كومپيۇتېر تېخنىكىسى: OCR ھەققىدە ساۋات (2) | ئالىم ئەھەت تور خاتىرىسى
نۆۋەتتىكى ئورنىڭىز: باشبەت  >  بىلوگ بىلدۈرگۈسى  >  يازما كۆرۈش

كومپيۇتېر تېخنىكىسى: OCR ھەققىدە ساۋات (2)

[ بىلوگ بىلدۈرگۈسى ]

OCR يۇمشاق دېتالىنىڭ ئىشلەش پىرىنسىپى مۇنداق بولىدۇ.

ocr3

(1) سايىلەنگەن رەسىمنى كىرگۈزۈش

سايىلىگۈچ، رەسىم ئاپپاراتى (ياكى باشقا تەسۋىر كىرگۈزۈش ئۈسكۈنىسى) ئارقىلىق كىتاب-ژۇرناللارنى كۈلرەڭ ھالەتتە سايىلەيمىز، ئېنىقلىقى 300 DPI بولىدۇ (ھەر ئىنگلىز دىيومىدىكى چېكىتنىڭ سانى 300 دېمەكچى).

(2) رەسىمنى ئالدىن بىر تەرەپ قىلىش

سايىلەنگەن رەسىمنى ئاق-قارا ئىككى رەڭدىن تۈزۈلگەن رەڭسىز رەسىمگە ئايلاندۇرۇپ، بەتنى تۈزلەيمىز، بەت يۈزىدىكى داغ نۇقتىلارنى چىقىرىپ تاشلايمىز.

(3) بەت يۈزىنى ئانالىز قىلىش
بەت يۈزدىكى تېكىست، جەدۋەل ۋە سۈرەت رايونىنى پەرقلەندۈرۈپ، ئوخشىمىغان دائىرىگە ئالىمىز، تېكىستنى پەرقلەندۈرۈپ، جەدۋەل ۋە سۈرەتنى ئۆز پېتى چىقىرىپ بېرىمىز. تېكىست رايونىنى قۇرغا، قۇرنى سۆزگە، سۆزنى ھەرپلەرگە پارچىلايمىز.
ocr1

ocr4

(4) ھەرپلەرنى تونۇش
پارچىلانغان ھەرپلەرنى ئامباردىكى بىز تەييارلىۋالغان ئەندىزە بىلەن سېلىشتۇرىمىز. سېلىشتۇرۇشتىن ئاۋۋال ھەرپلەرنى چوڭ جەھەتتىن بىرنەچچە خاراكتېرىگە ئايرىۋېلىپ، ئامباردىكى شۇ خاراكتېردىكى ئەندىزىلەر ئارىسىدىن ئىزدىسەك تېخىمۇ تېز ۋە توغرا بولىدۇ.

ocr5
ocr2

(5) ئاخىرقى بىر تەرەپ قىلىش
تونۇپ بولغان ھەرپلەرنى قۇراشتۇرۇپ سۆزگە ئايلاندۇرىمىز. ئاندىن بۇ سۆزنىڭ ئىملاسىنى تەكشۈرىمىز. ئىملاسى خاتا بولسا ئاپتوماتىك توغرىلايمىز.

(6) تونۇش نەتىجىسىنى چىقىرىش

ئىملاسى توغرىلانغان سۆزلەرنى ئەسلىدىكى ئورنى بويىچە ئۆز جايىغا قويۇپ قۇرغا ئايلاندۇرىمىز، قۇرنى تېكىست رايونى ئىچىگە قويىمىز، تامام.

يۇقىرىقى باسقۇچلار ئىچىدە (3)، (4) ۋە (5)-باسقۇچلار ئىنتايىن مۇھىم بولۇپ، تونۇش نىسبىتىگە بىۋاسىتە تەسىر كۆرسىتىدۇ. ئىنگلىزچە، خەنزۇچە، ئۇيغۇرچە OCR يۇمشاق دېتالىنىڭ پەقەت (3)- ۋە (4)-باسقۇچى پەرقلىنىدۇ، باشقا جايى ئاساسەن ئوخشاش.

ھازىر ئىنگلىزچە OCR يۇمشاق دېتالىنىڭ توغرىلىقى 99.5% دىن، خەنزۇچىنىڭ %98 دىن، ئەرەبچىنىڭ %95 دىن يۇقىرى بولماقتا. ئۇيغۇرچە OCR يۇمشاق دېتالىنىڭ پەرقلەندۈرۈش نىسبىتى %90 دىن تۆۋەن بولسا، ئەمەلىي قوللىنىشچانلىقى تۆۋەن بولىدۇ. %80 دىن چۈشۈپ كەتسە ئىشلەتكىلى بولمايدۇ، بازاردا سېتىشقا تېخىمۇ بولمايدۇ.

داۋامىغا دىققەت قىلغايسىز. ئەمما سوئال سورايدىغانلار بولمىسا، مۇشۇ يەردە توختىتىمەن جۇمۇ

يازما ئۇچۇرلىرى
تېخىمۇ كۆپ
49 پارچە باھا يېزىلدى
باھا بېتى: 1 2 3
  • ئەسسالامۇ-ئەلەيكۇم!
    ئالىم ئەھەت مۇئەللىم، تىنىڭىز سالامەت بولسۇن.
    سىلى قول سالغان OCR غا ئۆزۈم ئويلىغان لاھېيە جەريانىنى سۆزلەپ باقاي دەپ بۇلارنى يازغان ئىدىم ۋاقت ئاجرىتىپ كۆرۈپ باققان بولسىلا بوپتىكەن.
    مەن مۇشۇ تېخنىكىنىڭ بىزلەردە تېزراق بار بولىشىنى تۆرت كۆزى بىلەن كۈتىۋاتقانلارنىڭ بىرسى، شۇڭا ئازتولا كاللا يۈگۈرتۈپ باقتىم. پىروگرامما تەلەپلەرنى ماشىنا ئىجرا قىلىدۇ، ئۇنى قانداق ئىجرا قىلغۇزۇش سىلىدەك پىروگراممىرلارنىڭ قولىدىن كىلىدۇ. مەن شۇ جەريانلارنى ئەدەبى تىلدىكى چۈشەنچەم بويىچە تۆۋەندىكلەرگە تىزدىم.

    {دەسلەپكى ئىزاھات:}
    بۇيەردە ئۇيغۇر 32 ئىككى ھەرىپىنىڭ ھەرخىل شەكلىنى ۋاريانت دەپ مىسالغا ئالدىم.(مەسلەن «ئا» ھەرپىنىڭ تۆت خىل شەكلى بارغۇ،[ئا] [ا] [ـا] [ـئا]. مەن دەل مۇشۇنداق بارلىق ھەرپلەرنىڭ شەكىللىرىنى ۋاريانت دىمەكچى)
    مەلۇم رەسىمدىكى ئۇيغۇرچە سۆزنى پارچىلاشقا توغرا كەلسە، ئۇنى ئالدى بىلەن بىز ئامبارغا ساقلاپ قويغان ھەرپ ۋاريانتلىرى بىلەن سېلىشتۇرۇپ ئوخشاشلىقى ئەڭ يېقىن بولغىنىنى شۇ دەپ بىكىتىش.
    پارچىلاش جەريانى:

    {ۋاريانتنى ئامبارغا قوشۇش جەريانى:}
    بىز سىرىتتىن بىر رەسىم كىرگۈزۈش ئۈسكىنىسگە مۇھتاج. بۇ ئۈسكىنىنىڭ ئالدىغا بىز تەييارلىغان 32ھەرپنىڭ بارلىق ۋارياتلىرىنى (يۈزخىلدىن ئارتۇق) ئوخشىمىغان چوڭلۇقتا تەڭلەپ، ئۇ سۆرەتلەرنىڭ ئېلىكتىرونلۇق ساقلانمىسىغا ئېرشىمىز، ھەمدە ئۆزلىرى دىگەندەك ئاق-قارا رەسىم بويىچە ھەممە ۋاريانتنىڭ ئوخشىمىغان چوڭلۇقتىكى نۇسقىسىنىڭ چېكىت سانىنى ساقلايمىز.مانا بۇ دەسلەپكى ئامبار. بۇ جەرياننى ئاددىيلاشتۇرۇپ ئۆزىمىز ۋاريانتلارنى سىزىپ كىرگۈزسەك بۇنىڭ چېكىت ئېنىقلىقى ھەقىقى يۇقىرى بولىدۇ، لىكىن ئەمەلى مۇھىتتىن تارتىپ ئېرىشكەن سۆرەتنىڭ چېكىت سانىغا ماس كەلمەيدىغان ئىشلار چىقىپ قېلىشى ئېھتىمال. شۇڭا مۇھىتتىن ساقلاپ، مۇھىتنى سەزگۈزسەك ئۈنۈمى بەلەنرەك بولارمىكىن.
    مۇھىم نۇقتا:
    ۋاريانتلارنى ئامبارغا ساقلىغاندا، ھەربىر ۋايانتلار چوقۇم ئورتاق چوڭلۇقتىكى كاتەكچىگە ماسلاشتۇرلۇپ ساقلىنىشى كېرەك. 16×16 ياكى 32×32 دىگەندەك ئورتاق ئۆلچەمدە دىمەكچى.
    ئەمەلى قەغەز يۈزىگە بېسىلغان سۆزلەرنى تەشكىل قىلغان ھەرپ ۋاريانتلىرى ئارىسىدىكى چېگرا دائېرسىنى ئورتاق چوڭلۇقتا بىكىتىش كېرەك.
    مەسلەن:
    [گـ][ـۈ][لـ][لـ][ـە][ن] سۆزىدىكى ھەربىر ھەرپ ۋاريانتىنىڭ چېگرا ئۇزۇنلۇقىنى مەجبۇرى بىكىتىشىمىز كىرەك. بۇنداق بولغاندا سېلىشتۇرۇشقا پايدىلىق.

    {ئېنىقلىقنى قولدا بىكىتىش:}
    بىز ساقلىۋالغان ۋاريانتلارنىڭ ھەرخىل چوڭلۇقتىكى شەكلىنىڭ چېكىت سانى ئامباردا ساقلاندى، ئەمدى بىز بۇ چېكىتلەرنىڭ مەلۇم قىسىمىنى قولىمىز بىلەن نىسبى ئۆچۈرۋېتىپ (ۋاريانتلارنىڭ ھەرخىل چوڭلۇقتىكى چېكىت سانىنى نىسبى ئازلىتىش)ئامبارغا ساقلايمىز.
    بۇ دىگەنلىك ئوڭ-سول، ئۈستى-ئاستى تەرەپلەرنىڭ ماس چېكىتلىرىنى نىسبى ئازايتىش دىگەنلىك.

    {سېلىشتۇرۇش جەريانى:}
    سىرىتتىن كىرگەن رەسىم مەزمۇنىنى ئاق-قارا نىسبەتكە ئايرىپ بولغاندىن كىيىن، مەلۇم سۆزنىڭ ئوڭ تەرەپ باشلانما قىسىدىن تارتىپ شۇ سۆز تۈگگىچە بولغان ئۇزۇنلۇقنى بىز بىكىتكەن ئۆلچەم بويىچە ماشىنىغا بۆلۈشكە تاپشۇرمىز(6بىرلىكىنى 2دىن 3كە بۆلگەندەك مەجبۇرى بۆلىدۇ)، ئاندىن ئوڭ تەرەپ بىرىنچى بۆلىكىنى چېكىتكە بۆلۈپ، بىز ئامبارغا ساقلىغان چېكىت سانى بىلەن سېلىشتۇردۇ. ھەمدە ماس كەلگەن چېكىتنىڭ ۋاريانتىنى ئانالىز قىلىدۇ.

    {ۋاريانتنى ئانالىز قىلىش ۋە سۆز ياساش:}
    ۋاريانتلارنى سۆزنى تۈزۈشىگە قاراپ تۆرت خىل تۈرگە بۆلدۈم:
    1-باشلىغۇچى ۋاريانت. [پـ، قـ، غـ …]
    2-داۋاملاشتۇرغۇچى ۋاريانىت.[ـپـ، ـقـ، ـغـ …]
    3-ئاخىرلاشتۇرغۇچى ۋاريانت.[ـپ، ـق، ـغ…]
    4-ئەركىن ۋاريانت.[و، ر، ز…]

    سىرىتتىن ئېرىشكەن سۆزنىڭ بىرىنچى بۆلەكتىكى ھەرپىنى ئامباردىكى ۋاريانت بويىچە سېلىشتۇرمىز. تېپىلغان ۋاريانت قايسى ۋاريانت تۈرى ئىكەنلىكى بويىچە سۆز ياسايمىز.
    ئەگەر مۇناسىۋەتلىك ھەرپ باشلىغۇچى ۋاريانت بولۇپ چىقسا، ئۇ داۋاملاشتۇرغۇچى ياكى ئاخىرلاشتۇرغۇچى ۋاريانتنىڭ ئۇلىنىشىغا يول قويىدۇ.
    مەسلەن:«گۈللەن» سۆزىدىكى [گـ] ۋاريانت (باشلىغۇچى ۋاريانت) [ـۈ] ۋاريانت(ئاخىرلاشتۇرغۇچى ۋاريانت.)نىڭ ياكى باشقا داۋاملاشتۇرغۇچى ۋاريانتنىڭ ئۇلىنىشىغا يول قويىدۇ.

    ناۋادا مۇناسىۋەتلىك ھەرپ داۋاملاشتۇرغۇچى ۋاريانت بولسا، ئەسلىدە باربولغان باشلىغۇچى ۋاريانتقا ئۇلىندۇ ھەمدە ئاخىرلاشتۇرغۇچى ياكى داۋاملاشتۇرغۇچى ۋايانتنىڭ ئۇلىنىشغا يول قويىدۇ.مەسلەن:
    مەسلەن:«گۈللەن» سۆزىدىكى [ـلـ] ۋاريانت(داۋاملاشتۇرغۇچى ۋاريانت) ئالدىدىكى [لـ] ۋاريانت (باشلىغۇچى ۋاريانت)قا ئۇلىندۇ، ھەمدە [ـە] ۋاريانت(ئاخىرلاشتۇرغۇچى ۋاريانت)نىڭ ئۇلىنىشىغا يول قويىدۇ.

    ئەگەر مۇناسىۋەتلىك ھەرپ ئاخىرلاشتۇرغۇچى ۋاريانت بولسا، ئۇ بار بولغان باشلىغۇچى ياكى داۋاملاشتۇرغۇچى ۋاريانتلارغا ئۇلىندۇ.باشقا ئۇلانماقچى بولغان ھەرقانداق ۋاريانتنىڭ ئۇلىنىشىنى رەت قىلىدۇ.مەسلەن:
    «گۈللەن» سۆزىدىكى [ـە] ۋاريانت(ئاخىرلاشتۇرغۇچى ۋاريانت) ئالدىدىكى [ـلـ] ۋاريانت (داۋاملاشتۇرغۇچى ۋاريانت)قا ئۇلىندۇ، لىكىن [ن] ۋاريانت(ئەركىن ۋاريانت)نىڭ ياكى باشقا ۋاريانتنىڭ ئۇلىنىشىنى رەت قىلىدۇ.

    يوللانغان ۋاقىت: 2016-يىلى 7-ئاينىڭ 1-كۈنى pm 16:17
  • داۋامىغا دىققەت قىلغايسىز. ئەمما سوئال سورايدىغانلار بولمىسا، مۇشۇ يەردە توختىتىمەن جۇمۇ
    دەپتىكەنسىز.
    ئەمسە مەن بىر سوئال سوراي :
    داۋامى قېنى؟

    يوللانغان ۋاقىت: 2015-يىلى 7-ئاينىڭ 8-كۈنى pm 19:14
  • ocr غا مۇناسىۋەتلىك تېمىڭىز توختاپ قالدىغۇ ئالىم مۇئەللىم، ئاخىرىنى داۋاملىق يوللايمەن داۋاتاتتىڭىز… كۈندە بىر رەت ئېچىپ كۆرۈمەن ocr غا مۇناسىۋەتلىك يېڭى تېما يوق…

    يوللانغان ۋاقىت: 2015-يىلى 6-ئاينىڭ 28-كۈنى pm 14:26
  • مېنىڭ چچ نومۇرۇم: 1920196043

    يوللانغان ۋاقىت: 2015-يىلى 6-ئاينىڭ 24-كۈنى am 09:26
  • ئالىم مۇئەللىم، سىزنىڭ جاۋابىڭىزنى چۈشەندىم. سىز دېگەن ئاشۇ رەسىمنى بىر فونتنى ئشىلىتىپ ئۇدۇل چىقارغىلى بۇللامدۇ، ياكى بەللى فونتىكى يېزىق رەسىملىرىنى پارچىلاپ چىقىرامدۇق؟ يەنە بىر سوئالىم: سىزنىڭ جاۋاپ قايتۇرغانلىقىڭىز مېنىڭ ئېلىخەت ئادرىسىمغا كېلەمدۇ؟ مەن بۈگۈن سىزنىڭ جاۋاپ خەت يازغانلىق بىر ئۇچىرىڭىزنى ئېلىخەتتە كۆرمىدىم. رەھمەت سىزگە.

    يوللانغان ۋاقىت: 2015-يىلى 6-ئاينىڭ 23-كۈنى pm 16:50
  • سالام، ئالىم مۇئەللىم. سىزنىڭ بۇ تېمىڭىزنى ئوقۇپ ناھايىتى خوش بولدۇم. قىسقا ئەمما ئەتراپلىق بىر چۈشەندۈرۈش بوپتۇ. مېنىڭ تەتقىقات تېمام سۈرەت بىرتەرەپ قىلىش بۇلىدۇ. مېنىڭ بىر ئاددىي بىر OCR ياسىغىم باتى، ئەمما كاللامنى قاتۇرغان بىر مەسىلە بولسا سېلىشتۇرما ساندىنىنى يەنى ئەندىزلەرنى قانداق ياساش توغۇرلۇق بىر پىكىر بەرگەن بولسىڭىز.

    يوللانغان ۋاقىت: 2015-يىلى 6-ئاينىڭ 23-كۈنى am 03:27
    • مەن قىسقىلا جاۋاب بېرەي، ئەمەلىيەتتە ئۇ بىر سانلار گۇرۇپپىسى، بىر ئۆلچەملىك بولسىمۇ بولىدۇ. ئەندىزىلەرنى تەييارلاشنىڭ نۇرغۇن ئۇسۇلى بار. بىر پارچە رەسىمنى 16، 32 ياكى 48 پارچىگە تەڭ پارچىلاپ، ھەربىر پارچىدىكى قارا چېكىتلەرنىڭ سانىنى پىرسەنتلەشتۈرۈپ ئۇنى تەرتىپ بويىچە 16، 32 ياكى 48 ئەزا سىغىدىغان سانلار گۇرۇپپىسىغا ساقلاڭ. شۇ بويىچە ئەڭ كىچىك يېقىن ئارىلىق فورمۇلىسى بىلەن سېلىشتۇرسىڭىزلا تامام. كېيىن بۇ تېمىنى داۋاملاشتۇرغاچ تەپسىلىي جاۋاب بېرەي، ھازىر ئەلكاتىپنىڭ نەشرىنى يېڭىلاۋاتقان ئىدىم

      يوللانغان ۋاقىت: 2015-يىلى 6-ئاينىڭ 23-كۈنى am 08:52
باھا بېتى: 1 2 3