ئۇيغۇرچە OCR ھەققىدە ئىزدىنىش ۋە نەتىجە
بۇرۇن ئۇيغۇرچە OCR (ئۇيغۇرچە باسما يېزىق تونۇش) ھەققىدە نۇرغۇن تېمىلار ۋە مۇنازىرىلەر بولدى، بىز شۇنداق دېتالغا ئېھتىياجلىق بولساقمۇ، لېكىن ئۇيغۇرچىدىكى بىرلىككە كەلگەن ئۆلچەملىك خەت نۇسخىسىنىڭ بولماسلىقى شۇ ۋەجىدىن خەت نۇسخىسىنىڭ ھەرخىللىقى سەۋەبلىك ئۇيغۇرچە OCR نى ۋۇجۇدقا چىقىرىشمۇبىر قەدەر قىيىن تېمىلارنىڭ بىرى بولغاچقا تا ھازىرغىچە يەنىلا ئىزدىنىش باسقۇچىدا بولۇپ تۇرۋاتىدۇ. مەنمۇ بىر ھەۋەسكار بولۇش سۈپىتىم بىلەن مۇشۇ توغۇرلۇق تېما ۋە ئۇچۇرلارغائالاھىدە دىققەت قىلىپ كېلۋاتىمەن. ئىزدىنىش ئارقىلىق بەزى چۈشەنچىلەرگە ئىگە بولدۇم بۇلارنى يەنىلا باشتىىن سۆزلەشكە توغرا كېلىدۇ.كىرىش سۆز
دەسلەپتە Torbo C مۇھىتىدا پىروگگىرامما يېزىشىنى باشلىغاندا، بارلىق پىروگگىرامما پەقەت مەلۇم بىر لوگىكىلىق ھېسابلاشنى كىرگۈزۈپ DOS مۇھىتىدا نەتىجىسىنى كۆرۈش ئىدى خالاس، كېيىن مەن ئىزدىنىش ئارقىلىق بەزى ئويۇنلارنى ياساپ باقتىم ئاخىرىدا بىر كىرگۈزگۈچ ياسىدىم شۇ چاغدا ئۇيغۇرچە ھەرىپلارنىڭ يېزىلىش ۋە باغلىنىشى ھەققىدە دەسلەپكى چۈشەنچىگە ئىگە بولغان،لېكىن ئۇ پەقەت بىر سىناق بولۇپ يازغان خەتنى ساقلىغىلى بولمايتتى ھېچقانداق ئەمىلى قوللىنىشى يوق دېيىشكە بولاتتى، كېيىن تاساددىبىي پۇرسەتتە مەكتەپ كومپىيوتېرخانىسىدىكى بىر كومپىيوتېردا VB.60نى ئۇچۇرتۇپ قالدىم، قوزغاتسىلا كۆزنەك چىقىدىكەن، كېيىن بىر تۇنۇشۇم ماڭا قانداق ئىجرا قىلىشنى ئۆگەتتى شۇنىڭ بىلەن ئۆگىنىش باشلىنىپ كەتتى. توختاڭ تېمىغا مۇناسىۋەتسىز سۆزلىگەندەكمۇ؟ ياق سەۋىرچان بولۇڭ.
VB.60 دەسلەپكى پىروگگىرامما ئۇيغۇرچىدىكى توققۇز قاتتار ۋە دامكا ئويۇنىدىن بىرنى ياساش ئىدى، مەن دامكا ئويۇنىنى تاللىدىم، بۇ ئويۇندا ئوينۇغۇچى ھەم كومپىيوتېر بىلەن ھەم توردا باشقىلار بىلەن ئوينىيالايتتى، توردا باشقىلار بىلەن ئويناشنى ئەمەلگە ئاشۇرۇش ئاسان، لېكىن كومپىيوتېر بىلەن ئويناشچۇ؟ مانا بۇ مەن دېمەكچى بولغان مەسىلە. دەسلەپكى لاھىيەنى تۈزگەندە لاھىيەنىڭ بىرى ئويۇننى توختىماي ئوينىتىپ، ماڭغان يوللارنى خاتېرلەپ، مەلۇم چەككە بارغاندا ئۇچۇر قىلىپ ساقلاپ باشقىلار بىلەن ئوينىغاندا شۇ ئۇچۇرنى ئىشلىتىش يەنى ئاۋال ئۆگىتىش. لېكىن كىم مۇشۇنداق ئويناپ بېرىدۇ. شۇ چاغدا«ئۆگىتىش» دېگەن بىر ئۇقۇم شەكىللەنگەن، كېيىن ئۇيغۇرچە تاۋۇش بىرىكتۈرۈشكە قاتناشقاندا ئاندىن پىروگگىرامما تۈزەشتە شۇنداق «ئۆگىتىش»ئۇسۇلىنىڭ بارلىقىنى بىلدىم.
كېيىن قول يازما پەرقلەندۈرمىز دەپ باللارنىڭ پوچىركىسىنى ئاۋاز تۇنىتىمىز دەپ ئاۋازىنى يىغىش خىزمىتىنى قىلىدىم ھازىر بىلسەم شۇلار «ئۆگىتىش»كەن.
كېيىن مەن OCR ۋە پاراڭلىشىش قورالىدىن ئىبارەت ئىككى قورالنى ياساشنى نىيەت قىلدىم. پاراڭلىشىش قورالىنى ياسىغانمۇ بولدۇم باشقىلارمۇ ياساپ تارقاتتى شۇڭا ئۇ ئەمەلگە ئاشقان بولدى، OCR غا كەلسەك دەسلەپتە VB.60 دىن پايدىلىنىپ بىر تەتىل سەرپ قىلىپ ساپ يېزىق بولغان بەتتىن تۇنۇشنى ئەمەلگە ئاشۇرغان بولساممۇ، لېكىن خەت نۇسخىسى ئۆزگەرسە ياكى بەتنىڭ سۈپىتى ئازراقلا ئۆزگەرسە تونۇش ئۈنۈمى بەكلا تۆۋەنلەپ كېتەتتى. شۇ چاغدا OCR نى پىروگگىرامما تىلىدىكى ئاددىي شەرتلىك جۈملىلەر ئارقىلىق تەھلىىل قىلىپ ئەمەلگە ئاشۇرۇشنىڭ ناھايىتى تەسلىكىنى بايقىدىم. كېيىن سۈنئىي نېرۋا تورى توغۇرلۇق مۇلاھىزە بولدى، لېكىن ئۇ چاغدا ئۇنى چۈشىنىدىغانلار ناھايىتى ئاز ئىدى، مەنمۇ شۇنىڭ ئىچىدە.
كېيىن ئىزدىنىش، قول سېلىش ئارقىلىق يېزىق تۇنۇش، تاۋۇش پەرقلەندۈرۈش، چىراي تونۇش... قاتارلىقلارنىڭ ھەممىسنىڭ سۈنئىي نېرۋا تورىغا تايانغانلىقىنى بىلدىم، بۇيەردىكى سۈنئىي نېرۋا تورى دەل ئادەم مىڭىسىگە تەقلىد قىلىنغان ھېسابلاش ئۇسۇلى بولۇپ، پىروگگىراممىغا ئاۋال قىلدۇرماقچى بولغان ئىشنى مەشىقلەندۈرۈپ ئۆگىتىمىز، ئۆگىتىش توغرا بولسا، پىروگگىرمما مەشىقلەندۈرۈش جەريانىدىن «تەجىربە يەكۈنلەپ» بىز ئۆگەتمىگەندىنمۇ نەتىجە چىقىرالايدۇ.
OCR ھەققىدە ئىزدىنىش
گەرچە پىروگگىرامما تىلىنى ئازراق بىلسەممۇ، لېكىن رەسىم ۋە خەتتاتلىقتىن خەۋىرىم بولمىغاچقا نۇرغۇن مەسلىلەرنى قانداق ھەل قىلىشنى بىلمەيتتىم ئىزدىنىش ۋە مۇشۇ مۇنبەردىكى « OCR ھەققىدە تەجىربىلىرىم» دېگەن تېمىنىڭ يازغۇچىسىنىڭ يېقىندىن يول كۆرسىتىشى ۋە ياردىمىدە دەسلەپكى چۈشەنچىگە ئىگە بولدۇم، بۇ يەردە ئۇنىڭغا ئالاھىدە رەھمىتىمنى بىلدۈرىمەن. رەھمەت!
خەت نۇسخىسىنىڭ شەكلى كۆپ بولغاچقا ھەممە خەت نۇسخىسىغا ماس كېلىدىغان تۇنۇش ئۇسۇلىنى تېپىش بەكلا مۈشكۈل. بەت ئانالىزىمۇ OCR دىكى ناھايىتى مۈشكۈل ئىش.دەسلەپتە بىرمۇ بىر سېلىشتۇرۇش ئۇسۇلىنى قوللانغان بۇ ئۇسۇلدا سۈرئەت بەكلا ئاستا بولغاننىڭ ئۈستىگە تازا كۆڭۈلدىكىدەك ئەمەس، كېيىن مەن يەنىلا سۈنئى نېرۋا تورىغا تاينىشنى قارار قىلدىم پەقەت توغرا تۇنۇسىلا سۈرئەتتە مەسلە چىقمايتتى. دەسلەپتە ماڭا سۈنئى نېرۋبەك مۇرەككەپ بىلىنەتتى شۇڭا ئاڭلىساملابەك ھەۋەس قىلاتتىم، ئارمانغا چۇشلۇق دەرمان يوق ئىدى. كۆپ يىللىق ئىزدىنىش ۋە ئۆگىنىش ئارقىلىق سۈنئى نېرۋ ھەققىدە ئازراق چۈشەنچىگىمۇ ئىگە بولدۇم. دوستلارغا تەۋىسىيەرىم مەن ئىزدىنىش جەريانىدا OpenCV، Pythonۋە MATLAB قاتارلىقلاردىن پايدىلاندىم.
مەن بەت يۈزى ئانالىزىنى سۆزلەپ ئولتۇرماي، پەقەت بەت يۈزى توغرا ئانالىز قىلىنىپ بولغاندىن كېيىنكى ئىزدىنىشنى سۆزلەي. يەنى نېگىزلىك تۇنۇش قىسىمىنى:
پۇتۇن جەريانى: ھەرىپكا ئايرىش->تۈرگە ئايرىش-> تۇنۇش ھېسابلاش ئۇسۇلى بولسى: BP->BP <-KNN
1) ھەرىپكە ئايرىش: بىز ھەربىر ھەرىپنى يەككە سۈنئىي نېرۋا تورىغا يەككە ھەرىپ ياكى ئەمەسلىكىنى مەشىقلەندۈرىمىز، مەن بۇنىڭغا 400 كىرىش ئۇچى ئىككى چىقىشئۇچى بولغان كۆپ قاتلاملىق BPنېرۋا تورىنىئىشلەتتىم.
2) تۈرگە ئايرىش: پارچىلىۋالغان ھەرىپنى ئالاھىدىلكى بويىچە تۈرگە ئايرىيمىز، مەسلەن KNN ھېسابلاش ئۇسىلىدا.
3) تۇنۇش: تۈرگە ئايرىپ بولغاندىن كېيىن ئاندىن تۇنۇش ئېلىپ بارىمىز، بۇ يەردە ھەخىل ئۇسۇلنى قوللانساق بولىدۇ.
يۇقارقىلار پەقەتلا شەخىسى قاراش، مۇتلەق مۇشۇنداق بولىدۇ دېگەنلىك ئەمەس.
يۇقارقى ئۇسۇلنىڭ ئارتۇقچىلىقى ئەمەلگە ئاشۇرۇش ئاسان، سۈرئىتى تېز. كەمچىلىكى نېرۋا تورىنى تەڭشەش تەس، مەشىقلەندۈرۈشكە كېرەكلىك ئەۋرىشكە يىغىش قىيىن، قايسى باسقۇچ ئازراقلاخاتا ھۆكۈم قىلىپقالسا كېيىنكى باسقۇچتا چوڭ خاتالىق كېلىپ چىقىدۇ.
سىناق OCR
گەرچە OCR ھەققىدە بۇرۇندىنلا ئىزدەنگەن بولساممۇ پەقەت ھەممىسى پەقەت نەزىرىيە ۋە كىچىك سىناق پىروگىراممىلار ئىدى. شۇڭا بۇ ھەقتە تورداشلارغا سۇنغىدەك بىر نەرسە يوق ئىدى، بەزى تېخنىكىلارنىڭ پىشىپ يېتىلىشى بىلەن ئۆزەمدىكى تەجىربە ۋە تەييار مودېللاردىن پايدىلىنىپ سىناق نۇسخىدىكى OCR نى پۈتكۈزدۈم.سىناق نۇسخىنىڭ كۆرۈنمە يۈزى ۋە تۇنۇش ئۈنۈمى تۆۋەندىكىدەك:
ئەسلى لاھىيەدە ئۇيغۇرچە، قازاقچە ۋە قىرغىزچىنى ئاساسلىق تىل، ئېنگىلىزچىنى قوشۇمچە تىل قىلىپ تونۇيدۇ، سىكانىرلاپ ئەكىرىش ۋە تەييار ھۆججەت ۋە مۇندەرىجە ئارقىلىق ئەكىرىشنى قوللايدۇ.
ھازىرقى سىناقتا سۈرەت ئارلىشىپ كەلگەن بەتتىن يېزىق رايونىنى ئايرىپ، قىيسىق كىرىپ قالغان بولسا ئاپتۇماتىك تۈزلاپ تۇنۇش ئېلىپ بارىدۇ،بەت سۈپىتى ياخشى بولسا تۇنۇش نىسبىتى 98% تىن يۇقىرى.
خاتىمە
تەجىربەم ۋە ئىپادىلەش قابىلىيىتىمنىڭ كەمچىل بولىشى سەۋەبلىك خاتا سۆزلەپ قويغان يەرلىرىم بولسا ئۇستازلارنىڭ تەلىم بېرىشىنى تېمامدا مۆجمەل بايان ۋە ئىملا خاتالىقى بولسا ئەيپكە بۇيرىماسلىقىنى ئۈمۈد قىلىمەن، بۇ پەقەت سىناق نۇسخا، مەشىقلاندۈرۈشنىڭ يېتەرلىك بولماسلىقى ۋە تېخى ئەسلى لاھىيە نىشانىغا يەتمىگەچكە تارقىتىلمىدى.مۇشۇ OCR غا تەكلىپ پىكىر برىشىنى ۋە سۈنئىى نېرۋا توغۇرلۇق پىكىر ئالماشتۇرۇشنى خالايدىغان دوستلارنىڭ چ چ توپى: 659773431 غا قوشۇلىشىنى قارشى ئالىمىز. سىناپ بېقىشنى خالايدىغانلارنىڭ سىناق ئۈچۈن بەزى مەزمۇنى ساغلام بولغان سىكانېرلانغان ھۆججەتلەرنى تەمىنلەپ بېرىشىنى ئۈمۈد قىلىمىز.
ۋا ئىسىل تىمىكەن بارىكالا مۇبارەك بولسۇن بەك خوش بولدۇم يارايسىز ، مۇبارەك بولسۇن راسلا ئېسىل تىمىكەن،بىلىمنىڭ تېگى يوق،داۋاملىق ئۈگىنىشىمىز كېرەك
تىرىشڭ دوستۇم ئەجىرىڭىزيەرىدە قالمسۇن بارىكاللا يارايسىز . بۇنى ئۈزىڭىز يالغۇز ياسىدىڭىزمۇ؟ بىر نەچچە يىلنىڭ ئالدىدا ئالىم ئەھەت مۇئەلىمنىڭ بىلوگىدا ئالىم مۇئەلىمنىڭ بۇ ئىشنى نەچچە ئون ئادەم نەچچە يىل ئىشلىسە ئۇنۇڭدىن كىيىن ۋۇجۇدقا چىقىدىغانلىقى توغرىسىدا يازغان يازمىسىنىكۆرگەنتىم. ئالىم ئەھەت مۇئەللىم زور مەبلەغ كېتىدىغانلىقى،بۇنىڭغا مەبلەغ سالغۇچى تېپىشنىڭ تەسلىكى ھەققىدە ئىنكاس قايتۇرغان،ھازىر خەنزۇچە ئىنگلىزچە تىللارنى يېزىققا ئايلاندۇرۇش ئاسان بولۇپ كەتتى،لېكىن بىزنىڭ يېزىقىمىزنى تۇنۇتۇشتا ئىلگىرلەش ناھايىتى ئاستا ئىدى،تىرىشچانلىقىڭىزغا بارىكاللا قېرىندىشىم،بىزلەر ياردەملىشەلەيدىغان ئىشلار بولسا ئوتتۇرىغا قويسىڭىز بىزمۇ قولىمىزدىن كېلىشىچە تىرىشىپ باقساق رەھمەت داۋاملىق تىرىشىڭيىزىق دىمەك مەدىنىيەت دىمەكتۇر
مەن نەچچە يىل بۇرۇنلا ئۇيغۇرچە OCR غا دىققەت قىلىپ كېلىۋاتقان ، لىكىن ھازىرغا قەدەر مۇنچىلىك نەتىجە چىققانلىقىنى ئاڭلاپ باقمىغان ئىدىم ، سىزنىڭ بۇ نەتىجىڭىز بىر چوڭ ئىلگىرىلەش بۇپتۇ، بۇنىڭدىن ناھايىتى خۇشال بولدۇم! داۋاملىق تىرىشىڭ، نەتىجە تىرىشقانلارغا مەنسۇپ !!! يارايسىز، قولىڭىزغا دەرت كەلمىسۇن!
تېخىمۇ تىرىشىڭ، ئۇتۇق يار بولسۇن!
بۇ رەسىمدىكى ئۇيغۇرچە خەتنى ، ئۇيغۇرچە يېزىققا ئايلاندۇرۇپ بىردىغان دىتالما ؟ شۇنداق چۈشەنسەم بۇلامدا ؟ ئەگەر مۇشۇ ئىش ۋۇجۇتقا چىقىپ قالسابۇنىڭغا ئۇيغۇر سوفىتنىڭ ئىملا تۈزەتكۈچىسى قوشۇلسا پاھ ئاجايىپ ياخشى ئىش بولاتتىدە. OCR يېزىق پەرىقلەندۈرۈپ يېزىپ بەرسە ، ئۇيغۇر سوفىتنىڭ ئىملا تۈزەتكۈچىسى خاتا تونۇغان خەتلەرنىڭ ئىملاسىنى توغۇرلاپ بەرسە ، نۇقسانسىز ئىش بولغۇدەك .
بارىكاللا، ئەجرىڭىز يەردە قالمايدۇ، بولسا شىرىن چۈشكە ئېلىپ چىققان بولسىڭىز بەزى ئىقتىسادى قىيىنچىلىقىڭىز ھەل بولغان ۇلاتتى، ھەم قىلغان ياخشى ئىشىڭىزدىن نۇرغۇن ئادەم خەۋەردار بۇلاتتى، بەلكىم اخشى بىر كىرىم يارتىش پۇرسىتى چىقىپ قېلىشىمۇ مۇمكىن .
بەت:
[1]