+تېما يوللاش
alip_eza يوللانغان ۋاقتى:2017-7-20 14:51 1720 قېتىم كۆرۈلدى 13 ئىنكاس يېزىلدى
مەلۇم قەۋەتكە يۆتكىلىش
بۇرۇن ئۇيغۇرچە OCR (ئۇيغۇرچە باسما يېزىق تونۇش) ھەققىدە نۇرغۇن تېمىلار ۋە مۇنازىرىلەر بولدى، بىز شۇنداق دېتالغا ئېھتىياجلىق بولساقمۇ، لېكىن ئۇيغۇرچىدىكى بىرلىككە كەلگەن ئۆلچەملىك خەت نۇسخىسىنىڭ بولماسلىقى شۇ ۋەجىدىن خەت نۇسخىسىنىڭ ھەرخىللىقى سەۋەبلىك ئۇيغۇرچە OCR نى ۋۇجۇدقا چىقىرىشمۇ  بىر قەدەر قىيىن تېمىلارنىڭ بىرى بولغاچقا تا ھازىرغىچە يەنىلا ئىزدىنىش باسقۇچىدا بولۇپ تۇرۋاتىدۇ. مەنمۇ بىر ھەۋەسكار بولۇش سۈپىتىم بىلەن مۇشۇ توغۇرلۇق تېما ۋە ئۇچۇرلارغا  ئالاھىدە دىققەت قىلىپ كېلۋاتىمەن. ئىزدىنىش ئارقىلىق بەزى چۈشەنچىلەرگە ئىگە بولدۇم بۇلارنى يەنىلا باشتىىن سۆزلەشكە توغرا كېلىدۇ.

       كىرىش سۆز

دەسلەپتە Torbo C مۇھىتىدا پىروگگىرامما يېزىشىنى باشلىغاندا، بارلىق پىروگگىرامما پەقەت مەلۇم بىر لوگىكىلىق ھېسابلاشنى كىرگۈزۈپ DOS مۇھىتىدا نەتىجىسىنى كۆرۈش ئىدى خالاس، كېيىن مەن ئىزدىنىش ئارقىلىق بەزى ئويۇنلارنى ياساپ باقتىم ئاخىرىدا بىر كىرگۈزگۈچ ياسىدىم شۇ چاغدا ئۇيغۇرچە ھەرىپلارنىڭ يېزىلىش ۋە باغلىنىشى ھەققىدە دەسلەپكى چۈشەنچىگە ئىگە بولغان،لېكىن ئۇ پەقەت بىر سىناق بولۇپ يازغان خەتنى ساقلىغىلى بولمايتتى ھېچقانداق ئەمىلى قوللىنىشى يوق دېيىشكە بولاتتى، كېيىن تاساددىبىي پۇرسەتتە مەكتەپ كومپىيوتېرخانىسىدىكى بىر كومپىيوتېردا VB.60  نى ئۇچۇرتۇپ قالدىم، قوزغاتسىلا كۆزنەك چىقىدىكەن، كېيىن بىر تۇنۇشۇم ماڭا قانداق ئىجرا قىلىشنى ئۆگەتتى شۇنىڭ بىلەن ئۆگىنىش باشلىنىپ كەتتى. توختاڭ تېمىغا مۇناسىۋەتسىز سۆزلىگەندەكمۇ؟ ياق سەۋىرچان بولۇڭ.
VB.60 دەسلەپكى پىروگگىرامما ئۇيغۇرچىدىكى توققۇز قاتتار ۋە دامكا ئويۇنىدىن بىرنى ياساش ئىدى، مەن دامكا ئويۇنىنى تاللىدىم، بۇ ئويۇندا ئوينۇغۇچى ھەم كومپىيوتېر بىلەن ھەم توردا باشقىلار بىلەن ئوينىيالايتتى، توردا باشقىلار بىلەن ئويناشنى ئەمەلگە ئاشۇرۇش ئاسان، لېكىن كومپىيوتېر بىلەن ئويناشچۇ؟ مانا بۇ مەن دېمەكچى بولغان مەسىلە. دەسلەپكى لاھىيەنى تۈزگەندە لاھىيەنىڭ بىرى ئويۇننى توختىماي ئوينىتىپ، ماڭغان يوللارنى خاتېرلەپ، مەلۇم چەككە بارغاندا ئۇچۇر قىلىپ ساقلاپ باشقىلار بىلەن ئوينىغاندا شۇ ئۇچۇرنى ئىشلىتىش يەنى ئاۋال ئۆگىتىش. لېكىن كىم مۇشۇنداق ئويناپ بېرىدۇ. شۇ چاغدا  «ئۆگىتىش» دېگەن بىر ئۇقۇم شەكىللەنگەن، كېيىن ئۇيغۇرچە تاۋۇش بىرىكتۈرۈشكە قاتناشقاندا ئاندىن پىروگگىرامما تۈزەشتە شۇنداق «ئۆگىتىش»  ئۇسۇلىنىڭ بارلىقىنى بىلدىم.
كېيىن قول يازما پەرقلەندۈرمىز دەپ باللارنىڭ پوچىركىسىنى ئاۋاز تۇنىتىمىز دەپ ئاۋازىنى يىغىش خىزمىتىنى قىلىدىم ھازىر بىلسەم شۇلار «ئۆگىتىش»  كەن.
كېيىن مەن OCR ۋە پاراڭلىشىش قورالىدىن ئىبارەت ئىككى قورالنى ياساشنى نىيەت قىلدىم. پاراڭلىشىش قورالىنى ياسىغانمۇ بولدۇم باشقىلارمۇ ياساپ تارقاتتى شۇڭا ئۇ ئەمەلگە ئاشقان بولدى، OCR غا كەلسەك دەسلەپتە VB.60 دىن پايدىلىنىپ بىر تەتىل سەرپ قىلىپ ساپ يېزىق بولغان بەتتىن تۇنۇشنى ئەمەلگە ئاشۇرغان بولساممۇ، لېكىن خەت نۇسخىسى ئۆزگەرسە ياكى بەتنىڭ سۈپىتى ئازراقلا ئۆزگەرسە تونۇش ئۈنۈمى بەكلا تۆۋەنلەپ كېتەتتى. شۇ چاغدا OCR نى پىروگگىرامما تىلىدىكى ئاددىي شەرتلىك جۈملىلەر ئارقىلىق تەھلىىل قىلىپ ئەمەلگە ئاشۇرۇشنىڭ ناھايىتى تەسلىكىنى بايقىدىم. كېيىن سۈنئىي نېرۋا تورى توغۇرلۇق مۇلاھىزە بولدى، لېكىن ئۇ چاغدا ئۇنى چۈشىنىدىغانلار ناھايىتى ئاز ئىدى، مەنمۇ شۇنىڭ ئىچىدە.
كېيىن ئىزدىنىش، قول سېلىش ئارقىلىق يېزىق تۇنۇش، تاۋۇش پەرقلەندۈرۈش، چىراي تونۇش... قاتارلىقلارنىڭ ھەممىسنىڭ سۈنئىي نېرۋا تورىغا تايانغانلىقىنى بىلدىم، بۇيەردىكى سۈنئىي نېرۋا تورى دەل ئادەم مىڭىسىگە تەقلىد قىلىنغان ھېسابلاش ئۇسۇلى بولۇپ، پىروگگىراممىغا ئاۋال قىلدۇرماقچى بولغان ئىشنى مەشىقلەندۈرۈپ ئۆگىتىمىز، ئۆگىتىش توغرا بولسا، پىروگگىرمما مەشىقلەندۈرۈش جەريانىدىن «تەجىربە يەكۈنلەپ» بىز ئۆگەتمىگەندىنمۇ نەتىجە چىقىرالايدۇ.
OCR ھەققىدە ئىزدىنىش

گەرچە پىروگگىرامما تىلىنى ئازراق بىلسەممۇ، لېكىن رەسىم ۋە خەتتاتلىقتىن خەۋىرىم بولمىغاچقا نۇرغۇن مەسلىلەرنى قانداق ھەل قىلىشنى بىلمەيتتىم ئىزدىنىش ۋە مۇشۇ مۇنبەردىكى « OCR ھەققىدە تەجىربىلىرىم» دېگەن تېمىنىڭ يازغۇچىسىنىڭ يېقىندىن يول كۆرسىتىشى ۋە ياردىمىدە دەسلەپكى چۈشەنچىگە ئىگە بولدۇم، بۇ يەردە ئۇنىڭغا ئالاھىدە رەھمىتىمنى بىلدۈرىمەن. رەھمەت!
خەت نۇسخىسىنىڭ شەكلى كۆپ بولغاچقا ھەممە خەت نۇسخىسىغا ماس كېلىدىغان تۇنۇش ئۇسۇلىنى تېپىش بەكلا مۈشكۈل. بەت ئانالىزىمۇ OCR دىكى ناھايىتى مۈشكۈل ئىش.  دەسلەپتە بىرمۇ بىر سېلىشتۇرۇش ئۇسۇلىنى قوللانغان بۇ ئۇسۇلدا سۈرئەت بەكلا ئاستا بولغاننىڭ ئۈستىگە تازا كۆڭۈلدىكىدەك ئەمەس، كېيىن مەن يەنىلا سۈنئى نېرۋا تورىغا تاينىشنى قارار قىلدىم پەقەت توغرا تۇنۇسىلا سۈرئەتتە مەسلە چىقمايتتى. دەسلەپتە ماڭا سۈنئى نېرۋ  بەك مۇرەككەپ بىلىنەتتى شۇڭا ئاڭلىساملا  بەك ھەۋەس قىلاتتىم، ئارمانغا چۇشلۇق دەرمان يوق ئىدى. كۆپ يىللىق ئىزدىنىش ۋە ئۆگىنىش ئارقىلىق سۈنئى نېرۋ ھەققىدە ئازراق چۈشەنچىگىمۇ ئىگە بولدۇم. دوستلارغا تەۋىسىيەرىم مەن ئىزدىنىش جەريانىدا OpenCV، Python  ۋە MATLAB قاتارلىقلاردىن پايدىلاندىم.
   مەن بەت يۈزى ئانالىزىنى سۆزلەپ ئولتۇرماي، پەقەت بەت يۈزى توغرا ئانالىز قىلىنىپ بولغاندىن كېيىنكى ئىزدىنىشنى سۆزلەي. يەنى نېگىزلىك تۇنۇش قىسىمىنى:
پۇتۇن جەريانى: ھەرىپكا ئايرىش->تۈرگە ئايرىش-> تۇنۇش ھېسابلاش ئۇسۇلى بولسى:   BP->BP <-KNN
1)        ھەرىپكە ئايرىش: بىز ھەربىر ھەرىپنى يەككە سۈنئىي نېرۋا تورىغا يەككە ھەرىپ ياكى ئەمەسلىكىنى مەشىقلەندۈرىمىز، مەن بۇنىڭغا 400 كىرىش ئۇچى ئىككى چىقىش  ئۇچى بولغان كۆپ قاتلاملىق BP  نېرۋا تورىنى  ئىشلەتتىم.
2)        تۈرگە ئايرىش: پارچىلىۋالغان ھەرىپنى ئالاھىدىلكى بويىچە تۈرگە ئايرىيمىز، مەسلەن KNN ھېسابلاش ئۇسىلىدا.
3)        تۇنۇش: تۈرگە ئايرىپ بولغاندىن كېيىن ئاندىن تۇنۇش ئېلىپ بارىمىز، بۇ يەردە ھەخىل ئۇسۇلنى قوللانساق بولىدۇ.
يۇقارقىلار پەقەتلا شەخىسى قاراش، مۇتلەق مۇشۇنداق بولىدۇ دېگەنلىك ئەمەس.
يۇقارقى ئۇسۇلنىڭ ئارتۇقچىلىقى ئەمەلگە ئاشۇرۇش ئاسان، سۈرئىتى تېز. كەمچىلىكى نېرۋا تورىنى تەڭشەش تەس، مەشىقلەندۈرۈشكە كېرەكلىك ئەۋرىشكە يىغىش قىيىن، قايسى باسقۇچ ئازراقلا  خاتا ھۆكۈم قىلىپ  قالسا كېيىنكى باسقۇچتا چوڭ خاتالىق كېلىپ چىقىدۇ.
سىناق OCR

گەرچە OCR ھەققىدە بۇرۇندىنلا ئىزدەنگەن بولساممۇ پەقەت ھەممىسى پەقەت نەزىرىيە ۋە كىچىك سىناق پىروگىراممىلار ئىدى. شۇڭا بۇ ھەقتە تورداشلارغا سۇنغىدەك بىر نەرسە يوق ئىدى، بەزى تېخنىكىلارنىڭ پىشىپ يېتىلىشى بىلەن ئۆزەمدىكى تەجىربە ۋە تەييار مودېللاردىن پايدىلىنىپ سىناق نۇسخىدىكى OCR نى پۈتكۈزدۈم.سىناق نۇسخىنىڭ كۆرۈنمە يۈزى ۋە تۇنۇش ئۈنۈمى تۆۋەندىكىدەك:

ئەسلى لاھىيەدە ئۇيغۇرچە، قازاقچە ۋە قىرغىزچىنى ئاساسلىق تىل، ئېنگىلىزچىنى قوشۇمچە تىل قىلىپ تونۇيدۇ، سىكانىرلاپ ئەكىرىش ۋە تەييار ھۆججەت ۋە مۇندەرىجە ئارقىلىق ئەكىرىشنى قوللايدۇ.
ھازىرقى سىناقتا سۈرەت ئارلىشىپ كەلگەن بەتتىن يېزىق رايونىنى ئايرىپ، قىيسىق كىرىپ قالغان بولسا ئاپتۇماتىك تۈزلاپ تۇنۇش ئېلىپ بارىدۇ،بەت سۈپىتى ياخشى بولسا تۇنۇش نىسبىتى 98% تىن يۇقىرى.
خاتىمە

تەجىربەم ۋە ئىپادىلەش قابىلىيىتىمنىڭ كەمچىل بولىشى سەۋەبلىك خاتا سۆزلەپ قويغان يەرلىرىم بولسا ئۇستازلارنىڭ تەلىم بېرىشىنى تېمامدا مۆجمەل بايان ۋە ئىملا خاتالىقى بولسا ئەيپكە بۇيرىماسلىقىنى ئۈمۈد قىلىمەن، بۇ پەقەت سىناق نۇسخا، مەشىقلاندۈرۈشنىڭ يېتەرلىك بولماسلىقى ۋە تېخى ئەسلى لاھىيە نىشانىغا يەتمىگەچكە تارقىتىلمىدى.  مۇشۇ OCR غا تەكلىپ پىكىر برىشىنى ۋە سۈنئىى نېرۋا توغۇرلۇق پىكىر ئالماشتۇرۇشنى خالايدىغان دوستلارنىڭ چ چ توپى: 659773431 غا قوشۇلىشىنى قارشى ئالىمىز. سىناپ بېقىشنى خالايدىغانلارنىڭ سىناق ئۈچۈن بەزى مەزمۇنى ساغلام بولغان سىكانېرلانغان ھۆججەتلەرنى تەمىنلەپ بېرىشىنى ئۈمۈد قىلىمىز.

باھالاش

قاتناشقانلار سانى 4تەجرىبە +142 يىغىش سەۋەبى
شەرەر + 50 مەن قوللايمەن
بۆرە216 + 30 مەن قوللايمەن
Boy卍HEr〇 + 12 مەن قوللايمەن
alip + 50 مەن قوللايمەن

باھا خاتىرىسى

ھەمبەھرىلەش:  QQ دوست ۋە توپQQ دوست ۋە توپ QQ ھويلىسىQQ ھويلىسى تېڭشۈن مىكروبلوگىتېڭشۈن مىكروبلوگى تېڭشۈن دوستلارتېڭشۈن دوستلار
ساقلاشساقلاش4 ھەمبەھرھەمبەھر قوللايمەنقوللايمەن8 قوللىمايمەنقوللىمايمەن

13ئادەم ئىنكاس يازدى

تۆر
چوپان ۋاقتى: 2017-7-20 16:53:49
ۋا ئىسىل تىمىكەن بارىكالا
گىلەم
abjsoft ۋاقتى: 2017-7-20 17:23:47
مۇبارەك بولسۇن بەك خوش بولدۇم
ئورۇندۇق
appchi ۋاقتى: 2017-7-20 17:28:37
يارايسىز ، مۇبارەك بولسۇن
5-قەۋەت
nafritim ۋاقتى: 2017-7-20 18:21:29
راسلا ئېسىل تىمىكەن،بىلىمنىڭ تېگى يوق،داۋاملىق ئۈگىنىشىمىز كېرەك
6-قەۋەت
tanha52014 ۋاقتى: 2017-7-20 18:22:09
تىرىشڭ دوستۇم ئەجىرىڭىزيەرىدە قالمسۇن
7-قەۋەت
بۆرە216 ۋاقتى: 2017-7-20 18:44:01
بارىكاللا يارايسىز . بۇنى ئۈزىڭىز يالغۇز ياسىدىڭىزمۇ؟ بىر نەچچە يىلنىڭ ئالدىدا ئالىم ئەھەت مۇئەلىمنىڭ بىلوگىدا ئالىم مۇئەلىمنىڭ بۇ ئىشنى نەچچە ئون ئادەم نەچچە يىل ئىشلىسە ئۇنۇڭدىن كىيىن ۋۇجۇدقا چىقىدىغانلىقى توغرىسىدا يازغان يازمىسىنى  كۆرگەنتىم.
8-قەۋەت
nurahmat ۋاقتى: 2017-7-20 22:22:55
ئالىم ئەھەت مۇئەللىم زور مەبلەغ كېتىدىغانلىقى،بۇنىڭغا مەبلەغ سالغۇچى تېپىشنىڭ تەسلىكى ھەققىدە ئىنكاس قايتۇرغان،ھازىر خەنزۇچە ئىنگلىزچە تىللارنى يېزىققا ئايلاندۇرۇش ئاسان بولۇپ كەتتى،لېكىن بىزنىڭ يېزىقىمىزنى تۇنۇتۇشتا ئىلگىرلەش ناھايىتى ئاستا ئىدى،تىرىشچانلىقىڭىزغا بارىكاللا قېرىندىشىم،بىزلەر ياردەملىشەلەيدىغان ئىشلار بولسا ئوتتۇرىغا قويسىڭىز بىزمۇ قولىمىزدىن كېلىشىچە تىرىشىپ باقساق
9-قەۋەت
yusupjan133 ۋاقتى: 2017-7-21 00:53:38
رەھمەت داۋاملىق تىرىشىڭ  يىزىق دىمەك مەدىنىيەت دىمەكتۇر
10-قەۋەت
$BashbugH$ ۋاقتى: 2017-7-21 10:39:47
مەن نەچچە يىل بۇرۇنلا ئۇيغۇرچە OCR غا دىققەت قىلىپ كېلىۋاتقان ، لىكىن ھازىرغا قەدەر مۇنچىلىك نەتىجە چىققانلىقىنى ئاڭلاپ باقمىغان ئىدىم ، سىزنىڭ بۇ نەتىجىڭىز بىر چوڭ ئىلگىرىلەش بۇپتۇ، بۇنىڭدىن ناھايىتى خۇشال بولدۇم! داۋاملىق تىرىشىڭ، نەتىجە تىرىشقانلارغا مەنسۇپ !!!
11-قەۋەت
ablizmansur ۋاقتى: 2017-7-21 10:45:34
يارايسىز، قولىڭىزغا دەرت كەلمىسۇن!
تېخىمۇ تىرىشىڭ، ئۇتۇق يار بولسۇن!
12-قەۋەت
تەنھا530 ۋاقتى: 2017-7-21 20:55:07
بۇ رەسىمدىكى ئۇيغۇرچە خەتنى ، ئۇيغۇرچە يېزىققا ئايلاندۇرۇپ بىردىغان دىتالما ؟ شۇنداق چۈشەنسەم بۇلامدا ؟
13-قەۋەت
oyqan1 ۋاقتى: 2017-7-22 22:14:23
ئەگەر مۇشۇ ئىش ۋۇجۇتقا چىقىپ قالسا  بۇنىڭغا ئۇيغۇر سوفىتنىڭ ئىملا تۈزەتكۈچىسى قوشۇلسا &  #1662;اھ ئاجايىپ ياخشى ئىش بولاتتىدە  . OCR يېزىق پەرىقلەندۈرۈپ يېزىپ بەرسە ، ئۇيغۇر سوفىتنىڭ ئىملا تۈزەتكۈچىسى خاتا تونۇغان خەتلەرنىڭ ئىملاسىنى توغۇرلاپ بەرسە ، نۇقسانسىز ئىش بولغۇدەك .
14-قەۋەت
tanha214 ۋاقتى: 2017-7-23 18:02:46
بارىكاللا، ئەجرىڭىز يەردە قالمايدۇ، بولسا شىرىن چۈشكە ئېلىپ چىققان بولسىڭىز بەزى ئىقتىسادى قىيىنچىلىقىڭىز ھەل بولغان ۇلاتتى، ھەم قىلغان ياخشى ئىشىڭىزدىن نۇرغۇن ئادەم خەۋەردار بۇلاتتى، بەلكىم اخشى بىر كىرىم يارتىش پۇرسىتى چىقىپ قېلىشىمۇ مۇمكىن .
كىرگەندىن كېيىن ئىنكاس يازالايسىز كىرىش | ئەزا بولۇش

سەھىپە جۇغلانما قائىدىسى

ئالپ تور بېتىدە قانۇنغا خىلاپ، سىياسى، دىنىي ، مىللەتلەر ئىتتپاقلىقىغا بۇزغۇنچىلىق قىلىش خاراكتىردىكى ، سېرىق، شەھۋانىي مەزمۇندىكى يازمىلار، ئۈن-سىن، رەسىملەر چەكلىندۇ

ئالپ تور بېتىدە ۋە ئالپ ئۈندىدار سالونىدا يوللانغان مەزمۇنلار ئالپ تورىغا تەۋە، رۇخسەتسىز كۆچۈرۈپ تارقىتىشقا بولمايدۇ. كۆچۈرۈپ تارقاتقۇچىلار بايقالسا قانۇنى مەسئۇلىيتى سۈرۈشتۈرۈلدۇ

特别警告:本网站坚决不允许发表违反国家法律法规的、含有分裂煽动内容的、引起民族矛盾的、破坏民族团结的、带有宗教色彩或有色情的文章

帖子、图片、音视频、电影、歌曲等。若发现将IP地址上报相关部门处理,后果自负。注意自我保护,谨防上当受骗

快速
回复
返回
列表
返回
顶部