pis-pas يوللانغان ۋاقتى 2014-12-13 10:56:58

يۇقۇرى ئۈنۈملۈك ئۇيغۇرچە ھەرپ تونۇتۇش ۋە چۈشۈنۈش سېستىمسى

«يۇقۇرى ئۈنۈملۈك ئۇيغۇرچە ھەرپ تونۇتۇش ۋە چۈشۈنۈش سېستىمسى» باھالاپ بېكىتىشتىن ئۆتتى
كەسىپ ئەھلىلىرىنى كۆپ يىللاردىن بېرى ئازابلاۋاتقان ئۇيغۇرچە خەتلەرنى تونۇتۇش ۋە ئۇيغۇرچە –خەنزۇچە تەرجىمە قىلىش مەسىلىسى چىڭ خۇا ئۇنىۋېرسىتىدىكى دىڭ شىياۋ چىڭ(丁晓青) ئەپەندى يېتەكچىلىكىدىكى تەتقىقات كوللېكتىپى تەرىپىدىن ھەل قىلىندى . 12-ئاينىڭ 1- كۈنى، مائارىپ مىنىستىرلىقى بېي جىڭ چىڭ خۇا ئۇنىۋېرسىتىدا ئۆتكۈزۈلگەن  « يۇقىرى ئۈنۈملۈك ئۇيغۇرچە ھەرپ تونۇتۇش ۋە چۈشىنىش سىستېمىسى» پەن تېخنىكا نەتىجىسىنى باھالاش يىغىنىدا باھالاش كومىتېتىنىڭ مۇدىرى جۇڭ گۇ قۇرۇلۇش ئاكادېمىيىسى ئاكادېمىكى نىې گۇاڭنەن(倪光南) ئەپەندى : چىڭ خۇا ئۇنىۋېرسىتېتى دىڭ شىياۋچىڭ ئەپەندى يېتەكچىلىكىدىكى تەتقىقات كوللېكتىپى تۇنجى بولۇپ ئۇيغۇر ھەرپلىرىنىڭ ئۇلانما ھالەتتە پەرقلەندۈرۈشىنى ئەمەلگە ئاشۇرغانلىقى ۋە پەرقلەندۈرۈش بىلەن ئۇيغۇرچە –خەنزۇچە تونۇتۇپ چۈشىنىشنى بىر گەۋدىلەندۈرگەن سىستېمىنىڭ قۇرۇلغانلىقىنى، ۋە بۇنىڭ دۇنيادا ئالدىنقى قاتارغا يەتكەنلىكىنى  جاكارلىدى .

2011-يىلدىن بېرى، دۆلەت تەبىئىي پەنلەر فوندىنىڭ مۇھىم تۈرلەرنى قوللىشى ئاستىدا، چىڭ خۇا ئۇنىۋېرسىتېتى ئېلېكتر قۇرۇلۇش فاكۇلتېتى مىللىي يېزىقلارنىڭ ئۇلىنىپ يېزىشنى پەرقلەندۈرۈش تەتقىقاتىغا چۆكۈپ ئىزدىنىۋاتقان بولۇپ، تەتقىقات گۇرۇپپىسى بۇرۇنقى ئۇيغۇر  ھەرپلەرنى پارچىلاپ تونۇتۇش ئۇسۇلىنى تاشلاپ، ماركوۋ مودېلى يوشۇرۇنغان مودېل(Hidden Markov Model, HMM) ئاساسىدا پارچىلانمىغان ( ئۇلانغان ھالەتتە) ئۇيغۇرچە يېزىقنى تونۇتۇش  تېخنىكىسىدا يېڭىلىق ياراتقان، شۇنىڭ بىلەن بىللە، شىنجاڭ ئۇنىۋېرسىتېتى ئۇچۇر تېخنىكىسى ۋە قۇرۇلۇش ئىنستىتۇتى مۇدىرى پىراففىسور  تۈرگۈن ئىبراھىم  باشچىلىقىدىكى كوللېكتىپ ئۇيغۇرچە –خەنزۇچە تېكىستلەرنىڭ تەرجىمە تېخنىكىسىغا مەسئۇل بولغان ، بېي جىڭ ۋېن توڭ تېخنىكا چەكلىك شىركىتى سىستېما قۇرۇلۇشى ۋە تور   مۇلازىمەت سۇپىسىنى ياساشقا مەسئۇل بولغان ،جاپالىق ئىزدىنىشلەر ئارقىلىق ئاخىرى « يۇقىرى ئۈنۈملۈك ئۇيغۇرچە ھەرپ تونۇتۇش ۋە چۈشىنىش سىستېمىسى»تەتقىق قىلىنىپ دۇنياغا كەلگەن.

تەتقىقات تۈر گۇرۇپپىسىنىڭ ئەزاسى باي جىڭ ئۇنىۋېرسىتېتى ئېلېكتر فاكۇلتېتىدىن پېڭ لىياڭرۈي(彭良瑞) فىراپپىسورنىڭ تونۇشتۇرۇشىچە، ئۇيغۇر يېزىقى خەنزۇ ۋە لاتىن يېزىقلىرىغا ئوخشىمىغاچقا، ھەرپلەرنىڭ تاشقى شەكلى ۋە قۇرۇلمىسىنىڭ ئۆزگىرىشى بەكمۇ چوڭ ، ھەرپلەر ئۇلىنىپ يېزىلىدۇ  ۋە بۇ ھەرپلەرنى پەرقلەندۈرۈلۈش تەس بولۇشى ئۇيغۇر يېزىقىنىڭ پەرقلەندۈرۈشىگە زور قىيىنچىلىق تۇغدۇرۇۋاتقان ئىدى .
ئۇ يەنە : بۇ سىستېما تۇنجى بولۇپ ئۇيغۇر ھەرپلىرىنىڭ ئۇلانما ھالەتتە پەرقلەندۈرۈشىنى ئەمەلگە ئاشۇرغان بولۇپ، بىر سىستېما رامكىسى ئىچىدىلا تۇنجى بولۇپ ئۇيغۇرچە ھەرپلەرنى تونۇتۇش ۋە تەرجىمە قىلىپ چۈشەندۈرۈش چاكسىز  ئۇلانغان ، بۇ تېخنىكا ئۇيغۇر يېزىقتىكى ھۆججەتلەرنىڭ سكانىرلارپ تونۇتۇپ كومپيۇتېرغا كىرگۈزۈش ۋە خەنزۇچىنى نىشان تىل قىلغان تىللار ئارىسىدىكى  ئالماشتۇرۇپ چىقىرىشتەك قىيىن نۇقتىنى ھەل قىلدى، دەيدۇ  .
چۈشەندۈرۈلۈشىچە، بۇ سىستېما ئۇيغۇر تىلىنىڭ ئىشخانا ئاپتوماتلاشتۇرۇش، ئېلېكترونلۇق مەتبۇئات، ئىنتېرنېت ئۇچۇر مەنبەلىرىنى قۇرۇش قاتارلىق ساھەلەردە ئىشلىتىلىدىكەن. بۇ تەتقىقات نەتىجىسىنىڭ قولغا كېلىشى دۆلىتىمىز شىنجاڭ رايونىدىكى مىللىي تىل-يېزىقلاردىكى  ھۆججەت-ماتېرياللارنىڭ ئىلغار رەقەملەشتۈرۈش يولىنى ئېچىپ بەردى، شۇنداقلا خەنزۇ تىلىنى نىشان تىلى قىلغان تىللار ئارىسىدىكى ئالاقىنى كۈچەيتىدۇ ، مىللەتلەر ئارىسىدىكى مەدەنىيەت ئالماشتۇرۇشقا پايدىلىق .

چىڭخۇا ئۇنىۋېرسىتىتى تورىدىن تەرجىمە قىلىندى

gldingwash يوللانغان ۋاقتى 2014-12-13 13:31:32

ياخشى نەتىجىدىن بىرسى بارلىققا كەپتۇ مانا!

alip يوللانغان ۋاقتى 2014-12-13 13:51:21

بۇ يەردە دىيىلۋاتقان «ئۇيغۇرچە ھەرپ تونۇش» دېگىنى ئۇيغۇرچە OCR ئوخشىمامدۇ؟

يوللانغان ۋاقتى 1970-1-1 06:00:00

yollugh يوللانغان ۋاقتى 2014-12-13 14:04:30

OCR سىكاننىرلىغان سۈرەتنىڭ ئىچىدىن ھەرىپنى پەرقلەندۈرىدۇ، ماۋۇ قارىغاندا ئۇرۇلغان تېكىستلەرنىڭ ئىچىدىن سۆزلۈكلەرنى پەرقلەندۈرىدىكەن ھەم تەرجىمە قىلىپ بېرىدىكەن، مۇشۇ جەرياننى چۈشۈنۈش دەپ ئاپتۇ.

بۇنىڭدىن كىيىن كوچىدىكى تاختايلاردا ئادەمنى ھەيرانۇ-ھەس قالدۇرغىدەك ئېسىل تەرجىمىلەر بارلىققا كەلسە ئۇ تەرجىمىنى مۇشۇ سىستىمىدا قىپتۇ -دەپ چۈشىنەرسىلەر{:92:} تەرجىماننىڭ ئىش ھەققىنى تىجەپ قالغۇدەك.

alip يوللانغان ۋاقتى 2014-12-13 14:12:00

yollugh يوللىغان ۋاقتى  2014-12-13 14:04 static/image/common/back.gif
OCR سىكاننىرلىغان سۈرەتنىڭ ئىچىدىن ھەرىپنى پەرقلەندۈرى ...

ئاۋۇ رەسىمدىكىسىمۇ سىكانىرلىغان رەسىمنى تونۇغاندىكى ھالەتكەن. شۇڭا دەۋاتىمەن.

Abdiweli يوللانغان ۋاقتى 2014-12-13 14:25:22

بۇ دىگىنى بۇنىڭدىن كىيىن توردا ئۇيغۇرچە يىزىقتا پاراڭلاشقاندا ئېھتىيات قىلىڭ ! ئارتۇقچە سۆزلىسىڭىز بىز بىلىپ قالىمىز دىگىنى {:92:}

yollugh يوللانغان ۋاقتى 2014-12-13 14:25:43

بەلكىم. OCR چىققىلى خېلى بولدىغۇ، تەكرار ئەمگەك قىلىپ يۈرمەس.

Bayawan يوللانغان ۋاقتى 2014-12-13 14:25:50

راسىت گەپ قىلسام بۇ خەۋەردە نىمە دەۋاتقىنىنى چۈشەنمىدىم، بەلكى  ئو سى ئار  نى دەۋاتقان بولسا كېرەك دەپ پەرەز قىلدىم

iltersh يوللانغان ۋاقتى 2014-12-13 14:33:26

Abdiweli يوللىغان ۋاقتى  2014-12-13 14:25 static/image/common/back.gif
بۇ دىگىنى بۇنىڭدىن كىيىن توردا ئۇيغۇرچە يىزىقتا پاراڭ ...

گەپنىڭ جىڭ باسىدىغىنى مۇشۇ

iltersh يوللانغان ۋاقتى 2014-12-13 14:36:06

yollugh يوللىغان ۋاقتى  2014-12-13 14:25 static/image/common/back.gif
بەلكىم. OCR چىققىلى خېلى بولدىغۇ، تەكرار ئەمگەك قىلىپ يۈ ...

قېنى شۇ ocr تەتقىق قىلنىپ ياساپ چىقىلغان ؟
شۇنداق گەپلەرنى ئالامەت جىق ئاڭلىدىم،لېكىن چىشىم چىققاندىن بېرى بىرنىمۇ كۆرۈپ باقمىدىم
راست ياسالغان بولسا بازارغا سېلىنار ئىدى،مەنمۇ بىرنى ئالار ئىدىم

cooloff يوللانغان ۋاقتى 2014-12-13 14:58:30

بۇنىڭ توغرىلىق نىسبىتى ۋە خاتالىق پەرقى قانچىلىك؟  بۇدىن بۇرۇن ocrلار ياسالغان لىكىن تېكىستكە توغرا ئايلاندۇرۇش نىسبىتى 60%كىمۇ يەتمەيدۇ. ئۇنىڭ ئۈستىگە خاتا خەتلەرنى قايتا تۈزىتىش ئۇ بىر ۋاقىت كىتىدىغان ئىش، شۇڭا بىۋاستە قولدا ئۇرۇپ ئايلاندۇرش ياخشى چارىكەن،چۈنكى ئۇنى مەن ئىشىلتىپ باققان..
ئاۋۇ تەرجىمىگە كەلسەك، سۆزگە ئاساسەن تەرجىمە قىلىدىغاندەك تۇرىدۇ، لىكىن يەنىلا جۈملىلەرنىڭ توغرىلىق دەرىجىسىدە خاتالىقلار كۆپكەن...

pis-pas يوللانغان ۋاقتى 2014-12-13 15:28:19

yollugh يوللىغان ۋاقتى  2014-12-13 14:04 static/image/common/back.gif
OCR سىكاننىرلىغان سۈرەتنىڭ ئىچىدىن ھەرىپنى پەرقلەندۈرى ...

بىزچاغلاردا ئۇيغۇرچە سايىلەپ تونۇتۇش ( OCR دەيمىزما؟ ) سېسـتىمىسى توغرىلىق خېلى ئىزدىنىشلەر بولۇپ ، ئورگان تەرەپ بىلەن پارتىزانىسكى تەرەپ ئوتتۇرسىدا خېلى قىزغىنىشلار بولغاندەك قىلغان .
چىڭ خۇائنىڭ تەتقىقى قىلىپ چىققىنى ئورگان تەرەپ ( ھوشۇر ئىسلام ، تۈرگۈن ئىبراھىم  قاتارلىقلار رەھبەرلىكىدىكى گۇرۇپپا) بىلەن ھەمكارلىشىپ  ياساپ چىققان دەرىجىسى ئۆستۈرۈلگەن ( ماشىنا تەرجىمىنى قوشۇپ) نۇسىخىسىدەك قىلىدۇ.
ئەسلى مەنبە: http://news.tsinghua.edu.cn/publish/news/4205/2014/20141203155830165807178/20141203155830165807178_.html

pirogrammer يوللانغان ۋاقتى 2014-12-13 15:46:41

بۇ يازمىنى ئاخىرىدا   pirogrammer تەھرىرلىگەن. ۋاقتى  2014-12-13 15:54  

iltersh يوللىغان ۋاقتى  2014-12-13 14:36 static/image/common/back.gif
قېنى شۇ ocr تەتقىق قىلنىپ ياساپ چىقىلغان ؟
شۇنداق گەپلە ...

بىلىشىمچە OCR نى تۆت تەرەپ، يەنى شىنجاڭ ئۇنىۋېرسىتېتى، ماۋۇ چىڭخۇا ئۇنىۋېرسىتېتى ۋە يەنە ئىچكىردىكى بىر شىركەت بولدىغان، يەنە بىرى بىر ئۇيغۇر كارخانىسىمۇ ياساپتىكەن، ئەمما توغرىلىق نىسبىتى تۆۋەن ۋە ساتقاندىن كېيىن ھېچقانداق يېڭىلىنىش ۋە ئىگە بولۇش مۇلازىمىتى بولمىغاچقا يوقاپ كەتكەنمىش.
كۆپۈنچىلىرىنى سېتىۋېلىش بەك قىيىنكەن، پۇلى قىممەت.
OCR نى تەتقىق قىلىۋاتقانلار بۇلارلا ئەمەس...

iltersh يوللانغان ۋاقتى 2014-12-13 16:37:37

ئىشىنىمەنكى بۇ ھەرگىزمۇ بازارغا سېلىنمايدۇ ھەم سېتىلمايدۇ
پەقەتلا دۆلەت بىخەتەرلىك ئورۇنلىرى ئۈچۈن ئىشلىتىلىدۇ
قاچانمۇ  شەخسلەر نۇسخىسى بازارغا سېلىناركىن

terjiman يوللانغان ۋاقتى 2014-12-13 16:40:46

مەن ئىشىنىمەن، بۇ دېتال ھەر قانچە كۈچلۈك بولسىمۇ ئۇيغۇرچىدىكى جانلىق جۈملە تەركىبلىرىدىن «قالدى»، «بولدى»، «تۇردى»، «يۈردى»، «سالدى»، «ئالدى»، «چىقتى»...... دېگەندەك سۆزلەرنىڭ مەنىسىنى ئوچۇق چىقىرالمايدۇ، بۇلار تىلىمىزنىڭ گىرامماتىكا بايلىقى، تىل ئۆگەنگۈچىلەر ئۈچۈنمۇ ئەڭ يۇقىرى بىر پەللە ......

xaqan يوللانغان ۋاقتى 2014-12-13 16:48:06

مۇشۇ OCR سسىتېمىنى دەسلەپتە شىنجاڭ ئۇنىۋېرسىتېتى ياساپ چىققان بولۇپ، توغرۇلۇق نىسپىتى بەك تۆۋەن ئىكەنتۇق. 2010-يىللىرى مەن ئۇيغۇر سوفت شىركىتىدە خەنۋاڭ شىركىتى ياسىغان ئۇيغۇرچە OCR سىستېمىسىنى كۆرگەن، بەك ياخشى تونۇيتىكەنتۇق. ئالىم مۇئەللىمنىڭ دېيىشچە ئۇيغۇر سوفت كوررېكتورىنى OCR نىڭ يادروسىغا قېىۋېتىلسە، ئىملا تېخىمۇ توغرا بولىدۇ دېگەن، لېكىن خەنۋاڭ شىركىتى بازار ئېھتىياجىنى بەك ئاز بولغاچقا بازارغا سالمىغان دېگەندەك گەپلەرنى قىلغىنى ئېسىمدە. ئۇ سىستېمىنى مەنمۇ ئىشلىتىپ كۆرگەن ئىدىم. ھەقىقەتەن ياخشى تونۇيتىكەنتۇق.

alip يوللانغان ۋاقتى 2014-12-13 17:03:18

yollugh يوللىغان ۋاقتى  2014-12-13 14:25 static/image/common/back.gif
بەلكىم. OCR چىققىلى خېلى بولدىغۇ، تەكرار ئەمگەك قىلىپ يۈ ...

بۇرۇنقىسى سۆزنى ھەرپكە پارچىلاپ تونۇيدىكەنتۇق. ماۋۇنىڭ ئاۋۇ چۈشەندۈرۈشىگە قارىغاندا سۆز ياكى بۇغۇم بويىچە تونۇيدىغاندەك قىلىدۇ. راست شۇنداق بولسا تەكرار ئەمگەك بولمايدۇ.

perwazqil يوللانغان ۋاقتى 2014-12-13 17:24:28

ئەسىلامۇ ئەلەيكۇم ،  ئۇيغۇرچە خەت ئۇرۇشنى مەشق قىلدىغان ،كومپىيوتىرغا چۇشۇشىغان(تىلفۇن نۇسقىسى ئەمەس) ئەپ بولسا  چۇشۇرۇش ئادىرسىنى بىر يوللاپ بەرسەڭلار بەكمۇ مەمنۇن بۇلاتتىم ،  بىرسى ھاۋالە قىلغان ، مەن تاپالمىدىم،  رەھمەت!

boran0998 يوللانغان ۋاقتى 2014-12-13 17:55:53

ئۇيغۇرچە ھەرپ- بەلگىلەرنى مۇشۇنداق تونۇتۇشتا، ئەڭ قىيىن مەسىلە ئىملا مەسىلىسى. توربەتلەردىكى نۇرغۇن يازمىلاردا ئىملا خاتالىقى دېگەن ساماندەك. «ئوغۇلبالا» دېگەن سۆزنى «ئۇغۇلبالا، ئوغولبالا، ئوغاۋالا» دەپ يازسىمۇ ھەر ھالدا مەنىسى جىق ئۆزگىرىپ كەتمىگەندىكىن، كۆپىنچە كىشىلەر قانداق ئوڭ كەلسە شۇنداق يېزىۋېرىدۇ. شۇنداق بولغاچقا، بۇ تەتقىقاتنى «دۇنياۋى سەۋىيەگە يەتتى» دىيىش سەل بالدۇرلۇق قىلىدۇ. ئۇندىن باشقا، تىلىمىزدا شەكىلداش سۆز، ئاھاڭداش سۆزلەر بار. بۇنداق سۆزلەرنى ماشىنىنىڭ پەرقلەندۈرەلىشى تەس.
بەت: [1] 2
: يۇقۇرى ئۈنۈملۈك ئۇيغۇرچە ھەرپ تونۇتۇش ۋە چۈشۈنۈش سېستىمسى