ASCII نى ئىشلىتىپ ئىپادىلەيدىغان ھەرىپ-بەلگىلەرگە نىسبەتەن Unicode نىڭ ئۈنۈمى ئانچە يۇقىرى ئەمەس ، چۈنكى Unicode نى ASCII غا سېلىشتۇرغاندا بىر ھەسسە كۆپ بوشلۇق ئىگەللەيدۇ . ئەمما ASCII نى ئېلىپ ئېيىتساق يۇقىرقى يېزىق بوغۇمى (高字节)دىكى O نىڭ ئونىڭغا نىسبەتەن ھىچقانداق رولى يوق . بۇ مەسىلىنى ھەل قىلىش ئۈچۈن بىر قىسىم ئوتتۇرا فورماتلىق (中间格式) ھەرىپ- بەلگىلەر توپلىمى كەشىپ قىلىندى . ئۇلار ئورتاق ئىشلىتىلىدىغان ئاممىباب ئالماشتۇرۇش فورماتى دەپ ئاتالدى . يەنى UTF(Universal Transtarmation Format) نۆۋەتتە مەۋجۇت بولۇپ تۇرۇۋاتقان UTF فورماتلىرىدىن UTF-7 ، UTF7.5 ، UTF-8 ، UTF-16 ھەمدە UTF-32 قاتارلىقلار بار . بۇ ماقالىدە UTF-8 ھەرىپ - بەلگىلەر توپلىمى ھەققىدە چۈشەنچە بېرىمىز .
]kJ'}UE. UTF-8 بولسا Unicode نىڭ بىر خىل ھەرىپ- بەلگىلەر توپلىمى .
kz}DZ(a' Ken Thomsom تەرىپىدىن 1992-يىلى ئىجاد قىلىنغان . ھازىر RFC3629 بولۇپ ئۆلچەملەشتى . UTF-8 بولسا 1 دىن 6 بايىتقىچە بوغلۇق ئىشلىتىپ Unicode لۇق ھەرىپ-بەلگىلەرنى تەھرىرلەيدۇ . ناۋادا Unicode لۇق ھەرىپ-بەلگىلەر 2 بايتى بىلەن ئىپادىلەنسە ، UTF-8 شەكلىدە تەھرىرلەپ چىقىش ئۈچۈن 3 بايىت كېتىشى مۇمكىن ، ناۋادا Unicode لۇق ھەرىپ-بەلگىلەر 4 بايتى بىلەن ئىپادىلەنسە ، UTF-8 شەكلىدە تەھرىرلەپ چىقىش ئۈچۈن 4 بايىت كېتىشى مۇمكىن ، 4 ياكى 6 بايت ئارقىلىق Unicode لۇق بەلگىلەرنى تەھرىرلەشكە تېخىمۇ كۆپ كېتىشى مۇمكىن ، ئەمما بۇ خىل تەھرىرلەش ئۇسۇلى بەكلا ئاز ئۇچىرايدۇ .
f P*4vsE+ UTF-8 تەھرىرىنىڭ ئارتۇقچىلىقى
]");hU UTF-8 تەھرىرى نىقاپلىق بىت (屏蔽位)ۋە ئورۇن يۆتكەش مەشخۇلاتى (移位操作)ئارقىلىق تىز يېزىش ئىقتىدارىغا ئېگە . ھەرىپ - بەلگىلەر تىزمىسىنى سېلىشتۇرغاندا ()strxmp ۋە ()wcscmp نىڭ قايتۇرغان قىممىتى ئوخشاش ، شۇسەۋەپتىن رەتلەش تېخىمۇ ئوڭاي بولىدۇ . UTF-8 تەھرىرى ھەرىپ تەرتپى مۇناسىۋەتسىز ببولىدۇ . شۇڭا تەرتىپكە مۇناسىۋەتلىك بولغان BOM نى ئىشلىتىشنىڭ ھاجىتى يوق .
C{V@zW UTF-8 تەھرىرىنىڭ كەمچىللىكى .
15=V$i unicode ھەرىپ - بەلگىلەر سانىدىن utf-8 يېزىقىنىڭ بايىت سانىغا ھۆكۈم قىلىپ چىقىشقا بولمايدۇ ، چۈنكى utf-8 بولسا ئۇزارغان تەھرىر بولۇپ 2 بايىتلىق تەھرىرلەش شەكلىنى قوللىنىدۇ . كىڭەيتىلگەن ASCII ھەرىپ - بەلگىلىرى بولسا بىر بايىتلىق ھەرىپ - بەلگىلەر تەھرىرى ISO latin-1 نى ئىشلىتىدۇ . ئۇ بولسا unicode نىڭ بىر تارمىقى ، ئەمما UTF-8 گە تەۋە ئەمەس . 8 ئۆلچەملىك ھەرىپ - بەلگىلەردىن تۈزۈلگەن UTF-8 تەھرىرى بەلكىم email تور ئۆتكىلى تەرپىدىن سۈزىۋىتىلىشى مۇمكىن . چۈنكى internet ئۇچۇرلىرى ئەڭ دەسلەپتى 7 ئۆلچەملىك ASCII كودى قىلىپ لايھىلەنگەن . شۇ سەۋەپتىن UTF-7 كود تەھرىرى شەكىللەنگەن .
m,u44HAR6 ($0IU+=% قانىلىمىز داۋاملىق يېڭى ماتىرياللار بىلەن تەمىنلەيدۇ .
}Kp@K DBS تېخىمۇ كۆپ بىلىمگە ئېرىشمەكچى بولسىڭىز
www.darslik.com غا مەرھەممەت .