Skip to content

Latest commit

 

History

History
22 lines (16 loc) · 3 KB

README.md

File metadata and controls

22 lines (16 loc) · 3 KB

Syllabification-for-Uyghur

سۆزلەرنى ئاپتۇماتىڭ ھالدا بوغۇمىغا ئايرىش كومپىيوتېر ئارقىلىق تەبىئىي تىل بىر تەرەپ قىلىش ساھەسىدە ناھايىتى موھىم ئەھمىيەتكە ئىگە خىزمەت بولۇپ، ئاۋازنى ئاپتۇماتىك تونۇش،تېكىسنى ئاپتۇماتىك سۆزلەش،ئاپتۇماتىك تەرجىمە قىلىش قاتارلىق ساھەلەردە ناھايىتى كەڭ قوللىنىشچانلىققا ئىگە، شۇڭا بىز بۈگۈنكى ئ‍ۇيغۇر تىلىدىكى سۆزلەرنى پىروگىرامما ئارقىلىق ئاپتۇماتىڭ بوغۇمغا ئايرىش ھەققىدا توختىلىپ ئۆتىمەن.

ھەممىمىزگە مەلۇم بولغىنىدەك ئۇيغۇر تىلى يىزىق تۈرۈك يىزىقىنىڭ شەرقى تارماق قىسمىغا تەۋە بولۇپ ، ئىپادىلەش شەكلى جەھەتتىن ئەرەب يىزىقى ئاساسىدىكى ئۇيغۇر يىزىقى ، لاتىن يىزىقى ئاساسىدىكى ئۇيغۇر يىزىقى ۋە سيلىرىك يىزىقى ئاساسىدىكى ئ‍ۇيغۇر يىزىقى دەپ ئۈچ تۈرگە بۆلىنىدۇ ، بۇلارنىڭ ھەرىپ شەكىلىرى مەنبە1،2،3لەردىن كۆرۇلسە بولىدۇ. تۆۋەندىكى پىروگىراممىسا ئاساسلىق لاتىن يىزىقى ئاساسىدىكى سۆزلەرنى بوغۇمغا ئايىرش سۆزلىنىدۇ، ئەگەر قىزىققۇچىلار بولسا ئەسىلى كود چۈشۈرۇپ باشقا شەكىلدى ئ‍ۇيغۇر يىزىقىغا ماشلاشتۇرۇپ ئىشلەتسە بولىدۇ . تۆۋەندىكى پىرو گىرامما ئاساسلىقى دوكتۇر مەمتىمىن سەمەتنىڭ « ئ‍ۇيغۇر يىزىقىدىكى سۆزلەرنى ئوغۇمىغا ئايرىش قائىدىسى» نامىلق ماقالىسىگە ئاساسەن تۈزۈپ چىقىلغان بولۇپ ،بۇ پىروگىراممىنى كۆرۇشتىن ئاۋال ئەسلى ماقالىنى تەپسىلى ئوقۇپ چىقىشنى تەۋسىيە قىلىمەن. كود چۈشۈرۈش مەنبەسى:

سەمىمىي ئەسكەرتىش: مەزكۇز كودتا بەزى خاتالىقلار مەۋجۇت بولۇمىشى مومكىن ، كەڭ تورداشلارنىڭ مەسىلىلەرنى بايقىغان ھامان ئىنكاس قىلىشىنى تۈۋەنچىلىك بىلەن سورايمەن.

مەنبە: 1.ئۇيغۇر تىلى ئەرەپچە ئىلىپپە جەدىۋىلى https://en.wikipedia.org/wiki/Uyghur_Arabic_alphabet

2.ئ‍ۇيغۇر تىلى سيرلىك ئىلىپپە جەدىۋىلى https://en.wikipedia.org/wiki/Uyghur_Cyrillic_alphabet

3.ئۇيغۇر تىلى لاتىنچە ئىلىپپە جەدىۋىلى https://en.wikipedia.org/wiki/Uyghur_Latin_alphabet

A Syllabification Algorithm and Syllable Statistics of Written Uyghur http://ucrel.lancs.ac.uk/publications/CL2007/paper/153_Paper.pdf