ھازىرجاۋاب قوليازما ھەرپ (ئۇيغۇرچە) پەرقلەندۈرۈش تېخنىكىسى توغرىسىدا دەسلەپكى ئىزدىنىش
ئىدىقۇت
كىرىش سۆزنىڭ ئالدىدىكى سۆز
بۇ يازمىدا ئاساسلىقى ھازىرجاۋاب قوليازما پەرقلەندۈرۈش (Online Handwritten Recognition) سىستېمىسىنىڭ ئومومى پرىنسىپلىرى قىسقىچە تونۇشتۇرۇلىدۇ. مەن بۇ ساھەگە ئۇيغۇرچە ھەرپ پەرقلەندۈرۈش سىستېمىسىنى ۋۇجودقا كەلتۈرۈشنى مەقسەت قىلىپ كىرگەن بولغاچقا ماۋزۇغا (ئۇيغۇرچە) دەپ قوشۇپ قويدۇم. ئەمما بۇ يەردە كونكىرت قىلىپ ئۇيغۇرچە تۇغرۇلۇق سۆزلەشكە تېخى ئاجىزلىق قىلىمەن. شۇڭا «ئۇمومىي پىرىنسىپ» لىرىنى تونۇشتۇرۇش بىلەنلا چەكلىنىمەن.
كىرىش سۆز
يېزىق تونۇش(پەرقلەندۈرۈش) سىستېمىسى بولسا ھازىرقى زامان كومپىيۇتېر تېخنىكىسى تەتقىقاتىدىكى قىزىق نۇقتا Pattern Recognition ياكى Pattern Classification نىڭ مۇھىم تارمىقى. ئۇنداقتا يېزىق تونۇش دىگەن نىمە؟
يۇقىرىدىكى مۇناسىۋەتكە ئاساسەن ئاددى قىلىپ ئېيتساق، يېزىق تونۇش بولسا باسما يېزىق ۋە ھەرخىل ئېھتىياجغا ئاساسەن ئوخشىمىغان مۇھىتلاردا خاتىرىلەنگەن قوليازمىلارنى كومپىيۇتېر تونۇيدىغان كودغا ئايلاندۇرۇش جەريانىدۇر. ئەمدى يېزىق تونۇشنىڭ ھەرقايسى تارماقلىرىغا قاراپ باقايلى.
باسما يېزىق تونۇش بولسا سايىلەش(سىكاننېرلاش) ئارقىلىق ئېرىشكەن كىتاپ، ژورنال رەسىملىرىنى كومپىيۇتېرغا كىرگۈزۈپ، رەسىمدىكى يېزىقلارنى كومپىيۇتېر تونۇيدىغان كودغا ئايلاندۇرۇش جەريانىدىن ئىبارەت ياكى بىز ئادەتتە دەپ كېلىۋاتقان (Optical Character Recognition) OCR دىن ئىبارەت. بۇ ئوقۇم تورداشلارغا ئانچە ناتونۇش ئەمەس دەپ قارايمەن. چۈنكى، بازاردا شىنجاڭ سەركە ئۇچۇر تېخنىكىسى چەكلىك شىركىتى بازارغا سالغان كۆپ خىل يېزىقنى تونۇيدىغان OCR يۇمشاق دېتالى بار.
قوليازما تونۇش ئىككى تارماقنى ئۆز ئىچىگە ئالىدۇ. ھازىرجاۋاپ ۋە ئوپتىكىلىق قوليازما پەرقلەندۈرۈش سىستېمىسى (مەن Online نى ھازىرجاۋاپ دەپ ئالدىم. چۈنكى، ئۇنىڭ مەنىسى Real Time بىلەن ئۇخشاش). بۇ خىل سىستېمىلارنىڭ پرىنسىپى شۇكى ئىدراكلىق يانفۇن قاتارلىق ھەرخىل PDA ئەسۋابلىرى، تەبلىت كومپىيۇتېر ياكى سەزگۈر ئىكرانلىق تېرمىنال قاتارلىق كونۇپكا تاختىسى ئورنىتىش قۇلايسىز بولغان ئۈسكىنىلەرنىڭ ئىكرانىغا قولدا ياكى ماس بولغان ماگنىتلىق قەلەمدە خەت يازغاندا بېسىلغان نوقتىنىڭ كوردىنات ئۇچۇرى قاتارلىقلارغا ئاساسەن دەرھاللا خەتنى ئىكراندا كۆرسىتىپ بېرىدۇ. شۇڭا مەن ۋاقتىنچە ھازىرجاۋاپ دەپ تۇردۇم. بۇ يازمىدا تونۇشتۇرۇلماقچى بولغىنىمۇ دەل مۇشۇ خىل سىستېما.
ئوپتىكىلىق قوليازما پەرقلەندۈرۈشنىڭ ئېنگىلىزچىسى Offline Handwritten Recognition بولۇپ، پرىنسىپى OCR (ئوپتىكىلىق ھەرپ پەرقلەندۈرۈش دىگەننىڭ قىسقارتىلمىسى) بىلەن ئوخشاش. ئوخشىمايدىغان يېرى سايىلەش ئوبيىكتىدۇر. باسما يېزىق پەرقلەندۈرۈشتە كىتاب- ژورنالنى، ئوپتىكىلىق قوليازما پەرقلەندۈرۈشتە دەپتەرگە يېزىلغان قوليازمىلارنى سايىلەيمىز. شۇڭا Offline HWR نى ئوپتىكىلىق قوليازما پەرقلەندۈرۈش دەپ ئالغان. Offline) ۋە Online غا باشقا مۇۋاپىق تەرجىمە بولسا ئالماشتۇرۇۋەتسەك بۇلىدۇ).
ئەمدى Pattern Recognition (Pattern Classification) غا بىر تەبىر بېرەيلى. ئۇنداقتا Pattern دىگەن نىمە؟ ئاددى قىلىپ كومپىيۇتېرنىڭ پەرقلەندۈرۈش(تونۇش) ئوبيىكتىنى Pattern دەپ چۈشەنسەك بۇلىدۇ، مەسىلەن: ئاۋاز پەرقلەندۈرۈشتىكى ئاۋاز، يېزىق پەرقلەندۈرۈشتىكى يېزىق، چىراي پەرقلەندۈرۈشتىكى چىراي، گاز پەرقلەندۈرۈشتىكى گاز، سۈنئىي ھەمرا تارتقان سۈرەتتىكى مۇھىت ۋەھاكازالار. مۇنداقچە ئېيتقاندا بىز سەزگۈ ئەزالىرىمىز ئارقىلىق سىزەلەيدىغان بارلىق شەيئىلەرنى Pattern دەپ قارىساق بۇلىدۇ ( مۇشۇ نۇقتىدىن PR (Pattern Recognition) نى شەيئى پەرقلەندۈرۈش (تونۇش) ياكى مەۋجۇدىيەت پەرقلەندۈرۈش دەپ ئالساق قانداق بۇلار؟). PR نىڭ ئۆزى بىر دۇنيا، بۇ يەردە بىر قانچە جۈملە بىلەن چۈشەندۈرۈپ بولغىلى بولمايدۇ. ئەمما بارلىق PR سىستېمىلىرى ئاساسەن تۆۋەندىكى بىر قانچە باسقۇچنى بېسىپ ئۆتىدۇ.
تۆۋەندە ھازىرجاۋاپ قوليازما ھەرپ پەرقلەندۈرۈش سىستېمىسىنى مىسال قىلىپ ھەرقايسى باسقۇچلارنى قىسقىچە چۈشەندۈرۈپ باقاي.
• ئۇچۇر يىغىش
ئۇچۇر يىغىش باسقۇچى ئۆزىمىزگە لازىملىق ئەۋرىشكىگە(Sample) ئېرىشىش جەريانىدۇر. ئوخشىمىغان PR سىستېمىلىرىدا ئېرىشكەن ئۇچۇر ئوخشىمايدۇ. ھازىرجاۋاپ قوليازما پەرقلەندۈرۈش سىستېمىسىدا x-y كوردىنات سىستېمىسى ئارقىلىق بەلگىلىنىدىغان قوش ئۆلچەملىك ئۇچۇرغا ئېرىشىمىز. ھازىرجاۋاپ ھەرپ پەرقلەندۈرۈش سىستېمىسىدا سىزىق سانى، ۋاقىت تەرتىپى، كوردىنات ئورنى قاتارلىق جەريان (Dynamic) ئۇچۇرلىرىغا ئېرىشكىلى بولغاچقا ئوپتىكىلىق قوليازما پەرقلەندۈرۈش سىستېمىسىغا نىسبەتەن ئاسان دەپ قارىلىدۇ. بۇ يەردىكى سىزىق مائوس ياكى ماگنىتلىق قەلەم ئىكرانغا بىر تىگىپ كۆتۈرۈلگىچە بولغان ئارىلىقتا خاتىرىلەنگەن بىر بۆلەك ئىز ئۇچۇرىنى كۆرسىتىدۇ. مەسىلەن: ئۇيغۇرچە «ئا» ھەرپىنى ئۆلچەملىك يازساق ئىككى سىزىق بۇلىدۇ. ئۇچۇر يىغىش باسقۇچىدىكى ئاساسلىق ۋەزىپە مائوس ياكى ماگنىتلىق قەلەمنىڭ ئىزىغا ئېرىشىش ۋە ئۇنى مەلۇم بىر فورماتتا ئورۇنلاشتۇرۇپ، ھۆججەتكە ياكى شۇ فورماتقا ماس ئۆزىمىز ئېنىقلىغان تىپتىكى (Data Type) ئۆزگەرگۈچى مىقدارغا ساقلاش.
• ئالدىن بىر تەرەپ قىلىش(Preprocessing)
بۇ باسقۇچتا ئالدىنقى باسقۇچتا ئېرىشكەن ئەۋرىشكە تەركىبىدىكى ھەرخىل «شاۋقۇن» ئۇچۇرلارغا تازىلاش ئىلىپ بېرىلىدۇ. بۇ باسقۇچنىڭ مەقسىدى ئۆزىمىزگە پايدىلىق ئۇچۇرلارنى تېخىمۇ گەۋدىلىك قىلىش، كاشىلا ئۇچۇرلارنى ئىمكانقەدەر يۇقىتىشتۇر. ئۇخشىمىغان PR سىستېمىلىرىدا بىر تەرەپ قىلىشقا تىگىشلىك كاشىلا ئۇچۇرلار ئۇخشىمايدۇ. ئەلۋەتتە بىر تەرەپ قىلىدىغان ئالگورىزىملارمۇ (Algorithm) ئوخشىمايدۇ. ھازىرجاۋاپ قوليازما ھەرپ پەرقلەندۈرۈش سىستېمىسىدا ھەرپ كوردىنات ئۇچۇرىدىكى ئارتۇق نۇقتىلارنى چىقىرىۋېتىش، قىيسىقلىقىنى تۇغۇرلاش، چوڭ كىچىكلىكىنى مۇقىملاش قاتارلىق ئالدىن بىر تەرەپ قىلىش مەشغۇلاتى ئىلىپ بېرىلىدۇ. قوليازما پەرقلەندۈرۈشتە دائىم قوللىنىدىغان ئالدىن بىر تەرەپ قىلىش ئالگورىزىملىرىدىن سىزىقلىق ۋە سىزىقسىز قىلىپلاشتۇرۇش (Normalization) ئالگورىزىمى قاتارلىقلار بار.
• خاسلىق سۈزۈش
بۇ باسقۇچ ھەرقانداق بىر PR سىستېمىسىنىڭ جېنى دەپ قارىلىدۇ. بۇ باسقۇچتىكى ئۇچۇر سىستېمىنىڭ تونۇش ئۈنۈمىنىڭ يۇقىرى تۆۋەنلىكىگە بىۋاستە تەسىر كۆرسىتىدۇ. ئەلۋەتتە بۇ باسقۇچ بىلەن ئالدىنقى باسقۇچتىكى ئالگورىزىملارنىڭ ئۆز ئارا ماسلىشىپ كىلىشى تونۇش ئۈنۈمىنى تېخىمۇ يۇقىرى كۆتۈرىدۇ. شۇڭا خاسلىق سۈزۈش (Feature Extraction) باسقۇچىدا ئېرىشىدىغان ئۇچۇرغا مۇنداق ئىككى تەلەپ بار: بىرى- ئېرىشكەن خاسلىق سىستېمىنىڭ تونۇش ئوبيىكتىنى گەۋدىلىك ئىپادىلەپ بېرىشى كېرەك. ئۇيغۇرچە ھەرپ تونۇشقا نىسبەتەن ئېرىشكەن خاسلىق ئۇچۇرى بارلىق ئۇيغۇرچە ھەرپلەرگە ۋەكىللىك قىلالىشى كېرەك. يەنە بىرى- ئېرىشكەن خاسلىق ئۇچۇرىنىڭ ئۆلچەم (Dimension) سانى ئىمكانقەدەر كىچىك بولىشى كېرەك. ئوخشىمىغان PR سىستېمىلىرىدا ئېرىشكىلى بولىدىغان خاسلىقنىڭ ئۆلچەم سانى بەك چوڭ بولىشى ھەتتا چەكسىز بولىشى مۇمكىن. شۇڭا ئامالنىڭ بارىچە تۆۋەن ئۆلچەملىك، ۋەكىللىك خاراكتىرى كۈچلۈك بولغان ئۇچۇرلارنى تاللاپ (Feature Selection) ئېلىپ قىلىش كېرەك. مۇشۇنداق تەلەپ بۇيىچە خاسلىق ئۇچۇرىغا ئىگە بولساق كېيىنكى تونۇش باسقۇچىنىڭ ئۈنۈمى يۇقىرى، ھېسابلاش سۈرئىتى تېز بولىدۇ. خاسلىق سۈزۈشتە سۈنئىي نېرۋا تورى، گىن ئالگورىزىمى(Genetic Algorithm) قاتارلىقلاردىن پايدىلىنىشقىمۇ بولىدۇ. ئەلۋەتتە ئوخشىمىغان PR سىستېمىلىرىدا ئۆزىگە خاس بولغان خاسلىق سۈزۈش ئالگورىزىملىرى بار. دانا ھەكىم كىسەلگە قاراپ دورا بېرىشى كېرەك.
• تۈرگە ئايرىش
تۈرگە ئايرىشمۇ(Classification) خاسلىق سۈزۈشكە ئوخشاشلا PR سىستېمىسىنىڭ ئىنتايىن مۇھىم بىر باسقۇچى. بۇ باسقۇچتا ئالدىنقى باسقۇچتا ئېرىشكەن خاسلىق ئۇچۇرىدىن پايدىلىنىپ تونۇش مەشغۇلاتى ئېلىپ بېرىلىدۇ. تۈرگە ئايرىش باسقۇچىدا قوللىنىۋاتقان نۇرغۇن ئۇسوللار بار. بۇ يەردە قېلىپ سېلىشتۇرۇش (Template Matching- TM) بىلەن ماشىنا ئۈگىنىشى (Machine Learning- ML) توغرىسىدا ئازراق توختۇلۇپ ئۆتەي.
مەيلى قايسى خىل ئۇسولنى ئىشلىتەيلى بۇ باسقۇچ ئادەتتە ئىككى تارماقنى ئۆز ئىچىگە ئالىدۇ: مەشىق ۋە سىناق. ئوخشىمىغان PR سىستېمىسىلىرى بۇ باسقۇچ ئۈچۈن مەلۇم مىقداردىكى تىل ئامبىرى(Corpus)، ئەۋرىشكە ئامبىرىغا ئىھتىياجلىق. ئاۋاز سىستېمىسى ئاۋاز ماتېرىيال ئامبىرىغا، OCR سايىلەنگەن يېزىق ئامبىرىغا، ھازىرجاۋاپ ھەرپ پەرقلەندۈرۈش سىستېمىسى ھەرپ ئامبىرىغا دىگەندەك. ھەرخىل PR سىستېمىسىغا نىسبەتەن تىل ئامبىرى بار دىگەنلىك ئەۋرىشكە يىغىش باسقۇچى تۈگىدى دىگەنلىك بولىدۇ. ھازىرجاۋاپ ھەرپ پەرقلەندۈرۈشكە نىسبەتەن يۇقىرىدا تىلغا ئالغان TM ئۇسولىدا مەلۇم ساندىكى تىل ئامبىرىغا (مەشق تىل ئامبىرى) تەرتىپ بۇيىچە ئالدىن بىر تەرەپ قىلىش، خاسلىق يىغىش ھەتتا لازىم بولغاندا كلاستېرلاش (Clustering) مەشغۇلاتى ئېلىپ بېرىپ بولغاندىن كېيىن مۇۋاپىق بىر قېلىپ (Template) ياساش ئالگورىزىمى ئارقىلىق قىلىپ تەييارلىنىدۇ. شۇنىڭ بىلەن ئاتالمىش «مەشىق» ئاخىرلىشىدۇ. بۇنى ئىپتىدائى كوررېكتورلاردىكى ئىملاسى توغرا بولغان سۆزلۈك ئامبىرى تەييارلاش جەريانىغا ئوخشاتساق بولىدۇ. ئاندىن يەنە بىر قىسىم مەشق جەريانىغا قاتناشمىغان كورپۇسقا ئوخشاشلا ئالدىن بىر تەرەپ قىلىش، خاسلىق سۈزۈش مەشغۇلاتى قىلىپ ئېۋكىلىد ئارىلىقى دىگەندەك سېلىشتۇرۇش ئالگورىزىملىرىدىن پايدىلىنىپ تۈرگە ئايرىيمىز. بۇ خۇددى يېزىپ بولغان بىر ئابزاس تېكىستنى تەييار سۆزلۈك ئامبىرىغا سېلىشتۇرۇپ كوررىكتورلىغانغا ئوخشاش. مانا ئاتالمىش «سىناق» مۇ ئاخىرلاشتى. ئەمما بۇ PR سىستېمىسى پۈتتى دىگەنلىك ئەمەس. تېخى ھەرخىل قۇيرۇقىنى يېغىشتۇرۇش (Postprocessing) ئېلىپ بارىدىغان گەپ. سىز مۇشۇ يەرگە كىلەلىسىڭىز سىستېمىمۇ قۇيرۇقىنى خادا قىلىپ تىكىۋېتىشكە تەييار بولۇپ بولغان بولىدۇ. ئۇنىڭدىن غەم قىلماڭ.
ماشىنا ئۈگىنىشى بولسا سۈنئىي ئىدراك (Artificial Intelligence- AI) تەتقىقاتىنىڭ مۇھىم بىر تارمىقى. ھەرخىل ساھەلەردە ناھايىتى كەڭ قوللىنىشقا ئىگە. AI نى ئاددى قىلىپ كومپىيۇتېرنى ئادەمگە ئوخشاش تەپەككۇرغا ئىگە قىلىش دەپ چۈشىنىمەن. ئۇنىڭ ھەر قايسى تارماقلىرى ئوخشىمىغان ساھە، ئوخشىمىغان مەسلىلەرگە نىسبەتەن كونكىرىت ھەل قىلىش چارىلىرىنى تەتقىق قىلىدۇ خالاس. ML تەتقىقاتى كومپىيۇتېرنى ئادەمدەك بۇرۇن توپلىغان بىر قىسىم تەجرىبىلىرى ئاساسىدا بىرلەشتۈرۈپ «تەپەككۈر» قىلىش ئارقىلىق ئۇچرىتىپ باقمىغان بىراق بۇرۇنقىغا ئوخشايدىغان يېڭى مەسىلىلەرنىمۇ ھەل قىلىش ئېقتىدارىغا ئىگە بولۇشىنى نىشان قىلىدۇ. ماشىنا ئۈگىنىشى ساھەسىدىمۇ ئوتتۇرىغا قويۇلغان نۇرغۇن ئىدىيە، نەزىرىيىلەر بار. مەسىلەن: سۈنئىي نېرۋا تورى، يېقىنقى 10 نەچچە يىلدىن بېرى «قىزىپ» كەتكەن يۈلەنچۈك ۋېكتور ماشىنىسى (Support Vector Machine- SVM) قاتارلىقلار ماشىنا ئۈگىنىشىنىڭ تارماقلىرىدۇر. نېرۋا تورىدىنمۇ پروگرامما تېللىرىغا ئوخشاشلا بىر پاتمىنى بار. ھەممىسىنىڭ ئۆزىگە خاس ئالاھىدىكى ۋە كەمچىللىكى بار. كېسەلگە قاراپ دورا بېرىش پرىنسىپى بۇيىچە تاللاپ ئىشلىتىلىپ كېلىۋاتىدۇ. بۇلارنىڭ ئىچىدە نىسبەتەن كەڭ قوللىنىشقا ئېرىشىكىنى BP نېرۋا تورىدۇر. بىراق «مىڭ كۈلكىنىڭ بىر يىغىسى بار» دىگەندەك ھەر قانداق بىر ياخشى نەرسە بەزى ئاجىزلىقلارنىمۇ تەڭ ھەمرا قىلىدىكەن. نېرۋا تورىنىڭ ئاجىزلىقلىرىدىن بېرى نېرۋا قۇرۇلمىسىنى بېكىتىشنىڭ مۇقىم نەزىرىيىۋى فورمۇلىسى يوق. تەجرىبىگە تايىنىدىغان گەپ. يەنە بىرى «ئارتۇق ئۈگىنىپ قىلىش»، «كەم ئۈگىنىپ قىلىش» تەك مۇۋازىنەت ھادىسىسى كۆرۈلىدۇ. ئۇنىڭدىن باشقا پارامېتىر تەڭشەش قېيىنچىلىقى قاتارلىقلار. دەل مۇشۇ مەسىلىلەر تۈپەيلى 95-يىلى ئەتراپىدا SVM نەزىزىيىسى مەيدانغا كەلگەن. SVM نىمۇ بىر خىل نېرۋا تورى دەپ چۈشەنسەك بولىدۇ. بۇرۇن يۈلەنچۈك ۋېكتور تورى دەپمۇ ئاتالغان. ئارتۇقچىلىقى يۇقىرىدا تىلغا ئالغان ئەنئەنىۋى نېرۋا تورىنىڭ مەسلىلىرىنى ھەل قىلغان ھەم ناھايىتى ياش، ھاياتى كۈچى ئۇرغۇپ تۇرغان بىر نەزىرىيىدۇر. شۇڭا ۋاقىت چىقىرىپ تەتقىق قىلىپ بېقىشقا ئەرزىيدۇ.
TM بولسا بىر مىخانىك جەريان ھېسابلىندۇ. گەرچە مەشق دېيىلسىمۇ سۈنئىي نېرۋا تورىغا ئوخشاش ھەقىقى ئۆگىنىش ئەمەس. پەقەتلا ۋىروسخورغا ئوخشاش ئامباردا بولسا تونۇيدۇ بولمىسا ئامال يوق. ML بولسا ئازراق تەپەككۇرغا ئىگە. مەلۇم ئوخشاشلىقتىن پايدىلىنىپ ئامباردا يوق ۋىروسنىمۇ تونۇيدۇ.
مەيلى TM، مەيلى ML بولسۇن مەشق (ئۈگىنىش) ئىككى خىل بولىدۇ. يىتەكچىلىك ئۈگىنىش (Supervised Learning) ۋە يىتەكچىسىز ئۈگىنىش (Unsupervised Learning) تىن ئىبارەت. يىتەكچىلىك ئۈگىنىش جەريانىدا ھەر قايسى ئۇچۇرلارنىڭ قايسى ھەرپلەرگە ۋەكىللىك قىلىدىغانلىقىنى ئېيتىپ قويىمىز. سىستېما شۇ بۇيىچە تەكرار مەشق قىلىدۇ. دىمەكچى مەشققە قاتناشقان خاسلىق ئۇچۇرلىرى ماس بولغان ھەرپ ئىندىكىسىنى ئۆز ئىچىگە ئالغان بولىدۇ. بۇ خىل ئۇسولدا بىز نېرۋا تورىنىڭ ئاخىرىدا بىزگە تەمىنلەشكە تېگىشلىك ھېسابلاش نەتىجىسىنى ئالدىن دەپ قويۇپ ئۈگىنىشكە بۇيرۇيمىز. دەسلەپتە ئەلۋەتتە ئەمەلىي ھېسابلاش نەتىجىسى بىلەن بىز بەلگىلىگەن نەتىجە ئوتتورىسىدا پەرق بولىدۇ. نەتىجە ئوخشىغانغا قەدەر تەكرار ئۈگىتىمىز. يىتەكچىسىز ئۈگىنىشتە بىز پەقەت بىر تۈركۈم خاسلىق ئۇچۇرىنى تەمىنلەيمىز. ئەمما بۇ ئۇچۇرلار كونكىرىت قايسى ھەرپكە ۋەكىللىك قىلىدىغانلىقى تۇغرۇلۇق ئۇچۇر يوق. كلاستىرلاش دەل مۇشۇ خىلغا تەۋە. نېرۋا تورىدىن RBF(Radial Based Function) تورىنىڭ مۇشۇنداق ئېقتىدارى بارغۇ دەيمەن.
خۇلاسە كالام
بۇ يازمىدا ھازىرجاۋاپ قوليازما ھەرپ پەرقلەندۈرۈشنى تۇتقا قىلىپ ستاتىستىكىلىق PR سىستېمىسىنىڭ جەريانى بىرەر قۇر تونۇشتۇرۇلدى. بۇنىڭدىن باشقىمۇ بىر نەچچە خىل PR بار. تورداشلار قىزىقسا ئۆزلىرى ئىزدىنىپ باقسا بولىدۇ. بۇلارنىڭ ئىچىدە ستاتىستىكىلىق PR (Statistical PR) بىر قەدەر پىشىپ يېتىلگەن. ئەمەلىيەتتە كوپرەك قوللىنىلغىنى ھېسابلىنىدۇ. يەنە بىر كوپرەك تىلغا ئېلىنىدىغىنى بولسا قۇرۇلمىلىق PR دۇر( ئېنگىلىزچىسىنى ئونتۇپ قاپتىمەن. خەنزۇچىدا 结构模式识别،句法模式识别،文法模式识别 دىگەندەك ناملار بىلەن ئاتايدۇ). ئىككى خىل ئۇسولنىڭ ئوخشاشلا ئارتۇقچىلىقى ۋە كەمچىللىكى بار. ئىككىسىنى بىرلەشتۈرۈپ ئىشلەتسە ئۆز ئارا تولۇقلايدۇ. يازمىنى تەييارلاش جەريانىدا ئۆزەم بۇرۇن كۆرگەن ماتېرىياللارنىڭ ئىسىمدە قالغانلىرى بۇيىچىلا جۆيلۈدۈم. ناۋادا خاتا سۆزلەپ قويغان جايلار بولسا تورداشلار تۈزۈتسە بولىدۇ. ئۇنىڭدىن باشقا ئاتالغۇ مەسلىسىدە توغرا ئىپادىلەپ بىرىلمىگەن جايلىرىم بولسا باشقىلارنىڭ پىكىرىنى قوبۇل قىلىمەن. Pattern Recognition نى تۈرگە ئايرىپ پەرقلەندۈرۈش، تەقلىدىي پەرقلەندۈرۈش دىگەندەك ئاتاشلار بولغان. بۇلارنىمۇ ئويلىشىپ باقساق. ئاتالغۇ مەسلىسىدە كۆپچىلىك ئورتاق كۈچ چىقارساق دىگەن ئۈمىدتىمەن. ئاخىرىدا دەيدىغىنىم يازمام ئارقىلىق مۇشۇ ساھەگە قىزىقىدىغان تورداشلارغا ئازراق ئىلھام بىرەلىسەم كۇنۇپكىداننى بىكارغا چەكمىگەن بۇلىمەن...