Wednesday, November 12, 2014

ស្រៈខ្មែរមានចំនួនប៉ុន្មាន?​ ១៦ ២១ ឬ ២៣?

ដំបូង​សុំ​ចាប់​ផ្តើម​ពី​វចនានុក្រម។ ពី​ព្រោះ​អ្នក​ប្រើប្រាស់​ភាសា​ខ្មែរ​ភាគ​ច្រើន​ពឹង​ផ្អែក​ទៅ​លើ​វចនានុក្រម​សម្តេច​សង្ឃរាជ ជួន ណាត។

ក្នុង​វចនានុក្រម​សម្តេច​សង្ឃ​បោះ​ពុម្ព​លើក​ចុង​ក្រោយ ក្នុង​ឆ្នាំ​១៩៦៨ កំណត់​យក​ស្រៈ​និស័យ​ខ្មែរ​ចំនួន ២១ រួម​មាន អ អា អិ អី អឹ អឺ អុ អូ អួ អើ អឿ អៀ អេ អែ អៃ អោ អៅ អុំ អំ អាំ អះ។

រហូត​មក​ដល់​ពេល​នេះ ខ្មែរ​យើង​នៅ​មិន​ទាន់​បង្កើត​បាន​វចនានុក្រម​ថ្មី​មក​ចំនួស​វចនានុក្រម​សម្តេច​សង្ឃ​រាជ ជួន ណាត បាន​នៅ​ឡើង ហើយ​វចនានុក្រម​នេះ​ពិត​ជា​មាន​លក្ខណៈ​ប្រពៃ​ដែល​មនុស្ស​ជា​ច្រើន​ជំនាន់​ទទូល​ស្គាល់។ ក៏​ប៉ុន្តែ​វា​មាន​បញ្ហា​ត្រង់​កន្លែង​កំណត់​យក​ចំនួន​ស្រៈ​ខ្មែរ ធ្វើ​ឲ្យ​អ្នក​សិក្សា​ស៊ីជម្រៅ​ផ្នែក​ភាសា​ខ្មែរ​ក្នុង​ទស្សវត្ស​ឆ្នាំ១៩៩០ ចាត់​ទុក​ថា​ជា​កង្វះ​ខាត​មួយ។ កង្វះ​ខាត​ដែល​បន្សល់​ទុក​បញ្ហា​មក​ដល់​សព្វ​ថ្ងៃ​គឺ "បញ្ហា​ស្រៈ អះ (ះ)" នេះ​ឯង។

ក្នុង​ផ្នែក​រៀបរាប់​អំពី​ស្រៈ វចនានុក្រម​ហៅ​សញ្ញា (ះ) ថា​ស្រៈ អះ ក៏​ប៉ុន្តែ​ក្នុង​ទំព័រ​១១៥៧ ត្រង់​កន្លែង​ពន្យល់​អំពី​វណ្ណយុត្ត​ខ្មែរ វចនានុក្រម​ដដែល​នេះ​បែ​ជា​ចាត់​ទុក​សញ្ញា (ះ) ជា​វណ្ណយុត្ត​ទីមួយ ដែល​មាន​ឈ្មោះ​ថា វិសជ៌នី ឬវិសគ៌ៈ ទៅ​វិញ (មើល​រូបភាព​ខាង​ក្រោម)។

ដោយ​ហេតុ​នេះ​ហើយ មុន​នឹង​ស្នើ​ឲ្យ​ដាក់​អក្សរ​ខ្មែរ​ចូល​ក្នុង​តារាង Unicode អ្នក​សិក្សា​ស្រាវជ្រាវ​ខ្មែរ​បាន​ពិភាក្សា​គ្នា​ជា​ច្រើន​លើក រួច​ក៏​មាន​ការ​ឯកភាព​ក្នុង​អង្គ​ប្រជុំ​កាល​ពី​ថ្ងៃ​ទី​១៨ កក្កដា ឆ្នាំ១៩៩៦ (មើលឯកសារ)។ តាម​ពិត​បញ្ហា​គួរ​តែ​ចប់​ទាំង​ពេល​នោះ ប្រសិន​បើ​គ្មាន​ការ​ជ្រៀត​ជ្រេក​ពី​សំណាក់​អ្នក​នយោបាល និង​អ្នក​ផ្តល់​ជំនួយ។

ការ​ឯកភាព​របស់​ក្រុម​អ្នក​ស្រាវជ្រាវ​នោះ​គឺ សម្រេច​យក​ស្រៈ​ខ្មែរ​តែ១៦ ដោយ​មិន​គិត​ស្រៈ អ រួម​មាន អា អិ អី អឹ អឺ អុ អូ អួ អើ អឿ អៀ អេ អែ អៃ អោ អៅ។ ចំណែក អំ និង អះ ត្រូវ​បាន​ចាត់​ទុក​ក្នុង​ចំណោម​វណ្ណយុត្ត ហើយ​ស្រៈ អុំ និង អាំ ដែល​មាន​វណ្ណយុត្ត​រួម​ផ្សំ ត្រូវ​បាន​ចាត់​ទុក​ថា​ស្រៈ​ផ្សំ គឺ​ត្រូវ​ចុច​ ២​ដង ដូច​ជា អុំ​ = អ + ុ + ំ ជា​ដើម។ ការ​សម្រេច​នេះ​ត្រូវ​បាន​អ្នក​បច្ចេកទេស​គាំទ្រ ជា​ពិសេស​អ្នក​ធ្លាប់​បង្កើត​ក្កាចុច​ខ្មែរ (Keyboard)។ ពី​ព្រោះ​អក្សរ​ខ្មែរ​យើង​មាន​សញ្ញា​ច្រើន​ណាស់​បើ​ប្រៀបធៀប​នឹង​អក្សរ​របស់​ជាតិ​សាសន៍​ដដៃ។ ការ​សម្រេច​យក​វិធី​ស្រៈ​ផ្សំ​ចុច​២​ដង ធ្វើ​ឲ្យ​អ្នក​រៀន​វាយ​អក្សរ​ខ្មែរ​ចំណេញ​ពេល​ក្នុង​ការ​ចងចាំ។

ប៉ុន្តែ​ពេល​ចេញ Unicode ដែល​មាន​អក្សរ​ខ្មែរ​ដំបូងក្នុង​ឆ្នាំ​១៩៩៩ អនុលោម​​តាម​សំណើរ​របស់​អ្នក​ស្រាវជ្រាវ​ភាសា​ខ្មែរ​ខាង​លើ បែ​រជា​មាន​ការ​ជំទាស់​ពីសំណាក់អ្នក​នយោបាយ​ថា​ខ្វះ​ស្រៈ ដោយ​មិន​ស្តាប់​ហេតុផល​អំពី​ស្រៈ​ផ្សំ និង​ការ​វេកញេក​របស់​អ្នក​ស្រាវជ្រាវ ហើយ​អ្នក​ផ្តល់​ជំនួយ និង​អង្គការ​អន្តរជាតិ​មួយ​ចំនួន​ក៏​គាំទ្រ​អ្នក​នយោបាយ មិន​គាំទ្រ​អ្នក​ភាសាវិទ្យា និង​អ្នក​បច្ចេកទេស​ទេ។ ដូច្នោះ​ហើយ​ទើប​យើង​ឃើញ​ក្ដាចុច​ខ្មែរ​មួយ​ចំនួន​មាន​ស្រៈ​ច្រើន​ជាង​១៦ មិន​មែន​២១ តាម​វចនានុក្រម​ទេ គឺ២៣ ការ​បង្កើត​ឲ្យ​មាន​ស្រៈ​ច្រើន​ដូច្នោះ​ដើម្បី​យក​ចិត្ត​អ្នក​នយោបាយ។

សរុប​សេចក្តី​មក ក្នុង​តារាង Unicode មាន​ស្រៈ​ខ្មែរ ១៦ គឺ​តាម​សំណើរ​របស់​អ្នក​ស្រាវ​ជ្រាវ រីឯ​អ្នក​ដែល​គិត​អំពី​ភាព​ងាយ​ស្រួល​ក្នុង​ការ​ប្រើប្រាស់​ទៅ​អនាគត​ក៏​គួតែ​គោរព​ស្តង់ដារ Unicode។ ចំណែក​ក្តារ​ចុច​ខ្មែរ​ដែល​មាន​ចំនួន​ស្រៈ​ដល់​ទៅ​២៣ ច្រើន​ជាង​ស្រៈ​ក្នុង​វចនានុក្រម​ទៀត​នោះ គឺ​ធ្វើ​តម្រូវ​ចិត្ត​អ្នក​នយោបាយ ហើយ​បើសិន​មាន​អ្នក​ស្រាវជ្រាវ​ខ្មែរ​ដាក់​បញ្ហា គេ​តម្លាក់​កំហុស​ទៅ​អ្នក​នយោបាយ​ជាការស្រេច។

Thursday, November 6, 2014

Khmer OCR ត្រូវ​បាន​ប៉ុន្មាន % ហើយ?

ថ្ងៃនេះ ខ្ញុំ​យក​សៀវភៅ "ប្រវត្តិ​ប្រជាជាតិ​ខ្មែរ" ដែល​វាយ​លើង​វិញ​សម្រាប់​ធ្វើ​សៀវភៅ​អេឡិចទ្រូនិច មក​ប្តូរ​ទៅ​ជា​ពុម្ព​អក្សរ Khmer OS Battambang size 26 ឃើញ​ថា លទ្ធផល​អាច​អាន​យល់​ខ្លះៗ ហើយ ដោយសារ​មាន​អ្នក​ចូល​រួម​កែ​ជា​ច្រើន។ ប៉ុន្តែ​សម្រាប់​ពុម្ព​អក្សរ​ផ្សេង អត្រា​ពាក្យ​ត្រូវ​ប្រហែល​នៅ​តិច​ជាង។ សូម​អរគុណ​អង្គការ SBBIC និង Innovation Development ដែល​បាប​ផ្តល់​ថវិកា និង​ទី​កន្លែង​សម្រាប់​ផ្សព្វ​ផ្សាយ​កម្មវិធី​នេះ៕

Tuesday, October 14, 2014

កម្មវិធី Khmer OCR ដំណើរ​ការ​ដូច​ម៉្តេច?

Tesseract OCR ជា​កម្មវិធី​កូដ​ចំហ ខ្មែរ​យើង​ជា​ច្រើន​បាន​ទាញ​យក​មក​បង្កើត​កម្មវិធី​ស្កែន​រូបភាព​បំឡែង​ទៅ​ជា​អត្ថបទ (Khmer OCR) ប៉ុន្តែ​មិន​បាន​ជោគជ័យ ពី​ព្រោះ​គំនូស​អក្សរ​ខ្មែរ​លម្អិត​ពេក ហើយ​មាន​កត្តា​ជា​ច្រើន​ដែល​ធ្វើ​ឲ្យ​លទ្ធផង​ចេញ​មក​មិន​ដូច​បំណង។

កាល​ពី​ឆ្នាំ ២០០៣ ពេល​កំពុង​ធ្វើ​ពុម្ព​អក្សរ​យូនីកូដ ខ្ញុំ​ក៏​នឹក​ឃើញ​គំនិត​ថ្មី​ក្នុង​ការ​បង្កើត​កម្មវិធី OCR សម្រាប់​ខ្មែរ ប៉ុន្តែ​មិន​បាន​អនុវត្ត ពី​ព្រោះ​នេះ​ជា​ការងារ​ធំ ទាមទារ​ឲ្យ​មាន​មនុស្ស​ច្រើន​ចូលរួម។

ដល់​ឆ្នាំ២០១២ ដោយសារ​មាន​លោក Paul Dodds អ្នក​ជំនាញ​ផ្នែក​ច្បាប់​របស់​ធនាគាពិភពលោក​ជួយ​លើក​ទឹក​ចិត្ត ទើប​ខ្ញុំ និង ធីម ច័ន្ទរិទ្ធី ​អ្នកបង្កើតប្រព័ន្ធប្រតិបត្តិការ moonOS បង្កើត​​បាន​​ក្រុម​​ការងារ ហើយ​​ក្រោយ​​មក​​រួម​​សហការ​​ជា​​មួយ​​ក្រុមហ៊ុន innover.com និង​​អង្គការ SBBIC (http://www.sbbic.org) បង្កើត​បាន​គម្រោង​នេះ​ឡើង។

កិច្ចការ​ចំពោះ​មុខ​របស់​គម្រោង Khmer OCR  គឺ​បង្កើត​ឧបករណ៍​សម្រាប់​ប្រើ​លើ​បណ្តាញ​អ៊ីនធឺណេត ដែល​អនុញ្ញាត​ឲ្យ​អ្នក​ប្រើប្រាស់​ចូល​រួម​តាម​រយៈ​កែ​ពាក្យ​ខុស​ឲ្យ​ត្រូវ ដូច​ជា​ជួយ​បង្រៀង​កម្មវិធី​កុំព្យូទ័រ​ឲ្យ​ស្គាល់​ភាសា​ខ្មែរ។ ប្រសិន​បើ​មាន​អ្នក​ចូល​រួម​កាន់​តែ​ច្រើន លទ្ធផល​នៃ​ការ​បំឡែង​រូបភាព​ទៅ​ជា​អត្ថបទ​ត្រូវ​បាន​កាន់​តែ​ច្រើន។

ឧទាហរណ៍ លទ្ធផលបឋម

កែកំហុស

លទ្ធផលចុងក្រោយ

លោកអ្នកអាចចូលសាកល្បង​នៅទីនេះ khmerocr.org។ យើងខ្ញុំមានទំព័រ​សម្រាប់​ការ​ងារ​​បង្រៀន​ឲ្យកម្មវិធី​កុំព្យូទ័រ​​ស្គាល់ពាក្យខុស ​(train data) នៅ​ទី​នេះ khmerocr.org/train សម្រាប់​តែ​អ្នក​ស្ម័គ្រចិត្ត​មួយ​ចំនួន ដែល​មាន​បំណង​ជួយ​កែលម្អ​កម្មវិធី​នេះ។

Sunday, September 28, 2014

អានសៀវភៅ epub នៅក្នុង iPhone និង iPad

បន្ទាប់​ពី​ខ្ញុំ​ដាក់​ឯកសារ "កំណត់​ហេតុ​របស់ ជីវ តាក្វាន់" ជា​ទម្រង់ epub សម្រាប់​អ្នក​ប្រើប្រាស់​ទូរសព្ទ Android មាន​ប្រិយមិត្ត​អ្នក​លេង Facebook មួយ​ចំនួន​សួរ​ខ្ញុំ​អំពី​ការ​អាន​ឯកសារ​នេះ​នៅ​ក្នុង​ឧបករណ៍​របស់ Apple ដូច​ជា iPhone និង iPad ជា​ដើម។

ខាងក្រោម ជាចម្លើយរបស់ខ្ញុំ។

កម្មវិធី iBook នៅ​ក្នុង iOS អនុញ្ញាត​ឲ្យ​លោក​អ្នក​អាន​សៀវ​ភៅ​ទម្រង់ .epub បាន។ ប៉ុន្តែ​សម្រាប់​អ្នក​ប្រើ iPhone និង iPad មាន​កំណែ iOS ទាប ហើយ​គ្មាន​ការ jailbreak ដាក់​អក្សរ​ខ្មែរ​ចូល នៅ​មាន​បញ្ហា​ជា​មួយ​ពុម្ព​អក្សរ​ខ្មែរ។ ប្រសិន​បើ​កឧបករណ៍​របស់​លោក​អ្នក jailbreak ដាក់​អក្សរ​ខ្មែរ​ចូល ឬ​បន្ទាន់​សម័យ​ទៅ iOS 8 ហើយ គឺ​លែង​មាន​បញ្ហា​ក្នុង​ការ​អាន​ខ្មែរ​ទៀត​ហើយ។

លោក​អ្នក​ទាញ​យក​សៀវភៅ "កំណត់ហេតុ" របស់ ជីវ តាក្វាន់ នៅ​ទីនេះ។ រួច​ឃើញ​ផ្ទាំង​ដូច​នៅខាង​ឆ្វេង ចុច "Open in "iBook"" ជា​ការ​ស្រេច។


រូបភាព​មួយ​ចំនួន​នៅ​ក្នុង​ iPhone (iOS 8)។


Saturday, August 23, 2014

កម្មវិធី Play Book អានសៀវភៅខ្មែរយ៉ាយត្រជាក់ភ្នែក លើទូរសព្ទ Android

Google Play Book ជាកម្មវិធីអានសៀវភៅអេឡិកត្រូនិចរបស់ Google សម្រាប់ទូរសព្ទ Android។​ កម្មវិធីនេះអាចរកបានក្នុង Play Store សម្រាប់ប្រទេសមួយចំនួន តាមរយៈការវាយពាក្យគន្លឹះ "Google Play Book"។

តែអ្នកនៅស្រុកខ្មែរពុំទាន់អាចទាញយកកម្មវិធីនេះពី Play Store បានទេ​ ដោយសារតែវាពុំទាន់គាំទ្រទីផ្សារស្រុកខ្មែរ។ ដូច្នោះលោកអ្នកអាចទាញយក នៅទីនេះ

កម្មវិធីនេះអនុញ្ញាតឲ្យលោកអ្នកនាងអានសៀវភៅខ្មែរទម្រង់ epub ដែលជាទម្រង់ទំនើបមួយ ត្រូវបានបង្កើតតាមរយៈការសរសេរកូដ html។ (មើលការណែនាំនៅទីនេះ)។

សាកល្បងជាមួយសៀវភៅគំរូភាសាខ្មែរ ទី១ ទី២

ចុច Menu -> Display option លោកអ្នកនឹងកន្លែងដូរទំហំអក្សរ និងប្ដូរទម្រង់សម្រាប់ការអាននៅពេលថ្ងៃ ឬយប់។