សៀវភៅប្រវត្តិប្រជាជាតិខ្មែរ និពន្ធដោយលោក ថាច់ ត្វាន់ ឥឡូវនេះត្រូវបានបង្កើតជាទម្រង់ epub សម្រាប់អានលើទូរសព្ទហើយ។
លោកអ្នកអាចទាញយក សៀវភៅនៅទីនេះ ទៅអានលើទូរសព្ទ Android iPhone iPad ឬ Windows Phone យ៉ាងងាយស្រួល។
ចំពោះអ្នកប្រើទូរសព្ទ Android ត្រូវទាញយកកម្មវិធីអានសៀវភៅជាមុនសិន (មើលទីនេះ) ទើបអានសៀវភៅនេះបាន។
ចំពោះអ្នកប្រើទូរសព្ទ iPhone ឬ iPad ត្រូវមានកម្មវិធី iBook ជាមុនសិន (មើលទីនេះ)។
Monday, January 26, 2015
សៀវភៅប្រវត្តិប្រជាជាតិខ្មែរ
| Reactions: |
Wednesday, November 12, 2014
ស្រៈខ្មែរមានចំនួនប៉ុន្មាន? ១៦ ២១ ឬ ២៣?
ដំបូងសុំចាប់ផ្តើមពីវចនានុក្រម។ ពីព្រោះអ្នកប្រើប្រាស់ភាសាខ្មែរភាគច្រើនពឹងផ្អែកទៅលើវចនានុក្រមសម្តេចសង្ឃរាជ ជួន ណាត។
ក្នុងវចនានុក្រមសម្តេចសង្ឃបោះពុម្ពលើកចុងក្រោយ ក្នុងឆ្នាំ១៩៦៨ កំណត់យកស្រៈនិស័យខ្មែរចំនួន ២១ រួមមាន អ អា អិ អី អឹ អឺ អុ អូ អួ អើ អឿ អៀ អេ អែ អៃ អោ អៅ អុំ អំ អាំ អះ។
រហូតមកដល់ពេលនេះ ខ្មែរយើងនៅមិនទាន់បង្កើតបានវចនានុក្រមថ្មីមកចំនួសវចនានុក្រមសម្តេចសង្ឃរាជ ជួន ណាត បាននៅឡើង ហើយវចនានុក្រមនេះពិតជាមានលក្ខណៈប្រពៃដែលមនុស្សជាច្រើនជំនាន់ទទូលស្គាល់។ ក៏ប៉ុន្តែវាមានបញ្ហាត្រង់កន្លែងកំណត់យកចំនួនស្រៈខ្មែរ ធ្វើឲ្យអ្នកសិក្សាស៊ីជម្រៅផ្នែកភាសាខ្មែរក្នុងទស្សវត្សឆ្នាំ១៩៩០ ចាត់ទុកថាជាកង្វះខាតមួយ។ កង្វះខាតដែលបន្សល់ទុកបញ្ហាមកដល់សព្វថ្ងៃគឺ "បញ្ហាស្រៈ អះ (ះ)" នេះឯង។
ក្នុងផ្នែករៀបរាប់អំពីស្រៈ វចនានុក្រមហៅសញ្ញា (ះ) ថាស្រៈ អះ ក៏ប៉ុន្តែក្នុងទំព័រ១១៥៧ ត្រង់កន្លែងពន្យល់អំពីវណ្ណយុត្តខ្មែរ វចនានុក្រមដដែលនេះបែជាចាត់ទុកសញ្ញា (ះ) ជាវណ្ណយុត្តទីមួយ ដែលមានឈ្មោះថា វិសជ៌នី ឬវិសគ៌ៈ ទៅវិញ (មើលរូបភាពខាងក្រោម)។
ដោយហេតុនេះហើយ មុននឹងស្នើឲ្យដាក់អក្សរខ្មែរចូលក្នុងតារាង Unicode អ្នកសិក្សាស្រាវជ្រាវខ្មែរបានពិភាក្សាគ្នាជាច្រើនលើក រួចក៏មានការឯកភាពក្នុងអង្គប្រជុំកាលពីថ្ងៃទី១៨ កក្កដា ឆ្នាំ១៩៩៦ (មើលឯកសារ)។ តាមពិតបញ្ហាគួរតែចប់ទាំងពេលនោះ ប្រសិនបើគ្មានការជ្រៀតជ្រេកពីសំណាក់អ្នកនយោបាល និងអ្នកផ្តល់ជំនួយ។
ការឯកភាពរបស់ក្រុមអ្នកស្រាវជ្រាវនោះគឺ សម្រេចយកស្រៈខ្មែរតែ១៦ ដោយមិនគិតស្រៈ អ រួមមាន អា អិ អី អឹ អឺ អុ អូ អួ អើ អឿ អៀ អេ អែ អៃ អោ អៅ។ ចំណែក អំ និង អះ ត្រូវបានចាត់ទុកក្នុងចំណោមវណ្ណយុត្ត ហើយស្រៈ អុំ និង អាំ ដែលមានវណ្ណយុត្តរួមផ្សំ ត្រូវបានចាត់ទុកថាស្រៈផ្សំ គឺត្រូវចុច ២ដង ដូចជា អុំ = អ + ុ + ំ ជាដើម។ ការសម្រេចនេះត្រូវបានអ្នកបច្ចេកទេសគាំទ្រ ជាពិសេសអ្នកធ្លាប់បង្កើតក្កាចុចខ្មែរ (Keyboard)។ ពីព្រោះអក្សរខ្មែរយើងមានសញ្ញាច្រើនណាស់បើប្រៀបធៀបនឹងអក្សររបស់ជាតិសាសន៍ដដៃ។ ការសម្រេចយកវិធីស្រៈផ្សំចុច២ដង ធ្វើឲ្យអ្នករៀនវាយអក្សរខ្មែរចំណេញពេលក្នុងការចងចាំ។
ប៉ុន្តែពេលចេញ Unicode ដែលមានអក្សរខ្មែរដំបូងក្នុងឆ្នាំ១៩៩៩ អនុលោមតាមសំណើររបស់អ្នកស្រាវជ្រាវភាសាខ្មែរខាងលើ បែរជាមានការជំទាស់ពីសំណាក់អ្នកនយោបាយថាខ្វះស្រៈ ដោយមិនស្តាប់ហេតុផលអំពីស្រៈផ្សំ និងការវែកញែករបស់អ្នកស្រាវជ្រាវ ហើយអ្នកផ្តល់ជំនួយ និងអង្គការអន្តរជាតិមួយចំនួនក៏គាំទ្រអ្នកនយោបាយ មិនគាំទ្រអ្នកភាសាវិទ្យា និងអ្នកបច្ចេកទេសទេ។ ដូច្នោះហើយទើបយើងឃើញក្ដាចុចខ្មែរមួយចំនួនមានស្រៈច្រើនជាង១៦ មិនមែន២១ តាមវចនានុក្រមទេ គឺ២៣ ការបង្កើតឲ្យមានស្រៈច្រើនដូច្នោះដើម្បីយកចិត្តអ្នកនយោបាយ។
សរុបសេចក្តីមក ក្នុងតារាង Unicode មានស្រៈខ្មែរ ១៦ គឺតាមសំណើររបស់អ្នកស្រាវជ្រាវ រីឯអ្នកដែលគិតអំពីភាពងាយស្រួលក្នុងការប្រើប្រាស់ទៅអនាគតក៏គួតែគោរពស្តង់ដារ Unicode។
ក្នុងវចនានុក្រមសម្តេចសង្ឃបោះពុម្ពលើកចុងក្រោយ ក្នុងឆ្នាំ១៩៦៨ កំណត់យកស្រៈនិស័យខ្មែរចំនួន ២១ រួមមាន អ អា អិ អី អឹ អឺ អុ អូ អួ អើ អឿ អៀ អេ អែ អៃ អោ អៅ អុំ អំ អាំ អះ។
រហូតមកដល់ពេលនេះ ខ្មែរយើងនៅមិនទាន់បង្កើតបានវចនានុក្រមថ្មីមកចំនួសវចនានុក្រមសម្តេចសង្ឃរាជ ជួន ណាត បាននៅឡើង ហើយវចនានុក្រមនេះពិតជាមានលក្ខណៈប្រពៃដែលមនុស្សជាច្រើនជំនាន់ទទូលស្គាល់។ ក៏ប៉ុន្តែវាមានបញ្ហាត្រង់កន្លែងកំណត់យកចំនួនស្រៈខ្មែរ ធ្វើឲ្យអ្នកសិក្សាស៊ីជម្រៅផ្នែកភាសាខ្មែរក្នុងទស្សវត្សឆ្នាំ១៩៩០ ចាត់ទុកថាជាកង្វះខាតមួយ។ កង្វះខាតដែលបន្សល់ទុកបញ្ហាមកដល់សព្វថ្ងៃគឺ "បញ្ហាស្រៈ អះ (ះ)" នេះឯង។
ក្នុងផ្នែករៀបរាប់អំពីស្រៈ វចនានុក្រមហៅសញ្ញា (ះ) ថាស្រៈ អះ ក៏ប៉ុន្តែក្នុងទំព័រ១១៥៧ ត្រង់កន្លែងពន្យល់អំពីវណ្ណយុត្តខ្មែរ វចនានុក្រមដដែលនេះបែជាចាត់ទុកសញ្ញា (ះ) ជាវណ្ណយុត្តទីមួយ ដែលមានឈ្មោះថា វិសជ៌នី ឬវិសគ៌ៈ ទៅវិញ (មើលរូបភាពខាងក្រោម)។
ដោយហេតុនេះហើយ មុននឹងស្នើឲ្យដាក់អក្សរខ្មែរចូលក្នុងតារាង Unicode អ្នកសិក្សាស្រាវជ្រាវខ្មែរបានពិភាក្សាគ្នាជាច្រើនលើក រួចក៏មានការឯកភាពក្នុងអង្គប្រជុំកាលពីថ្ងៃទី១៨ កក្កដា ឆ្នាំ១៩៩៦ (មើលឯកសារ)។ តាមពិតបញ្ហាគួរតែចប់ទាំងពេលនោះ ប្រសិនបើគ្មានការជ្រៀតជ្រេកពីសំណាក់អ្នកនយោបាល និងអ្នកផ្តល់ជំនួយ។
ការឯកភាពរបស់ក្រុមអ្នកស្រាវជ្រាវនោះគឺ សម្រេចយកស្រៈខ្មែរតែ១៦ ដោយមិនគិតស្រៈ អ រួមមាន អា អិ អី អឹ អឺ អុ អូ អួ អើ អឿ អៀ អេ អែ អៃ អោ អៅ។ ចំណែក អំ និង អះ ត្រូវបានចាត់ទុកក្នុងចំណោមវណ្ណយុត្ត ហើយស្រៈ អុំ និង អាំ ដែលមានវណ្ណយុត្តរួមផ្សំ ត្រូវបានចាត់ទុកថាស្រៈផ្សំ គឺត្រូវចុច ២ដង ដូចជា អុំ = អ + ុ + ំ ជាដើម។ ការសម្រេចនេះត្រូវបានអ្នកបច្ចេកទេសគាំទ្រ ជាពិសេសអ្នកធ្លាប់បង្កើតក្កាចុចខ្មែរ (Keyboard)។ ពីព្រោះអក្សរខ្មែរយើងមានសញ្ញាច្រើនណាស់បើប្រៀបធៀបនឹងអក្សររបស់ជាតិសាសន៍ដដៃ។ ការសម្រេចយកវិធីស្រៈផ្សំចុច២ដង ធ្វើឲ្យអ្នករៀនវាយអក្សរខ្មែរចំណេញពេលក្នុងការចងចាំ។
ប៉ុន្តែពេលចេញ Unicode ដែលមានអក្សរខ្មែរដំបូងក្នុងឆ្នាំ១៩៩៩ អនុលោមតាមសំណើររបស់អ្នកស្រាវជ្រាវភាសាខ្មែរខាងលើ បែរជាមានការជំទាស់ពីសំណាក់អ្នកនយោបាយថាខ្វះស្រៈ ដោយមិនស្តាប់ហេតុផលអំពីស្រៈផ្សំ និងការវែកញែករបស់អ្នកស្រាវជ្រាវ ហើយអ្នកផ្តល់ជំនួយ និងអង្គការអន្តរជាតិមួយចំនួនក៏គាំទ្រអ្នកនយោបាយ មិនគាំទ្រអ្នកភាសាវិទ្យា និងអ្នកបច្ចេកទេសទេ។ ដូច្នោះហើយទើបយើងឃើញក្ដាចុចខ្មែរមួយចំនួនមានស្រៈច្រើនជាង១៦ មិនមែន២១ តាមវចនានុក្រមទេ គឺ២៣ ការបង្កើតឲ្យមានស្រៈច្រើនដូច្នោះដើម្បីយកចិត្តអ្នកនយោបាយ។
សរុបសេចក្តីមក ក្នុងតារាង Unicode មានស្រៈខ្មែរ ១៦ គឺតាមសំណើររបស់អ្នកស្រាវជ្រាវ រីឯអ្នកដែលគិតអំពីភាពងាយស្រួលក្នុងការប្រើប្រាស់ទៅអនាគតក៏គួតែគោរពស្តង់ដារ Unicode។
Thursday, November 6, 2014
Khmer OCR ត្រូវបានប៉ុន្មាន % ហើយ?
ថ្ងៃនេះ ខ្ញុំយកសៀវភៅ "ប្រវត្តិប្រជាជាតិខ្មែរ" ដែលវាយលើងវិញសម្រាប់ធ្វើសៀវភៅអេឡិចទ្រូនិច មកប្តូរទៅជាពុម្ពអក្សរ Khmer OS Battambang size 26 ឃើញថា លទ្ធផលអាចអានយល់ខ្លះៗ ហើយ ដោយសារមានអ្នកចូលរួមកែជាច្រើន។ ប៉ុន្តែសម្រាប់ពុម្ពអក្សរផ្សេង អត្រាពាក្យត្រូវប្រហែលនៅតិចជាង។ សូមអរគុណអង្គការ SBBIC និង Innovation Development ដែលបាបផ្តល់ថវិកា និងទីកន្លែងសម្រាប់ផ្សព្វផ្សាយកម្មវិធីនេះ៕
Thursday, October 30, 2014
Tuesday, October 14, 2014
កម្មវិធី Khmer OCR ដំណើរការដូចម៉្តេច?
Tesseract OCR ជាកម្មវិធីកូដចំហ ខ្មែរយើងជាច្រើនបានទាញយកមកបង្កើតកម្មវិធីស្កែនរូបភាពបំឡែងទៅជាអត្ថបទ (Khmer OCR) ប៉ុន្តែមិនបានជោគជ័យ ពីព្រោះគំនូសអក្សរខ្មែរលម្អិតពេក ហើយមានកត្តាជាច្រើនដែលធ្វើឲ្យលទ្ធផងចេញមកមិនដូចបំណង។
កាលពីឆ្នាំ ២០០៣ ពេលកំពុងធ្វើពុម្ពអក្សរយូនីកូដ ខ្ញុំក៏នឹកឃើញគំនិតថ្មីក្នុងការបង្កើតកម្មវិធី OCR សម្រាប់ខ្មែរ ប៉ុន្តែមិនបានអនុវត្ត ពីព្រោះនេះជាការងារធំ ទាមទារឲ្យមានមនុស្សច្រើនចូលរួម។
ដល់ឆ្នាំ២០១២ ដោយសារមានលោក Paul Dodds អ្នកជំនាញផ្នែកច្បាប់របស់ធនាគាពិភពលោកជួយលើកទឹកចិត្ត ទើបខ្ញុំ និង ធីម ច័ន្ទរិទ្ធី អ្នកបង្កើតប្រព័ន្ធប្រតិបត្តិការ moonOS បង្កើតបានក្រុមការងារ ហើយក្រោយមករួមសហការជាមួយក្រុមហ៊ុន innover.com និងអង្គការ SBBIC (http://www.sbbic.org) បង្កើតបានគម្រោងនេះឡើង។
កិច្ចការចំពោះមុខរបស់គម្រោង Khmer OCR គឺបង្កើតឧបករណ៍សម្រាប់ប្រើលើបណ្តាញអ៊ីនធឺណេត ដែលអនុញ្ញាតឲ្យអ្នកប្រើប្រាស់ចូលរួមតាមរយៈកែពាក្យខុសឲ្យត្រូវ ដូចជាជួយបង្រៀងកម្មវិធីកុំព្យូទ័រឲ្យស្គាល់ភាសាខ្មែរ។ ប្រសិនបើមានអ្នកចូលរួមកាន់តែច្រើន លទ្ធផលនៃការបំឡែងរូបភាពទៅជាអត្ថបទត្រូវបានកាន់តែច្រើន។
ឧទាហរណ៍ លទ្ធផលបឋម
កែកំហុស
លទ្ធផលចុងក្រោយ
លោកអ្នកអាចចូលសាកល្បងនៅទីនេះ khmerocr.org។ យើងខ្ញុំមានទំព័រសម្រាប់ការងារបង្រៀនឲ្យកម្មវិធីកុំព្យូទ័រស្គាល់ពាក្យខុស (train data) នៅទីនេះ khmerocr.org/train សម្រាប់តែអ្នកស្ម័គ្រចិត្តមួយចំនួន ដែលមានបំណងជួយកែលម្អកម្មវិធីនេះ។
កាលពីឆ្នាំ ២០០៣ ពេលកំពុងធ្វើពុម្ពអក្សរយូនីកូដ ខ្ញុំក៏នឹកឃើញគំនិតថ្មីក្នុងការបង្កើតកម្មវិធី OCR សម្រាប់ខ្មែរ ប៉ុន្តែមិនបានអនុវត្ត ពីព្រោះនេះជាការងារធំ ទាមទារឲ្យមានមនុស្សច្រើនចូលរួម។
ដល់ឆ្នាំ២០១២ ដោយសារមានលោក Paul Dodds អ្នកជំនាញផ្នែកច្បាប់របស់ធនាគាពិភពលោកជួយលើកទឹកចិត្ត ទើបខ្ញុំ និង ធីម ច័ន្ទរិទ្ធី អ្នកបង្កើតប្រព័ន្ធប្រតិបត្តិការ moonOS បង្កើតបានក្រុមការងារ ហើយក្រោយមករួមសហការជាមួយក្រុមហ៊ុន innover.com និងអង្គការ SBBIC (http://www.sbbic.org) បង្កើតបានគម្រោងនេះឡើង។
កិច្ចការចំពោះមុខរបស់គម្រោង Khmer OCR គឺបង្កើតឧបករណ៍សម្រាប់ប្រើលើបណ្តាញអ៊ីនធឺណេត ដែលអនុញ្ញាតឲ្យអ្នកប្រើប្រាស់ចូលរួមតាមរយៈកែពាក្យខុសឲ្យត្រូវ ដូចជាជួយបង្រៀងកម្មវិធីកុំព្យូទ័រឲ្យស្គាល់ភាសាខ្មែរ។ ប្រសិនបើមានអ្នកចូលរួមកាន់តែច្រើន លទ្ធផលនៃការបំឡែងរូបភាពទៅជាអត្ថបទត្រូវបានកាន់តែច្រើន។
ឧទាហរណ៍ លទ្ធផលបឋម
កែកំហុស
លទ្ធផលចុងក្រោយ
លោកអ្នកអាចចូលសាកល្បងនៅទីនេះ khmerocr.org។ យើងខ្ញុំមានទំព័រសម្រាប់ការងារបង្រៀនឲ្យកម្មវិធីកុំព្យូទ័រស្គាល់ពាក្យខុស (train data) នៅទីនេះ khmerocr.org/train សម្រាប់តែអ្នកស្ម័គ្រចិត្តមួយចំនួន ដែលមានបំណងជួយកែលម្អកម្មវិធីនេះ។
Sunday, September 28, 2014
អានសៀវភៅ epub នៅក្នុង iPhone និង iPad
បន្ទាប់ពីខ្ញុំដាក់ឯកសារ "កំណត់ហេតុរបស់ ជីវ តាក្វាន់" ជាទម្រង់ epub សម្រាប់អ្នកប្រើប្រាស់ទូរសព្ទ Android មានប្រិយមិត្តអ្នកលេង Facebook មួយចំនួនសួរខ្ញុំអំពីការអានឯកសារនេះនៅក្នុងឧបករណ៍របស់ Apple ដូចជា iPhone និង iPad ជាដើម។
ខាងក្រោម ជាចម្លើយរបស់ខ្ញុំ។
កម្មវិធី iBook នៅក្នុង iOS អនុញ្ញាតឲ្យលោកអ្នកអានសៀវភៅទម្រង់ .epub បាន។ ប៉ុន្តែសម្រាប់អ្នកប្រើ iPhone និង iPad មានកំណែ iOS ទាប ហើយគ្មានការ jailbreak ដាក់អក្សរខ្មែរចូល នៅមានបញ្ហាជាមួយពុម្ពអក្សរខ្មែរ។ ប្រសិនបើកឧបករណ៍របស់លោកអ្នក jailbreak ដាក់អក្សរខ្មែរចូល ឬបន្ទាន់សម័យទៅ iOS 8 ហើយ គឺលែងមានបញ្ហាក្នុងការអានខ្មែរទៀតហើយ។
លោកអ្នកទាញយកសៀវភៅ "កំណត់ហេតុ" របស់ ជីវ តាក្វាន់ នៅទីនេះ។ រួចឃើញផ្ទាំងដូចនៅខាងឆ្វេង ចុច "Open in "iBook"" ជាការស្រេច។
រូបភាពមួយចំនួននៅក្នុង iPhone (iOS 8)។
ខាងក្រោម ជាចម្លើយរបស់ខ្ញុំ។
កម្មវិធី iBook នៅក្នុង iOS អនុញ្ញាតឲ្យលោកអ្នកអានសៀវភៅទម្រង់ .epub បាន។ ប៉ុន្តែសម្រាប់អ្នកប្រើ iPhone និង iPad មានកំណែ iOS ទាប ហើយគ្មានការ jailbreak ដាក់អក្សរខ្មែរចូល នៅមានបញ្ហាជាមួយពុម្ពអក្សរខ្មែរ។ ប្រសិនបើកឧបករណ៍របស់លោកអ្នក jailbreak ដាក់អក្សរខ្មែរចូល ឬបន្ទាន់សម័យទៅ iOS 8 ហើយ គឺលែងមានបញ្ហាក្នុងការអានខ្មែរទៀតហើយ។
លោកអ្នកទាញយកសៀវភៅ "កំណត់ហេតុ" របស់ ជីវ តាក្វាន់ នៅទីនេះ។ រួចឃើញផ្ទាំងដូចនៅខាងឆ្វេង ចុច "Open in "iBook"" ជាការស្រេច។
រូបភាពមួយចំនួននៅក្នុង iPhone (iOS 8)។
Thursday, September 25, 2014
សៀវភៅ កំណត់ហេតុ ជីវ តាក្វាន់ ជាទម្រង់ epub
Subscribe to:
Posts (Atom)










