99994. การดำาเนินงาน
1. เทคนิคการประมวลผลภาษาไทย
-การตัดคำาอัตโนมัติ
2. ซอฟต์แวร์เครื่องมือ
-เครื่องมือตัดคำาอัตโนมัติ
3. ฐานความรู้ทางภาษา
-คลังคำาศัพท์ทั่วไป จำานวน 9,000 คำา
4. ผลงานตีพิมพ์
- บทความวิชาการนานาชาติ 5 ฉบับ
1. ระบบต้นแบบ
- ระบบจัดเก็บเอกสารหลายภาษา
2. เทคนิคการประมวลผลภาษาไทย
- การหานิพจน์ระบุนัย
3. ซอฟต์แวร์เครื่องมือ
-เครื่องมือกำากับชนิดของคำา
- เครื่องมือสกัดกฎไวยากรณ์
4. ฐานความรู้ทางภาษา
-คลังต้นไม้ จำานวน 500 ต้น
-คลังคำาศัพท์ทั่วไป จำานวน 10,000 คำา
5. ผลงานตีพิมพ์
-บทความวิชาการนานาชาติ 1 ฉบับ
-บทความวิชาการในประเทศ 5 ฉบับ
1. ระบบต้นแบบ
- ระบบรู้จำาภาพอักษรภาษาไทย
- ระบบรู้จำาลายมือเขียนภาษาไทย
2. ซอฟต์แวร์เครื่องมือ
- เครื่องมือปรับปรุงเอกสารรูปภาพอักษร
เอียง
- เครื่องมือปรับปรุงเงาดำาในเอกสาร
- เครื่องมือลบรอยเปื้อนจุดสีดำา
3. ฐานความรู้ทางภาษา
-คลังคำาศัพท์ทั่วไป จำานวน 10,000 คำา
-คลังคำาศัพท์สองภาษา (อังกฤษ-ไทย)
10,000 คู่คำา
-คลังต้นไม้ จำานวน 1,000 ต้น
3. 3. ผลงานตีพิมพ์
-บทความวิชาการนานาชาติ 6 ฉบับ
-บทความวิชาการในประเทศ 3 ฉบับ
ปีที่ 1 2545
งบประมาณ 1800,000
ปีที่ 2 2546
งบประมาณ 3500,000
ปีที่ 3 2547
งบประมาณ 2000,000
ปีที่ 4 2548
งบประมาณ 1600,000
ปีที่ 5 2549
งบประมาณ 1200,000
1. ระบบต้นแบบ
- ระบบประมวลผลภาพเพื่อสร้างดัชนี
- ระบบสืบค้นสารสนเทศอัจฉริยะ
- ระบบจัดหมวดหมู่อัตโนมัติ
2. ฐานความรู้ทางภาษา
- คลังคำาศัพท์ทั่วไป จำานวน 12,514 คำา
- คลังคำาศัพท์สองภาษา (อังกฤษ-ไทย)
10,000 คู่คำา
-คลังต้นไม้ จำานวน 500 ต้น
3. ผลงานตีพิมพ์
-บทความวิชาการในประเทศ 7 ฉบับ
1. ระบบ STREDEO
2. ผลงานตีพิมพ์
-วารสารวิชาการต่างประเทศ 1 ฉบับ
03/23/1503/23/15
5. บุคลากร
• สร้างนิสิตปริญญาเอกและร่วมวิจัยกับโครงการนี้
จำานวน 1 คน
• ผลิตนิสิตปริญญาโทที่จบการศึกษาไปแล้ว 21
คน
• ผลิตนิสิตปริญญาตรีที่จบการศึกษาไปแล้ว 28
คน
• สร้างผู้ช่วยวิจัยเต็มเวลา 9 คน แบ่งเป็น
– นักภาษาศาสตร์เชิงคำานวณ 2 คน
– ผู้ช่วยนักภาษาศาสตร์ 2 คน
– นักวิจัยวิศวกรคอมพิวเตอร์ปริญญาโท 3 คน03/23/1503/23/15 5
10. การดำาเนินงานใน SRU-NAiST II
1. พัฒนาระบบจัดเก็บฐานความรู้ และ
เอกสารงานวิจัยและพร้อมให้บริการแก่ผู้
สนใจ (Project Doc)
2. พัฒนาระบบขยายคำาค้น
- Soundex
1.พัฒนาระบบจัดเก็บฐานความรู้ และ
เอกสารงานวิจัย
-ฐานข้อมูลเอกสารการเกษตรจาก
-กรมการข้าว
-กรมส่งเสริมการเกษตร
-กรมวิชาการเกษตร
2. พัฒนาระบบสืบค้นจากหลายแหล่ง
-ระบบสืบค้นที่มีความถูกต้องและตรง
กับความต้องการของผู้ใช้
3. พัฒนา จัดทำา Workbench
Ontology
Ontologyเพื่อใช้กับระบบสืบค้นอย่าง
น้อย 2 โดเมน
1. พัฒนาระบบสืบค้นจากหลายแหล่ง
ระบบ Meta Search เพื่อใช้สืบค้นกับ
Ontology
2. จัดทำา Workbench Ontology
Ontologyเพื่อใช้กับระบบสืบค้นอย่าง
น้อย 2 โดเมน
3. พัฒนา social bookmarking
เพื่อช่วยขยายผลลัพธ์ให้ตรงใจผู้ใช้มาก
ขึ้น
4. พัฒนาระบบขยายคำาค้น
- Romanization
ปีที่ 1 2551
ปีงบประมาณ 2550
ปีที่ 2 2552
ปีงบประมาณ 2551
1.พัฒนาเครื่องมือจัดการข้อมูลจากแหล่ง
ต่างๆ
- Parser
- Sentences Segmentation
2. พัฒนาระบบขยายคำาค้น
- Ontology
3. พัฒนา social bookmarking
เพื่อช่วยขยายผลลัพธ์ให้ตรงใจผู้ใช้มาก
ขึ้น (ต่อ)
1. ระบบบริหารจัดการ
เอกสารที่มีประสิทธิภาพ
ในระดับเชิงพาณิชย์
2. UserInterface ที่ง่ายต่อ
การใช้งาน
ปีที่ 3 2553
ปีงบประมาณ 2552
ปีที่ 4 2554
ปีงบประมาณ 2553
ปีที่ 5 2555
ปีงบประมาณ 2554
03/23/1503/23/15
12. มูลค่าตลาด Digital Content ทั่วโลก
• ปี 2006: 165,500 ล้านเหรียญสหรัฐฯ
• ปี 2007: 271,300 ล้านเหรียญสหรัฐฯ
มูลค่าตลาด Digital Content ในประเทศไทย
• มีการคาดการณ์ว่า อุตสาหกรรม Digital Content
จะมีมูลค่า 80,000 ล้านบาท ภายในปี 2551
สัดส่วนการเติบโตของ Digital Content Market Segments
Digital Content Market
M o b ile
C o n t e n t , 6 6 %
E - L e a r n in g ,
5 4 %
G a m e s , 2 0 %
Source: ศูนย์วิจัยกสิกรไทย(2006) และ IDC(2006)
03/23/1503/23/15 12
13. ภาพรวม DMS ในปัจจุบัน
• โครงการ DMS ใช้งบประมาณโดยเฉลี่ย
6.6 ล้านเหรียญสหรัฐ (Computer World,
September 30, 2007)
• มี DMS ทั่วโลกในปัจจุบันมากกว่า 300
แพ็กเก็จ
• โดยปกติการสร้าง DMS ในช่วงเริ่มต้นจะใช้
เวลาประมาณ 3 เดือน แต่ในการสร้างให้
เสร็จสมบูรณ์จะใช้เวลา 9-12 เดือน หรือ
มากกว่านั้น 03/23/1503/23/15 13
14. ภาพรวม DMS ในปัจจุบัน (ต่อ)
• DMS ได้รับการพัฒนาให้รองรับความ
ต้องการอย่างหลากหลายจนเกิดเป็น DMS
หลายชนิด เช่น
–Web content management
–Document management
–Asset management
–Portal publishing
–Application integration
03/23/1503/23/15 14
42. ออนโทโลยี คืออะไร
• หมายถึง วิธีการบรรยายแนวความคิดตามขอบเขต
ที่สนใจ หรือข้อกำาหนดที่เกี่ยวกับแนวคิด
• โดยที่ออนโทโลยีเป็นการสร้างโครงสร้างฐาน
ความรู้ทางด้านใดด้านหนึ่ง หรือขอบเขตใด
ขอบเขตหนึ่ง ซึ่งมีแนวคิดและความเข้าใจตรงกัน
• ออนโทโลยีใช้ในการอธิบายความหมายของสิ่ง
ต่าง ๆ และสามารถจัดหมวดหมู่เอกสารของข้อมูล
ได้ในขอบเขตความสนใจหนึ่ง ๆ
• ปัจจุบันออนโทโลยีได้ถูกนำามาประยุกต์ใช้งาน
มากยิ่งขึ้น สามารถประยุกต์กับงานหลาย ๆ ด้าน03/23/1503/23/15 42
44. Ontology Structure
ก ร ะ เป๋ า
ก ร ะ เป๋ าถื อ
ก ร ะ เป๋ าเอ ก ส าร
ก ร ะ เป๋ าส ะ พ าย
เป้
อุ ป ก ร ณ์ ก าร ผ ลิ ต
วั ส ดุ
วั ส ดุ ต ก แ ต่ ง
ผ้ า
ห นั ง
พื ช
H y p o n y m : a k in d o f
M e r o n y m : a p a r t o f
R e la te d te rmข าย ป ลี ก
ซ่ อ ม
ข าย ส่ ง
03/23/1503/23/15 44
45. Example
ก ร ะ เ ป๋ า
ก ร ะ เป๋ า ถื อ
ก ร ะ เ ป๋ าเ อ ก ส า ร
ก ร ะ เ ป๋ า ส ะ พ า ย
เป้
อุ ป ก ร ณ์ ก า ร ผ ลิ ต
วั ส ดุ
วั ส ดุ ต ก แ ต่ ง
ผ้ า
ห นั ง
พื ช
1 . 1 8 /3 0 1 8ร้านจานทอง ซอย ถนนงามวงศ์วาน
1 1 0 0ตำา บ ล บ า ง เข น อำา เภ อ เมื อ ง น น ท บุ รี
. 0 - 2 5 8 9 - 7 4 8 5 0 - 2 9 5 1 - 8 3 1 2โ ท ร
2 . 1 3 8 5 /4ห้างเพชรทองบุญรัตน์ ถนนเนรมิต ตำาบลคลัง
8 0 0 0 0 : 0อำา เภ อ เมื อ ง จั ง ห วั ด น ค ร ศ รี ธ ร ร ม ร า ช โ ท ร
7 5 3 5 6 1 9 6 , 0 9 4 7 4 3 9 1 8 : 0 7 5 3 5 8 0 0 0โทรสาร
3 . . 4 2 /9ชองแฮนดิคราฟท์ แอนด์ กิฟท์แวร์ บจก
-ถ น น ทุ่ ง ส ง ห้ ว ย ย อ ด อำา เภ อ ทุ่ ง ส ง น ค ร ศ รี ธ ร ร ม ร า ช
8 0 1 1 0 . 0 - 7 5 4 2 - 0 2 1 8 , 0 - 1 6 8 2 - 6 3 6 1โทร
03/23/1503/23/15 45