Your SlideShare is downloading. ×
Present
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Present

1,139
views

Published on

Published in: Business, Health & Medicine

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,139
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
20
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. การรู้จำลายมือเขียนตัวพยัญชนะภาษาไทยโดยการใช้อีลาสติกดีฟอเมชัน The Handwritten Thai-Alphabet Recognition by Using Elastic Deformation นายสุธี คงเกียรติไพบูลย์ ม . 6/3 เลขที่ 22 นายภควัฒน์ เอี่ยมสุโร ม . 6/10 เลขที่ 23 อาจารย์ที่ปรึกษา อ . ปทุมศิริ สงศิริ
  • 2. ที่มาและความสำคัญ
    • มีการกรอกแบบฟอร์มต่างๆเป็นจำนวนมาก
    • เสียทรัพยากรและเวลาในการจัดเก็บ ( พิมพ์ข้อมูล )
    • Handwritten Recognition
    • ประสิทธิภาพในการรู้จำยังต่ำ ขาดความถูกต้อง
  • 3. จุดประสงค์
    • เพื่อพัฒนาขั้นตอนวิธีเพื่อแก้ปัญหาการรู้จำลายมือเขียนพยัญชนะลายมือเขียนภาษาไทยด้วยเทคนิคอีลาสติกดีฟอเมชัน
  • 4. ขอบเขตการศึกษา
    • ทำการศึกษาและพัฒนาขั้นตอนการรู้จำพยัญชนะลายมือเขียนภาษาไทย
    • วิเคราะห์ความถูกต้องในการรู้จำโดยใช้เทคนิคอีลาสติกดีฟอเมชันซึ่งเป็นการเพิ่มจำนวนตัวอย่าง เปรียบเทียบกับการไม่ใช้เทคนิคนี้
    • พยัญชนะไทยที่ศึกษามี 46 ตัว คือ ก – ฮ รวมถึง ฤ และ ฦ
    • ข้อมูลที่รับเข้ามาอยู่ในรูปไฟล์รูปภาพ Bitmap ขาว หรือ ดำ
  • 5. แนวคิดและสมมติฐาน
    • ประสิทธิภาพในการรู้จำมีปัจจัยหลายๆอย่าง
      • Feature ที่ใช้ในการรู้จำ
      • ตัวอย่างข้อมูลที่ใช้ในการรู้จำ
      • Model ที่ใช้ในการรู้จำ
    • ตัวอย่างข้อมูลที่เราใช้ในการรู้จำมีจำกัด หากเราสามารถเพิ่มในตัวอย่างโดยที่ไม่ต้องเก็บข้อมูลเพิ่ม และนำไปรู้จำ ซึ่งได้ประสิทธิภาพที่ดีขึ้น ก็จะเป็นการเพิ่มประสิทธิภาพในการรู้จำวิธีหนึ่ง
  • 6. แผนภาพการทำงาน Input
    • ตัดให้พอดีขอบ
    • กำจัด noise
    • thinning
    Preprocessing Feature Extraction Recognition
    • Height / Width
    • จำนวนจุดบน / จำนวนจุดล่าง
    • End & Junction point
    • Connection
    • Head
    • Vertical Stroke
    • Crossing Count
    • Cavity
    • Histogram
    • Empty Zone
    • libsvm
    Elastic Deformation
  • 7. แผนภาพการทำงาน Input
    • ตัดให้พอดีขอบ
    • กำจัด noise
    • thinning
    Preprocessing Feature Extraction Recognition
    • Height / Width
    • จำนวนจุดบน / จำนวนจุดล่าง
    • End & Junction point
    • Connection
    • Head
    • Vertical Stroke
    • Crossing Count
    • Cavity
    • Histogram
    • Empty Zone
    • libsvm
    Elastic Deformation
  • 8. แผนภาพการทำงาน Input
    • ตัดให้พอดีขอบ
    • กำจัด noise
    • thinning
    Preprocessing Feature Extraction Recognition
    • Height / Width
    • จำนวนจุดบน / จำนวนจุดล่าง
    • End & Junction point
    • Connection
    • Head
    • Vertical Stroke
    • Crossing Count
    • Cavity
    • Histogram
    • Empty Zone
    • libsvm
    Elastic Deformation
  • 9.
    • ใช้ขั้นตอนวิธีของ Y.Y. Zhang และ P.S.P. Wang
    Thinning Y.Y. Zhang and P.S.P. Wang, A Parallel Thinning Algorithm with Two-Subiteration that Generates One-Pixel-Wide Skeletons Fig.1 Psuedo Code ในการ thinning
  • 10. แผนภาพการทำงาน Input
    • ตัดให้พอดีขอบ
    • กำจัด noise
    • thinning
    Preprocessing Feature Extraction Recognition
    • Height / Width
    • จำนวนจุดบน / จำนวนจุดล่าง
    • End & Junction point
    • Connection
    • Head
    • Vertical Stroke
    • Crossing Count
    • Cavity
    • Histogram
    • Empty Zone
    • libsvm
    Elastic Deformation
  • 11. แผนภาพการทำงาน Input
    • ตัดให้พอดีขอบ
    • กำจัด noise
    • thinning
    Preprocessing Feature Extraction Recognition
    • Height / Width
    • จำนวนจุดบน / จำนวนจุดล่าง
    • End & Junction point
    • Connection
    • Head
    • Vertical Stroke
    • Crossing Count
    • Cavity
    • Histogram
    • Empty Zone
    • libsvm
    Elastic Deformation
  • 12. Height / Width Height Width Fig.2 อัตราส่วน Height / Width
  • 13. แผนภาพการทำงาน Input
    • ตัดให้พอดีขอบ
    • กำจัด noise
    • thinning
    Preprocessing Feature Extraction Recognition
    • Height / Width
    • จำนวนจุดบน / จำนวนจุดล่าง
    • End & Junction point
    • Connection
    • Head
    • Vertical Stroke
    • Crossing Count
    • Cavity
    • Histogram
    • Empty Zone
    • libsvm
    Elastic Deformation
  • 14. จำนวนจุดบน / จำนวนจุดล่าง Fig.3 การหาจำนวนจุดบน / จำนวนจุดล่าง
  • 15. แผนภาพการทำงาน Input
    • ตัดให้พอดีขอบ
    • กำจัด noise
    • thinning
    Preprocessing Feature Extraction Recognition
    • Height / Width
    • จำนวนจุดบน / จำนวนจุดล่าง
    • End & Junction point
    • Connection
    • Head
    • Vertical Stroke
    • Crossing Count
    • Cavity
    • Histogram
    • Empty Zone
    • libsvm
    Elastic Deformation
  • 16. End point & Junction point, Connection Fig.4 การแบ่งโซนของ End Point & Junction Fig.5 การแบ่งโซนของ Connection
  • 17. แผนภาพการทำงาน Input
    • ตัดให้พอดีขอบ
    • กำจัด noise
    • thinning
    Preprocessing Feature Extraction Recognition
    • Height / Width
    • จำนวนจุดบน / จำนวนจุดล่าง
    • End & Junction point
    • Connection
    • Head
    • Vertical Stroke
    • Crossing Count
    • Cavity
    • Histogram
    • Empty Zone
    • libsvm
    Elastic Deformation
  • 18. Head Fig. 6 การหา Head I. Methasate, S. Marukatat, S. Sae-tang, T. Theeramunkong, “The Feature Combination Technique for Off-line Thai Character Recognition System” Proceedings of the 2005 Eight International Conference on Document Analysis and Recognition (ICDAR’05), 2005.
  • 19. แผนภาพการทำงาน Input
    • ตัดให้พอดีขอบ
    • กำจัด noise
    • thinning
    Preprocessing Feature Extraction Recognition
    • Height / Width
    • จำนวนจุดบน / จำนวนจุดล่าง
    • End & Junction point
    • Connection
    • Head
    • Vertical Stroke
    • Crossing Count
    • Cavity
    • Histogram
    • Empty Zone
    • libsvm
    Elastic Deformation
  • 20. Vertical Stroke
    • ทำ histogram แนวตั้ง
    • Smooth
    • หา จุดยอด และ local minimum
    • Triangle method
    • เช็คว่าเป็น vertical stroke จริงหรือไม่
    • โดยดูจากความยาวว่ายาวเท่าไร ซึ่งต้องยาวกว่า
    • 0.65 เท่าของความสูงตัวอักษร
    Fig.7 การหา Vertical Stroke I. Methasate, S. Sae-tang, “The Clustering Technique for Thai Handwritten Recognition” Proceedings of the 9th Int’l Workshop on Frontiers in Handwriting Recognition (IWFHR-9 2004), 2004.
  • 21. แผนภาพการทำงาน Input
    • ตัดให้พอดีขอบ
    • กำจัด noise
    • thinning
    Preprocessing Feature Extraction Recognition
    • Height / Width
    • จำนวนจุดบน / จำนวนจุดล่าง
    • End & Junction point
    • Connection
    • Head
    • Vertical Stroke
    • Crossing Count
    • Cavity
    • Histogram
    • Empty Zone
    • libsvm
    Elastic Deformation
  • 22. Crossing Count Fig.8 การแบ่งโซนของ Crossing Count
  • 23. แผนภาพการทำงาน Input
    • ตัดให้พอดีขอบ
    • กำจัด noise
    • thinning
    Preprocessing Feature Extraction Recognition
    • Height / Width
    • จำนวนจุดบน / จำนวนจุดล่าง
    • End & Junction point
    • Connection
    • Head
    • Vertical Stroke
    • Crossing Count
    • Cavity
    • Histogram
    • Empty Zone
    • libsvm
    Elastic Deformation
  • 24. Cavity Fig.9 ลักษณะของ Cavity แบบต่างๆ Pisit Phokharatkul and Chom Kimpan, “Recognition of handprinted Thai characters Using the cavity features of character base on neural network.” The 1998 IEEE Asia-Pacific Conference on circuits and systems, 24-27 November 1998, pp. 149-152.
  • 25. แผนภาพการทำงาน Input
    • ตัดให้พอดีขอบ
    • กำจัด noise
    • thinning
    Preprocessing Feature Extraction Recognition
    • Height / Width
    • จำนวนจุดบน / จำนวนจุดล่าง
    • End & Junction point
    • Connection
    • Head
    • Vertical Stroke
    • Crossing Count
    • Cavity
    • Histogram
    • Empty Zone
    • libsvm
    Elastic Deformation
  • 26. Histogram
    • ทำ Histogram ทั้งแนวตั้งและแนวนอน โดยแบ่งเป็นแนวละ 3 โซน และแนวตั้งทั้งภาพ แนวนอนทั้งภาพ จากนั้นคิดเป็นอัตราส่วนกับ ความกว้างหรือความยาว
    Fig.10 การแบ่งส่วนการทำ Histogram
  • 27. แผนภาพการทำงาน Input
    • ตัดให้พอดีขอบ
    • กำจัด noise
    • thinning
    Preprocessing Feature Extraction Recognition
    • Height / Width
    • จำนวนจุดบน / จำนวนจุดล่าง
    • End & Junction point
    • Connection
    • Head
    • Vertical Stroke
    • Crossing Count
    • Cavity
    • Histogram
    • Empty Zone
    • libsvm
    Elastic Deformation
  • 28. Empty Zone Fig.11 การแบ่งส่วนการทำ Empty Zone
  • 29. Normalize
    • ค่าที่ได้ = a
    • Median = med
    • MD = ∑(a – med)/ n
    • ค่าที่ normalize = (a – med)/MD
  • 30. แผนภาพการทำงาน Input
    • ตัดให้พอดีขอบ
    • กำจัด noise
    • thinning
    Preprocessing Feature Extraction Recognition
    • Height / Width
    • จำนวนจุดบน / จำนวนจุดล่าง
    • End & Junction point
    • Connection
    • Head
    • Vertical Stroke
    • Crossing Count
    • Cavity
    • Histogram
    • Empty Zone
    • libsvm
    Elastic Deformation
  • 31. การหา Feature ที่เหมาะสม ตารางแสดงค่าความถูกต้องในการเลือกใช้ feature แต่ละชนิด (10 อันดับสูงสุด ) * 1 = ใช้ feature นั้น normalize, 2 = ใช้ feature นั้นไม่ normalize, 0 = ไม่ใช้ feature นั้น % H/W U/L End Junc. Con. Verst. H. In. H. Fill. H. Re. C. Ver. C. Hor. Cavity His ver His Hor Empty 69.3478 1 1 2 2 2 2 0 2 2 2 2 1 2 2 2 69.3478 1 1 2 2 2 1 0 2 2 2 2 1 2 2 2 69.3478 1 1 2 2 2 2 2 2 2 2 2 1 2 2 2 69.2391 1 1 2 2 2 2 0 0 2 2 2 1 2 2 2 69.2391 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 69.0217 1 1 2 2 2 1 2 2 2 2 2 1 2 2 2 69.0217 1 1 2 2 2 2 0 2 2 2 2 1 2 2 0 68.587 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 68.587 1 1 0 0 0 0 0 0 0 2 2 1 2 2 2 68.3696 1 1 2 0 2 1 0 2 2 2 2 1 2 2 2
  • 32. แผนภาพการทำงาน Input
    • ตัดให้พอดีขอบ
    • กำจัด noise
    • thinning
    Preprocessing Feature Extraction Recognition
    • Height / Width
    • จำนวนจุดบน / จำนวนจุดล่าง
    • End & Junction point
    • Connection
    • Head
    • Vertical Stroke
    • Crossing Count
    • Cavity
    • Histogram
    • Empty Zone
    • libsvm
    Elastic Deformation
  • 33. Elastic Deformation
    • ใช้เทคนิคนี้ในการสร้างตัวอย่างขึ้นจากตัวอย่างเดิมที่มีอยู่ในแล้วโดยอาศัยการ random ขึ้นมาใหม่ ถ้า random หมด ภาพจะเพี้ยน จึงมีการทำ smooth ก่อน จากนั้นนำไป train เป็นตัวอย่างหนึ่งที่เพิ่มขึ้นมา
    Fig.12 การทำ Elastic Deformation
  • 34. ตารางแสดงค่าความถูกต้องเมื่อมีการเพิ่มจำนวนตัวอย่าง 116 100 80 60 40 20 0 1 3 5 69.3478 69.3478 70.1087 48.4783 69.3478 69.5652 70.1087 49.4565 69.3478 69.4565 69.8913 51.1957 69.2391 69.1304 69.6739 50.4348 69.2391 69.3478 69.7826 50.2174 0 1 3 5 69.7826 69.0217 69.5652 57.5 68.2609 67.9348 68.6957 55.6522 69.4565 69.1304 69.3478 56.8478 69.2391 68.8043 68.913 56.413 69.0217 69.3478 69.7826 56.5217 0 1 3 5 67.9348 67.3913 68.1522 55.5435 67.7139 66.9565 67.9348 63.913 67.3913 67.1739 68.0435 65.5435 66.3043 66.413 66.9565 64.2391 67.7174 67.5 68.0435 64.2391 0 1 3 5 66.6304 66.7391 66.8478 59.5652 65.9783 66.087 65.9783 67.2826 66.7391 66.6304 66.6304 67.1739 66.1957 66.413 66.413 67.0652 67.1739 66.7391 67.1739 67.0652 0 1 3 5 62.8261 62.5 63.6957 64.4565 59.3478 47.2826 61.087 62.7174 59.5652 59.0217 60.9783 60.7609 62.2826 61.5127 63.2609 63.4783 63.587 63.0435 63.913 64.5652 0 1 3 5 56.5217 57.0652 58.3696 59.1304 55.9783 55.9783 57.8261 59.4565 54.4565 54.8913 56.1957 56.9565 56.1957 56.6304 57.3913 58.587 56.413 56.413 57.5 58.8043
  • 35. สรุปผล
    • เมื่อมีการเพิ่มจำนวนตัวอย่าง ประสิทธิภาพความถูกต้องจะเพิ่มขึ้นเล็กน้อย เมื่อเทียบกับการไม่เพิ่มจำนวนตัวอย่าง สูงสุดที่ 70.187%
    • หากเพิ่มจำนวนตัวอย่างมากเกินไปจะทำให้ความถูกต้องลดลง
    • ตัวอย่างที่เพิ่มเข้าไปไม่สามารถทดแทนตัวอย่างที่เก็บเพิ่มเข้ามาได้
  • 36. References
    • Chih-Chung Chang and Chih-Jen Lin, “LIBSVM:a Library for Support Vector Machines”. Software available at http://www.csie.ntu.edu.tw/~cjlin/libsvm (accessed 15/11/2007)
    • I. Methasate, S. Marukatat, S. Sae-tang, T. Theeramunkong, “The Feature Combination Technique for Off-line Thai Character Recognition System” Proceedings of the 2005 Eight International Conference on Document Analysis and Recognition (ICDAR’05), 2005.
    • I. Methasate, S. Sae-tang, “The Clustering Technique for Thai Handwritten Recognition” Proceedings of the 9th Int’l Workshop on Frontiers in Handwriting Recognition (IWFHR-9 2004), 2004.
    • P. Phokharatkul, K. Sankhuangaw, S. Somkuarnpanit, S. Phaiboon, C. Kimpan, “Off-Line Hand Written Thai Character Recognition using Ant-Miner Algorithm” Transactions on Engineering, Computering and Technology, vol. 8, p 276-281, 2005.
    • Pisit Phokharatkul and Chom Kimpan, “Recognition of handprinted Thai characters Using the cavity features of character base on neural network.” The 1998 IEEE Asia-Pacific Conference on circuits and systems, 24-27 November 1998, pp. 149-152.
  • 37. References
    • M. Morita, R. Sabourin, F. Bortolozzi, C. Y. Suen, “A Recognition and Verification Strategy for Handwritten Word Recognition”, Proceedings of the Seventh International Conference on Document Analysis and Recognition (ICDAR’03), 2003.
    • Y.Y. Zhang and P.S.P. Wang, “A Parallel Thinning Algorithm with Two-Subiteration that Generates One-Pixel-Wide Skeletons”. Available at http://portal.acm.org/citation.cfm?id=848444 (accessed 23/03/50)
    • Antoine Manzanera, Thierry M.Bernard, Francoise Preteux, and Bernard Lonquet, “Ultra-fast Skeleton based on an isotropic fully parallel algorithm”. Available at http://www.springerlink.com/index/j4knuh91g28qhjee.pdf ( accessed 12/01/2007)
    • P. Simard, D. Steinkraus and J. Platt, "Best practices for convolutional neural networks applied to visual document analysis“, In International Conference on Document Analysis and Recognition (ICDAR) 2003 Edinbourgh, UK

×