Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
คอมพิวเตอร์วิทัศน์  ( computer vision )
คอมพิวเตอร์วิทัศน์  ( computer vision )   <ul><li>คอมพิวเตอร์วิทัศน์  ( computer vision )  เป็นสาขาหนึ่งของปัญญาประดิษฐ์  ...
คอมพิวเตอร์วิทัศน์  ( computer vision ) <ul><li>เป้าหมายของคอมพิวเตอร์วิทัศน์ โดยทั่วไปคือ การทำให้คอมพิวเตอร์สามารถเข้าใจ...
คอมพิวเตอร์วิทัศน์  ( computer vision ) <ul><li>กระบวนการจะเกี่ยวเนื่องตั้งแต่ การรับภาพ  ( ซึ่งไม่ได้จำกัดอยู่เพียงแต่ภาพ...
คอมพิวเตอร์วิทัศน์  ( computer vision ) <ul><li>งานที่พบเห็นทั่วไปของ คอมพิวเตอร์วิทัศน์ </li></ul><ul><li>การตรวจจับ แยกแ...
คอมพิวเตอร์วิทัศน์  ( computer vision ) <ul><li>งานของคอมพิวเตอร์วิทัศน์ จะต้องใช้ความรู้จากสาขาต่างๆ  </li></ul><ul><li>-...
computer vision  <ul><li>มีความพยายามในการสรางระบบที่มีความสามารถในการวิเคราะหและประมวลผลภาพ โดยเปาหมายหลักประการหนึ่งก...
computer vision
computer vision
2.  อุปกรณรับภาพ  ภาพที่สามารถนํามาวิเคราะหหาขอมูลตองมีวิธีการบันทึกภาพที่เหมาะสม โดยหลักการคราวๆ ของการบันทึกภาพก็เห...
อุปกรณรับภาพธรรมชาติ  มีดังนี้คือ   1.  ตา   2.  กล้องรูเข็ม   3.  เลนส์   4.  กล้อง  CCD
<ul><li>ตา   </li></ul><ul><li>เปนอวัยวะของมนุษยที่ทําหนาที่รับภาพโดยมีสวนประกอบดังนี้ คือ  </li></ul><ul><ul><li>•  E...
<ul><ul><li>•  Lens  ทําหนาที่ เปนสวนรวมแสงเหมือนเลนสกลอง  </li></ul></ul><ul><ul><li>•  Retina  เปนฉากรับแสง ประกอบ...
<ul><li>2.  กลองรูเข็ม   </li></ul><ul><li>เปนอุปกรณรับภาพที่อาศัยรูเล็กๆ เพียงรูเดียวใหแสงสามารถลอดผานได โดยแสงที่ก...
 
<ul><li>ขอเสียของอุปกรณชิ้นนี้ก็คือ ความเขมแสงที่ตกกระทบวัตถุมีผลตอความชัดเจนของภาพที่ไดเปน อยางมาก ขนาดของรูของกล...
<ul><ul><ul><li>3.  เลนส  </li></ul></ul></ul><ul><li>  ปริมาณแสงที่ผานรูของกลองรูเข็มไปยังฉากมีจํากัด เพราะการขยายขนาด...
 
การทํางานของเลนส จะกลาวถึงการหักเหของแสง  เมื่อเดินทางผานตัวกลางที่มีความทึบแสงตางกัน สําหรับแทงแกวใสที่มีผิวเปนสว...
<ul><li>4.   กลอง  CCD  </li></ul><ul><li>  กลองถายรูปบันทึกภาพลงบนฟลม โดยอาศัยปฏิกิริยาเคมี ที่ทําใหเกิดการเปลี่ยนแ...
<ul><li>  กลอง  CCD (charged coupled device)  ประกอบดวยสวนรับแสง และสวนบันทึกภาพ ซึ่งเปนวงจรรวมที่ประกอบไปดวยเซลลเล...
 
บทที่  2 ทฤษฎีและงานวิจัยที่เกี่ยวข้อง
วิธีการที่ใช้ในการแยกข้อความออกจากรูปภาพ   <ul><li>1.  การรู้จำรูปแบบ  (Pattern Recognition) </li></ul><ul><li>2.  การทำ  ...
วิธีการที่ใช้ในการแยกข้อความออกจากรูปภาพ <ul><li>5.  การทำ  Normalization </li></ul><ul><li>6.  การแยกส่วนประกอบ  ( Decomp...
การรู้จำรูปแบบ  ( Pattern  Recognition ) <ul><li>ตัวอย่างของระบบการจดจำรูปแบบ </li></ul><ul><ul><li>สัญญาณเตือนภัยในบ้าน ท...
1. การกำหนดรูปแบบของการรู้จำ <ul><li>เป้าหมายของการรู้จำคือ  </li></ul><ul><ul><li>การที่เราสนใจในการแบ่งกลุ่มของ  object ...
ภาพแสดงขั้นตอนการดำเนินงานของรูปแบบการรู้จำ
ภาพแสดง  observation vector สำหรับตัวอักษร
ภาพแสดงวิธีการเบื้องต้นสำหรับการรู้จำรูปแบบ
2. การทำ   convolution <ul><li>การทำ  convolution   ภาพที่มีขนาด  MxN  โดยใช้  kernel  และฟังชั่นข้อมูลภาพ เขียนแทนด้วย  I...
ลักษณะของหน้ากาก  3 x 3
วิธีการคำนวณตามสมการ  2.1 โดยที่  i  เริ่มจาก  1  ถึง  M-m+1  และ  j  เริ่มจาก  1  ถึง  N-n +1
ภาพแสดง  input  และ  kernal  ที่ทำ  Convlution
3.  การหา  Poincar’e index  <ul><li>การแบ่งภาพออกเป็นหน้าต่างของภาพทั้งหมด </li></ul><ul><li>การหาค่า  Poincar’e  index  ข...
การแบ่งภาพออกเป็นหน้าต่างของภาพทั้งหมด <ul><li>ภาพมีขนาด  M  N  ทำ  Orientation  field  ใช้สัญลักษณ์  โดยกำหนด  มีขนาด  N...
การหาค่า  Poincare Index  ของแต่ละหน้าต่าง <ul><li>นำหน้าต่างแต่ละอันหา หาค่า  Poincar’e   index   ซึ่งในการหาแต่ละครั้งจะ...
สมการที่ใช้ในการคำนวณ if
4.  การทำ   Sector   <ul><li>เมื่อได้  core point  แล้วจุดนี้เราเรียกว่า  registeration  point  เป็นจุดแกนกลางและจะนำไปใช้...
4.  การทำ   Sector <ul><li>ซึ่งเรากำหนดให้จุดศูนย์กลางแทนด้วย  และ  แทนจุด  ที่เป็นจุดภาพระดับเท่า ในภาพลายนิ้วมือขนาด  M ...
5.  การทำ  Normalization <ul><li>ก่อนที่เราจะทำการ  decompose  กับภาพลายนิ้วมือเราจะต้องทำ  normalize  ในแต่ละ  sector  โด...
<ul><li>ซึ่ง  Mi   และ  Vi   ได้จากการประมาณ  mean   และ  variance   ของ  ตามลำดับ และ   Ni(x,y)  ได้จากการ  normalize   ค...
สมการ  2.4
6. การแยกส่วนประกอบ  ( Decomposition ) <ul><li>วิธีการทำ Decomposition  เป็นการทำภาพให้มีความละเอียดของโครงสร้างลายนิ้วมือ...
7.  คุณลักษณะเวคเตอร์ ( Feature  Vector) <ul><li>จากขั้นตอนของการทำ   Decomposition  เราจะได้ภาพทั้งหมด  4  ภาพด้วยกัน และ...
สมการที่  2.6 จากสมการ  2.6  ค่า เป็นค่าเฉลี่ย ของ  sector  และ ค่ามุมของภาพ  sector  นั้นๆ  และ  เป็นจำนวนของจุดทั้งหมดที...
<ul><li>8. การแยกประเภทลายนิ้วมือด้วยเครื่องตรวจเวคเตอร์  (Support Vector Machines) </li></ul>
ภาพแสดงการแบ่ง  2  คลาส Class 1 Class 2
สมการที่ใช้ในการคำนวณ <ul><li>สมการ 2.7 </li></ul><ul><li>สมการ2.8 </li></ul><ul><li>สมการ2.9 </li></ul>
ลักษณะการแยก  2  คลาสด้วย  Support vector  และ  Hyperplane   M  6 =1.4 Class 1 Class 2  1 =0.8  2 =0  3 =0  4 =0  5...
การเปลี่ยนจาก   non –linear   เป็น  linear   <ul><li>1.Polynomial kernel with degree  d </li></ul><ul><li>Radial basis fun...
ภาพแสดง ลักษณะการเปลี่ยนจาก   non –linear   เป็น  linear      ) )  (  )  )  (  )  (  )  (  )  (  )  )  ( )  (  ) ...
1.3   การวิเคราะห  และประมวลผลภาพ <ul><li>การวิเคราะห  ประมวลผลภาพและการรับรู  จากภาพ เป  นศาสตร  ที่ครอบคลุมเนื้อหาก...
1.3.1   ภาพไบนารี <ul><li>คือ ภาพซึ่งในแต  ละพิกเซลจะมีความเข  มของแสงได  สองแบบเท  านั้น คือสว่างกับมืด โดยอาจเขียนแท...
ในทางปฏิบัติการพิจารณาภาพไบนารี เราจะไม  สนใจแต  ละพิกเซลแยกกันไป แต  เราจะสนใจกลุ  มของพิกเซลที่อยู  ติดกัน หรือที่เ...
<ul><li>สําหรับ การตีความว  าพิกเซลใดอยู  ติดกันทําได  สองแบบหลักๆ คือ </li></ul><ul><li>1.  แบบสี่เพื่อนบ  าน  ( 4-co...
<ul><li>นิยามของการอยู  ติดกันของพิกเซลทั้งสองแบบที่ กล  าวมาเป  นที่นิยมใช  ในการประมวลผลภาพไบนารี แต  มีสิ่งที่ต  ...
 
<ul><li>หากความไม  สอดคล  องนี้ไม  ทําให  เกิดป  ญหากับงานที่ทําก็ไม  เป็นไร แต  หากจําเป  นต  องแก  ไขให  สอดค...
1.3.1.1   การนับจํานวนกลุ  มของพิกเซลที่อยู  ติดกัน <ul><li>กลุ  มของพิกเซลที่อยู  ติดกัน กลุ  มของพิกเซลเหล  านี้อา...
1.3.1.2   ตัวบอกลักษณะเชิงพื้นที่ <ul><li>เราสามารถบรรยายรูปร  างของกลุ  มพิกเซลที่อยู  ติดกันด  วยตัวบอกลักษณะเชิงพื้...
การจับคู่กับแม่แบบ นําแม่แบบไปวางทาบกับภาพที่พิจารณาและทําการประมวลผลโดยใช  ค  าของพิกเซลของภาพและของแม  แบบที่อยู  ใน...
ภาพเกรย  สเกล -  ภาพเกรย  สเกลก็สามารถให  ข  อมูลได  กว  างขวางลึกซึ้งกว  า -  ภาพที่รับมาจากกล  องรับภาพอยู่ในแบบ...
Thresholding -   ฮิสโตแกรม คือกราฟที่แจกแจงจํานวนพิกเซลที่ความเข  มของแสงต  างๆ กัน -  ค  าสําหรับแยกประเภทของพิกเซล - ...
การมัวภาพ   ( image blurring ) -  การลดผลกระทบของสัญญาณรบกวนในภาพ -  การแทนค  าความเข  มของพิกเซล ด  วยค  าเฉลี่ยของมั...
speech recognition  คือ การรู้จำเสียงพูดของคอมพิวเตอร์ ตัวอย่าง บริษัท ไนน์เนอร์ส จำกัด นำเสนอ  Izpal Speech  ใช้เสียงพูดเ...
Wheelchair Controlled with Speech Recognition System ใช้ในการควบคุมรถเข็นคนพิการให้เคลื่อนที่ไปในทิศทางต่างๆ โดยกำหนดด้วยค...
องค์ประกอบหลักๆ ของระบบรู้จำเสียงพูด  1.  การเตรียมสัญญาณขั้นต้น   (Preprocessing) 2. การหาลักษณะสำคัญของเสียง  ( Feature ...
(Basic of  Image Processing )   <ul><li>การประมวลผลรูปภาพ หรือที่ใคร ๆ อาจจะเรียกกว่ากันว่า  Computer Vision   </li></ul><...
1.  แนะนําภาพดิจิตอล   <ul><li>รูปภาพที่เราเห็นกันอยู่ ไม่ว่าจะเป็นภาพที่ถ่ายโดยใช้กล้องธรรมดา หรือแบบดิจิตอล ถ้าเรามองกัน...
2.  การแปลงภาพให้เป็นภาพเชิงดิจิตอล <ul><li>ภาพเป็นกระบวนการทางแสง  (Optical Process)  ซึ่งเกิดจากพลังงานคลื่นแม่เหล็กไฟฟ้...
<ul><li>ถ้าพูดกันในภาษาทางเทคนิคแล้ว ภาพดิจิตอลนั้นก็คือ ฟังก์ชั่น  2  มิติ หรือ  f(x,y)  ของค่าความเข้มของแสงโดยที่  x  แ...
<ul><li>แต่เมื่อรูปภาพ ถูกนำมาทำเป็นภาพในคอมพิวเตอร์ มันจะรู้และเข้าใจภาพเป็นเพียงแค่เป็นจุดสีหลาย ๆ จุดที่เรียงต่อกันในคว...
3.  การบันทึกภาพ  (Image Acquisition) <ul><li>ก่อนที่จะได้ภาพมา อันดับแรก เราจะต้องทำการถ่ายถาพเสียก่อน การถ่ายภาพ เป็น กา...
ในส่วนของการบันทึกภาพนี้ เป็นหน้าที่ของกลไกทางแสงในตัวกล้อง ที่จะทำหน้าที่รับภาพเข้ามา
4.  การสุ่มเลือกจุดตำแหน่ง  (Image Sampling) <ul><li>เป็นการแปลงภาพ  2  มิติที่ได้ให้เป็นภาพเชิงดิจิตอล โดยการสุ่มเลือกทาง...
<ul><li>เหตุผลของการทำ  Image Sampling  นั้นก็คือ ในการแสดงผลของจอภาพคอมพิวเตอร์นั้น หน่วยของความละเอียดในการแสดงผลนั้นเป็...
<ul><li>ภาพที่ 1 สุ่มเลือกมา 128x128   จุด  ภาพที่  2  สุ่มเลือกมา 64x64 จุด ภาพที่ 3 สุ่มเลือกมา 32x32  จุด  </li></ul>จะ...
<ul><li>ในการสุ่มเลือกทางตำแหน่งนี้ ถ้าในระยะความกว้างและความสูงของภาพ เราสุ่มมาละเอียดมาก ๆ เช่น สุ่มมา  128  จุด คุณภาพข...
5.  การประมาณค่าความเข้มของแสง  (ImageQuantization) <ul><li>เมื่อเราได้ภาพจากการ  Sampling  มาแล้ว </li></ul><ul><li>แต่ละ...
สีดำ จะแทนด้วยค่าตัวเลข  255  สีขาวจะแทนด้วยค่าตัวเลขคือ  0  รวมทั้งสิ้น  256  ระดับสี  (0-255)  หรือ  2  กําลัง  8  โดยที...
ถ้าภาพเป็นแบบโทนขาวดำ  (Grayscale)  แต่ละจุดภาพก็จะถูกแทนที่ด้วยตัวเลขที่บอกถึงค่าสีตั้งแต่  0-255  ลองดูภาพต่อไปนี้  แต่ล...
<ul><li>ค่าระดับสี  0  ก็คือ  00000000  </li></ul><ul><li>ค่าระดับสี  1  ก็คือ  00000001  </li></ul><ul><li>ค่าระดับสี  2 ...
ระดับความเข้มของสีที่เรากำหนดให้กับภาพ ถ้าภาพ ๆ นั้นใช้ระดับสีน้อย เช่น  256 , 128 , 64 , 32 , 16 , 8 , 4 , 2 (1  บิต )  ผ...
<ul><li>ในความเป็นจริงแล้ว ความละเอียดของภาพจะมีมากกว่านี้ และอัตราในการสุ่มภาพนั้น ถ้าเราไม่คำนึงถึงคุณภาพและรายละเอียดขอ...
Upcoming SlideShare
Loading in …5
×

Com Vision

3,357 views

Published on

Published in: Technology, Business
  • thank u
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • Be the first to like this

Com Vision

  1. 1. คอมพิวเตอร์วิทัศน์ ( computer vision )
  2. 2. คอมพิวเตอร์วิทัศน์ ( computer vision ) <ul><li>คอมพิวเตอร์วิทัศน์ ( computer vision ) เป็นสาขาหนึ่งของปัญญาประดิษฐ์ </li></ul><ul><li>จุดประสงค์หลักของคอมพิวเตอร์วิทัศน์ คือการทำให้คอมพิวเตอร์สามารถ &quot; เข้าใจ &quot; ทิวทัศน์ หรือคุณลักษณะต่างๆ ในภาพได้ </li></ul>
  3. 3. คอมพิวเตอร์วิทัศน์ ( computer vision ) <ul><li>เป้าหมายของคอมพิวเตอร์วิทัศน์ โดยทั่วไปคือ การทำให้คอมพิวเตอร์สามารถเข้าใจภาพที่รับเข้ามา โดยการแปลงจาก ภาพ ( image ) เป็น แบบจำลอง ( model ) ที่คอมพิวเตอร์สามารถรับรู้คุณสมบัติที่ต้องการได้ เช่น คุณสมบัติทางรูปร่าง เพื่อการจดจำ เพื่อการหยิบจับ เป็นต้น </li></ul>
  4. 4. คอมพิวเตอร์วิทัศน์ ( computer vision ) <ul><li>กระบวนการจะเกี่ยวเนื่องตั้งแต่ การรับภาพ ( ซึ่งไม่ได้จำกัดอยู่เพียงแต่ภาพที่รับด้วยกล้อง แต่อาจหมายถึงภาพถ่ายความร้อน และ ภาพจากอุปกรณ์วัดระยะ ฯลฯ ) การประมวลผลภาพ การสร้างแบบจำลองจากภาพ และการรับรู้เข้าใจของคอมพิวเตอร์จากแบบจำลอง </li></ul>
  5. 5. คอมพิวเตอร์วิทัศน์ ( computer vision ) <ul><li>งานที่พบเห็นทั่วไปของ คอมพิวเตอร์วิทัศน์ </li></ul><ul><li>การตรวจจับ แยกแยะ หาตำแหน่ง และ จดจำ วัถตุที่ต้องการในภาพ เช่น การจดจำหน้าคน </li></ul><ul><li>การสร้างแบบจำลองของวัตถุ เพื่อจุดประสงค์ต่างๆ เช่น การใช้แขนกลหยิบจับ ตัด หรือ เพื่อการตรวจสอบ เช่น การสร้างภาพสามมิติทางการแพทย์ </li></ul><ul><li>การสร้างแบบจำลองสามมิติของสภาพแวดล้อม เช่น เพื่อการรับรู้ตำแหน่ง และการเคลื่อนที่ของหุ่นยนต์ </li></ul>
  6. 6. คอมพิวเตอร์วิทัศน์ ( computer vision ) <ul><li>งานของคอมพิวเตอร์วิทัศน์ จะต้องใช้ความรู้จากสาขาต่างๆ </li></ul><ul><li>- การรู้จำแบบ </li></ul><ul><li>- การเรียนรู้เชิงสถิติ </li></ul><ul><li>- projective geometry </li></ul><ul><li>- การประมวลผลภาพ </li></ul><ul><li>- ทฤษฎีกราฟ </li></ul><ul><li>- สาขาอื่นๆ </li></ul>
  7. 7. computer vision <ul><li>มีความพยายามในการสรางระบบที่มีความสามารถในการวิเคราะหและประมวลผลภาพ โดยเปาหมายหลักประการหนึ่งก็คือการสรางระบบที่สามารถบอกไดวาภาพสองมิติที่ไดรับมานั้นเปนภาพของ วัตถุใด มีลักษณะในสามมิติอยางไร ศาสตรที่วานี้มีชื่อเรียกกันวา computer vision แต่ computer vision ยังไม่สามารถพัฒนาให้ดีพอได้เพราะธรรมชาติของปญหาเองที่ตองการกูคืน ขอมูลสามมิติจากขอมูลเขาสองมิติ ซึ่งเปนไปไมไดนอกจากมีขอกําหนดเสริมที่เพียงพอ ดังสํานวนที่วา “ A picture is worth a thousand words” ดูภาพของวัตถุชิ้นเดียวกันจากสามมุมมองในรูปที่ 1.1 และรูปที่ 1.2 </li></ul>
  8. 8. computer vision
  9. 9. computer vision
  10. 10. 2. อุปกรณรับภาพ ภาพที่สามารถนํามาวิเคราะหหาขอมูลตองมีวิธีการบันทึกภาพที่เหมาะสม โดยหลักการคราวๆ ของการบันทึกภาพก็เหมือนกับการทํางานของกลองถายรูป นั่นก็คือแสงจากตน ทางที่ตกกระทบวัตถุจะสะทอนและผานจุดรวมแสง โดยแสงที่ผาน จุดรวมแสงจะไปตกกระทบที่สวนรับภาพ จากนั้นภาพที่ไดจะถูกนําไปประมวลผลตอไป
  11. 11. อุปกรณรับภาพธรรมชาติ มีดังนี้คือ 1. ตา 2. กล้องรูเข็ม 3. เลนส์ 4. กล้อง CCD
  12. 12. <ul><li>ตา </li></ul><ul><li>เปนอวัยวะของมนุษยที่ทําหนาที่รับภาพโดยมีสวนประกอบดังนี้ คือ </li></ul><ul><ul><li>• Extraocular Muscles เปนกลามเนื้อทําหนาที่ควบคุมการเคลื่อนไหวของลูกตาเพื่อใหอยูในทิศทางที่จะรับภาพที่ตองการได เสมือนการปรับมุมกลองใหไดพอเหมาะ </li></ul></ul><ul><ul><li>• Cornea ทําหนาที่ เปนสวนควบคุมปริมาณแสงที่เขาสูตาใหเหมาะสม เสมือนกับการปรับรูรับแสงของกลองถายรูปที่จะใหแสงเขา </li></ul></ul>
  13. 13. <ul><ul><li>• Lens ทําหนาที่ เปนสวนรวมแสงเหมือนเลนสกลอง </li></ul></ul><ul><ul><li>• Retina เปนฉากรับแสง ประกอบไปดวยเซลลไวแสงแบบตางๆ เหมือนฟลมในกลอง ถายรูป </li></ul></ul><ul><ul><li>• Macula ทําหนาที่ปรับใหเกิดความคมชัดของภาพที่ retina มาเสมือนการปรับ f-stop ของกลองถายรูป </li></ul></ul><ul><ul><li>• Optic nerve ทําหนาที่สงตอขอมูลที่ไดรับมาสูสมอง </li></ul></ul>
  14. 14. <ul><li>2. กลองรูเข็ม </li></ul><ul><li>เปนอุปกรณรับภาพที่อาศัยรูเล็กๆ เพียงรูเดียวใหแสงสามารถลอดผานได โดยแสงที่กระทบวัตถุจะลอดผานรูนี้เปนเสนตรง และไปกระทบกับฉากทําใหเกิดเปนภาพของวัตถุ </li></ul>
  15. 16. <ul><li>ขอเสียของอุปกรณชิ้นนี้ก็คือ ความเขมแสงที่ตกกระทบวัตถุมีผลตอความชัดเจนของภาพที่ไดเปน อยางมาก ขนาดของรูของกลองที่ไมเหมาะสม ก็เปนปจจัยที่ทําใหภาพพรามัวได </li></ul>
  16. 17. <ul><ul><ul><li>3. เลนส </li></ul></ul></ul><ul><li> ปริมาณแสงที่ผานรูของกลองรูเข็มไปยังฉากมีจํากัด เพราะการขยายขนาดรูใหใหญเพื่อใหไดปริมาณแสงที่เพิ่มขึ้นอาจทําใหไดภาพมัว ปริมาณแสงที่จํากัดนี้เปนสาเหตุใหไดภาพที่มืดและไมชัดเจน เราสามารถแกปญหานี้ไดดวยการใชเลนสเปนอุปกรณรวมแสง โดยใชหลักการหักเหของแสง (refraction) แทนการใหแสงรอดผานรู </li></ul>
  17. 19. การทํางานของเลนส จะกลาวถึงการหักเหของแสง เมื่อเดินทางผานตัวกลางที่มีความทึบแสงตางกัน สําหรับแทงแกวใสที่มีผิวเปนสวนโคงกลม (spherical surface) ลําแสงขนานที่เดินทางในอากาศและตกกระทบ แทงแกวแล้วหักเหและมาพบกันที่จุดโฟกัส เราเรียกระยะหางที่ใกลที่สุดจากจุดนี้ไปยังผิวของแกววา ระยะโฟกัส
  18. 20. <ul><li>4. กลอง CCD </li></ul><ul><li> กลองถายรูปบันทึกภาพลงบนฟลม โดยอาศัยปฏิกิริยาเคมี ที่ทําใหเกิดการเปลี่ยนแปลงบนสวนของฟลมที่ไดรับแสง แตภาพที่บันทึกบนแผนฟลม นั้นไมสามารถที่นําไปประมวลผลดวยคอมพิวเตอรโดยตรงได </li></ul>
  19. 21. <ul><li> กลอง CCD (charged coupled device) ประกอบดวยสวนรับแสง และสวนบันทึกภาพ ซึ่งเปนวงจรรวมที่ประกอบไปดวยเซลลเล็กๆ เรียงอยูอยางมีระเบียบ โดยแตละเซลลจะมีความไวแสงและเปลี่ยนแสงที่มากระทบใหอยูในรูปของสัญญาณไฟฟาพรอมที่จะสงไปยังคอมพิวเตอรเพื่อประมวลผล </li></ul>
  20. 23. บทที่ 2 ทฤษฎีและงานวิจัยที่เกี่ยวข้อง
  21. 24. วิธีการที่ใช้ในการแยกข้อความออกจากรูปภาพ <ul><li>1. การรู้จำรูปแบบ (Pattern Recognition) </li></ul><ul><li>2. การทำ Convolution </li></ul><ul><li>3. การหา Poincare index </li></ul><ul><li>4. การทำ Sector </li></ul>
  22. 25. วิธีการที่ใช้ในการแยกข้อความออกจากรูปภาพ <ul><li>5. การทำ Normalization </li></ul><ul><li>6. การแยกส่วนประกอบ ( Decomposition) </li></ul><ul><li>7. คุณลักษณะเวคเตอร์ ( Feature Vector ) </li></ul><ul><li>8. การแยกประเภทลายนิ้วมือด้วยเครื่องตรวจ เวคเตอร์ ( Support Vector Machines ) </li></ul>
  23. 26. การรู้จำรูปแบบ ( Pattern Recognition ) <ul><li>ตัวอย่างของระบบการจดจำรูปแบบ </li></ul><ul><ul><li>สัญญาณเตือนภัยในบ้าน ที่ควบคุมด้วย remote control </li></ul></ul><ul><ul><li>ตัวอ่าน bar codes </li></ul></ul><ul><ul><li>ตัวอ่านแถบแม่เหล็กต่างๆที่อยู่บนบัตรเครดิต </li></ul></ul>
  24. 27. 1. การกำหนดรูปแบบของการรู้จำ <ul><li>เป้าหมายของการรู้จำคือ </li></ul><ul><ul><li>การที่เราสนใจในการแบ่งกลุ่มของ object เข้าไปใน categories หรือ class ซึ่ง object ที่เราสนใจนั้นโดยทั่วไปเรียกว่า Patterns ซึ่งอาจเป็นในรูปของ </li></ul></ul><ul><ul><ul><ul><li>- ตัวอักษร </li></ul></ul></ul></ul><ul><ul><ul><ul><li>- ตัวอักขระต่างๆ </li></ul></ul></ul></ul><ul><ul><ul><ul><li>- รูปแบบของคลื่นไฟฟ้า </li></ul></ul></ul></ul><ul><ul><ul><ul><li>- รูปแบบของสัญญาณต่างๆ </li></ul></ul></ul></ul>
  25. 28. ภาพแสดงขั้นตอนการดำเนินงานของรูปแบบการรู้จำ
  26. 29. ภาพแสดง observation vector สำหรับตัวอักษร
  27. 30. ภาพแสดงวิธีการเบื้องต้นสำหรับการรู้จำรูปแบบ
  28. 31. 2. การทำ convolution <ul><li>การทำ convolution ภาพที่มีขนาด MxN โดยใช้ kernel และฟังชั่นข้อมูลภาพ เขียนแทนด้วย I(x,y) สำหรับขั้นตอนในการทำจะนำ I(x,y) และหน้ากากขนาด 3x3 มาทำการซ้อนทับกับแฟ้มข้อมูลของภาพเอกสารโดยใช้ตำแน่งของหน้ากากคูณกับตำแหน่งเดียวกันของแฟ้มข้อมูล (convolution) </li></ul>
  29. 32. ลักษณะของหน้ากาก 3 x 3
  30. 33. วิธีการคำนวณตามสมการ 2.1 โดยที่ i เริ่มจาก 1 ถึง M-m+1 และ j เริ่มจาก 1 ถึง N-n +1
  31. 34. ภาพแสดง input และ kernal ที่ทำ Convlution
  32. 35. 3. การหา Poincar’e index <ul><li>การแบ่งภาพออกเป็นหน้าต่างของภาพทั้งหมด </li></ul><ul><li>การหาค่า Poincar’e index ของแต่ละหน้าต่าง </li></ul>
  33. 36. การแบ่งภาพออกเป็นหน้าต่างของภาพทั้งหมด <ul><li>ภาพมีขนาด M  N ทำ Orientation field ใช้สัญลักษณ์ โดยกำหนด มีขนาด N  N ลงบนภาพและในพื้นที่ จะถูกแบ่งเป็นหน้าต่างที่มีขนาด W  W </li></ul>
  34. 37. การหาค่า Poincare Index ของแต่ละหน้าต่าง <ul><li>นำหน้าต่างแต่ละอันหา หาค่า Poincar’e index ซึ่งในการหาแต่ละครั้งจะใช้พื้นที่ขนาด 3  3 ซึ่งเราจะใช้ตำแหน่งกลาง คือ ตำแหน่ง w( 2,2) เป็นตำแหน่งที่ใช้ค่าของข้อมูลภาพของตำแหน่งนี้หาค่าความแตกต่างกับค่าข้อมูลภาพของตำแหน่งที่อยู่ล้อมรอบตำแหน่งนี้ </li></ul>
  35. 38. สมการที่ใช้ในการคำนวณ if
  36. 39. 4. การทำ Sector <ul><li>เมื่อได้ core point แล้วจุดนี้เราเรียกว่า registeration point เป็นจุดแกนกลางและจะนำไปใช้ในการกำหนดระยะของบริเวณภาพที่เราต้องการใช้เท่านั้นซึ่งเป็นลักษณะการแพร่ออกจากจุด core point และอยู่ในลักษณะการแบ่ง sector </li></ul>
  37. 40. 4. การทำ Sector <ul><li>ซึ่งเรากำหนดให้จุดศูนย์กลางแทนด้วย และ แทนจุด ที่เป็นจุดภาพระดับเท่า ในภาพลายนิ้วมือขนาด M  N ซึ่งบริเวณที่เราสนใจก็จะถูกกำหนดในแบบของ sector โดยที่ sector ลำดับที่ i จะถูกคำนวณในเทอมของตัวแปร </li></ul>
  38. 41. 5. การทำ Normalization <ul><li>ก่อนที่เราจะทำการ decompose กับภาพลายนิ้วมือเราจะต้องทำ normalize ในแต่ละ sector โดยจะหาค่าคงที่เฉลี่ย ( mean ) และค่าแปรผัน ( variance) ของทุก sector เพื่อเข้าไปใช้ในสมการ (2.4 ) ซึ่งการทำ normalize คือ ทำการตัด noise ที่เป็นผลมาจากการตรวจจับ noise และจากการกดนิ้วมือที่แตกต่างกัน โดยให้ แทนค่าของจุดภาพ ที่จุด </li></ul>
  39. 42. <ul><li>ซึ่ง Mi และ Vi ได้จากการประมาณ mean และ variance ของ ตามลำดับ และ Ni(x,y) ได้จากการ normalize ค่า gray-level ที่จุด สำหรับจุดทั้งหมดใน จะทำการ normalize ภาพโดยมีนิยามดังสมการ (2.4) </li></ul>5. การทำ Normalization
  40. 43. สมการ 2.4
  41. 44. 6. การแยกส่วนประกอบ ( Decomposition ) <ul><li>วิธีการทำ Decomposition เป็นการทำภาพให้มีความละเอียดของโครงสร้างลายนิ้วมือ เพื่อเพิ่มความน่าเชื่อถือในการมองภาพ เพราะการทำงานในลักษณะนี้เป็นการหมุนภาพให้อยู่ในมุมต่างๆ เพื่อให้การมองลายเส้นและร่องของลายนิ้วมือในแต่ละมุมให้มีประสิทธิภาพเพิ่มมากขึ้น และตัวที่จะทำให้เรากรองเอา สัน และ ร่อง ต่างๆของลายนิ้วมือก็คือ Gabor Filter </li></ul>
  42. 45. 7. คุณลักษณะเวคเตอร์ ( Feature Vector) <ul><li>จากขั้นตอนของการทำ Decomposition เราจะได้ภาพทั้งหมด 4 ภาพด้วยกัน และในขั้นตอนนี้ จะนำภาพทั้ง 4 ภาพมาเปลี่ยนแปลงข้อมูลจุดภาพให้อยู่ในลักษณะของ เวคเตอร์ ( feature vector ) ดังสมการที่ 2.6 </li></ul>
  43. 46. สมการที่ 2.6 จากสมการ 2.6 ค่า เป็นค่าเฉลี่ย ของ sector และ ค่ามุมของภาพ sector นั้นๆ และ เป็นจำนวนของจุดทั้งหมดที่มีอยู่ใน Sector
  44. 47. <ul><li>8. การแยกประเภทลายนิ้วมือด้วยเครื่องตรวจเวคเตอร์ (Support Vector Machines) </li></ul>
  45. 48. ภาพแสดงการแบ่ง 2 คลาส Class 1 Class 2
  46. 49. สมการที่ใช้ในการคำนวณ <ul><li>สมการ 2.7 </li></ul><ul><li>สมการ2.8 </li></ul><ul><li>สมการ2.9 </li></ul>
  47. 50. ลักษณะการแยก 2 คลาสด้วย Support vector และ Hyperplane M  6 =1.4 Class 1 Class 2  1 =0.8  2 =0  3 =0  4 =0  5 =0  7 =0  8 =0.6  9 =0  10 =0 Support vector Optimal hyperplane W
  48. 51. การเปลี่ยนจาก non –linear เป็น linear <ul><li>1.Polynomial kernel with degree d </li></ul><ul><li>Radial basis function kernel with width s </li></ul><ul><li>Sigmoid with parameter k and q </li></ul>
  49. 52. ภาพแสดง ลักษณะการเปลี่ยนจาก non –linear เป็น linear  ) )  ( ) )  ( )  ( )  ( )  ( ) )  ( )  ( )  (.)  ( )  ( )  ( )  ( )  ( )  ( )   ( )  )
  50. 53. 1.3 การวิเคราะห  และประมวลผลภาพ <ul><li>การวิเคราะห  ประมวลผลภาพและการรับรู  จากภาพ เป  นศาสตร  ที่ครอบคลุมเนื้อหากว  างขวางและลึกซึ้งอย่างมาก เพื่อให  เกิดความเข  าใจถึงลักษณะของป  ญหาที่สามารถประยุกข  ใช  เทคนิคต  างๆ จากศาสตร  แขนงนี้ จะขอยกตัวอย  างการประมวลผลภาพแบบพื้นฐาน โดยจะขอกล่าวถึงการประมวลผลภาพไบนารี ( binary image ) ซึ่งเข  าใจได  ง  ายก  อน แล  วจึงจะกล  าวถึงการประมวลผลภาพเกรย  สเกล ( gray scale image ) ที่มีความซับซ  อนขึ้นเป  นลําดับต  อไป </li></ul>
  51. 54. 1.3.1 ภาพไบนารี <ul><li>คือ ภาพซึ่งในแต  ละพิกเซลจะมีความเข  มของแสงได  สองแบบเท  านั้น คือสว่างกับมืด โดยอาจเขียนแทนได  ด  วยเลข 0 และ 1 ด  วยความเข้มของแสงเพียงสองระดับ จึงทำให้มีข  อจํากัดที่จะนํามาใช  แสดงภาพทั่วๆ ไปแต  อย  างไรก็ตามการมีความเข  มของแสงเพียงสองระดับก็ทําให  การประมวลผลทําได  อย  างมีประสิทธิภาพ การประมวลผลภาพไบนารีนําไปใช  มากในการประมวลผลเอกสาร การประมวลผลภาพในอุตสาหกรรมที่ต  องการความเร็วสูง การมีความเข  มเพียงสองระดับในภาพไบนารี ทําให  สามารถที่จะเลือกพิจารณาให  ความเข  มระดับหนึ่งแทนภาพของสิ่งที่เราสนใจโดยเรียกว  า “ พิกเซลภาพ ” และความเข  มอีกระดับแทนพื้นหลังจะถูกเรียกว  า “ พิกเซลพื้นหลัง ” </li></ul>
  52. 55. ในทางปฏิบัติการพิจารณาภาพไบนารี เราจะไม  สนใจแต  ละพิกเซลแยกกันไป แต  เราจะสนใจกลุ  มของพิกเซลที่อยู  ติดกัน หรือที่เรียกว  า “ พิกเซลเพื่อนบ  าน ” เช  นกลุ่มของพิกเซลที่เรียงกันเป  นตัวอักษร ดังรูปที่ข้างล่าง
  53. 56. <ul><li>สําหรับ การตีความว  าพิกเซลใดอยู  ติดกันทําได  สองแบบหลักๆ คือ </li></ul><ul><li>1. แบบสี่เพื่อนบ  าน ( 4-connectedness ): จะถือว่าแต  ละพิกเซลอยู  ติดกับสี่พิกเซลที่อยู  ด  านบน , ล่าง , ซ  ายและขวา ในบางครั้งเราอาจใช  ชื่อทิศในการเรียกพิกเซลรอบๆ เช  นเรียกพิกเซล 2 ว  าพิกเซลเหนือของพิกเซล p เป  นต  น </li></ul><ul><li>2. แบบแปดเพื่อนบ  าน ( 8-connectedness ): จะถือว  าแต  ละพิกเซลอยู  ติดกับทั้งแปดพิกเซลที่อยู  ล  อมรอบ </li></ul>
  54. 57. <ul><li>นิยามของการอยู  ติดกันของพิกเซลทั้งสองแบบที่ กล  าวมาเป  นที่นิยมใช  ในการประมวลผลภาพไบนารี แต  มีสิ่งที่ต  องระลึกคือมีความไม  สอดคล  องบางประการกับเรขาคณิต กล  าวคือจากทฤษฎีเส  นโค  งของจอร  แดน ( Jordan’s curve theorem ) เส  นโค  งบนระนาบที่ลากเป  นวงป  ดจะแบ่งระนาบออกเป  นสองส  วนที่ไม  ติดกัน คือส  วนที่อยู  ภายในวงและส  วนที่อยู  นอกวง แต  สําหรับภาพไบนารีหากเราลองกําหนดให  ใช  นิยามการติดกันแบบแปดเพื่อนบ  านแล  วลองลากเส  นให  เป  นวงเช  นในรูปที่ 1.23 จะเห็นได  ว  าพิกเซลที่ประกอบเป  นเส  นที่ลากนี้ไม  ได  แบ  งพิกเซลที่เหลือให  เป  นสองส  วนที่ไม  ติดกันเลย ( สังเกตพิกเซล 1 กับ 2 ของพื้นหลังที่ถือว  าติดกัน ) ในลักษณะเดียวกันหากเราใช  การติดกันแบบสี่เพื่อนบ  านกับภาพไบนารีในรูปที่ 1.23 ภาพนี้ก็จะประกอบไปด  วยเส  นสี่เส  นที่ไม  ติดกันและไม  มีวงป  ดเกิดขึ้น แต  ว  ากลับทําให  พิกเซลที่เหลือ ( พิกเซลพื้นหลัง ) แยกกันเป  นสองกลุ  มที่ไม  ติดกัน </li></ul>
  55. 59. <ul><li>หากความไม  สอดคล  องนี้ไม  ทําให  เกิดป  ญหากับงานที่ทําก็ไม  เป็นไร แต  หากจําเป  นต  องแก  ไขให  สอดคล  อง วิธีแก  ป  ญหาวิธีหนึ่งก็คือการเปลี่ยนไปใช  พิกเซลที่เป  นรูปหกเหลี่ยมแทนพิกเซลสี่เหลี่ยม ( รูปที่ 1.24 ) และกําหนดให  พิกเซลที่มีขอบร  วมกันเป  นพิกเซลที่ติดกัน อีกวิธีที่ทําได  โดยยังคงรูปแบบพิกเซลสี่เหลี่ยมก็คือการพิจารณาการติดกันของพิกเซลพื้นหลังแบบสี่เพื่อนบ  าน แต  ใช  การติดกันแบบแปดเพื่อนบ  านสําหรับพิกเซลที่แทนภาพของสิ่งที่เราสนใจ </li></ul>
  56. 60. 1.3.1.1 การนับจํานวนกลุ  มของพิกเซลที่อยู  ติดกัน <ul><li>กลุ  มของพิกเซลที่อยู  ติดกัน กลุ  มของพิกเซลเหล  านี้อาจเป  นภาพของตัวอักษรในเอกสาร หรืออาจเป  นภาพของสิ่งที่เราสนใจอื่นๆ ก็ได  ข  อมูลที่เราต  องการทราบอยู  บ  อยๆ อย  างหนึ่งก็คือ จํานวนกลุ  มของพิกเซลที่อยู  ติดกัน เช  นจํานวนตัวอักษรในภาพเอกสาร การที่เราจะทราบจํานวนดังกล  าวได  เราต  องสามารถแยกพิกเซลออกเป  นกลุ  มๆ ที่ติดกัน เรานิยามกลุ่มของพิกเซลที่อยู  ติดกันในลักษณะคล  ายๆ กับนิยามของ connected component จากทฤษฎีกราฟ นั่นก็คือทุกๆ คู  ของพิกเซลในกลุ  มเดียวกันจะต  องมีเส  นทางเชื่อมที่ประกอบไปด  วยพิกเซลอื่นๆในกลุ  มที่เรียงต  อกัน โดยต  องไม  มีเส  นทางระหว  างคู  พิกเซลต  างกลุ  ม วิธีนับที่จะเสนอนี้ ทํางานโดยแจกหมายเลขกลุ  มให  กับแต  ละพิกเซล พิกเซลที่อยู  คนละกลุ่มจะได  หมายเลขต  างกัน ภาพไบนารีที่จะนํามาประมวลผล ถูกเก็บในแถวลําดับสองมิติ A [ 1 ... n ][ 1 ... m ] ที่มีขนาด n × m โดยพิกเซลภาพจะมีค่าเป  น -1 และพิกเซลพื้นหลังมีค  าเป  น 0 </li></ul>
  57. 61. 1.3.1.2 ตัวบอกลักษณะเชิงพื้นที่ <ul><li>เราสามารถบรรยายรูปร  างของกลุ  มพิกเซลที่อยู  ติดกันด  วยตัวบอกลักษณะเชิงพื้นที่ เราสามารถใช  ตัวบอกลักษณะเชิงพื้นที่นี้ช  วยในการตรวจสอบอย  างคร  าวๆ ว  าภาพที่ได  รับนั้นมีโอกาสเป็นภาพของวัตถุต้นแบบหรือไม  โดยการเปรียบเทียบตัวบอกลักษณะเชิงพื้นที่ของภาพที่ได  กับภาพของวัตถุต  นแบบ ทั้งนี้ภาพที่ต  องการตรวจสอบนั้นต  องถูกถ  ายในสภาวะเดียวกันกับภาพของวัตถุต  นแบบ นอกจากวิธีนี้เราก็อาจใช  ภาพต  นแบบในการเปรียบเทียบโดยตรงกับภาพที่ต  องการตรวจสอบโดยไม  ต  องคํานวณตัวบอกลักษณะก  อน เราเรียกวิธีนี้ว  าการจับคู  กับแม  แบบ ( template matching ) </li></ul>
  58. 62. การจับคู่กับแม่แบบ นําแม่แบบไปวางทาบกับภาพที่พิจารณาและทําการประมวลผลโดยใช  ค  าของพิกเซลของภาพและของแม  แบบที่อยู  ในตําแหน  งเดียวกัน
  59. 63. ภาพเกรย  สเกล - ภาพเกรย  สเกลก็สามารถให  ข  อมูลได  กว  างขวางลึกซึ้งกว  า - ภาพที่รับมาจากกล  องรับภาพอยู่ในแบบเกรย  สเกล - บอกรูปแบบของความเข  มของแสงในแต  ละพิกเซล
  60. 64. Thresholding - ฮิสโตแกรม คือกราฟที่แจกแจงจํานวนพิกเซลที่ความเข  มของแสงต  างๆ กัน - ค  าสําหรับแยกประเภทของพิกเซล - หาค  าเทรสโฮลนี้ได  ด  วยการพิจารณาฮิสโตแกรม ( histogram ) ของความเข  มของแสง
  61. 65. การมัวภาพ ( image blurring ) - การลดผลกระทบของสัญญาณรบกวนในภาพ - การแทนค  าความเข  มของพิกเซล ด  วยค  าเฉลี่ยของมันกับค  าความเข  ม ของพิกเซลที่อยู  รอบๆ - นิยมเรียกแม  แบบว  าหน  ากาก ( mask ) - เลื่อนหน  ากากไปเรื่อยๆ บนภาพที่จะมัวจากซ  ายไปขวาและจาก บนลงล  างทีละพิกเซล
  62. 66. speech recognition คือ การรู้จำเสียงพูดของคอมพิวเตอร์ ตัวอย่าง บริษัท ไนน์เนอร์ส จำกัด นำเสนอ Izpal Speech ใช้เสียงพูดเป็นคำสั่งให้โปรแกรมทำงานแทนการพิมพ์ด้วยมือหรือใช้เม้าส์
  63. 67. Wheelchair Controlled with Speech Recognition System ใช้ในการควบคุมรถเข็นคนพิการให้เคลื่อนที่ไปในทิศทางต่างๆ โดยกำหนดด้วยคำสั่ง 9 คำสั่ง ซึ่งจะเป็นคำสั่งที่ใช้เป็นสัญญาณอินพุตเข้าสู่ระบบ
  64. 68. องค์ประกอบหลักๆ ของระบบรู้จำเสียงพูด 1. การเตรียมสัญญาณขั้นต้น (Preprocessing) 2. การหาลักษณะสำคัญของเสียง ( Feature Extraction) 3. การรู้จำเสียงพูด ( Speech Recognition)
  65. 69. (Basic of Image Processing ) <ul><li>การประมวลผลรูปภาพ หรือที่ใคร ๆ อาจจะเรียกกว่ากันว่า Computer Vision </li></ul><ul><li>หนึ่งในศาสตร์ด้านปัญญาประดิษฐ์ (AI) ลองมาพิจารณารูปภาพ ในมุมมองของคอมพิวเตอร์กัน </li></ul>
  66. 70. 1. แนะนําภาพดิจิตอล <ul><li>รูปภาพที่เราเห็นกันอยู่ ไม่ว่าจะเป็นภาพที่ถ่ายโดยใช้กล้องธรรมดา หรือแบบดิจิตอล ถ้าเรามองกันในแบบของคอมพิวเตอร์แล้วล่ะก็ มันก็คือ จุดสีหลาย ๆ จุดที่นำมาเรียงต่อๆ กัน จนสามารถบอกได้ว่าเรียงกันเป็นรูปอะไร เนื้อหาของรูปภาพเป็นอย่างไร การมองเพื่อทำความเข้าใจรูปภาพหนึ่ง ๆ ไม่ว่าจะเป็นภาพถ่าย หรือภาพที่เป็นแบบดิจิตอลในคอมพิวเตอร์ก็ตาม ในมุมมองของมนุษย์กับรูปภาพ หรือมุมมองของคอมพิวเตอร์กับรูปภาพ เป็นคนละมุมกัน และแตกต่างกันอย่างสิ้นเชิง มนุษย์สามารถเข้าใจถึงเนื้อหาของภาพได้ว่าภาพที่ปรากฏนั้นให้ความพึงพอใจ ความน่าสนใจมากน้อยแค่ไหน และภาพนี้บอกอะไร สามารถสื่อถึงความรู้สึกอะไรบางอย่างได้หรือไม่ และอีกหลาย ๆ ความรู้สึกที่ได้จากการมองภาพ </li></ul>
  67. 71. 2. การแปลงภาพให้เป็นภาพเชิงดิจิตอล <ul><li>ภาพเป็นกระบวนการทางแสง (Optical Process) ซึ่งเกิดจากพลังงานคลื่นแม่เหล็กไฟฟ้า (Electromagnetic Spectrum) หลาย ๆ ช่วงความถี่ เช่น แสงธรรมดา รังสีเอ็กซ์แรย์ (X-Ray) รังสีอินฟาเรด (Infared) เป็นต้น และพลังงานเสียง เช่น อัลตราซาวนด์ (Ultrasound) ตกกระทบวัตถุแล้วสะท้อนกลับมาสู่ประสาทรับรู้ทางตาของมนุษย์ หรืออุปกรณ์ตรวจจับ เช่น เซนเซอร์ (Sensor) </li></ul>
  68. 72. <ul><li>ถ้าพูดกันในภาษาทางเทคนิคแล้ว ภาพดิจิตอลนั้นก็คือ ฟังก์ชั่น 2 มิติ หรือ f(x,y) ของค่าความเข้มของแสงโดยที่ x และ y คือ ค่าที่บอกถึงตำแหน่งในระบบพิกัดฉาก และค่าของฟังก์ชั่น ณ ตำแหน่ง ใดๆ จะเป็นสัดส่วนกับความสว่างของแสง ณ ตำแหน่งนั้น กระบวนการแปลงภาพให้เป็นภาพในเชิงดิจิตอลเราเรียกว่า Image Digitization มีกระบวนการ 3 ขั้นตอน คือ การบันทึกภาพ (Image Acquisition), การสุ่มเลือกจุดตำแหน่ง (Image Sampling) และ การประมาณค่าความเข้มของแสง (Image Quantization) </li></ul>
  69. 73. <ul><li>แต่เมื่อรูปภาพ ถูกนำมาทำเป็นภาพในคอมพิวเตอร์ มันจะรู้และเข้าใจภาพเป็นเพียงแค่เป็นจุดสีหลาย ๆ จุดที่เรียงต่อกันในความสัมพันธ์ระหว่างจุดภาพที่เหมาะสม ภาพดิจิตอลถึงแม้จะเก็บอยู่ในรูปของไฟล์ในดิสก์ของคอมพิวเตอร์เอง หรือแม้แต่เราจะนำเอาภาพสวย ๆ มาเป็นวอลเปเปอร์พื้นหลังของ Desktop ใน Windows ก็ตาม มันก็ไม่อาจจะรู้และเข้าใจถึงเนื้อหาของภาพที่ปรากฏนั้นได้ ยกเว้นมนุษย์ที่เป็นผู้ใช้คอมพิวเตอร์นั้น ๆ จะเป็นผู้เห็นภาพ ๆ นั้นจึงจะบอกได้ว่านี่คือภาพที่สวยหรือไม่สวย </li></ul>
  70. 74. 3. การบันทึกภาพ (Image Acquisition) <ul><li>ก่อนที่จะได้ภาพมา อันดับแรก เราจะต้องทำการถ่ายถาพเสียก่อน การถ่ายภาพ เป็น การแปลงภาพเชิงต่อเนื่อง (Continuous Image) แบบ </li></ul><ul><li>3 มิติ ให้เป็นภาพเชิงต่อเนื่อง 2 มิติ โดยใช้อุปกรณ์เชิงแสง (Optical Device) เช่น กล้องถ่ายรูป เพื่อแปลงภาพให้มาเป็นภาพบนฟีล์ม , รูปถ่ายบนกระดาษ หรือภาพบนจอคอมพิวเตอร์ โดยปกติแล้ว ภาพที่เรามองเห็นกันอยู่นั้น มีทั้งความกว้าง , ความสูง และความลึก ซึ่งเป็นแบบ 3 มิตินั่นเอง การถ่ายภาพด้วยกล้องจะทำให้เราได้ภาพมา แต่จะเป็นภาพที่มีแต่ความกว้าง และความสูงเท่านั้น ซึ่งเป็นภาพแบบ 2 มิติ เพราะเราไม่อาจจะถ่ายความลึกของสถานที่มาด้วยได้ </li></ul>
  71. 75. ในส่วนของการบันทึกภาพนี้ เป็นหน้าที่ของกลไกทางแสงในตัวกล้อง ที่จะทำหน้าที่รับภาพเข้ามา
  72. 76. 4. การสุ่มเลือกจุดตำแหน่ง (Image Sampling) <ul><li>เป็นการแปลงภาพ 2 มิติที่ได้ให้เป็นภาพเชิงดิจิตอล โดยการสุ่มเลือกทางจุดตำแหน่ง หรือ Spatially Sampling โดยสุ่มเลือกเฉพาะบางตำแหน่งในภาพ ซึ่งถ้าเราสุ่มเลือกมาละเอียดภาพที่ได้ก็จะมีความละเอียดสูง หน่วยของการสุ่มเลือกก็คือ จุด หรือ Pixel </li></ul>
  73. 77. <ul><li>เหตุผลของการทำ Image Sampling นั้นก็คือ ในการแสดงผลของจอภาพคอมพิวเตอร์นั้น หน่วยของความละเอียดในการแสดงผลนั้นเป็นจุด (Pixel) แต่ในโลกแห่งความเป็นจริง ภาพที่เรามองเห็นด้วยตา ไม่ใช่การเรียงกันของจุด แต่มันเป็นภาพเชิงต่อเนื่องคือ ไม่สามารถแยกลงไปเป็นทีละจุด ๆ ๆ ๆ ได้เลย เพราะฉะนั้น เมื่อภาพนั้นมาอยู่ในคอมพิวเตอร์ ภาพจะต้องถูกปรับให้อยู่ในหน้าจอที่ประกอบด้วยจุดสี เพราะฉะนั้น จึงจำเป็นที่จะต้องมีการสุ่มเลือกจุดตำแหน่ง หรือการทำ Image Sampling จากที่ได้กล่าวมานี้ ถ้าเราสุ่มเลือกจุดตำแหน่งถี่มากเท่าใด คุณภาพของภาพที่ได้ก็จะดีขึ้น ลองดูเมื่อขยายเท่า ๆ กัน ดังรูปต่อไปนี้ </li></ul>
  74. 78. <ul><li>ภาพที่ 1 สุ่มเลือกมา 128x128 จุด ภาพที่ 2 สุ่มเลือกมา 64x64 จุด ภาพที่ 3 สุ่มเลือกมา 32x32 จุด </li></ul>จะเห็นได้ว่า ภาพ ๆ เดียวกัน แต่เมื่อทำการสุ่มเลือกทางจุดมาไม่เท่ากัน ขยายออกมา คุณภาพของภาพที่ได้จึงต่างกัน
  75. 79. <ul><li>ในการสุ่มเลือกทางตำแหน่งนี้ ถ้าในระยะความกว้างและความสูงของภาพ เราสุ่มมาละเอียดมาก ๆ เช่น สุ่มมา 128 จุด คุณภาพของภาพก็จะดีขึ้น แต่ก็ต้องใช้เนื้อที่ในการเก็บข้อมูลภาพมากขึ้น และขนาดของภาพก็จะมากขึ้นด้วย </li></ul>
  76. 80. 5. การประมาณค่าความเข้มของแสง (ImageQuantization) <ul><li>เมื่อเราได้ภาพจากการ Sampling มาแล้ว </li></ul><ul><li>แต่ละจุดในภาพจะถูกแทนด้วยสี ภาพในโทนสีเทา หรือ Grayscale </li></ul><ul><li>จะประกอบไปด้วยสีดำ และ </li></ul><ul><li>ไล่เฉดสีจางลงไปจนถึงสีขาวดังรูป </li></ul>
  77. 81. สีดำ จะแทนด้วยค่าตัวเลข 255 สีขาวจะแทนด้วยค่าตัวเลขคือ 0 รวมทั้งสิ้น 256 ระดับสี (0-255) หรือ 2 กําลัง 8 โดยที่ 8 ก็คือ จำนวนบิตในหน่วยความจำที่ใช้ในการเก็บค่านี้หนึ่งค่า เพราะฉะนั้น สีดำ จะถูกแทนด้วยรหัสในเลขฐานสองคือ 00000000 และสีขาวก็จะถูกแทนด้วยรหัส 11111111 และสีที่อยู่ตรงกลางระหว่างสีดำกับสีขาวก็จะไล่ไปตามลำดับการนับของบิตในเลขฐานสองดังรูป
  78. 82. ถ้าภาพเป็นแบบโทนขาวดำ (Grayscale) แต่ละจุดภาพก็จะถูกแทนที่ด้วยตัวเลขที่บอกถึงค่าสีตั้งแต่ 0-255 ลองดูภาพต่อไปนี้ แต่ละจุด ๆ จะถูกแทนที่ด้วยตัวเลข ซึ่งตัวเลขเหล่านี้ก็อยู่ระหว่าง 0-255 คือตั้งแต่ 0,1,2,3,4,……. 255 เป็นโทนสีเทา แต่ถ้าเป็นภาพขาวดำล่ะก็จะมีอยู่ด้วยกันแค่ 2 สีคือ สีดำ แทนด้วยเลข 0 กับสีขาวแทนด้วยเลข 255 เพราะฉะนั้นถ้าเป็นภาพขาวดำหนึ่งจุดภาพจะใช้พื้นที่เก็บข้อมูลเพียง 1 บิตเท่านั้น แต่ถ้าเป็นภาพในโทนสีเทานั้น ใน 1 จุดภาพจะใช้พื้นที่ในการเก็บข้อมูล 8 บิต ที่เป็น 8 บิตก็เพราะว่าค่าระดับสีเมื่อเปลี่ยนเป็นเลขฐานสองแล้วจะได้ 8 บิต
  79. 83. <ul><li>ค่าระดับสี 0 ก็คือ 00000000 </li></ul><ul><li>ค่าระดับสี 1 ก็คือ 00000001 </li></ul><ul><li>ค่าระดับสี 2 ก็คือ 00000010 … … </li></ul><ul><li>ค่าระดับสี 256 ก็คือ 11111111 </li></ul><ul><li>เพราะฉะนั้นใน 1 จุดสี จะมีค่าใดค่าหนึ่งเท่านั้น จึงใช้พื้นที่ในการเก็บเพียง 8 บิต บางครั้งจะใช้การเขียนในแบบยกกำลังคือ </li></ul><ul><li>ภาพขาวดำ 2 ยกกําลัง 1 (1 ก็คือ 1 บิต ) </li></ul><ul><li>ภาพโทนสีเทา 2 ยกกําลัง 8 (8 ก็คือ 8 บิต ) </li></ul>
  80. 84. ระดับความเข้มของสีที่เรากำหนดให้กับภาพ ถ้าภาพ ๆ นั้นใช้ระดับสีน้อย เช่น 256 , 128 , 64 , 32 , 16 , 8 , 4 , 2 (1 บิต ) ผลที่ได้ก็คือการไล่สีของภาพนั้นจะไม่นวล เป็นรอยที่ไม่ค่อยน่าดูเท่าไหร่ ดังรูปต่อไปนี้
  81. 85. <ul><li>ในความเป็นจริงแล้ว ความละเอียดของภาพจะมีมากกว่านี้ และอัตราในการสุ่มภาพนั้น ถ้าเราไม่คำนึงถึงคุณภาพและรายละเอียดของภาพ แต่คำนึงถึงเนื้อหาของภาพ เราใช้อัตราน้อย ๆ ก็ได้ เช่น เราต้องการทราบแค่ว่ารูปนี้คือรูปอะไรเท่านั้น เพราะฉะนั้น เมื่อเราพูดถึงเนื้อหาของภาพแบบดิจิตอล ก็จะเกี่ยวข้องกับเรื่องของการมองเห็นของมนุษย์ด้วย เพราะภาพที่มีความละเอียดต่างกัน ดวงตาของมนุษย์อาจจะแยกแยะไม่ได้ หรือสนใจเพียงแค่เนื้อหา แต่ไม่สนใจในรายละเอียด ดังนั้นถ้ารูป ๆ นึง sampling มาแค่ 2 ยกกําลัง 1 เราดูออกมั้ยล่ะว่าเป็นรูปหน้าคน และเพียงพอมั้ยที่จะนําไปใช้งาน ข้อมูลเพียงแค่ 2 บิต คือ 0 กับ 1 ถ้าเพียงพอและครอบคลุม แต่ถ้าต้องการข้อมูลมากกว่านี้ เช่น ทําระบบ Detect หน้าคนที่จะต้องใช้ข้อมูลอื่น ๆ ด้วย เมื่อนั้นล่ะ จึงต้องการข้อมูลจุดที่มากกว่า </li></ul>

×