Unit6
- 2. 1.1 ความหมายของการค้นคืนสารสนเทศ ( Information Retrieval )
การสืบค้นข้อมูลหรือการค้นคืนสารสนเทศ คือ การกระทาใดๆ ที่ทาให้ได้คืนมา ซึ่ง
ซึ่งตัวเอกสารหรือสารสนเทศโดยมีกระบวนการค้นคืนสารสนเทศที่ค้นหาจากเมทา
ดาต้า ผ่านเครื่องมือสืบค้น ซึ่งผลของการดึงข้อมูลจะมีเนื้อหาที่เกี่ยวข้องกับคาค้าที่ใช้
ที่ใช้ในการสืบค้น โดยเอกสารหรือสารสนเทศในที่นี้ หมายความถึง สิ่งพิมพ์ต่างๆ ที่เป็น
ที่เป็นตัวอักษร สื่ออื่นๆ อย่าง วิดีโอ รูปภาพ เสียง และทุกสิ่งทุกอย่างที่มีการจัดเก็บไว้
1.พื้นฐานของการสืบค้น/ค้นคืนสารสนเทศ
- 3. กระบวนการค้นคืนสารสนเทศ เริ่มจากขั้นตอนที่ผู้ใช้ป้ อนคาสอบถาม(Query)ซึ่ง
คือข้อมูลหรือสารสนเทศที่ผู้ใช้ต้องกี่ค้นหาเข้าไปในระบบ ขั้นตอนต่อมา เมื่อระบบค้น
คืนสารสนเทศ( Information Retrieval ) รับคาสอบถามแล้วจะทาการค้นคืน
สารสนเทศจากเอกสาร ขั้นสุดท้ายระบบจะส่งผลลัพธ์ที่ได้เสนอเป็นสารสนเทศที่ถูกดึง
ออกมา ( Information Retrieval ) ซึ่งขึ้นกับความต้องการของผู้ใช้ โดยทั่วไปจะ
ไม่ได้มีเพียงรายการเดียว แต่จะมีหลายรายการ ซึ่งควรสอดคล้องสัมพันธ์( Retrieval )
กับสิ่งที่ผู้ใช้ต้องการค้นหา อย่างไรก็ตาม หากผลลัพธ์มีรายการ ควรมีการจัดอันดับ
(Rank) ตามความสอดคล้องมากน้อย โดยให้ข้อมูลที่ต้องการค้นหามากสุดอยู่ก่อน
ส่วนรายการที่มีความสอดคล้องน้อยอยู่หลัง
1.2 กระบวนการค้นคืนสารสนเทศ
- 5. ส่วนประกอบของระบบคืนค้นสารสนเทศแบ่งได้เป็น 3 ส่วน ดังนี้
1) ส่วนนาเข้าข้อมูล (Input)
เป็นส่วนของการป้ อนคาสอบถาม(Query) จากผู้ใช้ซึ่งคือ ข้อมูลหรือสารสนเทศที่ผู้ใช้
ต้องการค้นหา เช่น คาสาคัญ ชื่อเรื่อง หัวเรื่อง เป็นต้น ระบบค้นคืนสารสนเทศจะนา
สารสนเทศเหล่านี้ผ่านการประมวลผลแบบเชื่อโดยตรงกับระบบคอมพิวเตอร์ ซึ่งผู้ใช้จะมี
การโต้ตอบหรือปฏิสัมพันธ์กับระบบโดยตรง
1.3 ส่วนประกอบของการคืนค้นสารสนเทศ
- 6. 2) ส่วนประมวลผล(Processor)
เป็นส่วนของการประมวลผลได้แก่ การจัดโครงสร้างของสารสนเทศในรูปแบบที่เหมาะสม
เหมาะสม อันประกอบด้วย การสร้างแทนเอกสาร การแบ่งแยกกลุ่มของเอกสาร การจัดเก็บ
จัดเก็บสารสนเทศการดึงข้อมูลตามที่ผู้ใช้ต้องการ ระบบจะนาคาสอบถามไปเปรียบเทียบกับ
กับเอกสารที่มีอยู่ เพื่อดึงเอกสารที่ใกล้เคียงนาออกมาให้แก้ผู้ใช้
3) ส่วนแสดงผลลัพธ์ (Output)
เป็นส่วนที่นาผลลัพธ์ที่ได้จากระบบเป็นข้อความสั้นๆ เช่น ชื่อหนังสือ ชื่อผู้แต่ง หมายเลข
เอกสาร สานักพิมพ์ เป็นต้น ผู้ใช้สามารถพิจารณาจากข้อมูลต่างๆ กับสิ่งที่ต้องการ ผู้ใช้
สามารถป้ อนคาสอบถามใหม่เพื่อให้ได้เอกสารที่ตรงกับความต้องการมากที่สุด ผลลัพธ์ที่ได้จึง
ได้จึงขึ้นอยู่กับคาสอบถามของผู้ใช้
- 8. ระบบการค้นคืนสารสนเทศ มีขั้นตอนการทางานเพื่อให้ได้สารสนเทศที่เหมาะสม
และตรงกับความต้องการของผู้ใช้ ที่สาคัญ 5 ขั้นตอน ดังนี้
ขั้นตอนที่ 1 การทาความเข้าใจกับความต้องการสารสนเทศของผู้ใช้
เป็นขั้นตอนวิเคราะห์ความต้องการของผู้ใช้โดยทั่วไป ความต้องการสารสนเทศของผู้ใช้
สิ่งสาคัญ จึงต้องทาความเข้าใจกับความต้องการให้มากที่สุด ซึ่งจะทาให้การค้นหา
ดาเนินการไปในทิศทางที่ถูกต้อง
ขั้นตอนที่ 2 การคัดเลือกระบบค้นคืนสารสนเทศที่เหมาะสม
เป็นขั้นตอนการคัดเลือกระบบคืนค้นสารสนเทศที่จะใช้ในการคืนค้น ซึ่งมีอยู่มากมายทั้ง
ในรูปสื่อสิ่งพิมพ์ สื่อโสตทัศน์ และสื่อคอมพิวเตอร์ ซึ่งอาจพิจารณาจากเกณฑ์ต่างๆ เช่น
ขอบเขต ความทันสมัย ระยะเวลาที่ครอบคลุม เนื้อหาสาระของระเบียนข้อมูล วิธีการ
จัดทาศัพท์ดรรชนี และค่าใช้จ่าย
2. ขั้นตอนการสร้างระบบค้นคืนสารสนเทศ
- 9. ขั้นตอนที่ 3 การกาหนดความต้องการสารสนเทศในรูปแนวคิดและคาค้น
เป็นขั้นตอนการกาหนดคาค้นแทนแนวคิด ผู้ค้นควรคานึงถึงวิธีการจาทาศัพท์ดรรชนี ที่เป็นตัวแทน
ตัวแทนสาระเอกสารในระบบค้นคืนสารสนเทศที่จะใช้ ว่ามีการใช้ศัพท์ควบคุมหรือไม่ ไม่ว่าระบบ
ระบบดังกล่าวจะใช้วิธีการใดก็ตาม การกาหนดคาค้นแทนแนวคิดควรใช้วิธีการเดียวเพื่อให้ได้ผลที่ดี
ได้ผลที่ดี
ขั้นตอนที่ 4 การกาหนดกลยุทธ์การคืนค้น
กลยุทธ์การคืนค้นส่วนใหญ่อยู่ในรูปคาถามซึ่งประกอบด้วยคาค้นต่างๆ ที่มีความสัมพันธ์กัน
โดยทั่วไปการกาหนดกลยุทธ์จะขึ้นอยู่กับวิธีการทางานของระบบค้นคืนสารสนเทศที่ใช้และประเภท
ประเภทของความต้องการสารสนเทศของผู้ใช้
ขั้นตอนที่ 5 การดาเนินการค้นและทบทวนผลการคืนค้น
การดาเนินการค้นเป็นการป้ อนคาถามที่สร้างขึ้นเข้าสู่ระบบค้นคืนสารสนเทศ เพื่อจับคู่เปรียบเทียบ
เปรียบเทียบระหว่างศัพท์ดรรชนี ซึ่งเป็นตัวแทนสาระของเอกสารในระบบกับคาค้น ในข้อคาถามและ
คาถามและเป็นตัวแทนความต้องการของผู้ใช้ระบบพิจารณาแต่เอกสารว่า สอดคล้องกับเรื่องที่
ที่สอบถามหรือไม่
- 12. เทคนิคการค้นคืนโดยใช้หัวเรื่อง คือ การใช้หัวข้อ หรือวลีที่กาหนดขึ้นแทนหรือบ่งบอก
เนื้อหาที่สาคัญของสารสนเทศเพื่อใช้เป็นเครื่องชี้นาไปยังเนื้อหาที่แท้จริงของสารสนเทศ
หัวเรื่องที่ดีควรเป็นคาหรือกลุ่มคาที่สั้นกะทัดรัด และมีความหมายเฉพาะเจาะจง
ครอบคลุมเนื้อหาที่แท้จริงของสารสนเทศที่ต้องการค้นคืน หัวเรื่องแบ่งเป็น 2 ประเภท คือ
1) หัวเรื่องใหญ่ หมายถึง คาที่กาหมดขึ้นเพื่อระบุถึงเนื้อเรื่องของสารสนเทศโดยตรง
2) หัวเรื่องย่อย หมายถึง คาที่กาหมดขึ้นใช้ตามหลังหัวเรื่องใหญ่เพื่อกาหมดขอบเขตหรือ
ความหายของเรื่องให้เฉพาะเจาะจงลงไปโดยมีเครื่องหมาย – คั่น เพื่อระบุแง่มุมเฉพาะ
ด้านของเรื่อง รูปแบบการเขียน หัวเรื่องย่อยบางหัวเรื่องก็สามารถใช้เป็นหัวเรื่องใหญ่ได้
3.2 การใช้หัวเรื่อง (Subject heading)
- 15. 2) ตัวเชื่อม และ (AND) เป็นการเชื่อมคาค้นตั้งแต่สองคาขึ้นไป โดยผลการค้น
ต้องปรากฏคาทั้ง 2 ในรายการผลการค้นคืน
3) ตัวเขื่อม ไม่ (NOT) เป็นการเชื่อมคาค้นตั้งแต่ 2 คาขึ้นไป โดยที่ผลการค้น
คืนจะปรากฏคาเพียงคาเดียวเท่านั้น และไม่ต้องการให้ปรากฏคาหลังในรายการผล
การค้นคืน
- 18. 1) วารสารอิเล็กทรอนิกส์ (E-Journal) เป็นสื่อรูปแบบหนึ่งที่เผยแพร่เป็น
ฉบับต่อเนื่องมีกาหนดออกที่แน่นอนและเสนอข้อมูลข่าวสารที่ทันสมัย มีบริการฐานข้อมูล
วารสารอิเล็กทรอนิกส์ เพื่อการศึกษาค้นคว้าเชิงวิชาการทาให้เกิดประโยชน์ในการเรียน
การสอน
2)หนังสืออิเล็กทรอนิกส์ (E-Book) เป็นหนังสือที่สร้างขึ้นด้วยโปรแกรม
คอมพิวเตอร์ มีลักษณะเป็นเอกสารอิเล็กทรอนิกส์ ที่สามารถอ่านเอกสารผ่านทางหน้า
จอคอมพิวเตอร์หรืออุปกรณ์อิเล็กทรอนิกส์แบบพกพาอื่นๆได้ ทั้งในระบบออฟไลน์และ
ออนไลน์
- 19. 3) วิทยานิพนธ์อิเล็กทรอนิกส์ (E-Thesis) เป็นฐานข้อมูล วิทยานิพนธ์
งานวิจัยและบทความวารสาร ที่มหาวิทยาลัยหรือสถาบันการศึกษาจัดทาขึ้นเพื่อให้
บริการค้นหาวิทยานิพนธ์อิเล็กทรอนิกส์หรืองานวิจัยอิเล็กทรอนิกส์
4) ระบบโอแพ็ก (Online Public Access Catalog: OPAC) เป็นฐานข้อมูล
รายการทรัพยากรสารสนเทศของสถาบันบริการสารสนเทศผ่านทางอินเตอร์เน็ต ด้วย
โปรแกรมห้องสมุดอัตโนมัติ ซึ่งเป็นโปรแกรมสาเร็จรูปได้แก่ VTLS,WEB,OPAC เป็นต้น
หรือสถาบันอาจพัฒนาขึ้นเอง
- 20. 4) เวิลด์ไวด์เว็บ(World Wide Wed: WWW) เป็นฐานข้อมูลทั่วไปใน
อินเตอร์เน็ตที่บริการบนเครือข่ายอินเตอร์เน็ต ที่มีข้อมูลและสารสนเทศอยู่เป็นจานวนมาก
ซึ่งแบ่งเป็น 2 ประเภทใหญ่ๆ ได้แก่
- การค้นคืนข้อมูลโดยการจัดหมวดหมู่ (Wed Directory) เป็นการค้นคืน
โดยการเลือกจากรายชื่อที่ทางเว็บไซต์ได้รวบรวมและจัดหมวดหมู่เอาไว้แล้ว เว็บไซต์ที่มี
การค้นคืนแบบนี้ได้แก่ Sanook, Saimguru, Excite เป็นต้น
- การค้นคืนข้อมูลโดยใช้โปรแกรมค้นหา (Search Engine) เป็นการค้น
คืนข้อมูล หรือรายละเอียดบนอินเตอร์เน็ตจากคาสาคัญ (Keyword) ที่กาหนดโดยจะ
รวบรวมข้อมูลทั้งที่เป็นรายชื่อและรายละเอียดบนเครือข่ายโดยอัตโนมัติ เว็บไซต์ที่มีการ
ค้นคืนแบบนี้ได้แก่ Google, Yahoo, Altavista เป็นต้น
- 22. 4.3 การสืบค้นเสียงในอินเตอร์เน็ต
การค้นคืนเสียงสามารถค้นได้ด้วยคาค้น และค้นคืนเสียงจากเสียง อาจจะเป็น
เสียงพูด เสียงดนตรี หรือเสียงเพลง การค้นคืนเสียงด้วยคาค้นผู้ใช้สามารถค้นไฟล์เสียงโดยการ
โดยการใส่คาค้นเข้าไปในช่องค้นหา เหมือนกับการค้นข้อมูลทั่วไปในอินเตอร์เน็ต ส่วนการค้น
ค้นคืนเสียงด้วยเสียงนั้นผู้ใช้สามารถค้นเสียงได้ด้วยการคลิกปุ่มรูปไมโครโฟนแล้วพูดหรือ
บันทึกเสียงที่ต้องการค้นหาเข้าไป ระบบก็จะทาการค้นคืนเสียงที่ตรงหรือใกล้เคียงมากที่สุด
ที่สุด เว็บไซต์ที่ให้บริการค้นคืนเสียงในอินเตอร์เน็ต มีดังตารางต่อไปนี้
- 27. ในการวิจัยด้านประสิทธิภาพของการค้นคืนสารสนเทศ ถ้าจานวน B และ C เท่ากับ
0 หมายถึง ประสิทธิภาพสูงสุด แต่ในความเป็นจริง ถ้าพบว่าจานวน B และ C ยิ่งมีค่าต่า
เท่าใด แสดงว่าการค้นคืนนั้นยิ่งมีประสิทธิภาพ จากตารางสมารถคานวณอัตราการค้นคืน
และ อัตราความถูกต้องได้ดังนี้
ตัวอย่าง การวัดประสิทธิภาพของระบบการค้นคืนสารสนเทศ
ในการค้นคืนสารสนเทศ ได้สารสนเทศออกมาทั้งหมด 50 รายการ ซึ่งตรงกับความ
ต้องการ 30 รายการ แต่มีสารสนเทศที่ค้นคืนไม่ได้ แต่ตรงกับที่เราต้องการอีก 10
รายการ อยู่ในฐานข้อมูล ซึ่งมีสารสนเทศอยู่ทั้งหมด 500 รายการ จงคานวณหาอัตรา
การค้นคืน อัตราความถูกต้อง ของการค้นคืนสารสนเทศ