More Related Content
Similar to Search Engine (20)
Search Engine
- 1. Search Engine คืออะไร
กลับมาพูดถึงกันอีกครั้งกับ Search Engine?คืออะไร?อัน
ที่จริงแล้วนี่ ผมตั้งใจจะเขียนเรื่องนี้มานานมากแล้ว แต่ว่าข้อมูลไม่
เพียงพอก็เลยไม่ได้ออนไลน์ให้กับหลาย ๆ ท่านได้อ่านกันหนะครับ
วันนี้ได้โอกาส ก็เลยจะมานั่งหาข้อมูลและเขียนให้จบไปสักตอน
ก่อนก็ยังดีเพื่อเป็นการเจาะลึกเนื้อหาและข้อมูลเกี่ยวกับ “Search
Engine คืออะไร” และรายละเอียดต่าง ๆ ของ Search Engine
เพื่อเป็นข้อมูลให้หลาย ๆ ท่านทียังไม่ทราบ หรือ กำาลังหาข้อมูลจะ
่
ได้นำาไปใช้ให้เกิดประโยชน์ ผมก็เลยได้พยายามรวบรวมข้อมูลต่าง
ๆ จากหลายแห่ง เพื่อจะนำามาเขียนบทความชุดนี้
Search Engine คืออะไร ?
Search Engine คือ เครื่องมือการค้นหาข้อมูลผ่านอินเตอร์เน็ต
ทีทุกคนสามารถเข้าไปค้นหาข้อมูลผ่านอินเตอร์เน็ตก็ได้ โดย
่
กรอก ข้อมูลที่ต้องการค้นหา หรือ Keyword (คีเวิร์ด) เข้าไปที่ช่อง
Search Box แล้วกด Enter แค่นี้ข้อมูลที่เราค้นหาก็จะถูก
แสดงออกมาอย่างมากมายก่ายกอง เพื่อให้เราเลือกข้อมูลที่เรา
โดนใจที่สุดเอามาใช้ งาน โดยลักษณะการแสดงผลของ Search
Engine นั้นจะทำาการแสดงผลแบบ เรียงอันดับ Search Results
ผ่านหน้าจอคอมพิวเตอร์ของเรา
Search Engine มีกี่ประเภท ?
Search Engine มี?3?ประเภท (ในวันทีทำาการศึกษา
่
ข้อมูลนี้และได้ทำาการรวบรวมข้อมูล ผมสรุปได้?3 ประเภทหลัก)
โดยมีหลักการทำางานที่ต่างกัน และ การจัดอันดับการค้นหาข้อมูลก็
ต่างกันด้วยครับ เพราะมีลักษณะการทำางานที่ต่างกันนี่เองทำาให้
- 2. โดยทัว ๆ ไปแล้วจะมีการแบ่งออกเป็นหลาย ๆ ประเภทด้วยกัน แต่
่
ที่พอสรุปได้ก็มีเพียง?3 ประเภทหลัก ๆ ดังที่จะนำาเสนอต่อไปนี้ครับ
ประเภทที่ 1 Crawler Based Search Engines
Crawler Based Search Engines คือ เครื่องมือ
การค้นหาบนอินเตอร์เน็ตแบบอาศัยการบันทึกข้อมูล และ จัดเก็บ
ข้อมูลเป็นหลัก ซึ่งจะเป็นจำาพวก Search Engine ที่ได้รบความ
ั
นิยมสูงสุด เนื่องจากให้ผลการค้นหาแม่นยำาที่สุด และการประมวล
ผลการค้นหาสามารถทำาได้อย่างรวดเร็ว จึงทำาให้มีบทบาทในการ
ค้นหาข้อมูลมากที่สุดในปัจจุบัน
โดยมีองประกอบหลักเพียง 2 ส่วนด้วยกันคือ
1. ฐานข้อมูล โดยส่วนใหญ่แล้ว Crawler Based Search
Engine เหล่านี้จะมีฐานข้อมูลเป็นของตัวเอง ทีมีระบบการประมวล
่
ผล และ การจัดอันดับที่เฉพาะ เป็นเอกลักษณ์ของตนเองอย่างมาก
2. ซอฟแวร์ คือเครื่องมือหลักสำาคัญที่สุดอีกส่วนหนึ่งสำาหรับ
Serch Engine ประเภทนี้ เนื่องจากต้องอาศัยโปรแกรมเล็ก ๆ (
ชนิดที่เรียกว่า จิ๋วแต่แจ๋ว) ทำาหน้าที่ในการตรวจหา และ ทำาการจัด
เก็บข้อมูล หน้าเพจ หรือ เว็บไซต์ต่าง ๆ ในรูปแบบของการทำา
สำาเนาข้อมูล เหมือนกับต้นฉบับทุกอย่าง ซึ่งเราจะรู้จักกันในนาม
Spider หรือ Web Crawler หรือ Search Engine Robots
ตัวอย่างหนึงของ Crawler Based Search Engine ชื่อดัง http://
่
www.google.com
Crawler Based Search Engine ได้แก่อะไรบ้าง
- 3. จะยกตัวอย่างคร่าว ๆ ให้ได้เห็นกันเอาแบบที่เรา ๆ ท่าน
ๆ รู้จักหนะครับก็ได้แก่? Google , Yahoo, MSN, Live,
Search, Technorati (สำาหรับ blog)?ครับ ส่วนลักษณะการ
ทำางาน และ การเก็บข้อมูงของ Web Crawler หรือ Robot หรือ
Spider นั้นแต่ละแห่งจะมีวิธีการเก็บข้อมูล และ การจัดอันดับ
ข้อมูลที่ต่างกันนะครับ เช่น คุณทำาการค้นหาคำาว่า “Search
Engine คืออะไร” ผ่านทั้ง 5 แห่งที่ผมให้ไว้จะได้ผลการค้นหาที่
ต่างกันครับ
ประเภทที่ 2 Web Directory หรือ Blog Directory
Web Directory หรือ Blog Directory คือ สารบัญ
เว็บไซต์ทให้คุณสามารถค้นหาข่าวสารข้อมูล ด้วยหมวดหมู่ข่าวสาร
ี่
ข้อมูลที่เกี่ยวข้องกัน ในปริมาณมาก ๆ คล้าย ๆ กับสมุดหน้าเหลือง
ครับ ซึ่งจะมีการสร้าง ดรรชนี มีการระบุหมวดหมู่ อย่างชัดเจน ซึ่ง
จะช่วยให้การค้นหาข้อมูลต่าง ๆ ตามหมวดหมู่นั้น ๆ ได้รับการ
เปรียบเทียบอ้างอิง เพื่อหาข้อเท็จจริงได้ ในขณะที่เราค้นหาข้อมูล
เพราะว่าจะมีเว็บไซต์มากมาย หรือ Blog มากมายที่มีเนื้อหาคล้าย
ๆ กันในหมวดหมู่เดียวกัน ให้เราเลือกที่จะหาข้อมูลได้ อย่างตรง
ประเด็นที่สุด (ลดระยะเวลาได้มากในการค้นหา) ซึ่งผมจะขอยก
ตัวอย่างดังนี้
- 4. ODP Web Directory ชื่อดังของโลก ที่มี Search Engine
มากมายใช้เป็นฐานข้อมูล Directory 1.? ODP หรือ Dmoz ที่
หลาย?ๆ คนรู้จัก ซึ่งเป็น Web Directory ทีใหญ่ที่สุดในโลก
่
Search Engine หลาย ๆ แห่งก็ใช้ข้อมูลจากทีแห่งนี้เกือบทั้งสิ้น
่
เช่น Google, AOL, Yahoo, Netscape และอื่น ๆ อีกมากมาย
ODP มีการบันทึกข้อมูลประมาณ 80 ภาษาทั่วโลก รวมถึงภาษา
ไทยเราด้วยครับ (URL : http://www.dmoz.org )
2. สารบัญเว็บไทย SANOOK ก็เป็น Web Directory ที่มีชื่อ
เสียงอีกเช่นกัน และเป็นทีรู้จักมากที่สุดในเมืองไทย (URL :
่
http://webindex.sanook.com )
3. Blog Directory อย่าง BlogFlux Directory ทีมีการเก็บข้อมูล
่
เกี่ยวกับบล็อกมากมายตามหมวดหมู่ต่าง ๆ หรือ Blog Directory
อื่น ๆ ที่สามารถหาได้จาก Make Many แห่งนี้ครับ
ประเภทที่ 3 Meta Search Engine
Meta Search Engine คือ Search Engine ทีใช้หลักการในการ
่
ค้นหาโดยอาศัย Meta Tag ในภาษา HTML ซึ่งมีการประกาศชุด
- 5. คำาสั่งต่าง ๆ เป็นรูปแบบของ Tex Editor ด้วยภาษา HTML นั่นเอง
เช่น ชื่อผู้พัฒนา คำาค้นหา เจ้าของเว็บ หรือ บล็อก คำาอธิบายเว็บ
หรือบล็อกอย่างย่อ
ผลการค้นหาของ Meta Search Engine นี้มักไม่แม่นยำาอย่างที่คิด
เนื่องจากบางครั้งผู้ให้บริการหรือ ผู้ออกแบบเว็บสามารถใส่อะไร
เข้าไปก็ได้มากมายเพื่อให้เกิดการค้นหาและพบเว็บ หรือ บล็อก
ของตนเอง และ อีกประการหนึ่งก็คือ มีการอาศัย Search Engine
Index Server หลาย?ๆ แห่งมาประมวลผลรวมกัน จึงทำาให้ผลการ
ค้นหาข้อมูลต่าง ๆ ไม่เที่ยงตรงเท่าที่ควร.
มาถึงตอนนี้หลาย ๆ ท่านที่เคยสงสัยว่า “Search Engine คือ
อะไร” คงได้หายสงสัยกันไปบ้างแล้วและเริ่มเข้าใจหลักการทำางาน
ของ Search Engine กันมากขึ้น เพื่อจะได้เลือกใช้อย่างถูกต้อง
และตรงกับความต้องการของเราในการค้นหาข่าวสารข้อมูล สำาหรับ
บทความ “Search Engine คืออะไร” นี้หากขาดตกบกพร่อง
ประการใด หรือ ไม่ได้รบข้อมูลที่ชัดเจนท่านสามารถติชม หรือ ให้
ั
ข้อเสนอแนะต่าง ๆ ผ่าน Comments ของบทความชุดนี้เพื่อจะได้
ทำาการปรับปรุงและแก้ไขให้ได้ข้อมูลที่ดีที่สุดและ เป็นประโยชน์
สำาหรับ ผูที่ทำาการค้นคว้างข้อมูลต่าง ๆ เพื่อนำาไปใช้งาน.
้
สิทธิศักดิ์? บุญมาก
เขียน 30-09-2006
ข้อมูลอ้างอิง
http://www.it-guides.com/lesson/search_engine_01.html
http://www.nectec.or.th/courseware/internet/web-
tech/0021.html
http://gotoknow.org/blog/bow
http://truehits.net/faq/f_stat.php
http://www.keng.com/?p=64
ขอขอบคุณเพื่อน ๆ ชาว SEO ใน http://www.seo.in.th
ทุกท่านที่ใด้ให้ความรู้ต่าง ๆ จนสามารถเขียนบทความนี้ได้
สำาเร็จลุลวงไปด้วยดี.
่
- 7. Basic Search คือ เครื่องมือในการค้นหาว็บไซต์ ทำา
หน้าที่ในการให้บริการค้นหาข้อมูล (Search Engine) โดยเน้น
เรื่องความสามารถในการค้นหาข้อมูลภาษาไทยบนอินเทอร์เน็ต มี
ความสามารถเทียบเท่าเสิร์ชเอ็นจิ้นชื่อดังจากต่างประเทศ โดยการ
ค้นหาจะเป็นแบบค้นหาข้อมูลจากทุกคำาของข้อมูลจริง (Full Text
Search) ทั้งภาษาไทย และ ภาษาอังกฤษจากเว็บเพจจำานวนหลาย
แสนหน้า มีการเก็บรวบรวมข้อมูลเว็บเพจที่เกี่ยวข้องกับ
ประเทศไทยมาจัดทำาดัชนี (index) โดยอัตโนมัติ ผสมกับการจัด
แยกหมวดหมูอย่างชัดเจน เพื่อให้ผู้ใช้งานสามารถเข้าถึงข้อมูลได้
่
ง่ายและรวดเร็วมากที่สุด
เว็ บ ไซต์ www.siamguru.com แบ่งการค้นหาเป็น 4
รูปแบบคือ
ค้ น หาเว็ บ ไซต์ (Basic Search) เหมาะสำาหรับผู้ที่ใช้อิน
เทอร์เน็ตทั่วๆ ไปที่ยังไม่มีความรู้มากนัก
ค้ น หาเว็ บ ไซต์ แ บบซู เ ปอรเสิ ร ์ ช (Super Search) เป็น
บริการสืบค้นข้อมูลแบบมีเงื่อนไข สำาหรับการค้นหาที่มีการ
เฉพาะเจาะจงมากยิ่งขึ้น
ค้ น หาเพลง (Music Search) บริการค้นหาเพลง , เนื้อ
ร้อง จากเว็บเพจต่างๆ โดยสามารถค้นหาได้จากชื่อเพลง ชื่อ
นักร้อง ชื่ออัลบั้ม หรือ คำาร้องจากท่อนใดท่อนหนึ่งก็ได้
ค้ น หารู ป ภาพ (Image Search) บริการค้นหา ภาพถ่าย
ภาพกราฟฟิก ภาพการ์ตูน
คำาแนะนำาในการใช้ Basic Search
• ช่ อ งค้ น หา เป็นช่องป้อนข้อความที่เป็นเงื่อนไข สำาหรับ
กำาหนดคำา/ข้อความที่เป็นเงื่อนไขในการค้นหา
• คำ า แนะนำ า พร้ อ มตั ว อย่ า งการใช้ ง าน เป็นข้อความที่อยู่
ภายใต้ช่องค้นหา เพื่อแนะนำาการใช้งาน Search Engine
อย่างง่าย พร้อมตัวอย่างการใช้งาน
• ปุ ่ ม "Go" ปุ่มสำาหรับสั่งให้ทำาการค้นหา
- 8. การค้นหาด้วย Super Search
Super Search เป็นเครื่องมือค้นหาข้อมูลใน
อินเทอร์เน็ตอีกประเภทหนึ่ง เหมาะสำาหรับผู้ที่คุ้นเคยกับ Basic
Search อยู่แล้ว แต่ตองการค้นหาข้อมูลให้ได้ผลลัพธ์ตรงความ
้
ต้องการมากขึ้นกว่าที่จะสามารถทำาได้ใน Basic Search ด้วยวิธี
การสร้างเงื่อนไขการค้นหาขึ้น ซึ่งจะได้ผลลัพธ์ที่น่าพอใจกว่าใน
Basic Search ในขณะเดียวกันการค้นหาแบบ Super Search
ก็จะมีความซับซ้อนในการใช้งานด้วยเช่นกัน
• ข้ อ ความแบบมี เ งื ่ อ นไข เป็นช่องสำาหรับกำาหนดข้อความที่
เป็นเงื่อนไขในการค้นหา
• เสี ย งคล้ า ย เป็นช่องระบุว่าต้องการคำาที่ออกเสียงคล้ายคลึง
กันได้
• คำ า แนะนำ า พร้ อ มตั ว อย่ า งการใช้ ง าน เป็นข้อความที่อยู่
ภายใต้ช่องค้นหา เพื่อแนะนำาการใช้งาน Search Engine
อย่างง่าย พร้อมตัวอย่างการใช้งาน
• ปุ ่ ม "Go" ปุ่มสำาหรับสั่งให้ทำาการค้นหา
เงื่อนไขที่ใช้ใน Super Search
การค้ น หาโดยใช้ เ งื ่ อ นไข "AND"
รู ป แบบการใช้ ง าน : A and B โดย A , B เป็น คำาหลัก
(Keywords)
อธิ บ าย : เราใช้เงื่อนไข "and" ก็ต่อเมื่อ ต้องการให้ปรากฏ
คำาหลัก A และ B ในหน้าเว็บเพจเดียวกัน หมายถึง การค้นหา
คำาหลักที่มีทั้ง A และ B
Example 1: พิมพ์ ไทย and จี น ลงในช่องข้อความแบบมี
เงื่อนไข จะหมายถึง ค้นหาคำาว่า ไทย และ จีน โดยผลลัพธ์
จากการค้นหา จะปรากฏคำาว่า "ไทย" และ "จีน" อยู่ในหน้า
เว็บเพจเดียวกัน
- 9. การค้ น หาโดยใช้ เ งื ่ อ นไข "OR"
รู ป แบบการใช้ ง าน : A or B
อธิ บ าย : เราใช้เงื่อนไข "or" ก็ต่อเมื่อ ต้องการค้นหาคำาหลัก
A หรือ B โดยผลลัพธ์จากการค้นหาจะต้องปรากฏคำาหลัก A
หรือ B อย่างใดอย่างหนึ่ง หรือ ทั้งสองคำา
Example 2: พิมพ์ กี ฬ า or ดนตรี ลงในช่องข้อความแบบ
มีเงื่อนไข Super Search จะค้นหาข้อมูลที่ปรากฏคำาว่า
"กีฬา" หรือ "ดนตรี" ในหน้าเว็บเพจ
การค้ น หาโดยใช้ เ งื ่ อ นไข "NOT"
รู ป แบบการใช้ ง าน : A not B
อธิ บ าย : เราใช้เงื่อนไข "not" ก็ต่อเมื่อ ต้องการค้นหา A แต่
ไม่ต้องการให้ปรากฏ B อยู่ในหน้าเว็บเพจ
Example 3: พิมพ์ กี ฬ า not ฟุ ต บอล จะหมายถึง การ
ค้นหาเว็บเพจที่ปรากฏคำาว่า "กีฬา" แต่ต้องไม่ปรากฏคำาว่า
"ฟุตบอล"
การค้ น หาโดยใช้ เ งื ่ อ นไข "NEAR"
รู ป แบบการใช้ ง าน : A near B
อธิ บ าย : หมายถึง เป็นการระบุให้ผลลัพธ์ของการค้นหาต้อง
ปรากฏทั้ง A และ B และทั้งสองคำานี้จะต้องปรากฏอยู่ใกล้ๆกัน
รูปแบบการค้นหาแบบนี้จะคล้ายกับการใช้เงื่อนไข "AND"
แต่ต่างกันเพียง คำาทั้งสองจะต้องปรากฏอยู่ห่างกันไม่เกิน 10
คำา ซึ่งเราจะเห็นว่าการใช้เงื่อนไข NEAR จะมีประสิทธิภาพที่
- 10. ดีกว่าการใช้เงื่อนไข "AND" ในกรณีที่คำาทั้งสองมีความ
เกี่ยวข้องกัน โดยคาดหวังว่าคำาทั้งสองน่าจะปรากฏอยู่ใกล้
เคียงกัน ยกตัวอย่างเช่น
เราค้นหา วั ด near อยุ ธ ยา ผลลัพธ์ทออกมาน่าจะได้
ี่
หน้าเว็บเพจที่คำาว่า "วัด" และ "อยุธยา" ที่ทั้งสองคำานี้น่าจะมี
ความเกี่ยวข้องกัน มากกว่า วัด and อยุธยา ที่ปรากฏคำาทั้ง
สองคำานี้ในหน้าเว็บเพจแต่อาจจะไม่เกี่ยวข้องกันเลยก็ได้
Example 4: พิมพ์ วั ด near อยุ ธ ยา หมายถึง การค้นหา
เว็บเพจที่มีทั้งคำาว่า วัด และ อยุธยา อยู่ในหน้า เว็บเพจ
เดียวกัน และคำาทั้งสองน่าจะปรากฏอยู่ใกล้เคียงกัน
การค้ น หาโดยใช้ เ ครื ่ อ งหมายวงเล็ บ "( )"
รู ป แบบการใช้ ง าน : (A * B) โดย A และ B เป็นคำาที่
ต้องการค้นหา และ สัญญลักษณ์ * แทนเงื่อนไข and , or
,not และ near
อธิ บ าย : การใช้เครื่องหมายวงเล็บคร่อมข้อความที่เป็น
เงื่อนไข หมายถึง การเจาะจงให้ประมวลผลข้อความที่อยู่
ภายในวงเล็บก่อน
Example 5: พิมพ์ (การเมื อ ง or เศรษฐกิ จ ) near
รั ฐ สภา หมายถึง การสั่งให้ค้นหาหน้าเอกสารเว็บเพจที่
ปรากฏคำาว่า "การเมือง" หรือ "เศรษฐกิจ" และ จะต้องปรากฏ
อยู่ใกล้เคียงกับคำาว่า "รัฐสภา" ด้วย