วันจันทร์ที่ 12 กันยายน พ.ศ. 2554

Search Engine

      เสิร์ชเอนจิน (search engine) คือ โปรแกรมที่ช่วยในการสืบค้นหาข้อมูล 
โดยเฉพาะข้อมูลบนอินเทอร์เน็ต โดยครอบคลุมทั้งข้อความ รูปภาพ
 ภาพเคลื่อนไหว เพลง ซอฟต์แวร์ แผนที่ ข้อมูลบุคคล กลุ่มข่าว และอื่น ๆ 
ซึ่งแตกต่างกันไปแล้วแต่โปรแกรมหรือผู้ให้บริการแต่ละราย
 เสิร์ชเอนจินส่วนใหญ่จะค้นหาข้อมูลจากคำสำคัญ (คีย์เวิร์ด) ที่ผู้ใช้ป้อนเข้าไป 
จากนั้นก็จะแสดงรายการผลลัพธ์ที่มันคิดว่าผู้ใช้น่าจะต้องการขึ้นมา 
ในปัจจุบัน เสิร์ชเอนจินบางตัว เช่น กูเกิล จะบันทึกประวัติการค้นหาและการเลือกผลลัพธ์ของผู้ใช้ไว้ด้วย 
และจะนำประวัติที่บันทึกไว้นั้น มาช่วยกรองผลลัพธ์ในการค้นหาครั้งต่อ ๆ ไป



ประเภทของ Search Engine
       ประเภทที่ 1 Crawler Based Search Engines  คือ เครื่องมือการค้นหาบนอินเตอร์เน็ตแบบอาศัยการบันทึกข้อมูล และ จัดเก็บข้อมูลเป็นหลัก ซึ่งจะเป็นจำพวก Search Engine ที่ได้รับความนิยมสูงสุด เนื่องจากให้ผลการค้นหาแม่นยำที่สุด และการประมวลผลการค้นหาสามารถทำได้อย่างรวดเร็ว จึงทำให้มีบทบาทในการค้นหาข้อมูลมากที่สุดในปัจจุบัน
โดยมีองประกอบหลักเพียง ส่วนด้วยกันคือ
  1. ฐานข้อมูล โดยส่วนใหญ่แล้ว Crawler Based Search Engine เหล่านี้จะมีฐานข้อมูลเป็นของตัวเอง ที่มีระบบการประมวลผล และ การจัดอันดับที่เฉพาะ เป็นเอกลักษณ์ของตนเองอย่างมาก
  2.
 ซอฟแวร์ คือเครื่องมือหลักสำคัญที่สุดอีกส่วนหนึ่งสำหรับ Serch Engine ประเภทนี้ เนื่องจากต้องอาศัยโปรแกรมเล็ก ๆ (ชนิดที่เรียกว่า จิ๋วแต่แจ๋ว) ทำหน้าที่ในการตรวจหา และ ทำการจัดเก็บข้อมูล หน้าเพจ หรือ เว็บไซต์ต่าง ๆ ในรูปแบบของการทำสำเนาข้อมูล เหมือนกับต้นฉบับทุกอย่าง ซึ่งเราจะรู้จักกันในนาม Spider หรือ Web Crawler หรือ Search Engine Robots ตัวอย่างหนึ่งของ Crawler Based Search Engine ชื่อดัง http://www.google.com


       ประเภทที่ 2 Web Directory หรือ Blog Directory  คือ สารบัญเว็บไซต์ที่ให้คุณสามารถค้นหาข่าวสารข้อมูล ด้วยหมวดหมู่ข่าวสารข้อมูลที่เกี่ยวข้องกัน ในปริมาณมาก ๆ คล้าย ๆ กับสมุดหน้าเหลืองครับ ซึ่งจะมีการสร้าง ดรรชนี มีการระบุหมวดหมู่ อย่างชัดเจน ซึ่งจะช่วยให้การค้นหาข้อมูลต่าง ๆ ตามหมวดหมู่นั้น ๆ ได้รับการเปรียบเทียบอ้างอิง เพื่อหาข้อเท็จจริงได้ ในขณะที่เราค้นหาข้อมูล เพราะว่าจะมีเว็บไซต์มากมาย หรือ Blog มากมายที่มีเนื้อหาคล้าย ๆ กันในหมวดหมู่เดียวกัน ให้เราเลือกที่จะหาข้อมูลได้ อย่างตรงประเด็นที่สุด (ลดระยะเวลาได้มากในการค้นหา) ซึ่งยกตัวอย่างดังนี้

   1. ODP หรือ Dmoz ที่หลายๆ คนรู้จัก ซึ่งเป็น Web Directory ที่ใหญ่ที่สุดในโลก Search Engine หลาย ๆ แห่งก็ใช้ข้อมูลจากที่แห่งนี้เกือบทั้งสิ้น เช่น Google, AOL, Yahoo, Netscape และอื่น ๆ อีกมากมาย ODP มีการบันทึกข้อมูลประมาณ 80 ภาษาทั่วโลก รวมถึงภาษาไทยด้วย (URL : http://www.dmoz.org )
   2. สารบัญเว็บไทย SANOOK ก็เป็น Web Directory ที่มีชื่อเสียงอีกเช่นกัน และเป็นที่รู้จักมากที่สุดในเมืองไทย (URL : http://webindex.sanook.com )
   3. Blog Directory อย่าง BlogFlux Directory ที่มีการเก็บข้อมูลเกี่ยวกับบล็อกมากมายตามหมวดหมู่ต่าง ๆ หรือ Blog Directory อื่น ๆ ที่สามารถหาได้จาก Make Many แห่งนี้

       ประเภทที่ 3 Meta Search Engine  คือ Search Engine ที่ใช้หลักการในการค้นหาโดยอาศัย Meta Tag ในภาษา HTML ซึ่งมีการประกาศชุดคำสั่งต่าง ๆ เป็นรูปแบบของ Tex Editor ด้วยภาษา HTML นั่นเองเช่น ชื่อผู้พัฒนา คำค้นหา เจ้าของเว็บ หรือ บล็อก คำอธิบายเว็บหรือบล็อกอย่างย่อ ผลการค้นหาของ Meta Search Engine นี้มักไม่แม่นยำอย่างที่คิด เนื่องจากบางครั้งผู้ให้บริการหรือ ผู้ออกแบบเว็บสามารถใส่อะไรเข้าไปก็ได้มากมายเพื่อให้เกิดการค้นหาและพบเว็บ หรือ บล็อกของตนเอง และ อีกประการหนึ่งก็คือ มีการอาศัย Search Engine Index Server หลายๆ แห่งมาประมวลผลรวมกัน จึงทำให้ผลการค้นหาข้อมูลต่าง ๆ ไม่เที่ยงตรงเท่าที่ควร 

การค้นหาข้อมูลด้วย Basic Search 
            Basic Search คือ เครื่องมือในการค้นหาว็บไซต์ ทำหน้าที่ในการให้บริการค้นหาข้อมูล (Search Engine) โดยเน้นเรื่องความสามารถในการค้นหาข้อมูลภาษาไทยบนอินเทอร์เน็ต  มีความสามารถเทียบเท่าเสิร์ชเอ็นจิ้นชื่อดังจากต่างประเทศ  โดยการค้นหาจะเป็นแบบค้นหาข้อมูลจากทุกคำของข้อมูลจริง (Full Text Search) ทั้งภาษาไทย และ ภาษาอังกฤษจากเว็บเพจจำนวนหลายแสนหน้า  มีการเก็บรวบรวมข้อมูลเว็บเพจที่เกี่ยวข้องกับประเทศไทยมาจัดทำดัชนี (index) โดยอัตโนมัติ ผสมกับการจัดแยกหมวดหมู่อย่างชัดเจน เพื่อให้ผู้ใช้งานสามารถเข้าถึงข้อมูลได้ง่ายและรวดเร็วมากที่สุด

            Super Search เป็นเครื่องมือค้นหาข้อมูลในอินเทอร์เน็ตอีกประเภทหนึ่ง เหมาะสำหรับผู้ที่คุ้นเคยกับ Basic Search อยู่แล้ว แต่ต้องการค้นหาข้อมูลให้ได้ผลลัพธ์ตรงความต้องการมากขึ้นกว่าที่จะสามารถทำได้ใน Basic Search ด้วยวิธีการสร้างเงื่อนไขการค้นหาขึ้น ซึ่งจะได้ผลลัพธ์ที่น่าพอใจกว่าใน Basic Search ในขณะเดียวกันการค้นหาแบบ Super Search ก็จะมีความซับซ้อนในการใช้งานด้วยเช่นกัน

เงื่อนไขที่ใช้ใน Super Search

     -การค้นหาโดยใช้เงื่อนไข "AND"
รูปแบบการใช้งาน : A and B โดย A , B เป็น คำหลัก (Keywords)
อธิบาย : เราใช้เงื่อนไข "and" ก็ต่อเมื่อ ต้องการให้ปรากฏคำหลัก A และ B ในหน้าเว็บเพจเดียวกัน หมายถึง การค้นหาคำหลักที่มีทั้ง A และ B
Example 1: พิมพ์ ไทย and จีน ลงในช่องข้อความแบบมีเงื่อนไข จะหมายถึง ค้นหาคำว่า ไทย และ จีน โดยผลลัพธ์จากการค้นหา จะปรากฏคำว่า "ไทย" และ "จีน" อยู่ในหน้าเว็บเพจเดียวกัน

   -การค้นหาโดยใช้เงื่อนไข "OR"
รูปแบบการใช้งาน : A or B 
อธิบาย : เราใช้เงื่อนไข "or" ก็ต่อเมื่อ ต้องการค้นหาคำหลัก A หรือ B โดยผลลัพธ์จากการค้นหาจะต้องปรากฏคำหลัก A หรือ B อย่างใดอย่างหนึ่ง หรือ ทั้งสองคำ
Example 2: พิมพ์ กีฬา or ดนตรี ลงในช่องข้อความแบบมีเงื่อนไข Super Search จะค้นหาข้อมูลที่ปรากฏคำว่า "กีฬา" หรือ "ดนตรี" ในหน้าเว็บเพจ

   -การค้นหาโดยใช้เงื่อนไข "NOT"
รูปแบบการใช้งาน : A not B 
อธิบาย : เราใช้เงื่อนไข "not" ก็ต่อเมื่อ ต้องการค้นหา A แต่ไม่ต้องการให้ปรากฏ B อยู่ในหน้าเว็บเพจ
Example 3: พิมพ์ กีฬา not ฟุตบอล จะหมายถึง การค้นหาเว็บเพจที่ปรากฏคำว่า "กีฬา" แต่ต้องไม่ปรากฏคำว่า"ฟุตบอล"

   -การค้นหาโดยใช้เงื่อนไข "NEAR"
รูปแบบการใช้งาน : A near B 
อธิบาย : หมายถึง เป็นการระบุให้ผลลัพธ์ของการค้นหาต้องปรากฏทั้ง A และ B และทั้งสองคำนี้จะต้องปรากฏอยู่ใกล้ๆกัน รูปแบบการค้นหาแบบนี้จะคล้ายกับการใช้เงื่อนไข "AND" แต่ต่างกันเพียง คำทั้งสองจะต้องปรากฏอยู่ห่างกันไม่เกิน 10 คำ ซึ่งเราจะเห็นว่าการใช้เงื่อนไข NEAR จะมีประสิทธิภาพที่ดีกว่าการใช้เงื่อนไข "AND" ในกรณีที่คำทั้งสองมีความเกี่ยวข้องกัน โดยคาดหวังว่าคำทั้งสองน่าจะปรากฏอยู่ใกล้เคียงกัน 
Example 4: พิมพ์ วัด near อยุธยา หมายถึง การค้นหาเว็บเพจที่มีทั้งคำว่า วัด และ อยุธยา อยู่ในหน้า เว็บเพจเดียวกัน และคำทั้งสองน่าจะปรากฏอยู่ใกล้เคียงกัน

   -การค้นหาโดยใช้เครื่องหมายวงเล็บ "(   )"
รูปแบบการใช้งาน : (A * B) โดย A และ B เป็นคำที่ต้องการค้นหา และ สัญญลักษณ์ * แทนเงื่อนไข and , or ,not และ near 
อธิบาย : การใช้เครื่องหมายวงเล็บคร่อมข้อความที่เป็นเงื่อนไข หมายถึง การเจาะจงให้ประมวลผลข้อความที่อยู่ภายในวงเล็บก่อน
Example 5: พิมพ์ (การเมือง or เศรษฐกิจ) near รัฐสภา หมายถึง การสั่งให้ค้นหาหน้าเอกสารเว็บเพจที่ปรากฏคำว่า "การเมือง" หรือ "เศรษฐกิจ" และ จะต้องปรากฏอยู่ใกล้เคียงกับคำว่า "รัฐสภา" ด้วย

ไม่มีความคิดเห็น:

แสดงความคิดเห็น