Docstoc

Search Engine _______

Document Sample
Search Engine _______ Powered By Docstoc
					Search Engine คืออะไร

By webmaster on September 30th, 2006




กลับมาพูดถึงกันอีกครั้งกับ Search Engine?คืออะไร?อันที่จริงแล้วนี่
ผมตั้งใจจะเขียนเรื่องนี้มานานมากแล้ว แต่ว่าข้อมูลไม่เพียงพอก็เลยไม่ได้ออนไลน์ให้กับหลาย ๆ
ท่านได้อ่านกันหนะครับ วันนี้ได้โอกาส ก็เลยจะมานั่งหาข้อมูลและเขียนให้จบไปสักตอนก่อนก็ยังดี

เพื่อเป็นการเจาะลึกเนื้อหาและข้อมูลเกี่ยวกับ “Search Engine คืออะไร” และรายละเอียดต่าง ๆ
ของ Search Engine เพื่อเป็นข้อมูลให้หลาย ๆ ท่านที่ยังไม่ทราบ หรือ
กําลังหาข้อมูลจะได้นําไปใช้ให้เกิดประโยชน์ ผมก็เลยได้พยายามรวบรวมข้อมูลต่าง ๆ
จากหลายแห่ง เพื่อจะนํามาเขียนบทความชุดนี้

Search Engine คืออะไร ?

Search Engine คือ เครื่องมือการค้นหาข้อมูลผ่านอินเตอร์เน็ต
ที่ทุกคนสามารถเข้าไปค้นหาข้อมูลผ่านอินเตอร์เน็ตก็ได้ โดย กรอก ข้อมูลที่ต้องการค้นหา หรือ
Keyword (คีเวิร์ด) เข้าไปที่ช่อง Search Box แล้วกด Enter
แค่นี้ข้อมูลที่เราค้นหาก็จะถูกแสดงออกมาอย่างมากมายก่ายกอง
เพื่อให้เราเลือกข้อมูลที่เราโดนใจที่สุดเอามาใช้ งาน โดยลักษณะการแสดงผลของ Search Engine
นั้นจะทําการแสดงผลแบบ เรียงอันดับ Search Results ผ่านหน้าจอคอมพิวเตอร์ของเรา
Search Engine มีกี่ประเภท ?

Search Engine มี?3?ประเภท (ในวันที่ทําการศึกษาข้อมูลนี้และได้ทําการรวบรวมข้อมูล
ผมสรุปได้?3 ประเภทหลัก) โดยมีหลักการทํางานที่ต่างกัน และ
การจัดอันดับการค้นหาข้อมูลก็ต่างกันด้วยครับ เพราะมีลักษณะการทํางานที่ต่างกันนี่เองทําให้
โดยทั่ว ๆ ไปแล้วจะมีการแบ่งออกเป็นหลาย ๆ ประเภทด้วยกัน แต่ที่พอสรุปได้ก็มีเพียง?3
ประเภทหลัก ๆ ดังที่จะนําเสนอต่อไปนี้ครับ

ประเภทที่ 1 Crawler Based Search Engines

Crawler Based Search Engines คือ
เครื่องมือการค้นหาบนอินเตอร์เน็ตแบบอาศัยการบันทึกข้อมูล และ จัดเก็บข้อมูลเป็นหลัก
ซึ่งจะเป็นจําพวก Search Engine ที่ได้รับความนิยมสูงสุด เนื่องจากให้ผลการค้นหาแม่นยําที่สุด
และการประมวลผลการค้นหาสามารถทําได้อย่างรวดเร็ว
จึงทําให้มีบทบาทในการค้นหาข้อมูลมากที่สุดในปัจจุบัน

โดยมีองประกอบหลักเพียง 2 ส่วนด้วยกันคือ
1. ฐานข้อมูล โดยส่วนใหญ่แล้ว Crawler Based Search Engine
เหล่านี้จะมีฐานข้อมูลเป็นของตัวเอง ที่มีระบบการประมวลผล และ การจัดอันดับที่เฉพาะ
เป็นเอกลักษณ์ของตนเองอย่างมาก
2. ซอฟแวร์ คือเครื่องมือหลักสําคัญที่สุดอีกส่วนหนึ่งสําหรับ Serch Engine ประเภทนี้
เนื่องจากต้องอาศัยโปรแกรมเล็ก ๆ (ชนิดที่เรียกว่า จิ๋วแต่แจ๋ว ) ทําหน้าที่ในการตรวจหา และ
ทําการจัดเก็บข้อมูล หน้าเพจ หรือ เว็บไซต์ต่าง ๆ ในรูปแบบของการทําสําเนาข้อมูล
เหมือนกับต้นฉบับทุกอย่าง ซึ่งเราจะรู้จักกันในนาม Spider หรือ Web Crawler หรือ Search
Engine Robots
ตัวอย่างหนึ่งของ Crawler Based Search Engine ชื่อดัง http://www.google.com
Crawler Based Search Engine ได้แก่อะไรบ้าง

จะยกตัวอย่างคร่าว ๆ ให้ได้เห็นกันเอาแบบที่เรา ๆ ท่าน ๆ รู้จักหนะครับก็ได้แก่ ? Google , Yahoo,
MSN, Live, Search, Technorati (สาหรับ blog)?ครับ ส่วนลักษณะการทํางาน และ
การเก็บข้อมูงของ Web Crawler หรือ Robot หรือ Spider นั้นแต่ละแห่งจะมีวิธีการเก็บข้อมูล และ
การจัดอันดับข้อมูลที่ต่างกันนะครับ เช่น คุณทําการค้นหาคําว่า “Search Engine คืออะไร”
ผ่านทั้ง 5 แห่งที่ผมให้ไว้จะได้ผลการค้นหาที่ต่างกันครับ

ประเภทที่ 2 Web Directory หรือ Blog Directory

Web Directory หรือ Blog Directory คือ สารบัญเว็บไซต์ที่ให้คุณสามารถค้นหาข่าวสารข้อมูล
ด้วยหมวดหมู่ข่าวสารข้อมูลที่เกี่ยวข้องกัน ในปริมาณมาก ๆ คล้าย ๆ กับสมุดหน้าเหลืองครับ
ซึ่งจะมีการสร้าง ดรรชนี มีการระบุหมวดหมู่ อย่างชัดเจน ซึ่งจะช่วยให้การค้นหาข้อมูลต่าง ๆ
ตามหมวดหมู่นั้น ๆ ได้รับการเปรียบเทียบอ้างอิง เพื่อหาข้อเท็จจริงได้ ในขณะที่เราค้นหาข้อมูล
เพราะว่าจะมีเว็บไซต์มากมาย หรือ Blog มากมายที่มีเนื้อหาคล้าย ๆ กันในหมวดหมู่เดียวกัน
ให้เราเลือกที่จะหาข้อมูลได้ อย่างตรงประเด็นที่สุด (ลดระยะเวลาได้มากในการค้นหา)
ซึ่งผมจะขอยกตัวอย่างดังนี้
ODP Web Directory ชื่อดังของโลก ที่มี Search Engine มากมายใช้เป็นฐานข้อมูล Directory 1.?
ODP หรือ Dmoz ที่หลาย?ๆ คนรู้จัก ซึ่งเป็น Web Directory ที่ใหญ่ที่สุดในโลก Search Engine
หลาย ๆ แห่งก็ใช้ข้อมูลจากที่แห่งนี้เกือบทั้งสิ้น เช่น Google, AOL, Yahoo, Netscape และอื่น ๆ
อีกมากมาย ODP มีการบันทึกข้อมูลประมาณ 80 ภาษาทั่วโลก รวมถึงภาษาไทยเราด้วยครับ
(URL : http://www.dmoz.org )

2. สารบัญเว็บไทย SANOOK ก็เป็น Web Directory ที่มีชื่อเสียงอีกเช่นกัน
และเป็นที่รู้จักมากที่สุดในเมืองไทย (URL : http://webindex.sanook.com )

3. Blog Directory อย่าง BlogFlux Directory
ที่มีการเก็บข้อมูลเกี่ยวกับบล็อกมากมายตามหมวดหมู่ต่าง ๆ หรือ Blog Directory อื่น ๆ
ที่สามารถหาได้จาก Make Many แห่งนี้ครับ

ประเภทที่ 3 Meta Search Engine

Meta Search Engine คือ Search Engine ที่ใช้หลักการในการค้นหาโดยอาศัย Meta Tag ในภาษา
HTML ซึ่งมีการประกาศชุดคําสั่งต่าง ๆ เป็นรูปแบบของ Tex Editor ด้วยภาษา HTML นั่นเองเช่น
ชื่อผู้พัฒนา คําค้นหา เจ้าของเว็บ หรือ บล็อก คําอธิบายเว็บหรือบล็อกอย่างย่อ
ผลการค้นหาของ Meta Search Engine นี้มักไม่แม่นยําอย่างที่คิด เนื่องจากบางครั้งผู้ให้บริการหรือ
ผู้ออกแบบเว็บสามารถใส่อะไรเข้าไปก็ได้มากมายเพื่อให้เกิดการค้นหาและพบเว็บ หรือ
บล็อกของตนเอง และ อีกประการหนึ่งก็คือ มีการอาศัย Search Engine Index Server หลาย?ๆ
แห่งมาประมวลผลรวมกัน จึงทําให้ผลการค้นหาข้อมูลต่าง ๆ ไม่เที่ยงตรงเท่าที่ควร.

มาถึงตอนนี้หลาย ๆ ท่านที่เคยสงสัยว่า “Search Engine คืออะไร”
คงได้หายสงสัยกันไปบ้างแล้วและเริ่มเข้าใจหลักการทํางานของ Search Engine กันมากขึ้น
เพื่อจะได้เลือกใช้อย่างถูกต้องและตรงกับความต้องการของเราในการค้นหาข่าวสารข้อมูล
สําหรับบทความ “Search Engine คืออะไร” นี้หากขาดตกบกพร่องประการใด หรือ
ไม่ได้รับข้อมูลที่ชัดเจนท่านสามารถติชม หรือ ให้ข้อเสนอแนะต่าง ๆ ผ่าน Comments
ของบทความชุดนี้เพื่อจะได้ทําการปรับปรุงและแก้ไขให้ได้ข้อมูลที่ดีที่สุดและ เป็นประโยชน์สําหรับ
ผู้ที่ทําการค้นคว้างข้อมูลต่าง ๆ เพื่อนําไปใช้งาน.

สิทธิศักดิ์? บุญมาก
เขียน 30-09-2006

ข้อมูลอ้างอิง
http://www.it-guides.com/lesson/search_engine_01.html
http://www.nectec.or.th/courseware/internet/web-tech/0021.html
http://gotoknow.org/blog/bow
http://truehits.net/faq/f_stat.php
http://www.keng.com/?p=64

ขอขอบคุณเพื่อน ๆ ชาว SEO ใน http://www.seo.in.th ทุกท่านที่ใด้ให้ความรู้ต่าง ๆ
จนสามารถเขียนบทความนี้ได้สาเร็จลุล่วงไปด้วยดี.
      การค้นหาข้อมูลด้วยเว็บไซต์ค้นหานั้น เพื่อให้ขอบข่ายของการค้นหาแคบเข้า
สามารถค้นหาได้ง่ายและรวดเร็วขึ้น จะต้องใช้เว็บไซต์การค้นหาเข้าช่วย เช่น




การค้นหาข้อมูลด้วย Basic Search จากเว็บไซต์ www.siamguru.com

         Basic Search คือ เครื่องมือในการค้นหาว็บไซต์ ทําหน้าที่ในการให้บริการค้น หาข้อมูล
(Search Engine)
โดยเน้นเรื่องความสามารถในการค้นหาข้อมูลภาษาไทยบนอินเทอร์เน็ต มีความสามารถเทียบเท่าเ
สิร์ชเอ็นจิ้นชื่อดังจากต่างประเทศ โดยการค้นหาจะเป็นแบบค้นหาข้อมูลจากทุกคําของข้อมูลจริง
(Full Text Search) ทั้งภาษาไทย และ
ภาษาอังกฤษจากเว็บเพจจํานวนหลายแสนหน้า มีการเก็บรวบรวมข้อมูลเว็บเพจที่เกี่ยวข้องกับประเ
ทศไทยมาจัดทําดัชนี (index)
โดยอัตโนมัติ ผสมกับการจัดแยกหมวดหมู่อย่างชัดเจน เพื่อให้ผู้ใช้งานสามารถเข้าถึงข้อมูลได้ง่ายแ
ละรวดเร็วมากที่สุด
        เว็บไซต์ www.siamguru.com แบ่งการค้นหาเป็น 4 รูปแบบคือ

      ค้นหาเว็บไซต์ (Basic Search) เหมาะสําหรับผู้ที่ใช้อินเทอร์เน็ตทั่วๆ
       ไปที่ยังไม่มีความรู้มากนัก
      ค้นหาเว็บไซต์แบบซูเปอรเสิร์ช (Super Search) เป็นบริการสืบค้นข้อมูลแบบมีเงื่อนไข
       สําหรับการค้นหาที่มีการเฉพาะเจาะจงมากยิ่งขึ้น
      ค้นหาเพลง (Music Search) บริการค้นหาเพลง , เนื้อร้อง จากเว็บเพจต่างๆ
       โดยสามารถค้นหาได้จากชื่อเพลง ชื่อนักร้อง ชื่ออัลบั้ม หรือ คําร้องจากท่อนใดท่อนหนึ่งก็ได้
      ค้นหารูปภาพ (Image Search) บริการค้นหา ภาพถ่าย ภาพกราฟฟิก ภาพการ์ตูน




               คาแนะนาในการใช้ Basic Search



      ช่องค้นหา เป็นช่องป้อนข้อความที่เป็นเงื่อนไข
       สําหรับกําหนดคํา/ข้อความที่เป็นเงื่อนไขในการค้นหา
      คาแนะนาพร้อมตัวอย่างการใช้งาน เป็นข้อความที่อยู่ภายใต้ช่องค้นหา
       เพื่อแนะนําการใช้งาน Search Engine อย่างง่าย พร้อมตัวอย่างการใช้งาน
      ปุ่ม "Go" ปุ่มสําหรับสั่งให้ทําการค้นหา




การค้นหาด้วย Super Search
        Super Search เป็นเครื่องมือค้นหาข้อมูลในอินเทอร์เน็ตอีกประเภทหนึ่ง
เหมาะสําหรับผู้ที่คุ้นเคยกับ Basic Search อยู่แล้ว
แต่ต้องการค้นหาข้อมูลให้ได้ผลลัพธ์ตรงความต้องการมากขึ้นกว่าที่จะสามารถทําได้ใน Basic
Search ด้วยวิธีการสร้างเงื่อนไขการค้นหาขึ้น ซึ่งจะได้ผลลัพธ์ที่น่าพอใจกว่าใน Basic Search
ในขณะเดียวกันการค้นหาแบบ Super Search ก็จะมีความซับซ้อนในการใช้งานด้วยเช่นกัน


       ข้อความแบบมีเงื่อนไข เป็นช่องสําหรับกําหนดข้อความที่เป็นเงื่อนไขในการค้นหา
       เสียงคล้าย เป็นช่องระบุว่าต้องการคําที่ออกเสียงคล้ายคลึงกันได้
       คาแนะนาพร้อมตัวอย่างการใช้งาน เป็นข้อความที่อยู่ภายใต้ช่องค้นหา
        เพื่อแนะนําการใช้งาน Search Engine อย่างง่าย พร้อมตัวอย่างการใช้งาน
       ปุ่ม "Go" ปุ่มสําหรับสั่งให้ทําการค้นหา

เงื่อนไขที่ใช้ใน Super Search

       การค้นหาโดยใช้เงื่อนไข "AND"
        รูปแบบการใช้งาน : A and B โดย A , B เป็น คําหลัก (Keywords)
        อธิบาย : เราใช้เงื่อนไข "and" ก็ต่อเมื่อ ต้องการให้ปรากฏคําหลัก A และ B
        ในหน้าเว็บเพจเดียวกัน หมายถึง การค้นหาคําหลักที่มีทั้ง A และ B
        Example 1: พิมพ์ ไทย and จีน ลงในช่องข้อความแบบมีเงื่อนไข จะหมายถึง ค้นหาคําว่า
        ไทย และ จีน โดยผลลัพธ์จากการค้นหา จะปรากฏคําว่า "ไทย" และ "จีน"
        อยู่ในหน้าเว็บเพจเดียวกัน




       การค้นหาโดยใช้เงื่อนไข "OR"
        รูปแบบการใช้งาน : A or B
        อธิบาย : เราใช้เงื่อนไข "or" ก็ต่อเมื่อ ต้องการค้นหาคําหลัก A หรือ B
        โดยผลลัพธ์จากการค้นหาจะต้องปรากฏคําหลัก A หรือ B อย่างใดอย่างหนึ่ง หรือ
        ทั้งสองคํา
    Example 2: พิมพ์ กีฬา or ดนตรี ลงในช่องข้อความแบบมีเงื่อนไข Super Search
    จะค้นหาข้อมูลที่ปรากฏคําว่า "กีฬา" หรือ "ดนตรี" ในหน้าเว็บเพจ




   การค้นหาโดยใช้เงื่อนไข "NOT"
    รูปแบบการใช้งาน : A not B
    อธิบาย : เราใช้เงื่อนไข "not" ก็ต่อเมื่อ ต้องการค้นหา A แต่ไม่ต้องการให้ปรากฏ B
    อยู่ในหน้าเว็บเพจ
    Example 3: พิมพ์ กีฬา not ฟุตบอล จะหมายถึง การค้นหาเว็บเพจที่ปรากฏคําว่า "กีฬา"
    แต่ต้องไม่ปรากฏคําว่า "ฟุตบอล"




   การค้นหาโดยใช้เงื่อนไข "NEAR"
    รูปแบบการใช้งาน : A near B
    อธิบาย : หมายถึง เป็นการระบุให้ผลลัพธ์ของการค้นหาต้องปรากฏทั้ง A และ B
    และทั้งสองคํานี้จะต้องปรากฏอยู่ใกล้ๆกัน
    รูปแบบการค้นหาแบบนี้จะคล้ายกับการใช้ เงื่อนไข "AND" แต่ต่างกันเพียง
    คําทั้งสองจะต้องปรากฏอยู่ห่างกันไม่เกิน 10 คํา ซึ่งเราจะเห็นว่าการใช้เงื่อนไข NEAR
    จะมีประสิทธิภาพที่ดีกว่าการใช้เงื่อนไข "AND" ในกรณีที่คําทั้งสองมีความเกี่ยวข้องกัน
    โดยคาดหวังว่าคําทั้งสองน่าจะปรากฏอยู่ใกล้เคียงกัน ยกตัวอย่างเช่น
           เราค้นหา วัด near อยุธยา ผลลัพธ์ที่ออกมาน่าจะได้หน้าเว็บเพจที่คําว่า "วัด" และ
    "อยุธยา" ที่ทั้งสองคํานี้น่าจะมีความเกี่ยวข้องกัน มากกว่า วัด and อยุธยา
    ที่ปรากฏคําทั้งสองคํานี้ในหน้าเว็บเพจแต่อาจจะไม่เกี่ยวข้องกันเลยก็ได้
    Example 4: พิมพ์ วัด near อยุธยา หมายถึง การค้นหาเว็บเพจที่มีทั้งคําว่า วัด และ
    อยุธยา อยู่ในหน้า เว็บเพจเดียวกัน และคําทั้งสองน่าจะปรากฏอยู่ใกล้เคียงกัน




   การค้นหาโดยใช้เครื่องหมายวงเล็บ "( )"
    รูปแบบการใช้งาน : (A * B) โดย A และ B เป็นคําที่ต้องการค้นหา และ สัญญลักษณ์ *
    แทนเงื่อนไข and , or ,not และ near
    อธิบาย : การใช้เครื่องหมายวงเล็บคร่อมข้อความที่เป็นเงื่อนไข หมายถึง
    การเจาะจงให้ประมวลผลข้อความที่อยู่ภายในวงเล็บก่อ น
    Example 5: พิมพ์ (การเมือง or เศรษฐกิจ) near รัฐสภา หมายถึง
    การสั่งให้ค้นหาหน้าเอกสารเว็บเพจที่ปรากฏคําว่า "การเมือง" หรือ "เศรษฐกิจ" และ
    จะต้องปรากฏอยู่ใกล้เคียงกับคําว่า "รัฐสภา" ด้วย

				
DOCUMENT INFO