วิธีการทำงานของ Search

ลิซซี่ ฮาร์วีย์
ลิซซี่ ฮาร์วีย์

เครื่องมือค้นหาทำหน้าที่อะไร

เครื่องมือค้นหาคือบรรณารักษ์เวอร์ชันดิจิทัล โดยใช้ดัชนีที่ครอบคลุมเพื่อช่วยค้นหาข้อมูลที่ถูกต้อง การทำความเข้าใจพื้นฐานด้านการค้นหาจะช่วยเตรียมความพร้อมในการสร้างเนื้อหาให้ผู้ใช้ค้นพบได้

วิธีที่ Crawler ท่องเว็บ

การ Crawl ก็เหมือนกับการอ่านหนังสือทุกเล่มในห้องสมุด ก่อนที่เครื่องมือค้นหาจะนำผลการค้นหาใดๆ มาได้ เครื่องมือค้นหาจะต้องมีข้อมูลจากเว็บมากที่สุดเท่าที่จะเป็นไปได้ ในการดำเนินการนี้ เครื่องมือค้นหาจะใช้ Crawler ซึ่งเป็นโปรแกรมที่เดินทางจากเว็บไซต์หนึ่งไปยังอีกเว็บไซต์หนึ่ง และทำหน้าที่เหมือนเบราว์เซอร์

หากหนังสือหรือเอกสารหายไปหรือเสียหาย Crawler จะอ่านไม่ได้ โปรแกรมรวบรวมข้อมูลจะพยายามดึงข้อมูล URL แต่ละรายการเพื่อระบุสถานะของเอกสาร ถ้าเอกสารส่งคืนรหัสสถานะข้อผิดพลาด โปรแกรมรวบรวมข้อมูลจะใช้เนื้อหาใดๆ ของเอกสารไม่ได้ และอาจลองใช้ URL อีกครั้งในภายหลัง วิธีนี้ทำให้มั่นใจได้ว่าจะมีเฉพาะเอกสารที่เข้าถึงได้แบบสาธารณะ ในดัชนี

หากโปรแกรมรวบรวมข้อมูลพบรหัสสถานะการเปลี่ยนเส้นทาง (เช่น 301 หรือ 302) โปรแกรมรวบรวมข้อมูลจะติดตามการเปลี่ยนเส้นทางไปยัง URL ใหม่และต่อไปยัง URL ดังกล่าว เมื่อได้รับการตอบกลับสำเร็จ ซึ่งหมายความว่าผู้ใช้พบเอกสารที่ผู้ใช้เข้าถึงได้แล้ว ระบบจะตรวจสอบว่าได้รับอนุญาตให้ทำการ Crawl หรือไม่ แล้วจึงดาวน์โหลดเนื้อหา

การตรวจสอบนี้รวม HTML และเนื้อหาทั้งหมดที่กล่าวถึงใน HTML เช่น รูปภาพ วิดีโอ หรือ JavaScript นอกจากนี้ โปรแกรมรวบรวมข้อมูลยังแยกลิงก์จากเอกสาร HTML เพื่อที่โปรแกรมรวบรวมข้อมูลจะสามารถไปที่ URL ที่ลิงก์ด้วยเช่นกัน ลิงก์ต่อไปนี้คือวิธีที่โปรแกรมรวบรวมข้อมูล ค้นหาหน้าใหม่ๆ ในเว็บ

โปรแกรมรวบรวมข้อมูลจะไม่คลิกลิงก์หรือปุ่ม แต่จะส่ง URL ไปยังคิวเพื่อรวบรวมข้อมูลในภายหลังแทน เมื่อเข้าถึง URL ใหม่ จะไม่มีคุกกี้ โปรแกรมทำงานของบริการ หรือพื้นที่เก็บข้อมูลในเครื่อง (เช่น IndexedDB)

การสร้างดัชนี

หลังจากเรียกเอกสาร โปรแกรมรวบรวมข้อมูลจะส่งเนื้อหาไปยังเครื่องมือค้นหาเพื่อเพิ่มลงในดัชนี ตอนนี้ เครื่องมือค้นหาจะแสดงผลและวิเคราะห์เนื้อหา เพื่อทำความเข้าใจ การแสดงผลหมายถึงการแสดงหน้าเว็บในแบบเบราว์เซอร์ (โดยมีข้อจำกัดบางประการ)

เครื่องมือค้นหาจะดูที่คีย์เวิร์ด ชื่อ ลิงก์ ส่วนหัว ข้อความ และสิ่งอื่นๆ อีกมากมาย ซึ่งเรียกว่าสัญญาณซึ่งอธิบายเนื้อหาและบริบทของหน้าเว็บ สัญญาณจะช่วยให้เครื่องมือค้นหาสามารถตอบคำถามหนึ่งๆ ได้ด้วยหน้าที่ดีที่สุดเท่าที่จะเป็นไปได้

เครื่องมือค้นหาอาจพบเนื้อหาเดียวกันใน URL ที่ต่างกัน เช่น สูตรสำหรับ "พายแอปเปิล" อาจอยู่ใน /recipes/apple-pie และต่ำกว่า /recipes/1234 หากต้องการหลีกเลี่ยงการจัดทำดัชนีและแสดงสูตรอาหาร 2 ครั้ง เครื่องมือค้นหาจะกำหนดว่า URL หลักควรเป็นอะไร แล้วทิ้ง URL อื่นที่แสดงเนื้อหาเดียวกัน

แสดงผลลัพธ์ที่มีประโยชน์ที่สุด

เครื่องมือค้นหาทำงานมากกว่าแค่จับคู่คำค้นหากับคีย์เวิร์ดในดัชนี จึงอาจพิจารณาบริบท การใช้คำทางเลือก ตำแหน่งของผู้ใช้ และอื่นๆ เพื่อให้ได้ผลลัพธ์ที่เป็นประโยชน์ ตัวอย่างเช่น "silicon Valley" อาจหมายถึงภูมิภาคทางภูมิศาสตร์หรือรายการทีวี แต่ถ้าข้อความค้นหาคือ "silicon Valley Cast" ผลลัพธ์ในภูมิภาคนี้จะไม่มีประโยชน์มากนัก

คำค้นหาบางอย่างอาจเป็นการค้นหาโดยอ้อม เช่น "เพลงจากนิยายเยื่อน" และเครื่องมือค้นหาต้องตีความสิ่งนั้นและแสดงผลการค้นหาเพลงในภาพยนตร์ เมื่อผู้ใช้ทำการค้นหา เครื่องมือค้นหาจะพิจารณาผลการค้นหาที่มีประโยชน์ที่สุด แล้วแสดงต่อผู้ใช้ การจัดอันดับ หรือการเรียงลำดับหน้าเว็บจะเกิดขึ้นตามข้อความค้นหา ลำดับอาจเปลี่ยนแปลงได้เมื่อเวลาผ่านไปหากมีข้อมูลที่ดีขึ้น

ขั้นตอนถัดไป: วิธีเพิ่มประสิทธิภาพสำหรับเครื่องมือค้นหา

เมื่อเข้าใจพื้นฐานการทำงานของเครื่องมือค้นหาแล้ว คุณอาจเห็นประโยชน์ในการเพิ่มประสิทธิภาพสำหรับเครื่องมือค้นหา ซึ่งเรียกว่า SEO หรือ "การเพิ่มประสิทธิภาพเครื่องมือค้นหา" การทำให้เครื่องมือค้นหาค้นพบและเข้าใจเนื้อหาของคุณได้โดยอัตโนมัติ จะเป็นการปรับปรุงการแสดงผลเว็บไซต์ของคุณสำหรับการค้นหาที่เกี่ยวข้อง ซึ่งอาจส่งผลให้มีผู้ใช้ที่สนใจเข้ามาที่เว็บไซต์ของคุณมากขึ้น ตรวจสอบเว็บไซต์ด้วย Lighthouse และตรวจสอบผลลัพธ์ของ SEO เพื่อดูว่าเครื่องมือค้นหาทำให้ผู้ใช้รับรู้ถึงเนื้อหาของคุณได้ดีเพียงใด