搜尋服務的運作方式

搜尋引擎的功能為何?

搜尋引擎是圖書館員的數位版本,他們會使用完整索引,協助找出查詢的正確資訊。瞭解搜尋的基本概念,讓使用者找到你的內容。

檢索器如何瀏覽網路

檢索就像是閱讀圖書館中的所有書籍。搜尋引擎必須盡可能從網路取得大量資訊,才能提供任何搜尋結果。為此,搜尋引擎會使用檢索器,這是一種會在各個網站之間移動,並像瀏覽器一樣運作的程式。

如果書籍或文件遺失或損壞,檢索器就無法讀取。檢索器會嘗試擷取每個網址,以判斷文件的狀態。如果文件傳回錯誤狀態碼,檢索器就無法使用任何內容,並可能稍後重試網址。這可確保只有可公開存取的文件會納入索引。

如果檢測到重新導向狀態碼 (例如 301 或 302),檢索器就會依循重新導向至新網址,並繼續執行。收到成功回應後 (代表找到可供使用者存取的文件),他們會檢查是否允許檢索,然後下載內容。

這項檢查項目包括 HTML 和 HTML 中提及的所有內容,例如圖片、影片或 JavaScript。檢索器也會從 HTML 文件中擷取連結,以便檢索器也能造訪連結的網址。追蹤連結是檢索器在網路上尋找新網頁的方式。

檢索器不會主動點選連結或按鈕,而是將網址傳送至佇列,以便稍後檢索。存取新網址時,無法使用 Cookie、服務工作者或本機儲存空間 (例如 IndexedDB)。

建構索引

擷取文件後,檢索器會將內容交給搜尋引擎,以便將內容新增至索引。搜尋引擎現在會算繪及分析內容,以便瞭解內容。轉譯是指以瀏覽器的方式顯示網頁 (但有部分限制)。

搜尋引擎會檢視關鍵字、標題、連結、標題、文字和其他許多項目。這些稱為「信號」,用於描述網頁的內容和背景。信號可讓搜尋引擎為任何查詢提供最佳網頁。

搜尋引擎可能會在不同網址中找到相同的內容。舉例來說,「蘋果派」食譜可能會出現在 /recipes/apple-pie/recipes/1234 底下。為避免索引及顯示食譜兩次,搜尋引擎會判斷主要網址應為何,並捨棄顯示相同內容的替代網址。

提供最實用的結果

搜尋引擎不只會將查詢與索引中的關鍵字比對,為了提供實用的結果,他們可能會考量上下文、替代用詞、使用者所在位置等因素。舉例來說,「矽谷」可能指的是地理區域或電視節目。但如果查詢的是「silicon valley cast」,區域結果就沒什麼幫助。

有些查詢可能間接,例如「來自《黑色追殺令》的歌曲」,搜尋引擎需要解讀這類查詢,並顯示電影中的音樂結果。使用者搜尋某項內容時,搜尋引擎會判斷最實用的結果,然後向使用者顯示。系統會根據查詢來排名或排序網頁。如果有更準確的資訊,排序可能會隨時間變動。

後續步驟:如何為搜尋引擎進行最佳化

瞭解搜尋引擎運作方式的基本概念後,您可能會發現為搜尋引擎進行最佳化有其價值。這就是所謂的「搜尋引擎最佳化 (SEO)」。確保搜尋引擎可以找到並自動瞭解您的內容,有助於提升網站在相關搜尋結果中的曝光率。這麼做有助於吸引更多感興趣的使用者造訪您的網站。使用 Lighthouse 稽核網站,並查看 SEO 結果,瞭解搜尋引擎如何讓使用者瞭解你的內容。