Le fonctionnement de la Recherche Google

Quel est le rôle d'un moteur de recherche ?

Les moteurs de recherche sont la version numérique d'un libraire. Ils utilisent un index complet pour aider à trouver les bonnes informations pour une requête. Comprendre les principes de base de la recherche vous aidera à rendre votre contenu visible pour les utilisateurs.

Comment les robots d'exploration parcourent le Web

L'exploration, c'est comme lire tous les livres de la bibliothèque. Pour que les moteurs de recherche puissent fournir des résultats de recherche, ils doivent disposer d'autant d'informations que possible sur le Web. Pour ce faire, les moteurs de recherche utilisent un robot d'exploration, un programme qui navigue d'un site à l'autre et agit comme un navigateur.

Si un livre ou un document est manquant ou endommagé, le robot d'exploration ne pourra pas le lire. Les robots d'exploration tentent d'extraire chaque URL pour déterminer l'état du document. Si un document renvoie un code d'état d'erreur, les robots d'exploration ne peuvent utiliser aucun de son contenu et peuvent réessayer l'URL ultérieurement. Cela garantit que seuls les documents accessibles au public sont inclus dans l'index.

Si les robots d'exploration détectent un code d'état de redirection (comme 301 ou 302), ils suivent la redirection vers une nouvelle URL et poursuivent la redirection vers celle-ci. Une fois qu'ils obtiennent une réponse positive, c'est-à-dire qu'ils ont trouvé un document accessible aux utilisateurs, ils vérifient si son exploration est autorisée, puis téléchargent le contenu.

Cette vérification inclut le code HTML et tout le contenu mentionné dans le code HTML, tel que les images, les vidéos ou le code JavaScript. Les robots d'exploration extraient également les liens des documents HTML afin qu'ils puissent également consulter les URL liées. En suivant les liens, les robots d'exploration trouvent de nouvelles pages sur le Web.

Les robots d'exploration ne cliquent pas activement sur les liens ou les boutons, mais envoient les URL à une file d'attente pour les explorer ultérieurement. Lorsque vous accédez à une nouvelle URL, aucun cookie, service worker ni espace de stockage local (comme IndexedDB) n'est disponible.

Créer un index

Après avoir récupéré un document, le robot d'exploration transmet le contenu au moteur de recherche pour qu'il l'ajoute à l'index. Le moteur de recherche affiche et analyse le contenu pour le comprendre. Le rendu consiste à afficher la page comme le ferait un navigateur (avec certaines restrictions).

Les moteurs de recherche examinent les mots clés, le titre, les liens, les en-têtes, le texte et bien d'autres éléments. Ceux-ci sont appelés signaux, qui décrivent le contenu et le contexte de la page. Les signaux permettent aux moteurs de recherche de répondre à n'importe quelle requête avec la meilleure page possible.

Les moteurs de recherche peuvent trouver le même contenu sur différentes URL. Par exemple, une recette pour "tarte aux pommes" peut se trouver sous /recipes/apple-pie et sous /recipes/1234. Pour éviter d'indexer et d'afficher la recette deux fois, les moteurs de recherche déterminent quelle doit être l'URL principale et ignorent les autres URL affichant le même contenu.

Afficher les résultats les plus utiles

Les moteurs de recherche font plus que simplement mettre en correspondance la requête avec les mots clés de l'index. Pour fournir des résultats utiles, ils peuvent tenir compte du contexte, d'autres formulations, de la position de l'utilisateur, etc. Par exemple, "silicon Valley" peut faire référence à la région géographique ou à l'émission télévisée. Mais si la requête est "silicon Valley cast", les résultats sur la région ne sont pas très utiles.

Certaines requêtes peuvent être indirectes, comme "la chanson de la pulp fiction", et les moteurs de recherche doivent interpréter cela et afficher des résultats pour la musique utilisée dans le film. Lorsqu'un utilisateur effectue une recherche, les moteurs de recherche déterminent les résultats les plus utiles, puis les présentent à l'utilisateur. Les pages sont classées ou classées en fonction de la requête. L'ordre peut souvent changer au fil du temps si de meilleures informations deviennent disponibles.

Étapes suivantes: comment optimiser votre site pour les moteurs de recherche

Maintenant que vous comprenez les bases du fonctionnement des moteurs de recherche, vous verrez peut-être l'intérêt de les optimiser pour les moteurs de recherche. C'est ce qu'on appelle le SEO, ou "optimisation du référencement". En vous assurant que les moteurs de recherche peuvent trouver et comprendre automatiquement votre contenu, vous améliorez la visibilité de votre site pour les recherches pertinentes. Vous pourriez ainsi attirer davantage d'internautes intéressés sur votre site. Effectuez un audit de votre site avec Lighthouse et vérifiez les résultats de l'optimisation du référencement pour déterminer dans quelle mesure les moteurs de recherche peuvent sensibiliser les utilisateurs à votre contenu.