À quoi sert un moteur de recherche ?
Les moteurs de recherche sont la version numérique d'un bibliothécaire. Ils utilisent un indice complet pour trouver les bonnes informations pour une requête. Comprendre les principes de base de la recherche vous permet de rendre vos contenus visibles pour les utilisateurs.
Comment les robots d'exploration parcourent le Web
L'exploration est comme la lecture de tous les livres de la bibliothèque. Avant de pouvoir afficher des résultats de recherche, les moteurs de recherche doivent disposer d'un maximum d'informations provenant du Web. Pour ce faire, les moteurs de recherche utilisent un robot d'exploration, un programme qui passe d'un site à l'autre et agit comme un navigateur.
Si un livre ou un document est manquant ou endommagé, le robot d'exploration ne peut pas le lire. Les robots d'exploration tentent d'extraire chaque URL pour déterminer l'état du document. Si un document renvoie un code d'état d'erreur, les robots d'exploration ne peuvent utiliser aucun de son contenu et peuvent réessayer l'URL ultérieurement. Ainsi, seuls les documents accessibles au public sont inclus dans l'index.
Si les robots d'exploration détectent un code d'état de redirection (comme 301 ou 302), ils suivent la redirection vers une nouvelle URL et continuent là-bas. Une fois qu'il a reçu une réponse positive, ce qui signifie qu'il a trouvé un document accessible aux utilisateurs, il vérifie s'il est autorisé à être exploré, puis télécharge le contenu.
Cette vérification inclut le code HTML et tout le contenu mentionné dans le code HTML, comme les images, les vidéos ou le code JavaScript. Les robots d'exploration extraient également les liens des documents HTML afin de pouvoir consulter les URL associées. Les robots d'exploration suivent les liens pour trouver de nouvelles pages sur le Web.
Les robots d'exploration ne cliquent pas activement sur les liens ni sur les boutons, mais envoient les URL à une file d'attente pour les explorer ultérieurement. Lorsque vous accédez à une nouvelle URL, aucun cookie, service worker ni stockage local (comme IndexedDB) n'est disponible.
Créer un index
Après avoir récupéré un document, l'explorateur transmet le contenu au moteur de recherche pour l'ajouter à l'index. Le moteur de recherche affiche et analyse désormais le contenu pour le comprendre. Le rendu consiste à afficher la page comme le ferait un navigateur (avec certaines limitations).
Les moteurs de recherche examinent les mots clés, le titre, les liens, les titres, le texte et bien d'autres éléments. Il s'agit de signaux qui décrivent le contenu et le contexte de la page. Les signaux permettent aux moteurs de recherche de répondre à toute requête donnée avec la meilleure page possible.
Les moteurs de recherche peuvent trouver le même contenu sous différentes URL. Par exemple, une recette de "tarte aux pommes" peut se trouver sous /recipes/apple-pie
et sous /recipes/1234
. Pour éviter d'indexer et d'afficher la recette deux fois, les moteurs de recherche déterminent l'URL principale et éliminent les URL alternatives affichant le même contenu.
diffuser les résultats les plus utiles ;
Les moteurs de recherche ne se contentent pas de faire correspondre la requête aux mots clés de l'index. Pour fournir des résultats utiles, ils peuvent tenir compte du contexte, d'autres formulations, de l'emplacement de l'utilisateur, etc. Par exemple, "Silicon Valley" peut faire référence à la région géographique ou à la série télévisée. Toutefois, si la requête est "casting silicon valley", les résultats sur la région ne sont pas très utiles.
Certaines requêtes peuvent être indirectes, comme "la chanson de Pulp Fiction". Les moteurs de recherche doivent alors les interpréter et afficher des résultats pour la musique du film. Lorsqu'un utilisateur recherche quelque chose, les moteurs de recherche déterminent les résultats les plus utiles, puis les affichent. Le classement, ou l'ordre des pages, est basé sur la requête. L'ordre peut souvent changer au fil du temps si de meilleures informations deviennent disponibles.
Étapes suivantes: optimiser votre site pour les moteurs de recherche
Maintenant que vous comprenez les principes de base du fonctionnement des moteurs de recherche, vous pouvez voir l'intérêt d'optimiser votre site pour les moteurs de recherche. C'est ce qu'on appelle le référencement naturel (SEO, "Search Engine Optimization"). En vous assurant que les moteurs de recherche peuvent trouver et comprendre automatiquement votre contenu, vous améliorez la visibilité de votre site pour les recherches pertinentes. Cela peut attirer davantage d'utilisateurs intéressés sur votre site. Effectuez un audit de votre site avec Lighthouse et vérifiez les résultats SEO pour voir dans quelle mesure les moteurs de recherche peuvent attirer l'attention des utilisateurs sur votre contenu.