Как работает поиск

Что делает поисковая система?

Поисковые системы — это цифровая версия библиотекаря. Они используют комплексный индекс, который помогает найти нужную информацию для запроса. Понимание основ поиска подготовит вас к тому, чтобы сделать ваш контент доступным для поиска пользователями.

Как сканеры просматривают Интернет

Ползание похоже на чтение всех книг в библиотеке. Прежде чем поисковые системы смогут выдать какие-либо результаты поиска, им необходимо получить как можно больше информации из Интернета. Для этого поисковые системы используют сканер — программу, которая перемещается с сайта на сайт и действует как браузер.

Если книга или документ отсутствуют или повреждены, сканер не сможет их прочитать. Сканеры пытаются получить каждый URL-адрес, чтобы определить состояние документа. Если документ возвращает код состояния ошибки, сканеры не могут использовать его содержимое и могут повторить попытку доступа к URL-адресу позже. Это гарантирует, что в индекс попадут только общедоступные документы.

Если сканеры обнаруживают код состояния перенаправления (например, 301 или 302), они следуют за перенаправлением на новый URL-адрес и продолжают там. Получив успешный ответ, то есть нашли документ, доступный пользователям, они проверяют, разрешено ли его сканирование, а затем загружают контент.

Эта проверка включает в себя HTML и весь контент, упомянутый в HTML, например изображения, видео или JavaScript. Сканеры также извлекают ссылки из HTML-документов, чтобы сканер также мог посещать связанные URL-адреса. Переход по ссылкам — это то, как сканеры находят новые страницы в Интернете.

Сканеры не нажимают ссылки или кнопки активно, а вместо этого отправляют URL-адреса в очередь для их последующего сканирования. При доступе к новому URL-адресу файлы cookie, сервисные работники или локальное хранилище (например, IndexedDB) недоступны.

Создание индекса

После получения документа сканер передает его содержимое поисковой системе для добавления его в индекс. Поисковая система теперь отображает и анализирует контент, чтобы понять его. Рендеринг означает отображение страницы так, как это делает браузер ( с некоторыми ограничениями ).

Поисковые системы просматривают ключевые слова, заголовок, ссылки, заголовки, текст и многое другое. Это так называемые сигналы , которые описывают содержимое и контекст страницы. Сигналы позволяют поисковым системам отвечать на любой запрос, предоставляя наилучшую страницу.

Поисковые системы могут найти один и тот же контент по разным URL-адресам. Например, рецепт «яблочного пирога» может находиться в /recipes/apple-pie и /recipes/1234 . Чтобы избежать индексации и повторного показа рецепта, поисковые системы определяют, каким должен быть основной URL-адрес, и отбрасывают альтернативные URL-адреса, показывающие тот же контент.

Достигаем самых полезных результатов

Поисковые системы выполняют больше работы, чем просто сопоставляют запрос с ключевыми словами в индексе. Чтобы получить полезные результаты, они могут учитывать контекст, альтернативные формулировки, местоположение пользователя и многое другое. Например, «Силиконовая долина» может относиться к географическому региону или телешоу. Но если запрос «слепок из Кремниевой долины», результаты по региону не очень полезны.

Некоторые запросы могут быть косвенными, например «песня из криминального чтива», и поисковые системы должны интерпретировать их и показывать результаты по музыке в фильме. Когда пользователь что-то ищет, поисковые системы определяют наиболее полезные результаты и затем показывают их пользователю. Ранжирование или упорядочение страниц происходит на основе запроса. Порядок часто может меняться со временем, если становится доступной более точная информация.

Следующие шаги: как оптимизировать для поисковых систем

Теперь, когда вы понимаете основы работы поисковых систем, вы можете увидеть ценность оптимизации для поисковых систем. Это называется SEO или «Поисковая оптимизация». Убедившись, что поисковые системы могут находить и автоматически понимать ваш контент, вы улучшаете видимость своего сайта для релевантных поисковых запросов. Это может привести к тому, что на ваш сайт придет больше заинтересованных пользователей. Проведите аудит своего сайта с помощью Lighthouse и проверьте результаты SEO, чтобы увидеть, насколько хорошо поисковые системы могут информировать пользователей о вашем контенте.