Главные сложности Google с обходом сайтов в 2025 году

Сотрудники Gary Illyes и Martin Splitt в подкасте описали основные проблемы, которые Googlebot замечал при обходе сайтов в 2025 году. Главный вывод: параметры и фасеты раздувают пространство URL и могут создавать лишнюю нагрузку на сервер.

  • Google перечисляет среди проблем фасетную навигацию, параметры действий, нерелевантные параметры, календарные параметры и другие нестандартные параметры URL.
  • Фасетная навигация (фильтры и сортировки) названа крупнейшей категорией проблем: 50%.
  • Параметры действий (например, add_to_cart и add_to_wishlist) оценены в 25% и могут увеличивать URL-пространство без существенных изменений контента.
  • Нерелевантные параметры (например, UTM-метки и идентификаторы сессии) — 10%: роботу сложно понять, меняют ли они состояние страницы.
  • WordPress-плагины или виджеты — 5%, а «другое странное» — 2% (пример — случайное двойное кодирование URL).

Почему это важно: В подкасте отмечается, что из-за таких URL робот может попадать в петли обхода и нагружать сервер, что влияет на производительность сайта. Gary Illyes объяснил, что после обнаружения набора URL робот не может решить, хорошее ли это пространство, пока не обойдёт значительную его часть.

На что обратить внимание: В разбивке отдельно выделены фасетная навигация и URL-параметры, а также параметры действий и «случайные» строки вроде UTM или session ID. В тексте подчёркивается, что неочевидные параметры заставляют робота проверять больше вариантов, чтобы понять, меняется ли страница. Отдельно упомянуты случаи, когда плагины/виджеты WordPress или ошибки кодирования создают редкие, но проблемные URL.

Читайте также

  1. Google: алгоритмы поиска, выявление спама и политики принципиально не меняются из-за AI-поиска
  2. ChatGPT: блок Top Stories и более визуальные «панели знаний» в ответах
  3. Bing: multi-turn search стал доступен по всему миру
  4. Google: почему ошибки 404 не важны для SEO
  5. Google: выбирайте разумное название сайта, по которому реально ранжироваться в поиске
Ключевые инсайты из новости (по версии ChatGPT)
  • Карта рисков для crawl: какие URL-паттерны чаще всего раздувают пространство страниц: В подкасте Google перечислены типовые классы URL, которые чаще всего создают избыточное пространство адресов при обходе: фасетная навигация, параметры действий, нерелевантные параметры, календарные параметры и редкие «странные» случаи. Это полезно как практический чек-лист для аудита генерации URL и оценки того, где у ботов возникает риск «перекрауливания» и лишней нагрузки на сайт.
    [Процессы]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!