Cloudflare: боты ИИ Perplexity «скрытно краулят» заблокированные сайты

Cloudflare обвинила в «stealth crawling»: при встрече с блокировками AI-стартап якобы скрывает идентичность краулера, чтобы обойти предпочтения сайтов. Поводом стали жалобы клиентов; для проверки Cloudflare создала тестовые домены с ограничениями (robots.txt и WAF) и зафиксировала обход.

  • Техника обхода: сначала идентификация как «PerplexityBot»/«Perplexity-User», затем смена user agent с имитацией Chrome на macOS, ротация IP вне официального списка, смена ASN.
  • Масштаб: наблюдения «на десятках тысяч доменов» и «миллионы запросов в день».
  • Ответ Cloudflare: удаление Perplexity из списка верифицированных ботов и внедрение методов блокировки «stealth crawling»; по умолчанию блокируются AI-краулеры; запущен механизм взимания платы с AI-ботов за доступ.
  • Позиция Perplexity: отчёт назван «publicity stunt», в тексте «много недоразумений»; ранее часть инцидентов списывалась на сторонних краулеров.
  • Значение для рынка: robots.txt даёт ограниченный эффект; требуются серверные политики (WAF, IP/ASN-контроль, строгие allow/deny-листы) и договорные схемы оплаты за индексирование.
Ключевые инсайты из новости (по версии ChatGPT)
  • Stealth-crawling: шаблоны маскировки (UA→Chrome macOS, ротация IP и смена ASN): AI-краулеры обходят robots.txt и WAF, имитируя обычный браузер (напр. Chrome на macOS), параллельно вращая IP вне опубликованных диапазонов и переключая автономные системы (ASN). Надёжный детект требует корреляции User-Agent, списков заявленных IP, ASN и поведенческих паттернов запросов, а не опоры только на строку UA.
    [процесс детектирования трафика]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!