Cloudflare: боты ИИ Perplexity «скрытно краулят» заблокированные сайты
Cloudflare обвинила
Perplexity в «stealth crawling»: при встрече с блокировками AI-стартап якобы скрывает идентичность краулера, чтобы обойти предпочтения сайтов. Поводом стали жалобы клиентов; для проверки Cloudflare создала тестовые домены с ограничениями (robots.txt и WAF) и зафиксировала обход.
- Техника обхода: сначала идентификация как «PerplexityBot»/«Perplexity-User», затем смена user agent с имитацией
Google Chrome на macOS, ротация IP вне официального списка, смена ASN. - Масштаб: наблюдения «на десятках тысяч доменов» и «миллионы запросов в день».
- Ответ Cloudflare: удаление Perplexity из списка верифицированных ботов и внедрение методов блокировки «stealth crawling»; по умолчанию блокируются AI-краулеры; запущен механизм взимания платы с AI-ботов за доступ.
- Позиция Perplexity: отчёт назван «publicity stunt», в тексте «много недоразумений»; ранее часть инцидентов списывалась на сторонних краулеров.
- Значение для рынка: robots.txt даёт ограниченный эффект; требуются серверные политики (WAF, IP/ASN-контроль, строгие allow/deny-листы) и договорные схемы оплаты за индексирование.
Читайте также
Perplexity обвиняют в скрейпинге сайтов, явно запретивших AI-скрейпинг
Cloudflare: AI-сервис Perplexity применяет «скрытные тактики» для обхода запретов на обход (no-crawl)
Perplexity заявляет, что уходит от рекламы и делает ставку на подписки
Издатели выступают против скрейпинга ИИ при поддержке IAB Tech Lab
Протокольные войны agentic-commerce приходят в e-commerce; Perplexity говорит, что реклама подрывает доверие к AI
Ключевые инсайты из новости (по версии ChatGPT)
- Stealth-crawling: шаблоны маскировки (UA→Chrome macOS, ротация IP и смена ASN): AI-краулеры обходят robots.txt и WAF, имитируя обычный браузер (напр. Chrome на macOS), параллельно вращая IP вне опубликованных диапазонов и переключая автономные системы (ASN). Надёжный детект требует корреляции User-Agent, списков заявленных IP, ASN и поведенческих паттернов запросов, а не опоры только на строку UA.
[процесс детектирования трафика]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!
Verge