Cloudflare: боты ИИ Perplexity «скрытно краулят» заблокированные сайты
Cloudflare обвинила Perplexity в «stealth crawling»: при встрече с блокировками AI-стартап якобы скрывает идентичность краулера, чтобы обойти предпочтения сайтов. Поводом стали жалобы клиентов; для проверки Cloudflare создала тестовые домены с ограничениями (robots.txt и WAF) и зафиксировала обход.
- Техника обхода: сначала идентификация как «PerplexityBot»/«Perplexity-User», затем смена user agent с имитацией Google Chrome на macOS, ротация IP вне официального списка, смена ASN.
- Масштаб: наблюдения «на десятках тысяч доменов» и «миллионы запросов в день».
- Ответ Cloudflare: удаление Perplexity из списка верифицированных ботов и внедрение методов блокировки «stealth crawling»; по умолчанию блокируются AI-краулеры; запущен механизм взимания платы с AI-ботов за доступ.
- Позиция Perplexity: отчёт назван «publicity stunt», в тексте «много недоразумений»; ранее часть инцидентов списывалась на сторонних краулеров.
- Значение для рынка: robots.txt даёт ограниченный эффект; требуются серверные политики (WAF, IP/ASN-контроль, строгие allow/deny-листы) и договорные схемы оплаты за индексирование.
Читайте также
Perplexity обвиняют в скрейпинге сайтов, явно запретивших AI-скрейпинг
Дайджест: OpenAI покупает TBPN, CNN строит agentic-инфраструктуру, а Grok хотят сделать обязательным в IPO SpaceX?
Cloudflare: AI-сервис Perplexity применяет «скрытные тактики» для обхода запретов на обход (no-crawl)
Яндекс Поиск сэкономил 4,5 млрд ₽ в 2025 году благодаря ИИ — при этом качество ответов Алисы AI выросло в 3 раза
ИИ для управления проектами. Для чего его на самом деле применяют российские организации
Ключевые инсайты из новости (по версии ChatGPT)
- Stealth-crawling: шаблоны маскировки (UA→Chrome macOS, ротация IP и смена ASN): AI-краулеры обходят robots.txt и WAF, имитируя обычный браузер (напр. Chrome на macOS), параллельно вращая IP вне опубликованных диапазонов и переключая автономные системы (ASN). Надёжный детект требует корреляции User-Agent, списков заявленных IP, ASN и поведенческих паттернов запросов, а не опоры только на строку UA.
[процесс детектирования трафика]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!