Perplexity обвиняют в скрейпинге сайтов, явно запретивших AI-скрейпинг

04.08.2025 • TechCrunch

Cloudflare заявила, что Perplexity системно обходит запреты на AI-скрейпинг: игнорирует robots.txt и правила блокировок, маскирует бота сменой user-agent и ASN, а при блокировке использует "обычный" браузер, имитирующий Google Chrome на macOS. По данным Cloudflare, активность фиксировалась на десятках тысяч доменов и достигала миллионов запросов в день; подпольный краулер был отпечатан с помощью ML и сетевых сигналов. После жалоб клиентов Cloudflare провела тесты и подтвердила обход; сервис исключил ботов Perplexity из списка проверенных и добавил новые методы блокировки.

Perplexity отвергает обвинения, назвав пост Cloudflare "sales pitch"; компания утверждает, что на скриншотах нет доступа к контенту, а упомянутый бот "вообще не их".

Контекст: в июле Cloudflare запустила маркетплейс для монетизации обращений AI-краулеров и ранее представила бесплатный инструмент против скрейпинга; CEO Мэттью Принс предупреждает, что ИИ ломает бизнес-модель интернета.
Это не первый спор вокруг Perplexity: издания, включая Wired, обвиняли сервис в плагиате; на Disrupt 2024 CEO Аравинд Сриневас затруднился с определением "плагиата".

PubMag

Perplexity обвиняют в скрейпинге сайтов, явно запретивших AI-скрейпинг

Читайте также