Иск: Reddit обвинил Perplexity в краже данных из результатов Google и поймал «с поличным»
Reddit подал иск против AI-поисковика
Perplexity, обвиняя компанию и ряд партнёров в незаконном скрейпе контента Reddit из результатов
Google (SERP) и обходе анти-скрейпинговых механизмов, в которые инвестировали и Google, и Reddit. По версии Reddit, Perplexity позиционирует себя как «answer engine», но фактически использует стороннюю LLM для парсинга большого массива результатов Google и извлечения ответов на основе контента Reddit.
Ключевой эпизод: Reddit провёл «маркированный» эксперимент, разместив материал, доступный только в SERP Google; уже через несколько часов этот контент появился в ответах Perplexity. Истцы утверждают, что это возможно лишь при скрейпе страниц результатов поиска Google с включённым контентом Reddit и быстрым включением данных в выдачу Perplexity.
- Иск указывает на «заговор» нескольких компаний и сравнивает их с «грабителями банков».
- Perplexity отвергает обвинения, заявляя, что лишь суммирует обсуждения и корректно ссылается на треды, не обучая базовые модели.
- Perplexity считает иск попыткой давления на «открытый интернет» ради лицензирования данных и рычагом в переговорах Reddit с Google и
OpenAI.
Дело обостряет вопросы правомерности скрейпа SERP, лицензирования UGC и границ для «answer engines».
Читайте также
«Совкомбанк Страхование» выбрала digital-агентство i-Media для SEO-продвижения
Reddit потребовала компенсаций от Perplexity за кражу контента для ИИ
Perplexity заявляет, что уходит от рекламы и делает ставку на подписки
Canva довела ARR до $4 млрд на фоне роста реферального трафика из LLM
Протокольные войны agentic-commerce приходят в e-commerce; Perplexity говорит, что реклама подрывает доверие к AI
- Honeypot-метод для детекции несанкционированного скрейпа SERP: Практика «маркированных» публикаций: размещаем контент, доступный только на страницах результатов поиска (SERP) и недоступный по прямым ссылкам/на сайте, затем проверяем, появляется ли он в ответах/резюме AI-поисковиков. Срабатывание в течение часов/дней — индикатор парсинга SERP и быстрой интеграции данных в answer engine.
[Процесс]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Ars Technica