Иск: Reddit обвинил Perplexity в краже данных из результатов Google и поймал «с поличным»

подал иск против AI-поисковика , обвиняя компанию и ряд партнёров в незаконном скрейпе контента Reddit из результатов (SERP) и обходе анти-скрейпинговых механизмов, в которые инвестировали и Google, и Reddit. По версии Reddit, Perplexity позиционирует себя как «answer engine», но фактически использует стороннюю LLM для парсинга большого массива результатов Google и извлечения ответов на основе контента Reddit.

Ключевой эпизод: Reddit провёл «маркированный» эксперимент, разместив материал, доступный только в SERP Google; уже через несколько часов этот контент появился в ответах Perplexity. Истцы утверждают, что это возможно лишь при скрейпе страниц результатов поиска Google с включённым контентом Reddit и быстрым включением данных в выдачу Perplexity.

  • Иск указывает на «заговор» нескольких компаний и сравнивает их с «грабителями банков».
  • Perplexity отвергает обвинения, заявляя, что лишь суммирует обсуждения и корректно ссылается на треды, не обучая базовые модели.
  • Perplexity считает иск попыткой давления на «открытый интернет» ради лицензирования данных и рычагом в переговорах Reddit с Google и .

Дело обостряет вопросы правомерности скрейпа SERP, лицензирования UGC и границ для «answer engines».

Читайте также

  1. Google: почему ошибки 404 не важны для SEO
  2. Джон Мюллер (лично): помогает ли Schema-разметка LLM и Google
  3. Смогут ли ИИ-чатботы показывать рекламу, не теряя доверия пользователей?
  4. Reddit потребовала компенсаций от Perplexity за кражу контента для ИИ
  5. AI-оптимизация: новый канал, который бренды не могут позволить себе игнорировать
Ключевые инсайты из новости (по версии ChatGPT)
  • Honeypot-метод для детекции несанкционированного скрейпа SERP: Практика «маркированных» публикаций: размещаем контент, доступный только на страницах результатов поиска (SERP) и недоступный по прямым ссылкам/на сайте, затем проверяем, появляется ли он в ответах/резюме AI-поисковиков. Срабатывание в течение часов/дней — индикатор парсинга SERP и быстрой интеграции данных в answer engine.
    [Процесс]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!