Reddit ограничил доступ Internet Archive к контенту из-за действий ИИ-компаний

ограничил доступ Wayback Machine (Internet Archive) к контенту платформы из-за случаев, когда ИИ-компании извлекали данные из архива в обход политик Reddit. По словам представителя Reddit Тима Ратшмидта, до достижения «надлежащей защиты сайта и соблюдения платформенных правил, включая уважение к приватности», архиву разрешено сохранять только главную страницу — без постов, комментариев и профилей. Директор Wayback Machine Марк Грэм подтвердил, что между сторонами идёт диалог.

  • Объём ограничений: снимки только главной страницы Reddit по датам; детальные страницы заблокированы.
  • Причина: предотвращение несанкционированного скрейпинга для обучения ИИ и нарушения платформенных политик.
  • Контекст монетизации данных: ранее Reddit заключил сделки по лицензированию данных с и и ограничил доступ другим поисковым системам без оплаты.
  • Правовой фон: в июне Reddit подал иск против , обвиняя компанию в продолжающемся скрейпинге.

Решение усиливает контроль Reddit над дистрибуцией пользовательского контента и формирует прецедент для платформ, стремящихся монетизировать данные и ограничить использование архивов третьими сторонами в эпоху AI.

Ключевые инсайты из новости (по версии ChatGPT)
  • Pay-to-crawl как новая платёжная модель: Платформы переходят от свободного краулинга к модели «плати за доступ к данным». Reddit ограничил архивирование и ранее открыл платный доступ к данным для Google и OpenAI — это фиксирует рыночную норму монетизации UGC-датасетов.
    [Политики данных и монетизация]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!