AP делает свой архив пригодным для ИИ, чтобы воспользоваться бумом корпоративного RAG
Associated Press (AP) перестраивает архив под эпоху ИИ: за 9–12 месяцев десятки миллионов материалов (текст, фото, видео, аудио) оцифрованы, размечены, очищены по правам и отдаются по API для надёжной подложки enterprise-RAG и LLM. Это превращает 50 лет верифицированной журналистики в «топливо» для корпоративных ИИ и открывает новый канал выручки.
Модель монетизации: лицензирование структурированных данных через Snowflake Marketplace (первые клиенты — финсектор) и партнёрства Big Tech: OpenAI (2023), Google Gemini (начало 2025), Microsoft (контент-маркетплейс). Параллельно рынок формируется игроками вроде Factiva (30 тыс. издателей) и издателей FT/The Economist, уже монетизирующих архивы.
- Операционная база AP: 230 локаций в ~100 странах, ~5 000 единиц контента в день.
- Deloitte (≈2 000 компаний, 14 стран EMEA): 38% — гибрид (in-house+вендоры), 32% — вендор-центрик, 24% — ставка на собственные LLM/RAG.
- Норматив рынка: спор об оплате за данные — издатели настаивают на «рациональном take rate» против «100% take rate» скрейпинга ИИ.
Ключевая идея: «лучший ИИ требует лучших входных данных» — verified-контент повышает ценность издателей и выстраивает экономику лицензирования данных для ИИ, сближая стимулы медиа и AI-платформ.
Читайте также
The Economist лицензирует контент для частных корпоративных LLM
Анализ документов нейросетью с цитатами из источников: скилл research-docs для Claude Code
Дайджест: OpenAI покупает TBPN, CNN строит agentic-инфраструктуру, а Grok хотят сделать обязательным в IPO SpaceX?
Как кодинг-агенты используют инструменты, память и контекст репозитория, чтобы писать код лучше
Обзор медиазакупок: глава Instrument о том, как агентствам нужно вести клиентов в сторону AI
- AI-ready архив: требования к контенту: Чтобы архив был полезен корпоративным LLM/RAG, материалы должны быть оцифрованы, структурированы, снабжены богатыми метаданными и правами, а доступ — по стабильным API с возможностью цитирования и биллинга. Такой подход превращает десятилетия контента в продаваемый дата-продукт.
[Процесс → Data Productization]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться