ИИ поедает сам себя: почему технология рискует деградировать от собственного успеха

17.06.2025 • ИНК

Массовое распространение искусственного интеллекта приводит к росту доли синтетического контента в интернете — по данным AWS, ИИ уже генерирует 57% всего контента. Эта тенденция создает риск «коллапса модели» (model collapse): языковые модели начинают обучаться преимущественно на данных, сгенерированных предыдущими ИИ, что приводит к снижению качества, шаблонности, потере уникальных знаний и усилению предвзятостей.

Уже зафиксированы первые признаки деградации: снижение разнообразия, увеличение числа повторов и искажений. Стандартные методы тонкой настройки не решают проблему — необходимо контролировать долю оригинальных человеческих данных в обучении и совершенствовать методы отбора обучающих корпусов. Одной из угроз становится исчезновение редких идей и культурных нюансов, что влияет как на качество информации, так и на достоверность поисковых систем.

Для борьбы с деградацией эксперты рекомендуют фильтровать синтетический контент, использовать новые методы разметки (например, "водяные знаки") и инвестировать в поддержку авторов оригинальных текстов. Также развиваются новые подходы к обучению, например, Constitutional AI и RLHF 2.0, а крупные компании ищут баланс между синтетикой и человеческим творчеством. Несмотря на опасения, рынок готовится к новым архитектурам ИИ, способным минимизировать эффекты самореференции и деградации.

#Искусственный интеллект #ИНК #OpenAI #Anthropic #AWS (Amazon Web Services)#UGC (пользовательский контент)

← Назад в ленту Читать оригинал →

✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!