Пик ИИ близок: индустрия столкнулась с дефицитом человеческих данных и угрозой деградации LLM

С момента запуска ChatGPT-4o и других LLM индустрия искусственного интеллекта переживает беспрецедентный технологический бум. Однако этот прогресс сталкивается с фундаментальной проблемой: ресурс качественного человеческого контента, необходимого для обучения моделей, быстро истощается. Уже сегодня 51% всего интернет-трафика приходится на AI-скрейперы, а доля AI-контента на просторах интернета достигает 30–40% (по прогнозам — до 90% в ближайшие годы).

Исследования показывают, что даже незначительное загрязнение обучающих данных (10–30% AI-контента) приводит к быстрому «обрушению модели» — деградации качества LLM уже через несколько циклов обучения. При этом всё больше пользователей и студентов интегрируют AI-решения в повседневную жизнь: 88% студентов использовали генеративный ИИ в 2025 году, а активность на Stack Overflow снизилась почти наполовину.

Рынок приближается к фазе истощения уникальных человеческих данных, что ставит под угрозу дальнейшее развитие LLM. Эксперты обсуждают перспективу появления специализированных «контент-ферм» и необходимости поиска новых способов взаимодействия между биологическими и цифровыми системами. Вопрос о будущем AI — не только технологический, но и философский: как избежать краха и найти новый источник смысла для развития цифровых интеллектов?

← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!