Гендиректор Surge AI опасается, что компании оптимизируют ИИ под «AI-мусор»

08.12.2025 • Business Insider

Генеральный директор Surge AI Эдвин Чен предупреждает, что индустрия ИИ вместо реального прогресса в медицине и экономике все чаще оптимизирует модели под «AI slop» — эффектные, но поверхностные ответы. По его словам, системы обучают «гнаться за дофамином, а не за истиной», так как разработчики ориентируются на популярные общественные лидерборды вроде LMArena, где пользователи за секунды выбирают самый броский ответ без вдумчивого чтения и фактчекинга; при этом позиции в рейтингах уже обсуждают на продажных встречах с клиентами.

Схожую критику высказывают и другие игроки. Основатель ZeroPath Дин Валентайн пишет, что прогресс моделей после Anthropic Claude 3.5 Sonnet в 2024 году в их внутренних тестах в основном «пустой шум»: новые релизы почти не улучшают поиск багов и экономическую полезность, лишь делают диалог более «разговорным». Исследование Совместного исследовательского центра Еврокомиссии показывает системные проблемы бенчмарков, где культурные и коммерческие стимулы важнее общественных эффектов. На этом фоне компании обвиняют в «натаскивании» моделей под тесты: так, Meta 1 подала кастомизированную версию Llama 4 Maverick на LMArena, и платформа публично заявила, что ожидала от провайдера большей прозрачности.

PubMag

Гендиректор Surge AI опасается, что компании оптимизируют ИИ под «AI-мусор»

Читайте также