Гендиректор Surge AI опасается, что компании оптимизируют ИИ под «AI-мусор»
Генеральный директор Surge AI Эдвин Чен предупреждает, что индустрия ИИ вместо реального прогресса в медицине и экономике все чаще оптимизирует модели под «AI slop» — эффектные, но поверхностные ответы. По его словам, системы обучают «гнаться за дофамином, а не за истиной», так как разработчики ориентируются на популярные общественные лидерборды вроде LMArena, где пользователи за секунды выбирают самый броский ответ без вдумчивого чтения и фактчекинга; при этом позиции в рейтингах уже обсуждают на продажных встречах с клиентами.
Схожую критику высказывают и другие игроки. Основатель ZeroPath Дин Валентайн пишет, что прогресс моделей после
Anthropic Claude 3.5 Sonnet в 2024 году в их внутренних тестах в основном «пустой шум»: новые релизы почти не улучшают поиск багов и экономическую полезность, лишь делают диалог более «разговорным». Исследование Совместного исследовательского центра
Еврокомиссии показывает системные проблемы бенчмарков, где культурные и коммерческие стимулы важнее общественных эффектов. На этом фоне компании обвиняют в «натаскивании» моделей под тесты: так,
Meta подала кастомизированную версию Llama 4 Maverick на LMArena, и платформа публично заявила, что ожидала от провайдера большей прозрачности.
Читайте также
Perplexity заявляет, что уходит от рекламы и делает ставку на подписки
Стартап Миры Муратти предлагает инженерам $500 000 в год ради лидерства в AI-гонке
Обновлённый Sonnet от Anthropic лучше использует компьютер — и временами проявляет экзистенциальную тревогу
В графиках: состояние сектора маркетинговых агентств
Брифинг о будущем маркетинга: ментальная гимнастика principal media
- Концепция «AI slop» и дофаминовая оптимизация моделей: Часть лидеров рынка ИИ вводит термин «AI slop» для описания моделей, которые выдают эффектные, но поверхностные ответы, оптимизированные под мгновенный пользовательский отклик, а не под точность и пользу. Такой подход фактически учит модели гнаться за дофамином (лайки, апвоуты, «вау-эффект») вместо поиска истины и решения сложных задач.
[Подходы к оценке и обучению AI-моделей]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться