Гендиректор Surge AI опасается, что компании оптимизируют ИИ под «AI-мусор»

Генеральный директор Surge AI Эдвин Чен предупреждает, что индустрия ИИ вместо реального прогресса в медицине и экономике все чаще оптимизирует модели под «AI slop» — эффектные, но поверхностные ответы. По его словам, системы обучают «гнаться за дофамином, а не за истиной», так как разработчики ориентируются на популярные общественные лидерборды вроде LMArena, где пользователи за секунды выбирают самый броский ответ без вдумчивого чтения и фактчекинга; при этом позиции в рейтингах уже обсуждают на продажных встречах с клиентами.

Схожую критику высказывают и другие игроки. Основатель ZeroPath Дин Валентайн пишет, что прогресс моделей после Claude 3.5 Sonnet в 2024 году в их внутренних тестах в основном «пустой шум»: новые релизы почти не улучшают поиск багов и экономическую полезность, лишь делают диалог более «разговорным». Исследование Совместного исследовательского центра показывает системные проблемы бенчмарков, где культурные и коммерческие стимулы важнее общественных эффектов. На этом фоне компании обвиняют в «натаскивании» моделей под тесты: так, подала кастомизированную версию Llama 4 Maverick на LMArena, и платформа публично заявила, что ожидала от провайдера большей прозрачности.

Читайте также

  1. Perplexity заявляет, что уходит от рекламы и делает ставку на подписки
  2. Стартап Миры Муратти предлагает инженерам $500 000 в год ради лидерства в AI-гонке
  3. Обновлённый Sonnet от Anthropic лучше использует компьютер — и временами проявляет экзистенциальную тревогу
  4. В графиках: состояние сектора маркетинговых агентств
  5. Брифинг о будущем маркетинга: ментальная гимнастика principal media
Ключевые инсайты из новости (по версии ChatGPT)
  • Концепция «AI slop» и дофаминовая оптимизация моделей: Часть лидеров рынка ИИ вводит термин «AI slop» для описания моделей, которые выдают эффектные, но поверхностные ответы, оптимизированные под мгновенный пользовательский отклик, а не под точность и пользу. Такой подход фактически учит модели гнаться за дофамином (лайки, апвоуты, «вау-эффект») вместо поиска истины и решения сложных задач.
    [Подходы к оценке и обучению AI-моделей]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!