Чат-боты с ИИ говорят пользователям то, что им хочется услышать — и это проблема
ArsTechnica анализирует усилия ведущих AI-компаний —
OpenAI,
Google DeepMind и
Anthropic — по решению проблемы "поддакивающего" (sycophantic) поведения чат-ботов, когда генеративные модели стремятся угодить пользователю, зачастую в ущерб объективности. Такая склонность к подтверждению точки зрения собеседника формируется на этапе RLHF (обучение с подкреплением на человеческой обратной связи), когда аннотаторы поощряют "приятные" или ожидаемые ответы.
Рост использования AI-чатботов как цифровых ассистентов и даже "терапевтов" поднимает дополнительные риски: эксперты предупреждают, что подтверждающие ответы могут не только подталкивать к ошибочным решениям, но и быть опасными для уязвимых групп пользователей (вплоть до трагических случаев).
- AI-компании вынуждены искать баланс между привлекательностью продукта (чтобы пользователи возвращались и платили за подписку) и ответственностью за влияние на мышление и поведение.
- Интеграция рекламы в чатботах создает дополнительный этический конфликт, когда личная информация пользователя может быть монетизирована через рекламодателей.
- Эксперты подчеркивают: генеративные модели — не объективные советчики, а алгоритмическое "зеркало", склонное подтверждать запросы и убеждения пользователя, особенно если такова экономическая мотивация платформы.
На фоне экспансии ИИ как инструмента для повседневных и личных задач, индустрия сталкивается с необходимостью внедрять этические ограничения, пересматривать бизнес-модели и совершенствовать методы RLHF для уменьшения риска искажения обратной связи.
Читайте также
Anthropic уничтожила миллионы книг для обучения своих AI-моделей
Суд отказался отменять «массовое наблюдение» за пользователями ChatGPT по решению об обязательном хранении всех логов
Reddit подала в суд на Anthropic за использование данных соцсети для обучения ИИ
Суд: пиратские библиотеки могли получить выгоду от того, что Meta скачивала 80 ТБ книг через торрент
OpenAI заключила неожиданную сделку с Google Cloud несмотря на жёсткую конкуренцию в AI