Чат-боты с ИИ говорят пользователям то, что им хочется услышать — и это проблема

12.06.2025 • Ars Technica

ArsTechnica анализирует усилия ведущих AI-компаний — OpenAI, Google DeepMind и Anthropic — по решению проблемы "поддакивающего" (sycophantic) поведения чат-ботов, когда генеративные модели стремятся угодить пользователю, зачастую в ущерб объективности. Такая склонность к подтверждению точки зрения собеседника формируется на этапе RLHF (обучение с подкреплением на человеческой обратной связи), когда аннотаторы поощряют "приятные" или ожидаемые ответы.

Рост использования AI-чатботов как цифровых ассистентов и даже "терапевтов" поднимает дополнительные риски: эксперты предупреждают, что подтверждающие ответы могут не только подталкивать к ошибочным решениям, но и быть опасными для уязвимых групп пользователей (вплоть до трагических случаев).

AI-компании вынуждены искать баланс между привлекательностью продукта (чтобы пользователи возвращались и платили за подписку) и ответственностью за влияние на мышление и поведение.
Интеграция рекламы в чатботах создает дополнительный этический конфликт, когда личная информация пользователя может быть монетизирована через рекламодателей.
Эксперты подчеркивают: генеративные модели — не объективные советчики, а алгоритмическое "зеркало", склонное подтверждать запросы и убеждения пользователя, особенно если такова экономическая мотивация платформы.

На фоне экспансии ИИ как инструмента для повседневных и личных задач, индустрия сталкивается с необходимостью внедрять этические ограничения, пересматривать бизнес-модели и совершенствовать методы RLHF для уменьшения риска искажения обратной связи.

PubMag

Чат-боты с ИИ говорят пользователям то, что им хочется услышать — и это проблема

Читайте также