Допрос: Google использует сигналы поиска и данные для обучения моделей Gemini AI

Судебные документы и показания представителей в рамках дела Министерства юстиции подтвердили, что компания активно использует данные поискового движка и пользовательские сигналы для обучения своих AI-моделей и систем генерации AI Overviews. По словам старшего директора по инженерии Google Фироза Параха, поисковые данные применялись на этапе pretrain моделей для AI Overviews, а пользовательский фидбек — для принятия решений о запуске AI-ответов в поисковой выдаче.

Внутренние переписки Google показывают, что поисковые сигналы помогают «повышать вес» авторитетных страниц и занижать позиции спамных и недостоверных ресурсов при обучении ИИ. Подобный подход способствует повышению качества и достоверности AI-ответов в продуктах Google Search, AI Mode и Gemini. Несмотря на ранние заявления компании о подобных практиках, только сейчас они получили публичное подтверждение на уровне судебных слушаний.

Читайте также

  1. Рекламная выручка Google выросла на 8,5%, AI Overviews — у 1,5 млрд пользователей ежемесячно
  2. Google начал показывать AI-ответы для объяснений песенных текстов
  3. AI-краулер Google для Gemini (Google-Extended) поддерживает рендеринг JavaScript
  4. Google запускает AI Mode в США: Deep Search, Live Search, персонализация и агентные сценарии в поиске
  5. AI Overviews от Google: масштабное расширение и 10% рост поисковых запросов
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!