Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты

Статья разбирает, как обычные действия в приложениях и играх превращаются в обучающие данные для ИИ. Главная мысль проста: ценный датасет часто возникает не в отдельном проекте по разметке, а внутри уже работающего цифрового сервиса, где пользователь решает свою задачу, а платформа параллельно собирает сигналы о мире, поведении и маршрутах.

Кейс Pokémon Go здесь показан не как курьез, а как инфраструктурная история. Niantic годами строила AR-слой вокруг визуального позиционирования, 3D-карт и сканов, которые пользователи создают смартфоном, а затем начала использовать этот массив для Large Geospatial Model и пространственного ИИ. Игровая механика побуждает человека сканировать объект или пространство, после чего из многовидовых изображений и привязанных к местности наблюдений собираются пространственные датасеты, системы визуального позиционирования и модели среды; позже эти наработки вышли за пределы игры и дошли до партнерства с Coco Robotics для роботов-доставщиков.

Тот же принцип давно работает и в других сценариях. reCAPTCHA совмещала защиту от ботов с распознаванием слов, которые не смог прочитать OCR: в статье Science 2008 года говорится, что OCR ошибался примерно на 20% слов в старых печатных материалах, подозрительные слова действительно были проблемными в 96% случаев, точность итогового распознавания превышала 99%, а система уже тогда работала более чем на 40 тысячах сайтов и помогла распознать свыше 440 миллионов слов. Strava Metro агрегирует и обезличивает траектории движения для городской аналитики, но исследование 2025 года напоминает об ограниченной репрезентативности такой аудитории, а Waze for Cities дает городам и службам живые данные о перекрытиях, ремонтах, авариях и пробках, которые полезны не только людям, но и навигационным ИИ-системам.

Отдельный слой — игры и виртуальные среды как источник данных о принятии решений и восприятии пространства. Для StarCraft II исследователи отфильтровали почти 5 миллионов игр по версиям 4.8.2–4.9.2, затем выбрали около 1,4 миллиона матчей игроков с MMR выше 3500 и получили 3,5 миллиарда обучающих наблюдений; при этом в такой сложной среде даже простое копирование сильной человеческой игры оказывается мощной стартовой точкой. А GTA V и подобные среды дают синтетические данные для распознавания объектов, оценки глубины, сегментации сцены, SLAM и навигации: в них можно быстро менять освещение, погоду, плотность трафика и положение камер, чтобы дешевле собирать большие наборы данных для робототехники и автономного транспорта.

Коротко

  • Niantic использовала сканы и изображения из Pokémon Go и Scaniverse для визуального позиционирования, 3D-карт и Large Geospatial Model.
  • В reCAPTCHA человек одновременно проходил проверку и помогал распознавать слова из OCR-пайплайна; в 2008 году система работала на 40 тыс. сайтов.
  • Strava Metro полезна для анализа городской мобильности, но исследование 2025 года отмечает: аудитория сервиса не полностью совпадает с населением города.
  • Для StarCraft II из почти 5 млн игр отобрали около 1,4 млн матчей сильных игроков и получили 3,5 млрд наблюдений для обучения на реплеях.
  • GTA V и похожие виртуальные среды позволяют быстро собирать синтетические данные для SLAM, распознавания объектов, глубины и навигации без дорогих выездов.

FAQ

Зачем ИИ-системам собирать данные из повседневных действий пользователей в играх, навигаторах и других сервисах, а не только из специально размеченных датасетов?

Потому что такие действия дают живые сигналы о пространстве, маршрутах, объектах и выборе человека в реальной среде. Это особенно важно для пространственного ИИ, навигации, робототехники и смешанной реальности.

Как именно данные из Pokémon Go превращаются из игрового взаимодействия в основу для навигации и работы систем, которые ориентируются в физическом мире?

Игра мотивирует пользователя сканировать объекты и пространство вокруг себя, а система получает многовидовые изображения и наблюдения, привязанные к местности. Из них строят 3D-представления сцены, визуальное позиционирование и модели среды, которые можно применять уже вне игры.

Почему исследователи используют для обучения ИИ не только реальные данные, но и реплеи StarCraft II или синтетические сцены из GTA V?

Такие источники дешевле и масштабнее ручного сбора, а еще дают доступ к сложным сценариям принятия решений и восприятия среды. При этом реплеи показывают человеческие стратегии, а виртуальные сцены позволяют быстро генерировать большие наборы данных с контролируемыми условиями.

Читайте также

  1. LLM-агент для поиска свободных доменов: автоматизация подбора
  2. Бесплатный API для нейросетей от NVIDIA: более 100 моделей, OpenAI-совместимый эндпоинт и 40 запросов в минуту
  3. Когда, зачем и как правильно начинать новую сессию в Claude Code
  4. Продакт в 2026 году: чем занимается, как им стать и почему цифровому бизнесу без него никуда
  5. ИИ для управления проектами. Для чего его на самом деле применяют российские организации
Ключевые инсайты из новости (по версии ChatGPT)
  • Побочные пользовательские действия можно проектировать как источник обучающих данных: Полезный датасет не обязательно собирать отдельным исследовательским проектом: он может формироваться как побочный продукт уже востребованного пользовательского сценария. Для продуктовых команд это означает, что механика сервиса, интерфейс и тип действий пользователя можно изначально проектировать так, чтобы они одновременно решали пользовательскую задачу и создавали данные для обучения моделей.
    [AI / Data Strategy]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!