Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты

16.04.2026 • Хабр

Статья разбирает, как обычные действия в приложениях и играх превращаются в обучающие данные для ИИ. Главная мысль проста: ценный датасет часто возникает не в отдельном проекте по разметке, а внутри уже работающего цифрового сервиса, где пользователь решает свою задачу, а платформа параллельно собирает сигналы о мире, поведении и маршрутах.

Кейс Pokémon Go здесь показан не как курьез, а как инфраструктурная история. Niantic годами строила AR-слой вокруг визуального позиционирования, 3D-карт и сканов, которые пользователи создают смартфоном, а затем начала использовать этот массив для Large Geospatial Model и пространственного ИИ. Игровая механика побуждает человека сканировать объект или пространство, после чего из многовидовых изображений и привязанных к местности наблюдений собираются пространственные датасеты, системы визуального позиционирования и модели среды; позже эти наработки вышли за пределы игры и дошли до партнерства с Coco Robotics для роботов-доставщиков.

Тот же принцип давно работает и в других сценариях. reCAPTCHA совмещала защиту от ботов с распознаванием слов, которые не смог прочитать OCR: в статье Science 2008 года говорится, что OCR ошибался примерно на 20% слов в старых печатных материалах, подозрительные слова действительно были проблемными в 96% случаев, точность итогового распознавания превышала 99%, а система уже тогда работала более чем на 40 тысячах сайтов и помогла распознать свыше 440 миллионов слов. Strava Metro агрегирует и обезличивает траектории движения для городской аналитики, но исследование 2025 года напоминает об ограниченной репрезентативности такой аудитории, а Waze for Cities дает городам и службам живые данные о перекрытиях, ремонтах, авариях и пробках, которые полезны не только людям, но и навигационным ИИ-системам.

Отдельный слой — игры и виртуальные среды как источник данных о принятии решений и восприятии пространства. Для StarCraft II исследователи отфильтровали почти 5 миллионов игр по версиям 4.8.2–4.9.2, затем выбрали около 1,4 миллиона матчей игроков с MMR выше 3500 и получили 3,5 миллиарда обучающих наблюдений; при этом в такой сложной среде даже простое копирование сильной человеческой игры оказывается мощной стартовой точкой. А GTA V и подобные среды дают синтетические данные для распознавания объектов, оценки глубины, сегментации сцены, SLAM и навигации: в них можно быстро менять освещение, погоду, плотность трафика и положение камер, чтобы дешевле собирать большие наборы данных для робототехники и автономного транспорта.

Коротко

Niantic использовала сканы и изображения из Pokémon Go и Scaniverse для визуального позиционирования, 3D-карт и Large Geospatial Model.
В reCAPTCHA человек одновременно проходил проверку и помогал распознавать слова из OCR-пайплайна; в 2008 году система работала на 40 тыс. сайтов.
Strava Metro полезна для анализа городской мобильности, но исследование 2025 года отмечает: аудитория сервиса не полностью совпадает с населением города.
Для StarCraft II из почти 5 млн игр отобрали около 1,4 млн матчей сильных игроков и получили 3,5 млрд наблюдений для обучения на реплеях.
GTA V и похожие виртуальные среды позволяют быстро собирать синтетические данные для SLAM, распознавания объектов, глубины и навигации без дорогих выездов.

FAQ

Зачем ИИ-системам собирать данные из повседневных действий пользователей в играх, навигаторах и других сервисах, а не только из специально размеченных датасетов?

Потому что такие действия дают живые сигналы о пространстве, маршрутах, объектах и выборе человека в реальной среде. Это особенно важно для пространственного ИИ, навигации, робототехники и смешанной реальности.

Как именно данные из Pokémon Go превращаются из игрового взаимодействия в основу для навигации и работы систем, которые ориентируются в физическом мире?

Игра мотивирует пользователя сканировать объекты и пространство вокруг себя, а система получает многовидовые изображения и наблюдения, привязанные к местности. Из них строят 3D-представления сцены, визуальное позиционирование и модели среды, которые можно применять уже вне игры.

Почему исследователи используют для обучения ИИ не только реальные данные, но и реплеи StarCraft II или синтетические сцены из GTA V?

Такие источники дешевле и масштабнее ручного сбора, а еще дают доступ к сложным сценариям принятия решений и восприятия среды. При этом реплеи показывают человеческие стратегии, а виртуальные сцены позволяют быстро генерировать большие наборы данных с контролируемыми условиями.

PubMag

Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты

Коротко

FAQ

Зачем ИИ-системам собирать данные из повседневных действий пользователей в играх, навигаторах и других сервисах, а не только из специально размеченных датасетов?

Как именно данные из Pokémon Go превращаются из игрового взаимодействия в основу для навигации и работы систем, которые ориентируются в физическом мире?

Почему исследователи используют для обучения ИИ не только реальные данные, но и реплеи StarCraft II или синтетические сцены из GTA V?

Читайте также