Прогноз по мировому ИИ на 2026 год: конец эпохи хайпа и начало эпохи эффективности
К концу 2025-го рынок ИИ смещается от дорогого обучения к энергоэффективному инференсу: универсальные GPU
Nvidia уступают специализированным TPU и Trainium.
Google TPU v7 дают в 4,7 раза лучшую производительность на доллар и на 67% меньшее энергопотребление на токен; AWS Trainium3 обеспечивает до 4,4-кратного роста вычислительной мощности и 4-кратную энергоэффективность, а Trainium4 интегрируется с NVLink, снимая барьер миграции с CUDA.
Тренд закрепляют крупные сделки: альянс Google и
Anthropic на развёртывание до 1 млн TPU и более 1 ГВт мощностей, партнёрство
OpenAI и Broadcom вокруг кастомных чипов под инфраструктуру на 10 ГВт, выход Qualcomm с линейкой AI200/250 и проектом на 200 МВт. На фоне оценки стройки дата-центра на 1 ГВт в ~50 млрд долларов, из которых около 35 млрд — чипы Nvidia, переход на ASIC и собственные чипы становится вопросом выживания экономики облака.
На уровне моделей 2026-й обещает взлёт «маленьких» LLM до 10B параметров, которые уже догоняют GPT-4o, распространение on-premise-развёртываний, рост агентных сценариев и лидерство Китая с сотней open source-моделей
DeepSeek/Qwen и MoE-архитектурами, снижающими стоимость токена в разы. Параллельно нарастает риск DarkOpenrouter-экосистем, DaaS-сервисов обмана и требований аудитовать использование LLM и агентов.
Авторы прогнозируют «экономический дарвинизм»: волну закрытий и M&A среди AI-сервисов, рост вертикальной интеграции стека «от транзистора до токена», гибридный контур из SLM on-prem + тяжёлых облачных моделей, первый крупный физический инцидент из-за ИИ-агента и фрагментацию регулирования (
США,
ЕС, Китай), при которой выигрывают не самые большие модели, а эффективные интеграции AI в реальные бизнес-процессы.
Читайте также
Как OpenAI похоронила традиционный BI — и что пришло ему на смену
Обновлённый Sonnet от Anthropic лучше использует компьютер — и временами проявляет экзистенциальную тревогу
Как оптимизация промптов превратилась из шаманства в инженерную дисциплину
Заглянуть под капот ИИ-агентов: новый инструмент раскрывает «магию» Claude Code
Российские нейросети наращивают веб-аудиторию
- Экономика инференса и специализированные AI-чипы: Сдвиг фокуса с обучения на энергоэффективный инференс меняет экономику железа: специализированные TPU/Trainium и другие ASIC дают кратный выигрыш по цене токена и энергопотреблению по сравнению с универсальными GPU. Для крупных GenAI-проектов ключевым становится не пик производительности, а стоимость инференса на токен и возможность масштабировать кластеры до сотен МВт–ГВт.
[ИИ-инфраструктура]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться