Microsoft выпустила компактную ИИ-модель для сложных рассуждений

представила Phi-4-mini-Flash-Reasoning — компактную языковую модель с открытым исходным кодом, разработанную для логических рассуждений и сложных задач. Содержит всего 3,8 млрд параметров, но работает до 10 раз быстрее предыдущей версии при генерации длинных ответов.

Основной фокус — оптимизация вычислений без потери качества: модель достигает точности 92,45% на тесте Math500, обгоняя предшественника Phi-4-mini-Reasoning (91,2%) и другие открытые модели. Поддерживается контекст до 64 тыс. токенов.

Phi-4-mini-Flash-Reasoning использует новую гибридную архитектуру Sambay, сочетающую слои внимания и SSM с легковесным механизмом Gated Memory Unit (GMU), что снижает задержки при обработке длинных запросов и делает модель пригодной для real-time-сценариев.

Решение доступно на Hugging Face и демонстрирует значительный прогресс в создании компактных моделей с высоким качеством reasoning. Оно также дополняет более широкую инициативу Microsoft, ранее объявившей совместно с и финансирование в $23 млн на обучение 400 тыс. учителей работе с ИИ.

← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!