Microsoft выпустила компактную ИИ-модель для сложных рассуждений
Microsoft представила Phi-4-mini-Flash-Reasoning — компактную языковую модель с открытым исходным кодом, разработанную для логических рассуждений и сложных задач. Содержит всего 3,8 млрд параметров, но работает до 10 раз быстрее предыдущей версии при генерации длинных ответов.
Основной фокус — оптимизация вычислений без потери качества: модель достигает точности 92,45% на тесте Math500, обгоняя предшественника Phi-4-mini-Reasoning (91,2%) и другие открытые модели. Поддерживается контекст до 64 тыс. токенов.
Phi-4-mini-Flash-Reasoning использует новую гибридную архитектуру Sambay, сочетающую слои внимания и SSM с легковесным механизмом Gated Memory Unit (GMU), что снижает задержки при обработке длинных запросов и делает модель пригодной для real-time-сценариев.
Решение доступно на Hugging Face и демонстрирует значительный прогресс в создании компактных моделей с высоким качеством reasoning. Оно также дополняет более широкую инициативу Microsoft, ранее объявившей совместно с
OpenAI и
Anthropic финансирование в $23 млн на обучение 400 тыс. учителей работе с ИИ.
Читайте также
Сэм Альтман: мы предсказали развитие ИИ, но не реакцию общества
Сооснователь Anthropic объяснил отключение Windsurf от Claude: «Было бы странно продавать Claude OpenAI»
Slackbot теперь стал AI-агентом
Вице-президент Google объяснил, почему реклама уместна в AI-поиске, но пока не в Gemini
ChatGPT тестирует загадочную новую функцию “Study Together”
ИНК