Microsoft выпустила компактную ИИ-модель для сложных рассуждений

представила Phi-4-mini-Flash-Reasoning — компактную языковую модель с открытым исходным кодом, разработанную для логических рассуждений и сложных задач. Содержит всего 3,8 млрд параметров, но работает до 10 раз быстрее предыдущей версии при генерации длинных ответов.

Основной фокус — оптимизация вычислений без потери качества: модель достигает точности 92,45% на тесте Math500, обгоняя предшественника Phi-4-mini-Reasoning (91,2%) и другие открытые модели. Поддерживается контекст до 64 тыс. токенов.

Phi-4-mini-Flash-Reasoning использует новую гибридную архитектуру Sambay, сочетающую слои внимания и SSM с легковесным механизмом Gated Memory Unit (GMU), что снижает задержки при обработке длинных запросов и делает модель пригодной для real-time-сценариев.

Решение доступно на Hugging Face и демонстрирует значительный прогресс в создании компактных моделей с высоким качеством reasoning. Оно также дополняет более широкую инициативу Microsoft, ранее объявившей совместно с и финансирование в $23 млн на обучение 400 тыс. учителей работе с ИИ.

Читайте также

  1. Сэм Альтман: мы предсказали развитие ИИ, но не реакцию общества
  2. Сооснователь Anthropic объяснил отключение Windsurf от Claude: «Было бы странно продавать Claude OpenAI»
  3. Slackbot теперь стал AI-агентом
  4. Вице-президент Google объяснил, почему реклама уместна в AI-поиске, но пока не в Gemini
  5. ChatGPT тестирует загадочную новую функцию “Study Together”
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!