Новая AI-модель Olmo 2 1B от Ai2 превзошла аналоги от Google, Meta и Alibaba

Исследовательский институт Ai2 представил новый лёгкий AI-модель Olmo 2 1B с открытым исходным кодом, которая превзошла сопоставимые по размеру разработки от Google, Meta и Alibaba на ряде бенчмарков. Содержит 1 млрд параметров и распространяется под свободной лицензией Apache 2.0 через платформу Hugging Face. Полный стек данных и кода, включая датасеты Olmo-mix-1124 и Dolmino-mix-1124, доступен для самостоятельного воспроизведения.

Olmo 2 1B предназначен для работы на обычных ноутбуках и мобильных устройствах, в отличие от более тяжёлых моделей. Он показал лучшие результаты на тестах GSM8K (арифметика) и TruthfulQA (фактическая точность), опередив Google Gemma 3 1B, Meta Llama 3.2 1B и Alibaba Qwen 2.5 1.5B.

Модель была обучена на 4 трлн токенов, включая публичные, синтезированные и вручную отобранные источники. Ai2 подчёркивает риски использования: возможны токсичные или ошибочные выводы, поэтому не рекомендует применять модель в продакшене. Появление Olmo 2 1B подчёркивает тренд на демократизацию генеративного ИИ и разработку «малых» моделей, способных на многое при меньших ресурсах.

← Назад в лентуЧитать оригинал →