Бесплатные AI-модели от Alibaba: 1 млн токенов на каждую модель Qwen в Сингапуре
- Бесплатная квота заявлена как 1 000 000 токенов на каждую модель отдельно (не на аккаунт): Qwen-Max, Qwen-Plus, Qwen-Flash, Qwen3-Coder-Plus и другие.
- Срок действия квоты — 90 дней с момента активации.
- Через API доступна линейка Qwen3, включая мультимодальные модели (текст+изображения), OCR с поддержкой русского, а также аудио/видео-мультимодальность.
- По умолчанию после исчерпания квоты начинается платное потребление; переключатель Free Quota Only заставляет API возвращать ошибку AllocationQuota.FreeTierOnly вместо списаний.
- Ограничения включают привязку к Singapore region (International Edition), покрытие только real-time inference, платность batch-вызовов и context cache, несовместимость API-ключей Сингапура и Пекина, а также раздельные квоты по моделям.
Почему это важно: Предложение снижает барьер для экспериментов с линейкой Qwen, потому что лимит выделяется на каждую модель отдельно. Для проектов с контролем затрат критична механика, где переход на платное потребление происходит автоматически после исчерпания квоты. Совместимость API с
OpenAI SDK упрощает перенос интеграций и ускоряет тестирование гипотез.
На что обратить внимание: В тексте отдельно оговорено, что квота работает только в Singapore region (International Edition) и покрывает лишь real-time inference, тогда как batch и context cache оплачиваются отдельно. Также отмечено, что API-ключи разных регионов не взаимозаменяемы, а квота считается по моделям и не объединяется между вариантами вроде qwen-max и qwen-max-latest. В качестве следующего шага в заметке описаны активация квоты через принятие условий, получение ключа в консоли и включение режима Free Quota Only для выбранных моделей.
Читайте также
Четыре проекта на Kwork, которые автор отклонил, и почему
Ваша LLM стримит в никуда: разбираемся, как работать с дисконнектами в FastAPI
Промпты для ИИ: как писать запросы для нейросетей и получать лучший результат
ИИ для PHP-разработчиков. Часть 2: практическое использование TransformersPHP
ИИ-сленг в 2026 году: датасет, лосс, RAG и ещё 50 терминов — базовый минимум индустрии
- Free-tier квота Qwen в Alibaba Cloud Model Studio: считается по моделям: В Alibaba Cloud Model Studio (Singapore region, International Edition) для новых пользователей действует бесплатная квота 1 000 000 токенов не на аккаунт, а на каждую модель Qwen отдельно. Квоты разных моделей не объединяются и не “шарятся” между собой, а варианты вроде qwen-max и qwen-max-latest считаются разными квотами. Срок действия квоты — 90 дней с момента активации.
[AI-провайдеры и квоты]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Alibaba Cloud Model Studio в сингапурском регионе даёт новым пользователям бесплатную квоту 1 000 000 токенов на каждую модель Qwen. В заметке перечислены условия, ограничения и механика защиты от случайных списаний после исчерпания лимита.