Бесплатные AI-модели от Alibaba: 1 млн токенов на каждую модель Qwen в Сингапуре

Alibaba Cloud Model Studio в сингапурском регионе даёт новым пользователям бесплатную квоту 1 000 000 токенов на каждую модель Qwen. В заметке перечислены условия, ограничения и механика защиты от случайных списаний после исчерпания лимита.

  • Бесплатная квота заявлена как 1 000 000 токенов на каждую модель отдельно (не на аккаунт): Qwen-Max, Qwen-Plus, Qwen-Flash, Qwen3-Coder-Plus и другие.
  • Срок действия квоты — 90 дней с момента активации.
  • Через API доступна линейка Qwen3, включая мультимодальные модели (текст+изображения), OCR с поддержкой русского, а также аудио/видео-мультимодальность.
  • По умолчанию после исчерпания квоты начинается платное потребление; переключатель Free Quota Only заставляет API возвращать ошибку AllocationQuota.FreeTierOnly вместо списаний.
  • Ограничения включают привязку к Singapore region (International Edition), покрытие только real-time inference, платность batch-вызовов и context cache, несовместимость API-ключей Сингапура и Пекина, а также раздельные квоты по моделям.

Почему это важно: Предложение снижает барьер для экспериментов с линейкой Qwen, потому что лимит выделяется на каждую модель отдельно. Для проектов с контролем затрат критична механика, где переход на платное потребление происходит автоматически после исчерпания квоты. Совместимость API с SDK упрощает перенос интеграций и ускоряет тестирование гипотез.

На что обратить внимание: В тексте отдельно оговорено, что квота работает только в Singapore region (International Edition) и покрывает лишь real-time inference, тогда как batch и context cache оплачиваются отдельно. Также отмечено, что API-ключи разных регионов не взаимозаменяемы, а квота считается по моделям и не объединяется между вариантами вроде qwen-max и qwen-max-latest. В качестве следующего шага в заметке описаны активация квоты через принятие условий, получение ключа в консоли и включение режима Free Quota Only для выбранных моделей.

Читайте также

  1. Четыре проекта на Kwork, которые автор отклонил, и почему
  2. Ваша LLM стримит в никуда: разбираемся, как работать с дисконнектами в FastAPI
  3. Промпты для ИИ: как писать запросы для нейросетей и получать лучший результат
  4. ИИ для PHP-разработчиков. Часть 2: практическое использование TransformersPHP
  5. ИИ-сленг в 2026 году: датасет, лосс, RAG и ещё 50 терминов — базовый минимум индустрии
Ключевые инсайты из новости (по версии ChatGPT)
  • Free-tier квота Qwen в Alibaba Cloud Model Studio: считается по моделям: В Alibaba Cloud Model Studio (Singapore region, International Edition) для новых пользователей действует бесплатная квота 1 000 000 токенов не на аккаунт, а на каждую модель Qwen отдельно. Квоты разных моделей не объединяются и не “шарятся” между собой, а варианты вроде qwen-max и qwen-max-latest считаются разными квотами. Срок действия квоты — 90 дней с момента активации.
    [AI-провайдеры и квоты]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!