Xiaomi официально запустила режим UltraSpeed для MiMo-V2.5-Pro — крупной языковой модели из семейства MiMo. Решение, созданное совместно с TileRT, позволяет модели с 1 трлн параметров работать на универсальных GPU и преодолеть барьер в 1 000 токенов в секунду при генерации.
По словам Xiaomi, добиться такого результата удалось за счет «предельного совместного проектирования» самой модели и системной части.

Для сравнения: MiMo-V2-Flash, более ранняя модель линейки, уже в момент запуска в декабре 2025 года выдавала 150 токенов в секунду. Это примерно 110 слов в секунду — то есть ИИ формирует текст быстрее, чем самый быстрый человек успевает читать или говорить.
Новый режим UltraSpeed заметно поднимает планку: Xiaomi заявляет примерно о десятикратном приросте скорости по сравнению со стандартным доступом к MiMo-V2.5-Pro через API.
Режим Xiaomi MiMo-V2.5-Pro UltraSpeed стоит дороже
За прирост скорости приходится платить. Буквально. API MiMo-V2.5-Pro-UltraSpeed стоит в 3 раза дороже стандартного тарифа. Для сравнения, обычный MiMo-V2.5-Pro берет 0.025 юаня за миллион токенов при попадании в кэш, 3 юаня за ввод при промахе кэша и 6 юаней за миллион токенов на вывод.
При этом Xiaomi отмечает, что UltraSpeed — это «рост цены в 3 раза», но при этом «опыт вывода в 10 раз быстрее». Также Token Plan для UltraSpeed не поддерживается — доступ предоставляется только в рамках API trial.

Из-за ограниченного запаса высокоскоростных ресурсов для инференса Xiaomi проводит заявочный тестовый доступ с 9 по 23 июня 2026 года. Гарантированных сроков одобрения и процента успешных заявок нет, при этом компания обещает отдавать приоритет корпоративным клиентам и профессиональным разработчикам с реальными бизнес-задачами.
Пользователи, получившие одобрение, смогут бесплатно пользоваться Chat в течение двух недель. При этом действуют ограничения: не более 10 запросов в очереди на аккаунт в день, длительность сессии — до 30 минут, а при простое более 5 минут ресурсы автоматически освобождаются.
Сам MiMo-V2.5-Pro вышел в апреле 2026 года как часть расширяющегося семейства моделей Xiaomi, которое теперь включает текстовые, голосовые и мультимодальные возможности.
Этот релиз полезен прежде всего тем, кто работает с генерацией текста и интеграцией ИИ через API: UltraSpeed дает заметный прирост скорости, что может быть важно для тестов, прототипов и прикладных сценариев. При этом условия доступа и более высокая цена показывают, что режим рассчитан не на массовое использование, а на задачи с повышенной нагрузкой.















