Xiaomi продолжает неуклонно продвигаться к выпуску моделей с большим количеством языков. После представления MiMo-7B в мае 2025 года и последующего выпуска MiMo-V2-Flash в декабре Xiaomi анонсировала три новые модели: MiMo-V2-Pro, MiMo-V2-Omni и MiMo-V2-TTS.
Все три приложения уже интегрированы в собственную экосистему Xiaomi, включая MiMo Studio, Xiaomi Browser и Kingsoft Office, а также доступны через инструменты для разработчиков, такие как OpenClaw, OpenCode и Cline. Для разработчиков также предусмотрена бесплатная пробная версия на одну неделю.
Xiaomi MiMo-V2-Pro
Главная модель — MiMo-V2-Pro, которую Xiaomi позиционирует как флагманскую для того, что она называет “эрой агентов”. Он рассчитан на большие рабочие нагрузки в реальном мире, его общий объем составляет более 1 ТБАЙТ, а контекстное окно — 1 МБ.

Xiaomi утверждает, что MiMo-V2-Pro может выполнять сложные задачи, такие как организация рабочего процесса и долгосрочное планирование, без участия человека, особенно в рамках агентских платформ. Компания также заявляет, что ее производительность близка к таким моделям, как Claude Opus 4.6, при этом использование API обходится значительно дешевле. Цены начинаются от 1 доллара за миллион токенов для ввода в небольших контекстах и увеличиваются для более крупных.
Модель интегрирована в инструменты Kingsoft WPS Office, где она может работать с Word, Excel, PowerPoint и PDF-файлами.
Xiaomi MiMo-V2-Omni и MiMo-V2-TTS.
MiMo-V2-Omni использует другой подход для решения мультимодальных задач. Он предназначен для совместной обработки аудио, изображений и видео, и Xiaomi заявляет о высокой производительности в таких областях, как понимание звука и визуальное мышление.
Модель способна обрабатывать длинные аудиосигналы, сценарии с несколькими динамиками и комбинированный анализ аудио-видео, что указывает на более широкие возможности использования, помимо текста. Xiaomi заявляет, что в некоторых случаях ее качество звука превосходит даже такие модели, как Gemini 3 Pro.

Между тем, MiMo-V2-TTS — это модель синтеза речи Xiaomi. Здесь вы можете настраивать тон, эмоции и стиль речи на детальном уровне. Xiaomi заявляет, что она может обрабатывать все, от естественного разговора до пения, с поддержкой нескольких диалектов китайского языка.
Все три модели теперь доступны через API-платформу Xiaomi по относительно выгодным ценам. Большинство крупных технологических компаний создают аналогичные пакеты текстовых, мультимодальных и голосовых моделей. Примечательно, насколько быстро Xiaomi внедряет новые технологии и насколько тесно эти модели вплетены в существующую программную экосистему.















