Китайские технологические гиганты ускоряют глобальную гонку за ИИ. ByteDance и Alibaba Cloud представили новые модели генерации изображений, разработанные для конкуренции с Google Nano Banana Pro.
Запуски свидетельствуют о растущей конкуренции между Китаем и Соединенными Штатами в области креативных инструментов искусственного интеллекта. Обе компании стремятся снизить затраты при одновременном повышении производительности бизнеса и индивидуальных разработчиков.
Версия Seedream 5.0 от ByteDance теперь доступна для бета-тестирования на Jimeng в Китае и на CapCut по всему миру. Компания заявляет, что модель обладает более развитыми навыками логического мышления и лучше понимает сложные подсказки.
Это позволяет пользователям редактировать определенные части изображения, не изменяя дизайн целиком. В одном из тестов была создана сцена “снежной ночи”, которая позже была изменена путем включения и выключения освещения, а остальное осталось без изменений.
Запуск основан на недавней модели AI-видео от ByteDance Seedance 2.0, которая фокусируется на реалистичных видеороликах, созданных с помощью искусственного интеллекта.
Qwen-Image-2.0 от Alibaba Cloud объединяет создание изображений и их редактирование в единой системе. Она поддерживает до 1000 подсказок и создает изображения с разрешением 2K.
Модель может обрабатывать структурированные макеты, многопанельные дизайны и согласованные символы в разных сценах. Она также отлично справляется с отображением китайского текста и сложной каллиграфии.
В совокупности эти запуски позиционируют обе компании как серьезных мировых конкурентов в области креативных инструментов на базе искусственного интеллекта.
Сравнение основных характеристик:
| Особенность | ByteDance Seedream 5.0 | Alibaba Qwen-Изображение 2.0 | Google Nano Banana Pro |
|---|---|---|---|
| Разработчик | ByteDance | Alibaba Cloud (команда Qwen) | Google DeepMind (Gemini) |
| Основная функция | Преобразование текста в изображение + редактирование | Создание унифицированных изображений + редактирование | Создание изображений + расширенное редактирование |
| Собственное разрешение вывода | Поддержка вывода 2K и 4K | Собственный вывод в формате 2K (2048 × 2048) | Вывод с разрешением до 4K |
| Обработка подсказок | Разработан для детального понимания подсказок | Поддерживает длинные подсказки (до ~ 1 тыс. токенов) | Расширенная генерация на основе подсказок (официальное ограничение по токенам не указано) |
| Рендеринг текста | Генерирует разборчивый текст в изображениях | Четкая типографика и структурированный рендеринг текста | Расширенный многоязычный рендеринг текста |
| Интеграция генерации и редактирования | Поддерживает выборочное редактирование изображений | Создание и редактирование изображений в одной модели | Интегрированные инструменты для создания и редактирования изображений |
| Доступность | Бета-тестирование проводится на платформах Jimeng (Китай) и CapCut (по всему миру) | Доступно на платформах Qwen | Доступно через приложения Gemini и Google AI tools |
| База модели / движок | Запатентованная модель Seedream | Мультимодальная архитектура Qwen | Построена на основе Gemini 3 Pro Image |















