Китайские ByteDance и Alibaba сражаются с Google Nano Banana в войне изображений с помощью искусственного интеллекта

Китайские технологические гиганты ускоряют глобальную гонку за ИИ. ByteDance и Alibaba Cloud представили новые модели генерации изображений, разработанные для конкуренции с Google Nano Banana Pro.

Запуски свидетельствуют о растущей конкуренции между Китаем и Соединенными Штатами в области креативных инструментов искусственного интеллекта. Обе компании стремятся снизить затраты при одновременном повышении производительности бизнеса и индивидуальных разработчиков.

Наши социальные сети: MAX, Telegram, VK, Dzen, Rutube

Версия Seedream 5.0 от ByteDance теперь доступна для бета-тестирования на Jimeng в Китае и на CapCut по всему миру. Компания заявляет, что модель обладает более развитыми навыками логического мышления и лучше понимает сложные подсказки.

Это позволяет пользователям редактировать определенные части изображения, не изменяя дизайн целиком. В одном из тестов была создана сцена “снежной ночи”, которая позже была изменена путем включения и выключения освещения, а остальное осталось без изменений.

Запуск основан на недавней модели AI-видео от ByteDance Seedance 2.0, которая фокусируется на реалистичных видеороликах, созданных с помощью искусственного интеллекта.

Qwen-Image-2.0 от Alibaba Cloud объединяет создание изображений и их редактирование в единой системе. Она поддерживает до 1000 подсказок и создает изображения с разрешением 2K.

Модель может обрабатывать структурированные макеты, многопанельные дизайны и согласованные символы в разных сценах. Она также отлично справляется с отображением китайского текста и сложной каллиграфии.

В совокупности эти запуски позиционируют обе компании как серьезных мировых конкурентов в области креативных инструментов на базе искусственного интеллекта.

Сравнение основных характеристик:

Особенность	ByteDance Seedream 5.0	Alibaba Qwen-Изображение 2.0	Google Nano Banana Pro
Разработчик	ByteDance	Alibaba Cloud (команда Qwen)	Google DeepMind (Gemini)
Основная функция	Преобразование текста в изображение + редактирование	Создание унифицированных изображений + редактирование	Создание изображений + расширенное редактирование
Собственное разрешение вывода	Поддержка вывода 2K и 4K	Собственный вывод в формате 2K (2048 × 2048)	Вывод с разрешением до 4K
Обработка подсказок	Разработан для детального понимания подсказок	Поддерживает длинные подсказки (до ~ 1 тыс. токенов)	Расширенная генерация на основе подсказок (официальное ограничение по токенам не указано)
Рендеринг текста	Генерирует разборчивый текст в изображениях	Четкая типографика и структурированный рендеринг текста	Расширенный многоязычный рендеринг текста
Интеграция генерации и редактирования	Поддерживает выборочное редактирование изображений	Создание и редактирование изображений в одной модели	Интегрированные инструменты для создания и редактирования изображений
Доступность	Бета-тестирование проводится на платформах Jimeng (Китай) и CapCut (по всему миру)	Доступно на платформах Qwen	Доступно через приложения Gemini и Google AI tools
База модели / движок	Запатентованная модель Seedream	Мультимодальная архитектура Qwen	Построена на основе Gemini 3 Pro Image

AppSetter | Android | ПК | Новости | Сравнения и обзоры