Китайские технологические гиганты ускоряют глобальную гонку за ИИ. ByteDance и Alibaba Cloud представили новые модели генерации изображений, разработанные для конкуренции с Google Nano Banana Pro.

Запуски свидетельствуют о растущей конкуренции между Китаем и Соединенными Штатами в области креативных инструментов искусственного интеллекта. Обе компании стремятся снизить затраты при одновременном повышении производительности бизнеса и индивидуальных разработчиков.

Наши социальные сети: Telegram, VK, Dzen, Rutube

Версия Seedream 5.0 от ByteDance теперь доступна для бета-тестирования на Jimeng в Китае и на CapCut по всему миру. Компания заявляет, что модель обладает более развитыми навыками логического мышления и лучше понимает сложные подсказки.

Это позволяет пользователям редактировать определенные части изображения, не изменяя дизайн целиком. В одном из тестов была создана сцена “снежной ночи”, которая позже была изменена путем включения и выключения освещения, а остальное осталось без изменений.

Запуск основан на недавней модели AI-видео от ByteDance Seedance 2.0, которая фокусируется на реалистичных видеороликах, созданных с помощью искусственного интеллекта.

Qwen-Image-2.0 от Alibaba Cloud объединяет создание изображений и их редактирование в единой системе. Она поддерживает до 1000 подсказок и создает изображения с разрешением 2K.

Модель может обрабатывать структурированные макеты, многопанельные дизайны и согласованные символы в разных сценах. Она также отлично справляется с отображением китайского текста и сложной каллиграфии.

В совокупности эти запуски позиционируют обе компании как серьезных мировых конкурентов в области креативных инструментов на базе искусственного интеллекта.

Сравнение основных характеристик:

Особенность ByteDance Seedream 5.0 Alibaba Qwen-Изображение 2.0 Google Nano Banana Pro
Разработчик ByteDance Alibaba Cloud (команда Qwen) Google DeepMind (Gemini)
Основная функция Преобразование текста в изображение + редактирование Создание унифицированных изображений + редактирование Создание изображений + расширенное редактирование
Собственное разрешение вывода Поддержка вывода 2K и 4K Собственный вывод в формате 2K (2048 × 2048) Вывод с разрешением до 4K
Обработка подсказок Разработан для детального понимания подсказок Поддерживает длинные подсказки (до ~ 1 тыс. токенов) Расширенная генерация на основе подсказок (официальное ограничение по токенам не указано)
Рендеринг текста Генерирует разборчивый текст в изображениях Четкая типографика и структурированный рендеринг текста Расширенный многоязычный рендеринг текста
Интеграция генерации и редактирования Поддерживает выборочное редактирование изображений Создание и редактирование изображений в одной модели Интегрированные инструменты для создания и редактирования изображений
Доступность Бета-тестирование проводится на платформах Jimeng (Китай) и CapCut (по всему миру) Доступно на платформах Qwen Доступно через приложения Gemini и Google AI tools
База модели / движок Запатентованная модель Seedream Мультимодальная архитектура Qwen Построена на основе Gemini 3 Pro Image
Задайте вопрос? Оставьте комментарий
Ваш комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Смотрите так же 👀

Что будем искать? Например,как настроить

Минуту внимания
Мы используем файлы cookies, чтобы обеспечивать правильную работу нашего веб-сайта, а также работу функций социальных сетей и анализа сетевого трафика.