Сбер запустил Kandinsky 6.0 Image: новая нейросеть для редактирования изображений в ГигаЧате

Сбер анонсировал выпуск обновленной нейросети Kandinsky 6.0 Image, интегрированной в ИИ-помощник GigaChat. Модель предназначена для создания изображений с нуля и редактирования существующих фотографий по текстовым запросам. Инструмент доступен во всех версиях GigaChat — веб, мобильное приложение и мессенджеры — и работает без ограничений по количеству генераций.

Сбер запустил Kandinsky 6.0 Image: новая нейросеть для редактирования изображений в GigaChat

Новая версия получила улучшенные алгоритмы точного редактирования и расширенный набор функций для работы с деталями. Компания перешла на архитектуру Mixture of Experts, что повлияло на скорость обработки запросов и качество результата. Обновление делает редактирование изображений базовой функцией экосистемы, а не специализированным инструментом.Kandinsky 6.0 Image работает по принципу загрузки изображения или текстового описания желаемого результата. Модель создает картинку с нуля либо вносит изменения в загруженное фото. Основное улучшение касается точности редактирования — теперь можно добавлять объекты в кадр, удалять детали, менять прическу, применять фильтры или комбинировать элементы из разных изображений. При внесении правок в один элемент остальная часть изображения сохраняется без искажений. Модель лучше справляется со сложными композициями: интерьерами, сервировкой столов, групповыми портретами и кадрами с большим количеством деталей. Количество ошибок сократилось, а генерация текста на изображениях стала корректнее.

В шестую версию добавлен режим реставрации фотографий. Kandinsky 6.0 восстанавливает четкость старых, выцветших или поврежденных снимков. Еще одна функция — нейрофотосессия, где модель берет одно фото человека и создает серию новых кадров с измененным фоном, одеждой или локацией. Сбер интегрировал в модель технологию Image RAG — поиск по изображениям. Эта функция решает проблему с актуальными объектами, персонажами или визуальными трендами, которые появились после завершения обучения модели. Если Kandinsky не знает, как выглядит запрашиваемый объект, система находит референс и использует его при генерации.

Для использования Kandinsky 6.0 Image дополнительных действий не требуется — модель уже интегрирована в GigaChat. Пользователь открывает веб-версию, мобильное приложение или чат в мессенджере, загружает изображение и описывает необходимые изменения. Доступные операции включают удаление предметов из кадра, восстановление старых фотографий, примерку образов, замену фона и стилизацию под аниме, комикс или мультфильм. Созданные изображения можно использовать для видео через модель Kandinsky Video, которая анимирует статичные картинки.

Сбер встраивает редактирование изображений в базовый функционал GigaChat, расширяя применение за рамки профессионального дизайна. Набор сценариев охватывает ретушь, макияж, карточки товаров, рекламные макеты, интерьеры и контент для социальных сетей. По данным компании, пользователи GigaChat создали несколько сотен миллионов изображений. Переход на архитектуру Mixture of Experts означает, что модель не задействует все вычислительные блоки на каждый запрос, а выбирает специализированные части под конкретную задачу. Это обеспечивает рост производительности и качества обработки. Представители Сбера заявили о планах расширения возможностей работы с видеоконтентом в ближайшее время. Kandinsky 6.0 Image превращает GigaChat в комплексное решение для быстрой правки фотографий и генерации визуального контента.

Читайте также:

neuronews.by

Сбер запустил Kandinsky 6.0 Image: новая нейросеть для редактирования изображений в ГигаЧате

Последние новости: