Главная » Статьи » Финансы » Сбер представил Kandinsky 2.0 — первую российскую диффузионную модель для генерации изображений по тексту на разных языках

Сбер представил Kandinsky 2.0 — первую российскую диффузионную модель для генерации изображений по тексту на разных языках

23.11.2022

На международной конференции по искусственному интеллекту (ИИ) Artificial Intelligence Journey Сбер представил Kandinsky 2.0 — первую российскую мультиязычную диффузионную модель для генерации изображений по текстовому описанию с 2 млрд параметров.

Нейросеть разработали и обучили исследователи Sber AI при партнёрской поддержке ученых из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и SberDevices из 1 млрд пар «текст — изображение». Увидеть, как она рисует, можно на сайте FusionBrain, а также при помощи команды «Запусти художника» на умных устройствах Sber и в мобильном приложении Салют.

FusionBrain.ai – открытый портал для демонстрации моделей, приближающих мир к созданию AGI (Artificial General Intelligence, сильный искусственный интеллект) от Института AIRI, который Сбер решил поддержать, первым выложив свою модель на ресурсе. В будущем на сайте FusionBrain.ai будут доступны как генеративные, так и передовые мультимодальные и мультизадачные модели.

В Kandinsky 2.0 разработчики использовали набирающий популярность диффузионный подход, поскольку модели подобной архитектуры, в отличие от трансформеров, дают хорошие результаты почти во всех задачах генерации мультимедийного контента по текстовому описанию (синтез изображений, видео, 3D и аудио).

Модель способна одинаково быстро и качественно обрабатывать запросы на 101 языке. Среди них как распространённые русский и английский, так и более редкие, например, монгольский. Система поймёт задачу, даже если в одном запросе будут слова на разных языках.

Kandinsky 2.0 отличается от своего предшественника более сочной, глубокой и реалистичной картинкой и расширенными возможностями. На сайте FusionBrain изображения можно генерировать в 20 различных стилях, среди которых ренессанс, классицизм, мультипликация, Новый год и даже хохлома. В модели также реализованы функции inpainting (замена любой части изображения и любого объекта на изображении на сгенерированные нейросетью) и outpainting (возможность дорисовывать готовое изображение и фон вокруг картинки).

Кроме того, в Kandinsky 2.0 пользователи могут оценить, как одинаковые с точки зрения смысла лингвистические конструкции и понятия отличаются в зависимости от языка и культурной окраски. Например, если сформулировать запрос «национальное блюдо» на русском языке, нейросеть чаще всего рисует щи, а на японском это будет мисо суп и суши.

Александр Ведяхин, первый заместитель Председателя Правления Сбербанка:

«Мы продолжаем развивать решения для автоматической генерации изображений по описанию на естественном языке — так называемый креативный ИИ. Kandinsky 2.0, который пришёл на смену первой версии модели, — прорыв в этой сфере. Наша модель позволяет за несколько секунд получить уникальную картинку под конкретную задачу и свободно распространять её без лицензии, что очень актуально для бизнеса. Генеративные модели развиваются очень быстро: ещё четыре года назад даже постановку такой задачи сложно было представить, а сегодня мы имеем работающую модель, которая понимает 101 язык и рисует реалистичные изображения, которые зачастую неотличимы от тех, что создают люди».

Материалы по теме:

Т2 первой на телеком-рынке начисляет проценты на остаток минут и гигабайтов

Т2 дарит бесплатную связь ветеранам Великой Отечественной войны

Т2 выводит «Понедельники» на новый уровень: теперь подарками можно делиться с друзьями

Советуем почитать

Здравоохранение

15 май 2025 10:49

15
май
10:49 layer up

Республиканский госпиталь ветеранов войн стал призером всероссийского конкурса

Республиканский госпиталь стал призёром Всероссийского конкурса «Лучший госпиталь ветеранов войн». Награду от Министра здравоохранения России Михаила Мурашко получил главврач Ренат Аширов.

Подробнее...

14 май 2025 16:21

14
май
16:21 layer up

В Саранске началось строительство нового корпуса Республиканского онкодиспансера

В столице Мордовии началась реконструкция Республиканского онкологического диспансера по адресу ул. Ульянова, д. 30. На месте старого корпуса появится новое современное здание, отвечающее современным нормативным требованиям. Строительство ведется под контролем инспекторов ФБУ «РосСтройКонтроль».

Подробнее...

28 апрель 2025 10:00

28
апрель
10:00 layer up

Поздравление Главы Мордовии с Днём работника скорой медицинской помощи

Уважаемые работники скорой медицинской помощи! От всей души поздравляю вас с профессиональным праздником!

Подробнее...

18 март 2025 12:13

18
март
12:13 layer up

В Мордовии за неделю вновь зарегистрировано 5 случаев коронавируса

В Мордовии с с 10 по 16 марта зарегистрировано 5 случаев коронавируса, как и неделей раньше. 8 человек выздоровели за этот период, на минувшей неделе выписали четверых пациентов. Статистику публикует портал Объясняем.рф.

Подробнее...

11 март 2025 11:39

11
март
11:39 layer up

В Мордовии за неделю зарегистрировано 5 случаев коронавируса

В Мордовии с 3 по 9 марта зарегистрировано 5 случаев коронавируса, на 3 меньше, чем неделей раньше. 4 человека выздоровели за этот период, на минувшей неделе выписали 8 пациентов. Статистику публикует портал Объясняем.рф.

Подробнее...

«Ростелеком» лидирует на рынке голосовых решений для бизнеса

«Посети ты Апатиты» — у заполярного города появился новый гимн из сериала «ВИА “Васильки”» от Wink.ru

Зло уже пробудилось: премьера триллера «Фишер. Затмение» на Wink.ru состоится 29 мая

График плановых отключений электроэнергии