Новости

«Сбер» создал мультимодальную нейросеть, которая генерирует картинки по описанию на русском языке

03.11.2021

«Сбер» объявил о создании первой в мире нейронной сети ruDALL-E, которая способна создавать изображения на основе текстового описания на русском языке. Использовать ее можно для создания вариантов дизайна интерьера, стоковых изображений или векторных иллюстраций, материалов для рекламы, копирайтинга, архитектурного и промышленного дизайна. Попробовать ruDALL-E можно на его сайте.

Нейросеть одновременно обучается на двух видах данных — картинках и текстах, и позволяет создавать неограниченное число новых изображений по заданному описанию. Есть два варианта модели: ruDALL-E XL, содержащая 1,3 млрд параметров; ruDALL-E 12B с 12 млрд параметров.

Моделью ruDALL-E XL можно воспользоваться бесплатно, загрузив её с сервиса Github. Обе модели также вскоре будут доступны на платформе ML Space в хабе предобученных моделей и датасетов DataHub от SberCloud.

Создание изображений при помощи ruDALL-E происходит в три этапа: сначала одна нейросеть принимает текст на вход и генерирует заданное число картинок, затем следующая выбирает, какие из них наиболее удачны и максимально соответствуют описанию, а третья увеличивает их в размере без потери качества. Таким образом можно получить неограниченное количество новых изображений, подходящих под указанные характеристики.

Архитектура модели DALL-E для английского языка была впервые представлена OpenAI в 2021 г., однако эта модель так и не была полностью выложена в открытый доступ. На основе публикации OpenAI команды SberDevices и Sber AI при содействии SberCloud воспроизвели код и запустили обучение нейросети на платформе ML Space на базе суперкомпьютера «Кристофари», получив аналогичный результат для русского языка. В результате получилась самая большая модель такого рода в мире, работающая с русским языком: обучение заняло 23 тыс. GPU-часов на массиве данных из 120 млн пар текст-изображение. Проект по обучению ruDALL-E стал самым большим нейросетевым вычислительным проектом в России и СНГ.

ЧИТАТЬ ТАКЖЕ: Ассоциация разработчиков «Отечественный софт» отчиталась по итогам 2020 года

Давид Рафаловский, исполнительный вице-президент Сбербанка, CTO «Сбера», руководитель блока «Технологии», сказал: «Помимо вклада в прогресс в области ИИ, генерация изображений закрывает две важных потребности современного бизнеса — возможность получить уникальную картинку под собственное описание, а также в любой момент создавать необходимое количество licence-free-иллюстраций. При этом создание «мультимодальных» нейронных сетей, которые обучаются сразу на нескольких видах данных, даже сейчас, в эпоху big data и огромных возможностей поиска, будет очень востребованным, поскольку решает задачи на принципиально ином уровне. Технология пока совсем новая, первые шаги в этом направлении были сделаны только в 2020 г., а еще в 2018—2019 гг. даже постановку такого рода задачи нельзя было себе представить. ruDALL-E можно считать настоящим прорывом для русскоязычной индустрии».

Клиника косметологии в Москве: как выбрать, чтобы не навредить себе и…

Почему стоит пользоваться гидрофильным маслом?

Доставка из Китая в Казахстан: подробное руководство

Виды лазеров для проведения эпиляции

Работа в качестве эскорта: путешествие в уникальное путешествие

Duet V: Революция в омоложении без уколов и скальпеля

Airtouch: искусство окрашивания волос, которое стало трендом

Шлифовка рубцов: методы, эффективность и уход после процедуры

Реконструкция груди после мастэктомии

Профессиональные пилинги: уход за кожей лица на высшем уровне

Микроигольчатый RF-лифтинг: современная технология для омоложения и подтяжки кожи

Как выбрать клинику пластической хирургии

Псевдоблефаропластика: что это такое и кому подходит

Шлифовка рубцов: методика, показания и противопоказания

Массаж ног при варикозе

Профессия сексолога: обучение, обязанности, зарплата

Как сделать клубнику в шоколаде?

Дайте волю своим чувствам: исследование мира оптовых поставщиков парфюмерии и косметики

Подзорная труба

Автоматические кофемашины Krups Espresseria: искусство приготовления кофе дома

Монтаж кондиционеров: особенности, этапы и важность профессионального подхода

Букет из шаров — отличный способ удивить любого

Секреты победы в бильярд

Воробьевы горы — идеальное место для романического свидания

«Сбер» создал мультимодальную нейросеть, которая генерирует картинки по описанию на русском языке

ЭТО ИНТЕРЕСНО

Навка показала букет пионов из своего сада — а на фоне милое фото с...

Atos модернизировала ЦОД группы «Альфастрахование»

Знаменитый сервис «белых» хакеров отключил пользователей из России и Белоруссии и «зажал» их премии

Почему лечить зубы вовремя очень важно.

Создатель «убийц» смартфонов-флагманов начал выпуск «убийцы» дешевых Xiaomi

Выбор редактора

Бессменный ведущий программы «Человек и закон» Алексей Пиманов умер в 64...

Кочарян оценил перспективы вступления Армении в ЕС

В ЕС захотели погасить кредит Украине за счет «репараций» России

Популярные посты

Как научиться играть на гитаре

Маски от морщин после 30 лет

Мужской шугаринг глубокое бикини

ПОПУЛЯРНЫЕ КАТЕГОРИИ