Сбер запустил промышленную версию нейросети для генерации изображений

Промышленная версия нейросети, создающей изображения по словесному описанию на русском языке (ruDALL-E), которая предполагает генерацию картинок более высокого качества, стала доступна для пользователей облачной платформы ML Space. Об этом в среду сообщила пресс-служба Сбера.

«Промышленная версия первой в мире нейронной сети ruDALL-E от SberDevices и Sber AI (входят в экосистему Сбера), которая создает изображения на основе текстового описания на русском языке, появилась в доступе на платформе ML Space. < …> Она содержит 12 миллиардов параметров и подходит для создания коммерческих материалов: иллюстраций для рекламы, архитектурного и промышленного дизайна, векторных и стоковых изображений», — говорится в сообщении.

Базовая модель ruDALL-E XL стала доступна для бесплатной загрузки с сервиса Github в ноябре. В отличие от промышленной версии, она обладает только 1,3 миллиардами параметров.

«[Тогда] мы выложили в открытый доступ модель ruDALL-E XL, сделали демо-сайт и навык для ассистентов Салют, чтобы с ней можно было «поиграть», создавая любые картинки по запросу. Теперь же внешняя аудитория может воспользоваться и XXL-версией модели, которая позволяет получать не только абстрактные изображения, но и любое количество качественных уникальных иллюстраций, которые можно применять в разных сферах», — приводятся в сообщении слова технического директора (CTO) Сбербанк Груп, исполнительного вице-президента Давида Рафаловского.

Создание изображений при помощи ruDALL-E происходит в три этапа: сначала нейросеть принимает текст и генерирует заданное число иллюстраций, на следующем этапе она выбирает, какие из них наиболее удачны и максимально соответствуют описанию, на завершающей стадии — увеличивает их в размере без потери качества.

Информационное агентство России ТАСС

Добавить комментарий