Каталог нейросетей
для любых задач

ruDALL-E

Генерация изображений на русском языке
ruDALL-E

RuDALL E - мультимодальная нейросеть от экосистемы Сбера, которая генерирует оригинальные изображения по текстовому описанию, в первую очередь на русском языке. Модель обучена на больших массивах пар текст + изображение и умеет создавать бесконечное количество новых картинок по заданным фразам и сценариям.

Семейство моделей включает крупные варианты с миллиардами параметров (в том числе ruDALL E XL и ruDALL E 12B). Вспомогательные компоненты для ранжирования результатов и повышения их разрешения. Часть моделей доступна в открытом исходном коде и может запускаться локально.

Ключевые возможности
  • Генерация изображений по тексту. Создание ярких и детализированных изображений по произвольным запросам на русском и других языках.
  • Поддержка разнообразных стилей. Можно задавать жанр, настроение, эпоху, цветовую палитру и получать визуалы под оформление рекламы, презентаций, обложек, концепт арта и т.  д.
  • Несколько вариантов на один запрос. Нейросеть генерирует серию изображений, среди которых удобно выбирать лучший вариант.
  • Ранжирование и улучшение качества. В связке с ruCLIP и моделями суперразрешения можно отбирать наиболее точные по смыслу кадры и увеличивать их разрешение.
  • Интеграции и инструменты. Доступны веб демо, Telegram боты и запуск через инфраструктуру SberCloud/ML Space, а также через репозиторий на GitHub.
Как работать с ruDALL E
  1. Перейти в веб интерфейс или другой сервис. Он использует ruDALL E (онлайн демо, бот, облачная платформа и т.  д. ).
  2. Ввести текстовый запрос на русском языке. Короткое описание сцены, объекта, стиля, дополнительных деталей.
  3. При необходимости уточнить настройки: количество вариантов, формат результата, дополнительные комментарии к стилю.
  4. Запустить генерацию и дождаться выдачи набора изображений.
  5. Сохранить подходящие кадры, если нужно доработать их в редакторе или использовать сразу в дизайне, презентациях, рекламе или контенте.
Особенности и ограничения

RuDALL E изначально разрабатывалась как модель с акцентом на русском языке. Поэтому особенно хорошо работает с запросами, в которых точно и подробно сформулировано текстовое описание на русском. К тому же допускается использование и иных языков, а так же смешанных запросов.

Модель распространяется в виде открытого кода под лицензией Apache 2.0.

К ограничениям можно отнести высокие требования к вычислительным ресурсам при локальном запуске крупных вариантов. Необходимость внимательно формулировать запросы. Делается, чтобы избежать некорректного или нежелательного контента и получить максимально релевантный результат.

Рабочая ссылка на нейросеть ruDALL-E на русском языке бесплатно. Если ИИ приложение/сайт не работает или описание не соответствует действительности, сообщите нам.

Комментарии