Что случилось
Вдохновившись успехами Midjourney, «Яндекс» выкатил свою нейросеть для генерации картинок по текстовому запросу. То есть нарисовать корги на мотоцикле, ламу-барабанщицу и енота в стиле киберпанк теперь можно и в отечественном ИИ — достаточно скачать приложение для Android и iOS.
Работает нейросеть по принципу каскадной диффузии — то есть сначала она создаёт на основе текста пиксельный набросок, а затем насыщает его деталями и увеличивает качество. Чтобы «Шедеврум» умел так делать, его обучили на датасете из 240 млн картинок с подписями.
Подробнее о том, как работает диффузия и создание картинок по тексту вообще, мы писали в нашей статье про нейросети — почитайте, это завораживает.
Разработчики отдельно пояснили, что нейросеть любит точные и конкретные запросы. Например, если нужна картинка в хорошем разрешении, можно указать запрос «фотореализм» или «высокая детализация». А ещё «Шедеврум» — билингв. То есть он понимает и русский, и английский языки.
А покажите сами шедевры
Нет проблем — вот примеры сгенерированных изображений из пресс-релиза «Яндекса»:

Изображение: пресс-служба компании «Яндекс»

Изображение: пресс-служба компании «Яндекс»

Изображение: пресс-служба компании «Яндекс»

Изображение: пресс-служба компании «Яндекс»
Больше примеров — в папке на «Яндекс Диске».
Скачать приложение можно в Google Play и App Store. Но чтобы пользоваться им полноценно, нужно оставить заявку и дождаться подтверждения.
Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!