5 апр 2023
0

«Яндекс» выпустил свою нейронку для генерации картинок — называется «Шедеврум»

Это наш ответ Midjourney и DALL-E.

Максим Сафронов

Шеф-редактор Skillbox Media «Код». Пишет о разработке, софт-скиллах и культовых личностях в IT. Обожает Swift, продукты Apple и мемы про код.

Что случилось

Вдохновившись успехами Midjourney, «Яндекс» выкатил свою нейросеть для генерации картинок по текстовому запросу. То есть нарисовать корги на мотоцикле, ламу-барабанщицу и енота в стиле киберпанк теперь можно и в отечественном ИИ — достаточно скачать приложение для Android и iOS.

Работает нейросеть по принципу каскадной диффузии — то есть сначала она создаёт на основе текста пиксельный набросок, а затем насыщает его деталями и увеличивает качество. Чтобы «Шедеврум» умел так делать, его обучили на датасете из 240 млн картинок с подписями.

Подробнее о том, как работает диффузия и создание картинок по тексту вообще, мы писали в нашей статье про нейросети — почитайте, это завораживает.

Разработчики отдельно пояснили, что нейросеть любит точные и конкретные запросы. Например, если нужна картинка в хорошем разрешении, можно указать запрос «фотореализм» или «высокая детализация». А ещё «Шедеврум» — билингв. То есть он понимает и русский, и английский языки.