Новая функция ИИ-стартапа Stability, Stable Video Diffusion, описывается компанией как «модель латентной диффузии для преобразования текста и изображений в видео высокого разрешения». Эта модель основана на аналогичной, используемой для генерации ИИ-изображений.

Stable Video Diffusion не только генерирует видео на основе текстовых подсказок. Она также может превращать одно изображение в видео с 14 или 25 кадрами, показанными со скоростью от 3 до 30 кадров в секунду.
Помимо анонса, представители компании Stability написали статью, где изложено их видение будущего сгенерированных видео, а также опубликовали код своей модели на GitHub. В будущем стартап планирует расширить модель с учётом различных потребностей пользователей.
Больше интересного про дизайн в нашем телеграм-канале. Подписывайтесь!