OpenAI, Google, Microsoft и другие крупные компании, разрабатывающие решения в сфере искусственного интеллекта, нашли новый способ получения обучающих данных. Они покупают неопубликованные видеоматериалы напрямую у авторов.
Цифровая гонка вооружений
Как сообщает Bloomberg, стоимость таких видео варьируется от 1 до 4 долларов за минуту, а за высококачественные 4K-съёмки, видео с дронов и 3D-анимацию цена может быть значительно выше. Обычный неизданный контент, например с платформ вроде YouTube и TikTok, оценивается в 1–2 доллара за минуту. Часто сумма сделок достигает нескольких тысяч долларов.
Для управления лицензированием компании сотрудничают со специализированными фирмами, такими как Troveo AI и Calliope Networks. По словам генерального директора Troveo Марти Пезиса, большинство разработчиков видеомоделей либо уже работают с ними, либо находятся на этапе переговоров. Troveo успела выплатить авторам более 5 миллионов долларов.
Дэн Левитт из агентства Wasserman называет это «гонкой вооружений» в области видеоконтента. Он отмечает перспективы заключения выгодных лицензий в ближайшие годы, но предупреждает, что эти возможности не будут существовать вечно.
Детали по закупкам
Контракты на покупку контента содержат защитные механизмы: компании не могут создавать цифровые копии авторов, воспроизводить сцены с их каналов или использовать материалы, которые могут нанести ущерб их репутации.
Одновременно с прямыми покупками видеоматериалов Google внедрил новые инструменты на YouTube. Теперь авторы могут сами решать, могут ли компании использовать их общедоступные видео для обучения искусственного интеллекта.
Среди потенциальных лицензиатов — более 17 компаний, включая OpenAI, Meta* и Microsoft. YouTube, который запретил несанкционированный сбор данных, может стать посредником и извлечь выгоду из лицензионных соглашений.
Читайте также:
Для чего это нужно
Компании стремятся собрать видеоданные для создания генераторов видео, таких как Sora и Veo. Однако исследователи имеют более амбициозную цель — использование больших видеоданных для разработки «симулятора мира». Эта теория предполагает, что анализ большого количества видео поможет ИИ лучше понять физическую реальность и улучшить способности к обобщению.
Для создателей контента это стало неожиданным источником дохода. Многие режиссёры снимают сотни часов видео, которые раньше оставались невостребованными, но теперь могут приносить значительную прибыль.
Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!
* Решением суда запрещена «деятельность компании Meta Platforms Inc. по реализации продуктов — социальных сетей Facebook и Instagram на территории Российской Федерации по основаниям осуществления экстремистской деятельности».