Со 2 по 6 декабря в Лас-Вегасе проходит ежегодная конференция Amazon Web Services под названием re:Invent 2024. Там облачное подразделение Amazon презентовало свои последние разработки в области искусственного интеллекта.
Нейросеть Nova для генерации текста
Компания представила новое семейство ИИ-моделей для работы с текстом, которое получило название Nova. Семейство включает в себя четыре модели с разными возможностями — Micro, Lite, Pro и Premier.
Так, модель Micro анализирует только текстовые запросы до 100 тысяч слов. Lite, Pro и Premier способны обрабатывать информацию из изображений и видео длительностью до 30 минут. Кроме того, они понимают запрос до 225 тысяч слов. Все модели поддерживают 15 языков, в том числе русский. Четвёртую, Premier, Amazon позиционирует как ИИ для обучения пользовательских моделей — она появится в начале 2025 года.
![](/upload/setka_images/14394906122024_accf102caaa970ce65d217b9ae9a8e9a57caa67c.jpg)
Модели Micro, Lite и Pro уже доступны в сервисе Amazon Bedrock от 0,000035 до 0,0008 доллара за 1 тысячу входных токенов и от 0,00014 до 0,0032 доллара за 1 тысячу выходных токенов.
Нейросети Nova Canvas и Nova Reel
Кроме того, Amazon представил ИИ-модели Nova Canvas и Nova Reel. Первая может генерировать и редактировать изображения, а также настраивать их цветовую гамму. Стоимость одной картинки в Amazon Bedrock варьируется от 0,04 до 0,08 доллара в зависимости от качества.
![](/upload/setka_images/14395006122024_7e362904b7d857173ea1dbafb405ab1977cbbb2a.gif)
Нейросеть Nova Reel создаёт видеоролики длиной до шести секунд по текстовым подсказкам или по изображениям. Кроме того, при генерации видео можно настроить движение камеры. Стоимость одного сгенерированного видео — 0,08 доллара.
Нейросеть для преобразования речи
Ещё Amazon активно работает над ИИ-моделью для преобразования речи в улучшенную аудиоверсию. Кроме того, у компании есть в планах выпустить модель, которая будет способна принимать контент в любом формате и превращать его в другой — в текст, аудио или изображение. Ожидается, что Amazon выпустит обновление в первом квартале 2025 года.
ИИ-ассистент Q
Amazon также представил обновление своего ИИ-ассистента Q, который может выполнять корпоративные задачи от лица пользователей. Отдельно стоит упомянуть про новый сервис Q Developer с окном для написания кода. ИИ-агент может проанализировать проект и предоставить список выявленных ошибок до отправки кода на проверку.
![](/upload/setka_images/14395006122024_6896a8696b8038f4fc8989ab005e4fccc3b90047.jpg)
Q может бесплатно обработать до 50 запросов в месяц. Платная версия стоит 19 долларов и позволяет делать до 1 тысячи запросов в месяц.
Сервис для борьбы с галлюцинациями ИИ
Кроме того, компания анонсировала инструмент Automated Reasoning checks для выявления галлюцинаций нейросетей. Под галлюцинациями понимаются ошибки и генерация несуществующих фактов. Сервис проверяет ответы модели на точность, опираясь на информацию, предоставленную пользователем.
Чипы для обучения ИИ-моделей
Amazon также объявила об открытии публичного доступа к своим чипам Trainium2 (T2) для обучения и развёртывания больших языковых моделей. Эти чипы, которые компания впервые анонсировала год назад, будут в четыре раза быстрее своих предшественников, а один сервер EC2 на базе Trainium2 с 16 чипами T2 обеспечит вычислительную производительность до 20,8 петафлопса.
![](/upload/setka_images/14395006122024_c7c2d6650fe8dd3125b1541cb39af56649bd56fa.jpg)
На практике это означает, что предоставление мощностей одного такого сервера для массивной ИИ-модели Llama 405B позволит увеличить пропускную способность в 3 раза по сравнению с другими доступными предложениями крупных облачных провайдеров.
Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!