Со 2 по 6 декабря в Лас-Вегасе проходит ежегодная конференция Amazon Web Services под названием re:Invent 2024. Там облачное подразделение Amazon презентовало свои последние разработки в области искусственного интеллекта.
Нейросеть Nova для генерации текста
Компания представила новое семейство ИИ-моделей для работы с текстом, которое получило название Nova. Семейство включает в себя четыре модели с разными возможностями — Micro, Lite, Pro и Premier.
Так, модель Micro анализирует только текстовые запросы до 100 тысяч слов. Lite, Pro и Premier способны обрабатывать информацию из изображений и видео длительностью до 30 минут. Кроме того, они понимают запрос до 225 тысяч слов. Все модели поддерживают 15 языков, в том числе русский. Четвёртую, Premier, Amazon позиционирует как ИИ для обучения пользовательских моделей — она появится в начале 2025 года.
Модели Micro, Lite и Pro уже доступны в сервисе Amazon Bedrock от 0,000035 до 0,0008 доллара за 1 тысячу входных токенов и от 0,00014 до 0,0032 доллара за 1 тысячу выходных токенов.
Нейросети Nova Canvas и Nova Reel
Кроме того, Amazon представила ИИ-модели Nova Canvas и Nova Reel. Первая может генерировать и редактировать изображения, а также настраивать их цветовую гамму. Стоимость одной картинки в Amazon Bedrock варьируется от 0,04 до 0,08 доллара в зависимости от качества.
Нейросеть Nova Reel создаёт видеоролики длиной до шести секунд по текстовым подсказкам или по изображениям. Кроме того, при генерации видео можно настроить движение камеры. Стоимость одного сгенерированного видео — 0,08 доллара.
Нейросеть для преобразования речи
Ещё Amazon активно работает над ИИ-моделью для преобразования речи в улучшенную аудиоверсию. Кроме того, у компании есть в планах выпустить модель, которая будет способна принимать контент в любом формате и превращать его в другой — в текст, аудио или изображение. Ожидается, что Amazon выпустит обновление в первом квартале 2025 года.
ИИ-ассистент Q
Amazon также представила обновление своего ИИ-ассистента Q, который может выполнять корпоративные задачи от лица пользователей. Отдельно стоит упомянуть про новый сервис Q Developer с окном для написания кода. ИИ-агент может проанализировать проект и предоставить список выявленных ошибок до отправки кода на проверку.
Q может бесплатно обработать до 50 запросов в месяц. Платная версия стоит 19 долларов и позволяет делать до 1 тысячи запросов в месяц.
Сервис для борьбы с галлюцинациями ИИ
Кроме того, компания анонсировала инструмент Automated Reasoning checks для выявления галлюцинаций нейросетей. Под галлюцинациями понимаются ошибки и генерация несуществующих фактов. Сервис проверяет ответы модели на точность, опираясь на информацию, предоставленную пользователем.
Чипы для обучения ИИ-моделей
Amazon также объявила об открытии публичного доступа к своим чипам Trainium2 (T2) для обучения и развёртывания больших языковых моделей. Эти чипы, которые компания впервые анонсировала год назад, будут в четыре раза быстрее своих предшественников, а один сервер EC2 на базе Trainium2 с 16 чипами T2 обеспечит вычислительную производительность до 20,8 петафлопса.
На практике это означает, что предоставление мощностей одного такого сервера для массивной ИИ-модели Llama 405B позволит увеличить пропускную способность в 3 раза по сравнению с другими доступными предложениями крупных облачных провайдеров.
Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!