Google рассказал, что ролики с демонстрацией способностей Gemini постановочные

Компания открыто рассказывает о том, что демонстрационное видео тщательно продумано и не отражает реальные показатели модели машинного обучения.

Редакция «Код» Skillbox Media

Онлайн-журнал для тех, кто влюблён в код и информационные технологии. Пишем для айтишников и об айтишниках.

В начале декабря 2023 года Google выпустил набор больших языковых моделей Gemini. Самая мощная из них превосходит в тестах GPT-4. Кроме того, компания опубликовала проморолик, продемонстрировав передовые возможности моделей. На деле выяснилось, что видео постановочное и тщательно спродюсировано.

Демонстрация Gemini

В шестиминутном ролике Google показал примеры работы с Gemini. В видео делается упор на мультимодальность и демонстрируется, как нейросеть генерирует текст, распознаёт изображения и использует знания о мире. При этом в своём блоге Google рассказал о том, как снимали видео, а перед роликом предупредил, что ответы нейросети были тщательно подобраны.

Журналисты заметили, что Gemini передают детальные запросы, в которых уже содержится часть ответа или подсказка. В одном из примеров нейросети показывают жесты из игры «Камень, ножницы, бумага» и просят объяснить, что происходит на кадрах. При этом уже в самом запросе указывают, что это какая-то игра. Если показывать жесты по отдельности и без уточнений, то Gemini будет называть совершенно другие значения.

В запросе Gemini получает подсказку
*Изображение: Google*

В видео также показали, как Gemini играет в «Напёрстки» и без проблем угадывает, где находится скомканный лист бумаги. В примере всё выглядит захватывающе и быстро, но на самом деле сначала нейросети объясняют правила игры, начальное положение элементов и сообщают об изменениях на каждом этапе. Только после этого Gemini может повторить решение подобной задачи.

Подробное описание каждого действия игры и положения стаканов
*Изображение: Google*

В других примерах работы нейросети от Google, как считают журналисты, тоже нет прозрачности. Gemini заранее получает подсказки или часть ответа в запросе. Это вводит в заблуждение пользователей, которые в демонстрации не видят реального взаимодействия с моделью машинного обучения.

Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!

Читайте также: