Код
#новости

Google рассказал, что ролики с демонстрацией способностей Gemini постановочные

Компания открыто рассказывает о том, что демонстрационное видео тщательно продумано и не отражает реальные показатели модели машинного обучения.

В начале декабря 2023 года Google выпустил набор больших языковых моделей Gemini. Самая мощная из них превосходит в тестах GPT-4. Кроме того, компания опубликовала проморолик, продемонстрировав передовые возможности моделей. На деле выяснилось, что видео постановочное и тщательно спродюсировано.

Демонстрация Gemini

В шестиминутном ролике Google показал примеры работы с Gemini. В видео делается упор на мультимодальность и демонстрируется, как нейросеть генерирует текст, распознаёт изображения и использует знания о мире. При этом в своём блоге Google рассказал о том, как снимали видео, а перед роликом предупредил, что ответы нейросети были тщательно подобраны.

Журналисты заметили, что Gemini передают детальные запросы, в которых уже содержится часть ответа или подсказка. В одном из примеров нейросети показывают жесты из игры «Камень, ножницы, бумага» и просят объяснить, что происходит на кадрах. При этом уже в самом запросе указывают, что это какая-то игра. Если показывать жесты по отдельности и без уточнений, то Gemini будет называть совершенно другие значения.

В запросе Gemini получает подсказку
Изображение: Google

В видео также показали, как Gemini играет в «Напёрстки» и без проблем угадывает, где находится скомканный лист бумаги. В примере всё выглядит захватывающе и быстро, но на самом деле сначала нейросети объясняют правила игры, начальное положение элементов и сообщают об изменениях на каждом этапе. Только после этого Gemini может повторить решение подобной задачи.

Подробное описание каждого действия игры и положения стаканов
Изображение: Google

В других примерах работы нейросети от Google, как считают журналисты, тоже нет прозрачности. Gemini заранее получает подсказки или часть ответа в запросе. Это вводит в заблуждение пользователей, которые в демонстрации не видят реального взаимодействия с моделью машинного обучения.

Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!

Изучайте IT на практике — бесплатно

Курсы за 2990 0 р.

Я не знаю, с чего начать
Освойте топовые нейросети за три дня. Бесплатно
Знакомимся с ChatGPT-4, DALLE-3, Midjourney, Stable Diffusion, Gen-2 и нейросетями для создания музыки. Практика в реальном времени. Подробности — по клику.
Узнать больше
Понравилась статья?
Да

Пользуясь нашим сайтом, вы соглашаетесь с тем, что мы используем cookies 🍪

Ссылка скопирована