В прошлом году Google сделал ставки на контент, который создаётся при помощи искусственного интеллекта. Тогда представили программу Magic Editor для обработки фотографий на телефонах Pixel, а также объявили о разработке собственной модели ИИ — Bard.

Сейчас Bard заменила нейросеть Gemini. На конференции I/O 2024 отметили, насколько стремительно развивается ИИ — от умных помощников и генеративных систем изображений, слов, музыки и речи до больших языковых моделей, которые умеют программировать или используют медицинские знания.

Что это значит для потребителей? В ближайший год ИИ в Google будет развиваться по двум направлениям. С одной стороны, ежедневные поисковые запросы скоро будут дополнены новым видом ИИ-помощника — Project Astra. Это прототип системы, которая использует камеру смартфона и речь, чтобы отвечать на самые разные вопросы. Она поможет решить задачу по коду, придумать каламбур или найти очки.

Среди других инноваций — Ask Photos: новый способ взаимодействия с изображениями при помощи голосовых команд. Например, можно попросить показать все фотографии котиков на устройстве или напомнить, где была снята картинка. Google объявила, что Pro-версия Gemini (v1.5) теперь может просеивать миллион токенов (единиц обрабатываемых данных) за раз.

Gemini интегрируют в Google Workspace, и она скоро станет ценной частью Gmail. Скоро можно будет, например, запросить сводку всех ваших мероприятий на предстоящий год, пишет Wallpaper.

Исследования показывают, что большинство людей уже используют строку поиска как оракул, задавая, как правило, прямые вопросы, а не цепочки связанных слов. Gemini умеет объединять эти запросы в удобные папки — планы питания, списки покупок, маршруты, объяснения и предложения. И всё это будет персонализировано и выдано хорошо поставленным голосом.

Кроме того, на конференции рассмотрели более мрачный вариант развития событий. Генеративный ИИ уже вызывает споры в творческих кругах, несмотря на то, что его уже встроили в такие инструменты, как Photoshop. Компания Google пригласила нескольких художников — это Шон Икс, Эрик Ху, Эрик Картер и Харуко Хаякава.

Они обсудили использование Imagen 2 — генеративной модели, созданной на базе Google DeepMind. Бывший креативный директор Nike Эрик Ху провёл параллели между «разрушительными возможностями» ИИ и такими глобальными мировыми изменениями, как эпоха Возрождения и зарождение фотографии.

На конференции представили генератор картинок StyleDrop, а также технологию Veo. Она может делать мгновенную кинематографическую раскадровку, создавая фотореалистичное видео на основе простых промптов.


Больше интересного про дизайн в нашем телеграм-канале. Подписывайтесь!