Как пользоваться Gemini AI от Google в России
Знакомьтесь с нейросетью, которая пишет, рисует и анализирует видео.


Иллюстрация: Alexander Wende / Ehimetalor Akhere Unuabona / Unsplash / Google / Дима Руденок для Skillbox Med
Gemini — многофункциональная нейросеть от Google, которая способна генерировать тексты и код, создавать изображения, анализировать данные, а также работать с аудио и видео. Благодаря своей универсальности она применяется в работе, учёбе, научных исследованиях и многих других сферах.
Хотя Gemini официально доступна через браузер Google Chrome, в России её использование ограничено. В этой статье разберёмся, как устроена эта нейросеть, какие у неё возможности и можно ли её попробовать в деле.
Содержание
- Что такое Gemini
- Как устроена нейросеть от Google
- Как пользоваться Gemini
- Какие есть версии Gemini, сколько стоят и в чём их различия
- Как воспользоваться Gemini в России
Что такое Gemini
Gemini — современная нейросеть, разработанная подразделением Google DeepMind в 2023 году. Это же подразделение создало AlphaGo — первую систему, победившую чемпиона мира по древней игре го. Также они придумали систему AlphaFold, которая совершила прорыв в биологии, научившись точно предсказывать трёхмерную структуру белков.
Изначально у Gemini было другое название — Bard. В феврале 2023 года, во время первой публичной демонстрации чат-бота, произошёл неприятный инцидент: Bard допустил фактическую ошибку в ответе о научных открытиях телескопа «Джеймс Уэбб». Это серьёзно повлияло на репутацию компании: акции Google упали на 8% всего за один торговый день после случившегося.
Несмотря на неудачный старт, Google продолжил развивать проект. В апреле 2023 года разработчики сообщили, что Bard научился писать и комментировать код на 20 популярных языках программирования, включая Python, C и Java. Этот шаг был важным, поскольку Google стремился догнать и обойти OpenAI с её популярным ChatGPT. Для обучения модели использовали передовые алгоритмы машинного обучения и огромные массивы данных.
В декабре 2023 года Bard научился генерировать изображения с помощью Imagen — встроенной модели для создания изображений. В феврале 2024 года чат-бот переименовали в Gemini, запустив одноимённое Android-приложение и платную подписку на более мощную версию модели — Gemini Ultra. По состоянию на март 2025 года Gemini доступна в трёх версиях с разной производительностью: Ultra (самая мощная), Pro (средняя) и Nano (облегчённая для мобильных устройств). Модель умеет анализировать и создавать различные типы контента и поддерживает более 40 языков.
Как устроена нейросеть от Google
Gemini, предположительно, построена на базе продвинутой языковой модели LaMDA — сложной нейронной сети, которая разработана для понимания естественного языка и генерации осмысленных ответов. Ключевая особенность таких моделей — их масштаб. Gemini использует архитектуру с 1,5 триллиона параметров, что приблизительно соответствует количеству синопсов в человеческом мозге. Увеличение числа параметров напрямую влияет на способность модели обрабатывать информацию и генерировать ответы.
В основе Gemini лежат несколько ключевых компонентов:
- Трансформерная архитектура — основной элемент модели, который анализирует связи между словами и их контекстом. В предложении «кошка сидит на коврике» модель не просто распознаёт слова, но и понимает их роли и смысловые связи: кто выполняет действие (кошка), что происходит (сидит) и где это происходит (на коврике).
- Механизм внимания — подобно тому, как человек фокусируется на ключевых деталях разговора, модель определяет наиболее значимые элементы во входных данных. Например, при ответе на вопрос «Какого цвета машина?» она концентрируется на словах, описывающих цвет.
- Энкодер-декодер работает как переводчик: энкодер анализирует входящую информацию, а декодер преобразует её в нужный формат. К примеру, при переводе с русского на английский энкодер обрабатывает русский текст, а декодер создаёт его английский аналог.
- Многоязычный токенизатор разбивает текст на мелкие единицы (токены) для эффективной обработки на разных языках. Например, слово «привет» может быть разделено на «при» и «вет» для обработки.
- Система контекстного обучения — учитывает окружающий контекст для точных ответов. Так, в диалоге: «Как погода? — Дождливо» — модель понимает, что речь о текущем состоянии погоды, а не прогнозе.
Особое внимание стоит уделить мультимодальности. В отличие от большинства языковых моделей, которые работают только с текстом или текстом и кодом, Gemini способна обрабатывать различные типы данных:
- Вести диалог как чат-бот, обрабатывая текст.
- Анализировать изображения и описывать их содержимое.
- Обрабатывать аудио и видео — распознавать речь, звуки и создавать краткие обзоры.
- Писать и анализировать программный код.
- Комбинировать все эти возможности для решения сложных задач.
Для достижения мультимодальности модель обучают на различных типах данных. Когда поступает запрос, трансформер анализирует и интерпретирует задачу. Если входные данные — это изображение, модель использует свёрточные нейросети (CNN) или vision transformers (ViT) для обработки изображения. При работе с аудио система преобразует звук в спектрограммы — визуальные представления звуковых волн, и так далее.
Далее все данные преобразуются в векторы — числовые представления, которые содержат смысловую информацию. Например, слово «кошка» и фотография кошки будут иметь схожее векторное представление.
Затем векторы поступают в единое пространство представлений, где модель определяет взаимосвязи между разными типами данных. Благодаря этому она может создавать текстовые описания изображений, определять объекты на них или генерировать изображения на основе текстовых запросов.
В результате мультимодальная модель воспринимает информацию подобно человеку — она одновременно анализирует текст, визуальные элементы и аудиоданные. Однако важно понимать, что эта аналогия условна: в отличие от человека, модель не обладает истинным пониманием контекста и не может выходить за рамки своего обучения. Её возможности ограничены заложенными алгоритмами и данными. По крайней мере, на данный момент.
Что умеет Gemini и как ей пользоваться
Google позиционирует Gemini как инструмент, способный заменить сразу несколько сервисов. Давайте проверим и посмотрим, как она справляется с разными задачами. Мы покажем сами промпты и полученный результат.
Рассказы
Поскольку Gemini умеет генерировать тексты различных жанров и стилей, давайте обратимся с таким заданием:
«Напиши короткий рассказ примерно в 200 слов в стиле Эдгара Аллана По о таинственном исчезновении в старинном замке. В нём должны быть завязка, кульминация и развязка. Представь, что действие происходит в современном мире. Добавь в него иронии».
Gemini создала атмосферный рассказ с элементами мистики и саспенса. Текст хорошо структурирован и точно соответствует заданному объёму. Однако стиль лишь отдалённо напоминает По. В отличие от классика, который часто начинает произведения с философскими размышлениями и сложными конструкциями, нейросеть выбрала более прямолинейное повествование.
Кроме того, Gemini проигнорировала наше требование осовременить сюжет. Что касается иронии — хотя нейросеть и попыталась её добавить, сделав лорда-скептика жертвой мистического происшествия, этот элемент оказался недостаточно проработанным. Читатель узнаёт о скептицизме персонажа только в последнем предложении, что снижает эффект неожиданности:
Тайна замка Блэквуд
В сумраке старинного замка, чьи стены хранили тайны веков, исчез лорд Блэквуд. Его исчезновение окутано мраком, словно тень, ускользнувшая из-под лунного света. Комнаты замка, пропитанные пылью и запахом старых книг, словно свидетели немого преступления, хранили молчание.Леди Элеонора, его невеста, с бледным лицом и дрожащими руками, металась по коридорам, словно призрак, ища следы своего возлюбленного. Она звала его имя, но в ответ лишь тишина эхом отражалась от каменных стен.
Внезапно, в одной из потайных комнат, за старинным гобеленом, она обнаружила странную надпись, выцарапанную на стене: «Там, где тени танцуют, а время замирает, найдешь свою погибель». Сердце леди Элеоноры забилось с удвоенной силой, словно предчувствуя недоброе.
В полночь, когда луна достигла своего зенита, она отправилась в запретную часть замка, где, по слухам, обитали призраки. Там, в самом темном углу, она увидела лорда Блэквуда, стоящего спиной к ней. Его фигура была окутана странным свечением, словно он сам стал призраком.
Он медленно повернулся, и леди Элеонора увидела, что его лицо искажено ужасом, а глаза полны безумия. Он протянул к ней руку, словно приглашая в свой мир теней.
Леди Элеонора отшатнулась, и в этот момент пол под ее ногами провалился. Она упала в темную бездну, и ее крик растворился в тишине замка.
С тех пор в замке Блэквуд обитают два призрака: лорда, навеки запертого в своем безумии, и леди Элеоноры, обреченной вечно падать в темноту.Иронично, что лорд Блэквуд, известный своим скептицизмом и любовью к науке, сам стал жертвой мистической тайны, которую так презирал.
Сценарии
От рассказов перейдём к чему-то посложнее:
«Напиши сценарий для короткого рекламного ролика о новом приложении для изучения иностранных языков. Начни с забавной фразы на английском языке для привлечения внимания. Затем напиши короткую забавную сценку между двумя молодыми персонажами — девушкой и парнем. Закончи призывом скачать приложение».
Gemini создала сценарий с чётко прописанными диалогами и детальными описаниями сцен. Все поставленные задачи были выполнены технически корректно. Итоговый текст получился несколько затянутым, но после сокращения мог бы стать хорошей основой для рекламного видео:
Реклама языкового приложения
Начало:
(0-2 секунды)
- Крупный план: чашка кофе с надписью «Coffee».
- Голос за кадром (бодрый, энергичный): «Do you speak coffee?»
- Камера отъезжает, показывая молодого человека (Максим) за столиком в кафе.
(2-15 секунд)
- Максим пытается заказать кофе на английском, но путает слова.
- Максим: «I want… uh… big… milk… hot… thing… for… drink!»
- Официантка (Анна) смотрит на него с улыбкой, но непониманием.
- Анна: «You want a latte?»
- Максим (с облегчением): «Yes! Latte!»
- Анна: «One latte, coming right up!»
- Максим достает телефон, на экране — иконка приложения для изучения языков.
- Максим (сам себе): «Пора учить английский по-настоящему…»
(15-25 секунд)
- Монтаж: быстрые кадры, показывающие, как Максим использует приложение.
- Максим повторяет слова, смотрит видеоуроки, делает упражнения.
- На экране появляются всплывающие подсказки с названиями функций приложения: «Интерактивные уроки», «Разговорная практика», «Игры и тесты».
- Голос за кадром: «С нашим приложением вы заговорите на любом языке легко и быстро! Учите слова, тренируйте произношение, общайтесь с носителями языка!»
(25-30 секунд)
- Максим снова в кафе, заказывает кофе.
- Максим (уверенно): «I’d like a double espresso, please.»
- Анна (удивленно): «Wow, your English is much better!»
- Максим (улыбаясь): «Thanks! I’ve been practicing.»
- Крупный план: экран телефона с открытым приложением.
(30-32 секунды)
- Голос за кадром: «Скачайте наше приложение прямо сейчас и начните говорить свободно!»
- На экране появляется QR-код для скачивания приложения и название приложения.
- Внизу экрана: «Доступно в App Store и Google Play».
Статьи в блог
Продолжаем и переходим к полноценной статье:
«Напиши статью для блога о больших языковых моделях. Представь, что ты инженер машинного обучения с десятилетним опытом. Расскажи, что умеют современные языковые модели, какие бывают и какие задачи помогают решить. Твоя аудитория — широкая, это неспециалисты, которые хотят применить ИИ для решения своих задач».
Gemini выдала довольно связный и структурированный текст с примерами. Фактическая информация верна. Однако объём оказался небольшим — вероятно, бесплатная модель ограничена примерно 700 словами:
Большие языковые модели: что это такое и как они могут помочь вам
Привет, я инженер машинного обучения с десятилетним опытом работы в области искусственного интеллекта. Сегодня я хочу рассказать вам о больших языковых моделях (LLM) — мощном инструменте, который может помочь вам в решении самых разных задач.
Что такое большие языковые модели?
Большие языковые модели — это тип искусственного интеллекта, который обучается на огромных массивах текстовых данных. В результате они могут понимать и генерировать текст, очень похожий на человеческий.
Что умеют современные языковые модели?
Современные языковые модели могут выполнять широкий спектр задач, включая:
- Генерация текста: LLM могут генерировать текст для самых разных целей, например, статьи, эссе, стихи, код и даже сценарии.
- Перевод языков: LLM могут переводить текст с одного языка на другой с высокой точностью.
- Ответы на вопросы: LLM могут отвечать на вопросы, используя информацию из огромного объема текста, на котором они были обучены.
- Обобщение текста: LLM могут обобщать длинные тексты, выделяя ключевые моменты.
- Создание чат-ботов: LLM могут использоваться для создания чат-ботов, которые могут общаться с людьми на естественном языке.
- Анализ тональности: LLM могут анализировать тональность текста, определяя, является ли он положительным, отрицательным или нейтральным.
- Классификация текста: LLM могут классифицировать текст по различным категориям, например, новости, спорт, политика и т.д.
Какие бывают языковые модели?
Существует множество различных типов языковых моделей, но наиболее распространенными являются:
- Трансформеры: Трансформеры — это тип нейронной сети, который особенно хорошо подходит для обработки текста. Они используются в большинстве современных LLM.
- Рекуррентные нейронные сети (RNN): RNN — это еще один тип нейронной сети, который может использоваться для обработки текста. Однако они, как правило, менее эффективны, чем трансформеры.
- Свёрточные нейронные сети (CNN): СNN обычно используются для обработки изображений, но они также могут использоваться для обработки текста.
Какие задачи помогают решить?
Большие языковые модели могут помочь вам в решении самых разных задач, например:
- Автоматизация задач: LLM можно использовать для автоматизации задач, связанных с текстом, например, написание отчетов, ответов на электронные письма и т.д.
- Улучшение качества контента: LLM можно использовать для улучшения качества контента, например, для исправления грамматических ошибок, улучшения стиля и т.д.
- Создание нового контента: LLM можно использовать для создания нового контента, например, статей, эссе, стихов и т.д.
- Получение информации: LLM можно использовать для получения информации из огромного объема текста, например, для поиска ответов на вопросы, обобщения текстов и т.д.
- Создание чат-ботов: LLM можно использовать для создания чат-ботов, которые могут общаться с людьми на естественном языке.
- Анализ данных: LLM можно использовать для анализа данных, например, для анализа тональности текста, классификации текста и т.д.
Как использовать большие языковые модели?
Существует множество способов использования больших языковых моделей. Вы можете использовать их через API, предоставляемые такими компаниями, как Google, OpenAI и другие. Вы также можете использовать их, установив программное обеспечение на свой компьютер.
Заключение
Большие языковые модели — это мощный инструмент, который может помочь вам в решении самых разных задач. Если вы хотите узнать больше о том, как использовать LLM, я рекомендую вам изучить ресурсы, доступные в Интернете.
Стиль письма получился сухим и скучным. Попробуем это исправить:
«Перепиши статью живым языком, с примерами, убери отглагольные и сложные предложения».
Модель поправила стиль и сделала текст более понятным. Это показывает, что Gemini умеет адаптироваться к форматам и может быть полезна копирайтерам, студентам и всем, кто создаёт тексты для работы или учёбы:
Большие языковые модели: ваш новый помощник в мире текста
Привет! Я инженер, уже 10 лет работаю с искусственным интеллектом. Сегодня расскажу вам о крутой штуке — больших языковых моделях (LLM). Это как супер-мозг, который понимает и пишет тексты.
Что это за зверь — языковая модель?
Представьте, есть огромная библиотека, где собраны все книги, статьи, сайты мира. LLM — это как человек, который прочитал всё это и теперь умеет понимать и создавать тексты, как мы с вами.
Что они умеют?
- Писать тексты: Нужно написать статью, придумать слоган или даже сценарий? LLM сделает это! Например, можно попросить её написать короткий рассказ в жанре фэнтези, и она выдаст вам вполне читабельный текст.
- Переводить: Забудьте про корявые переводы! LLM переводит тексты с одного языка на другой почти идеально.
- Отвечать на вопросы: Задайте любой вопрос, и LLM найдёт ответ в своей «библиотеке». Например: «Какие самые высокие горы в мире?» — и она ответит.
- Делать краткие пересказы: У вас огромная статья, а времени читать нет? LLM выделит главное.
- Создавать чат-ботов: Общайтесь с компьютером, как с человеком! LLM делает чат-ботов, которые понимают и отвечают на ваши вопросы.
- Определять настроение текста: Позитив, негатив или нейтраль? LLM скажет, какое настроение у текста.
- Разделять тексты по темам: Новости, спорт, кино — LLM разложит всё по полочкам.
Какие они бывают?
Есть разные виды LLM, но самые популярные — это:
- Трансформеры: Самые умные и быстрые, они лежат в основе большинства современных LLM.
- Другие сети: Есть и другие, но они обычно уступают трансформерам.
Чем они могут помочь?
- Автоматизировать рутину: Пусть LLM пишет отчёты и отвечает на письма.
- Улучшить тексты: Исправит ошибки, сделает текст красивым.
- Придумать что-то новое: Статьи, стихи, идеи — всё, что угодно.
- Найти нужную информацию: Задайте вопрос, и получите ответ.
- Создать умного помощника: Чат-бот поможет вашим клиентам.
- Анализировать данные: Узнайте, что люди думают о вашем продукте.
Как их использовать?
Есть специальные сервисы, где можно подключиться к LLM через интернет. Или можно установить программу на компьютер.
В общем, LLM — это крутой инструмент, который упростит вашу работу с текстом. Попробуйте, вам понравится!
Редактирование
Gemini не только генерирует текст, но и помогает его улучшить:
«Исправь ошибки в следующем тексте: кагда я выросту я хачу пани. патамушта ани такие класные. у них грива как у пренцессы и хвостик как у белочки. ани такие маленкие и их можна гладить. и еще я хачу штобы у меня была пани с крыльями. как в мультике. штоб я могла на ней летать. и мыбы летали над облаками и ели сахарную вату. и еще я хачу штоб моя пани умела говарить. и мыбы сней болтали про фей и принцес. и еще я хачу штоб она была розовая с блестками. и штоб у нее были бальшие глаза. и онабы мне давала катаца на спине. и мыбы скакали по радуге. и еще я хачу штоб она ела тока конфеты и мармелад. и штоб она никогда не балела. и штоб она жила у меня в комнате. и штоб мы сней спали в одной кровате. и штоб она мне расказывала скаски на ночь. и штоб она меня любила. и я ее тоже.».
Gemini быстро находит и исправляет все ошибки:
Когда я вырасту, я хочу пони. Потому что они такие классные. У них грива, как у принцессы, и хвостик, как у белочки. Они такие маленькие, и их можно гладить. И ещё я хочу, чтобы у меня была пони с крыльями, как в мультике. Чтобы я могла на ней летать. И мы бы летали над облаками и ели сахарную вату. И ещё я хочу, чтобы моя пони умела говорить. И мы бы с ней болтали про фей и принцесс. И ещё я хочу, чтобы она была розовая с блёстками. И чтобы у неё были большие глаза. И она бы мне давала кататься на спине. И мы бы скакали по радуге. И ещё я хочу, чтобы она ела только конфеты и мармелад. И чтобы она никогда не болела. И чтобы она жила у меня в комнате. И чтобы мы с ней спали в одной кровати. И чтобы она мне рассказывала сказки на ночь. И чтобы она меня любила. И я её тоже.
Попробуем ещё такой вариант:
«Сделай этот текст более лаконичным и убедительным: „Предлагаю погрузиться в пучину глоссария оральной гигиены, где каждый термин — это неприступная цитадель, а каждое понятие — лабиринт, достойный Минотавра.
Итак, начнём с фундамента — зубного налёта. Эта коварная субстанция, состоящая из бактерий, остатков пищи и слюны, является первопричиной большинства стоматологических бед. Её метаболизм приводит к образованию кислот, которые деминерализуют эмаль, запуская кариозный процесс.
Но не будем забывать о зубном камне — окаменевшем налёте, который, подобно змею-искусителю, скрывается в поддесневых карманах, вызывая гингивит и пародонтит. Его удаление — процесс, требующий филигранной точности и использования ультразвуковых скейлеров“».
Gemini перефразировала предложения, убрала лишнее и улучшила текст:
Основы гигиены полости рта:
Зубной налет:
- Это скопление бактерий, остатков пищи и слюны.
- Вызывает кариес, так как бактерии выделяют кислоты, разрушающие эмаль.
Зубной камень:
- Это затвердевший зубной налет.
- Вызывает воспаление десен (гингивит) и пародонтит.
- Удаляется с помощью ультразвуковых скейлеров.
Ключевые моменты:
- Регулярная и тщательная гигиена полости рта необходима для предотвращения заболеваний зубов и десен.
- Профессиональная чистка зубов помогает удалить зубной камень и налет, которые невозможно удалить в домашних условиях.
Краткий пересказ
Gemini можно использовать для обобщения содержания статей, книг и даже видео. Начнём со статьи и передадим её по URL:
«Сделай краткое содержание статьи: https://skillbox.ru/media/code/transfernoe-obuchenie-chto-eto-kak-rabotaet-i-dlya-chego-nuzhno/».
Gemini выделила ключевые моменты и создала довольно точный краткий пересказ. Мы также убедились, что нейросеть может не только обрабатывать текст в чате, но и анализировать содержимое по ссылкам. Правда, итоговый вариант получился несколько тяжеловесным — видно, что модель сначала формирует мысли на английском языке, а потом переводит их на русский:

Теперь попробуем сделать краткий пересказ видео:
«Сделай краткое содержание видео: Почему „Семь“ — великое кино».
Нейросеть подключилась к YouTube в реальном времени, нашла несколько ключевых моментов, кратко их описала и добавила таймкоды. Пересказ получился не слишком глубоким, но достаточным, чтобы уловить основную информацию. Эта функция может значительно сэкономить время студентам:

Исследования
У Gemini есть функция Deep Research, которую можно использовать как улучшенный поисковик. Она анализирует информацию из множества источников и предоставляет краткую выжимку. Давайте попробуем:
«Сравни концепции свободы в трудах Жан-Жака Руссо и Джона Локка. Приведи ключевые аргументы, процитируй источники и сделай вывод о различиях и сходствах».
Сначала модель предлагает план анализа темы. Если нажать «Изменить план», можно внести изменения — например, попросить добавить конкретные исследования. После этого чат-бот обработает данные и предложит обновлённый план. Нажмите «Начать исследование», чтобы продолжить.

Интересно, что нейросеть поэтапно показывает свои размышления и источники, которые она использовала. Сначала поиск выполняется на английском, а затем на русском. Поскольку процесс может занять некоторое время, вкладку можно закрыть и вернуться к результатам позже.
В итоге Gemini проанализировала 74 источника и подготовила текст с цитатами и ссылками. В число изученных материалов вошли работы Руссо, сборник его цитат, статьи из Британской энциклопедии и Стэнфордской философской энциклопедии. Однако качество некоторых источников вызывает вопросы — например, странно видеть в научной подборке сайт книжного магазина в Нью-Йорке. И хотя модель прозрачно показывает ход своих рассуждений, критерии отбора источников всё ещё остаются неясными.

Анализ изображений
Gemini не просто «видит» изображения, но и понимает их содержание. Она распознаёт объекты, сцены и может интерпретировать сложные композиции:
«Опиши то, что изображено на этой фотографии».
В результате нейросеть предоставила нам детальное описание: перечислила объекты, цвета и даже попыталась передать настроение фотографии. Однако следует учитывать, что, если на изображении присутствуют люди, Gemini сообщит, что не работает с подобными изображениями:
Попробуем теперь такой промпт:
«Что за стиль живописи на этой картине и кто её автор?»
Нейросеть точно определила ключевые элементы картины, проанализировав стиль и технику художника. Это действительно «Зодиак» Альфонса Мухи:

Описания изображений
С Gemini вы можете получать довольно точные описания изображений, которые подойдут для оформления товаров в интернет-магазинах, публикаций в соцсетях и на других платформах. Давайте проверим:
«Опиши эту картину».
Нейросеть описала содержимое картины, её стиль и дополнила это историческими сведениями. Выглядит довольно подробно:
Перейдём к более сложному запросу:
«Напиши короткий рассказ по мотивам этой картины».
В ответ нейросеть создаёт повествование, основываясь на своём понимании картины для создания сюжета и персонажей:

Генерация и редактирование изображений
Для начала попросим нейросеть создать что-то общее:
«Нарисуй футуристичный город».
Нейросеть понимает запросы не только на английском, но и на других языках. В ответ она сгенерировала детализированное изображение с неоновыми огнями, небоскрёбами и атмосферой фильма «Бегущий по лезвию»:

Вы также можете менять изображение с помощью промпта, добавляя новые детали. Однако исходное изображение при этом может значительно измениться. Чтобы добиться нужного результата, указывайте в запросе стиль, настроение и ключевые элементы. Попробуем и попросим следующее:
«Включи в изображение песочных великанов».
Нейросеть добавила великанов и пустыню, сохранив при этом общий стиль изображения. Если результат вас не устраивает — попробуйте нажать на стрелочку для генерации нового варианта. Чтобы сохранить изображение, щёлкните по нему правой кнопкой мыши и выберите «Сохранить как», либо нажмите левой кнопкой, а затем — на стрелочку в правом верхнем углу.

Написание кода
Нейросеть Gemini способна генерировать, дополнять и исправлять код:
«Напиши на Python функцию, которая находит сумму всех чётных чисел в списке».
Код получился чистым и лаконичным. Главное — нейросеть добавила подробное объяснение каждого действия, что особенно полезно для новичков.
Посмотрите код:
def sum_even_numbers(numbers):
"""
Эта функция принимает список чисел и возвращает сумму всех четных чисел в списке.
Args:
numbers: Список чисел.
Returns:
Сумма всех четных чисел в списке.
"""
even_sum = 0
for number in numbers:
if number % 2 == 0:
even_sum += number
return even_sum
# Пример использования
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
even_sum = sum_even_numbers(numbers)
print(f"Сумма четных чисел в списке: {even_sum}")
А вот его объяснение:
- Определение функции:
- Функция sum_even_numbers принимает один аргумент: numbers (список чисел).
- Она инициализирует переменную even_sum значением 0, которая будет хранить сумму четных чисел.
- Итерация по списку:
- Цикл for проходит по каждому числу в списке numbers.
- Проверка на четность:
- Оператор if number % 2 == 0 проверяет, является ли текущее число number четным. Если остаток от деления на 2 равен 0, значит число четное.
- Суммирование четных чисел:
- Если число четное, оно добавляется к переменной even_sum.
- Возврат результата:
- После завершения цикла функция возвращает значение even_sum, которое содержит сумму всех четных чисел в списке.
Пример использования:
В примере кода мы создаем список numbers и передаем его в функцию sum_even_numbers. Затем мы выводим результат, который будет равен 30 (2 + 4 + 6 + 8 + 10).
Перевод текста
Для начала поработаем с информационной статьей:
«Переведи статью про грейды в айти из Skillbox Media».
Результат получился скучным: Gemini перевела текст на английский, сохранив лексику, синтаксис и логику. Нейросеть также предложила варианты перевода отдельных терминов и даже добавила комментарий: «Надеюсь, это поможет».
А вот с художественным переводом всё интереснее. Наш промпт:
«Переведи первый сонет В. Шекспира».
Нейросеть постаралась сохранить рифму и слог оригинала, и ей это почти удалось. Рифмовать должны были каждая первая и третья строки, вторая и четвёртая, а две последние — между собой. Для сравнения, по ссылке — перевод Самуила Маршака. Ещё у нейросети есть небольшая проблема с определением рода существительных.
Мы ждем потомства от прекраснейших созданий,
Чтоб роза красоты вовек не увядала,
И чтобы, когда зрелый плод исчезнет с годами,
Его наследник нежный память сохранял.
Но ты, в своих сияющих глазах замкнувшись,
Свой яркий пламень подкрепляешь сам собой,
Где изобилье, там голод создав, ужаснувшись,
Себе враг, к сладкой собственной душе жестокий бой.
Ты, украшение мира, свежее сейчас,
Весны блистательной единственный глашатай,
В бутоне собственном скрываешь счастья час,
И, скупясь, расточитель нежный, безвозвратно.
Смилуйся над миром, иначе будешь ты
Обжорой, съевшим то, что миру должен ты.
Какие есть версии Gemini и в чём их различия
В конце 2024 года Google представил модель Gemini 2.0 — новейшую версию, которая по умолчанию используется в чат-ботах. У этой модели есть несколько разновидностей, различающихся по производительности:
- Gemini 2.0 Flash оптимизирована для задач, где важна скорость ответа: краткие вопросы, обобщение информации и создание небольших текстов. Например, когда нужно быстро узнать прогноз погоды или получить краткое определение термина. Google заявил, что Gemini 2.0 Flash работает в два раза быстрее, чем предыдущая версия Gemini 1.5 Pro.
- Flash Thinking Experimental расширяет возможности быстрой работы функцией «мышления». Модель демонстрирует процесс рассуждений и позволяет видеть логику формирования ответа. Такой подход полезен при решении сложных задач, когда важен не только результат, но и путь к его получению. Например, при решении математической задачи модель пошагово показывает процесс вычислений. Отличие от обычной версии Flash — эта модель работает без доступа к интернету.
- Flash Thinking Experimental with Apps интегрирована с другими сервисами Google: YouTube, «Поиском», «Картами» и прочими приложениями. Она позволяет эффективно решать задачи, которые требуют доступа к информации из этих сервисов. Например, вы можете попросить Gemini найти видео на YouTube или проложить оптимальный маршрут в «Картах».
Пользоваться Gemini 2.0 можно бесплатно. Также доступна подписка на Gemini Advanced — более мощную версию с расширенными возможностями:
- Контекстное окно Gemini Advanced вмещает 1 миллион токенов (около 750 тысяч слов), что позволяет модели одновременно обрабатывать и анализировать примерно 1,5 тысячи страниц формата A4. Это в четыре раза больше, чем у GPT-4, который способен обработать около 300 страниц.
- Подписчики Gemini Advanced первыми получают доступ к новым функциям: обновлениям интерфейса, экспериментальным возможностям и улучшенным версиям нейросетей — ещё до официального релиза.
- Gemini Advanced показывает высокую эффективность при выполнении сложных задач: написании и отладке кода, проведении масштабных исследований с привлечением многих источников, а также анализе больших объёмов данных — от текстовых документов до баз данных.
Стоимость подписки на Gemini Advanced составляет 19,99 доллара в месяц и включает 2 ТБ облачного хранилища Google One. Перед оформлением подписки вы можете активировать бесплатный 30-дневный пробный период.
Как воспользоваться Gemini в России
На момент обзора Gemini официально недоступна в России. Однако, если бы у вас появилась возможность виртуально переместиться, скажем, в Нидерланды, использование сервиса стало бы сильно проще. В этом случае сообщение «Gemini пока не поддерживается в вашей стране» должно смениться на «Начать чат» или «Войти». После этого вы можете приступать.
Есть несколько способов использовать Gemini:
- Через веб-приложение. Перейдите на сайт gemini.google.com, войдите в свой аккаунт Google и введите запрос в текстовое поле. Если нужно, добавьте файл или изображение и нажмите кнопку «Отправить».
- Через приложение Google (Android и iOS). Откройте приложение Google на устройстве — если Gemini доступна, вы увидите значок с синей звездой на главном экране. Нажмите на него и введите свой запрос.
- Через «Google Ассистента» (Android). Чтобы использовать Gemini через Google Assistant, переключите язык ассистента на английский и выберите Gemini в качестве основного помощника в настройках. Google работает над локализацией этой функции, и есть вероятность, что в будущем Gemini станет доступна на многих языках, включая русский.
Если вы ищете альтернативы Gemini, в России без ограничений работают несколько похожих нейросетей. Среди основных — Yandex GPT, GigaChat и DeepSeek. Они умеют создавать тексты, писать код, генерить картинки и поддерживать общение. При этом каждая из них имеет свои особенности: Yandex GPT лучше понимает русский контекст, GigaChat ориентирован на бизнес-задачи, а DeepSeek отлично справляется с программированием.

Читайте также:
Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!