Код

#статьи

1 апр 2025
0

Новый генератор изображений в ChatGPT: что умеет и как им пользоваться

Превращаем всё подряд в аниме студии Ghibli.

Иллюстрация: ChatGPT / OpenAI / Colowgee для Skillbox Media

Даниил Шатухин

Автор статей о программировании, технологиях и гаджетах. Пишет код на JavaScript и Python. Любит веб-технологии, модные приложения и магию Apple.

На прошлой неделе соцсети наводнили тонны картинок в стиле известных мультфильмов и франшиз. Пользователи выкладывали переработанные исторические фотографии, мемы и семейные архивы, созданные с помощью ИИ — к тренду даже присоединился официальный аккаунт правительства США.

Виной всему стало обновление ChatGPT. Инженеры OpenAI научили нейросеть редактировать пользовательские фотографии и генерировать реалистичные картинки. Мы поэкспериментировали с новой версией чат-бота и в этой статье подробно рассказываем об основных возможностях.

Содержание

Контекст: что за новый генератор
Как получить доступ
Как сгенерировать картинку
Стилизация изображений
Генерация по наброскам
ChatGPT в дизайне интерфейсов
Инфографика от нейросети
Минусы и ограничения

Контекст: что за новый генератор

25 марта 2025 года OpenAI выпустила обновлённый генератор изображений в ChatGPT. Если раньше картинки создавала отдельная модель DALL-E, то теперь эту задачу полностью переложили на мультимодальную GPT-4o.

Нейросеть научили запоминать образы персонажей, чтобы применять к ним различные стили, работать с текстом, добавлять детали и генерировать фотореалистичные картинки. А ещё ChatGPT прокачали в сфере составления графиков, чертежей и инфографики: можно отправить чат-боту любой текст и попросить собрать главные мысли в одной зарисовке.

Как получить доступ

Изначально доступ к генератору картинок был открытым, однако серверы не выдержали наплыва пользователей. OpenAI пришлось ввести ограничения — сейчас нейросеть доступна только в тарифах ChatGPT Plus и ChatGPT Pro. При этом у авторизованных пользователей без подписки есть три бесплатные генерации в день.

Интересно, что даже в платных версиях проблемы сохраняются: нейросеть может работать медленно и выдавать некачественные арты. Из-за этого Сэм Альтман даже призвал пользователей охладить свой пыл и поменьше генерировать картинки :)

Чтобы получить доступ к новому генератору изображений, перейдите на сайт ChatGPT, авторизуйтесь и выберите модель GPT-4o. Также генератор доступен в сервисе Sora — для этого в поле запроса нужно выбрать пункт Image. Помимо стандартной работы с изображениями, Sora умеет превращать картинки в видео.

Обратите внимание: ChatGPT официально не работает в России. Поэтому для запуска сервиса придётся переместиться в другую страну, например в Германию или Нидерланды.

Генератор картинок на сайте Sora
*Скриншот: Sora / Skillbox Media*

Как сгенерировать картинку

Генерация изображений доступна только в чате с моделью GPT-4o — в других версиях генерация картинок недоступна. Вот пошаговая инструкция, как сгенерировать картинку в новой версии ChatGPT:

Шаг 1. Перейдите на официальный сайт ChatGPT, но помните о территориальных ограничениях.
Шаг 2. В верхнем выпадающем меню выберите модель GPT-4o.

Картинки можно генерировать только в чате с моделью GPT-4o
*Скриншот: ChatGPT / Skillbox Media*

Шаг 3. В поле ввода нажмите на три точки и в выпадающем списке выберите опцию «Создать изображение».

Для работы с картинками надо выбрать специальную опцию
*Скриншот: ChatGPT / Skillbox Media*

Шаг 4. Введите промпт и дождитесь завершения генерации.

На создание картинки может уйти несколько минут
*Скриншот: ChatGPT / Skillbox Media*

Шаг 5. Скачайте готовое изображение или внесите правки. Для этого нажмите на картинку в чате, выберите иконку карандаша и выделите область, которую надо отредактировать.

Готовое изображение можно отредактировать
*Скриншот: ChatGPT / Skillbox Media*

Стилизация изображений: гайд и примеры

Судя по постам в соцсетях, пользователям особенно понравилось изменять стиль фотографий знаменитостей, переосмыслять мемы и переносить персонажей поп-культуры в новые вселенные.

Чтобы отредактировать картинку в нужном стиле, сделайте следующее:

Шаг 1. Откройте чат с языковой моделью GPT-4o и выберите опцию «Создать изображение».
Шаг 2. Нажмите на иконку с плюсом и загрузите своё изображение. Можно выбрать несколько картинок, например, если нужно смешать стили или перенести персонажей с одного фото на другое.

Можно загрузить своё изображение, чтобы ChatGPT его обработал
*Скриншот: ChatGPT / Skillbox Media*

Шаг 3. Детально опишите, что вы хотите получить на выходе. Для стилизации картинки достаточно просто указать стиль финального изображения.

Посмотрим на возможности стилизации ChatGPT на примере популярных мемов: кукольного кота из американского шоу TV Funhouse, фото турецкого стрелка Юсуфа Дикеча и всегда улыбающегося Николая Василенко.

Аниме-студия Ghibli

Практически сразу после релиза обновлённого генератора ленту в соцсети X заполнили переработки исторических фотографий, мемов и кадров из фильмов в стиле аниме студии Ghibli. Дошло до того, что один разработчик из Канады выпустил браузерное расширение, которое полностью удаляет с веб-страницы всё, что хотя бы чуть-чуть напоминает работы студии.

«Симпсоны»

Вторые по популярности в интернете — генерации в духе «Симпсонов». Примечательно, что нейросеть не просто применяет «жёлтый» фильтр для кожи, а полностью повторяет особенности персонажей. Вот как выглядели бы наши мемы, если попали в Спрингфилд.

«Южный парк»

Персонажи «Южного парка» оказались не такими популярными в социальных сетях. Впечатление отчасти портит разная рисовка. Вероятно, в датасете ChatGPT были кадры из разных сезонов мультсериала.

Пластилиновая анимация

Мы решили поиграть со стилями и посмотреть на мемы в трёхмерном стиле пластилиновых мультиков. В такой технике выполненные многие культовые мультфильмы советской эпохи, например «Падал прошлогодний снег» или «Пластилиновая ворона». Вот так в этом стиле выглядят мемы:

8-битная графика

От трёхмерных артов переходим к 8-битной графике времён игры Super Mario. ChatGPT справился и с этой задачей:

LEGO

С помощью ChatGPT любую фотографию можно превратить в сцену из мира конструкторов LEGO. В некоторых случаях нейросеть добавляет фигуркам лишние детали, чтобы они выглядели более живыми:

Генерация по наброскам

ChatGPT научили анализировать изображения, которые загружает пользователь, и учитывать их содержимое во время генерации. Благодаря этому можно передавать чат-боту наброски картинок и получать на выходе шедевры.

Например, если вам нужна обложка для видео на YouTube, то просто нарисуйте её, загрузите в ChatGPT и попросите использовать в качестве референса. За основу можно взять следующий промпт:

Turn this sketch into a hyper-realistic 1920×1080 YouTube thumbnail. Follow the rules that are given in the text on the thumbnail.

Перевод: «Преврати этот набросок в гиперреалистичную превью для YouTube с разрешением 1920×1080. Следуй правилам, которые даны текстом на наброске».

Вот какой результат выдаст нейросеть:

Небрежный набросок превращается в реалистичную картинку
*Скриншот: ChatGPT / Skillbox Media*

ChatGPT в дизайне интерфейсов

ChatGPT теперь ещё лучше справляется с дизайнерскими задачами. Допустим, у вас есть набор виджетов для мобильного приложения. Все они выполнены в светлых тонах, но надо адаптировать набор для любителей тёмной темы.

Можно перерисовать всё вручную, а можно сделать скриншот макета, закинуть в ChatGPT и попросить поменять оформление. На удивление нейросеть отлично справляется и даже не придумывает лишние детали:

Всего за минуту чат-бот переделал макет виджетов
*Скриншот: ChatGPT / Skillbox Media*

Дизайн от ChatGPT можно перенести в Figma и разбить на отдельные элементы. Даже если вы планируете делать всё сами, чат-бот поможет визуализировать идеи.

За основу для экспериментов можете взять промпт ниже:

Change the theme of these widgets to dark. Keep all the original design details. Just change the theme of the design.

Перевод: «Поменяй цветовую тему этих виджетов на тёмную. Сохрани все оригинальные детали оформления. Просто измени тему».

Инфографика от нейросети

Инженеры OpenAI улучшили генерацию текста на изображениях, поэтому ChatGPT теперь может добавлять подписи на картинки. Например, на картинке ниже ChatGPT превратил описание случайного чайника в полноценную инфографику. Языковая модель нашла ключевые мысли, выделила важные преимущества товара и отразила их на карточке. Правда, допустила несколько опечаток в тексте, но не будем судить строго.

Текст и рисунки полностью создала нейросеть
*Скриншот: ChatGPT / Skillbox Media*

Можно пойти дальше и попросить чат-бота создать схему, плакат или слайды для презентации. Главное, что текст на картинках теперь будет читаемым.

Минусы и ограничения модели

Несмотря на все плюсы, у генератора изображений от OpenAI есть несколько существенных минусов:

Нейросеть всё ещё часто ошибается — например, может сгенерировать человека с четырьмя пальцами на руке или нарисовать Боба Росса без красок в палитре :)
Создавать картинки без ограничений могут только владельцы платных подписок Pro и Plus.
Иногда нейросеть отказывается генерировать картинки в стиле известных франшиз из-за авторских прав. Предсказать это невозможно: допустим, ChatGPT генерирует несколько картинок в стиле студии Ghibli, а потом внезапно вспоминает, что они защищены авторским правом.
Перегруженные серверы мешают создавать изображения оперативно. В некоторых случаях сервис просит сделать перерыв на 10–15 минут — видимо, чтобы другие тоже могли сгенерировать себе аватарку в стиле «Симпсонов».

Даже чат-боту бывает нужен перерыв
*Скриншот: ChatGPT / Skillbox Media*

Что в итоге

OpenAI обновила функцию генерации изображений в ChatGPT. Пользователям понравились новые опции и возможности, но не все могут протестировать нейросеть.
Обновлённая функция генерации доступна только пользователям тарифов ChatGPT Plus и Pro.
Даже с платной подпиской сервис не всегда работает стабильно: слишком много желающих, и серверы не справляются с нагрузкой.
С помощью генератора в ChatGPT пользователи превращают фотографии в кадры знаменитых мультфильмов и перемещают знаменитостей в альтернативные вселенные.

Больше интересного про код — в нашем телеграм-канале. Подписывайтесь!

Читайте также: