Код
#подборки

Промпты для нейросетей: как правильно писать запросы к ChatGPT и другим нейронным сетям

Заставляем нейронки работать на себя и вместо себя.

Иллюстрация: Катя Павловская для Skillbox Media

Нейросети, как джинн из лампы, выполняют всё, о чём мы их просим: пишут тексты для соцсетей, переводят статьи, рисуют картинки всего за пару секунд и так далее. Но есть загвоздка ― чтобы получилось именно то, чего мы хотим, нужно правильно составить запрос. Рассказываем, как это делать.

Содержание

Что такое промпт

Промпт ― это задание для нейросети, сформулированное на естественном языке. Представьте, что ставите задачу настоящему, живому ассистенту: для этого не нужно знать язык программирования и сложные алгоритмы. Достаточно подробно описать, чего вы хотите от помощника, и дать ему необходимые вводные данные.

Например, если бы мы хотели сгенерировать эту статью с помощью нейросети, то промпт для неё мог бы выглядеть так: «Нужно выступить в роли эксперта по нейросетям. Сгенерировать пост для блога на тему: Как писать промпты для нейросетей. Подтемы: midjourney, chatgpt. Использовать стилистику: описание. Тон текста должен быть неформальным».

Передадим этот запрос боту ChatGPT в Telegram и посмотрим на результат.
Скриншот: ChatGPT & Midjourney | AI bot / Telegram / Skillbox Media

Нейросеть выполнила задачу, но не поняла, что Midjourney и ChatGPT — разные инструменты. Кроме того, статья получилась весьма скудного содержания. К счастью, есть несколько лайфхаков, позволяющих получить более качественный результат.

Как правильно составить промпт

Начнём с основных правил хорошего запроса. Их нужно соблюдать при работе с любыми генеративными моделями машинного обучения.


Подробно опишите задачу

Расскажите нейросети, какой результат вы хотите получить. Если вы обращаетесь к модели для генерации изображений, укажите, нужен вам комикс или фотореалистичный рендер. В случае с языковыми моделями укажите формат и жанр текста: пост для соцсетей, статья, пошаговое руководство, художественный рассказ и так далее.

Добавьте тему или объект

Задайте в промпте тему текста и опишите аудиторию, чтобы языковая модель адаптировала контент к вашей задаче. Если пишете статью для новичков, укажите на это, иначе нейросеть выдаст слишком сложный текст. Если генерируете изображение, детально опишите главный объект.

Например, вот какой текст сгенерировал ChatGPT по запросу «Напиши статью в блог технологической компании про нейронные сети». С виду статья получилась «профессиональной», но на самом деле это поверхностный текст, напичканный профессиональными терминами:

Скриншот: ChatGPT & Midjourney | AI bot / Telegram / Skillbox Media

Для другого примера попробуем сгенерировать изображение в нейросети Kandinsky, используя промпт «Создай изображение кота-программиста, который работает допоздна»:

Изображение: Юлия Гаврилова / Kandinsky

Картинка получилась странной, но формально нейросеть отразила все детали запроса. Для более точного результата нужно тщательнее поработать со стилем.

Добавьте больше деталей

Чем больше деталей будет содержать запрос, тем точнее полученный текст или изображение будет соответствовать вашим ожиданиям. При генерации текста можно не только задать формат и тему, но и перечислить важные тезисы или определить структуру статьи. Языковые модели понимают и указания на другие характеристики:

  • Настроение: нейтральное, мистическое, драматичное.
  • Стиль: научный, публицистический, неформальный.
  • Целевая аудитория: школьники, взрослые, айтишники.
  • Объём текста: 100 слов, 1000 знаков.

Вот так могут выглядеть два промпта для текстов на одну тему, но для читателей с разным уровнем подготовки:

  • «Напиши статью в блог технологической компании про нейронные сети. Поясни, почему нейронные сети не крадут работу у людей, а создают её. Объём — 1000 знаков. Целевая аудитория — начинающие программисты».
  • «Напиши научную статью про нейронные сети. Поясни, почему нейронные сети не крадут работу у людей, а создают её. Объём — 1000 знаков. Целевая аудитория ― учёные».

Если вы работаете с изображениями, то попробуйте указать в промпте размеры, цвета, формы и расположение объектов. Например, чтобы создать образ кота, не пишите просто «кот». Объясните, что это за кот (толстый, рыжий, полосатый), где он находится и какие объекты есть рядом с ним. Чтобы получить лучший результат, можно указать стиль картинки.

Вот так Kandinsky обработал запрос «Создай изображение гигантского толстого рыжего полосатого кота-программиста, который работает допоздна за компьютером из восьмидесятых. Стиль ― масляная живопись»:

Изображение: Юлия Гаврилова / Kandinsky

Если сравнить результат с первой попыткой сгенерировать кота-трудоголика, то заметно улучшение качества картинки. Мы использовали ту же нейросеть, но добавили в промпт больше деталей.

Кстати, одни и те же запросы к разным нейросетям могут давать совершенно разные результаты. Такого кота нам нарисовала Stable Diffusion:

Скриншот: Stable Diffusion Online / Skillbox Media

Можно попросить нейросеть имитировать стиль известного художника. Такое изображение сгенерировала Stable Diffusion по запросу «Кот за компьютером в стилистике „Звёздной ночи“ Ван Гога»:

Скриншот: Stable Diffusion Online / Skillbox Media

Дополнительные советы

Ещё несколько советов, которые упростят работу с нейронками:

  • Пользуйтесь телеграм-ботами. На данный момент крупные зарубежные нейросети недоступны в России, но чат-боты на их основе по-прежнему работают.
  • Многие энтузиасты говорят, что стоит использовать запросы на английском языке ― нейросети лучше его понимают.
  • Не используйте в промпте сокращения, просторечия или сленг — языковые модели плохо их воспринимают.
  • Не пытайтесь сгенерировать «запрещёнку». В нейросетях установлены фильтры, которые не позволят вам это сделать.
  • Следите, чтобы детали запроса не противоречили друг другу.

В запросе к Midjourney ― чётко и по делу

Midjourney ― нейросеть для генерации высококачественных изображений. Модель создаёт по запросу четыре картинки, чтобы пользователю было из чего выбрать. Доступ к Midjourney можно получить через бота на официальном Discord-сервере разработчиков. Пробного периода нет, а цена подписки начинается от 8 долларов в месяц. Оплатить можно только картой иностранного банка.

В Telegram можно найти ботов на базе Midjourney. В некоторых из них есть пробный период, которого хватит для знакомства с нейросетью. После этого всё равно придётся покупать токены.


Как составить запрос

В промптах для Midjourney важно соблюдать порядок: чем раньше упомянута деталь, тем она приоритетнее. Поэтому сперва описывайте главный объект, потом окружение и фон, стиль и цвет, а в самом конце указывайте пропорции и размер изображения. Запросы к Midjourney лучше писать на английском языке.

Вот так может выглядеть промпт для генерации изображения: «Paint a mural of a silvery spacecraft traveling through pink, purple and blue nebulas and galaxies. The spaceship is in the middle, there are smaller spaceships collapsing in the background. Genre ― 80s sci-fi».

Сначала мы описываем, что нужно нарисовать: мурал космического корабля. Затем задаём желаемый фон ― туманности и галактики. И, наконец, стиль ― научная фантастика восьмидесятых. Дополнительно указываем цвета объектов и уточняем расположение элементов на холсте.

Вот такие изображения получилось сгенерировать в телеграм-боте на базе Midjourney:

Скриншот: ChatGPT4 | Midjourney / Telegram / Skillbox Media

Для выбора понравившейся картинки надо нажать на одну из кнопок Un, где n — номер изображения. Кнопки с префиксом V генерируют новое изображение на основе выбранного.

Скриншот: ChatGPT4 | Midjourney / Telegram / Skillbox Media

Изображение можно улучшить с помощью встроенных инструментов, которые предлагает бот:

  • Upscale. Увеличивает разрешение картинки. Параметры Subtle и Creative отвечают за креативность при апскейле. В первом случае картинка будет идентична оригиналу, а во втором нейросеть дорисует новые детали.
  • Vary. Генерирует вариации одного и того же изображения. Если выбрать команду с параметром Subtle, то изображение будет больше похоже на исходный вариант, если выбрать Strong ― меньше.
  • Zoom Out. Увеличивает обозримую площадь изображения в полтора или два раза.

Технические детали

Можно указать технические характеристики оборудования. Например, объектив, камеру, освещение и другие параметры. Всё это влияет на цвета и эстетику изображения. Если выбрать плёночную фотокамеру, то картинки будут слегка зернистыми.

Те, кто разбирается в фотографии, могут указать в промпте для Midjourney точные данные для настройки оборудования. Нейросеть умеет работать с ISO, диафрагмой, выдержкой и балансом белого. Всё это позволяет создавать фотореалистичные изображения.

Полезные команды

Midjourney поддерживает множество команд для составления детальных запросов. С их помощью можно генерировать более качественные изображения. Вот несколько самых популярных и полезных команд:

  • --no. Исключает из результата объекты, стили или цвета. Например, можно попросить нейросеть создать картинку с огурцами и помидорами на летней кухне, но не использовать для этого жёлтый цвет:
Скриншот: ChatGPT4 | Midjourney / Telegram / Skillbox Media
  • --aspect или --ar. Позволяет задать соотношение сторон. По умолчанию нейросеть генерирует картинки с соотношением 1:1, но можно использовать и другие популярные форматы:
Изображение: Midjourney v7
  • --chaos или --с. С помощью этой команды можно управлять тем, насколько четыре сгенерированных варианта будут отличаться друг от друга. По умолчанию значение равно нулю. С его увеличением различий между изображениями будет становиться больше:
Генерации без параметра chaos (слева) и с самым высоким значением (справа)
Изображение: Midjourney Documentation
  • --quality или --q. Этот параметр отвечает за проработку и детализацию картинки. Есть четыре возможных значения: 0.25, 0.5, 1, 2. Чем выше детализация, тем больше времени уйдёт на генерацию. По умолчанию установлено значение 1.
Изображение: Eugene Chekhov / X
  • --tilе. Параметр указывает модели на то, что создать изображения нужно в виде бесшовного паттерна.

Более подробно о том, как Midjourney работает с запросами, можно почитать в официальной документации.

Для запросов к Stable Diffusion те же правила, что и для запросов к Midjourney

Stable Diffusion — открытая модель от компании Stability AI. Сторонние разработчики создают на её основе сайты и приложения для работы с нейросетью. Для экспериментов можно использовать сервис Stable Diffusion Online. В нём есть пробный тариф, позволяющий бесплатно сгенерировать десять картинок.

Скриншот: Stable Diffusion Online / Skillbox Media

Нейросеть не поддерживает команды для детальной настройки, как в Midjourney, но остальные принципы составления промптов остаются теми же. Вот что Stable Diffusion сгенерировала по запросу «Very beautiful retro comic book style of a girl writing an article with background summer park, daylight, colorful»:

Скриншот: Stable Diffusion Online / Skillbox Media

В сервисе Stable Diffusion Online в специальном поле можно указать детали, которых не должно быть в сгенерированном изображении. Например, в запросе «Angelic red apple on a cloud», можно указать, чтобы нейросеть не рисовала ангелов. Рядом есть меню для выбора стиля. Выберем «фэнтези» и посмотрим на результат:

Скриншот: Stable Diffusion Online / Skillbox Media

В запросах к «Шедевруму» добавьте побольше деталей

«Шедеврум» ― бесплатная нейросеть «Яндекса» для генерации изображений и зацикленных анимаций. Для доступа к ней нужно установить приложение из Google Play или App Store и авторизоваться.

Все принципы составления запросов, о которых мы говорили выше, применимы и в работе с «Шедеврумом». В приложении есть лента с последними и лучшими работами — её можно использовать для поиска идей. Важная фишка «Шедеврума» в том, что он хорошо понимает промпты на русском языке.

Скриншот: «Шедеврум» / Skillbox Media

В запросах к Kandinsky делаем отсылки к русской культуре

Kandinsky (ruDALL-E) — нейросеть Sber AI для генерации картинок и коротких роликов. Компания представила её в 2021 году. Последняя версия лучше прежних понимает контекст и знает много о русской культуре. Поэтому, если вам нужно сгенерировать персонажа российского или советского мультфильма, например Чебурашку, то лучше всего для этого подойдёт именно Kandinsky.

Доступ к модели можно получить на портале ruDALL-E, Fusion Brain, в телеграм-боте или в приложении «Салют» для Android.

Сайтом ruDALL-E можно пользоваться без регистрации. На странице есть поле для ввода запроса и меню выбора соотношения сторон, разрешения и стиля.

Скриншот: ruDALL-E / Skillbox Media

Для доступа к веб-приложению Fusion Brain надо будет пройти регистрацию, но в нём больше возможностей для генерации. Например, можно разместить несколько вариантов на одном холсте и выбрать наиболее подходящий. Кроме того, Fusion Brain позволяет создавать видео и анимации.

Как генерировать видео

Kandinsky пока умеет создавать только короткие ролики. Максимальная длительность анимации составляет 7 секунд, длительность видео ― 4 секунды. Для генерации необходимо:

  • Выбрать в редакторе вкладку «Видео».
Скриншот: Fusion Brain / Skillbox Media
  • В пункте «Модель» выбрать тип контента: анимация или видео. В меню «Размер» можно задать соотношение сторон.
Скриншот: Fusion Brain / Skillbox Media
  • Для генерации анимации надо описать происходящее в каждом кадре, а также выбрать направление камеры.
  • При создании видео можно просто указать промпт.

Примеры видео, сгенерированных с помощью Kandinsky:

В запросах к ChatGPT обязательно описываем контекст

ChatGPT — чат-бот на базе большой языковой модели GPT от разработчика OpenAI. Он может писать статьи, генерировать идеи, составлять контент-планы и готовить посты для социальных сетей.

Официальный сайт чат-бота не открывается на территории России, но у компании есть публичный API. Сторонние разработчики используют его для создания телеграм-ботов с поддержкой ChatGPT.

Нейросеть понимает множество языков, включая русский. При составлении запросов важно придерживаться чёткой структуры, чтобы всегда получать предсказуемый результат:

  • Роль. Начните промпт с описания роли чат-бота. Например, он может быть маркетологом с большим опытом или психологом.
  • Задача. Затем расскажите ChatGPT, чего вы хотите. Для этого используйте описания действий: «напиши», «придумай» или «проанализируй».
  • Контекст. Введите ChatGPT в курс дела, передайте ему цель запроса и вводные данные. Если вы хотите сгенерировать контент-план, то расскажите о конечной цели.
  • Формат. Укажите, в каком формате должен быть ответ: таблицы, электронного письма, сценария или статьи.
  • Тон. Если вы используете чат-бота для генерации письма для коллег, то укажите, что надо использовать деловой стиль общения.

Подробный промпт для ChatGPT может выглядеть так: «Представь, что ты маркетолог с десятилетним опытом. Я хочу за три месяца вырастить блог с 1000 до 5000 подписчиков в нише образования. Предложи контент-план на месяц, который поможет мне достичь этой цели. План должен быть в виде таблицы». Вот что нейросеть сгенерирует по этому запросу:

Скриншот: ChatGPT / Skillbox Media

В запросах к GigaChat просим покреативить

GigaChat — большая языковая модель от разработчиков Sber AI. Она похожа на ChatGPT, но обучали её на русскоязычном датасете. Доступ к GigaChat можно получить на сайте или в телеграм-боте.

Нейросеть может отвечать на вопросы, писать статьи и генерировать идеи. Её главное преимущество в том, что она хорошо знает русский язык. ChatGPT лучше понимает английский, а свои ответы просто переводит на русский, и это иногда сказывается на качестве результата.

GigaChat можно использовать для работы с русскоязычными текстами или для генерации креативов. Чат-бот может придумывать шутки с игрой слов, слоганы и песни. А ещё в телеграм-боте GigaChat можно создавать открытки для близких:

  • Сперва надо отправить команду «Создать открытку» и ответить на несколько уточняющих вопросов.
Скриншот: GigaChat / Telegram / Skillbox Media
  • Нейросеть использует эти данные для сочинения небольшого стиха:
Скриншот: GigaChat / Telegram / Skillbox Media

Где искать вдохновение

Прокачивать навык составления промптов можно с помощью специальных сайтов. На них энтузиасты публикуют лучшие запросы с результатами, которые можно адаптировать к своим целям:

  • Lexica. Большая библиотека нейроартов с промптами, которые можно скопировать одним кликом.
Скриншот: Lexica / Skillbox Media
  • OpenArt. Галерея изображений, сгенерированных пользователями, с запросами и подробным описанием параметров.
Скриншот: OpenArt / Skillbox Media
  • «Шедеврум». В ленте приложения видны работы пользователей. Их можно использовать для поиска идей.
Скриншот: «Шедеврум» / Skillbox Media
  • GigaChat. Команда разработчиков Sber AI собирает удачные промпты в базе знаний. Вместе с запросами публикуют и примеры ответов.

Помощники для генерации промптов

Помимо самих генеративных моделей, существуют специальные сервисы для составления запросов:

  • Promptomania — конструктор промптов для Midjourney. С его помощью можно быстро разобраться со стилями, настройками камеры и создавать сложные запросы.
Скриншот: Promptomania / Skillbox Media
  • ChatGPT Prompt Generator — сервис, который помогает составить запрос с подробным описанием роли чат-бота. После обработки такого запроса бот будет отвечать как специалист по регулярным выражениям, писатель или архитектор ПО.
Скриншот: Aspose / Skillbox Media
  • Neural Writer — генератор промптов с поддержкой 27 языков. Сервис получает запрос и адаптирует его для ChatGPT.
Скриншот: Neural Writer / Skillbox Media
  • GPTprompt — помогает составлять запросы на русском языке.
Скриншот: GPTprompt / Skillbox Media

Изучайте IT на практике — бесплатно

Курсы за 2990 0 р.

Я не знаю, с чего начать
Научитесь: Профессия Python-разработчик Узнать больше
Понравилась статья?
Да

Пользуясь нашим сайтом, вы соглашаетесь с тем, что мы используем cookies 🍪

Ссылка скопирована