Изображения: брифуй ИИ как арт-директор
Вчера ты научился думать прежде, чем создавать. Сегодня это правило встречается с картинками: ты опишешь изображение так, как арт-директор даёт бриф иллюстратору — пять решений, одно предложение — и уйдёшь с открыткой, флаером или обоями, которыми реально воспользуешься. Всё на бесплатных тарифах, как всегда.
Генерация изображений — это бриф, а не магия: опиши Объект, Сцену, Стиль, Настроение и Формат так, как сделал бы арт-директор, — а затем дорабатывай результат в диалоге. Gemini даёт больше всего бесплатных изображений в день, ChatGPT стоит использовать, когда на картинке должен быть точный текст, а Claude — который вообще не генерирует изображения — пишет тебе брифы.
1Откуда берётся картинка — и почему всё решают твои слова
Вот что на самом деле происходит, когда ты печатаешь предложение и появляется изображение, — одним честным абзацем. Эти системы учились на миллионах пар «изображение + его текстовое описание». На достаточном количестве примеров они выучили, как слова выглядят: что «золотистый ретривер» делает с формами и шерстью, что «акварель» делает с краями, что «в сумерках» делает со светом. Когда ты печатаешь описание, модель отрисовывает совершенно новое изображение под твои слова — она не ищет фото в интернете и не вырезает кусочки из существующих картинок. Она рисует то, что ты описал, исходя из всего, что выучила о том, как описания превращаются в изображения.
У этого механизма есть одно следствие, которое объясняет каждое разочаровывающее ИИ-изображение, что ты когда-либо видел: модель отрисовывает твоё описание — и сама решает всё, что ты не описал. Неоднозначность — это не ошибка, это делегирование. Напиши «собака в парке» — и ты делегировал породу, время года, время суток, ракурс, художественный стиль и настроение машине, которая выберет для каждого пункта самый статистически усреднённый вариант. Результат технически верный и абсолютно безликий — стоковое фото ничьей собаки в ничьём парке.
Если это звучит знакомо — так и должно быть. Это снова Формула брифа из Дня 2: всё, что ты не уточнил, ассистент додумает, а догадки — безликие. И это «Сначала думай → потом создавай» из Дня 6 в новой одежде: генератор изображений — строитель, а не архитектор. Думать — что именно эта картинка должна показать, в каком стиле, для чего — твоя работа. Сегодняшняя структура из пяти частей и есть способ продумать это для картинок.
2Бриф на изображение: пять решений, которые делают картинку твоей
Арт-директор никогда не говорит иллюстратору «нарисуй что-нибудь красивое». Он передаёт бриф. В твоём — пять частей, это и есть Бриф на изображение, и он покрывает каждое решение, которое модель иначе приняла бы без тебя:
- Объект — кто или что на картинке. Главное существительное плюс одна-две детали: «щенок золотистого ретривера в синем праздничном колпаке», «дымящаяся кружка», «постер с текстом „GARAGE SALE"».
- Сцена — где и когда. Место, время суток, погода: «в куче осенних листьев в городском парке на рассвете», «на деревянном столе у окна, по которому стекает дождь».
- Стиль — как это сделано. «Фотореалистично», «акварель как в детской книжке», «плоская иллюстрация», «винтажный туристический плакат», «минималистичный контурный рисунок».
- Настроение — каким это должно ощущаться. «Тёпло и ностальгично», «игриво и ярко», «спокойно и тихо». Настроение незаметно задаёт свет и цвета.
- Формат — какая форма, для чего. «Квадрат, для открытки», «широкая горизонталь, для обоев рабочего стола», «вертикальный постер». Назвав назначение, ты помогаешь модели выстроить под него композицию.
Собери все пять в одно простое предложение — и получишь то, что узнал бы любой арт-директор:
Создай изображение: 1щенок золотистого ретривера в синем праздничном колпаке 2сидит в куче осенних листьев в городском парке на рассвете, 3акварельная иллюстрация как в детской книжке, 4тепло, спокойно и немного ностальгично, 5квадратный формат, для открытки.
Два успокаивающих замечания, прежде чем ты начнёшь переживать, что делаешь это «правильно». Первое: пять частей — это чек-лист, а не смирительная рубашка. Простое предложение, которое касается всех пяти, бьёт любую кашу из ключевых слов, и порядок не важен. Второе: тебе не нужен художественный словарь. «Выглядит как детская книжка с картинками» — совершенно нормальный стиль. «Уютно, как воскресное утро» — совершенно нормальное настроение. Модель училась на человеческих описаниях; обычный человеческий язык — именно то, что она понимает лучше всего.
3Вторая суперсила: дорабатывай в том же треде
Первое изображение — это первый черновик, то же правило про текст, что ты выучил в День 1. Но вот чего большинство новичков так и не открывает: тебе не нужно начинать заново. Поскольку ты работаешь в диалоге, тред помнит созданную картинку, и ты можешь направлять изменения простыми словами: То же изображение, но в сумерках. Оставь всё, сделай кружку красной. Убери текст на стене. Каждый ответ — это инструкция на правку художнику, которому никогда не надоедает переделывать, а не очередной рывок за рычаг.
В этом и разница между перегенерацией и доработкой, и это стоит сказать точно: каждая перегенерация с теми же словами — подброс монеты; каждое изменённое слово — это решение. Если изображение не такое, значит, в брифе чего-то не хватало или что-то было неясно — назови это. «Сделай теплее по ощущению» бьёт «попробую ещё раз». «Вид с другой стороны улицы» бьёт «надеюсь, повезёт». Ты — арт-директор; раунд правок — это момент, когда в картинку входит твой вкус.
Одно честное замечание про ожидания: руки, лица и мелкие надписи всё лучше, но именно на них модели изображений чаще всего срываются. Если деталь важна — число пальцев, написание на вывеске, — внимательно посмотри на неё, прежде чем использовать картинку, и назови правку в следующей доработке. Уверенный стажёр из Дня 1 тоже рисует картинки.
4Три инструмента, три роли: кто рисует, кто пишет буквы, кто составляет бриф
Это модель персонала из Дня 3 за настоящей работой. Большая тройка делит сегодняшнюю задачу чётко:
- Gemini — инструмент объёма. Самая щедрая бесплатная генерация изображений из большой тройки с большим отрывом — дневной бесплатный лимит, достаточно большой, чтобы для тренировки считать его практически безграничным (точный потолок часто меняется; проверь текущие лимиты внутри приложения). Это делает его твоей тренировочной студией — местом, где учишься брифовать на практике и где впустую потраченное изображение не стоит тебе ничего.
- ChatGPT — инструмент точности. Его генератор изображений лучше всех справляется с чистым, правильно написанным текстом внутри картинки — постеры, приглашения, вывески. Но бесплатный лимит на изображения мал и часто меняется (проверь текущие лимиты внутри приложения), так что трать каждое осознанно: сначала бриф, потом генерация.
- Claude — автор брифов. Claude вообще не генерирует изображения. Зато он сильнейший писатель из трёх — а значит, это превосходная фабрика брифов на изображения: опиши, что тебе нужно, получи пять арт-директорских брифов в пяти стилях, перенеси лучший в Gemini.
Изображения путешествуют дальше текста, поэтому три строчки, прежде чем чем-то делиться:
- Никаких изображений реальных людей — ни твоего начальника, ни знаменитости, ни учителя твоего ребёнка. Это варьируется от грубости до настоящего вреда.
- Никаких логотипов брендов. Они тоже под запретом.
- Указывай, что изображение создано ИИ, где это важно — объявление на маркетплейсе, рассылка сообщества, что угодно, что люди могут принять за фотографию. Скажи, что изображение создано ИИ. За то, что ты публикуешь, отвечаешь ты, а не инструмент.
Генерировать изображение — это описывать сцену художнику-скетчеру по телефону. Скажи «нарисуй дом» — и получишь какой-то дом, его, а не твой. Скажи «узкий кирпичный таунхаус в сумерках, тёплый свет в окнах, лёгкий дождь, вид с другой стороны улицы, книжный стиль» — и получишь свой. Тот же художник, тот же карандаш, дико разный результат. Художник никогда не был проблемой; проблемой был телефонный звонок. А когда скетч приходит почти таким, как надо, ты не кладёшь трубку и не перезваниваешь — ты остаёшься на линии: «отлично, но пусть дождь будет сильнее».
Ты сделаешь своё первое арт-директорское изображение там, где ошибки бесплатны. Одно правило, раз и навсегда: квадратные скобки в любом промпте означают «замени на своё» — [твоё настоящее событие] заполняешь сам. Аккаунт Gemini ты создал в День 1.
- Открой gemini.google.com и войди под аккаунтом из Дня 1. Посмотри внизу страницы — там поле для сообщения. пустое поле для сообщения внизу, твои прошлые чаты в боковой панели.
- Скопируй и вставь этот полный Бриф на изображение в поле сообщения и отправь. Генерация изображения занимает дольше, чем текст, — дай ей несколько секунд.
Промпт для копирования · GeminiСоздай изображение: уютный домашний кабинет в скандинавском стиле, утренний свет через большое окно, дымящаяся кружка на столе, мягкие пастельные тона, фотореалистично, горизонтальный формат.изображение появляется прямо в чате, как фото в мессенджере. Заметь, сколько в нём ты узнаёшь из брифа — свет, кружку, цвета.
- Теперь дорабатывай — в том же треде, а не в новом чате. Именно диалог помнит картинку.
Промпт для копирования · Gemini (тот же тред)Та же сцена, но вечер, тёплый свет лампы, и добавь спящего кота на кресле.та же комната, перерисованная: свет лампы вместо утреннего солнца, кот на кресле. Сцена уцелела; изменилось только то, что ты назвал.
- Сделай ещё одну свою доработку — измени ровно одну вещь («сделай стены тёмно-зелёными», «вид от дверного проёма»). Это и есть привычка: меняй слова, а не кости. та одна вещь, которую ты назвал, меняется, а остальное в основном держится. Это режиссура, а не азартная игра.
- Сохрани понравившееся: наведи курсор (или коснись) на изображение и нажми иконку скачивания. файл изображения попадает в папку загрузок, готовый к использованию где угодно.
Специальность ChatGPT — помещать читаемые, правильно написанные слова внутрь изображения — именно то, что нужно постерам, приглашениям и вывескам. Бесплатный лимит на изображения мал (проверь текущие лимиты внутри приложения), поэтому дисциплина такая: напиши бриф до того, как откроешь инструмент. Эти лимиты часто меняются — какими бы ни были цифры на твоём экране, рабочий процесс всё равно тот же.
- Реши, какой именно текст должна нести твоя картинка, слово в слово, прежде чем тратить генерацию. Запиши его. (Это «Сначала думай → потом создавай» в миниатюре.) короткая заметка в одну строку с твоим настоящим текстом, например „GARAGE SALE · SATURDAY 10AM".
- Открой chatgpt.com, начни новый чат и вставь бриф со своим текстом в кавычках:
Промпт для копирования · ChatGPTСоздай простой постер: текст „[твоё настоящее событие — например, GARAGE SALE · SATURDAY 10AM]" жирным дружелюбным шрифтом, яркий иллюстрированный стиль, солнечный пригородный фон, квадратный формат.постер с твоими словами, написанными реально разборчивым шрифтом, — то, в чём инструменты изображений раньше были знаменито плохи.
- Вычитай изображение так, как вычитывал бы письмо: прочитай каждое слово на нём, вслух, если можешь. Шрифт обычно правильный — но «обычно» не значит «всегда». Если что-то не так, дорабатывай в том же треде:
Промпт для копирования · ChatGPT (тот же тред)Тот же постер, оставь всё — но исправь текст, чтобы он читался точно так: [твой текст, написанный так, как тебе нужно].исправленный постер. Проверь ещё раз — текст заслуживает второго прочтения.
- Скачай его так же, как раньше (наведи или коснись, затем иконка скачивания). файл квадратного постера, который реально можно напечатать или выложить уже сегодня.
Claude не умеет рисовать — но пишет брифы лучше, чем ты бы поверил, а ты теперь знаешь, что бриф и есть работа. Используй его всякий раз, когда знаешь, что тебе нужно, но не знаешь, как это описать. Аккаунт Claude ты создал в День 1.
- Открой claude.ai, начни новый чат и закажи пять брифов сразу:
Промпт для копирования · ClaudeНапиши 5 промптов для генерации изображений для [твоя настоящая задача — например, открытка на день рождения 60-летнему любителю джаза]. По одному предложению на каждый, и в каждом должны быть объект, сцена, стиль, настроение и формат. Варьируй стиль: фотореализм, акварель, плоская иллюстрация, винтажный плакат, минимализм.пять пронумерованных брифов в одно предложение, каждый — полный Бриф на изображение в своём стиле — стилистическое меню для одной идеи.
- Выбери понравившийся и итерируй по нему, как по любому черновику (привычка из Дня 2): Сделай №2 теплее и игривее и закончи его так: квадратный формат, для печатной открытки. бриф, заточенный под твой вкус, — ещё до того, как хоть одна генерация изображения была где-либо потрачена.
- Скопируй готовый бриф, вставь в Gemini и сгенерируй. изображение, собранное из профессионально написанного брифа, который ты как арт-директор довёл примерно за минуту, — модель персонала из Дня 3 в работе командой.
Промпт из пяти слов, потом перегенерация, перегенерация, перегенерация — в надежде, что машина рано или поздно прочтёт твои мысли. На бесплатных тарифах это сжигает дневной бюджет на изображения за десять минут, и хуже того — ничему тебя не учит: каждая перегенерация с теми же словами — подброс монеты; каждое изменённое слово — это решение. Картинка вышла не такой не потому, что инструмент слабый, — она вышла не такой потому, что в брифе не хватало решения, а перегенерация его не добавляет. Арт-директоры не перегенерируют; они перебрифовывают.
Вот твоё преимущество с сегодняшнего дня: пока все остальные дёргают рычаг, ты пишешь один бриф из пяти частей и делаешь две названные доработки — и на том же бесплатном бюджете именно ты выпускаешь что-то годное.
Создай одно изображение, которым реально воспользуешься на этой неделе — открытку на день рождения, флаер мероприятия, обои рабочего стола с любимым местом, визуал для поста.
- Напиши полный Бриф на изображение из пяти частей: Объект + Сцена + Стиль + Настроение + Формат. (Застрял на формулировке? Попроси Claude набросать черновик — разбор 3.)
- Сгенерируй его в Gemini — или в ChatGPT, если на изображении нужны слова.
- Сделай ровно две доработки в диалоге в том же треде. Меняй слова, а не кости.
- Скачай победителя и помести туда, где он пойдёт в дело, — открытку напечатай, флаером поделись, обои поставь.
- Сохрани выигравший бриф, дословно, в своём Блокноте промптов (День 5), подписав, что он сделал. Брифы переиспользуемы; удача игрового автомата — нет.
Итог дня — 30 секунд
- Изображения брифуют, а не колдуют: модель отрисовывает твоё описание — каждая деталь, которую ты опустил, это решение, делегированное машине.
- Бриф на изображение: Объект + Сцена + Стиль + Настроение + Формат, в одном простом предложении. Обычный язык бьёт художественный жаргон.
- Дорабатывай в диалоге в том же треде — «то же изображение, но…». Меняй слова, а не кости: каждая перегенерация — подброс монеты, каждое изменённое слово — решение.
- Маршрутизация: Gemini = бесплатный объём (большой дневной лимит — проверь текущие лимиты в приложении), ChatGPT = точность и текст на картинке (малый бесплатный лимит, часто меняется — трать осознанно), Claude = пишет брифы, изображений не генерирует.
- Права и вкус: никаких реальных людей, никаких логотипов брендов; проверяй руки, лица и надписи перед использованием; указывай ИИ-изображения, где это важно.
- Выигравший бриф идёт в твой Блокнот промптов — сегодняшнее изображение красивое, но актив — это переиспользуемый бриф.