Зображення: дайте ШІ бриф, як арт-директор
Учора ви навчилися думати, перш ніж створювати. Сьогодні це правило зустрічається з картинками: ви описуватимете зображення так, як арт-директор дає бриф ілюстратору — п'ять рішень, одне речення — і отримаєте картку, флаєр чи шпалери, які справді захочеться використати. Усе на безкоштовних тарифах, як завжди.
Генерація зображень — це бриф, а не магія: опишіть Об'єкт, Сцену, Стиль, Настрій і Формат так, як це зробив би арт-директор — а потім допрацюйте результат у розмові. Gemini дає вам найбільше безкоштовних зображень на день, ChatGPT варто використовувати, коли на зображенні мають бути точні слова, а Claude — який зовсім не генерує зображень — це той, хто пише ваші брифи.
1Звідки береться картинка — і чому ваші слова вирішують усе
Ось що насправді відбувається, коли ви вводите речення і з'являється зображення, в одному чесному абзаці. Ці системи навчилися на мільйонах пар зображень та їхніх текстових описів. На достатній кількості прикладів вони засвоїли, як слова виглядають: що «золотистий ретривер» робить із формами й шерстю, що «акварель» робить із краями, що «у сутінках» робить зі світлом. Коли ви вводите опис, модель малює абсолютно нове зображення, що відповідає вашим словам — вона не шукає фото в інтернеті й не вирізає та вставляє з наявних картинок. Вона малює те, що ви описали, з усього, що дізналася про те, як описи відображаються в зображення.
У цього механізму є один наслідок, який пояснює кожне розчаровуюче ШІ-зображення, яке ви коли-небудь бачили: модель малює ваш опис — а все, що ви не описали, вирішує сама. Двозначність — це не помилка; це делегування. Введіть «собака в парку» — і ви делегували породу, пору року, час доби, ракурс камери, художній стиль і настрій машині, яка обере найбільш статистично усереднений варіант для кожного. Результат технічно правильний і цілком безликий — стокове фото нічиєї собаки в нічиєму парку.
Якщо це звучить знайомо — так і має бути. Це знову Формула брифу з Дня 2: усе, що ви не вкажете, асистент вгадує, а здогадки безликі. І це Думаємо → Створюємо з Дня 6 у новому вбранні: генератор зображень — це будівельник, а не архітектор. Думання — що саме має показувати ця картинка, в якому стилі, для чого — це ваша робота. Сьогоднішня структура з п'яти частин — це те, як ви робите це думання для картинок.
2Бриф на зображення: п'ять рішень, які роблять картинку вашою
Арт-директор ніколи не каже ілюстратору «намалюй щось гарне». Він передає бриф. У вашому — п'ять частин — це Бриф на зображення, і він охоплює кожне рішення, яке модель інакше ухвалила б без вас:
- Об'єкт — хто чи що зображено на картинці. Головний іменник плюс одна-дві деталі: «цуценя золотистого ретривера в синьому святковому ковпачку», «горнятко, з якого парує», «постер із текстом „РОЗПРОДАЖ“».
- Сцена — де і коли. Місце, час доби, погода: «у купі осіннього листя в міському парку на світанку», «на дерев'яному столі біля вікна, по якому стікає дощ».
- Стиль — як це зроблено. «Фотореалістично», «акварель у стилі дитячої книжки», «пласка ілюстрація», «вінтажний туристичний постер», «мінімалістичний лінійний малюнок».
- Настрій — що воно має передавати. «Тепло й ностальгійно», «грайливо й яскраво», «спокійно й тихо». Настрій непомітно керує світлом і кольорами.
- Формат — яка форма, для чого. «Квадрат, для вітальної картки», «широкий горизонтальний, для шпалер робочого столу», «вертикальний постер». Називання призначення допомагає моделі скомпонувати картинку під нього.
Вкладіть усі п'ять в одне просте речення — і отримаєте щось, що арт-директор упізнав би:
Створи зображення: 1цуценя золотистого ретривера в синьому святковому ковпачку 2сидить у купі осіннього листя в міському парку на світанку, 3акварельна ілюстрація у стилі дитячої книжки, 4тепло, спокійно й трохи ностальгійно, 5квадратний формат, для вітальної картки.
Дві заспокійливі ремарки, перш ніж ви почнете хвилюватися, чи робите все «правильно». По-перше, п'ять частин — це чек-лист, а не гамівна сорочка: просте речення, що торкається всіх п'яти, переб'є будь-яку кашу з ключових слів, і порядок не має значення. По-друге, вам не потрібен художній словник. «Схоже на дитячу книжку з картинками» — цілком хороший стиль. «Затишно, як недільний ранок» — цілком хороший настрій. Модель навчилася з людських описів; звичайна людська мова — саме те, що вона розуміє найкраще.
3Друга суперсила: допрацьовуйте в тому самому чаті
Перше зображення — це перша чернетка — те саме правило, яке ви засвоїли про текст у День 1. Але ось чого більшість новачків так і не відкриває: вам не потрібно починати спочатку. Оскільки ви працюєте в розмові, чат пам'ятає картинку, яку він зробив, і ви можете спрямовувати зміни простою мовою: Те саме зображення, але в сутінках. Залиш усе, зроби горнятко червоним. Прибери текст на стіні. Кожна відповідь — це інструкція з редагування художнику, який ніколи не втомлюється від правок — а не новий смик за важіль.
Це різниця між регенерацією і допрацюванням, і її варто сформулювати точно: кожна регенерація з тими самими словами — це підкидання монети; кожне змінене слово — це рішення. Якщо зображення неправильне, у брифі чогось бракувало або щось було нечітким — назвіть це. «Зроби тепліше за відчуттям» краще, ніж пробувати ще раз. «Вид із того боку вулиці» краще, ніж сподіватися. Ви — арт-директор; раунд перегляду — це там, де у картинку входить ваш смак.
Одна чесна ремарка щодо очікувань: руки, обличчя й дрібний текст постійно покращуються, але саме там моделі зображень досі найчастіше зриваються. Якщо деталь важлива — кількість пальців, написання на вивісці — придивіться до неї уважно, перш ніж використовувати зображення, і назвіть виправлення у наступному допрацюванні. Впевнений стажист із Дня 1 теж малює картинки.
4Три інструменти, три роботи: хто малює, хто пише букви, хто пише бриф
Це штатна модель із Дня 3 у реальній справі. Велика трійка чітко ділить сьогоднішню роботу:
- Gemini — інструмент об'єму. Найщедріша безкоштовна генерація зображень із великої трійки з великим відривом — денний безкоштовний ліміт, достатньо великий, щоб для практики вважати його практично безмежним (точний ліміт часто змінюється; перевірте поточні обмеження в застосунку). Це робить його вашою практичною студією — місцем, де вчишся брифувати на практиці, де змарноване зображення нічого вам не коштує.
- ChatGPT — інструмент точності. Його генератор зображень найсильніший у чистому, правильно написаному тексті всередині зображення — постери, запрошення, вивіски. Але безкоштовний ліміт зображень малий і часто змінюється (перевірте поточні обмеження в застосунку), тож витрачайте кожне з них свідомо: спершу бриф, потім генерація.
- Claude — автор брифів. Claude зовсім не генерує зображень. Але він найсильніший автор із трьох — що робить його чудовою фабрикою брифів на зображення: опишіть, що вам потрібно, отримайте п'ять арт-директорських брифів у п'яти стилях, занесіть найкращий до Gemini.
Зображення розходяться далі за текст, тож три рядки, перш ніж щось поширювати:
- Жодних зображень реальних людей — ні вашого начальника, ні знаменитості, ні вчительки вашої дитини. Це варіюється від нечемного до по-справжньому шкідливого.
- Жодних логотипів брендів. Вони теж під забороною.
- Розкривайте, що зображення згенероване ШІ, там, де це важливо — оголошення на маркетплейсі, спільнотна розсилка, будь-що, що люди можуть прийняти за фотографію. Скажіть, що зображення згенероване ШІ. Ви відповідаєте за те, що публікуєте, а не інструмент.
Згенерувати зображення — це описати сцену художнику-скетчеру по телефону. Скажіть «намалюй будинок» — і отримаєте якийсь будинок — його, не ваш. Скажіть «вузький цегляний таунхаус у сутінках, тепле світло у вікнах, легкий дощ, вид із того боку вулиці, книжковий стиль» — і отримаєте ваш. Той самий художник, той самий олівець, кардинально інший результат. Проблемою ніколи не був художник; проблемою був телефонний дзвінок. А коли скетч повертається майже правильним, ви не кладете слухавку і не передзвонюєте — ви лишаєтеся на лінії: «ідеально, але зроби дощ сильнішим».
Ви зробите своє перше арт-директорське зображення там, де помилки безкоштовні. Одна домовленість, раз і назавжди: квадратні дужки в будь-якому промпті означають «замініть власним» — [ваша реальна подія] вам заповнювати. Свій акаунт Gemini ви створили в День 1.
- Відкрийте gemini.google.com і увійдіть зі своїм акаунтом із Дня 1. Подивіться внизу сторінки на поле для повідомлень. порожнє поле для повідомлень унизу, ваші минулі чати на бічній панелі.
- Скопіюйте та вставте цей повний Бриф на зображення в поле для повідомлень і надішліть. Генерація зображення триває довше за текст — дайте їй кілька секунд.
Промпт для копіювання · GeminiСтвори зображення: затишний домашній офіс у скандинавському стилі, ранкове світло крізь велике вікно, горнятко, з якого парує, на столі, м'які пастельні кольори, фотореалістично, горизонтальний формат.зображення з'являється просто у чаті, як фото в месенджері. Зверніть увагу, як багато в ньому ви впізнаєте з брифу — світло, горнятко, кольори.
- Тепер допрацюйте — у тому самому чаті, не в новому. Саме розмова пам'ятає картинку.
Промпт для копіювання · Gemini (той самий чат)Та сама сцена, але ввечері, тепле світло лампи, і додай кота, що спить на кріслі.та сама кімната, перемальована: світло лампи замість ранкового сонця, кіт на кріслі. Сцена вціліла; змінилося лише те, що ви назвали.
- Зробіть ще одне власне допрацювання — змініть рівно одну річ («зроби стіни темно-зеленими», «вид від дверей»). Це і є звичка: змінюйте слова, а не кидайте кубики. та одна річ, яку ви назвали, змінюється, тоді як решта здебільшого тримається. Це режисура, а не азартна гра.
- Збережіть улюблене: наведіть курсор (або торкніться) зображення й скористайтеся іконкою завантаження. файл зображення потрапляє в папку завантажень, готовий до використання будь-де.
Спеціальність ChatGPT — розміщувати читабельні, правильно написані слова всередині зображення — саме те, що потрібно постерам, запрошенням і вивіскам. Безкоштовний ліміт зображень малий (перевірте поточні обмеження в застосунку), тож дисципліна така: напишіть бриф до того, як відкриєте інструмент. Ці обмеження часто змінюються — хоч би які цифри були на вашому екрані, робочий процес однаковий.
- Визначте точний текст, який має нести ваше зображення, слово в слово, перш ніж витрачати генерацію. Запишіть його. (Це Думаємо → Створюємо в мініатюрі.) однорядкову нотатку з вашим реальним текстом, напр. «РОЗПРОДАЖ · СУБОТА 10:00».
- Відкрийте chatgpt.com, почніть новий чат і вставте бриф із вашим текстом у лапках:
Промпт для копіювання · ChatGPTСтвори простий постер: текст "[ваша реальна подія — напр. РОЗПРОДАЖ · СУБОТА 10:00]" жирним, дружнім шрифтом, яскравий ілюстрований стиль, сонячне передмістя на фоні, квадратний формат.постер із вашими словами, відтвореними справді розбірливим шрифтом — те, в чому інструменти зображень колись були сумнозвісно слабкі.
- Вичитайте зображення так, як вичитували б листа: прочитайте кожне слово на ньому, уголос, якщо можете. Шрифт зазвичай правильний — «зазвичай» не означає «завжди». Якщо щось не так, допрацюйте в тому самому чаті:
Промпт для копіювання · ChatGPT (той самий чат)Той самий постер, залиш усе — але виправ текст, щоб він читався точно так: [ваш текст, написаний так, як вам потрібно].виправлений постер. Перевірте ще раз — текст заслуговує на друге прочитання.
- Завантажте його так само, як раніше (наведіть курсор або торкніться, потім іконка завантаження). квадратний файл постера, який ви справді могли б надрукувати чи опублікувати сьогодні.
Claude не вміє малювати — але пише брифи краще, ніж ви могли б повірити, і ви тепер знаєте, що бриф і є роботою. Використовуйте його щоразу, коли знаєте, що вам потрібно, але не знаєте, як це описати. Свій акаунт Claude ви створили в День 1.
- Відкрийте claude.ai, почніть новий чат і замовте п'ять брифів одразу:
Промпт для копіювання · ClaudeНапиши 5 промптів для генерації зображень для [ваша реальна потреба — напр. вітальна картка для 60-річного шанувальника джазу]. По одному реченню на кожен, і кожен має охоплювати об'єкт, сцену, стиль, настрій і формат. Варіюй стиль: фотореалістичний, акварель, пласка ілюстрація, вінтажний постер, мінімалістичний.п'ять пронумерованих брифів на одне речення, кожен — повний Бриф на зображення в іншому стилі — стилістичне меню для тієї самої ідеї.
- Виберіть улюблений і поітеруйте над ним, як над будь-якою чернеткою (звичка з Дня 2): Зроби №2 теплішим і грайливішим, і заверши його так: квадратний формат, для друкованої картки. бриф, загострений під ваш смак — перш ніж будь-де було витрачено хоч одну генерацію зображення.
- Скопіюйте готовий бриф, вставте його в Gemini й згенеруйте. зображення, побудоване з професійно написаного брифу, який ви арт-режисували приблизно за хвилину — штатна модель із Дня 3, що працює як команда.
Промпт із п'яти слів, а потім регенерація, регенерація, регенерація — у надії, що машина зрештою прочитає ваші думки. На безкоштовних тарифах це спалює весь денний бюджет зображень за десять хвилин, а ще гірше — це нічого вас не вчить: кожна регенерація з тими самими словами — це підкидання монети; кожне змінене слово — це рішення. Картинка була неправильною не тому, що інструмент слабкий — вона була неправильною, бо в брифі бракувало рішення, а перекидання його не постачає. Арт-директори не перекидають; вони переписують бриф.
Це ваша перевага від сьогодні: поки всі інші смикають важіль, ви пишете один бриф із п'яти частин і робите два названі допрацювання — і на тому самому безкоштовному бюджеті саме ви відвантажуєте щось придатне.
Створіть одне зображення, яке ви справді використаєте цього тижня — вітальну картку, флаєр події, шпалери робочого столу з улюбленим місцем, візуал для допису.
- Напишіть повний Бриф на зображення з п'яти частин: Об'єкт + Сцена + Стиль + Настрій + Формат. (Застрягли на формулюванні? Хай Claude накидає чернетку — покрокова інструкція 3.)
- Згенеруйте його в Gemini — або в ChatGPT, якщо вашому зображенню потрібні слова на ньому.
- Зробіть рівно два розмовні допрацювання в тому самому чаті. Змінюйте слова, а не кидайте кубики.
- Завантажте переможця й помістіть туди, де його використають — картку надрукувати, флаєр поширити, шпалери встановити.
- Збережіть бриф-переможець, дослівно, у своєму Блокноті промптів (День 5), із підписом, що він створив. Брифи можна перевикористовувати; везіння ігрового автомата — ні.
Підсумок дня — 30 секунд
- Зображення брифують, а не викликають: модель малює ваш опис — кожна деталь, яку ви випускаєте, це рішення, делеговане машині.
- Бриф на зображення: Об'єкт + Сцена + Стиль + Настрій + Формат, в одному простому реченні. Звичайна мова переб'є художній жаргон.
- Допрацьовуйте в розмові в тому самому чаті — «те саме зображення, але…». Змінюйте слова, а не кидайте кубики: кожна регенерація — підкидання монети, кожне змінене слово — рішення.
- Маршрутизація: Gemini = безкоштовний об'єм (великий денний ліміт — перевірте поточні обмеження в застосунку), ChatGPT = точність і текст на зображенні (малий безкоштовний ліміт, що часто змінюється — витрачайте свідомо), Claude = пише брифи, не генерує зображень.
- Права і смак: жодних реальних людей, жодних логотипів брендів; перевіряйте руки, обличчя й текст перед використанням; розкривайте ШІ-зображення там, де це важливо.
- Бриф-переможець іде у ваш Блокнот промптів — сьогоднішнє зображення приємне, та активом є перевикористовуваний бриф.