Slike: brifiraj AI kot umetniški vodja
Včeraj si se naučil premisliti, preden ustvariš. Danes to pravilo sreča slike: sliko boš opisal tako, kot umetniški vodja brifira ilustratorja – pet odločitev, en stavek – in odšel s čestitko, letakom ali ozadjem, ki bi ga res uporabil. Vse na brezplačnih paketih, kot vedno.
Generiranje slik je brifiranje, ne čarovnija: opiši Subjekt, Prizorišče, Slog, Razpoloženje in Format tako, kot bi to storil umetniški vodja – nato rezultat izpili pogovorno. Gemini ti dnevno da največ brezplačnih slik, ChatGPT je tisti, ki ga uporabiš, ko mora slika vsebovati natančne besede, Claude – ki ne generira nobenih slik – pa je tisti, ki napiše tvoje brife.
1Od kod pride slika – in zakaj o vsem odločajo tvoje besede
Tukaj je v enem poštenem odstavku, kaj se dejansko zgodi, ko vtipkaš stavek in se pojavi slika. Ti sistemi so se učili iz milijonov parov slik in njihovih besednih opisov. Skozi dovolj primerov so se naučili, kako so besede videti: kaj »zlati prinašalec« naredi z oblikami in dlako, kaj »akvarel« naredi z robovi, kaj »v mraku« naredi s svetlobo. Ko vtipkaš opis, model izriše povsem novo sliko, ki ustreza tvojim besedam – ne išče fotografije po spletu in ne izrezuje ter lepi iz obstoječih slik. Riše to, kar si opisal, iz vsega, kar se je naučil o tem, kako se opisi preslikajo v slike.
Ta mehanizem ima eno posledico, ki pojasni vsako razočaranje ob AI-slikah, kar si jih kdaj videl: model izriše tvoj opis – in odloči o vsem, česar nisi opisal. Dvoumnost ni napaka; je prenos pristojnosti. Vtipkaj »pes v parku« in pasmo, letni čas, čas dneva, kot kamere, umetniški slog in razpoloženje si prenesel na stroj, ki bo za vsako izbral statistično najbolj povprečno možnost. Rezultat je tehnično pravilen in popolnoma generičen – fotografija s fotobanke ničigarjevega psa v ničigarjevem parku.
Če se ti to zdi znano, naj se ti. To je Formula brifa z 2. dne, znova: česar ne navedeš, asistent ugiba, ugibanja pa so generična. In to je Premisli → Ustvari s 6. dne v novi preobleki: generator slik je gradbenik, ne arhitekt. Razmislek – kaj točno naj ta slika prikazuje, v kakšnem slogu, za kakšno rabo – je tvoja naloga. Današnja petdelna struktura je način, kako ta razmislek opraviš za slike.
2Slikovni brif: pet odločitev, ki sliko naredijo tvojo
Umetniški vodja ilustratorju nikoli ne reče »nariši nekaj lepega«. Izroči mu brif. Tvoj ima pet delov – to je Slikovni brif in pokrije vsako odločitev, ki bi jo model sicer sprejel brez tebe:
- Subjekt – koga ali kaj slika prikazuje. Glavni samostalnik plus eden ali dva podatka: »mladiček zlatega prinašalca z modro zabavno kapico«, »kadeča se skodelica«, »plakat z besedilom ‚GARAŽNA RAZPRODAJA'«.
- Prizorišče – kje in kdaj. Kraj, čas dneva, vreme: »v kupu jesenskega listja v mestnem parku ob sončnem vzhodu«, »na leseni mizi ob z dežjem obliti okenski šipi«.
- Slog – kako je narejeno. »Fotorealistično«, »akvarel iz otroške slikanice«, »ploska ilustracija«, »vintage potovalni plakat«, »minimalistična risba v črtah«.
- Razpoloženje – kakšen občutek naj vzbuja. »Toplo in nostalgično«, »igrivo in svetlo«, »mirno in tiho«. Razpoloženje tiho usmerja svetlobo in barve.
- Format – kakšna oblika, za kakšno rabo. »Kvadratno, za rojstnodnevno čestitko«, »široko ležeče, za ozadje namizja«, »navpičen plakat«. Poimenovanje rabe modelu pomaga, da kompozicijo prilagodi zanjo.
Daj vseh pet v en preprost stavek in dobiš nekaj, kar bi umetniški vodja prepoznal:
Ustvari sliko: 1mladiček zlatega prinašalca z modro zabavno kapico 2sedi v kupu jesenskega listja v mestnem parku ob sončnem vzhodu, 3akvarel iz otroške slikanice, 4toplo, mirno in malce nostalgično, 5kvadratni format, za rojstnodnevno čestitko.
Dve pomiritvi, preden te zaskrbi, da boš to naredil »prav«. Prvič, pet delov je kontrolni seznam, ne prisilni jopič – preprost stavek, ki se dotakne vseh petih, premaga vsako kopico ključnih besed, vrstni red pa ni pomemben. Drugič, ne potrebuješ umetniškega besedišča. »Videti kot otroška slikanica« je povsem dober slog. »Prijetno, kot nedeljsko jutro« je povsem dobro razpoloženje. Model se je učil iz človeških opisov; običajen človeški jezik je natanko tisto, kar najbolje razume.
3Druga supermoč: izpili v isti niti
Prva slika je prvi osnutek – isto pravilo, ki si se ga naučil o besedilu na 1. dan. A tukaj je, kar večina začetnikov nikoli ne odkrije: ni ti treba začeti znova. Ker delaš v pogovoru, si nit zapomni sliko, ki jo je naredila, spremembe pa lahko usmerjaš v preprostem jeziku: Ista slika, a v mraku. Ohrani vse, naredi skodelico rdečo. Odstrani besedilo na steni. Vsak odgovor je navodilo za urejanje umetniku, ki ga popravki nikoli ne utrudijo – ne sveža poteza ročice.
To je razlika med regeneriranjem in izpiljevanjem in vredno jo je povedati natančno: vsako regeneriranje z istimi besedami je met kovanca; vsaka spremenjena beseda je odločitev. Če je slika napačna, je nekaj v brifu manjkalo ali bilo nejasno – poimenuj to. »Naj bo bolj toplo« premaga ponovno poskušanje. »Gledano čez ulico« premaga upanje. Ti si umetniški vodja; krog pregleda je tam, kjer v sliko vstopi tvoj okus.
Ena poštena opomba o pričakovanjih: roke, obrazi in drobne črke se nenehno izboljšujejo, a so še vedno tam, kjer slikovni modeli najpogosteje spodrsnejo. Če je detajl pomemben – število prstov, črkovanje na napisu – si ga pred uporabo slike natančno oglej in popravek poimenuj v naslednjem izpiljevanju. Samozavestni pripravnik s 1. dne riše tudi slike.
4Tri orodja, tri naloge: kdo slika, kdo črkuje, kdo napiše brif
To je kadrovski model s 3. dne pri pravem delu. Velika trojica današnjo nalogo razdeli čisto:
- Gemini – orodje za obseg. Najbolj radodarno brezplačno generiranje slik med veliko trojico, z veliko prednostjo – dnevna brezplačna kvota, dovolj velika, da jo za vajo obravnavaš kot praktično neomejeno (točna omejitev se pogosto spreminja; preveri trenutne omejitve v aplikaciji). To ga naredi za tvoj vadbeni studio – kraj, kjer se brifiranja učiš z delom, kjer te zavržena slika nič ne stane.
- ChatGPT – orodje za natančnost. Njegov generator slik je najmočnejši pri čistem, pravilno črkovanem besedilu znotraj slike – plakati, vabila, napisi. A brezplačna slikovna kvota je majhna in se pogosto spreminja (preveri trenutne omejitve v aplikaciji), zato vsako porabi premišljeno: najprej brifiraj, šele nato generiraj.
- Claude – pisec brifov. Claude ne generira nobenih slik. A je najmočnejši pisec med trojico – kar ga naredi za odlično tovarno slikovnih brifov: opiši, kaj potrebuješ, dobi pet umetniško vodenih brifov v petih slogih, najboljšega prenesi v Gemini.
Slike potujejo dlje kot besedilo, zato tri vrstice, preden karkoli deliš:
- Brez slik resničnih ljudi – ne tvojega šefa, ne slavne osebe, ne učiteljice tvojega otroka. To sega od nesramnega do resnično škodljivega.
- Brez logotipov blagovnih znamk. Tudi ti so prepovedani.
- Razkrij AI-generirane slike, kjer je to pomembno – objava na tržnici, glasilo skupnosti, karkoli, za kar bi ljudje lahko predpostavili, da je fotografija. Povej, da je slika AI-generirana. Za to, kar objaviš, si odgovoren ti, ne orodje.
Generiranje slike je opisovanje prizora risarju po telefonu. Reci »nariši hišo« in dobil boš neko hišo – njegovo, ne tvojo. Reci »ozka opečnata mestna hiša v mraku, topla svetloba v oknih, rahel dež, gledana čez ulico, slog slikanice« in dobiš svojo. Isti risar, isti svinčnik, povsem drugačen rezultat. Risar nikoli ni bil težava; telefonski klic je bil. In ko se risba vrne skoraj prava, ne odložiš slušalke in znova ne pokličeš – ostaneš na zvezi: »odlično, a naj dežuje močneje«.
Naredil boš svojo prvo umetniško vodeno sliko tam, kjer so napake brezplačne. Ena konvencija, enkrat: oglati oklepaji v katerem koli promptu pomenijo »zamenjaj s svojim« – [tvoj resnični dogodek] je tvoj, da ga izpolniš. Svoj Gemini račun si ustvaril na 1. dan.
- Odpri gemini.google.com in se prijavi s svojim računom z 1. dne. Na dnu strani poišči polje za sporočilo. prazno polje za sporočilo na dnu, tvoji pretekli klepeti v stranski vrstici.
- Kopiraj ta celoten Slikovni brif v polje za sporočilo in ga pošlji. Generiranje slike traja dlje kot besedilo – daj mu nekaj sekund.
Prompt za kopiranje · GeminiUstvari sliko: prijetna domača pisarna v skandinavskem slogu, jutranja svetloba skozi veliko okno, kadeča se skodelica na mizi, mehke pastelne barve, fotorealistično, ležeči format.slika se pojavi kar v klepetu, kot fotografija v sporočilnem programu. Opazi, koliko od nje prepoznaš iz brifa – svetlobo, skodelico, barve.
- Zdaj izpili – v isti niti, ne v novem klepetu. Pogovor je tisto, kar si zapomni sliko.
Prompt za kopiranje · Gemini (ista nit)Isti prizor, a zvečer, topla svetloba svetilke, in dodaj spečo mačko na stolu.ista soba, znova izrisana: svetloba svetilke namesto jutranjega sonca, mačka na stolu. Prizor je preživel; spremenilo se je le tisto, kar si poimenoval.
- Naredi še eno svoje izpiljevanje – spremeni natanko eno stvar (»naredi stene temno zelene«, »gledano z vrat«). To je navada: spreminjaj besede, ne kock. ena stvar, ki si jo poimenoval, se spremeni, medtem ko ostalo večinoma drži. To je usmerjanje, ne igranje na srečo.
- Shrani svojo najljubšo: pojdi z miško čez (ali tapni) sliko in uporabi ikono za prenos. slikovna datoteka pristane v tvoji mapi za prenose, pripravljena za uporabo kjer koli.
Posebnost ChatGPT je vstavljanje berljivih, pravilno črkovanih besed v sliko – kar je natanko tisto, kar potrebujejo plakati, vabila in napisi. Brezplačna slikovna kvota je majhna (preveri trenutne omejitve v aplikaciji), zato je disciplina ta: brif napiši, preden odpreš orodje. Te omejitve se pogosto spreminjajo – ne glede na to, kakšne so številke na tvojem zaslonu, delovni tok še vedno deluje enako.
- Odloči se za točno besedilo, ki ga mora tvoja slika nositi, besedo za besedo, preden porabiš generiranje. Zapiši ga. (To je Premisli → Ustvari v miniaturnem obsegu.) enovrstična opomba s tvojim resničnim besedilom, npr. »GARAŽNA RAZPRODAJA · SOBOTA OB 10.00«.
- Odpri chatgpt.com, začni nov klepet in prilepi brif s svojim besedilom v narekovajih:
Prompt za kopiranje · ChatGPTUstvari preprost plakat: besedilo "[tvoj resnični dogodek – npr. GARAŽNA RAZPRODAJA · SOBOTA OB 10.00]" v krepkih, prijaznih črkah, svetel ilustriran slog, sončno predmestno ozadje, kvadratni format.plakat s tvojimi besedami, izrisanimi v dejansko berljivih črkah – to, v čemer so bila slikovna orodja nekoč zloglasno slaba.
- Sliko korekturno preglej tako, kot bi korekturno pregledal e-pošto: preberi vsako besedo na njej, na glas, če lahko. Črke so običajno pravilne – »običajno« ni »vedno«. Če je kaj narobe, izpili v isti niti:
Prompt za kopiranje · ChatGPT (ista nit)Isti plakat, ohrani vse – a popravi besedilo, da se glasi natanko: [tvoje besedilo, črkovano tako, kot želiš].popravljen plakat. Preveri ga znova – besedilo si zasluži drugo branje.
- Prenesi ga na enak način kot prej (pojdi z miško čez ali tapni, nato ikona za prenos). datoteka kvadratnega plakata, ki bi ga lahko res natisnil ali objavil že danes.
Claude ne zna slikati – a brife piše bolje, kot bi verjel, in zdaj veš, da je brif tisto delo. Uporabi ga vedno, ko veš, kaj potrebuješ, a ne, kako bi to opisal. Svoj Claude račun si ustvaril na 1. dan.
- Odpri claude.ai, začni nov klepet in naroči pet brifov naenkrat:
Prompt za kopiranje · ClaudeNapiši 5 promptov za generiranje slik za [tvoja resnična potreba – npr. rojstnodnevna čestitka za 60-letnega ljubitelja jazza]. Vsak po en stavek in vsak naj pokrije subjekt, prizorišče, slog, razpoloženje in format. Variiraj slog: fotorealistično, akvarel, ploska ilustracija, vintage plakat, minimalistično.pet oštevilčenih enostavčnih brifov, vsak celoten Slikovni brif v drugem slogu – slogovni meni za isto idejo.
- Izberi najljubšega in iteriraj na njem kot na vsakem osnutku (navada z 2. dne): Naredi #2 bolj toplega in bolj igrivega ter ga zaključi z: kvadratni format, za tiskano čestitko. brif, izostren po tvojem okusu – še preden je bilo kjer koli porabljeno eno samo generiranje slike.
- Kopiraj končani brif, prilepi ga v Gemini in generiraj. slika, zgrajena iz profesionalno napisanega brifa, ki si ga umetniško vodil v približno minuti – kadrovski model s 3. dne, ki dela kot ekipa.
Prompt s petimi besedami, nato regeneriraj, regeneriraj, regeneriraj – z upanjem, da bo stroj sčasoma prebral tvoje misli. Na brezplačnih paketih to pokuri ves dnevni proračun slik v desetih minutah, kar je še huje, pa te nič ne nauči: vsako regeneriranje z istimi besedami je met kovanca; vsaka spremenjena beseda je odločitev. Slika ni bila napačna, ker je orodje šibko – bila je napačna, ker je v brifu manjkala odločitev, ponovno metanje pa je ne priskrbi. Umetniški vodje ne metajo znova; znova brifirajo.
To je tvoja prednost od danes: medtem ko vsi drugi vlečejo ročico, ti napišeš en petdelni brif in narediš dve poimenovani izpiljevanji – in na istem brezplačnem proračunu si ti tisti, ki dostavi nekaj uporabnega.
Ustvari eno sliko, ki jo boš ta teden res uporabil – rojstnodnevno čestitko, letak za dogodek, ozadje namizja s krajem, ki ga imaš rad, vizual za objavo.
- Napiši celoten petdelni Slikovni brif: Subjekt + Prizorišče + Slog + Razpoloženje + Format. (Zataknjen pri ubeseditvi? Naj ga osnuje Claude – vodič 3.)
- Generiraj ga v Geminiju – ali v ChatGPT, če tvoja slika potrebuje besede na sebi.
- Naredi natanko dve pogovorni izpiljevanji v isti niti. Spreminjaj besede, ne kock.
- Prenesi zmagovalca in ga postavi tja, kjer bo uporabljen – natisnjena čestitka, deljen letak, nastavljeno ozadje.
- Shrani zmagovalni brif, dobesedno, v svoj Zvezek promptov (5. dan), označen s tem, kar je ustvaril. Brifi so ponovno uporabni; sreča igralnega avtomata ni.
Današnji povzetek – 30 sekund
- Slike so brifirane, ne pričarane: model izriše tvoj opis – vsak detajl, ki ga izpustiš, je odločitev, ki si jo prenesel na stroj.
- Slikovni brif: Subjekt + Prizorišče + Slog + Razpoloženje + Format, v enem preprostem stavku. Običajen jezik premaga umetniški žargon.
- Izpili pogovorno v isti niti – »ista slika, a …«. Spreminjaj besede, ne kock: vsako regeneriranje je met kovanca, vsaka spremenjena beseda je odločitev.
- Usmerjanje: Gemini = brezplačen obseg (velika dnevna kvota – preveri trenutne omejitve v aplikaciji), ChatGPT = natančnost in besedilo v sliki (majhna brezplačna kvota, ki se pogosto spreminja – porabi premišljeno), Claude = piše brife, ne generira slik.
- Pravice in okus: brez resničnih ljudi, brez logotipov blagovnih znamk; pred uporabo preveri roke, obraze in črke; razkrij AI-slike, kjer je to pomembno.
- Zmagovalni brif gre v tvoj Zvezek promptov – današnja slika je lepa, ponovno uporabni brif je sredstvo.