Verder met mijn oma's
Om de draad op te pakken van mijn vorige blog: ik ben verder gegaan met portretten van inspirerende oudere gezichten. Deze dames hier zijn gegenereerd in Stable Diffusion versie 1.5 met de tekst:
'Grandma Anne, head and shoulders portrait, in brilliant watercolors, by Mark Brooks and Dan Mumford, by Hergé, by Arthur Rackham, Studio Ghibli, Anime Key Visual, perfect, smooth Epic cinematic brilliant stunning intricate meticulously detailed dramatic atmospheric maximalist, Deep Color, Intricate, Natural Lighting, Beautiful Composition'
Het zijn geen perfecte portretten. De meeste hebben ongewenste witranden en de AI laat vaak net de bovenkant van het hoofd weg, maar afgezien daarvan zijn het prachtige belijnde gezichten van vier echt verschillende oma's. Nog wat kleine foutjes: een door AI gegenereerde (nep)handtekening bij oma rechtsboven, een uitsteeksel aan de kraag bij oma linksboven, en een arm die in het niets verdwijnt bij oma rechtsonder.
Analyse
Het is grappig hoe groot de invloed van slechts 1 woord in de prompt kan zijn. Hiervoor had ik namelijk bijna dezelfde prompt geprobeerd, maar dan met 'old Anne' in plaats van 'grandma Anne'. Blijkbaar dacht de AI bij 'old Anne' eerder aan 'de Anne van vroeger, toen ze nog jong was', dan aan een Anne die oud is.
Dit is een voorbeeld van hoe je moet zoeken naar de juiste woorden om goed begrepen te worden. We kunnen de prompt nog verder analyseren op zijn onderdelen. Meestal begin je met wat je wilt zien, en hoe je het wil zien. Vervolgens waarmee er ge'schilderd' moet worden. Daarna benoem je de stijl die je wilt gebruiken.
wat = 'grandma Anne'
hoe = 'head and shoulders portrait'
waarmee = 'in brilliant watercolors'
Dit laatste betekent dat je een aquarel wilt. Ik kwam er pas later achter dat ik hier flink op woorden had kunnen besparen door alleen 'aquarel' te schrijven, maar net als iedereen begon ik met het kopiëren van voorbeelden.
stijl = de rest van de tekst, waarbij je bij deze generator niet boven de zestig woorden mag uitkomen; hierbij tellen de komma's tussen de woorden mee (totaal 44 + 13 = 57).
Stijl
De stijl zelf kan ook verder uit elkaar worden gerafeld. Als eerste een tweetal van mijn favoriete illustratoren in wiens stijl ik mijn creaties graag wil zien: 'by Hergé, by Arthur Rackham'. Daarna zijn hierboven een aantal stijlen aan elkaar geplakt van de 25 presets die NightCafe Studio biedt voor alle AI onder zijn dak. Hier heb ik vanwege de beperking op het aantal woorden uitgepikt wat mij het mooiste lijkt.
Anime stijl: Studio Ghibli, Anime Key Visual, by Makoto Shinkai, Deep Color, Intricate, 8k resolution concept art, Natural Lighting, Beautiful Composition
Stripboek stijl: Mark Brooks and Dan Mumford, comic book art, perfect, smooth
Epische stijl: Epic cinematic brilliant stunning intricate meticulously detailed dramatic atmospheric maximalist digital matte painting
Wat het effect is van elk woord, laat zich soms raden, maar vaak is het zinvol een tijdje met de prompts te spelen om precies de stijl en sfeer te krijgen waar je naar zoekt. Nog lastiger is het, dat het 'wat' en het 'hoe' ook de uitvoering van de stijl beïnvloedt. Als de artiesten in wiens stijl je wil werken nooit een vergelijkbare creatie hebben gemaakt, hebben de AI de neiging terug te vallen om meer fotografische voorbeelden. Dat zie je bij de volgende creaties van oma's die buiten het gangbare materiaal van deze stijl vallen. Was 'old Anne' al meer in een 'comic stijl' getekend dan 'grandma Anne', zo lijkt dit effect nog sterker te worden als we oma's uit verre streken proberen te creëren.
Ondertussen zijn er op het platform van Nightcafe Studio extra mogelijkheden gekomen. Ten eerste kunnen er nu per creatie een aantal prompts van maximaal 60 woorden worden opgegeven, en elke prompt kan hierbij zijn eigen gewicht krijgen. Daarnaast is het nu ook mogelijk om negatieve gewichten op te geven. Hierdoor is het mogelijk om in plaats van 'zonder jurk' te vragen om 'jurk' met gewicht -1. Of 'zonder randen, zonder handtekening, niet buiten het frame' en alles wat er mis kan gaan bij het genereren van deze creaties.
Bewerken
Om de schoonheidsfoutjes eruit te krijgen zijn er een aantal mogelijkheden:
De eerste, meest simpele optie is om de creatie opnieuw te proberen. Hierbij kan het oorspronkelijke plaatje als invoer gegeven worden, of kan alleen de waarde van het 'seed' (een random getal dat deel is van de invoer) iets veranderd worden, en blijft de tekst onveranderd.
Een tweede optie is 'inpainting'. Het gemankeerde plaatje wordt als invoer gegeven, maar de foute delen worden gemarkeerd en de tekstprompt wordt zo aangepast dat er beschreven wordt wat er nu wel getekend moet worden op die plekken.
Een derde optie is 'outpainting' wat vooral van belang is als er iets belangrijks buiten het kader moet worden bijgetekend. Hiervoor moet je nu of naar een andere aanbieder van AI-art, of je download het plaatje naar je computer, zet het in een groter plaatje omgeven door ruis, gebruikt dit nieuwe plaatje vervolgens als startplaatje zoals bij 'inpainting'.
De vierde - en eigenlijk meest leuke - optie, is het plaatje zelf bewerken in een programma als Photoshop of Krita. Hierbij houdt je volledige controle over het resultaat en de aanpassingen, maar is het wel afhankelijk van je eigen vaardigheid als fotobewerker en schilder.
Bij een aantal afbeeldingen hierboven ga ik dat laatste doen. Ik heb er nu al zin in.
Reactie plaatsen
Reacties