Soms wil je veel detail...
Het grote voordeel van het gebruiken van AI bij het maken van afbeeldingen, is ten eerste de grote hoeveelheid details, die ten tweede in hoge snelheid getekend worden. Natuurlijk zijn er onderling verschillen tussen de AI. Zo was de eerste Dall-e eenvoudiger dan Dall-e2, en kon het minder detail genereren. Midjourney en het Stable Diffusion algoritme legden de lat nog hoger dan die twee, zowel qua detail als qua kwaliteit van de afbeelding. Dat betekent ook dat je voor een oudere AI kunt gaan als je bewust voor een eenvoudige afbeelding kiest.
Hier volgt een voorbeeld van een lijntekening met Stable Diffusion v2.1. Je ziet dat de AI toch erg graag detail toevoegt.
De volledige specificatie is:
- "Continuous line art, man walking in Japanese garden, single line art, black and white, single line, minimalism, abstract art - Weight:3
- "photographic, rendered, 3D, texture" - Weight:-3
- "ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, blurry, bad anatomy, blurred, watermark, grainy, signature, cut off, draft" - Weight:-0.3
Seed: 2273717043
Overall Prompt Weight: 50%
Model Version: Stable Diffusion v2.1
Sampling method: K_LMS
CLIP Guidance: NONE
... en soms niet
Bij Stable Diffusion heb je dus behoorlijk wat tekst nodig om te zeggen dat je vooral niet veel wilt hebben.
Als je het eenvoudig wil (en dan bedoel ik echt eenvoudig) ben je veel sneller klaar met Dall-e2 dan met Stable. Beide zijn beschikbaar op NightCafe Creator, wat het makkelijk maakt om uit te proberen. Ook hier een voorbeeld van een eenvoudige creatie.
Text Prompts: "Continuous line art Japanese garden, single line art" - Weight:1
Zelfs het aantal specificaties is met Dall-e2 veel minder.
Het jammere is alleen dat ik het resultaat net iets te mager vind. In dit geval mis ik toch de details die het herkenbaar maken als een Japanse tuin. De boom is goed, maar heuvel, stenen en hekje overtuigen me niet.
Ik heb dus een probleem, maar daar zijn oplossingen voor. We kunnen gebruik maken van een eigenschap van de Stable Diffusion AI, die het toestaat een willekeurig plaatje als start te gebruiken. Daar wordt (de default) 50% ruis aan toegevoegd om te zorgen dat het resultaat geen kopie wordt.
Optie 1: van Dall-e2 naar Stable
We geven Dall-e2 de tekst prompt:
"Continuous line art Statue of Liberty plus New York skyline, single line art, contour lines"
Het eerste plaatje is het resultaat. Dit geven we als invoer aan Stable versie 2.1 met de tekst prompt: "Continuous line art Statue of Liberty plus New York skyline, single line art, contour lines"
Dit geeft nog niet helemaal het gewenste resultaat, maar de verschillen zijn wel duidelijk.
Nogmaals, maar nu met "New York Manhattan Skyline" in de prompt. Eerst Dall-e2, daarna Stable v2.1.
Mijn voorkeur ligt het meest bij de tweede versie, al is de eerste ook interessant om naar te kijken. Het is een verschil in stijl. Dall-e2 blijft dichter bij zijn opdracht en is in die zin beter. Stable geeft meer detail en een suggestie van diepte. Smaken kunnen natuurlijk verschillen.
Optie 2: doorontwikkelen
We blijven nog even bij het Statue of Liberty. Als je eenmaal een seed-waarde en een tekst-prompt hebt gevonden die redelijke resultaten opleveren - hier dus: niet teveel detail - kun je op deze resultaten doorontwikkelen. Daarom hier nogmaals - maar met alleen Stable Diffusion v2.1 - een opeenvolging van plaatjes.
"Continuous line art, Statue of Liberty New York and Skyline of New York, contour drawing, single line art, single line, minimalism"
Weight:3
"Ukiyo-e, hieroglyphs, ink drawing, kintsugi, comic art, manga, storybook illustration, woodcut, architecture"
Weight:0.5
"photographic, rendered, 3D, texture"
Weight:-3
Hierbij is vanaf plaatje twee ieder volgend plaatje gegenereerd met zijn voorganger als start-plaatje. Bekijk het resultaat.
Halverwege is er gewisseld van seed-waarde om meer verandering te krijgen. Dat is een random verandering, dus succes is niet verzekerd, maar door het eerdere plaatje als start te gebruiken, blijft de tekening toch eenvoudig.
Ik zelf werd het meest blij van het vijfde plaatje, maar ook hier kunnen smaken verschillen.
De toevoeging van het rode vlammetje past niet helemaal in de opdracht, maar wel goed bij de werkelijkheid waar de fakkel van blinkend materiaal is gemaakt.
Wat ook opvalt is dat de AI toch stiekem detail toevoegt dat niet meteen opvalt: het papier is meegetekend. De achtergrond is niet strak wit, zoals het met Dall-e2 wel zou worden. Het wordt zelfs hoe langer hoe groener, alsof het geïnspireerd werd door het Statue of Liberty zelf.
Niet erg. Dit is eenvoudig te verwijderen in een beeldbewerking programma zoals Krita of Photoshop.
Vragen om lijntekeningen had voor mij twee doelen. De eerste was 'gewoon' onderzoeken in hoeverre de AI hiertoe in staat waren. De tweede was om met deze lijntekeningen verder te gaan in Krita om zelf kleur toe te voegen.
Ik zie heel veel mogelijkheden 😁.
Reactie plaatsen
Reacties