Tips voor goede prompts

Gepubliceerd op 17 maart 2023 om 10:00

De beste prompts

Met al die keuzemogelijkheden van AI’s kan het kiezen van de juiste prompt best complex worden. Globaal leveren ze wel dezelfde resultaten op, maar het zijn de details die verschillen. Ook zelf had ik niet de tijd om ze allemaal uit te proberen. Ik zocht naar bronnen voor de beste prompts, en ook die bronnen hadden weer bronnen... dus in dit artikel een paar bronnen die tips geven voor het maken van de beste prompts.

Doordat de bronnen allemaal Engelstalig zijn, zou je de indruk krijgen dat dat de enig mogelijke taal is, maar dat blijkt onjuist. Zie hier het resultaat voor: "Uitgebreid ontbijt, Hagelslag op volkorenbrood, pindakaas, jam, glas melk, [stijlkenmerken in het Engels]" door Stable Diffusion v1.5. Helaas weet de AI niet wat hagelslag is, maar voor de rest komt het aardig in de buurt.

Ik heb nog niet geprobeerd om de stijlkenmerken in het Nederlands te schrijven. Doordat iedereen van elkaar leert op dit terrein, en de meesten in het Engels communiceren, houd ook ik het hier op Engelse termen.

Op naar de meest uitgebreide handleiding voor het schrijven van prompts.

Openart.ai promptbook

Openart.ai is een website die je per stijl laat snuffelen in een catalogus met afbeeldingen, maar het heeft maar een beperkt aantal stijlen in zijn bibliotheek. Wat wel heel sterk is, is het https://openart.ai/promptbook, waarin een uitgebreide presentatie wordt gegeven hoe een goede prompt te krijgen, met veel tips voor beginners. Voor wie niet alles wil lezen hier de krenten uit de pap, met wat toevoegingen van mezelf.

Kwaliteitsverbeteringen

De belangrijkste truc om een mooi plaatje te krijgen, is het toepassen van woorden die een kwaliteitsverbetering aanduiden. Denk aan:

HDR (high dynamic range=meer kleuren), UHD (ultra high definition), 64 K (resolutie 61440×34560: 64K Digital Cinema). Vooral bij landschappen geeft dit meer detail en meer diepte aan het plaatje. Het toevoegen van highly detailed doet ongeveer hetzelfde voor kleinschaligere afbeeldingen zoals een portret.

Als één object of persoon je onderwerp is, voeg toe: 40 mm lens, shallow depth of field, close up, studio lighting. Waar 'shallow depth of field' de achtergrond wazig maakt, zou het toevoegen van bokeh ervoor moeten zorgen dat die wazigheid artistieker wordt ingevuld.

Sowieso geldt bij fotografie, maak van photograph -> professional photograph, en noem een high-end model fototoestel zoals Nikon 15mm f/1.8G in je prompt. Of schrijf Canon lens, shot on dslr (digital single-lens reflex camera), 64 megapixels. Zo lijkt ieder genre zijn eigen standaarden voor kwaliteit en professionaliteit te hebben.

Bij onderwerpen gerelateerd aan games en het fantasy-genre is het zinvol de namen van platforms toe te voegen, zoals: trending on ArtStation, en bij 3D of 4D modellen: Unreal EngineMaya 3D, ZBrush of Blender (deze worden gebruikt om 3D assets voor film, televisie, games, en commercials te genereren). ZBrushCentral verwijst dan weer naar het platform waarop je je 3D creaties kunt tonen. Daarnaast kun je refereren aan hardware en software om creaties te renderen zoals Octane render (GPU render engine) of Vray. Specifiek voor een afbeelding in anime stijl kies je Anime Key Visual.

Van een heel andere aard is het toevoegen van high resolution scan. Hierdoor moet de foto historisch lijken, alsof het later is ingescand. Jazeker, in plaats van te gaan voor een zo'n scherp mogelijk plaatje kun je om inhoudelijke of artistieke redenen ook gaan voor een verouderde look. Maak bijvoorbeeld een oude foto door sepia yellow monochromatic vintage 1900s photograph toe te voegen na je onderwerp.

Trucs voor gevorderden: wil je een zwart-wit foto met 1 gekleurd object, gebruik: color splash. Kies Double exposure als je in de contour van je ene onderwerp een ander wil afbeelden. Stable Diffusion versie 1 reageert daarnaast ook op emoji’s ❄️🌨️ en leestekens als ((( en !!!, versie 2 wat minder.

Prompt: "sumi-e panda eating bamboo" levert geen mooi plaatje op en al helemaal niet in sumi-e stijl (Japanse inkttekening). Dit is Stable Diffusion v1.5.

prompt:  "sumi-e panda eating bamboo" - Weight:1 

"detailed matte painting, deep color, fantastical, intricate detail, splash screen, complementary colors, fantasy concept art, 8k resolution trending on Artstation Unreal Engine 5" - Weight:0.9

Dit is de standaard NightCafe stijl, die veel kwaliteitswoorden bevat, uitgevoerd op Stable Diffusion 1.5. Dit geeft al een mooier plaatje, maar nog niet in sumi-e stijl.

Structuur

Globaal is de structuur van je tekst-prompt als volgt:

[onderwerp]  [in omgeving]  [medium]  [kunststroming]  [in stijl van]  [POV]  [licht]  [kleur]  [kwaliteitswoorden]

Niet alles hoeft ingevuld te worden. [medium] kan ook helemaal vooraan worden geplaatst als de uitvoering hiervan het belangrijkst is. Ook voor de andere aspecten geldt dat ze verder naar voren moeten worden geplaatst als de impact te laag is naar je zin.

Voorbeelden:

  • onderwerp = mens, dier, landschap, etc. die iets doet, of iets aan heeft, of iets is (blij, verdrietig, romantisch), bijvoorbeeld 'blije panda eet bamboe'
  • in omgeving = in zijn kamer, op de berg, in het bos, indoor, outdoor, underwater, space
  • medium = foto, schilderij, krijttekening, aquarel, klei, gehaakt, origami, of andere keuze, maar wees specifiek
  • kunststroming = impressionism, film noir, baroque, post-apocalyptic, minimalismmodern art, ink painting, movie poster, naïve art, pointillism, pop art, splash art, storybook illustration, street art, surrealism, Ukiyo-e ... en dit is maar een kleine greep uit de mogelijkheden 
  • in stijl van : by Vermeer, Van Gogh, Arthur Rackham, Hayao Miyazaki , Alphonse Mucha, Albrecht Dürer. ... deze lijst is in principe oneindig maar niet iedere artiest is even goed bekend; ook goed werken studio namen: Studio Ghibli, Pixar, Disney.
  • POV (point of view): front, overhead, side, close-up, satellite, macro, telephoto, fish-eye lens, polaroid, long exposure, Gopro, drone photo, selfie
  • licht: soft, ambient, ring light, neon, at night, sun, cinematic, sun rays, sundown, sunrise
  • kleur: vibrant, dark, pastel, muted, monochrome, tetradic, triadic, warm colors, cool colors, en de kleuren zelf natuurlijk
  • kwaliteitswoorden: zoals genoemd in de paragraaf hiervoor.

prompt gesuggereerd door een prompt generator:

"sumi-e panda eating bamboo, Portrait, Artstation, Painting, Beautiful, Illustration" - Weight:1

"ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, blurry, bad anatomy, blurred, watermark, grainy, signature, cut off, draft" - Weight:-3

op Stable Diffusion v1.5

Dezelfde prompt maar uitgevoerd op Stable Diffusion v2.1 geeft al veel meer de indruk van de sumi-e stijl.

Experimenteer

Ruis

Alles beïnvloedt alles. Kies je artiesten met een gedetailleerde stijl, dan is het niet meer zo nodig om te vragen om hyperdetailed, of intricately detailed. Matcht je onderwerp niet met de artiesten, dan valt een AI als Stable Diffusion terug op een fotorealistische stijl. Het is zinvol hier uitgebreid mee te experimenteren. De stijlwoorden die bij het ene onderwerp in de prompt goed werken, kunnen bij een ander onderwerp dus heel anders uitpakken.

Let op dat bij het veranderen van de verhoudingen van je afbeelding (vierkant naar landscape bv) alles kan veranderen, zelfs bij gelijke prompt en seed. De AI zijn getraind op een standaardgrootte van 512x512 pixels, vierkant dus. Wel krijg je bij landscape- of portrait-formaten gelijkwaardige kleuren en compositie.

Houdt altijd in het achterhoofd dat de AI getraind is met 2000 jaar aan kunst. Het kan erg omslachtig zijn om een modern onderwerp correct te laten weergeven in een heel oud medium. Sketch geeft bijvoorbeeld een tekening in grijstinten, en zal je onderwerp modern weergeven - denk bij 'auto' aan 'Tesla'; painting geeft een kleurig beeld, maar een ouderwetsere weergave van je onderwerp - 'auto' wordt sneller een jaren '60 model.

Naast de tekst-prompt zijn er afhankelijk van de AI aanvullende instellingen. Bij Stable Diffusion op NightCafe kun je de seed instellen, die de ruis aan het begin bepaalt. Bij dezelfde seed en prompt zul je steeds dezelfde compositie krijgen. De verhouding tussen ruis en prompt is instelbaar met Overall Prompt Weight, per default 50%. Je geeft de AI meer vrijheid door het prompt-percentage lager te zetten, maar het resultaat kan wat ongestructureerd worden. Verhogen kan ook, maar teveel gaat er amateuristisch uit zien. Het inschakelen van CLIP Guidance kan helpen om beeldresultaten te verbeteren voor complexe prompts of grotere resoluties. Het kan er ook voor zorgen dat afbeeldingen er realistischer uitzien. Als CLIP Guidance is ingeschakeld, gebruikt de AI als bemonsterings-methode K_DPM_2_ANCESTRAL. Daarnaast zijn er nog tien methoden (oei, dit klinkt als een onderwerp voor een heel nieuw blog).

AIwiki.ai

Op Aiwiki.ai wordt de wereld van de huidige AI uitgediept en uitgelegd. Relevant hier is https://aiwiki.ai/wiki/Prompt, waar wordt uitgelegd hoe prompts werken, vergelijkbaar met de uitleg hierboven. De website geeft daarnaast een lijst aan prompt-generators voor als je een beetje hulp of inspiratie nodig hebt.

  • Midjourney Prompt Generator: onofficiële Midjourney prompt builder, op het HuggingFace platform. Het vult je onderwerp aan met extra details en stuurcommando's zoals --ar 3:2 (aspect ratio).
  • Phraser: assisteert in het maken van sterke prompts voor Midjourney and DALL-E. Ook als je niet inlogt (en niet betaalt), kun je kijken naar voorbeeld plaatjes en de gebruikte teksten, om zo inspiratie op te doen.
  • MidJourney Prompt Helper: text-to-image prompt builder ontwikkeld for Midjourney and DALL-E. Het helpt je stap voor stap door het opbouwen van de prompt heen door je op plaatjes te laten klikken van de gewenste stijlen. Als je de stuurcommando's voor Midjourney eruit haalt, wordt het ook bruikbaar voor Stable Diffusion.
  • Drawing Prompt Generator: helpt tekenaars aan ideeën, ook als ze niet met AI werken. Dit is alleen gericht op het onderwerp van je prompt.
  • Promptomania Builder: prompt builder voor verschillende AI art generators. Het werkt voor de meeste CLIP and VQCAN-based modellen. Ook hier klik je op plaatjes om je stijl te specificeren.
  • MidJourney Random Commands Generator: onofficiële Midjourney prompt generator voor complexe outputs. Deze helpt vooral bij het schrijven van de stuurcommando's die je Midjourney kunt meegeven.
  • Lexica.art: Lexica biedt haar eigen Stable Diffusion AI aan, maar daarnaast kun je ook zoeken in de reeds gemaakte afbeeldingen. Per plaatje zie je de prompt, zodat je hier veel kan opsteken.

prompt gekozen op basis van stijl-plaatjes:

"panda eating bamboo, sumi-e by Katsushika Hokusai, by Zeng Fanzhi, Ink, Filmic, Portrait, Tonal Colors, Dark, 2.5D" - Weight:3

"ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, blurry, bad anatomy, blurred, watermark, grainy, signature, cut off, draft" - Weight:-0.3

uitgevoerd op Stable Diffusion 1.5 Meer Ukiyo-e stijl dan sumi-e, maar dat is al Japans.

Andere prompt generators

Via verschillende kleinere bronnen kwam ik nog andere prompt generators tegen. Hier de interessantste.

  • CLIP Interrogator en CLIP interrogator2 staan beide op het HuggingFace platform. Hier upload je een plaatje en de tool probeert erachter te komen wat een goede prompt zou zijn om nieuwe afbeeldingen te maken zoals deze.
  • OpenAI ChatGPT Deze AI Chatbot kan ook worden gebruikt om prompts te ontwerpen voor AI. Gebruik "geef de bijvoeglijke naamwoorden van iets ...", "beschrijf in detail iets ..." om enkele trefwoorden te krijgen. Specificeer vooral voor welke AI je dit wil gebruiken.
  • Random AI Prompt Generator geeft je random prompts, voornamelijk gericht op Midjourney. 
  • Clip front werkt door de tekst om te zetten in een CLIP-insluiting en vervolgens die insluiting te gebruiken om meer plaatjes en/of keywords te tonen.
  • ArtHub.ai heeft een prompt library waar je per stijl inspiratie kunt opdoen.
  • PromptBase Prompt Marketplace voor DALL·E, GPT-3, Midjourney, Stable Diffusion. Hier kun je prompts kopen, maar erg zinvol is dit niet, omdat de uitvoering van je prompt verandert als het onderwerp teveel verandert.

Dezelfde prompt "panda eating bamboo, sumi-e by Katsushika Hokusai, by Zeng Fanzhi, Ink, Filmic, Portrait, Tonal Colors, Dark, 2.5D" - Weight:3

met een sterkere waarde voor het negatieve deel in Stable Diffusion 2.1, omdat ik weet dat versie 2.1 dit meer nodig heeft dan versie 1.5. Nog geen perfecte plaatjes, maar dichter bij sumi-e.

Andere platforms

Ook vermeldenswaardig is de subReddit over Stable Diffusion. Ook hier vindt je verwijzingen naar promptgenerators en uitleg over hoe je zelf prompts kan schrijven. Het fijne van een subReddit is de actieve community erachter, waardoor de kans dat de inhoud up-to-date wordt gehouden, groter is.

Zelf houdt ik het op het platform van NightCafe, waar ik veel leer van mijn medegebruikers. Vind ik daar een term die ik niet ken, dan Google ik het om te kunnen inschatten of ik het zelf ook zou willen gebruiken. Een plaatje zegt meer dan duizend woorden.

In deze blog heb ik aan de hand van een panda de invloed laten zien van de verschillende woorden in de prompt. Hopelijk inspireert het je tot het maken van veel nieuwe plaatjes op het platform van je keuze.

"panda eating bamboo, sumi-e by Katsushika Hokusai, by Zeng Fanzhi, Ink, Filmic, Portrait, Tonal Colors, Dark, 2.5D" op Dall-e2

Reactie plaatsen

Reacties

Er zijn geen reacties geplaatst.