top of page
  • AutorenbildAlexa

Text-zu-Bild Generatoren im Vergleich

Hallo und herzlich willkommen auf meinem Blog!


In diesem Beitrag möchte ich dir anhand von vier der bekanntesten Text-zu-Bild Generatoren zeigen, wie diese einen identischen Befehl umsetzen.


Ich habe bei jedem Programm exakt die gleiche Eingabe verwendet, um einen fairen Vergleich zu erhalten. Optionale Zusatzparameter der unterschiedlichen Tools wurden ebenfalls nicht verwendet.


Schauen wir uns die Vergleiche einmal an. Der verwendete Prompt steht jeweils über den Bildern.

a shot of a young woman Portrait --v 5.2

(von links nach rechts: Midjourney - Stable Diffusion - Leonardo - Dall-E)


Midjourney schneidet ihr meiner Meinung nach am besten ab, aber auch Stable Diffusion, punktet hier auf ganzer Linie.

Das Bild von Leonardo finde ich vom Stil recht gut umgesetzt. Auch hier gefällt mir der Blur im Hintergrund. Jedoch wirkt das Gesicht im Ganzen etwas künstlich.

Das Portrait von Dall-E finde ich alleine im Ausdruck etwas befremdlich und die Zähne sind komplett unscharf.


 

a painting of a pond with a white swan --v 5.2

(von links nach rechts: Midjourney - Stable Diffusion - Leonardo - Dall-E)


Bis auf Leonardo, wurde hier das gewünschte Gemälde auf allen Bildern umgesetzt. Nichtsdestotrotz gefällt mir das fotorealistische Bild von Leonardo sehr gut, nicht zuletzt wegen der eingefangenen Stimmung. Dall-E zeigt hier seine Stärke bezüglich unterschiedliche Stile von Kunstwerken und hat ein impressionistisches Bild erstellt.



 

a photography of a sloth, hyper realistic --v 5.2

(von links nach rechts: Midjourney - Stable Diffusion - Leonardo - Dall-E)


Beim Faultier haben alle Programme bis auf Dall-E recht gut abgeschnitten. Denn hier leidet die Bildqualität extrem, und obendrein hat das Faultier von Dall-E keine Augen.


 

A glass carafe with table water and lemons on a table in a country style garden. Close up --v 5.2

(von links nach rechts: Midjourney - Stable Diffusion - Leonardo - Dall-E)


Bei diesem Bild wollte ich sehen, wie gläserne Elemente und transparente Flüssigkeiten dargestellt werden. Überraschender Weise ist das auf allen Bildern recht gut umgesetzt worden. Auch wenn bei Dall-E wieder die Bildqualität zu wünschen übrig lässt und auch der Bildausschnitt schlecht gewählt ist, so wurde der Befehl trotz allem verstanden und zufriedenstellend generiert.


 

A shot of a diamond ring on a woman's hand, advertisement picture --v 5.2

(von links nach rechts: Midjourney - Stable Diffusion - Leonardo - Dall-E)


Bislang wurde Midjourney ja immer nachgesagt, dass das Programm starke Defizite beim Abbilden von Extremitäten hat und es gerade Hände nicht realistisch darstellt. Seit der Version 5.2 kann davon eigentlich keine große Rede mehr sein. In 90 % der Fälle werden nun auch Hände mit der richtigen Anzahl an Fingern abgebildet. Die detailgetreue Umsetzung ist hier im Vergleich zu allen anderen Programmen phänomenal!


Doch auch Stable Diffusion und Leonardo machen hier keinen schlechten Job, sind aber bezüglich der Anatomie noch im Hintertreffen. Das Bild von Dall-E wirkt allerdings extrem künstlich und schneidet mit Abstand am schlechtesten ab.


 

a cute monster --v 5.2

(von links nach rechts: Midjourney - Stable Diffusion - Leonardo - Dall-E)


Dieser Befehl wurde von allen Programmen gut umgesetzt. Auch wenn die Stilrichtungen sich unterscheiden, fällst das hier eher unter künstlerische Freiheit, denn im Prompt wurde schließlich kein expliziter Stil gefordert.


 

a ship in a storm, cinematic --v 5.2

(von links nach rechts: Midjourney - Stable Diffusion - Leonardo - Dall-E)


Die Schiffe im Sturm sind ebenfalls alle recht zufriedenstellend. Midjourney ist hier am detailgetreusten. Stable Diffusion erinnert sehr an ein Skizzenartiges Gemälde und auch Dall-E befindet sich eher künstlerischen Bereich.


 

a photo of a horse in a field --v 5.2

(von links nach rechts: Midjourney - Stable Diffusion - Leonardo - Dall-E)


Das Pferd im Feld wurde von Midjourney und Stable Diffusion perfekt umgesetzt. Leonardo hat, wie schon bei den Frauen Portraits, einen etwas malerischen Stil verwendet. Da im Prompt jedoch explizit nach einem Foto verlangt wurde, hat selbst Dall-E es diesmal nicht als Gemälde dargestellt. Allerdings wirkt das Pferd nicht sehr realistisch. Es erinnert mich etwas an die Ur-Pferdchen vor mehreren Millionen Jahren.😁


 

Hier habe ich dir die einzelnen Programme hinsichtlich Anwendung, Geschwindigkeit bei der Erstellung, Bildergebnisse sowie der Preise gegenübergestellt:


Wenn du diese Tools nun einmal ausprobieren möchtest findest du im Folgenden sämtliche Links zu den Programmen.


Falls du bisher noch nicht mit Midjourney gearbeitet hast, könnte die Anmeldung etwas umständlich erscheinen. Schau dir hierfür am Besten meine YouTube Videos für Midjourney-Einsteiger an! Teil 1 siehst du HIER.


Links:


Schau dir gerne auch mein Video zu diesem Beitrag an. Mit Klick auf den Button kann es auch schon losgehen!


Ich hoffe, dieser Beitrag hat dir gefallen! Wenn du an weiteren Informationen rund um die künstliche Intelligenz interessiert bist, dann abonniere doch meinen YouTube Kanal, um keine Tipps, Tricks und Neuigkeiten zu verpassen!


Nun wünsche ich dir viel Spaß beim Erkunden verschiedener Text-zu-Bild Generatoren!


Bis zum nächsten Mal,


viele Grüße


Deine Alexa



Kommentare


bottom of page