Was ist Dall-E? – Funktion, Prompts und Beispielbilder

dall-e-beitragsbild

Stellt euch vor, ihr könntet jedes Bild, das euch in den Sinn kommt, in Sekundenschnelle erstellen, und zwar nur mit ein paar Worten. Genau das ermöglicht Dall-E (Webseite von Dall-E besuchen), eine generative Bild-KI von OpenAI. Diese von machine-learning-gestützte Technologie hat die Welt der digitalen Kunst und des Designs in den letzten Monaten ziemlich auf den Kopf gestellt und ich nehme an, das wird auch in den kommenden Jahren so weitergehen.

In einer Zeit, in der künstliche Intelligenz immer mehr Bereiche unseres Lebens berührt, stehen Dall-E  und andere Bild-KIs an der Spitze dieser Entwicklung und zeigen uns, wie weit schon jetzt die Grenzen der Kreativität verschoben werden können.

dall-e-3

Entwicklung und Funktion von Dall-E

Dall-E wurde von OpenAI, dem gleichen Team, das auch hinter dem bekannten Sprachmodell GPT-4 und dem Chatbot ChatGPT steht, entwickelt. Diese KI nutzt fortschrittliche Algorithmen, um aus Textbeschreibungen visuelle Kunstwerke zu generieren. Dabei ist das Besondere an Dall-E, dass es nicht einfach vorhandene Bilder zusammenfügt, sondern basierend auf der Texteingabe komplett neue Bilder erschafft. Dies reicht von einfachen Objekten bis hin zu komplexen Szenen und Charakteren.

Die Bandbreite und Vielseitigkeit von Dall-E machen es zu einem mächtigen Werkzeug für Designer, Künstler und jeden, der kreative Ideen visuell umsetzen möchte. Diese Fähigkeit, aus Worten Bilder zu schaffen, eröffnet nicht nur neue kreative Möglichkeiten, sondern stellt auch eine beeindruckende technologische Errungenschaft dar.

Hier sieht man einen Auszug von den Werken, die man auf der Webseite von Dall-E selbst findet.
Hier sieht man einen Auszug von den Werken, die man auf der Webseite von Dall-E selbst findet.

Versionen von Dall-E

Hier ist eine Liste der verschiedenen Versionen von Dall-E mit ihren Veröffentlichungsdaten:

  • Dall-E (Erste Version): Veröffentlicht am 5. Januar 2021. Diese initiale Version von Dall-E stellte einen bedeutenden Fortschritt in der KI-gestützten Bildgenerierung dar​.
  • Dall-E 2: Angekündigt am 6. April 2022. Dall-E 2 betrat am 20. Juli 2022 die Beta-Phase und wurde am 28. September 2022 für alle Benutzer geöffnet. Diese Version war darauf ausgelegt, realistischere Bilder in höheren Auflösungen zu generieren​.
  • Dall-E 3: Veröffentlicht am 10. August 2023. Dall-E 3 wurde als eine Weiterentwicklung vorgestellt, die “deutlich mehr Nuancen und Details” als die vorherigen Versionen verstehen konnte​.

Diese Daten geben einen Überblick über die Entwicklung und Verbesserungen von Dall-E im Laufe der Zeit.

Anhand von diesem Beispiel sieht man, wie sich die Bildgenerierung von Dall-E 2 zu Dall-E 3 verbessert hat.
Anhand von diesem Beispiel sieht man, wie sich die Bildgenerierung von Dall-E 2 zu Dall-E 3 verbessert hat.

Vergleich mit anderen Bild-KI-Tools

Während Dall-E beeindruckende Fähigkeiten in der Generierung kreativer und oft surrealer Bilder besitzt, gibt es auch andere bemerkenswerte KI-basierte Bildgenerierungstools, die jeweils ihre eigenen Stärken haben.

  • Midjourney: Bekannt für fotorealistische Bilder und überlegene Bildkomposition und Ästhetik.
  • Artsmart.ai: Ermöglicht die Erstellung hochwertiger Bilder mit verschiedenen fortgeschrittenen Einstellungen.
  • Leonardo.ai: Spezialisiert auf Spielinhalte und bietet eine breite Palette an Funktionen.
  • Stability.ai DreamStudio: Nutzt die neuesten Stable-Diffusion-Modelle und ist ideal für experimentelle Kreationen.
  • Adobe Firefly: Bietet eine intuitive Benutzeroberfläche und ist für Adobe-Anwender optimiert.
  • Stockimg.ai und Supermachine: Ideal für die schnelle Generierung von Stockbildern.
  • BlueWillow by LimeWire: Bietet einzigartige Stile und eine benutzerfreundliche Plattform.
  • DALL·E 2 (OpenAI Labs): Eine frühere Version von Dall-E mit eigenen Merkmalen.
  • Neuroflash KI Bild Generator, Jasper Art, Canva Create, Craiyon, Photosonic, Nightcafé, Runway, ArtSpace.ai, Mindverse: Weitere Optionen, die jeweils ihre eigenen spezifischen Funktionen und Stärken haben​.

Diese Tools unterscheiden sich von Dall-E in Bezug auf Bildqualität, Anwendungsbereiche, Benutzerfreundlichkeit und spezifische Funktionen. Während Dall-E sich ideal für kreative und imaginative Bilder eignet, bieten andere Tools Vorteile in der Erstellung fotorealistischer Bilder, der Verarbeitungsgeschwindigkeit oder in speziellen Anwendungsbereichen wie Spielinhalte oder Stockfotos.

Dall-E vs. Midjourney

Ich konnte in der Vergangenheit sowohl Dall-E als auch Midjourney nutzen und habe dabei folgende Erfahrung gemacht: Midjourney liegt in jedem Fall vorne, wenn es darum geht, fotorealistische Ergebnisse zu erzielen. Sobald ich etwas erzeugen möchte, das realistisch aussehen soll, nutze ich Midjourney.

Dall-E hat seine Stärken aus meiner Sicht bei zwei Punkten:

  1. Es “versteht” den Prompt sehr gut und man kann gut Thumbnails für YouTube oder Bilder für Blogbeiträge erstellen. Vor allem, wenn auch Text im Bild vorhanden sein soll, dann ist Dall-E sehr gut. Midjourney hat mit Version 6 zwar nachgelegt, aber ich setze oft auf Dall-E, wenn es um Text im Bild geht.
  2. Wenn man ein Bild nach und nach in Kooperation mit ChatGPT entwickeln will, dann geht das mit ChatGPT Plus und Dall-E extrem gut. Ich sage ChatGPT, was ich für ein Bild benötige und er erstellt mir ein Bild. Dann erkläre ich ihm, was anders sein soll und er passt den Prompt im Hintergrund an. So komme ich nach und nach immer näher an mein Wunschergebnis und muss dabei nicht selbst am Bild-Prompt werkeln. Die Arbeit übernimmt ChatGPT.

Es kommt aber immer auf den Einzelfall an, welches Tool das geeignetere ist. In Leonardo.ai habe ich nur wenig Erfahrungen bisher sammeln können, aber es hat mich auch noch nicht so von den Socken gehauen, wie Midjourney, was die Ergebnisse betrifft.

Hier aber nun ein Beispiel von einem fotorealistischen Bild in Dall-E und Midjourney. Der Prompt lautet:

A photorealistic portrait of a cyborg, blending human features with subtle mechanical elements, highlighted by a luminous, intelligent gaze.

Und hier ist das Ergebnis von Dall-E 3:

Der Cyborg – generiert von Dall-E 3.
Der Cyborg – generiert von Dall-E 3.

Und das Ergebnis von Midjourney (V 6.0 alpha):

Der Cyborg – generiert von Midjourney V 6.0 alpha.
Der Cyborg – generiert von Midjourney V 6.0 alpha.

Anwendungsbereiche von Dall-E

Dall-E bietet vielfältige Anwendungsmöglichkeiten in verschiedenen Bereichen:

  • Architektur und Innenraumgestaltung: Schnelle Visualisierung von Gebäuden und Innenräumen.
  • Werbung und Marketing: Erstellung einzigartiger und kreativer Kampagnenbilder.
  • Bildung und Lehre: Generierung anschaulicher Lernmaterialien und Illustrationen.
  • Kunst und Design: Erschaffung einzigartiger Kunstwerke und Designelemente.
  • Unterhaltung: Entwicklung von Charakterdesigns und Szenarien für Videospiele und Filme.
  • Logo- und Markendesign: Kreation von Logos und Markenbildern.
  • Modellierung und Simulation: Unterstützung bei der Erstellung von 3D-Modellen und Umgebungen.

Diese Beispiele zeigen, wie Dall-E die Kreativität und Effizienz in verschiedenen Bereichen revolutionieren kann, von der Kunst bis zur Technik.

Dall-E 3 – Die neueste Version

Dall-E 3 ist die aktuellste und fortschrittlichste Version dieser KI-gestützten Bildgenerierungstechnologie. Diese Version bietet verbesserte Funktionen und eine höhere Präzision bei der Bildgenerierung. Zu den Neuerungen gehören eine gesteigerte Fähigkeit zur Erstellung detaillierterer und komplexerer Bilder sowie verbesserte Algorithmen, die eine noch genauere Umsetzung von Textbeschreibungen in visuelle Inhalte ermöglichen.

Dall-E 3 setzt neue Standards in der KI-gestützten Bildgenerierung und erweitert die Grenzen dessen, was in Sachen digitaler Kreativität möglich ist. Informationen zu Verfügbarkeit und Kosten sind dabei für Interessierte besonders relevant.

Eine der Stärken von Dall-E 3 ist das Verständnis des Prompt, so dass man auch einzelne Bildelemente näher beschreiben kann.
Eine der Stärken von Dall-E 3 ist das Verständnis des Prompt, sodass man auch einzelne Bildelemente näher beschreiben kann.

Leider scheint Dall-E aber nicht auf Anhieb zu verstehen, was man meint, wenn man diesen Prompt gibt:

A photorealistic portrait of a cyborg, blending human features with subtle mechanical elements, highlighted by a luminous, intelligent gaze.

Das Ergebnis sieht in Dall-E 3 so aus:

Leider nicht bestanden: Eine kleine rote Kugel neben einer großen blauen Pyramide auf einem größeren grünen Würfel.
Leider nicht bestanden: Eine kleine rote Kugel neben einer großen blauen Pyramide auf einem größeren grünen Würfel.

Bei Midjourney kam das hier raus:

Bei Midjourney ist von den 4 Bildern nur das links unten richtig. Ausser, dass er noch eine blaue Kugel dazu erfunden hat.
Bei Midjourney ist von den 4 Bildern nur das links unten richtig. Außer, dass er noch eine blaue Kugel dazu erfunden hat.

Nutzung von Dall-E über ChatGPT

Die einfachste und effektivste Art, mit Dall-E zu arbeiten, ist derzeit über ChatGPT. Diese Methode bietet den Vorteil, dass ChatGPT nicht nur dabei hilft, die Textbeschreibungen (Prompts) für Dall-E zu formulieren, sondern diese auch direkt an Dall-E weiterleitet. Dieser integrierte Ansatz macht den Prozess der Bildgenerierung besonders benutzerfreundlich und effizient.

Benutzer müssen sich bei OpenAI anmelden und können dann über die ChatGPT-Schnittstelle auf Dall-E zugreifen, wobei die Qualität der Ergebnisse stark von der Genauigkeit und Kreativität der eingegebenen Prompts abhängt.

Tipp: Wenn man sehen möchte, welcher Prompt aktuell an Dall-E geht, dann frage in ChatGPT einfach “Wie sieht der Prompt genau aus, der aktuell an Dall-E geschickt wurde?”

Hier sieht man die Kommunikation mit Dall-E über ChatGPT, um ein Bild zu erzeugen.
Hier sieht man die Kommunikation mit Dall-E über ChatGPT, um ein Bild zu erzeugen.

Beispiele für Bilder und Prompts mit Dall-E

Folgende Bilder habe ich erstellt, indem ich ChatGPT nach ein paar Ideen gefragt habe, die zeigen, wie vielseitig die Bild-KI ist. Aus den Ideen hat ChatGPT dann die Prompts erstellt, mit denen die Bilder erzeugt wurden. Und ihr findet hier nun, was dabei rausgekommen ist.

Bild 1 – Portrait

Prompt:

A detailed, lifelike portrait of a person in a photorealistic style. The portrait is a close-up, showcasing the intricacies of skin texture, light reflections, and shading to emphasize the capability for realistic depiction. The facial expression is serene and thoughtful, with a focus on the eyes and subtle details like eyelashes and the texture of the lips. The lighting should be soft and natural, enhancing the realism of the portrait.

Und hier das Ergebnis von Dall-E 3:

dalle-bild-1

Bild 2 – Abstrakte Kunst

Prompt:

An abstract artwork using vibrant colors and unusual shapes to create a non-realistic artistic expression. The composition focuses on dynamic color interplay and geometric patterns, creating a visually engaging and thought-provoking piece. The arrangement of elements is balanced yet dynamic, featuring a mix of sharp angles and fluid curves, showcasing the versatility of abstract art creation.

Und hier das Ergebnis von Dall-E 3:

dalle-bild-2

Bild 3 – Comic

Prompt:

A comic-style illustration depicting a humorous or action-packed scene. The image should feature characteristically strong and stylized figures, suitable for graphic novels or children’s books. Emphasis on bold lines, vibrant colors, and expressive characters to capture the essence of comic art.

Und hier das Ergebnis von Dall-E 3:

dalle-bild-3

Bild 4 – Surreale Landschaft

Prompt:

A surreal landscape depicting dream worlds or impossible scenarios, such as floating islands or landscapes with unusual color combinations. The scene should illustrate the ability to create imaginative and boundary-pushing scenes, featuring elements that defy conventional reality.

Und hier das Ergebnis von Dall-E 3:

dalle-bild-4

Bild 5 – Gemälde

Prompt:

A painting in the style of the old masters, such as Rembrandt or Leonardo da Vinci. This could be a historical scene or a classic portrait, demonstrating the ability to mimic traditional art styles. The artwork should capture the essence of Renaissance or Baroque art, with attention to detail, dramatic lighting, and rich textures.

Und hier das Ergebnis von Dall-E 3:

dalle-bild-5

Grenzen und Herausforderungen von Dall-E

Obwohl Dall-E ein beeindruckendes Tool für die Bildgenerierung ist, stößt es in einigen Bereichen an seine Grenzen. Beispielsweise kann es bei der Erstellung von Schriftzügen oder der genauen Darstellung anatomisch korrekter Gliedmaßen Schwierigkeiten geben. Diese Einschränkungen können die Nutzbarkeit in bestimmten Anwendungsfällen beeinträchtigen.

Weiterhin muss bei der Nutzung von Dall-E auch auf ethische Aspekte geachtet werden, wie die Vermeidung von urheberrechtlich geschütztem Material oder die Erstellung anstößiger Inhalte.

Bei Händen tun sich aktuell noch alle Bild-KIs schwer, aber Dall-E insbesonders.
Bei Händen tun sich aktuell noch alle Bild-KIs schwer, aber Dall-E insbesonders.

Meine Schlussfolgerung

Dall-E mag nicht das beste Bild-KI-Tool auf dem Markt sein, aber es ist zweifellos ein beeindruckendes und vielseitiges Instrument. Seine Integration in ChatGPT ist eines der praktischsten Features, da es die Erstellung von Bildern direkt aus Textbeschreibungen vereinfacht und effizienter macht.

Auch das Umsetzen von langen Prompts, bei denen Midjourney oft etwas in der Umsetzung weglässt, ist für Dall-E weniger ein Problem. Wenn es also nicht gerade um Fotorealismus geht, dann ist Dall-E eine gute Wahl.

Hat dir der Artikel gefallen und helfen dir die Anleitungen im Blog? Dann würde ich mich freuen, wenn du das Blog über eine Steady-Mitgliedschaft unterstützen würdest.

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Im Sir Apfelot Blog findest du Ratgeber, Anleitungen und Testberichte zu Apple Produkten wie iPhone, iPad, Apple Watch, AirPods, iMac, Mac Pro, Mac Mini und Mac Studio.

Specials