DALL-E und Sora: OpenAI zeigt neue KI-Entwicklungen

Die KI-Schmiede OpenAI, die vor allem für ChatGPT bekannt ist, hat diese Woche ein paar neue Entwicklungen ihrer Bild- und Video-KIs demonstriert. Das DALL-E genannte Werkzeug zur Bilderstellung wurde um die Möglichkeit zur individuellen, textbasierten Nachbearbeitung von erzeugten Bildern erweitert. Das Sora genannte Tool für die Videoerstellung, welches noch nicht für die breite Öffentlichkeit verfügbar ist, wurde von ausgesuchten Personen getestet. Einerseits haben sie damit Szenen und Videos erstellt, die äußerst kreative Ideen vermitteln. Andererseits lassen sich die Videos auch mit den wirren Sachen vergleichen, die man im Halbschlaf zusammenträumt.

Bearbeitungsmöglichkeiten vermittels der Bild-KI "DALL-E" (links) und verschiedene Ergebnisse der Video-KI "Sora" (rechts) werden aktuell vorgeführt. Quelle: OpenAI / YouTube
Bearbeitungsmöglichkeiten vermittels der Bild-KI “DALL-E” (links) und verschiedene Ergebnisse der Video-KI “Sora” (rechts) werden aktuell vorgeführt. Quelle: OpenAI / YouTube

OpenAI DALL-E – Erstellte Bilder können multimodal bearbeitet werden

In einem Beispielvideo für die neuen Funktionen der Nachbearbeitung von Grafiken zeigt OpenAI vorerst die Bilderstellung mit DALL-E. Dabei wird von der KI ein Pudel verlangt, der mit einem Schild „Happy Birthday“ sagt. Die KI erstellt daraufhin das  verlangte Bild und schmückt es mit weiteren Objekten, die man mit einer Geburtstagsparty in Verbindung bringen kann, aus.

Anschließend wird eines der beiden erstellten Bilder ausgewählt, ein Werkzeug zur Bearbeitung angeklickt und direkt auf dem Bild werden zwei Stellen an den Ohren des Hundes markiert. Per Texteingabe wird die KI dazu aufgefordert, dort Schleifen hinzuzufügen, was nach einiger Bearbeitungszeit umgesetzt wird. So kann auf eine komplett neue Bilderstellung verzichtet werden, wenn in einem Ergebnis nur ein-zwei verbessernde Details fehlen.

OpenAI Sora – Mehrere Beispielvideos für verschiedenste Anwendungszwecke

Auf dem YouTube-Kanal von OpenAI wurden und werden aktuell verschiedene Videos hochgeladen, welche die Möglichkeiten der Nutzung von Sora aufzeigen sollen. Neben einem Musikvideo von August Kamp, das Traumwelten mit Mustern und Effekten verbindet, gibt es eine Fantasie-Dokumentation namens „Beyond Our Reality“ von Don Allen Stevenson, die verschiedene Tier-Chimären zeigt.

Ein Video von Josephine Miller zeigt Menschen, die unter Wasser eine Glaskleidung tragen bzw. aus Glaskörpern bestehen. Und zuletzt gibt es ein Video von Paul Trillo, in dem Gold von einem Erd-Element zu einer Schallplatte wird und ins Welt fliegt. Alle Videos zeigen zwar eindrucksvoll auf, wie weit die KI bereits gekommen ist. Allerdings gibt es in jedem Video auch Elemente, Bewegungen, Kameraführungen, Glitches und andere Einzelfaktoren, welche das Material unwirklich und teils auch unangenehm wirken lassen.

Hier die Videos:

Hat dir der Artikel gefallen und helfen dir die Anleitungen im Blog? Dann würde ich mich freuen, wenn du das Blog über eine Steady-Mitgliedschaft unterstützen würdest.

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Im Sir Apfelot Blog findest du Ratgeber, Anleitungen und Testberichte zu Apple Produkten wie iPhone, iPad, Apple Watch, AirPods, iMac, Mac Pro, Mac Mini und Mac Studio.

Specials
Shopping
  •  
  •