4 Minuten Lesezeit

Künstliche Intelligenz kreiert Bilder, Fotos und Grafiken – was leistet die KI-App DALL-E 2?

29.09.22 08:27

Dass die Künstliche Intelligenz enormes Potenzial besitzt, ist inzwischen keine Neuigkeit mehr. Innovative und neue technische Lösungen mit KI sorgen dennoch immer wieder für Erstaunen. Dies gilt auch für die Resultate der KI-App DALL-E 2. Die Anwendung erzeugt innerhalb von Sekunden Bilder, die auf Wunsch auch in realen Umgebungen platziert sind. Handelt es sich bei DALL-E 2 um eine reine Spielerei oder ist die App ein Beweis dafür, wie Künstliche Intelligenz schon in naher Zukunft unseren Alltag verändern wird?

Was genau ist DALL-E 2?

Bei DALL-E 2 handelt es sich um einen sogenannten Text zu Bild Generator. Die Anwendung wird also mit reinen Textbefehlen bedient und erzeugt aus diesen die Bilder. DALL-E 2 ist die verbesserte Version des ersten Text zu Bild Generators. Die App baut auf der OpenAI-Plattform von Microsoft auf.

Das Besondere an den erzeugten Bildern ist, dass Sie diese in unterschiedlichsten Darstellungsarten erhalten können. Der Entwickler verspricht unter anderem fotorealistische Bilder. Aus den eingegebenen Befehlen erzeugt die App innerhalb von wenigen Sekunden fertige Bilder.

DALL-E 2 im Test – was kann der Text zu Bild Generator und wo sind die Grenzen?

Der beste Weg, herauszubekommen, was DALL-E 2 wirklich leistet, ist ein Test. Da die Anwendung aktuell nur in Englisch verfügbar ist, müssen die Befehle ebenfalls in englischer Sprache eingegeben werden. Besonders vielversprechend und interessant erscheinen die Möglichkeiten, mit DALL-E 2 realistische, reale Szenarien darzustellen. Dementsprechend zielt der erste Versuch darauf ab, ein Kind vor der Skyline von New York und dem Empire State Buildung zu erstellen, das ein Eis isst. Die Eingabe in DALL-E 2 lautet wie folgt:  "a boy in new york standing on the empire state building watching at the sykline with a ice cream"

Die Ergebnisse aus der App stehen nach kurzer Wartezeit bereit und sprechen für sich. Selbst bei genauerer Betrachtung sind die künstlich erzeugten Bilder von einem realen Foto nicht zu unterscheiden.

Blog


DALL-E 2 ist jedoch nicht nur in der Lage, fotorealistische Bilder zu erstellen. Die App kann verschiedene Kunststile erzeugen. Dafür müssen Sie nur einen zusätzlichen Textbefehl anhängen. Das Experiment von eben wird wiederholt, nur mit dem Zusatz „Pixel Art“. Die Ergebnisse sehen dann wie folgt aus:

Blog Pixell


Einschränkungen gibt es noch bei sehr komplexen und detaillierten Darstellungen. Hier fehlt es der KI noch an Inhalten und Vergleichsmöglichkeiten. Möglicherweise wird die Plattform in Zukunft lernen und solche Szenen besser darstellen können. Gleiches gilt, wenn Textinhalte in die Bilder eingebaut werden sollen. Hier ist die Anwendung noch nicht fähig, die Befehle richtig umzusetzen und Textblöcke zum Beispiel auf Schildern oder Werbetafeln im Bild zu integrieren.

Welche praktischen Einsatzmöglichkeiten und Vorteile bieten Bildgeneratoren wie DALL-E 2?

Solche Text zu Bild Generatoren haben das Potenzial, in vielerlei Hinsicht im Unternehmensalltag nützlich zu sein. Ein gutes Beispiel hierfür ist Bildmaterial, das Sie für Ihre Webseite, Marketingkampagnen und andere Veröffentlichungen benötigen. Solches Material müssen Sie entweder teuer beschaffen oder selbst erstellen. Die immer schärferen Gesetze in Bezug auf Bild- und Persönlichkeitsrechte macht es zunehmend schwerer, Bildmaterial für gewerbliche Zwecke einzusetzen.

Mit DALL-E 2 oder einer ähnlichen Lösung erzeugen Sie lizenzfreie Fotos, Bilder und Grafiken aller Art. Innerhalb von wenigen Sekunden haben Sie exakt das Ergebnis, was Sie benötigen. Bereits das ist schneller, als die Suche auf Plattformen, die Fotomaterial anbieten. Um Rechte und Lizenzen müssen Sie sich ebenfalls keine Sorgen machen, denn die Inhalte sind vollständig digital erstellt und somit nicht real. DALL-E 2 ist zudem nicht allein im Bereich der KI-unterstützen Bilderstellungsanwendungen. Mit Midjourney, Craiyon und einigen weiteren Plattformen schicken sich weitere Apps an, diesen Bereich zu besetzen.

Künstliche Intelligenz sinnvoll in Ihre Prozesse integrieren

DALL-E 2 ist eines der Beispiele für die Digitalisierung der nächsten Generation. Künstliche Intelligenz in dieser Form zeigt eindrucksvoll die Vorteile, die Sie mit einer gezielten Digitalisierung erreichen können: schneller, einfacher, günstiger und besser. Es ist auch ein Beispiel dafür, dass die Digitalisierung laufend und zügig voranschreitet.

Aus diesem Grund ist es sinnvoll, eine IT-Strategie zu haben und diese immer wieder zu aktualisieren. UPGREAT hilft Ihnen dabei, Ihre individuelle Digitalisierungsstrategie zu finden und diese zu Updaten. 

Rolf Weber

Gepostet von Rolf Weber

Als «Digital Transformation Coach» kombiniere ich fachliches Handwerk rund um moderne Cloud-Services (Microsoft 365, Teams, SharePoint) mit strategischer Perspektive, befähige Mitarbeitende, neue Technologien praktisch anzuwenden und verlasse mich auf mein Gespür, Menschen in den unterschiedlichsten Situationen zu begeistern.