KI erstellt Bilder aus Texten in Echtzeit
News & Trends

KI erstellt Bilder aus Texten in Echtzeit

KI-Generatoren, die aus einem Text ein Bild erstellen, gibt es inzwischen einige. Bei der Nutzung ist immer Geduld gefragt, denn bis zu einem Ergebnis dauert es oft mehrere Minuten. Stability AI ändert das.

Stability AI ist ein Unternehmen, das Text-, Bild- und Video-Generatoren auf Basis von Deep-Learning-Modellen erstellt. Ihren Text-zu-Bild-Generator nennen sie Stable Diffusion. Dieser spuckt anhand eines Beschreibungstexts, Prompt genannt, ein Bild aus. Die erste Version gibt es seit über einem Jahr, mit einer verbesserten Nachfolge, dem Stable Diffusion XL.

Mit Stable Diffusion XL erstellst du KI-generierte Bilder anhand von Prompts, also Textbeschreibungen.
Mit Stable Diffusion XL erstellst du KI-generierte Bilder anhand von Prompts, also Textbeschreibungen.
Quelle: Stability AI

Doch sowohl bei der ersten Version als auch bei der Nachfolge benötigt es von der Texteingabe bis zum Ergebnis einige Minuten. Nun hat Stability AI eine neue Version ihres Bild-Generators als Demo herausgebracht. Das sogenannte Stable Diffusion XL Turbo (SDXL-Turbo) basiert auf dem Modell Stable Diffusion XL und liefert im Gegensatz zum grösseren Bruder Ergebnisse in Sekundenschnelle.

Wie die Generatoren funktionieren, habe ich bereits in früheren Artikeln genauer abgehandelt. Das Prinzip als User ist simpel: Du gibst einen Text ein, Prompt genannt, und das Programm spuckt dir anhand dieser Beschreibung eines oder mehrere Bilder aus. Das ist beispielsweise toll zur Inspiration für Kreativschaffende.

  • Meinung

    Künstlichkeit der Kunst. Wie KI den Kunstmarkt aufmischt

    von Michelle Brändle

Da ein solches Programm für ein Ergebnis auf eine ziemlich grosse Datenbank zurückgreifen muss, erfordert es eine enorme Rechenleistung. Und nimmt viel Zeit in Anspruch. Wenn dir das Ergebnis anschliessend nicht gefällt, musst du deinen Text ergänzen, ändern oder gar neu schreiben. Das Prozedere beginnt von vorne. Das kann ermüdend sein.

Was ist neu beim SDXL-Turbo?

Mit dem SDXL-Turbo hat Stability AI ein Programm geschaffen, dass so schnell Bilder aus den Prompts liefert, dass sie es selbst als Echtzeit-Ergebnis betiteln. Die entstandenen Bilder sind nicht ganz so detailreich wie bei der langsameren Version, aber immer noch von recht guter Qualität. Allerdings sind sie schon alleine durch die Geschwindigkeit ihres Entstehens beeindruckend.

Ein mehr oder wenig süsses Ergebnis von Stable Diffusion XL Turbo.
Ein mehr oder wenig süsses Ergebnis von Stable Diffusion XL Turbo.
Quelle: Stable Diffusion XL Turbo

Normalerweise gehören zum Prozess eines Bild-Generators 20 bis 50 Schritte. Die Innovation beim SDXL-Turbo liegt darin, dass das Programm lediglich bis zu vier Schritte für den Output benötigt. Diese Vorgehensweise nennt Stability AI «Adversarial Diffusion Distillation». Sie ist recht komplex, nicht umsonst hat Stability AI die Theorie dahinter ausführlich erklärt.

Spannend ist, dass für das Ergebnis nicht nur Zeit eingespart wird, der Vorgang benötigt laut Stability AI auch weniger Rechenleistung. So hat auch mein Macbook Air mit M1-Chip genügend Leistung für ein paar witzige Ergebnisse. Die Demo-Version findest du auf dieser Webseite. Nach etwa 10 Sätzen und Ergebnissen ist die Gratisversion allerdings aufgebraucht. Die Bilder lassen sich mit einem Editor-Button noch weiter bearbeiten. Beispielsweise lässt du per Knopfdruck den Hintergrund entfernen oder drei weitere, ähnliche Ergebnisse anzeigen. Diese Bearbeitungen dauern wiederum etwas länger.

Mit dem Stable Diffusion XL Turbo kann ich auch den Hintergrund entfernen oder das Bild anderweitig bearbeiten.
Mit dem Stable Diffusion XL Turbo kann ich auch den Hintergrund entfernen oder das Bild anderweitig bearbeiten.
Quelle: Stable Diffusion XL Turbo
Titelbild: Michelle Brändle

15 Personen gefällt dieser Artikel


User Avatar
User Avatar

Seit ich einen Stift halten kann, kritzel ich die Welt bunt. Dank iPad kommt auch die digitale Kunst nicht zu kurz. Daher teste ich am liebsten Tablets – für die Grafik und normale. Will ich meine Kreativität mit leichtem Gepäck ausleben, schnappe ich mir die neuesten Smartphones und knippse drauf los. 


Diese Beiträge könnten dich auch interessieren

Kommentare

Avatar