Lebt in der Bild-KI Stable Diffusion eine dämonische Kreatur, die durch den Bildschirm kriechen will? Natürlich nicht. Aber die Bilder, die ein Reddit-Nutzer veröffentlichte, erwecken durchaus diesen Eindruck. Jedoch konnte das Rätsel um den Negative Prompt Man recht schnell gelöst werden.
Von Michael Förtsch
Es sind wirklich unheimliche Bilder, die ein Reddit-Nutzer namens kek0815 im Subreddit zum Bild-Generator-Modell Stable Diffusion veröffentlicht hat. Sie zeigen eine schattenhafte Figur, die ihre Hände mit langen Fingern direkt gegen den Bildschirm zu pressen scheint. Auf einem ist sie vor einem schwarzen Hintergrund zu sehen. Auf anderen erscheint sie vor einem Gesicht, einem Auto oder einem Stuhl. Die Szene könnte glatt aus einem Horrorstreifen wie jenen der Ring-Filmreihe stammen, in der ein verfluchtes Video immer wieder Menschen in den Tod reißt.
Aber es ist eben kein Video, das diese merkwürdige Figur hervorbringt, sondern das Text-zu-Bild-Modell Stable Diffusion. Allerdings nur flüchtig, wie der Reddit-Nutzer in seinem Post anmerkt. Nur im ersten Schritt der Bild-Generierung ist die schattenhafte Figur zu erkennen. Zum Zeitpunkt also, wenn das eigentlich gewünschte Motiv langsam aus digitalem Bildrauschen herausgebildet wird. In den weiteren Schritten verschwinde die Figur, bis nur noch die im Prompt beschriebenen Bildelemente sichtbar seien. Der Eintrag und die Beispielbilder von kek0815 stießen bei Reddit auf ziemlichen Widerhall.
„Ich glaube, deine Grafikkarte ist von Geistern befallen“, schrieb ein Nutzer. Andere suchten den Grund für die geisterhafte Silhouette in dämonischer Besessenheit, in den Seelen, die jedes Mal geopfert werden, wenn ein KI-Bild generiert wird, oder im „Gott der Technologie, der in jedem Renderbild lebt“. Andere Wieder andere fahndeten nach ernsthafteren und logischeren Erklärungen. Sie mutmaßten, dass es sich um eine Art Wasserzeichen handeln könnte. Denn nachstellen konnte das Phänomen zunächst keiner. Tatsächlich nutzte kek0815 zwar ein Stable-Diffusion-Modell, aber eines, das von der Community weiterentwickelt wurde.
Es gab bereits Loab
Wie kek0815 schrieb, war es das DreamShaperXL-Lightning-Modell, das die merkwürdige Figur auf dem Bildschirm zeichnete. Dabei handelt es sich um ein KI-Modell, das erst vor ein paar Tagen auf Basis von Stable Diffusion XL veröffentlicht wurde und besonders realistische und detaillierte Bilder mit möglichst wenigen Rechenschritten verspricht. Doch auch diese Informationen brachten zunächst keine Klarheit. Jedenfalls bis sich kek0815 plötzlich mit der Lösung selbst zurückmeldete.
„Ich habe das Mysterium gelöst und fühle mich wie ein Idiot“, schrieb kek0815. Der Negative Prompt war schuld an der schauerlichen Figur, offenbarte er. Daher wurde die Horrorfigur auch gleich Negative Prompt Man getauft. Mit einem negativen Prompt kann Stable Diffusion vorgegeben werden, welche Bildelemente und Konzepte das Modell im fertigen Bild explizit vermeiden soll. Wer zum Beispiel möglichst keinen Hund in einem Bild haben will, schreibt genau das in den negativen Prompt hinein.
kek0815 hatte hingegen als Negative Prompt für seine Bilder die Worte „complex, detailed, intricate, ugly, deformed, noisy, blurry, distorted, out of focus, bad anatomy, extra limbs, poorly drawn face, poorly drawn hands, missing fingers, signature, text“ hinterlassen, um typische Stable-Diffusion-Macken wie fehlende Finger an einer Hand, ungewollte Unschärfeebenen oder unlesbaren Text zu vermeiden. Der gesamte Negative Prompt manifestiert sich bei DreamShaperXL Lightning offenbar kurzzeitig als eine vollständige Figur, die anschließend wieder im digitalen Rauschen verschwindet – und kann auch gänzlich sichtbar gemacht werden. Auch bei 1E9 konnten wir das reproduzieren.
Werde Mitglied von 1E9!
Hier geht’s um Technologien und Ideen, mit denen wir die Welt besser machen können. Du unterstützt konstruktiven Journalismus statt Streit und Probleme! Als 1E9-Mitglied bekommst du frühen Zugriff auf unsere Inhalte, exklusive Newsletter, Workshops und Events. Vor allem aber wirst du Teil einer Community von Zukunftsoptimisten, die viel voneinander lernen.
Jetzt Mitglied werden!So etwas kommt nicht das erste Mal vor. Bereits vor zwei Jahren entdeckte Steph Maj Swanson bei ihren Experimenten mit Text-zu-Bild-Generatoren eine Horrorfigur, die sie Loab nannte. Diese tauchte auf, als Swanson auf den Negativ-Prompt „Brando“ – für Marlon Brando – ein Logo mit einer Stadtsilhouette und den Worten „DIGITA PNTICS“ bekam. Als Gegenteil dieses Logos und der Worte hoffte sie auf den Darsteller Marlon Brand, wurde aber enttäuscht. Stattdessen erhielt sie das Gesicht einer entstellten Frau mit durchdringendem Blick.
Hat dir der Artikel gefallen? Dann freuen wir uns über deine Unterstützung! Werde Mitglied bei 1E9 oder folge uns bei Twitter, Facebook, Instagram oder LinkedIn und verbreite unsere Inhalte weiter. Danke!
Sprich mit Job, dem Bot!
War der Artikel hilfreich für dich? Hast du noch Fragen oder Anmerkungen? Ich freue mich, wenn du mir Feedback gibst!