Kunst auf Tastendruck? DALL-E 2, Midjourney, Stable Diffusion und andere digitale Werkzeuge erstellen mit Hilfe Künstlicher Intelligenz beeindruckende Bilder. Immer mehr Menschen können diese Technik nutzen – und tun das auch. Einige sehen in den KI-Bild-Erzeugern den Anbruch einer kreativen Renaissance, die Kunst und Kultur durcheinander wirbeln wird. Doch das besorgt einige Künstler. Manche fühlen sich sogar von der Technologie beraubt.
Von Michael Förtsch
Es hat schon etwas Magisches. Einige beschreibende Worte genügen – und schon lassen DALL-E 2, Midjourney, Stable Diffusion und Disco Diffusion Bilder entstehen. Einfach so. Die KI-Programme mit den obskuren Namen produzieren Malereien der französischen Revolution, die ausschauen, als wären sie mit einer GoPro-Kamera aufgenommen. Sie zeichnen Portraits fremder Kreaturen auf außerirdischen Planeten, erdenken unmögliche Architekturformen oder fertigen Skizzen von Raumschiffen an, die anmuten, als hätte sie Leonardo Da Vinci mit der Feder gezogen. Und das hochauflösend und binnen weniger Minuten oder sogar nur einiger Sekunden. Die KI-Bild-Generatoren bauen dafür auf den bemerkenswerten Fortschritten bei der Entwicklung von Künstlicher Intelligenz auf, die in den letzten Jahren stattfanden.
Das schlicht Text to Image – also: Text zu Bild – genannte Konzept hinter DALL-E 2 und anderen Bild-Synthese-Werkzeugen ist nicht neu, sondern wird von Informatikern und KI-Forschern seit langem vorangetrieben. Aber neue Mechanismen ermöglichen es KI-Systemen, die Beziehungen zwischen Worten, einen Kontext in Sätzen zu erkennen und beides mit den Elementen und Mustern in Bildern zu assoziieren. Außerdem gibt es neue Arten, auf die eine KI lernen kann. Etwa, indem sie Bilder gezielt verrauscht und wieder aufbaut, um deren Muster und Regeln zu verinnerlichen. Und schnelle und große Speichermedien sowie rechenstarke Grafikkarten erlauben es Forschern, Firmen und unabhängigen Entwicklern, ihre Systeme mit riesigen Datenmengen zu trainieren – mit Millionen oder sogar Milliarden von Texten, Grafiken, Fotos, Malereien und Skizzen.
Das Ergebnis dieser Fortschritte sind nun digitale Maschinerien, die aus den Texteingaben – den Prompts – von Nutzern deduzieren, was das Bild zeigen soll und entsprechend gelernte Bestandteile, Muster und Motive replizieren und zusammensetzen. Dadurch kann jeder immer neue Bilder mit nahezu jedem denkbaren Motiv erzeugen. Jedes davon ist einzigartig, denn die Künstliche Intelligenz berechnet nie ein Bild zweimal auf dieselbe Weise. Derzeit werden vor allem Twitter, Instagram und Facebook von zahlreichen Nutzern mit den Grafiken geflutet, die allen voran mit DALL-E 2 und Midjourney erzeugt wurden, also mit zwei der ersten Text-to-Image-Diensten, die vielen Nutzern zugänglich sind und ohne Fachwissen und Einarbeit genutzt werden können. Das ist eine Revolution – und genau das sorgt für viele Fragen und sogar Ängste bei Künstlern.
Brauchen wir noch Künstler?
Es ist nicht sicher, wer den Satz zuerst in die Welt brachte, aber er wird seit Jahren immer wieder als Text und als Meme in Bildform geteilt. Er sagt: „To replace artists with robots, clients will have to accurately describe what they want. We’re still safe.“ Also, wenn Roboter irgendwann Künstler ersetzen sollten, müssten Kunden genau beschreiben, was sie wollen. Daher wären die Jobs von Künstlern noch sicher. Doch da sind sich einige nicht mehr so sicher – und fürchten, dass sie etwa als Illustratoren in Zukunft einfach ersetzt werden könnten. „Du hast bereits diese ganzen billigen Fertiggrafiken auf diesen Websites. Aber wenn du etwas einzigartiges, ein ganz bestimmtes Motiv willst, kamst du um uns [Illustratoren] nicht rum“, sagt eine Künstlerin, die wir nur Jenny nennen sollen, zu 1E9. Sie hat Illustrationen für Magazine in Österreich und Deutschland gestaltet hat und auch an mehreren Videospielen mitgearbeitet. „Aber jetzt geht das mit einigen Worten, die du da einfach eintippst – und du kriegst so viele Bilder, wie du willst und bezahlen kannst.“
Tatsächlich haben erste Magazine schon Titelbilder mit KIs erstellt. Die Autoren bekannter Newsletter und Blogs greifen auf Midjourney und DALL-E 2 zurück, um Artikel mit passenden Grafiken zu begleiten – und auch einige der Aufmacher bei 1E9 wurden mit Hilfe der KI-Bild-Erzeuger Disco Diffusion und Stable Diffusion erstellt. Solche „Flächen zu illustrieren“ habe für viele Grafiker, Zeichner und Maler einst den Einstieg in ihren Beruf bedeutet, sagt Jenny. Diese Aufträge drohten jetzt wegzufallen – was durchaus für Empörung sorgt. „Ich verstehe total, wie convenient das ist: geht total einfach und schnell“, sagt sie. „Aber wenn ich die Bilder da sehe, das kränkt schon – und macht auch Angst.“
Dass sie und ihre Kolleginnen und Kollegen womöglich bald weniger zu tun haben, davon ist Jenny daher fest überzeugt. Wirklich arbeitslos werde sie in absehbarer Zeit aber eher nicht, schränkt sie ein. Das sagen auch Mathew Dryhurst und Holly Herndon gegenüber 1E9. Matt und Holly sind Digitalkünstler, befassen sich seit 2016 mit Künstlicher Intelligenz und haben gerade erst die Organisation Spawning gegründet, die Künstlern helfen soll, ihre Interessen zu vertreten und mit den Herausforderungen umzugehen, die lernende Maschinen für ihre Zukunft darstellen – und zwar, indem sie befähigt werden, sich mit solchen Werkzeugen vertraut zu machen, sie für ihre Zwecke einzusetzen.
Vor allem in einem kommerziellen Umfeld kann man die Rolle eines Künstlers nicht darauf eindampfen, platte Anweisungen in irgendwas Visuelles zu übersetzen.
Mathew Dryhurst und Holly Herndonch
Laut Dryhurst und Herndon sei „die Lage [mit Künstlern und KI-Generatoren] zu kompliziert“, um sie auf einen Satz wie im obigen Meme herunterzubrechen. Es sei mit der Technik zwar sehr einfach einzelne Motive und Ideen zu generieren. Aber oft werde einem Künstler deutlich mehr abverlangt als einfach nur ein Bild zu liefern. „Vor allem in einem kommerziellen Umfeld kann man die Rolle eines Künstlers nicht darauf eindampfen, platte Anweisungen in irgendwas Visuelles zu übersetzen“, sagt das Duo. Es gehe darum, die gewünschten Motive zu interpretieren, die Interpretationen zu iterieren, zu selektieren und zu verfeinern. „All das sind Dynamiken, die eine Rolle spielen“, sagen sie. „Dafür wird es weiterhin Künstler brauchen.“
Dem stimmt auch Vladimir Alexeev zu, ein Kulturwissenschaftler und Künstler, der unter dem Namen Merzmensch arbeitet. Er befasst sich seit über sieben Jahren mit Künstlicher Intelligenz als Kreativwerkzeug. Mit Deep Dream, Midjourney, DALL-E 2 und Stable Diffussion hat Alexeev bereits gearbeitet – auch, um damit ganze Kurzfilme zu erschaffen. „Insbesondere in der Design-Branche wird man auf menschliche Kraft nie verzichten“, bestärkt er. „Denn auch im Falle eines perfekten Prompt-Designs bedarf das Werk einer Nachbearbeitung und Feinjustierung [durch menschliche Künstler].“
Das Auge und der Geist seien sehr gut darin, vollkommen synthetische Medien zu erkennen, sagt Vladimir Alexeev. KI-Systeme seien deshalb sehr gut, um „Ideen, Blaupausen [zu liefern], beim Brainstorming und der Motivfindung [zu unterstützen]“, aber für das finale Werk brauche es immer noch das menschliche Empfinden für Ästhetik, Emotionen, Stil und Authentizität. „Denn am Ende sind Menschen die eigentliche Zielgruppe“, sagt der Künstler. Kreative würden nicht einfach arbeitslos werden. Alexeev geht eher davon aus, dass neue Berufe rund um die KI-Werkzeuge entstehen und sich traditionelle Tätigkeiten in der Kreativwirtschaft verändern.
KI-Kunst wird Teil der neuen Normalität
Auf jeden Fall ist der Geist aus der Flasche. Und er lässt sich nicht mehr hineinpressen. So beschreiben Holly Herndon und Mathew Dryhurst die Situation. Künstler müssten akzeptieren, dass KI-Systeme nun einmal da sind und genutzt werden. Sie müssten als Anlass gesehen werden, „eine Debatte darüber anzustoßen, wie sie die Kreativwirtschaft prägen“ und wie sich Künstler ihrer ermächtigen könnten – und vielleicht sogar sollten. Schließlich könnten Werkzeuge wie Text-to-Image-Generatoren durchaus gewinnbringend als Teil eines kreativen Schaffensprozesses eingesetzt werden.
Dryhurst und Herndon plädieren dafür, dass sich Künstler den Werkzeugen und Technologien annähern und aktiv mit ihnen auseinandersetzen. Insbesondere, wenn sie ihnen eigentlich kritisch gegenüberstehen. „Es ist gut für Künstler, so gut wie möglich über wichtige neue technologische Entwicklungen informiert zu sein“, sagen sie. Nur so ließen sich Ängste und Ungewissheiten abbauen. Sie sollten wissen, was möglich ist, sich darüber austauschen, – und auch erfahren, wo sich Grenzen und Machbarkeiten verschieben. Und vor allem: wo sich für sie selbst neue Möglichkeiten auftun. Holly Herndon hat etwa 2021 ihre Stimme als KI-Model digitalisiert und lizenziert diese seitdem über eine DAO.
Der Künstler Vladimir Alexeev sieht, dass sich manche Kreative bereits sehr bewusst in diese neuen Technologien hineinbewegen. „Sie trainieren KI-Systeme an eigenen Bildern und generieren neue Versionen davon“, nennt er als Beispiel – auch er selbst hat das getan. „Sie kreieren zusammen mit KI. Sie malen Bilder ab, die eine KI erstellt.“ Dadurch entstehe ein spannender Dialog zwischen Mensch und Maschine. Herndon und Dryhurst sehen in solchen Prozessen auch neue Optionen für künstlerische Kollaborationen. Indem Künstler ihre Mal- und Zeichenstile – oder auch ihre Stimmen – bewusst in ein Model für eine Künstliche Intelligenz speisen, könnten andere damit arbeiten und Werke schaffen, die sonst so nie möglich wären. Identity Play haben das Dryhurst und Herndon getauft. Sie wähnen darin „eine neue und faszinierende Dimension, Kunst zu erschaffen, […] die bislang ungeahnte Möglichkeitswelten aufstößt“.
Auch die Illustratorin Jenny sieht in diesen Anwendungsfällen durchaus eine potentielle Bereicherung. „Ich fände es schon spannend, wenn eine Künstliche Intelligenz meinen Stil lernt oder ich mit dem speziellen Stil eines anderen Künstlers arbeiten kann, den ich nicht beherrsche“, sagt sie. „Da könnte viel an Schönheit und Inspiration herumkommen […] und ich habe mir natürlich angesehen, was diese Tools können und habe Motive bekommen, die mich schon begeistern, auf die ich selbst nie gekommen wäre.“
Macht euer Ding, experimentiert, habt keine Angst vor neuen Technologien.
Vladimir Alexeev
Dryhurst und Herndon erachten die KI-Technologie, obwohl sie schon jetzt beeindruckende Resultate hervorbringt, noch als „Kleinkind in der Wiege“. Aber dieses wachse und entwickle sich rasant. Die Technik würde kreative Pfade auslegen, die noch niemand erahnen könne – auch daher sei es gut, jetzt schon dabei zu sein, Künstliche Intelligenz zu erfahren und zu erfassen. „Macht euer Ding, experimentiert, habt keine Angst vor neuen Technologien“, sagt auch Alexeev. „Denn wenn ihr sie kennt und beherrscht, dann werdet ihr verstehen, dass die dystopische Angst, von der Maschine dominiert zu werden, grundlos ist.“
Klauen KIs einfach Kunststile?
So optimistisch und offen Mathew Dryhurst und Holly Herndon der Künstlichen Intelligenz und der wachsenden Zahl an Text-to-Image-Generatoren gegenübersehen, sie sehen dennoch ein Problem. Eines, das menschengemacht ist und bereits von einigen Künstlern in Social-Media-Kanälen thematisiert wurde. Trainiert werden die KI-Werkzeuge wie DALL-E 2, Midjourney und Co. nämlich mit Abertausenden von Bildern, die aus dem Internet geladen werden. Darunter sind Fotos, Grafiken und Illustrationen aus speziell für das Training von KI-Modellen kuratierten Datasets wie ImageNet und aus freien Bilddatenbanken wie Unsplash. Aber es sind offenkundig auch unzählige Bilder, die von Instagram, Artstation und Flickr geladen werden – Orte, an denen Künstler ihre Werke mit der Welt teilen.
Aus diesem Grund sind insbesondere DALL-E 2, Midjourney und Stable Diffusion sehr gut darin, die Stile von zahlreichen Künstlern zu emulieren – oder sogar zu plagiieren, wie einige Kritiker unterstellen. Unter den Betroffenen sind der Mangaka Kentaro Miura und die Maler und Zeichnerinnen Gerald Brom, Ruan Jia, Greg Rutkowski, Lois van Baarle, Greg Hildebrandt, Simon Stålenhag und Jesper Ejsing. Und das, ohne jemals eingewilligt zu haben, dass KI mit ihren Werken trainiert wird. Ob das tatsächlich rechtswidrig ist, ist unsicher. Aber: „Als Künstler bin ich extrem besorgt“, schreibt beispielsweise der Grafiker RJ Palmer auf Twitter – und zahlreiche schließen sich ihm an. Denn es sei schon bezeichnend, wie akkurat einige der KI-Werkzeuge die Optik bestimmter Künstler replizieren – Signaturen in der Ecke der Bilder eingeschlossen. Er und andere fühlen sich dadurch bedroht und beraubt.
Dass das nicht der Status Quo sein darf, davon sind Holly Herndon und Mathew Dryhurst überzeugt. „Diese Bild-Generatoren sind noch nicht gut genug, um eine echte Gefahr darzustellen, aber gut genug, um eine Diskussion zu rechtfertigen“, sagen sie. „Angesichts der zukünftigen Entwicklungen, muss das Thema Trainings-Daten und Einwilligung [der Künstler] adressiert werden […], denn es kann in niemandes Interesse sein, ihre Rechte zu verletzen.“ Laut dem Duo sei das eine komplexe Herausforderung, die aber durchaus bewältigt werden kann. „Das Gute ist, dass es auch die Gelegenheit bietet, das Thema des geistigen Eigentums für neue Generationen zu verhandeln“, sagen sie. Das Problem: „Wir haben nicht viel Zeit.“
Mit der rasanten Entwicklung von Künstlicher Intelligenz wachse die Gefahr, dass Künstler die Kontrolle über ihren Stil verlieren. Daher fordern Mathew Dryhurst und Holly Herndon das Recht für Künstler, zu bestimmen, dass ihre Werke nicht ungefragt in Trainings-Datenpakete für Künstliche Intelligenzen einsortiert werden. „Wir brauchen ein Opt-out- und Opt-in-System für Künstler“, meinen sie. „Wir sind der Meinung, dass die Entscheidung [ob Bilder zum Training von KI genutzt werden] von den jeweiligen Künstlern getroffen werden sollten.“ Auch daher sollten Kreativarbeiter die Technologie kennen und nutzen lernen – eben um die Werkzeuge nutzen zu können, die es ihnen etwa erlauben könnten, ihren Stil selbst als Trainings-Datenpaket oder KI-Model zu erschaffen und zu lizenzieren. „Wir müssen ihnen diese Werkzeuge in die Hand geben“, so Mathew Dryhurst und Holly Herndon.
Meiner Meinung nach erstellt Künstliche Intelligenz keine Plagiate […]
Vladimir Alexeev
Etwas anders sieht das Vladimir Alexeev. „Meiner Meinung nach erstellt Künstliche Intelligenz keine Plagiate der angegebenen Künstler, sondern schafft neue Werke, in welchen der Stil, die Essenz und neue Vorgaben des Prompt-Designers zusammentreffen“, sagt er. „Unsere ganze Kunst- und Kulturwelt baut auf Referenzen, Stil-Nachahmungen, Intertextualität. Die Künstler lernen, indem sie andere Kunstwerke abpausen oder abmalen.“ Ganz ähnlich sei das bei einer Künstlichen Intelligenz. Dieser Ansicht sind auch einige betroffene und durchaus namhafte Künstler wie etwa Simon Stålenhag, der keinen Anlass für Rechtsstreits sieht.
Ganz unkritisch sieht Alexeev die Praxis, ohne Zustimmung das Material von Künstlern zu nutzen trotzdem nicht. Allerdings seien Lösungsansätze wie Lizenzen einzelner Künstler auch keine Lösung, weil sie zu umständlich und unpraktikabel wären. „Am machbarsten sehe ich eine Art Platform mit gemeinfreien Bildern und allen Künstlern die ihre Werke freiwillig zur Verfügung stellen“, sagt er. Künstler, die ihre Zeichnungen, Gemälde oder Fotos für KI-Trainings-Daten zur Verfügung stellen, könnten etwa eine Aufwandsentschädigung erhalten. „Das wäre nicht ideal“, sagt die Illustratorin Jenny zu einem solchen Ansatz, „aber es wäre besser, als wenn die Bilder einfach ungefragt genommen werden.“
Werde Mitglied von 1E9!
Hier geht’s um Technologien und Ideen, mit denen wir die Welt besser machen können. Du unterstützt konstruktiven Journalismus statt Streit und Probleme! Als 1E9-Mitglied bekommst du frühen Zugriff auf unsere Inhalte, exklusive Newsletter, Workshops und Events. Vor allem aber wirst du Teil einer Community von Zukunftsoptimisten, die viel voneinander lernen.
Jetzt Mitglied werden!Wird KI alles durcheinanderwirbeln?
Sicher ist, Künstliche Intelligenz, die Fotos, Grafiken, Malereien und auch Bewegtbilder erzeugt, ist da – und wird bleiben. Ob es wirklich Kunst ist, was die digitalen Prozesse hervorbringen, darüber herrscht alles andere als Einigkeit – wie ein Blick auf die Social-Media-Plattformen und Feuilletonberichte der letzten Monate verrät. „Kunst ist ein schwieriges Wort, weil es so viele Interpretationen davon gibt“, weichen Mathew Dryhurst und Holly Herndon einer klaren Antwort aus. Und Vladimir Alexeev meint, dass „das KI-generierte Werk an sich […] noch keine Kunst“ sei, aber durch einen Menschen zu Kunst werden könnte. „Es liegt an uns Menschen zu bestimmen“, meint er, „ob das vorliegende KI-Erzeugnis ein Kunstwerk ist oder nicht.“ Sei es auch nur, indem etwa ein KI-generiertes Bild wie das Werk eines echten Malers kuratiert wird oder auch nur jemand darin Kunst zu erkennen meint.
„KI verändert unser Verständnis von der Kunst und von der Wahrnehmung eines Kunstwerks“, sagt Vladimir Alexeev. Und mit Künstlicher Intelligenz in Form von Text-to-Image-Generatoren und ähnlichen Werkzeugen erwarte uns womöglich „eine neue Renaissance – die kreative Zusammenarbeit von Mensch und Maschine“. Und geht es nach Holly Herndon und Mathew Dryhurst könnte Künstliche Intelligenz unser komplettes Verständnis von Kunst und Kultur durcheinanderwirbeln; denn beides werde endgültig zu einem gewaltigen Mitmachspielplatz. „Wir werden neue und total fremde Archetypen von Künstlern sehen, die diese Werkzeuge vollkommen verinnerlicht haben“, sagen sie. Was gerade geschehe, manifestiere sich zwar in KI-Werkzeugen, die faszinierende und schöne Bilder produzieren, aber gehe eigentlich weit darüber hinaus. Es lasse sich nicht einmal im Ansatz prophezeien, was uns in den kommenden Dekaden erwartet.
Hat dir der Artikel gefallen? Dann freuen wir uns über deine Unterstützung! Werde Mitglied bei 1E9 oder folge uns bei Twitter, Facebook, Instagram oder LinkedIn und verbreite unsere Inhalte weiter. Danke!
Sprich mit Job, dem Bot!
War der Artikel hilfreich für dich? Hast du noch Fragen oder Anmerkungen? Ich freue mich, wenn du mir Feedback gibst!