Hier könnt ihr nachschauen, ob mit euren Fotos Künstliche Intelligenzen trainiert werden

Es sind Milliarden von Bildern, mit denen die Künstliche-Intelligenz-Systeme von Kunstgeneratoren wie Midjourney, DALL-E 2 und Stable Diffusion trainiert werden. Viele Menschen wissen nicht einmal, dass ihre Fotos, Grafiken und Malereien dafür genutzt werden. Jetzt gibt es eine Suchmaschine, mit der ihr nachschauen könnt.

Von Michael Förtsch

Derzeit sorgen Text-zu-Bild-Generatoren wie Midjourney, DALL-E 2 und Stable Diffusion für viel Aufruhr. Denn sie erlauben es, mit einfachen Texteingaben zuweilen beeindruckende Bilderwelten zu erschaffen – die teils nicht von den Werken eines menschlichen Künstlers zu unterscheiden sind. Nicht wenige Plattformen für Kunst und Stockfotografien haben bereits Bedenken angemeldet oder KI-Kunst explizit verboten. Darunter zuletzt die kommerziellen Bilddatenbanken Getty und iStock. Teil ihrer Begründung ist auch die rechtlich unklare Lage, was die erzeugten Bilder betrifft. Denn es ist in vielen Ländern noch unsicher, wer das Urheberrecht an so einem Bild besitzt – insbesondere, wenn dabei explizit der Stil eines Künstlers imitiert wird.

Dass das überhaupt möglich ist, liegt daran, dass derartige Künstliche-Intelligenz-Systeme mit Fotografien, Grafiken, Gemälden und Skizzen echter Künstler trainiert werden. Diese sogenannten Datasets umfassen Hunderte von Millionen bis zu Milliarden an Dateien, die aus freien Bilddatenbanken gezogen werden. Aber wie sich zeigte, umfasst etwa das Dataset LAION, das unter anderem für das Training von Stable Diffusion genutzt wurde, offenbar auch Bilder, die eigentlich urheberrechtlich geschützt sind und nicht für solche Zwecke freigegeben wurden. Beispielsweise Fotos und Grafiken von Flickr, Instagram, Artstation und mehr.

„Angesichts der zukünftigen Entwicklungen, muss das Thema Trainings-Daten und Einwilligung [der Künstler] adressiert werden“, sagten die beiden Künstler Holly Herndon und Mathew Dryhurst gegenüber 1E9, die mit Spawning ein Projekt gestartet haben, das Künstlern beim Umgang mit Künstlicher Intelligenz helfen soll. „Es kann in niemandes Interesse sein, ihre Rechte zu verletzen.“

Um herauszufinden, ob Rechte verletzt werden, haben Holly Herndon und Mathew Dryhurst nun eine Suchmaschine namens Have I been trained gestartet, die im 5,8 Milliarden Bilder umfassenden LAION nach Schlagworten aber auch konkreten Bildern suchen kann. Beispielsweise nach dem eigenen Gesicht, eigenen Fotos oder Malereien.

Unklare Herkunft

Der Autor dieses Artikels hat gleich mehrere Fotografien entdeckt, die er etwa via einer Creative-Commons- oder GNU-Lizenz frei nutzbar gemacht hat. Ebenso fand er Fotos, die eigentlich urheberrechtlich geschützt und nicht für eine solche Verwendung freigegeben sind – etwa Fotos, die nur für die Verwendung in Artikeln genutzt oder auf Flickr veröffentlicht wurden.

Laut einem Bericht von ArsTechnica fand eine KI-Künstlerin bei einer Suche auch Bilder von sich selbst. Jedoch welche, die von ihr von einem Arzt nach einer Behandlung angefertigt wurden. Diese Fotos waren zu keinerlei Nutzung abseits der Ablage in ihre Krankenakte freigegeben. Der zuständige Arzt soll bereits vor mehreren Jahren verstorben sein. Daher mutmaßt die Künstlerin, die im Netz als Lapine auftritt, dass die Bilder nach der Auflösung der Praxis „im Internet verramscht“ wurden und diese dadurch in den Trainingssatz gelangten.

Werde Mitglied von 1E9!

Hier geht’s um Technologien und Ideen, mit denen wir die Welt besser machen können. Du unterstützt konstruktiven Journalismus statt Streit und Probleme! Als 1E9-Mitglied bekommst du frühen Zugriff auf unsere Inhalte, exklusive Newsletter, Workshops und Events. Vor allem aber wirst du Teil einer Community von Zukunftsoptimisten, die viel voneinander lernen.

Jetzt Mitglied werden!

Ob und wer für die Fotos im Dataset verantwortlich oder sogar haftbar ist, ist schwer zu sagen. Denn die Projektbetreiber von LAION kuratieren keine Datenbank mit sämtlichen Bildern auf einem Server. Stattdessen handelt es sich um eine Datenbank, die lediglich die Links zu den Milliarden an Bildern im Internet umfasst. Möchte jemand das Dataset nutzen, werden die Fotos einzeln heruntergeladen.

Hat dir der Artikel gefallen? Dann freuen wir uns über deine Unterstützung! Werde Mitglied bei 1E9 oder folge uns bei Twitter, Facebook, Instagram oder LinkedIn und verbreite unsere Inhalte weiter. Danke!

Sprich mit Job, dem Bot!

Job, der Bot

War der Artikel hilfreich für dich? Hast du noch Fragen oder Anmerkungen? Ich freue mich, wenn du mir Feedback gibst!

3 „Gefällt mir“