Eine Künstlergruppe will eine Bild-KI vollständig mit gemeinfreien Bildern trainieren

Die von Künstlern und KI-Profis ins Leben gerufene Initiative Spawning will ein eigenes Text-zu-Bild-Modell entwickeln. Im Gegensatz zu anderen Bild-Generatoren soll dieses jedoch vollständig mit urheberrechtsfreien Inhalten trainiert werden. Damit sollen ethische und urheberrechtliche Bedenken vollständig ausgeräumt werden.

Von Michael Förtsch

Es ist beeindruckend, welch realistische, kunstvolle und verblüffend komplexe Bilder mit heutigen KI-Modellen erzeugt werden können. Erst im Oktober hat das in Deutschland ansässige Team von Black Forest Labs mit Flux 1 eine neue Bild-KI vorgestellt, die zum Teil erschreckend lebensechte Fotos generieren und zuverlässig menschliche Hände zeichnen kann. Außerdem hat OpenAI-Chef Sam Altman gerade erst eine neue Version des in ChatGPT integrierten Bildgenerators DALL-E angedeutet. So spaßig und nützlich die Bild-Generatoren sind, sie stehen aber auch immer wieder in der Kritik. Denn um sie zu trainieren, werden Milliarden von Grafiken, Fotos und Malereien aus dem Internet verwendet – ohne die Urheber zu fragen oder zu entschädigen.

Aber könnte es auch anders gehen? Genau das will das Team hinter der Künstler- und KI-Initiative Spawning herausfinden. Es hat bereits Datensätze, die für das Training des Text-zu-Bild-Generators Stable Diffusion verwendet wurden, durchsuchbar gemacht und mit SourcePlus eine Plattform für die Erstellung von vollständig lizenzfreien Datensätzen gestartet. Mit PD12M hat das Team dort gerade eine Sammlung von 12 Millionen hochauflösenden und besonders ästhetischen Bildern veröffentlicht, die speziell für das Training von modernen Bild-KI-Modellen kuratiert wurden. Das Team habe mehrere Monate daran gearbeitet, sagt Mathew Dryhurst von Spawning.

Tatsächlich will Spawning nun sein eigenes Text-zu-Bild-Modell aufbauen. Ein Modell, das im Gegensatz zu Midjourney, Stable Diffusion, Flux, DALL-E und anderen vollständig auf freien Bildern basieren soll, die keine Urheberrechte, Lizenzen oder andere Nutzungsrechte verletzen. „Seit den Anfängen von Spawning haben wir über die Möglichkeit gesprochen, gemeinfreie Modelle zu trainieren“, sagt Dryhurst. Doch erst vor Kurzem sei das dank sinkender Preise für Rechenleistung, Speicher und andere technische Voraussetzungen für eine freie Initiative wie Spawning praktikabel geworden.

Millionen freie Bilder

In die Planung des Projekts, das derzeit unter dem Namen Public Diffusion läuft, sollen bereits mehrere Monate investiert worden sein. Mit dem Training des Modells könne daher bereits in diesem Monat begonnen werden. Doch trotz der langen Vorplanung sei eine der großen Herausforderungen für das Team „das Sammeln der Daten und die Anreicherung dieser Daten“ für das Training gewesen. Denn bei der Zusammenstellung eines Dataset für ein solches KI-System komme es nicht nur auf die Qualität, sondern auch auf die Vielfalt des Trainingsmaterials an.

„Wir werden mehr als 37 Millionen Bilder verwenden, die wir beschaffen konnten“, sagt Dryhurst. Darunter natürlich viel Material von Source Plus. Die Hauptverantwortlichen Jordan Meyer und Nicholas Padgett hätten sich aber auch „ein paar Tricks“ einfallen lassen, um die Diversität des Datensatzes zu erhöhen und ihn so mit zusätzlichen Inhalten auszupolstern. Zum Beispiel mit synthetischen – also KI-generierten – Daten und Segmentierungen, bei denen einzelne, oft hochauflösende Bilder und deren Inhalte noch einmal unterteilt und als Einzelbilder hinzugefügt werden.

Erstes Modell soll noch 2024 fertig werden

Auf welche KI-Architektur Public Diffusion setzen wird, mag Dryhurst noch nicht sagen, da das Team hier experimentieren wolle. „Wir wollen verschiedene Ansätze ausprobieren, um zu sehen, welcher Ansatz die besten Ergebnisse liefert“, sagt er. „Aber vielleicht ist es richtiger zu sagen, dass es wahrscheinlich mehrere Modelle geben wird, die denselben Datensatz mit unterschiedlichen Architekturen verwenden.“

Für die Umsetzung des ehrgeizigen Vorhabens will Spawning auch auf technische und finanzielle Hilfe von Partner zurückgreifen. Unter anderem, weil das Training voraussichtlich mehrere Millionen Euro kosten könnte. Während Spawning selbst über KI-Experten und einige finanzielle Mittel verfügt, hat die Initiative Kooperationen organisiert, die sowohl Rechenleistung als auch Fachwissen in das Projekt einbringen werden. „Es gibt viele Partner, denen die Idee gefällt, zu einem öffentlichen Modell beizutragen“, sagt Dryhurst. So könne man die die Chancen erhöhen, das bestmögliche Ergebnis zu erzielen.

Werde Mitglied von 1E9!

Hier geht’s um Technologien und Ideen, mit denen wir die Welt besser machen können. Du unterstützt konstruktiven Journalismus statt Streit und Probleme! Als 1E9-Mitglied bekommst du frühen Zugriff auf unsere Inhalte, exklusive Newsletter, Workshops und Events. Vor allem aber wirst du Teil einer Community von Zukunftsoptimisten, die viel voneinander lernen.

Jetzt Mitglied werden!

Die Hoffnung von Spawning ist, dass bereits Ende dieses Jahres ein Vorabmodell von Public Diffusion nutzbar und für einen kleinen Nutzerkreis freigegeben werden kann. Das finale Modell soll dann im nächsten Jahr veröffentlicht werden – und zwar „bedingungslos quelloffen“. „Unser Ziel ist es einfach zu zeigen, dass unser Ansatz ein leistungsfähiges Modell hervorbringen kann – und dass dieser Ansatz skalierbar ist“, sagt Dryhurst. Es gehe der Initiative auch darum, die Vorteile der Technologie und der Modelle nutzbar zu machen, ohne dass ethische Bedenken bestehen oder die Künstler drohen, in Streitigkeiten über Urheberrechte und geistiges Eigentum verwickelt werden.

Ebenso sollen Modelle wie Public Diffusion es Künstlern, Unternehmen und anderen Einrichtungen ermöglichen, diese als „saubere Basismodelle“ für eigene dedizierte Modelle zu nutzen – sie also mit eigenen Inhalten zu tunen, um sie für eigene Projekte zu nutzen oder für andere zu veröffentlichen, „ohne Angst vor Haftung oder Rückschlägen“. „Wir glauben, dass wir damit einen wichtigen Beitrag zur Diskussion in den Bereichen Kunst, Technologie und Regulierung leisten können, wenn wir dies zeigen können“.

Hat dir der Artikel gefallen? Dann freuen wir uns über deine Unterstützung! Werde Mitglied bei 1E9 oder folge uns bei Twitter, Facebook, Instagram oder LinkedIn und verbreite unsere Inhalte weiter. Danke!

Sprich mit Job, dem Bot!

Job, der Bot

War der Artikel hilfreich für dich? Hast du noch Fragen oder Anmerkungen? Ich freue mich, wenn du mir Feedback gibst!