Statt nur glaubhafter Gesichter können Künstliche Intelligenzen nun ganze Menschen samt Kleidung und Friseur erdenken. Damit will ein japanisches Unternehmen zukünftig Fotoshooting für Modemarken überflüssig machen.
Von Michael Förtsch
Dass Künstliche Intelligenzen realistische Gesichter generieren können, ist nicht mehr sonderlich neu. Zuletzt wurde die Website thispersondoesnotexist.com Tausende Male auf Facebook, Twitter und anderen Sozialen Netzwerken geteilt – und hat dabei nicht wenige verstört. Der Entwickler Phillip Wang hatte sie auf ein Generative Adversarial Network aufgebaut, das bei jedem Besuch ein neues Gesicht erdenkt . (Wie das funktioniert, erklären wir am Ende des Artikels)
Das japanische Unternehmen DataGrid, eine Ausgründung der Kyoto University, hat nun wiederum eine Künstliche Intelligenz geschaffen, die komplette Models samt Gesicht, Körper, Frisur und sogar Klamotten generieren kann – typische Posen inklusive. Ein kurzes Video, das DataGrid veröffentlicht hat, ist durchaus überaus beeindruckend. Es zeigt, wie aus scheinbar professionell abgelichteten Models stetig neue Personen aller möglichen Ethnien und mit verschiedensten Kleidungsstücken entstehen, die so gut und gerne auf einer Shopping-Website wie der von H&M oder Zalando zusehen sein könnten.
Genau dafür, erklärt DataGrid in einer Pressemitteilung, sei die Technologie auch gedacht: „Wir erwarten, dass die automatisierte Generierung von Ganzkörper-KI-Models in der Werbung und Kleidungsindustrie eine Verwendung finden wird.“ Damit könnten sich vor allem große Modeketten mit schnellen Produkt- und Kollektionszyklen zukünftig teure Foto-Shootings und Castings sparen. Erste Unternehmen, die das austesten wollen, hat DataGrid angeblich auch schon gefunden.
So funktionieren Generative Adversarial Networks
Wie auch thispersondoesnotexist.com setzt DataGrid dafür auf eine Technologie namens GAN – Generative Adversarial Networks. Dabei handelt es sich um zwei verschaltete Künstliche Neuronale Netze, ein Generator und ein Diskriminator, die mit unzähligen Beispielbildern dessen gefüttert werden, was sie erschaffen sollen. Eines der beiden Netze generiert die künstlichen Personen. Das andere Netz versucht sie anhand von Fehlern und Ungereimtheiten zu disqualifizieren.
Durch die Konkurrenz der beiden Netze entsteht ein Wettbewerb und gegenseitig befeuerter Lernprozess, der theoretisch zu einer steten Evolution der beiden Netze und damit der erzeugten Bilder führen kann. Die gleiche Technologie wird auch schon genutzt, um aus Videos dreidimensionale Umgebungen zu generieren oder die Grafiken alter Videospiele aufzufrischen. Auch die Künstliche Intelligenz deren Portrait of Edmond Belamy auf einer Auktion für 432.500 US-Dollar versteigert worden war, ist ein GAN.