Ein Start-up aus Israel erstellt mittels Künstlicher Intelligenz digitale Doppelgänger von Menschen. Die können dadurch in unendlich vielen Werbespots, Erklär- und Chatbot-Videos auftreten, ohne jedes Mal vor der Kamera zu stehen. Das Unternehmen sucht derzeit Models – und verspricht Geld für jedes Video, in dem das synthetische Abbild auftritt.
Von Michael Förtsch
Stell dir vor, du könntest allgegenwärtig sein, Millionen von Menschen bei ihren alltäglichen Problemen helfen, ihnen Tipps und Ratschläge geben. Du könntest auf ihrem Smartphone, ihrem Laptop oder Fernseher auftauchen und ihnen erklären, wie die neu gekaufte Spielkonsole installiert wird, ihnen bei der Vorbereitung auf eine Prüfung helfen oder sogar ein Einstellungsgespräch mit ihnen führen. Zumindest laut dem israelisch Start-up Hour One könnte diese zunächst skurrile Vorstellung durchaus Wirklichkeit werden. Woran das derzeit acht Köpfe starke Team aus Tel Aviv arbeitet, das ist nämlich, digitale Doppelgänger von echten Menschen zu erschaffen. Oder zumindest Abbilder von deren Körpern, die nicht von echten Menschen unterscheidbar sein sollen.
„Die Idee kommt von der Vision, dass irgendwann in der Zukunft jeder einen digitalen Zwilling von sich selbst haben könnte“, sagt Natalie Monbiot von Hour One zu 1E9. „Also eine digitale Version des eigenen Ichs, die dich in der digitalen Sphäre vertritt.“ Genau daran haben Oren Aharon and Lior Hakim, die Gründer von Hour One, vor rund zwei Jahren geforscht. Allerdings arbeiteten sie nicht mit 3D-Scannern, um die digitalen Körper zu erschaffen, wie es beispielsweise bei Will Smith für den Film Gemini Man geschehen war. Sondern sie wollten dafür eine Künstliche Intelligenz nutzen, die das Aussehen eines Menschen einfach selbstständig erlernt.
„Sie glaubten, damit ließe sich das Uncanny Valley überwinden“, sagt Monbiot. Gemeint ist damit der Effekt, den digital erzeugte Charaktere auslösen, die einem Menschen nachgebildet sind. Kommen sie ihm sehr nahe, sorgt das dafür, dass kleine Fehler unbewusst besonders stark wahrgenommen werden und die Nachbildung „unheimlich“ wirken lassen. Das sind oft Unstimmigkeiten in der Mimik. Beispielsweise, wenn sich beim Sprechen keine Falten zeigen, die Muskeln unter der Haut nicht richtig spannen, nicht mit dem ganzen Gesicht gelacht wird, die Augen zu still stehen oder ins Leere schauen. Dass KI-generierte Gesichter diese Probleme weniger haben und dadurch natürlicher wirklich als auf Scans basierte 3D-modellierte Gesichter, demonstriert Hour One mit Demovideos auf seiner Website.
Deepfake-Technik, aber keine Deepfakes?
Die KI-Technologie, die die Entwickler von Hour One einsetzen, ist an sich nicht neu oder besonders. Sie hat sogar schon für Aufsehen und Skandale gesorgt. Denn das Grundprinzip ist das gleiche wie bei Deepfakes. Dabei lernt ein KI-System etwa auf Basis von Abertausenden von Bildern das Gesicht eines Menschen und erzeugt ein Model, mit dem das Gesicht in einem Video gegen das gelernte Gesicht ausgetauscht werden kann. Passend zur Mimik im Original. Bei Hour One lernen sogenannte Generative Adversarial Networks, also KI-Systeme, die aus zwei neuronalen Netzen besteht, jedoch nicht nur ein Gesicht, sondern gleich einen ganzen Körper. Ein neuronales Netz versucht hierbei eine Kopie des Menschen anzufertigen. Ein anderes Netz arbeitet dagegen. Es versucht Fehler zu finden. Beide Netze fordern sich quasi heraus. Dadurch wird die digitale Kopie immer detailreicher und besser. Das ist ein aufwendiger und rechenintensiver Prozess, der daher von für KI-Einsätze ausgelegten Computern in der Cloud durchgeführt wird.
„Es gibt eine große Gemeinsamkeit“, sagt Natalie Monbiot über die Deepfake-Technologie. Aber dennoch möchte sie das, was Hour One tut, nicht als Deepfakes verstanden wissen. Denn Deepfakes wären zum Synonym für manipulierte Videos geworden – damit hat Hour One nichts zu schaffen. Daher sage man lieber, dass man bei dem Start-up „digitale Zwillinge“ erzeuge, die in „synthetischen Medieninhalten“ eingesetzt werden. Und natürlich arbeitet das Team bei Hour One etwas professioneller als die Deepfake-Künstler: Statt Prominentenvideos von YouTube und sozialen Netzwerken zu laden, lädt das Start-up die Klon-Kandidaten in sein Studio in Tel-Aviv ein oder organisiert vor Ort ein Studio und einen Kameramann, der dann das Bildmaterial liefert, von dem die Künstliche Intelligenz lernt.
Gespeichert werden die gelernten Menschen dann auf einer Server-Infrastruktur. Dort können sie mit einer eigens entwickelten Software dazu gebracht werden, sich zu bewegen und zu sagen, was die Kunden wollen. Die Stimme kommt dabei ebenso aus dem Computer – per Sprachsynthese, wie bei Audio-Deepfakes. Dabei ist es meist nicht die Originalstimme des Models, sondern eines professionellen Sprechers – wobei auch erstere geklont werden könnte. „Wir können Texte in fast jeder Sprache verwenden und den Charakteren wieder Leben einhauchen“, sagt die Hour-One-Mitarbeiterin. „Auf diese Weise kann ein einzelner Charakter theoretisch Tausende von Texten aufsagen und mit Menschen rund um die Welt interagieren.“
Das ist für Hour One nicht mehr nur Theorie, sondern bereits Praxis. „Heute schon replizieren wir Menschen und bestimmte Talente überall auf der Welt“, sagt Natalie Monbiot. Es seien bereits zahlreiche Personen aus Israel, den USA, China und Russland digitalisiert worden. Ebenso seien bereits Tausende kleine Videos für Werbeclips, lebende Chatbots, E-Learning- und Wellness-Angebote erstellt worden. Einige Stunden dauere jeweils die Berechnung. Geht es nach Hour One, könnten diese digitalen Figuren bald zum Alltag gehören. „Ja, ich denke, sie werden irgendwann zum Leben dazu gehören und uns helfen, Probleme zu lösen“, sagt Natalie Monbiot überzeugt. Ganz so, wie sich die Künstliche Intelligenz in alle Bestandteile des Lebens schleicht, ohne, dass es heute noch besonders auffallen würde.
Wer will einen Doppelgänger?
Um die digitalen Avatare zu erstellen, braucht es natürlich Freiwillige, die sich verewigen lassen. Und da kann sich derzeit tatsächlich jeder bei der israelischen Firma bewerben – und, wer angenommen wird, kann mit dem eigenen digitalen Abbild auch Geld verdienen. Wird die Bewerbung akzeptiert, organisiert Hour One ein Shooting mit einem Kameramann in einem Studio in der Nähe. „Es braucht dafür kein spezielles Equipment“, sagt Natalie Monbiot. Es müsse nur genügend Bildmaterial angefertigt werden – also Videoaufnahmen aus allen Winkeln, möglichst viele und verschiedene Gesichtsausdrücke. Meist würden 15 Minuten an Video genügen. Den Rest erledige die Künstliche Intelligenz.
Werde jetzt Mitglied von 1E9!
Als Mitglied unterstützt Du unabhängigen, zukunftsgerichteten Tech-Journalismus, der für und mit einer Community aus Idealisten, Gründerinnen, Nerds, Wissenschaftlerinnen und Kreativen entsteht. Außerdem erhältst Du vollen Zugang zur 1E9-Community, exklusive Newsletter und kannst bei 1E9-Events dabei sein. Schon ab 3 Euro (+ MwSt) im Monat!
Jetzt Mitglied werden!„Wenn du dann von einem oder mehreren unserer Kunden als Charakter ausgewählt wirst, erhältst du für jedes Video Geld“, sagt Natalie Monbiot. Wie viel, das könne nicht pauschal gesagt werden. Dazu verspricht Hour One sicherzustellen, dass die digitalen Avatare nicht für grenzwertige oder illegale Anwendungen eingesetzt werden. Ebenso können die Models festlegen, ob sie für bestimmte Produkte oder Medienbereiche nicht genutzt werden wollen. Will etwa jemand nicht in einem Video für Fleischprodukte oder Homöopathie werben, dann sei das kein Problem. „In Fällen von bestimmten Personen, beispielsweise Berühmtheiten“, sagt Monbiot, „kann es natürlich sein, dass nur sie selbst ihren Avatar einsetzten dürfen.“
Dass die digitalen Doppelgänger einigen Menschen durchaus unheimlich erscheinen, dass können die Entwickler bei Hour One nachvollziehen. „Wir wollen nicht vorgeben, dass die Videos echt sind – beziehungsweise die Personen, die da sprechen“, sagt Monbiot. Die Zuschauer hätten ein Recht darauf zu wissen, was sie sehen – weshalb das Unternehmen selbst seine Videos mit einem „Altered Visuals“-Vermerk beschriftet. Ebenso empfiehlt Hour One seinen Kunden, dass sich der digitale Avatar mit einem „Hallo, ich bin ein KI-Assistent…“ oder ähnlichem vorstelle. Letztlich, glaubt Monbiot, wären das alles Themen, die in einer öffentlichen Debatte besprochen werden sollten: „Ich denke, es liegt an uns als Gesellschaft, zu entscheiden, wie und wohin sich all das entwickelt.“
Teaser-Bild: Hour One