Warum Künstliche Intelligenzen (noch) keine erfolgreichen Stand-Up-Comedians werden können

Adriano · 8. Mai 2021 um 06:08

Automatisiert KI jetzt auch die Jobs von Comedians weg? Zusammen mit Jonas Imam, einer Größe der Berliner Stand-Up-Comedy-Szene, und dem Computerlinguisten Tristan Miller gehen wir der Frage auf den Grund, ob eine Künstliche Intelligenz genauso gut wie „echte“ Stand-Up-Comedians sein kann.

Von Adriano D’Adamo

„Kenne ich schon.“ „Nicht witzig.“ „Selbst ein Affe mit einer Schreibmaschine kann das besser“ Solche Kritik gehört für Stand-Up-Comedians schon immer dazu. Bald könnte einer dieser abfälligen Sätze auch so lauten: „Das kann sogar ein Computer besser.“ Roboter und Künstliche Intelligenz machen schließlich ständig Fortschritte. Wieso sollte sie nicht auch Humor können?

Die amerikanische Robotik-Wissenschaftlerin Heather Knight tourte bereits 2011 mit ihrem Roboter DATA durch amerikanische Comedy Clubs, um die Interaktion zwischen Maschine und Menschen zu erforschen. Dabei performte DATA auf der Bühne – Heather war nur das Rahmenprogramm. Die von Menschen geschriebenen Witze, die DATA mit ein paar Metadaten versehen in seinem Kopf gespeichert hatte, waren recht simpel. Hier ein Beispiel:

Ein Arzt sagt zu seinem Patienten: „Ich habe eine schlechte und eine noch schlechtere Nachricht für Sie. Die schlechte Nachricht ist, dass Sie nur noch 24 Stunden zu leben haben.“ „Das ist ja schrecklich“, antwortet der Patient. „Wie kann die andere Nachricht noch schlechter sein?“ „Ich versuche seit gestern, Sie zu erreichen.“

DATA konnte also keine eigenen Witze generieren und vortragen – doch darum ging es bei dem Experiment auch gar nicht. Er sollte herausfinden, wie das Publikum auf seine Gags reagiert, um mit diesem Wissen ein besseres Programm zu gestalten. Dafür erfasste er, wann gelacht wurde und wann nicht, und wie viele Zuschauer grüne oder rote Karten hochhielten. So konnte DATA durch seine Comedy-Auftritte erfahren, was die sozialen Normen und Regeln des Humors sind und wie er sie für ein erfolgreiches Programm einsetzen kann.

Sogar einen TED-Talk durften Heather Knight und DATA halten.

Für Heather Knight sind Comedians auch deshalb besonders gute Lehrer, weil sie wissen, wie sie ihr Gegenüber lesen können. Doch das ist nur eine Fähigkeit, die man für guten Live-Humor braucht, wie wir gleich herausfinden werden.

Von regelbasierten Systemen zu Machine Learning

Wie gut Künstliche Intelligenz und Roboter heute Stand-Up-Comedy können, klären wir mit Tristan Miller, einem Computerlinguisten vom österreichischen Forschungsinstitut für Artificial Intelligence, der sich mit Humor beschäftigt. Und mit Jonas Imam, der selbst Stand-Up-Comedian sowie Moderator der Comedy-Show KussKuss Digital und des Comedy-Podcasts Verprügelt mit Punchlines ist.

Wie eine Maschine überhaupt lernt, witzig zu sein, erklärt Tristan Miller. Früher habe man dafür mit regelbasierten Systemen gearbeitet, bei denen – vereinfacht gesagt – die Programmierer:innen vorgaben, wie Humor im Prinzip funktioniert. Mit den Bausteinen in der eigenen Datenbank konnte Software dann Witze generieren. Aber eben nur nach den festgelegten Regeln, was das Comedy-Potential stark limitierte. Inzwischen läuft es anders.

„Du gibst dem Computer sehr viel Übungsmaterial und sagst ihm, was davon lustig ist und was nicht, damit er selber lernt, es automatisch zu unterscheiden“, beschreibt Miller den neuen Ansatz: Machine Learnig. Dabei kann die KI selbst und umfassender lernen, wie Humor funktioniert – und dann selbst „kreativ“ werden. Allerdings gibt es weiterhin eine klare Einschränkung: Weil Machine Learning auf Daten der Vergangenheit setzt, fällt es dem Programm schwer, das Publikum mit völlig neuen Ideen zu überraschen. Sowohl für Tristan Miller als auch für Jonas Imam sind Überraschungen und das Brechen der Erwartungen aber ein integraler Bestandteil von Humor.

Unzählige Comedians, unzählige Arten von Humor

Es gibt keine richtige oder einheitliche Antwort darauf, was ein Comedian tun muss, um erfolgreich zu sein. Vergleichen wir zum Beispiel die beiden sehr erfolgreichen Stand-Up-Comedians Gabriel „Fluffy“ Iglesias und Bert Kreischer. Fluffy erzählt auf der Bühne längere Geschichten, die sich größtenteils um ihn selber drehen und vermischt sie immer wieder mit dem Thema Culture Clash. Bei seinen Geschichten gibt es keine klar definierte Pointe, sondern ständig witzige Stellen, über die das Publikum lacht. Bert Kreischer hingegen erzählt – oberkörperfrei –kurze Stories, auch Bits genannt, mit eindeutigen Höhepunkten am Schluss. Meist erzählt er, was für ein schlechter Vater er ist und wie dumm seine Kinder doch sind. Durch sein Timing und seine Stimmlage signalisiert er dem Publikum, dass sie jetzt lachen können und sollen.

Ein Programm von Gabriel „Fluffy“ Iglesias

Zwei sehr unterschiedliche Herangehensweisen. Zwei von unzählig vielen. Deswegen haben wir Jonas Imam gefragt, was er davon hält, wenn eine KI versucht, Humor zu lernen, indem sie viele verschiedene Comedians anschaut, die alle einen eigenen Sinn für Humor haben. „Das Durchmischen dieser ganzen unterschiedlichen Comedians ist glaube ich ein Fehler, um einer KI Humor beizubringen. Einfach deshalb, weil sie teilweise komplett konträr arbeiten“, sagt er. Doch auch wenn Comedians verschiedene Stile haben, so lassen sie sich aus seiner Sicht doch gruppieren und in Genres aufteilen. Vielleich wäre es also besser, einer KI erst eine Gruppe oder ein Genre von Comedians zu zeigen

Selbst wenn eine Künstliche Intelligenz auf dieser Art Humor besser „verstehen“ und einen passablen Text für ein eigenes Comedy-Programm auf die Beine stellen könnte, bleibt natürlich die Frage, ob das Publikum einen Rechner oder Roboter auf der Bühne gerne sehen oder überhaupt akzeptieren würde.

Jonas Imam während einer Show, die wegen Corona nur digital übertragen wurde. Auf dem Bildschirm neben ihm ist Ingrid Wenzel zu sehen, ebenfalls Comedian. Quelle: Jonas Imam

Jonas Imam während einer Show, die wegen Corona nur digital übertragen wurde. Auf dem Bildschirm neben ihm ist Ingrid Wenzel zu sehen, ebenfalls Comedian. Quelle: Jonas Imam

Jonas Imam tritt mit seiner Streaming-Comedy-Show Kusskuss Digital derzeit zwar auch „nur“ auf den Bildschirmen seiner Zuschauer:innen auf, kann sich aber nicht vorstellen, dass sich die Leute nach Corona oft einen Comedian in einer Location ansehen wollen, der selbst ein Bildschirm ist. „Leute könnten sich darauf einlassen, aber nur weil es eine KI ist und sie sehen wollen, wie eine KI sowas performt. Aber das hat dann eher diesen Neuigkeitsfaktor und nicht so sehr eine verbindende Funktion. Warum dann überhaupt im Publikum sein? Warum dann nicht einfach zuhause auf der Couch liegen und sich das Programm angucken?“, fasst Imam die fehlenden Gründe zusammen, zum Auftritt einer KI zu gehen.

Leblos? Authentisch? Witzig?

Zu einem erfolgreichen Stand-Up-Comedy-Auftritt gehört eben mehr als nur ein gutes Skript oder Set. Jonas Imam machte damit selbst seine Erfahrungen. Mimik, Gestik, Körperhaltung und Stimme. Alles Faktoren, die für ihn wichtig sind – und die er noch nicht in ausreichender Qualität bei einem Computer und auch nicht bei einem KI-gesteuerten Roboter sieht. „Die KI muss die Feinheiten alle kennen, zum Beispiel mit den Augen lächeln. Menschen erkennen daran ein authentisches Lächeln. Ohne Augen ist es nicht authentisch“, sagt Imam – und ergänzt, dass es für manche Witze trotzdem wichtig sein kann, dass der Comedian nicht authentisch lacht, um es sarkastischer wirken zu lassen. Ein generelles Ausschlusskriterium für Künstliche Intelligenzen oder generell performende Maschinen sei das allerdings nicht, lediglich ein Stolperstein, fügt er noch hinzu.

Einiges spricht nämlich dafür, dass es nicht unbedingt eine ausgefeilte Mimik braucht. Der Stand-Up-Comedian Jeff Dunham ist bei seinen Auftritten jedenfalls nicht alleine. Er performt mit seinen Bauchredner-Puppen. Die Puppen haben einen beweglichen Mund, Arme und je nach Figur andere Features. Durch die verschiedenen Stimmen kann Dunham ihnen einen Charakter verleihen und führt auf der Bühne einen sehr witzigen Dialog mit Figuren wie dem verbitterten Senioren Walter oder dem merkwürdigen und hyperaktiven Wesen Peanut. Obwohl es „nur“ Puppen ohne Mimik sind, finden es viele Menschen unterhaltsam und witzig. Dunham zählte Ende der 2000er und Anfang der 2010er Jahre zu den Top-Stand-Up-Comedians. Wenn Menschen also schon vor Jahren über Puppen mit einer Hand im Hintern lachen konnten, können sie in Zukunft vielleicht auch über Roboter lachen, die alleine auf der Bühne stehen.

Jeff Dunham mit seiner Puppe Peanut.

Wie der Performer auf der Bühne aussieht, ist also nicht ausschlaggebend. Mensch, Handpuppe oder auch Roboter: Jeder hat das Potential, eine gute Show abzuliefern. Es ist aber wichtig, was jemand sagt und wie es gesagt wird. Hier hat eine Puppe mit menschlicher Bauchrednerstimme klare Vorteile. Die synthetischen Stimmen, welche Sprachassistenten wie Alexa oder Siri nutzen, besitzen weniger Stimmlagen und ermöglichen es deswegen meistens nur das Reden in einer sehr monotonen Art. Der Computerlinguist Tristan Miller hebt hervor, dass Menschen grundsätzlich nicht gut auf eine monotone Stimmlage reagieren. Denn wenn jemand nur monoton spreche, könne das Gegenüber schnell das Interesse verlieren.

Jonas Imam bringt jedoch eine Ausnahme davon ins Spiel: den Deadpan bzw. den trockenen Humor. Dieser basiert nämlich auf wenig Veränderungen in der Stimmlage und einem monotonen Ton. Trotzdem hebt er hervor, dass Deadpan auch nur ein Genre für sich ist und es für die Perfomance viel besser wäre, wenn eine Maschine über mehrere und vor allem feinere Stimmlagen verfügen würde, die Höhen und Tiefen besitzen. „Es ist generell ein enormer Nachteil, keine Kontrolle über seine Stimme zu haben und sie der Performance nicht anpassen zu können. Ich weiß nicht, ob man sich 90 Minuten eine KI anhören will, die einfach Dinge sehr monoton vorträgt.“

Was ist mit Reinrufern?

Auch Spontanität ist eine wichtige Charaktereigenschaft, um auf der Bühne gut zu performen. Sei es das sogenannte Riffen, wenn Comedians auf der Bühne improvisieren, oder sei es Crowdwork, bei dem sie mit dem Publikum interagieren. Auch wenn das Skript für die Comedians bereits vor dem Auftritt steht, ist es auf der Bühne immer ein Dialog. Jonas Imam erklärt es so: „Der Dialog besteht darin, dass ich etwas sage als Comedian und das Publikum lacht oder lacht nicht. Das ist wie eine Ja-Nein-Antwort.“

Auch der Computerlinguist Tristan Miller betont, dass es auf der Bühne immer ein Hin-und-Zurück mit dem Publikum und kein Monolog oder Vortrag ist. Leider sind heutige KIs und Roboter noch nichts so weit, dass sie erfolgreich mit dem Publikum interagieren und richtig auf Zwischenrufe reagieren könnten. Sie könnten auf der Bühne zwar zwischen Lacher und Stille unterscheiden, wie es schon der Roboter DATA vor zehn Jahren konnte. Sie könnten auch vorgefertigte Fragen an das Publikum stellen, aber spontan und witzig auf die Antworten zu antworten, liegt noch außerhalb ihrer Möglichkeiten.

„Grundsätzlich ist die Unfähigkeit, schnell auf eine Situation im Raum zu reagieren ein enormer Nachteil“, findet Jonas Imam und erklärt, dass ein Stand-Up-Comedian den Raum schnell lesen können muss. Anhand der Atmosphäre weiß er, was funktionieren kann und welche Teile seines Programms keinen Erfolg finden werden. Dabei betont Imam auch, dass eine KI die Intention eines Zwischenrufes verstehen muss, aber wohl noch nicht kann. „Was ist, wenn es gar nicht so böse gemeint war? Es gibt den German Fact Tackle, bei dem jemand dazwischenruft, dass irgendeine Information nicht korrekt ist oder eine rhetorische Frage beantwortet. Für die KI wäre es schwer, darauf zu reagieren“.

Comedians müssen aus seiner Sicht auch äußere Umstände berücksichtigen. Ein Beispiel: Es könnte sein, dass ein Comedian einen Bit, also eine einzelne Geschichte des Comedy-Programms, über Entführungen im Programm hat und das lange Zeit gut ankommt. Dann könnten die Nachrichten plötzlich voll damit sein, dass eine berühmte Person entführt und getötet wurde. Dieser Teil des Programms wäre danach sehr unangebracht. Eine KI könnte nicht selbstständig verstehen, warum sie diesen Teil aus dem Programm nehmen müsste.

Wenn eine Künstliche Intelligenz nicht richtig auf das Publikum reagieren kann, bleibt ihr zunächst nur das zu tun, was viele junge Comedians machen, die noch nicht viel Bühnenerfahrung haben: Sie konzentrieren sich komplett auf ihr Skript. „Sich strikt an das Skript zu halten ist bei Stand-Up-Comedy immer ein Nachteil. Das ist okay für Schauspieler, aber wir sind halt keine“, sagt Imam. Seiner Meinung nach gibt es nichts Schlimmeres für einen Comedian, als auf der Bühne unterbrochen oder gestört zu werden und darauf nicht oder nicht gut zu reagieren können. Die Folge davon sei, dass man den Raum verliert – genau das könnte einer KI leicht passieren. Eine extreme Schwachstelle, findet Imam.

Verstehe, was die Zukunft bringt!

Als Mitglied von 1E9 bekommst Du unabhängigen, zukunftsgerichteten Tech-Journalismus, der für und mit einer Community aus Idealisten, Gründerinnen, Nerds, Wissenschaftlerinnen und Kreativen entsteht. Außerdem erhältst Du vollen Zugang zur 1E9-Community, exklusive Newsletter und kannst bei 1E9-Events dabei sein. Schon ab 2,50 Euro im Monat!

Jetzt Mitglied werden!

Nackte Gebäude und erfolglose Beziehungen

Während sich Heather Knight mit ihrem Roboter eher langsam an die Comedy rangtasteten, ging Keaton Patti, ein Autor für Comedy Central , gleich aufs Ganze. 2018 gab er einer Künstlichen Intelligenz mehr als 1.000 Stunden an Stand-Up-Comedy-Material zum Ansehen und Trainieren. Das Programm schrieb daraufhin ein Comedy-Set für ihn – jedoch wurde das Ergebnis unfreiwillig komisch. Die Texte waren trocken, konfus und voller Fehler. Hier ein kleiner (übersetzter) Auszug: „Gestern sagte mein Sohn, dass er gerne Tony Hawk wäre. Ich sagte ihm dann, wenn er ein Vogel sein will, soll er seine Knochen aushöhlen“.

Patti veröffentlichte Auszüge des Comedy-Sets auf Twitter, damit sich alle ein Bild davon machen konnten, wie der Stand von Comedy-KIs 2018 war. Witze wie „Viele nackte Gebäude heutzutage. Es ist okay, ich bin zur Hälfte ein Gebäude.“ brachten dabei vielleicht ein Lächeln hervor, aber können weder ein 90 Minuten Comedy-Special noch Comedy-Clubs füllen.

Die 21 „besten“ Witze, die das KI-Sprachmodell GPT-3 generiert hat.

Ein bisschen witziger ist KI seitdem aber durchaus geworden – auch durch die viel diskutierte Text-KI GPT-3 von OpenAI. GPT-3 steht dabei für Generative Pretrained Transformer 3 – und gilt als eine der besten Programme, die basierend auf Deep Learning Texte generieren können, die sich lesen als würden sie von Menschen stammen. Inzwischen wurde GPT-3 auch benutzt, um Witze zu schreiben. Und dabei kamen Gags wie dieser hier heraus: „Eine Diät ist einfach eine erfolglose Beziehung zu Essen“. Gar nicht so schlecht, oder?

Teaserbild: Getty Images

Hat dir der Artikel gefallen? Dann freuen wir uns über deine Unterstützung! Werde Mitglied bei 1E9 oder folge uns bei Twitter, Facebook oder LinkedIn und verbreite unsere Inhalte weiter. Danke!