Es sind nicht nur Videos, die TikTok so erfolgreich machen, sondern Künstliche Intelligenz

Michael · 24. August 2020 um 01:09

Die Kurzvideo-App TikTok erlebt einen Hype. Verantwortlich dafür sind nicht nur die Inhalte, sondern auch ein ausgefeiltes System von Algorithmen, das den Nutzern genau das zeigt, was sie sehen wollen. Der US-Präsident Donald Trump sieht TikTok jedoch als Bedrohung – denn die Macher der App sitzen in Peking. Daher soll das US-Geschäft der chinesischen App an ein US-Unternehmen verkauft werden. Doch dadurch könnte TikTok das verlieren, was seinen Erfolg ausmacht: die Künstliche Intelligenz.

Von Michael Förtsch

Auf TikTok passiert wahnsinnig viel. Es wird gesungen, getanzt, es werden ganz eigene Kunst- und Kulturformate geschaffen. Vieles davon wirkt für Außenstehende abstrakt und unverständlich. Gar albern und abseitig. Aber in den letzten Monaten hat TikTok als Plattform immer wieder demonstriert, was für einen Einfluss dessen Nutzerschaft auf die reale Welt entwickeln kann. Gerade erst brachten die Nutzer den Phil-Collins-Song In The Air Tonight zurück in die Charts. Sie ließen die Satire-Kryptowährung Dogecoin im Wert ansteigen. Und im Juni sorgten K-Pop-Fans auf TikTok dafür, dass Donald Trump seine Rede in Tulsa, Oklahama vor zahlreichen leeren Plätzen halten musste.

Außerdem ist TikTok, anders als gerne porträtiert, nicht nur ein Ort der unbeschwerten Belanglosigkeiten. Es werden durchaus ernste Themen angeschnitten, Menschenrechtsprobleme aufgegriffen und politische Debatten geführt – nicht fehlerfrei oder unbedenklich, aber immerhin. Beides ist dabei nicht immer so einfach. Denn hinter TikTok steht das erst 2012 gegründete und in Peking, China sitzende Unternehmen ByteDance – eigentlich Beijing Bytedance Technology Ltd. – das mit der chinesischen Nachrichten-App Toutiao groß wurde. Und das verfolgt strenge und zuweilen ziemlich undurchsichtige Regeln, wie, was und warum etwas auf der Plattform geduldet, unterdrückt oder zensiert wird oder auch nicht.

Der Ursprung

TikTok startete im September 2016 als eine rein chinesische Video-Sharing-Plattform namens A.me, die schnell in Douyin umbenannt wurde und binnen eines Jahres 100 Millionen Nutzer ansammelte. Ende 2017 kaufte ByteDance das chinesisch-amerikanische Start-up Musical.ly und dessen gleichnamigen Musik-, Video- und Lip-sync-Dienst, der zu diesem Zeitpunkt schon über 200 Millionen Nutzer hatte. Im Herbst 2018 wurden beide Dienste verschmolzen: zu TikTok. Und das mit immensen Erfolg. Derzeit ist TikTok in 75 Sprachen verfügbar und verfügt – Zeitpunkt Juli 2020 – über 800 Millionen Nutzer. Die verbringen im Durchschnitt 52 Minuten pro Tag in der App.

Damit besitzt TikTok – respektive ByteDance – eine große Macht: Denn es sammelt von den Nutzern massenhaft Daten. Und einige US-Behörden mutmaßen, dass die an die chinesische Führung gehen – selbst, wenn sogar die CIA dafür keine Belege findet. Das schürt Sorgen. US-Militärs ist daher die Nutzung von TikTok schon lange verboten. Nun soll ByteDance sogar gezwungen werden, den TikTok-Dienst für die USA (und damit wohl gleich auch für Kanada, Australien und Neuseeland) zu verkaufen. Dagegen will sich ByteDance aber wehren.

Doch selbst wenn der Erfolg von TikTok als Videoplattform geradezu gigantisch ist, ist diese nur der sichtbare Teil des Tuns von ByteDance. Deutlich wichtiger und betrachtenswerter ist, was dahinter geschieht: Big Data und die Entwicklung von Künstlicher Intelligenz – das eigentliche Kerngeschäft des Unternehmens. Das zeigte sich schon vor TikTok in der Nachrichten-App Toutiao. Die sammelt Artikel und Videos aus über 5.500 Quellen. Kuratiert wurden und werden die aber nicht von Menschen, sondern einer Künstlichen Intelligenz, die von ByteDance’ AI Lab stetig weiter entwickelt wird. Jeder der rund 120 Millionen Nutzer bekommt dadurch einen auf seine ganz eigenen Interessen und Vorlieben zugeschnittenen Datenstrom.

Die Zentrale Plattform

Was ByteDance in seinem AI Lab macht, das ist eigentlich recht gut einsehbar – einfach auf der Website des Unternehmens. Darunter sind Themen wie Empfehlungssysteme, Datenvisualisierung, automatisierte Übersetzungen, die KI-gestützte Analyse von sozialen Netzwerken oder Sprach- und Textverarbeitung. Aber auch Spracherkennung und Stimmzuordnung, Sprachsynthese, Gesichtserkennung, 3D-Rekonstruktionen aus 2D-Bildern oder Visual Question Answering, also der Versuch, einer Künstlichen Intelligenz beizubringen, nicht nur einzelne Elemente in Bildern und Videos zu erkennen, sondern auch deren Kontext zu verstehen und Fragen dazu zu beantworten. All diese Werkzeuge und Experimente sollen auf einem eigens vom AI Lab entwickelten und sehr flexiblen Software-Framework aufbauen, das vom Unternehmen zhongtai – zu Deutsch: zentrale Plattform – genannt wird.

Werde jetzt Mitglied von 1E9!

Als Mitglied unterstützt Du unabhängigen, zukunftsgerichteten Tech-Journalismus, der für und mit einer Community aus Idealisten, Gründerinnen, Nerds, Wissenschaftlerinnen und Kreativen entsteht. Außerdem erhältst Du vollen Zugang zur 1E9-Community, exklusive Newsletter und kannst bei 1E9-Events dabei sein. Schon ab 3 Euro (+ MwSt) im Monat!

Jetzt Mitglied werden!

In China gilt ByteDance damit als eines der führenden Unternehmen, was KI-Entwicklung angeht. Unter den Tools, die ByteDance entwickelt und die insbesondere für TikTok interessant sind, sind Systeme, die präzise die Bewegungen von Menschen in Videos erkennen können – sowohl vom Körper, dem Gesicht als auch von den Händen. Es werkelt auch an einem Werkzeug, mit dem sich TikToker in ihren Videos nicht nur Filter auf das Gesicht und den Bildvordergrund legen, sondern auch beispielsweise die Länge ihrer Beine verändern können. Aber allen voran hat ByteDance ein System entwickelt, das Nutzern das zeigt, was sie sehen wollen – oder zumindest, was sie scheinbar sehen wollen –, das vorhersagt, was trenden könnte und die Nutzer so vor dem Smartphone hält. Nicht nur bei TikTok, sondern auch anderen ByteDance-Video-Plattformen wie Vigo Video, TopBuzz, BuzzVideo oder Zigua Video, die im Westen jedoch vollkommen unbekannt und auch weit weniger erfolgreich sind.

Bei TikTok ist die Kontrolle der Künstlichen Intelligenz anders als bei den anderen Video-Apps nicht nur ein Faktor, sondern der Faktor überhaupt – nur die Moderatoren können die KI-Entscheidungen aushebeln. Dafür lernt die Künstliche Intelligenz aus den zahlreichen Informationen, die die Nutzer beiläufig zurücklassen. Was sie schauen, welche Videos sie bis zu Ende laufen lassen, welche sie erneut schauen, welche sie wegwischen, wie schnell sie sie wegwischen, was geliked und kommentiert wird und vieles mehr. Anhand der zunächst wenigen Hundert, nach einigen Tagen wohl schon Zehntausenden Datenpunkten wird eine Landkarte der Nutzerinteressen erstellt.

Deren Zielsicherheit grenzt laut dem Tech-Blogger Eugene Wei an den gedankenlesenden Zauberhut aus Harry Potter, der entscheidet, welcher Zauberlehrling zu Gryffindor, Hufflepuff, Ravenclaw oder Slytherin passt. Das heißt, sagt Wei: TikTok erkennt auch, welcher Subkultur jemand anhängt und stellt dadurch sicher, dass beispielsweise ein Gangster-Rap-Fan keinen Bubblegum-Pop vorgesetzt bekommt und umgekehrt. „Was den einen zusammenzucken lässt, das macht dem anderen Spaß“, schreibt der Blogger. „TikToks Algorithmen sortieren die Nutzer in Dutzende über Dutzende von Subkulturen ein.“

Damit die dann auch das richtige zu sehen bekommen, analysiert die TikTok-KI auch unzählige Aspekte der Videos, die hochgeladen werden. Sie versucht, so schreibt der Daten-Wissenschaftler Daksh Trehan, zu identifizieren, was in den Videos zu sehen ist, was gesprochen wird, welche Musik läuft, wie die Audio- und Videoqualität ausfällt. Und natürlich welche Hashtags vergeben wurden und ob diese zum Inhalt passen. Das System von TikTok soll erkennen können, ob Videos in der freien Natur oder der Wohnung aufgenommen sind, ob und welche Tiere vorkommen oder nur Menschen. Ob ein Video eher ruhig oder aufregend ist. Und natürlich: ob der TikToker tanzt, Sport macht, koch oder sonst etwas. Dadurch können ähnliche und korrelierende Videos erkannt, gruppiert und gezielt an Nutzer ausgespielt werden.

Daher braucht ein Nutzer bei TikTok keinen einzigen Follower oder viele Views, um mit einem Video viral zu gehen, sondern nur die Entscheidung der Künstlichen Intelligenz, dass das Video gut ist und vielen Menschen gefallen könnte. Und was gut geht, das weiß die KI eben daher, wie die Nutzer zuvor auf Videos und deren Inhalte reagierten. Laut der KI-Forscherin Catherine Wang ist genau dieses Zusammenspiel aus Inhalten und einer Inhalte lenkenden Künstlichen Intelligenz, das, was TikTok so besonders macht. Die Nutzer suchen und entdecken nicht Inhalte, sondern sie bekommen sie passend zu ihren Vorlieben serviert.

Wie und wonach die Künstliche Intelligenz von TikTok die Videos genau auswählt, die gepushed werden, welche Videos untergehen oder wie die Gewichtung der Vorlieben ausschaut, dabei herrscht keine Transparenz, das ist ein großes Geheimnis. Daher existieren wilde Theorien dazu, wie die Künstliche Intelligenz gelockt oder motiviert werden könnte, die eigenen Videos präferiert auszuspielen.

TikTok ist nichts ohne die KI

Natürlich ist TikTok nicht die einzige große und erfolgreiche Social-Media- oder Medien-Plattform, die Künstliche Intelligenz einsetzt. Nutzer werden auch auf YouTube, Facebook oder auch Netflix mit Empfehlungsalgorithmen konfrontiert, die sie bei der Stange halten sollen. Sie spielen über YouTube-Autoplay das nächste Video aus, das offenbar zum vorherigen passt und schlagen auf der Startseite dann Videos vor, die widerspiegeln, was der Zuschauer zuletzt auf YouTube schaute. Auf Facebook sortieren Algorithmen Beiträge, Bilder und Videos von Freunden, die ganz besonders interessieren oder zu einem Kommentar provozieren könnten. Und Netflix empfiehlt Filme und Serien, die gut zu den Vorlieben der Zuschauer passen. Wie genau die funktionieren, das ist natürlich auch hier jeweils Betriebsgeheimnis.

Klar ist jedoch, auch hierfür lernen Künstliche Intelligenzen, was den Nutzern gefällt. Oder zumindest gefallen könnte. Die KIs dieser Plattformen achten jedoch viel eher darauf, was Nutzer und andere, die ähnliche Beiträge oder Videoinhalte klicken, beispielsweise mit einem Like, Daumen-Oben oder Sternchen markieren oder einem Abo belohnen. Oder wo sie sogar einen Kommentar hinterlassen. Und das in Relation dazu, ob das Video, der Film, die Serie zu Ende geschaut wurde, Playlists und Serien durch-gebinged wurden, wie lange der Videoinhalt dauerte und zu welchen Uhrzeiten das geschah.

Zusätzlich verlassen sich die Algorithmen auf Schlagworte, Beschreibungen der Videos, Überschneidungen bei Genre-Bezeichnungen – Netflix hat dafür Aberhunderte Mikro-Genres geschaffen –, der Besetzung, Vorschaubilder und der Überzeugung, dass Menschen, die Ähnliches schauen, Ähnliches gefallen wird. Ebenso fallen die Wege der Nutzer durch Listen mit verwandten Videos, Top-Filmen und Serien und die Verweildauer auf empfohlenen Beiträgen ins Gewicht.

Auch ein Blick in die Videos, eine Analyse der Inhalte findet auf YouTube und Facebook durchaus statt – schon, um Copyright-Verletzungen sowie das Hochladen von Pornografie und illegalen Inhalten zu vermeiden –, fällt bei der Empfehlung aber nicht oder nur kaum ins Gewicht. Wie gut beziehungsweise schlecht das zeitweise funktioniert, das dürften viele wissen, die sich immer wieder über besonders treffende oder grotesk unzutreffende Empfehlungen wundern.

Aber vor allem: Der Nutzer ist auf diesen Plattformen derjenige der Kontrolle hat, die KI gibt auf YouTube, Facebook und Netflix nur Vorschläge. Bei TikTok ist das ganz anders: „TikTok präsentiert dem Benutzer nie eine Liste mit Empfehlungen wie Netflix und YouTube und fordert den Benutzer nie auf, zu sagen, was er will“, schreibt die Tech-Analystin und Investorin Connie Chan. „Die Plattform schlussfolgert und entscheidet vollständig selbst, was der Benutzer sehen soll.“ Damit sei TikTok die erste international erfolgreiche „Mainstream-Anwedung für Verbraucher, bei der die Künstliche Intelligenz das Produkt ist“. Bei den anderen Plattformen sind die Inhalte das Produkt und die KI lediglich eines von vielen Werkzeugen.

Tatsächlich ist ByteDance bei näherer Betrachtung kein Social-Media- oder Medien-Unternehmen wie Facebook, YouTube oder Netflix, das auch an Künstlicher Intelligenz forscht. Sondern es ist ein Forschungs- und Entwicklungsunternehmen für Künstliche Intelligenz, das diese auf sozialen Netzwerken wie TikTok einsetzt – und darüber Daten sammelt, mit denen es Künstliche-Intelligenz-Systeme trainiert. Je mehr Daten zur Verfügung stehen, umso ausgefeilter, komplexer und damit fähiger kann eine Künstliche Intelligenz werden. Und umso vielfältiger können die Einsatzmöglichkeiten sein.

Allein die Bild-, Video- und Sprachdaten, die ByteDance sammelt und verarbeitet, sind unbezahlbar. Ryan Holmes, der Gründer des Social-Media-Management-Tools Hootsuite, fragte daher bereits im vergangenen Jahr, ob TikTok eine „tickende Zeitbombe“ sei. Denn die gleichen Künstlichen Intelligenzen, die TikTok derzeit nutzt, um die Videos zu analysieren und zu kategorisieren, könnten eingesetzt werden, um Videos von in China verfolgten Uiguren zu unterdrücken oder diese gezielt ausfindig zu machen. Oder Aktivisten aus Hongkong.

Auch stellt sich die Frage, was die Firma, die das US-Geschäft von TikTok kaufen könnte, eigentlich bekommt. Denn die Plattform TikTok und deren Nutzer und Videos sind nicht das, was TikTok ausmacht. Sondern das KI-Gerüst und dessen Sortier-, Analyse- und Muster-Modelle, die ByteDance erschaffen hat. Diese wird das chinesische Unternehmen wohl kaum herausrücken, wie The Information bereits im Juli schrieb. Es ist schließlich das, worauf ByteDance seinen Erfolg und Wert gründet.

Übernähme Microsoft, Oracle oder Twitter oder sonst ein Unternehmen einen Teil von TikTok, müsste es dann eigens und von Grund auf ein neues KI-System entwickeln, das Daten sammelt und das Rezept, den Look & Feel , die Geschmackstreffsicherheit von TikTok rekonstruiert. Wie gut, und ob das überhaupt machbar ist, das ist die große Frage, an der sich auch entscheidet, ob TikTok und seine Kultur, sein Einfluss auf die Gesellschaft ohne ByteDance und dessen Künstliche Intelligenz überhaupt vorstellbar ist.

Teaser-Bild: Montage 1E9 / TikTok

justherb · 24. August 2020 um 21:58

Vielen Dank für deine Recherchen und diesen mal anderen und erfrischenden Artikel zum TikTok Thema!

Die Einblicke in diese einzigartige Rolle der KI bei Tiktok beim Dirigieren des Contents sind wirklich faszinierend.

Angesichts dieser Funktionsweise und dem Potential Menschen „at scale“ zu im Griff zu haben kann ich nachvollziehen warum sich u.a. die US Politik gerade schwer mit der App tut.

Auch die Erfolge einiger bekannter Persönlichkeiten aus Deutschland als Neu-Toktoker erscheinen in diesem Licht nochmal anders.

Dennoch finde ich eine KI in so einer Zentralen Steuerrolle zukunftsweisend und man müsste wohl Wege finden, wie dies in einer irgendwie nachhaltigen Form für Gesellschaft möglich gemacht werden kann.

Es stand ja u.a. auch die Möglichkeit im Raum Einblicke in die Funktionsweise des TikTok Systems offenzulegen, [wie der CEO in seinem Brief verkündete]https://newsroom.tiktok.com/en-us/fair-competition-and-transparency-benefits-us-all)

why we believe all companies should disclose their algorithms, moderation policies, and data flows to regulators. We will not wait for regulation to come, but instead TikTok has taken the first step by launching a Transparency and Accountability Center for moderation and data practices. Experts can observe our moderation policies in real-time, as well as examine the actual code that drives our algorithms.

Das wäre sicherlich ein wichtiger Schritt für die gesamte Industrie und eine Ansage an Facebook und co! Aber vielleicht ist dieser Schritt auch zu groß und daher eher ein Versuch der Beschwichtigung…