Warum Künstliche Intelligenz nicht ohne menschliche Klickarbeiter funktioniert


Künstliche Intelligenz könnte Millionen von Arbeitsplätzen überflüssig machen. Doch bevor das passiert (oder doch nicht passiert), schafft KI unzählige neue Jobs. Eine Schar von Klickarbeitern auf der ganzen Welt macht maschinelles Lernen überhaupt möglich. Wie und warum, das hat 1E9-Reporterin Cindy Michel recherchiert. Dafür wurde sie selbst zur Crowdworkerin.

Von Cindy Michel

Ein Versuch noch. Es ist Sonntagmorgen kurz nach 7 Uhr. Ich stehe in Pyjamahose und Hoodie in meinem Garten. Es nieselt leicht. In der einen Hand halte ich mein Smartphone in der anderen eine Tasse mit lauwarmen Kaffee. Zum dritten Mal aktualisiere ich die App einer Crowdworking-Plattform, bei der ich seit einer Woche angemeldet bin, und warte auf neue Aufträge. Mein Ziel: Ich möchte eine Künstliche Intelligenz trainieren.

Es gibt sie: die digitale Arbeiterklasse. Weltweit erledigen Millionen von sogenannten Klickarbeitern, Crowdworkern oder Turkern unzählige Kleinstaufträge. Von außen wirken diese manchmal stupide und eintönig. Aber sie benötigen menschliche Intelligenz. Zu den Klassikern gehört das Recherchieren von E-Mail-Adressen oder Webseiten. Auch Produktbeschreibungen werden oft von Crowdworkern geschrieben.

Seit ein paar Jahren kommen neue Aufgaben dazu, die durch den Boom der schlauen Algorithmen entstehen. Klickarbeiter analysieren und kategorisieren Bilder, Videos oder andere Daten, die als Trainingsmaterial für maschinelles Lernen gebraucht werden. Manche würden sagen: Sie liefern die Grundlage für das, was heute als Künstliche Intelligenz gilt.

Globaler Wettstreit der Klickarbeiter

Die digitalen Akkordarbeiter der Industrieländer finden ihre Jobs auf großen Crowdworking-Plattformen. Für jede erledigte Aufgabe bekommen sie von diesen ein paar Cent. In anderen Regionen der Welt sind richtige Klickfabriken entstanden, in denen tausende Menschen ihren Lebensunterhalt verdienen. Der Wettbewerb um Aufträge ist global.

Mittlerweile existieren weltweit über 2300 solche Plattformen, auf denen über 20 Millionen Crowdworker Aufträge suchen. International aufgestellt ist Mechanical Turk von Amazon. In Deutschland kennt man vor allem die Plattform Clickworker, die weltweit knapp 1,7 Millionen aktive Mitglieder hat, sowie den kleineren Marktplatz CrowdGuru aus Berlin.

Schon bevor ich die Kaffeemaschine angeschaltet habe, habe ich drei Microtasks erledigt. Für einen davon musste ich meinen Hund aus dem Bett schmeißen und für einen Haustier-Auftrag posieren lassen. Karma-Punkte gibt es dafür sicher nicht. Vielleicht stehe ich deswegen im Regen. Der Folgeauftrag hatte mich nämlich nach draußen geschickt, um eine Fotoserie verschiedener Objekte aufzunehmen. Ich entschied mich für eine quietschgelbe Minions-Figur sowie meine verbeulten Lampions. Ob die Bilder in einem neuronalen Netz landen?

Seit der zweiten Tasse Kaffee und dem Upload der Lampions bekomme ich nur noch Text- oder Rechercheaufträge angeboten. Ich möchte aber weder SEO-optimierte Texte verfassen noch Webseiten nach Begriffen durchsuchen. Ich will die Vorarbeit für eine mir unbekannte KI leisten!

Daher interessieren mich nur zwei Arten von Jobs: Zum einen die, bei denen ich bereits existierende Daten aufbereiten soll, zum Beispiel indem ich Objekte wie Ampeln oder Schilder auf Bildern markiere. Zum anderen Aufträge, bei denen ich Trainingsdaten für KI erstelle, zum Beispiel Fotoserien verschiedener Objekte. Letzteres sind gängige Aufträge. Ersteres wurden mir bisher auf keiner deutschen Plattformen angeboten.

Die Erstellung von Trainingsdaten braucht Diversität

Woran das liegt, weiß Ines Maione, die Marketingexpertin von Clickworker. „Bei der Erstellung von Daten kommt es oftmals auf die Diversität der Daten an“, sagt sie zu 1E9. Ein Beispiel: Wenn es um Trainingsdaten für Gesichtserkennung gehe, seien Porträts, die ausschließlich aus Indien kämen, nicht realistisch. Außer es sei die Aufgabe des Systems, lediglich Inder zu erkennen, sagt Ines Maione. „Gleiches gilt für die Erstellung anderer Daten wie Videos oder Audioaufnahmen.“

Wenn es aber darum gehe, bereits existierende Daten zu bearbeiten, spiele es keine Rolle, wer diese Markierung vornehme. Den Algorithmen ist es egal, ob eine indische oder eine französische Crowdworkerin die Katze auf einem Foto markiert. Für Klickarbeiter in Ländern wie Deutschland ist das ein Problem.

„Da können wir auf dem deutschen Markt preislich einfach nicht mithalten,“ sagt Ines Maione mit Blick auf Indien oder China. Auch Carsten Mehle, der CTO von CrowdGuru aus Berlin-Kreuzberg, kennt diese Entwicklung. „Crowdworker in Venezuela, Indien oder Pakistan arbeiten für einen Bruchteil der Kosten. Das schlägt sich gerade bei Aufgaben nieder, die bildbasiert sind und bei denen der deutsche Standortvorteil nicht mehr zum Tragen kommt“, sagt er zu 1E9.

Rund um die Welt entstehen Klickfabriken

China weiß diesen Markt für sich zu nutzen: Dort entsteht eine „neue Generation von Geringverdienern, die die Grundsteine für eine neue Zukunft montieren“, heißt es in einem Bericht der New York Times . In ärmeren Regionen fernab der teuren Metropolen gründen sich kleine Start-ups und beschäftigen ungeschulte Menschen, die für wenig Lohn die Trainingstdaten für KI sortieren und aufbereiten. Die rohen Datensätze bekommen sie von großen Unternehmen aus den Städten geliefert, die diese Microtasks gerne an billige Arbeitskräfte auf dem Land auslagern.

Dass China in diesem Segment der Datenbearbeitung zu einem Schwergewicht anwächst, wundert nicht. Denn es ist ein Land mit einem riesigen Datenfundus. „Die Chinesen sind extrem begierig auf digitale Services, vor allem auf ihren Mobilgeräten“, erklärt Kai-Fu Lee, der ehemalige Chef von Google in China. Die App WeChat etwa sei ein Portal, „das alles sammelt“, so Lee. „Ich zahle dort meine Telefonrechnung, kaufe meine Flugtickets, miete ein Auto, bestelle Essen.“ Gepaart mit einem schwachen Datenschutzgesetz sowie einer Vielzahl an Überwachungskameras sorgt dieser freigiebige Umgang mit persönlichen Informationen für eine gigantische Masse an Daten.

Der frühere Chef von Google in China, Kai-Fu Lee, sieht in den Unmengen von Daten, die chinesische Nutzer erzeugen einen Vorteil bei der Entwicklung von KI. Bild: Getty Images

„Wenn Daten der Treibstoff der Ära der Künstlichen Intelligenz sind, dann ist China Saudi Arabien“, sagt Lee. Der Experte prognostiziert, dass China bei KI in maximal fünf Jahren mit dem aktuellen Spitzenreiter USA gleichziehen wird. Die Initialzündung dafür könnten die Klickfabriken auf dem Land liefern, die teilweise aus der Not heraus von arbeitslosen Wanderarbeitern gegründet wurden. Schnell, zuverlässig und vor allem kostengünstig kategorisiert die chinesische Crowd die Daten, die die großen Unternehmen brauchen, um ihre KI zu entwickeln. Je mehr Daten, umso besser werden ihre Systeme.

Stundenlang und jeden Tag tun Menschen rund um die Welt nichts anderes, als Straßenschilder, Fahrradfahrer und Leitern zu markieren oder Tonaufnahmen anzuhören, damit sich später selbstfahrende Autos in der Welt zurecht finden und Alexa und Co. uns verstehen.

Der Begriff Künstliche Intelligenz führt zu einem Missverständnis

Ganze Heerscharen werden also benötigt, um Vorarbeit für den angeblichen Jobkiller Künstliche Intelligenz zu erledigen. Das klingt wie ein Widerspruch, hat aber eher mit einem Missverständnis zu tun. Und das beginnt mit unserer Sprache, meint Florian Gallwitz. Er ist Professor für Medieninformatik und Mustererkennung an der Technischen Hochschule Nürnberg.

„Ich vermeide die Bezeichnung Künstliche Intelligenz, da sie mit Bedeutungen und Visionen vollkommen überladen ist“, sagt er zu 1E9. „Ich würde in diesem Fall von maschinellem Lernen sprechen.“ Und schon verschwindet der Widerspruch. Aus einer intelligenten Maschine wird ein System, das einen Lehrer braucht. „In den meisten Fällen handelt es sich beim maschinellen Lernen um überwachtes Lernen“, erklärt Gallwitz. „Das heißt, man hat eine große Anzahl von Mustern, zum Beispiel Bilder, Sprachaufnahmen oder Videos, und man hat eine Referenz, welches Ergebnis das System am Ende liefern muss.“ Die Maschine erfährt also, ob sie richtig oder falsch liegt.

Falsche Trainingsdaten liefern dumme KI

Ein einfaches Beispiel: Ein Programm soll lernen, Katzen zu identifizieren. Dazu wird es mit einer großen Menge an Fotos gefüttert, auf denen eindeutig Katzen zu sehen sind. Außerdem werden etliche Bilder untergemischt, die eindeutig keine Katzen darstellen. Ohne jemals die Beschreibung einer Katze erhalten zu haben, legt der selbstlernende Algorithmus los.

Bei jedem Bild muss der Algorithmus entscheiden, ob es sich um eine Katze handelt oder nicht. Liegt er richtig, erfährt er es. Liegt er falsch, erfährt er es ebenfalls. Dann werden Gewichtungen im Algorithmus angepasst, und er kann es noch einmal versuchen. Mit der Zeit lernt der Algorithmus, an welchen Merkmalen er eine Katze erkennt, und kann eine hervorragende Trefferquote erreichen, vorausgesetzt die Trainingsdaten waren reichlich vorhanden und korrekt als Katze oder Nicht-Katze klassifiziert.

„Die kann man beim heutigen Stand der Technik nur per Hand erzeugen“, sagt Gallwitz. Wenn Maschinen Katzen schon eindeutig identifizieren könnten, müsste man sie ja nicht mehr dafür trainieren. „Was als sogenannte Künstliche Intelligenz verkauft wird, ist daher meistens nichts anderes als Mustererkennung mit einer sehr großen Menge an Trainingsdaten.“

Mit dem menschlichen Lernen hat das übrigens wenig zu tun. Schließlich müssen Kleinkinder nicht erst Millionen von Katzen gezeigt bekommen, um selbstständig Katzen von Hunden unterscheiden zu können. „Ein Kind schafft es relativ schnell, das abstrakte Konstrukt ,Katze‘ zu verstehen“, sagt Gallwitz. „Wie das genau funktioniert, wissen wir aber noch nicht.“

Damit ein Algorithmus Autos oder auch Menschen erkennen kann, muss er trainiert werden. Ohne Daten, die vorher von Menschen aufbereitet wurden, klappt das nicht. Bild: Getty Images

Klickarbeiter aus dem Slum und im Gefängnis

Nicht nur in China, auch in Afrika entstehen richtige Klickfarmen, in denen Geringverdiener Maschinen helfen, die Welt zu entdecken. Hier sind es vor allem amerikanische Firmen, die die durch Arbeitslosigkeit und Armut entstandenen Niedriglöhne nutzen. Samasource, ein Unternehmen aus dem Silicon Valley, zu dessen Kunden Google, Microsoft, Salesforce und Yahoo zählen, hat einen Standort in Kenias Hauptstadt Nairobi eröffnet. Dort erstellen und bearbeiten täglich etwa 1000 Menschen aus Kibera, dem größten Slum Afrikas, Daten für KI-Training und bekommen neun Dollar für acht Stunden Arbeit.

Für Menschen aus Kibera eine große Chance und eine Menge Geld, aber für eine Firma aus dem Silicon Valley? „Würden wir viel mehr als diese neun Dollar bezahlen, dann würde das alles durcheinanderbringen. Es könnte sich negativ auf Mieten oder Kosten für Lebensmittel in den Heimatgemeinden unserer Arbeiter auswirken“, erklärte eine Sprecherin des Unternehmens erst kürzlich in der BBC .

Auch andere Beispiele machten in den vergangenen Monaten Schlagzeilen. Facebook lässt offenbar private Posts von Nutzern – auch von Instagram – durch Subunternehmer an 200 Standorten weltweit kategorisieren, um seine Algorithmen zu verbessern, unter anderem in Indien wie Reuters berichtete.

In Finnland ersetzt die Crowarbeit neuerdings sogar den Job in der Gefängniswäscherei. Hier bereiten Häftlinge die Daten auf. Das geschehe aber nicht aus Kostengründen, sagte das Start-up Vain zu The Verge , das hinter der Rekrutierung der Gefängnisinsassen steckt. Der Grund sei der hohe Bedarf an Trainingsdaten für den finnisch-sprachigen Markt, der durch die geringe Anzahl der lokalen Crowdworker nicht gedeckt werden könne. Verdienen würden die Häftlinge in etwa genau so viel wie ihre freien Kollegen – durchschnittlich etwa zwei Dollar in der Stunde.

Es regnet immer noch. Mittlerweile beobachtet mich mein Nachbar, der wohl gerade aufgestanden ist. Seit ich versuche, die Welt der Clickworker in Deutschland zu verstehen, arbeite ich zu eher ungewöhnlichen Uhrzeiten – eigentlich immer dann, wenn ich etwas Luft habe und den Feierabend oder das Wochenende genießen sollte. Geht aber nicht anders, denn von der Klickarbeit allein könnte ich nicht leben. Im besten Fall verdiene ich in diesem Monat ein paar Euro dazu, vielleicht im zweistelligen Bereich. Ich klicke mich etwas frustriert durch eine der Apps. Vielleicht ist mein Status noch nicht hoch genug, um die wirklich interessanten KI-Jobs zu bekommen? Für manche davon kann man sich nur qualifizieren, wenn man von Auftraggebern positiv bewertet wurde.

Die Klickarbeit wird vorerst nicht ausgehen

Was passiert eigentlich mit den Klickarbeitern rund um den Globus, wenn Künstliche Intelligenz so intelligent ist, dass sie keine menschliche Vorarbeit mehr braucht? Für Florian Gallwitz von der Technischen Hochschule Nürnberg stellt sich diese Frage noch gar nicht. „Es wird nie der Punkt kommen, an dem man alle Daten hat“, sagt er. Wo jetzt nur Autos oder Bäume markiert werden, könnten im nächsten Schritt Polos oder Eichen getaggt werden. Die Daten werden also immer mehr verfeinert – und täglich entstehen neue, gigantische Mengen davon.

Endlich ploppt ein neuer Job auf: „Nehmen Sie ein Video Ihrer Nachbarschaft auf.“ Die Anweisungen überfliege ich kurz. Ich notiere gedanklich, dass Autokennzeichen auf gar keinen Fall gefilmt werden dürfen. Das Beispielvideo in schlechter Auflösung schaue ich bis zur Hälfte. Das muss reichen, denn Zeit ist Geld. Ich ziehe meine Kapuze ins Gesicht, stelle meine Tasse ab, drücke „record“ und filme, während ich eine kurze Runde durch die Nachbarschaft gehe.

Nach etwa zwei Minuten, kommt mir ein Auto entgegen, ich kann das Smartphone nicht schnell genug abschalten und filme einen Teil des Kennzeichens. Ich hoffe, das Video zählt trotzdem. Wenn nicht, wird der Job abgelehnt und ich würde keine 70 Cent bekommen. Kurz bevor ich mich endlich an den Frühstückstisch setze, checke ich kurz meinen Kontostand. Mist! Abgewiesen.

Teaser-Bild: Getty Images

Mitarbeit: @Wolfgang

11 Like