Auf Prognosemärkten können Nutzer mit Geld auf die Zukunft wetten. Zum Beispiel darauf, wer der nächste US-Präsident wird, ob der neue Marvel-Film floppt oder ob sich die Theorie bestätigt, dass das Coronavirus aus einem Labor stammt. Derzeit erlebt vor allem die Plattform Polymarket einen Hype. In Zukunft könnte die Vorhersage der Zukunft aber auch eine Aufgabe von KI-Modellen werden.
Von Michael Förtsch
Es war wohl die wichtigste weltpolitische Frage dieser Tage: Bleibt Joe Biden stur? Oder verzichtet der amtierende US-Präsident auf eine erneute Kandidatur? Zahlreiche Kommentatoren spekulierten Ende Juni in Zeitungen, Magazinen und Fernsehsendungen darüber. Auch innerhalb der demokratischen und republikanischen Partei kursierten Gerüchte und Spekulationen. Die Unsicherheit war groß. Selbst das Team um den US-Präsidenten im Weißen Haus soll erst wenige Minuten vor dem Rest der Welt von seiner Entscheidung erfahren haben, auf eine erneute Kandidatur zu verzichten. Zu dieser Zeit stand das Geschehen auf einer Plattform aber schon lange fest. Die Nutzer von Polymarket hatten sich Stunden vor der Veröffentlichung des offiziellen Statements auf eine fast hundertprozentige Chance geeinigt, dass Biden seinen Rückzug aus dem Wahlkampf bekannt geben würde.
Sie hatten Recht. Genauso wie mit vielen anderen Fragen, die seit 2020 auf der schlicht gestalteten Website gestellt wurden. Die Nutzer von Polymarket zweifelten schon früh am Hype um den vermeintlichen Supraleiter LK-99. Sie sagten 2023 als das bisher heißeste durch die NASA gemessene Jahr voraus. Die Zulassung von Bitcoin-ETFs lag laut Polymarket schon Wochen vor der endgültigen Entscheidung bei einer Wahrscheinlichkeit von 80 bis 90 Prozent – und damit richtig. Derartige Vorhersagen finden sich zu fast allen relevanten und irrelevanten Themen. Sei es die große Politik, Sport, Film und Fernsehen, Finanzen und Wirtschaft oder auch Wissenschaft und Technik. Mal sind die Fragen ernst, präzise formuliert und gewichtig. Mal sind sie trivial, fast lächerlich und absurd. Aber man kann zu fast allem eine Prognose abgeben. Wenn man bereit ist, einen Einsatz zu riskieren.
Was sind Prognosemärkte?
Bei Polymarket handelt es sich um einen sogenannten Prediction Market beziehungsweise Prognosemarkt. Die Ähnlichkeit mit einem Wettportal kommt nicht von ungefähr. Denn das Konzept lässt sich nach Ansicht einiger Historiker 200 bis 500 Jahre zurückverfolgen. In Wirtshäusern und auf Märkten wurden von Zeitungsverlegern und Politikern öffentliche Wetten auf Wahlausgänge oder Ernteerträge veranstaltet, um Stimmungen abzufragen und Vorhersagen zu treffen. Dabei setzen die Teilnehmer keine klassischen Wetteinsätze. Vielmehr kaufen und verkaufen sie Anteile an einer der Vorhersagen, die dem binären Ja-, Nein- oder auch Entweder-oder-Modell folgen. Der Preis der Anteile spiegelt die kollektive Wahrscheinlichkeitseinschätzung wider und schwankt entsprechend – ähnlich wie Aktien den angenommenen Wert eines Unternehmens widerspiegeln. Je mehr Nutzer auf einen möglichen Ausgang setzen, desto teurer werden die Anteile gehandelt und können auch schon vor dem Eintreffen oder Nichteintreffen einer Vorhersage mit Gewinn oder Verlust verkauft werden.
Im Fall von Polymarket müssen die Nutzerinnen und Nutzer eine Kryptowährung mit der Bezeichnung USDC verwenden, deren Wert an den US-Dollar gekoppelt ist. Es können beliebige Beträge in Polymarket eingezahlt werden, mit denen dann Wettanteile gekauft oder verkauft werden. Alle Einsätze werden auf der Polygon-Blockchain gespeichert. Teilweise setzen die Nutzer nur Cent- oder ein- bis zweistellige Dollarbeträge auf einen Tipp. Manchmal werden aber auch tausende oder zehntausende US-Dollar auf die Zukunft verwettet. Bei manchen Wetten, wie zum Beispiel auf den möglichen Gewinner der nächsten US-Präsidentschaftswahl, summieren sich die Gesamteinsätze so mitunter auf Hunderte von Millionen US-Dollar. Je riskanter die Wette, desto größer ist natürlich auch der mögliche Gewinn oder Verlust. Ein Joe Biden-Fan verlor rund zwei Millionen US-Dollar, als der US-Präsident aus dem Wahlkampf ausstieg.
Dieser finanzielle Einsatz gebe den Vorhersagen der Prognosemärkte Gewicht, argumentieren Datenjournalisten und Statistiker. Nicht alle, aber doch ein beträchtlicher Teil der Teilnehmer an Prognosemärkten würden eben nicht nur eine schnelle Wette platzieren, sondern ihre Vorhersagen mit Bedacht und Kalkül treffen. Sie basierten auf tagesaktuellem Wissen und bei einigen Nutzern sogar auf intensiver Recherche, Expertise oder gar Insiderwissen, das kontinuierlich in die Bewertungen einfließe. „Einige von denen, die teure Wetten abschließen, sind professionelle Analysten, Journalisten und Wissenschaftler“, sagt ein anonymer Nutzer von Polymarket gegenüber 1E9. „Sie wissen, was sie tun und warum sie so wetten.“
„Die Datengrundlage von Prediction Markets beruht somit auf dem kollektiven Wissen und der Einschätzung der Beteiligten“, urteilt daher beispielsweise die Bundesakademie für Sicherheitspolitik in einer Einschätzung. „Zu den Vorteilen von Prediction Markets gehören zum einen die mögliche Informationsbreite einer sehr großen Schwarmintelligenz, die das Wissen einer kleineren Gruppe von Fachleuten übertreffen kann.“ Aber auch das Bauchgefühl fließt über die Masse in die Prognosen ein. Das kann von Vorteil sein: Nicht logische oder auf Basis von unbewussten Erfahrungen gefällte Entscheidungen können in Anbetracht von komplexen Problemstellungen und unübersichtlicher Datenlage durchaus effektiv und aussichtsreich sein. „Intuitiv ist das menschliche Gehirn in der Lage, viele Informationen aufzunehmen und über ein Gesamturteil zu entscheiden“, stellte ein Forscherteam 2012 fest.
Wertige Vorhersagen
In Stichproben hat sich wiederholt gezeigt, dass Prognosemärkte häufig Vorhersagen produzieren, die dem tatsächlichen Ausgang einer Situation erstaunlich nahekommen. Näher als dies bei klassischen Umfragen oder gar einfachen Wetten der Fall ist. Zur Messung der Erfolgswahrscheinlichkeit von Prognosen gibt es den sogenannten Brier-Score, der zwischen 0 und 1 gemessen wird. Er wurde 1950 vom amerikanischen Statistiker Glenn W. Brier entwickelt. Je niedriger der Wert ist und je näher er bei 0 liegt, desto zutreffender ist eine Vorhersage. Je näher der Wert bei 1 liegt, desto unzutreffender sind die Aussagen.
Laut einer Studie von Lukas Kapp-Schwoerer vom Computer Engineering and Networks Laboratory der ETH Zürich aus dem Jahr 2023 liegt der durchschnittliche Brier Score der Prognosen auf Polymarket bei rund 0,15. Ein Wert, der unter dem von klassischen Telefonumfragen und Börsen- und Aktienmarktprognosen liegt und damit Potenzial verspricht. Allerdings nur im Durchschnitt, wie Kapp-Schwoerer betont. Über die Vorhersagen hinweg gibt es eine große Varianz, die mit dem Marktvolumen korreliert. Bei einzelnen Vorhersagen mit besonders hohem Einsatz und Interesse gebe es auch sichtbare Extreme in der Vorhersagegenauigkeit. Sie könnten also einen besonders hohen oder besonders niedrigen Brier Score produzieren. Insgesamt seien Vorhersagen mit hohen Transaktionsvolumina – also hohen Einsätzen – aber tendenziell genauer. Gleiches gelte für Prognosen, die sich über längere Zeiträume erstrecken.
Aber auch je nach Thema, Fachgebiet und betreffender Weltregion variiert die Qualität und Zuverlässigkeit der Prognosen zum Teil sehr stark. Nicht nur bei Polymarket, sondern beispielsweise auch bei Manifold, das einen Brier Score von 0,17 führt. Für Christian Schiffer, Internetexperte beim Bayerischen Rundfunk, ist das nicht verwunderlich. „Bei den Nutzern dieser Plattformen handelt es sich um ein bestimmtes Kompartiment der Gesellschaft“, sagt er. Die Nutzer seien überwiegend männlich, technik- und wissenschaftsaffin, interessierten sich für Kryptowährungen, Web3-Technologien, einen bestimmten Teil der Popkultur und neigten eher zu libertären politischen Orientierungen. „Ich glaube, dass das die Prognosen zum Teil einfärbt oder verzerrt“, sagt Schiffer. Eine wirklich ausgewogene Prognose sei daher bei vielen Themen nicht möglich.
Eine ähnliche Einschätzung kommt von der Bundesakademie für Sicherheitspolitik: „Entscheidend sind die Anzahl und Zusammensetzung der Teilnehmenden, die Qualität der verfügbaren Informationen und auch die Art des Ereignisses, für das eine Prognose erstellt werden soll.“ Zudem könne „potentiell irrationales Verhalten von Teilnehmenden“ zu einem verzerrenden Faktor werden, wenn es einen großen Teil der Nutzer betrifft. Dies kann insbesondere bei stark ideologisch und emotional aufgeladenen Fragen der Fall sein.
Anonyme Experten
Über die Zusammensetzung der Teilnehmerschaft an Prediction Markets kann bislang nur gemutmaßt werden. Denn der Reiz von Angeboten wie Polymarket liegt darin, dass die Nutzer zwar nicht völlig anonym, aber weitgehend pseudonym bleiben können. Bei Polymarket kann zwar ein Account mit E-Mail-Adresse angelegt werden, muss aber nicht. Stattdessen genügt eine Kryptowährungs-Wallet wie Metamask, die nur mit erheblichem Aufwand auf eine reale Person zurückgeführt werden kann. Einige kleinere Prognosemärkte, die auch ethisch fragwürdige Wetten – etwa auf den Tod von Personen – zulassen, sind teilweise zudem nur über Anonymisierungsdienste wie TOR erreichbar und mit Kryptowährungen wie Monero oder Zcash nutzbar, die auf anonymen Werttransfer ausgelegt sind.
Doch auch seriösere Prognosemärkte bemühen sich, ihre Nutzer nicht übermäßig zu exponieren. Der 2015 gestartete Prognosemarkt Metaculus, der Künstliche Intelligenz, Klimawandel und die Einschätzung biologischer/chemischer und nuklearer Gefahren als Spezialgebiete ausruft, bietet zwar nach Jahren gestaffelte und unterschiedlich gewichtete Ranglisten und damit Reputation. Jedoch finden sich auch hier kaum Klarnamen. Dass sich Nutzer wie Datscilly, der Nummer-1-Nutzer auf Metaculus, öffentlich zu erkennen geben, hat Seltenheitswert. Auch bei Manifold und Futuur können sich die Nutzer hinter einem Phantasienamen verstecken.
„Hinter manchen Nickname steckt wahrscheinlich jemand, den man schon mal im Fernsehen gesehen oder dessen Analysen man gelesen hat“, sagt der anonyme Szenekenner gegenüber 1E9. „Es gibt Leute, die wirklich keinen Wert darauflegen, dass bekannt wird, was sie tun und wie ihre Einschätzungen zu bestimmten Themen aussehen.“ Mutmaßungen zufolge gehören beispielsweise auch Peter Thiel, einstiger PayPal-Mitgründer und Gründer von Palantir, oder der Ethereum-Erfinder Vitalik Buterin zu den Nutzern von Polymarket. Beide haben in das Start-up hinter der Plattform investiert. Und auch der Statistiker und Journalist Nate Silver soll dort nicht nur als Berater tätig sein, sondern ebenfalls selbst wetten.
Zukunftsvorhersage mit KI?
Prognosemärkte wie Polymarket, Manifold und andere sind kein absolut zuverlässiges Instrument. Ihre Reliabilität ist nicht ideal. Dennoch: „Die vorliegenden Studien belegen eine hohe Prognosegenauigkeit und zeigen, dass Prognosemärkte mindestens so gut abschneiden wie alternative Prognosemethoden“, resümiert etwa Andreas Graefe von der Universität Karlsruhe in einer Arbeit über Prognosemärkte. Nicht wenige sehen deshalb in ihnen einen mächtigen Mechanismus, der genutzt und gefördert werden sollte. Denn auch wenn sie die Zukunft nicht vorhersagen können, so können sie doch als Barometer für Ereignisse und mögliche Reaktionen darauf dienen.
Martin Köppelmann, der mit Gnosis einst einen der ersten – inzwischen aber wieder eingestellten – Blockchain-basierten Prognosemärkte gründete, ist von deren positiven Versprechen überzeugt. Sie seien ein Mittel, „um die riesigen Informationsfluten, die es zu verschiedenen Themen gibt, auf eine einfache Zahl zu reduzieren — eine Zahl, die dann ein Destillat des aggregierten Wissens zu einem Thema darstellt“. Im Idealfall könnten solche Prognosemärkte alle wichtigen Entwicklungen und Fragen der globalisierten Welt abdecken. Noch sei diese Vision nicht verwirklicht, aber Köppelmann sieht das Potenzial, dass „jemand so etwas auf die Beine stellt“.
Es stellt sich jedoch die Frage, ob und wie die derzeitigen Marktinkonsistenzen überwunden werden können. Insbesondere solche, die direkt von den Nutzern ausgehen und sich negativ auf die Prognosegenauigkeit auswirken. Dazu zählen die mangelnde Diversität der Teilnehmer, teilweise irrationale Entscheidungen, die mangelnde Fähigkeit, alle relevanten Informationen zu einem Thema zeitnah zu analysieren und in die Entscheidungsfindung einzubeziehen – oder auch schlichtes Desinteresse der Nutzer an bestimmten Themenbereichen. Hier könnten in Zukunft synthetische Nutzer auf Basis von Künstlicher Intelligenz kompensierend und ausgleichend eingreifen – oder sogar ganz alleine einen Prognosemarkt mit den gewünschten Vorhersagen füllen.
Köppelmann zufolge ist dies durch die Entwicklungssprünge möglich, die in den letzten Jahren insbesondere bei den KI-Sprachmodellen, den Large Language Models (LLM), stattgefunden haben. „Das ist es, was uns motiviert hat, uns nochmal an den Komplex heranzutrauen“, sagt Köppelmann. Bei der Blockchain-Firma Gnosis arbeitet derzeit ein kleines Team an einem Experiment, bei dem sich KI-Agenten „durch die verfügbaren Informationen arbeiten und dann Mikrowetten abschließen“. Die LLM-gesteuerten Agenten können auf Basis eines offenen Themas eigene Recherchen durchführen, wesentliche Informationen zu diesem Thema aus verschiedenen Quellen zusammentragen, Exposés erstellen und auf dieser Basis eine Einschätzung abgeben. Dabei setzt er, wie menschliche Nutzer, auf Kryptowährungen. Das ist keine futuristische Idee, sondern bereits seit etwa einem halben Jahr Realität.
Werde Mitglied von 1E9!
Hier geht’s um Technologien und Ideen, mit denen wir die Welt besser machen können. Du unterstützt konstruktiven Journalismus statt Streit und Probleme! Als 1E9-Mitglied bekommst du frühen Zugriff auf unsere Inhalte, exklusive Newsletter, Workshops und Events. Vor allem aber wirst du Teil einer Community von Zukunftsoptimisten, die viel voneinander lernen.
Jetzt Mitglied werden!„Das ist schon live, das läuft schon“, sagt Köppelmann über das Projekt. „Wir haben im Moment etwa 200 solcher Agenten, die jetzt alle unabhängig voneinander arbeiten, sich die Märkte auf der Plattform anschauen, ihre Arbeitsschritte absolvieren und dann einen Trade machen.“ In Zukunft soll es möglich sein, die Arbeitsschritte dieser Agenten zu verfolgen und ihre Logik nachvollziehen. Rund zwei Minuten bräuchte ein Agent derzeit von der Frage über die Recherche bis zum Trade. Laut Köppelmann würden die KI-Auguren dabei zwar effizient arbeiten, aber derzeit noch keine „bahnbrechenden Erkenntnisse“ liefern.
Die Schlüsse, die die KI-Agenten ziehen, seien derzeit oft solche, auf die auch ein Mensch nach einer Google-Suche kommen könnte. „Aber wenn wir jetzt ein, zwei Jahre in die Zukunft denken: Ich glaube, es gibt schon eine realistische Chance, dass daraus Werkzeuge entstehen, die bessere Quellen, mehr Informationen finden können“, sagt Köppelmann. „Die dann vielleicht Dinge sehen, die ein Mensch nicht sieht.“ Mit dieser Einschätzung steht der Blockchain-Entwickler nicht alleine da. Auch Forscher der University of California, Berkeley, sehen in den Propheten der Künstlichen Intelligenz großes Potenzial.
Bereits zu Beginn des Jahres führte das Forscherteam rund um Danny Halawi ein umfangreiches Experiment durch, bei dem es Fragen von bekannten Prognosemärkten wie Polymarket, Metaculus und Manifold sammelte. Daraufhin ließ es ein eigens dafür konfigurierte Sprachmodelle „nach relevanten Informationen suchen, Prognosen generieren und Vorhersagen aggregieren. Laut den Wissenschaftlern konnten die Vorhersagen der KI-Systeme oft mit denen von menschlichen Prognostikern auf den Plattformen konkurrieren. Einigen haben habe sie in ihre Zielgenauigkeit diese sogar übertroffen. Die genutzten Modelle hätten eine Vorhersagegenauigkeit von 0,2 bis 0,22 erreicht. Gut also, wenn auch nicht so gut wie der Durchschnitt der derzeit menschlichen Nutzerschaft, die auf verschiedenen Märkten zwischen 0,14 und 0,2 liegt.
Die Berkeley-Forscher gehen davon aus, dass LLMs mit zunehmender Größe, Komplexität und Wissensbasis auch „besser vorhersagen“ werden. In naher Zukunft könnten Sprachmodelle in der Lage sein, genauso gute oder sogar bessere Vorhersagen zu treffen als gut informierte menschliche Nutzer. In Zusammenarbeit mit menschlichen Nutzern könnten Maschinen dann auf Prediction Markets nicht nur Wahlergebnisse vorhersagen oder mutmaßen, ob der nächste Marvel-Film an den Kinokassen floppen wird – und damit Millionensummen in Kryptowährungen bewegen. Sie könnten auch wertvolle Entscheidungshilfen für Wissenschaft, Wirtschaft und Politik liefern, die einen echten Unterschied machen können.
Hat dir der Artikel gefallen? Dann freuen wir uns über deine Unterstützung! Werde Mitglied bei 1E9 oder folge uns bei Twitter, Facebook, Instagram oder LinkedIn und verbreite unsere Inhalte weiter. Danke!
Sprich mit Job, dem Bot!
War der Artikel hilfreich für dich? Hast du noch Fragen oder Anmerkungen? Ich freue mich, wenn du mir Feedback gibst!