KI-Forscher suchen eure Fragen, um KI-Systeme auf die Probe zu stellen

Wann stehen wir an der Schwelle zur Entwicklung einer Allgemeinen künstlichen Intelligenz? Wann werden KI-Systeme zu echten Experten, die genauso gut und schnell arbeiten können wie ein Mensch? Ein Forschungsunternehmen und ein KI-Start-up wollen es herausfinden. Dazu rufen sie jetzt dazu auf, Fragen einzureichen, die kaum jemand beantworten kann.

Von Michael Förtsch

Wann kommt sie, die erste Allgemeine Künstliche Intelligenz? Also eine Künstliche Intelligenz, die wie ein Mensch denken und ständig dazulernen kann. Manche KI-Forscher sehen sie noch in weiter Ferne. Sie prognostizieren, dass es bis dahin noch Jahrzehnte oder gar Jahrhunderte dauern könnte. Andere glauben, dass angesichts der Fortschritte der letzte Jahre die erste AGI schon in wenigen Jahren Realität sein wird. Ein Team amerikanischer Technologieforscher will einen Test entwickeln, mit dem sich feststellen lässt, wann wir die Schwelle zu einem solchen KI-System überschreiten. Um diesen Test zu konzipieren, setzt das Team auf die Mithilfe der Menschheit und ruft dazu auf, Fragen einzureichen.

Das Projekt des Forschungsinstituts Center for AI Safety und des Start-ups Scale AI trägt einen recht dramatischen Namen: Humanity’s Last Exam, oder: Die letzte Prüfung der Menschheit. Die Bezeichnung bezieht sich auf die Beschreibung einer Allgemeinen Künstlichen Intelligenz als Humanity’s Last Invention, also die letzte Erfindung der Menschheit. Denn wenn eine AGI erst einmal geschaffen ist, so glauben einige KI-Forscher und Philosophen, könnte die Notwendigkeit menschlichen Erfindergeistes obsolet werden. Ein lernendes und denkendes KI-System könnte schließlich jedes Problem viel schneller, effizienter und präziser lösen als jeder Mensch.

Laut Dan Hendrycks, Direktor des Center for AI Safety, würden aktuelle KI-Modelle wie GPT-o1 bereits Tests problemlos lösen, an denen Sprachmodelle noch vor wenigen Monaten gescheitert wären. Diese Tests umfassen Mathematik, Allgemeinwissen, Logik und Sprache – und stellen selbst für manche Menschen eine Herausforderung dar. Die Entwicklung von KI-Modellen geht rasant voran und die Systeme werden in solchen Tests immer besser. Laut Hendrycks sind es aber vor allem die Fähigkeit zur Planung und zum abstrakten Denken, die eine Intelligenz herausfordern und messbar machen. Und genau das soll beim Humanity’s Last Exam der Fall sein.

Eure Fragen für den Test

Das Ziel von Humanity’s Last Exam ist es, einen Katalog von mindestens 1.000 Fragen zusammenzustellen, die KI-Modelle stark fordern. Die Modelle sollen zeigen, dass sie abstrahieren, vorausdenken und Metaebenen erkennen können. Dazu sollen die Fragen mehrere Fähigkeiten auf Expertenniveau in verschiedenen Domänen erfordern. Gegenwärtige Modelle mit sehr hoher Expertise sind fast ausschließlich auf eine Disziplin wie Mathematik oder Rechtswesen beschränkt. Einige Technologiephilosophen sind daher davon überzeugt, dass die Schaffung eines KI-Multitalents ein Indikator für die letzten Schritte, hin zu einer AGI ist.

Werde Mitglied von 1E9!

Hier geht’s um Technologien und Ideen, mit denen wir die Welt besser machen können. Du unterstützt konstruktiven Journalismus statt Streit und Probleme! Als 1E9-Mitglied bekommst du frühen Zugriff auf unsere Inhalte, exklusive Newsletter, Workshops und Events. Vor allem aber wirst du Teil einer Community von Zukunftsoptimisten, die viel voneinander lernen.

Jetzt Mitglied werden!

Für die Zusammenstellung der Fragen haben das Center for AI Safety und Scale AI einen globalen Aufruf gestartet. Auf einer eigens eingerichteten Website sollen die „schwierigsten und umfangreichsten Fragen aller Zeiten“ gesammelt werden. Die Fragen sollen für Laien schwer zu beantworten sein, aber auch keine Trick- oder Scherzfragen sein. Die Antworten auf die Fragen sollen logisch und von menschlichen Experten akzeptiert sein. Ebenso sollten keine externen Quellen benötigt werden, um eine Frage zu verstehen und einen Antwortprozess zu beginnen.

Vor allem aber sollen die Fragen originell – also neu und noch nie dagewesen – sein, wie das Center for AI Safety und Scale AI betonen. Denn es soll vermieden werden, dass die zu testenden KI-Systeme eine Frage und ihre Antwort bereits aus einem Trainingsdatensatz kennen. Noch bis zum 1. November können Fragen eingereicht werden. Diese werden dann von einer Kommission bewertet. Wessen Frage ausgewählt wird, kann mit einem Preisgeld von bis zu 5.000 US-Dollar rechnen. Außerdem sollen die Autoren der Fragen in den Ergebnissen von KI-Tests prominent gewürdigt oder, wenn mehrere ihrer Fragen verwendet werden, sogar als Co-Autoren aufgeführt werden.

Hat dir der Artikel gefallen? Dann freuen wir uns über deine Unterstützung! Werde Mitglied bei 1E9 oder folge uns bei Twitter, Facebook, Instagram oder LinkedIn und verbreite unsere Inhalte weiter. Danke!

Sprich mit Job, dem Bot!

Job, der Bot

War der Artikel hilfreich für dich? Hast du noch Fragen oder Anmerkungen? Ich freue mich, wenn du mir Feedback gibst!