19. März 2025
Manus aus China ist kein KI-Durchbruch, aber Open-Source-KI-Magie

Derzeit sorgt wieder einmal eine KI-Plattform eines chinesischen Start-ups für Aufsehen. Der Chatbot Manus soll der erste KI-Agent sein, der praktisch alle Anfragen beantworten und komplexe Aufgaben erledigen kann. Entsprechend wild waren die Spekulationen über die Funktionsweise. Entgegen anders lautender Gerüchte steckt kein revolutionäres KI-Modell dahinter, sondern die geschickte Nutzung von Open-Source-Projekten in einem „Multi-Agenten-System“.
Von Michael Förtsch
Mit dem KI-Sprachmodell DeepSeek R1 hat ein chinesisches Start-up das Silicon Valley und insbesondere die Forschungs- und Entwicklungsunternehmen für Künstliche Intelligenz verblüfft – und verunsichert. Denn damit schien China in Sachen Künstliche Intelligenz mit der westlichen Technologiebranche gleich-, ja sogar daran vorbeizuziehen. Mit Manus ging diesen Monat eine Plattform an den Start, die von einigen als „zweiter DeepSeek-Schock“ beschrieben wird. Wieder steckt ein chinesisches Team dahinter. Dessen Entwicklung: eine general-purpose artificial intelligence, die mittels agentischer Fähigkeiten äußerst komplexe Aufgaben bewältigen kann. Vor allem auf Social-Media-Plattformen wie X und Reddit sorgt Manus für Aufsehen. Aber auch für Zweifel. Denn die Fähigkeiten des KI-Wunders scheinen nicht auf eigenen Entwicklungen zu basieren, sondern auf denen westlicher KI-Forscher.
Wer Manus testen möchte, muss sich noch gedulden. Bisher braucht es dafür eine Einladung. Wer eine will, muss sich auf eine Warteliste eintragen, die mittlerweile über zwei Millionen Einträge lang ist – oder einen der Einladungscodes kaufen, die für bis zu 500 Euro gehandelt werden. Laut Yichao Ji, einem der Manus-Entwickler beim chinesischen Start-up Monica, handelt es sich bei der Plattform nicht um einen weiteren Chatbot à la ChatGPT oder Claude, sondern um einen „völlig autonomen Agenten, der die Lücke zwischen Konzeption und Ausführung schließt“. Er stelle das „nächste Paradigma der Mensch-Maschine-Kollaboration“ dar, behaupten die Entwickler in einem Video.
Tatsächlich sind die ersten Nutzer mehrheitlich begeistert. Denn während etwa ChatGPT mit Deep Research über Agentenfähigkeiten verfügt, um im Internet gründlich zu recherchieren, die gesammelten Daten zu reflektieren und auszuwerten, kann Manus offensichtlich mehr – oder kommt weiter. Nutzer haben Manus komplexe Analysen von Aktien durchführen und grafisch aufbereiten lassen. Ein Entwickler hat mit Manus angeblich einen kleinen Flugsimulator mit einer einfachen Eingabeaufforderung gebaut. Ein anderer gab die „Berechnung der optimalen Hohmann-Transferbahn für ein Raumfahrzeug, das von der Erde zum Mars fliegt“ in Auftrag, wobei „die aktuellen Positionen von Erde und Mars“ und „die Gravitationseinflüsse der Sonne und anderer Planeten“ berücksichtigt wurden. Selbst die Suche nach einem Haus für einen Kauf, das bestimmten Kriterien entspricht, einschließlich der Bearbeitung von Preisanfragen, soll Manus übernehmen können.
Die Ergebnisse sind, wie manche Nutzer protokollierten, trotz mancher faktischer Fehler und Endlosschleifen, in denen sich Manus dann und wann verfängt, durchaus imposant. Der Grund dafür? Manus hat nicht nur Zugang zum Internet, sondern auch zu einem „eigenen Computer“, wie es in einer Seitenspalte der Benutzeroberfläche heißt. Damit ist Manus in der Lage, auf die unterschiedlichsten Quellen und auch Programme zuzugreifen, um seine Aufgaben zu erfüllen. Das KI-System kann Informationen aus Suchmaschinen, Zeitungs- und Zeitschriftenarchiven, Social-Media-Plattformen abrufen, aber auch Programme und andere Plattformen nutzen, um seine Mission zu erfüllen. Nach Angaben des Entwicklerteams erreicht Manus damit eine bisher unerreichte Leistung in GAIA, einem Test zur Bewertung der Problemlösungsfähigkeiten von KI-Agenten.
Beeindruckende Ergebnisse
Nach dem Start von Manus fragten sich viele, wie das chinesische Team aus Shenzhen das geschafft hatte. Denn bei der Ankündigung hielt sich Monica-Co-Gründer Ji Yichao in Bezug auf die Technologie zunächst sehr bedeckt. Er sagte nur, das kleine Team habe „im vergangenen Jahr still an der nächsten Evolutionsstufe der KI gearbeitet“ und Manus sei eine „frühe Vorschau“ auf das, was das Start-up eigentlich plane. Dies führte zu zahlreichen Spekulationen und Gerüchten. So wurde vermutet, dass Manus auf einer völlig neuen Art von KI-Architektur basiere, die speziell auf die Nutzung des Internet trainiert sei. Einige Internetuser glaubten wiederum, dass sich hinter Manus-Entwickler Monica in Wirklichkeit ein viel bekannteres Unternehmen wie OpenAI oder DeepSeek verberge.
Die Wahrheit ist weit weniger spektakulär, aber nicht weniger raffiniert, wie Ji Yichao in einem Posting auf X als Reaktion auf die vielen Spekulationen öffentlich machte. „Es ist nicht so kompliziert“, so Yichao. Manus verwende kein neues oder spezielles KI-Modell, sondern mehrere bekannte und etablierte KI-Modelle. Es ist ein Multi-Agenten-System. Das bedeutet: Im Zentrum steht ein KI-Modell als ausführender Agent, mit dem der Nutzer kommuniziert. Er nimmt die Prompts entgegen und verarbeitet sie. Über ihn werden die Befehle aufgelöst und an weitere KI-Modelle mit anderen Agentenfähigkeiten weitergeleitet. Einige von ihnen interpretieren die Aufgabe, planen und strukturieren sie in Einzelaufgaben. Andere sind nur dazu da, Wissen über Quellen zu beschaffen und spezielle Aufgaben zu erfüllen.
Der Kern von Manus sei derzeit das von Anthropic entwickelte Claude 3.5 Sonnet – wobei das Team plant, alsbald Claude 3.7 zu nutzen. Denn es sehe „sehr vielversprechend aus“. Darüber hinaus werden mehrere von Monica getunte Modelle auf der Basis von Alibabas Qwen verwendet, um die verschiedenen agentischen Aufgaben auszuführen. „Einige Manus-Planungstechniken stammen von einem Modell, das ich im Oktober letzten Jahres veröffentlicht habe“, sagt Yichao. Damit die Modelle selbstständig arbeiten können, hat Monica 29 verschiedene Werkzeuge um die Modelle herum installiert. Dazu gehören Tools, die jedem Manus-Benutzer einen eigenen virtuellen Computer auf einem Server zuweisen, und Browser Use, ein Open-Source-Nachbau von Computer Use, das dem Anthropic-Modell ermöglicht, diesen Computer zu bedienen.
Nur Sonnet mit Werkzeugen?
Einige KI-Enthusiasten waren enttäuscht von der Klarstellung, dass Manus kein revolutionäres neues Modell anwendet, sondern nur „Sonnet mit Werkzeugen“ sei. Manche fühlten sich sogar getäuscht. Manus sei mehr Hype als Innovation. Das Interesse werde dadurch genährt, dass es bisher nur vergleichsweise wenige wirklich nutzen könnten, die Einladungen rar seien, so einige der Vorwürfe. Dennoch bestärkten Personen wie Victor Mustar, Produktmanager der KI-Plattform HuggingFace, Manus sei trotz allem „eines der beeindruckendsten KI-Tools, die ich je benutzt habe“.
Positiv sind auch die Stimmen aus der KI-Open-Source-Community. Denn es sind vor allem offene Projekte, die Manus ermöglichen. „Wir verwenden viele verschiedene Open-Source-Technologien“, sagt Yichao ganz offen. „Ohne die Open-Source-KI-Community würde es Manus nicht geben". In der Tat zeigt Manus, was durch die Kombination der richtigen Werkzeuge und Technologien möglich ist. Dass Innovation im Bereich der Künstlichen Intelligenz nicht nur durch neue und größere Modelle erreicht werden kann, sondern auch durch eine intelligentere und kreativere Nutzung bereits vorhandener Modelle.
Wie das Team hinter Manus angegeben hat, wolle es durchaus auch etwas zurückgeben. Etwa eigene Werkzeuge als offene Projekte veröffentlichen und Kooperationen mit Open-Source-Teams eingehen. Bereits jetzt sind frühe Fassungen der Qwen-Modelle verfügbar, die das Team für seine Agenten nutzt. Darüber hinaus hat bereits eine Entwicklergruppe namens Cale AI begonnen, die Architektur von Manus nachzuempfinden. Unter dem Namen OWL – kurz für Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation – ist dieses Programm innerhalb weniger Tage zu einem der gefragtesten Projekte auf der Entwicklerplattform Github gewachsen.

Michael Förtsch
Leitender Redakteur
Weiter bei 1E9...

Überschrift 3
Cooler Artikel!

Überschrift 3
Artikel

Überschrift 3
Cooler Artikel!

Überschrift 3
Cooler Artikel!