Bei dieser Suchmaschine behältst du deine Daten – und trainierst eine KI auf deinem Smartphone

Michael · 2. Februar 2021 um 04:56

Moderne Suchmaschinen sind keine bloßen Verzeichnisse von Webseiten. Sie werden von hochentwickelten Algorithmen und KI-Modellen angetrieben, die die Nutzer und ihre Vorlieben gut kennen. Das hilft, zu finden, was gefunden werden soll – ist aber auch bedenklich. Denn die großen Suchmaschinen horten unsere Nutzungsdaten. Das Suchmaschinen-Start-up Xayn will zeigen, dass es auch anders geht.

Von Michael Förtsch

Wer bei Google oder einer anderen Suchmaschine wie Bing oder Baidu etwas in das Suchfeld eingibt oder durch die Inhalte eines Nachrichten-Aggregators wie Google News scrollt, denkt gewöhnlich nicht daran, was im Hintergrund alles passiert. Auch, weil es unheimlich komplex ist, was bei etwas scheinbar so einfachem wie der Suche nach einem Begriff oder Artikel alles abläuft. Denn die Art, wie eine Onlinesuche funktioniert, hat sich gegenüber den frühen Jahren des Internets massiv verändert. Es sind nicht mehr einfache Berechnungen wie der PageRank ausschlaggebend, der die Popularität einer Website basierend auf einer Formel kalkuliert, sondern Algorithmen und Machine-Learning-Modelle wie BERT. Kurz: Künstliche Intelligenz, die natürliche Sprache verarbeiten kann.

Wir bringen die Künstliche Intelligenz zu den Daten – und nicht die Daten zur Künstlichen Intelligenz.
Leif-Nissen Lundbæk

Diese Künstliche Intelligenz ist dafür da, nicht nur Ergebnisse zu liefern, die allgemein relevant sind, sondern speziell für den Nutzer, der gerade sucht. Sie werden also personalisiert. Auch wenn die Unterschiede oft nicht dramatisch ausfallen, sind sie doch vorhanden – und in Sachen Datenschutz bedenklich. Denn um personalisierte Ergebnisse liefern zu können, sammeln Google und Co. viele persönliche Informationen der User, um sie auf den eigenen Servern zu lagern – und auch zu Geld zu machen. Genau da will das Berliner Start-up Xayn einhaken. Denn: „Wir brauchen diese Daten nicht bei uns, um personalisierte Suchergebnisse zu liefern“, sagt Leif-Nissen Lundbæk von Xayn. „Es geht vielleicht einfacher so [wie es Google und andere machen], aber es geht eben auch anders.“

Xayn verspricht, personalisierte Suchergebnisse, Datenschutz und nicht zuletzt einen verantwortungsvollen Einsatz von Künstlicher Intelligenz in Einklang zu bringen. Oder es zumindest ernsthaft zu versuchen. Wie das aussieht, lässt sich schon jetzt ausprobieren. Und zwar über eine App, die sowohl für iOS- als auch Android-Geräte vorhanden ist – und als Mischung aus Suchmaschine und News-Aggregator funktioniert – und das mit einigem Erfolg. 50.000 Menschen nutzen sie bereits. Im umkämpften Markt für Suchmaschinen ist das durchaus ein Erfolg. Bald soll daher auch eine Variante für den Browser starten, die dann auch am Laptop und Desktop-Rechner funktioniert. Womöglich noch im ersten Halbjahr 2021.

Deine eigene KI

Der Ansatz der Xayn-Entwickler ist, die digitale Souveränität ein Stück weit an die Nutzerschaft und deren Endgeräte zurückzugeben. Wer in der Xayn-App etwas sucht oder durch Nachrichten scrollt, erkennt ein kleines Gehirn, das in einer Bildschirmecke eingeblendet ist. Leuchtet es, lernt und arbeitet eine Künstliche Intelligenz – und baut ein Modell auf, das ganz speziell auf den Nutzer oder die Nutzerin zugeschnitten ist. Aber nicht irgendwo auf den Servern von Xayn. „Das alles passiert direkt auf deinem Smartphone, deinem Gerät“, sagt Lundbæk. „Wir sehen davon nichts. Wir bringen die Künstliche Intelligenz zu den Daten – und nicht die Daten zur Künstlichen Intelligenz.“

Was und wie die Künstliche Intelligenz lernt, darauf haben die Kunden bei Xayn ebenfalls Einfluss. Denn wenn ihnen die Suchmaschine ihre Ergebnisse präsentiert, können sie á la Tinder mit Wischbewegungen nach links ein Ergebnis für „uninteressant“ bewerten. Mit einem Wischer nach rechts wird ein gutes Ergebnis „bestätigt“. „Das ist auch ein ethischer Aspekt“, sagt Leif-Nissen Lundbæk. „Das Swipen hat einen Einfluss und gibt dem Nutzer eine Kontrolle darüber, was die Maschine lernt, oder eben auch, was sie nicht lernt.“ Das gebe auch ein gutes Gefühl – und die Sicherheit, die eigene Such- und Nachrichtenerfahrung aktiv zu gestalten.

In Zukunft könnten weitere Entscheidungen dazukommen, die die Nutzer mit dem Wischen treffen könnten – aber nicht unbedingt müssen: Beispielsweise ein Suchergebnis zurückzustellen oder zu vermerken, dass es nicht grundlegend falsch, aber für die aktuelle Suche irrelevant ist. Die Künstliche Intelligenz auf dem Gerät lernt auch schon jetzt nicht nur, ob ein Suchergebnis gut oder schlecht ist. Denn eigentlich ist es auch nicht nur eine Künstliche Intelligenz, sondern derzeit vier, die als ein KI-System zusammenarbeiten.

Eine der Künstlichen Intelligenzen analysiert etwa die Texte der Suchergebnisse, eine andere die Interessen der Nutzer an Kunst, Kultur, Sport und anderen Themen. Eine dritte die Vorblieben für bestimmte Quellen wie Wikipedia, 1E9 oder Spiegel.de. Und eine vierte führt Informationen der Künstlichen Intelligenzen zusammen, um die Ergebnisse, die letztlich auftauchen, zu präsentieren. Dabei werden auch Faktoren wie die Uhrzeit oder der Standort einbezogen. Denn es ist deutlich wahrscheinlicher, dass jemand nach einem Fußballspiel statt der Vorberichterstattung die Ergebnisse sehen will. Oder dass jemand, der nach dem Namen seines Wohnorts sucht, nicht unbedingt an dessen Wahrzeichen interessiert ist, sondern eher an aktuellen Meldungen.

Weniger Energieverbrauch pro Suche als sonstwo

Obwohl Xayn deutlich weniger Daten sammelt und verwertet als Google und Co. – und das auch nur auf den Geräten der Nutzer –, sollen durch das stete Lernen KI-Modelle entstehen, die ziemlich individuell auf die Nutzer zugeschnitten sind und schätzen können, was sie mögen, welchen Medien sie vertrauen, welche Websites sie oft und gerne anklicken. Zusammen sollen die KI-Modelle nur um die 50 Megabyte groß werden – zum Vergleich: das KI-Model von Google wiegt rund 10 Gigabyte. „Wir versuchen hier quasi wie ein Kind zu lernen, sehr schnell Interessen und Vorlieben zu erfassen“, erläutert Lundbæk. „Aber es geht auch darum, einfach gute Ergebnisse zu liefern und wirklich zu zeigen, was nun relevant und einfach wichtig sein könnte.“

Es ist nicht einfach, was wir hier machen. Fehler können geschehen. Denn wir haben durch unser Konzept keine Datenbank, an der wir entwickeln und einfach testen können.
Leif-Nissen Lundbæk

Daher soll die Nutzerschaft trotz allem nicht in einer oft beschworenen Filterblase gefangen werden. „Das hat auch wieder ethische Gründe“, sagt Lundbæk. Deswegen spielt Xayn immer wieder stichprobenartig Ergebnisse ein, die eigentlich ausgeschlossen wurden; einfach auch, um sicher zu stellen, dass die Nutzer oder die Künstliche Intelligenz nicht vielleicht einen Fehler bei der Abwahl gemacht haben. „Es ist nicht einfach, was wir hier machen. Fehler können geschehen“, sagt Lundbæk. „Denn wir haben durch unser Konzept keine Datenbank, an der wir entwickeln und einfach testen können.“

Aber laut dem Xayn-Team sei es den Aufwand und die Schwierigkeiten wert. Nicht nur aufgrund der Vorteile in Sachen Privatsphäre und Datenschutz der Nutzer. Das dezentrale Edge-Computing-Konzept und das kleinere und sehr persönliche Modell hätten auch andere Vorteile. Nämlich handfeste Energieersparnis, wie Michael Huth, Co-Gründer von Xayn, sagt. „Es ist einfach nachhaltiger, die Berechnungen dort durchführen zu lassen, wo sie zum Tragen kommen“, sagt er. „Das ist auch eher im Sinne der Smart Society, die gerne beschworen wird.“ Insgesamt werde gegenüber einer Google-Suche rund 5.000-mal weniger Rechenkraft und damit Strom gebraucht, sagt der Xayn-Co-Gründer.

Verstehe, was die Zukunft bringt!

Als Mitglied von 1E9 bekommst Du unabhängigen, zukunftsgerichteten Tech-Journalismus, der für und mit einer Community aus Idealisten, Gründerinnen, Nerds, Wissenschaftlerinnen und Kreativen entsteht. Außerdem erhältst Du vollen Zugang zur 1E9-Community, exklusive Newsletter und kannst bei 1E9-Events dabei sein. Schon ab 2,50 Euro im Monat!

Jetzt Mitglied werden!

Die Macht der Kunden

Die Entwickler von Xayn behaupten nicht, dass ihre Herangehensweise die einzig richtige sei. Sie wollen Google, Bing, Baidu und andere auch nicht verdammen oder anderen alternativen Suchmaschinen wie DuckDuckGo nun kräftig Konkurrenz machen. Sie wollen demonstrieren, dass es auch anders geht und damit eine gute und wirtschaftlich tragfähige Suchmaschine möglich ist. „Wir haben eine bestimmte Zielgruppe“, sagt Lundbæk. „Wir sehen unsere Nutzer als Leute, die wirklich eher eine unkomplizierte Nutzererfahrung haben wollen – aber trotzdem Datenschutz sehr stark wertschätzen.“

Auch die Rufe nach einer stärkeren Regulierung von Künstlicher Intelligenz und Unternehmen, die damit arbeiten, wollen die Xayn-Gründer nicht pauschal propagieren und unterstützen. „[Regulierung] mag in Einzelfällen wie Gesichtserkennung durchaus gerechtfertigt sein“, sagt Lundbæk. „Aber insgesamt geht es ja weniger um Künstliche Intelligenz, sondern deren Effekte und die Arten, wie die Künstlichen Intelligenzen genutzt werden – die müssten reguliert werden.“ Viel wichtiger, einflussreicher und ausschlaggebender als eine Regulierung wären die Nutzer und das Nutzerverhalten.

Insgesamt geht es ja weniger um Künstliche Intelligenz, sondern deren Effekte und die Arten, wie die Künstlichen Intelligenzen genutzt werden – die müssten reguliert werden.
Leif-Nissen Lundbæk

„Das, was die Nutzer wollen und unterstützen, das setzt sich gemeinhin durch“, meint Lundbæk. „Sie können Produkte und Firmen in die Knie zwingen und andere aufsteigen lassen.“ Wichtig sei, dass Unternehmen daher Ethik und Datenschutz nicht als Selbstzweck fahren, sondern wirklich auch gute und gut nutzbare Produkte bieten – und dabei auf die Anwender und ihre Bedürfnisse eingehen. „Diese Konzepte werden sich nur durchsetzen, wenn sie einfach genutzt werden können“, sagt Lundbæk. Dass das funktioniert, das sieht man schon jetzt. Nämlich bei Millionen von Menschen, die derzeit von WhatsApp zu Signal, Threema und anderen mehr auf Datenschutz fokussierten Messenger-Diensten wechseln.

Dieser Artikel ist Teil des 1E9-Themenspecials „KI, Verantwortung und Wir“. Darin wollen wir herausfinden, wie wir Künstliche Intelligenz so einsetzen, dass die Gesellschaft wirklich davon profitiert. Alle Inhalte des Specials findest du hier.

Wolfgang · 2. Februar 2021 um 12:01

Finde den Ansatz von Xayn super – KI-Training auf der eigenen Hardware, Daten auf der eigenen Hardware – und frage mich, ob sich dieser nicht noch auf viel mehr Anwendungsbereiche übertragen ließe. Mehr Edge, weniger Cloud. Das könnte das Vertrauen in KI sicherlich stärken. Was ich als Nicht-Fachperson nicht beurteilen kann: Werden die Anwendungen dadurch „schlechter“?

DrBolle · 2. Februar 2021 um 14:27

Lauter wichtige und richtige Ansätze! Allerdings frage ich nach dem Finanzierungsmodell. Wie verdient Xayn Geld?

Saskia · 2. Februar 2021 um 14:53

Das Team rund um Xayn scheint vieles richtig zu machen: an vorderster Stelle steht der Nutzen, aber eben zunehmend auch weitere Qualitäten wie die Privatsphäre, soziale Nachhaltigkeit und auch der ökologische Fussabdruck. Genau solche innovativen Lösungen brauchen wir! Ich stelle mir aber auch tatsächlich die Frage nach dem Geschäftsmodell. Wir bewerten den Nutzer Xayn im Vergleich zu Google etc.? Und sehe auch das Risiko der Blase also dass ich quasi nur noch mein „eigenes Universum“ sehe. Und dann natürlich die Frage: nach welchen Kriterien wird entschieden, was mir „zugespielt“ wird. Bei Google wäre es recht klar Sehr spannend würde gerne mehr darüber wissen!

rasmus · 2. Februar 2021 um 16:10

Tolles Produkt von Leif und seinem Team. Ich denke da treffen sie genau die richtige Kerbe weil das Thema Privacy immer wichtiger wird. Gerade im Search Space ist da bisher leider noch zu wenig passiert.

Michael · 3. Februar 2021 um 08:36

Geld verdienen will Xayn unter anderem mit Premium-Features geben. Nachgedacht wird etwa über eine mögliche Verknüpfung mit anderen Konten wie Dropbox, Google Drive, NAS etc. pp, wo dann nach Daten gesucht werden kann. Ebenso wird an einer Business-Fassung gearbeitet, die dann etwa von Firmen oder Behörden als Suchmaschine für das Intranet genutzt werden kann.

0x78 · 3. Februar 2021 um 20:45

Ist dieses Xayn eigentlich das ehemalige Xain, das DLT in die IoT Welt bringen wollte? Danach gesucht hab ich nur den VC earlybird und später noch dominik schiener von der iota foundation als Investoren gefunden. Meines Wissens gingen die damals in Xain. Wäre jedenfalls ein cooler pivot und hab das Produkt kurz getestet und find es richtig interessant auch bin der User experience (mit den tinder like swipe zum trainieren).

Michael · 3. Februar 2021 um 22:01

Jup. https://medium.com/next-level-german-engineering/the-porsche-xain-vehicle-blockchain-network-a-technical-overview-e1f48c40e73d

0x78 · 3. Februar 2021 um 22:06

Wow - gibt es noch irgend einen Zusammenhang zu dem blockchain Thema? Oder ist das Produkt jetzt eine komplette Neuausrichtung mit klarem cut in die Vergangenheit? Zumindest sucht sich das Team richtig dicke Bretter aus

Michael · 3. Februar 2021 um 23:05

Nein, gibt keinen Zusammenhang.

sebastianhofer · 4. Februar 2021 um 14:26

Wo ist denn da der Unterschied zur Zielgruppe von DuckDuckGo oder Startpage?

SamS · 4. Februar 2021 um 20:43

Hört sich verdammt nach federated learning an. Vielleicht einmal eine Anwendung davon, die gute Ergebnisse bringt. Wäre toll.

KillerSteff · 4. Februar 2021 um 20:56

Also eine Art Freemium-Modell. Sobald die Integration mit Cloud-Anbietern, die Rechenzentren in den Vereinigten Staaten nutzen, sollten die Datenschutzglocken läuten. Die USP wäre damit eingeschränkt, wenn nicht sogar futsch. Bleibt abzuwarten, was Schrems II in den nächsten Monaten und Jahren noch zutage fördern wird. Bis dann sollte die freie Edge-Lösung aber auch einige Schritte weiter sein. Ich bin gespannt.

Michael · 4. Februar 2021 um 23:43

Startpage und vor allem DuckDuckGo sind sehr „plain“ und eher technische und „neutrale“ Suchmaschinen, die für die Privacy eben den Komfort opfern. Für wahnsinnig viele Leute sind sie daher nichts. Genau hier will Xayn quasi reinschlagen, so wie sie es umrissen haben.

Michael · 4. Februar 2021 um 23:46

Ich glaube, Freemium ist das falsche Wort. Denn die Hauptanwendung ist ja die Suche - und die ist von vornherein kostenfrei und soll es auch bleiben. Da musst du nix freischalten. Und die Sache ist: Wenn sich jemand entscheidet, seinen Cloud-Anbieter zu integrieren, der in den USA sitzt, ist das seine eigene Entscheidung. Darum geht es ja auch: Entscheidungsfreiheit. Wenn jemand das mit seinem eigenen Datenschutz-Gewissen vereinbaren kann, warum nicht?! Cool wäre natürlich, wenn Xayn da warnt und aufklärt.

MaxHaarich · 5. Februar 2021 um 18:22

Hmm…klingt echt super, aber irgendwie auch zu super. Wäre ja ziemlich geil, wenn edge/federated die Lösung aller Datenschutzprobleme wäre. Vielleicht bin ich da zu pessimistisch/verschwörungstheortisch unterwegs, aber: Google braucht doch keine Google-Suchen, um an deine Daten zu kommen!? Es reicht doch schon ein Android Betriebssystem, um Google Zugang zu privaten Daten zu ermöglichen. Abgesehen von den ganzen anderen Helferapps, die dann nach irgendeinem update protzlich nach hause telefonieren, so dass irgendwo dann doch ausreichende Profile bei Facebook, Google und Palantir entstehen.

Also bitte versteht mich nicht falsch. Ich freue mich über jeden, der sich für Ethik in der Digitalisierung einsetzte. Aber ich habe Bedenken, wenn da immer nur die Tech-Industrie mit neuen Tech-Lösungen zu hören ist. Erstens glaube ich nicht, dass es für alles eine technische Lösung gibt und zweitens ist es gefährlich zu glauben, dass es für alles eine technische Lösung geben könnte. Das führt nämlich dazu, dass bei jedem neuen Problem (z.B. Datensicherheit bei Internetsuche) reflexartig immer nur die Tech-Industrie mit Fördergeldern beworfen wird. Mögliche soziale Ansatzpunkte wie z.B. das hier im Text angesprochenen Konsumverhalten, werden dann komplett ignoriert. Dass aber gesellschaftliche Lösungen manchmal die schnellsten und nachhaltigsten sein können, hat erst kürzlich der konzertierte Rückschlag gegen die Gamestop-Shortseller bewiesen. Vielleicht kann man die Reddit User mal fragen, wie man Google zum umdenken bewegen könnte!?

0x78 · 5. Februar 2021 um 21:14

das ist genau das Problem. Irgendwie ist es passiert und sowas kann man glaube ich noch nicht so wirklich mit Richtung versehen…

Wie wäre es denn grundsätzlich möglich „kontrolliert“ gesellschaftliche Lösungen umzusetzen? Gesellschaft (anders als ein Stück Elektronik, als design von Software, Regeln die man konkret implementieren kann) hat das Problem, dass (noch) es nicht fassbar ist und somit kaum planbar zu bewegen. Oder?

Saskia · 7. Februar 2021 um 11:57

Bin sehr bei Dir, @MaxHaarich! Mehr soziale Innovationen zur Problemlösung! Doch die sind in der Tat a) schwieriger, da nicht selten auf Struktur- oder Verhaltensveränderungen beruhend b) nicht mit (riesigen) ökonomischen Hoffnungen verbunden.
Gerade in Bezug auf Datenschutz, Privatheit, Selbstbestimmung haben wir da dicke Bretter zu bohren. Die Unbekümmertheit (im Tun) scheint grenzenlos. Wo Ansetzen? Wie kann man die weitreichenden persönlichen und sozialen Folgen einmal hinterlassener Datenspuren deutlich machen und damit Impulse für Verhaltensänderungen und politische Haltungen setzen?

KillerSteff · 8. Februar 2021 um 21:23

Macht Sinn, danke. Dennoch sind die meisten nutzerfreundlichen wie skalierbaren Cloud-Anwendungen, mit der die Lösung über private Tüftelei hinaus spannend würde, mit den Vereinigten Staaten verbunden.

Kollaborationen mit europäischen Partnern brächten die Suchmaschine Voraussichtlich so schnell ans Ziel, dass der flächendeckende Einsatz denkbar wäre. Leider lassen die zu oft zu lange auf sich warten.

MaxHaarich · 8. Februar 2021 um 21:39

Puh, das sind genau die Fragen, die ich mir auch Stelle. Ich glaube zum einen will man gar keine komplett steuerbare Gesellschaft haben. In Pandemie-Zeiten ist es unendlich wertvoll alle Leute schnell zum Befolgen der Maßnahmen bringen zu können. Aber die dafür nötigen Instrumente und die dafür notwendige Einstellung/Disziplinierung des Volkes kann dann genauso auch zu viel schlimmeren Dingen missbraucht werden. Ich glaube es ist meistens eh nachhaltiger die Ursachen zu verhindern, als die Konseqenzen zu kompensieren. D.h. das Problem ist ja nicht, dass wir die Leute nicht schnell genug gegen Fonds-Manager oder Google mobilisiert kriegen, sondern das Google und die Fonds-Manager mit ihrer Daten- und Geldgier so einen Volksaufstand überhaupt notwendig machen. Und da sind wir dann wieder beim Thema Ethik.