Dieser Beitrag beschreibt die potentiellen Apple Pläne bezüglich der Erweiterung von Siri um mächtige bahnbrechende KI Funktionen. Die Veröffentlichung könnte bereits am Montag, den 10.6.2024 anlässlich der WWDC Keynote erfolgen.
Es dreht sich im Schwerpunkt um die Weiterentwicklung von Siri zu einem umgangssprachlichen und vollkommen natürlichen Sprachassisten, ggf. mit animiertem Avatar auf einem Bildschirm.
Erreichen kann das Apple durch Implementation und ggf. Zukauf bestehender, d.h. bekannter KI Funktionen. Im Kern müsste Apple nur die folgenden KI-gestützten Elemente integrieren:
-
Eine Spracherkennung, die per KI unstrukturierte, umgangssprachliche Eingaben interpretieren kann und diverse Sprachen versteht
-
Eine KI, die umgangssprachliche Texte zu einem Set von aktuell allen und immer mehr möglichen Siri Befehlen zuordnet
-
Eine generative KI, die alle Anfragen, die keinen Match im aktuellen Siri Befehlssatz haben, beantwortet (mögliche Kooperationen mit OpenAI, Google, Anthropic, Universitäten und Forschungseinrichtungen sowie neben Eigenentwicklungen auch Aquisitionen von Startups)
-
Eine natürlichsprachliche, internationale Sprachgenerierung zur Quittierung von Befehlen und zur Beantwortung von Fragen im Sinne einer umgangssprachlichen und Chat-artigen Kommunikation
Die Antworten des natürlichen Sprachassistenten stammen also primär von dem sich weiterentwickelnden Set an möglichen Siri Anfragen und, wenn dort nicht interpretierbar, von einer generativen KI vom Schlage ChatGPTs.
Verpasst man der Sprachausgabe dann einen beliebigen animierten und lippensynchronen Avatar, hat man einen vollumfänglichen, umgangssprachlichen Assistenten auf dem Bildschirm, der sehr natürlich wirkt.
Wie diese mächtigen Erweiterungen der bisherigen Siri Funktionen durch die obigen vier KI Elemente wirken, wird am Besten durch das Apple Video „Knowledge Navigator“ aus dem Jahr 1987 begreifbar: