top of page

3. April 2025

Der KI-Forscher Björn Ommer erklärt, wie Deutschland bei KI noch eine Chance hat


Dass Deutschland im Hype um generative Künstliche Intelligenz international überhaupt wahrgenommen wird, haben wir auch ihm zu verdanken: dem Forscher Björn Ommer von der Uni München. Seine Forschungsgruppe steckte hinter Stable Diffusion, seine ehemaligen Doktoranden spielen mit FLUX an der Weltspitze mit. Er selbst verfolgt ein ambitioniertes Projekt: ein multimodales Foundation Model, Made in Bavaria.


Ein Interview von Wolfgang Kerler


Björn Ommer gehört zu Deutschlands wichtigsten KI-Forschern, wurde mit dem Zukunftspreis des Bundespräsidenten und dem Deutschen KI-Preis ausgezeichnet und hat an der Ludwigs-Maximilians-Universität den Lehrstuhl für Künstliche Intelligenz für Computer Vision und Digital Humanities/die Künste inne.


Seine Forschungsgruppe entwickelte zunächst in Heidelberg, dann in München den KI-Bildgenerator Stable Diffusion – und bewies damit, dass Europa durchaus das Zeug zu weltweit erfolgreichen KI-Modellen hat. Jetzt treibt er ein noch ambitionierteres Projekt voran, das anfangs „BayernGPT“ genannt wurde, aber weit darüber hinaus gehen soll: ein multimodales Foundation Model, das technologisch mindestens auf Augenhöhe mit Big Tech sein und die deutsche Wirtschaft souverän ins KI-Zeitalter bringen soll.


Nach einem ausführlichen 1E9-Interview 2022 und Vorträgen beim Festival der Zukunft 2023 und 2024 kehrt er auch dieses Jahr zu 1E9 zurück – mit diesem Interview und als Speaker beim Festival der Zukunft 2025 von 1E9 und Deutschem Museum.


1E9: Sie bezeichnen generative Künstliche Intelligenz als „Revolution“, die so bedeutsam ist wie Strom oder das Internet. Warum diese Superlative?


Björn Ommer: „Strom und das Internet wurden zur Grundlage für unzählige Anwendungen, die sich die Menschen vorher überhaupt nicht vorstellen konnten. Und das wird bei generativer KI genauso sein. Sie ist eine mächtige Ermöglichungstechnologie.“


Inwiefern?


Björn Ommer: „Weil sie als Nachbrenner für PCs wirkt. Die haben wir zwar seit Jahrzehnten, aber für die breite Masse waren Computer nicht uneingeschränkt nutzbar. Das einzig Persönliche am PC war bisher, dass wir ihn persönlich kaufen und bezahlen konnten. Aber die Programme waren ,von der Stange‘, programmiert von Experten, die dem Computer mühsam per Programmiersprache etwas Neues beigebracht haben.


Björn Ommer wird dieses Jahr die Main Stage des Festivals der Zukunft mit seiner Keynote eröffnen – am 3. Juli im Forum der Zukunft des Deutschen Museums. Hier findet ihr alle Informationen zum Event!
Björn Ommer wird dieses Jahr die Main Stage des Festivals der Zukunft mit seiner Keynote eröffnen – am 3. Juli im Forum der Zukunft des Deutschen Museums. Hier findet ihr alle Informationen zum Event!

Mit generativer KI versteht uns der PC endlich in natürlicher Sprache. Er lernt, was wir brauchen, und liefert uns dann Lösungen, die wirklich unseren Bedürfnissen entsprechen. Damit können alle Menschen die Fähigkeiten der Computer voll ausschöpfen, nicht nur die, die programmieren können. Die Grenze ist dann nur noch unsere Vorstellungskraft.“


Sie scheinen allerdings zu befürchten, dass es der deutschen Industrie genau an dieser Vorstellungskraft mangelt. Denn Sie warnen, dass es ihr wie den Unternehmen gehen könnte, die vor 100 Jahren Ozeanriesen über die Weltmeere schickten. Bis das Flugzeug kam. Wie kommen Sie zu diesem Vergleich?


Björn Ommer: „Die großen Schifffahrtsgesellschaften verstanden sich wirklich nur als solche – als Schifffahrtsgesellschaften, die Menschen und Waren verschiffen. Sie erkannten nicht, dass sie eigentlich Transportunternehmen sind. Anstatt sich zu transformieren, bauten sie deshalb immer größere und luxuriösere Schiffe. Die Erfindung der Flugzeugturbine machte sie überflüssig.


Eine ähnliche Entwicklung droht Europa bei generativer KI, wenn wir sie nur als weiteres Automatisierungstool begreifen, um unsere bestehenden Technologien und Prozesse zu optimieren, anstatt grundlegend neue Wege zu gehen. Um das zu verhindern, müssen wir lernen, durch die Brille von generativer KI auf alle Produkte und Prozesse zu schauen – jenseits unserer bisherigen Beschränkungen. Damit eröffnen sich völlig neue Möglichkeiten, aber es bedeutet auch eine gewaltige Transformation.“


Haben Unternehmen und Politik hierzulande das erkannt?


Björn Ommer: „Seit ein paar Monaten habe ich endlich das Gefühl, dass dem so ist. Spätestens seit der Rede des amerikanischen Vizepräsidenten J.D. Vance bei der großen KI-Konferenz in Paris Mitte Februar 2025 sollte außerdem klar sein, dass wir bei Künstlicher Intelligenz nicht von externen Akteuren abhängig sein wollen.“


Wieso das?


Björn Ommer: „Seine Botschaft war, dass die USA vorhaben, ihre hegemoniale Rolle bei Künstlicher Intelligenz zu behaupten – und wir Europäer vielleicht ein bisschen mitspielen dürfen, wenn wir amerikanische Unternehmen nicht zu streng regulieren. Der französische Präsident Macron saß dabei in der ersten Reihe.“


Bis diese Erkenntnis zur Bedeutung von generativer KI bei uns gereift ist, haben andere Länder viele Milliarden ins „AI Race“ investiert, also ins Wettrennen um die leistungsfähigste KI. Allen voran die USA und China. Ist es nicht längst ausgemachte Sache, dass wir von KI aus diesen Ländern abhängig sein werden?


Björn Ommer: „Nein, pauschal sehe ich das nicht so. Bei Hardware werden wir vorerst zwar auf Grafikprozessoren von amerikanischen Unternehmen wie Nvidia angewiesen sein. Diese Chips bilden das Substrat für KI-Entwicklung. Aber bei Software hat Europa eine Chance.


Bei Software hat Europa eine Chance.

Aktuell dominieren die Foundation Models von Unternehmen wie OpenAI, Anthropic oder Google. Doch der Erfolg des chinesischen Start-ups DeepSeek zeigt – bei aller Skepsis, die man gegenüber Angaben aus China haben muss –, dass es auch mit deutlich weniger Budget und ohne die leistungsstärkste Hardware möglich ist, konkurrenzfähige KI-Modelle zu entwickeln. Mit Stable Diffusionen haben wir mit einem millionenfach genutzten Foundation Model ebenfalls vorgelegt.“


Ihre ehemaligen Doktoranden haben inzwischen im Schwarzwald das Start-up Black Forest Labs gegründet, das mit FLUX einen der besten KI-Bildgeneratoren der Welt entwickelt hat. Eine der wenigen großen KI-Erfolgsgeschichten in Deutschland.


Björn Ommer: „Gerade deshalb können wir stolz auf das sein, was hier gelungen ist.“


Foundation Models, das sind große KI-Modelle, die mit riesigen Datenmengen trainiert werden und so flexibel sind, dass sie durch gezieltes Feintuning für unterschiedliche Aufgaben angepasst werden können. Warum ist es so wichtig, dass Europa hier aufholt – auch jenseits von Stable Diffusion oder FLUX?


Björn Ommer: „Foundation Models bilden die Grundlage für viele KI-Anwendungen und werden zu einer kritischen Infrastruktur. Es reicht nicht, nur Nutzer solcher Modelle zu sein. Wir brauchen eigene Expertise, um einschätzen zu können, was diese Modelle leisten, wo ihre Schwächen liegen und welche neuen Anwendungen auf ihrer Basis möglich sind. Sonst sind wir darauf angewiesen, was uns von großen Firmen zur Verfügung gestellt wird.“


Also müssen wir in Europa eigene Foundation Models entwickeln?


Björn Ommer: „Ja, unbedingt. Wer nicht aktiv mitgestaltet, läuft Gefahr, den Anschluss zu verlieren. Denn die Technologie entwickelt sich im Wochenrhythmus weiter. Wenn wir nicht selbst an Foundation Models arbeiten, bleiben wir außen vor. Viele der bestehenden Modelle sind zudem nicht wirklich Open Source, sondern nur in Teilen zugänglich.“


Nun gibt es in Bayern ein eigenes KI-Projekt, an dem Sie maßgeblich beteiligt sind. Anfangs war von ,BayernGPT‘ die Rede.


Björn Ommer: „Genau. Der Name ,BayernGPT‘ suggerierte allerdings, dass wir einfach ChatGPT nachbauen wollen. Die großen Tech-Konzerne haben sich bislang vor allem auf Textmodelle konzentriert – auf große Sprachmodell, LLMs, in die sie fast das gesamte Internet gefüttert haben. Jetzt werden diese LLMs immer stärker mit Bildmodellen verschränkt, damit sie ein gewisses Bildverständnis entwickeln.


Wir setzen jedoch auf echte Multimodalität. Unser Ziel ist also die Entwicklung eines KI-Modells, das nicht nur mit Text oder Bildern umgehen kann, sondern auch mit Daten aus der Industrie oder der Robotik.“


Warum sollte sowas in Bayern gelingen – und sich dann auch noch gegen wöchentlich neue Modelle der internationalen Tech-Konzerne durchsetzen?


Björn Ommer: „Die gemeinsame Arbeit  an einem leistungsfähigen multimodalen Foundation Model hilft, die Stärken der sehr breit aufgestellten bayerischen Forschungs- und Industrielandschaft zu bündeln. Insbesondere kann so kritische Expertise ausgebaut werden – besonders im Engineering, also praktische Fähigkeiten in der Datenvorverarbeitung und im Training großer Modelle.


Und die Geschwindigkeit, mit der internationale Player die Entwicklung vorantreiben, bedeutet nicht, dass sie schon alle Probleme gelöst haben. Gerade im Bereich der echten Multimodalität und der industriellen Anwendbarkeit von KI existieren noch große Lücken. Hier können wir neue Potentiale erschließen.


Unser Modell wird offen, transparent und rechtlich abgesichert sein.

Bei den großen kommerziellen Anbietern gibt es zudem bei Transparenz und regulatorischen Aspekten noch offene Fragen. Unser Modell wird offen, transparent und rechtlich abgesichert sein, um Unternehmen als Sprungbrett für Innovation zu dienen – gerade auch kleinen und mittelständischen Unternehmen.“


Wo steht das Projekt aktuell? Und gibt es bereits einen offiziellen Namen?


Björn Ommer: „Wir sprechen von einer bayerischen ,Multimodal Foundation Model Initiative‘. Einen Namen haben wir bisher bewusst nicht festgelegt. Aktuell arbeiten wir daran, die nötige Hardware aufzubauen, das nötige Personal aus Forschung und Unternehmen zu bekommen sowie Forschung und Industrie stärker miteinander zu vernetzen.


Das bayerische Wissenschaftsministerium spielt eine zentrale Rolle und stellt einen signifikanten Teil der Mittel bereit. Wichtig ist, dass das Projekt als Plattform für die gesamte bayerische Forschungs- und Wirtschaftslandschaft dient und langfristig ein Ökosystem aufbaut, ähnlich wie es in amerikanischen Forschungsclustern wie Stanford existiert.“


Es geht also nicht nur um das Foundation Model?


Björn Ommer: „Das Modell ist ein Fokalpunkt, aber die eigentliche Zielsetzung geht weit darüber hinaus. Wir wollen mit dieser Initiative essentielle Fähigkeiten ausbauen, die Verbindung zwischen den unterschiedlichen Akteuren stärken und langfristig eine wettbewerbsfähige KI-Landschaft in Bayern und Deutschland etablieren.“


Vorhin sagten Sie, dass das bayerische KI-Modell, das rechtssicher und Open Source sein soll, gerade für kleine und mittelständische Unternehmen von Bedeutung ist. Wie könnten diese profitieren?


Björn Ommer: „Wir haben in Deutschland viele kleine und mittelständische Unternehmen, die nicht notwendigerweise Tech-Firmen sind, für die KI aber jetzt und in Zukunft immer relevanter wird.


Bisher hatten diese Unternehmen – davon abgesehen, dass sie über viel weniger Kapital verfügten als amerikanische Big Tech-Konzerne – ein großes Problem: Ihnen fehlte das Knowhow. Sie hatten schlicht nicht genug Menschen, die sich mit KI beziehungsweise Machine Learning beschäftigen konnten, um ihr Geschäft damit zu transformieren.


Generative KI ändert das grundlegend, weil man mit ihr in natürlicher Sprache interagieren kann. Man muss nicht erst Informatik studieren, um sie zu nutzen – obwohl ich als Informatikprofessor natürlich empfehlen würde, das trotzdem zu tun!


Generative KI kann Prozesse vereinfachen, indem sie beispielsweise aus Bleistiftskizzen fertige Web-Oberflächen generiert oder komplexe Datenanalysen ermöglicht, ohne dass man zuvor Daten umständlich homogenisieren und in Excel-Tabellen pressen muss. Jetzt kann ich der KI unstrukturierte Rohdaten geben und sie hilft mir, diese zu analysieren.“


Besteht nicht trotzdem die Gefahr, dass der deutsche Mittelstand von internationalen Tech-Konzernen mithilfe von KI überflügelt wird?


Björn Ommer: „Ein entscheidender Vorteil der kleinen und mittleren Unternehmen liegt darin, dass sie viel näher an ihren Kunden sind. Sie haben direkten Zugang zu spezifischen Daten und Expertenwissen in ihren Bereichen.


Was bringen einem KI-Modell noch eine Milliarde Partyfotos?

Während große Konzerne massenhaft generische Daten aus dem Internet nutzen, sitzen viele Mittelständler auf einem Datenschatz, den die Tech-Giganten gar nicht haben. Was bringen einem KI-Modell noch eine Milliarde Partyfotos, wenn es um die Verbesserung industrieller Prozesse geht?


Viele deutsche Unternehmen sind Weltmarktführer in ihren jeweiligen Nischen. Ihre Daten sind oft proprietär und hoch spezialisiert. Wenn wir ihnen die Möglichkeit geben, KI-Modelle zu nutzen, die nicht über Server in Übersee laufen müssen, sondern lokal betrieben werden können, dann könnten sie diesen Datenschatz viel gezielter ausschöpfen. Und genau da setzt unsere Forschung an.“


Das klingt alles richtig vielversprechend. Aber wie schafft man es, dass diese Unternehmen, die sich selbst nicht als Tech-Firmen verstehen, tatsächlich auf Künstliche Intelligenz setzen?


Björn Ommer: „Das ist eine der zentralen Herausforderungen. Wir erleben hier eine technologische Revolution, die in einer enormen Geschwindigkeit voranschreitet. Schauen Sie sich an, wie lange es gedauert hat, bis das Internet oder Mobiltelefone massentauglich wurden – Jahrzehnte. Generative KI dagegen verbreitet sich innerhalb weniger Monate.


Viele Unternehmen haben sehr lange reflektiert: Ist das nur ein Hype oder hat das langfristig Bestand? Ich denke, mittlerweile sehen wir, dass es sich um eine fundamentale Veränderung handelt. Doch die Einführung neuer Technologie ist nicht nur eine technische, sondern auch eine kulturelle Frage. Es geht um ein Umdenken: Nicht nur bestehende Prozesse zu digitalisieren, sondern völlig neue Geschäftsmodelle zu entwickeln.


Das ist etwas, worin die USA traditionell sehr gut sind – dort wird nicht nur daran gedacht, wie bestehende Prozesse effizienter werden können, sondern wie neue Märkte entstehen. Wir in Deutschland haben oft eher die Tendenz, darüber nachzudenken, welche Jobs durch neue Technologie überflüssig werden könnten. Aber genau wie die moderne Telekommunikation oder der Personal Computer wird KI neue Arbeitsfelder schaffen.“


Ein anderer Punkt, den wir schon mehrfach angesprochen haben, ist die Bedeutung von Open Source in der KI. Sind offene Modelle der Weg in die Zukunft? Werden sie sich am Ende vielleicht sogar gegen die geschlossenen Modelle kommerzieller Unternehmen durchsetzen?


Björn Ommer: „Wir haben in vielen kritischen Bereichen Offenheit und einheitliche Standards eingefordert. In der Medizin verlangen wir Transparenz über die Wirkmechanismen von Medikamenten, in der Luftfahrt setzen wir auf strenge Sicherheitsstandards. Warum sollte es bei KI anders sein?


Gleichzeitig muss man aber differenzieren: Viele Unternehmen werben mit ,Open Source‘, aber oft sind nur die Modellgewichte frei verfügbar, nicht die Trainingsdaten oder der Code für das Training. Modellgewichte sind die Parameter, die das Verhalten des KI-Modells steuern – sozusagen das Gedächtnis des Modells. Ohne die Daten und den Trainingsprozess bleibt jedoch unklar, wie genau das Modell zu seinen Ergebnissen kommt. Das ist ein Unterschied, den wir klar erkennen müssen.


Transparenz ist also wichtig, aber natürlich wird es immer Bereiche geben, in denen Unternehmen mit KI Geld verdienen können – und das ist auch zentral für eine KI-Ökononomie. Entscheidend ist, dass wir eine Balance zwischen Offenheit und wirtschaftlicher Nutzbarkeit finden.“


Der aktuelle Trend sind KI-Agenten, die nicht nur Antworten liefern, sondern eigenständig Aufgaben übernehmen. Ist das die nächste Stufe der Evolution oder nur eine Spielerei?


Björn Ommer: „Die bisherigen Foundation Models waren erstaunlich leistungsfähig, selbst ohne auf eine bestimmte Aufgabe trainiert zu sein. Sie konnten programmieren, Texte schreiben, Bilder generieren – vieles davon war überraschend.


Der nächste Schritt sind nun Agentenmodelle, die nicht nur einzelne Aufgaben lösen, sondern ganze Prozesse steuern. Das ist enorm spannend. Zum Beispiel könnte ich der KI sagen, dass ich heute Abend Zeit habe, und sie würde dann nicht nur ein passendes Restaurant finden, sondern gleich eine Reservierung vornehmen, ein Taxi buchen und vielleicht sogar basierend auf meinen Vorlieben das beste Gericht für mich auswählen. Diese tiefe Integration macht die KI persönlicher und damit noch nützlicher.


Je stärker eine KI in den Alltag integriert ist, desto besser kann sie den Nutzer verstehen.

Je stärker eine KI in den Alltag integriert ist, desto besser kann sie den Nutzer verstehen – sei es in Arbeitsabläufen oder im Privatleben. Durch diese personalisierte Nutzung erhält sie mehr Daten und kann wiederum noch hilfreicher werden. Dadurch entsteht ein großer Vorteil gegenüber generischen Modellen, die zwar lernen, aber weniger spezifisch auf den Einzelnen eingehen können.“


Das klingt alles ziemlich gut, doch Sie klingen, als hätte die Sache einen Haken.


Björn Ommer: „Ja, denn gleichzeitig stellt sich die Frage, wer von diesen Entwicklungen am meisten profitiert. Unternehmen haben in den letzten Jahren große Mengen an Daten aus dem Internet genutzt – oft ohne klare rechtliche Grundlage. Bei KI-Agenten sind es die Nutzer selbst, die ihre persönlichen Daten freiwillig preisgeben – oft ohne sich der Konsequenzen bewusst zu sein.


Es bleibt abzuwarten, ob diese Daten offiziell für das Training der Modelle verwendet werden oder ob dies inoffiziell geschieht. Fakt ist: Wer die aktuell beste KI anbietet, erhält den direktesten Zugang zu neuen Daten, mit denen das Modell noch weiter verbessert wird. Ein sich selbst verstärkender Kreislauf entsteht. Deshalb ist es wichtig, dass jeder genau überlegt, welche Daten er solchen Modellen zur Verfügung stellt.


Wenn KI-Agenten rein lokal auf eigener Hardware laufen und es keinen Rückkanal gibt – also keine Daten an Unternehmen weitergeleitet werden – sieht die Situation anders aus. In solchen Fällen könnte man diese Agenten guten Gewissens auch für sehr persönliche Aufgaben nutzen.“


Kommt nach den KI-Agenten die AGI, die Allgemeine Künstliche Intelligenz, die es mit den kognitiven Fähigkeiten von Menschen aufnehmen kann? Oder sogar die Superintelligenz?


Björn Ommer: „AGI wird oft überdramatisiert – sowohl als Schreckgespenst als auch als Marketingversprechen. Tatsächlich haben wir schon heute sehr allgemeine KI-Modelle, die in vielen Bereichen leistungsfähig sind. Doch sie sind nicht mit menschlicher Intelligenz vergleichbar.


AGI wird oft überdramatisiert.

Mein Ziel ist es, KI als Werkzeug zu entwickeln, das uns ergänzt und unterstützt, anstatt uns zu ersetzen. Die spannende Frage ist nicht, wann AGI kommt, sondern wie wir KI sinnvoll nutzen, um unser Leben und Arbeiten zu verbessern.“


Du willst Björn Ommer live hören? Dann komm zum Festival der Zukunft 2025!



Wolfgang Kerler

Wolfgang Kerler

Chefredakteur

6

Cooler Artikel!

NewBot3.png
Job, der Bot

Das dürfen leider nur 1E9-Mitglieder.

Werde 1E9-Mitglied, um diesen Artikel weiterzulesen!

NewBot3.png

1E9 bietet dir gut recherchierten Journalismus, Newsletter und Podcasts über Zukunftstechnologien, dazu inspirierende Events und eine Community von Menschen, die Zukunft gestalten wollen.

Job, der Bot
NewBot3.png
Job, der Bot

Wir freuen uns immer über Feedback, als Mitglied kannst du auch kommentieren.

Hi, ich bin Job, der Bot! Konntest du mit diesem Artikel etwas anfangen?

NewBot3.png
Job, der Bot

Das freut mich zu hören!

Darf ich fragen warum?

Leider gab es einen Fehler. Bitte probiere es später noch einmal!

Kommentare (1)

0x78
0x78
Apr 01

Foundation models zu bauen kostet doch sehr viel (Compute infra / Energie). Ist etwas zum Budget bekannt mit dem man für das Bayern Modell arbeiten kann?


Klingt auf jeden Fall sehr sinnvoll wenn man auch mit Industrie Daten / robotics arbeiten könnte!


Was macht man hierbei in der Modell Architektur anders als die großen US Firmen oder Deepseek etc? Es scheint ungelöste Probleme zu geben für wirklich multimodale Modelle und für die Fähigkeit zur sinnvollen Verarbeitung von Industriedaten.

3

Weiter bei 1E9...

Überschrift 3

Cooler Artikel!

Überschrift 3

Artikel

Überschrift 3

Cooler Artikel!

Überschrift 3

Cooler Artikel!

bottom of page