Das KI-Start-up Midjourney will eine eigene Hardware bauen

,

Das KI-Unternehmen Midjourney hat den weltweit beliebtesten KI-Bild-Generator entwickelt. Jetzt will es auch eine eigene Hardware bauen. Worum es sich dabei handeln könnte, darüber wird viel spekuliert. Geleitet werden soll die Entwicklung von einem der Verantwortlichen für Apples Vision Pro.

Von Michael Förtsch

In den letzten zwei Jahren haben sich Bild-Generatoren zu einer der meist genutzten Technologien entwickelt, die auf Künstlicher Intelligenz basieren. Wenige Worte als Prompt genügen, um eine Illustration, eine Skizze oder sogar ein ansprechendes Kunstwerk zu generieren. Die bekannteste und wahrscheinlich meistfrequentierte Plattform dafür ist Midjourney, auch wenn sie zunehmend Konkurrenz durch konkurrierende Dienste wie Ideogram und offene Modelle wie Stable Diffusion, Aura Flow und Flux bekommt. Hinter Midjourney steht das gleichnamige Start-up aus San Francisco, das zuletzt fast 21 Millionen Nutzer zählte. Dieses will nun offenbar auch eigene KI-Hardware entwickeln.

Wie Midjourney-Gründer David Holz immer wieder betont, arbeitet das Unternehmen mit zuletzt weniger als 100 Festangestellten sehr profitabel. Ein Großteil des Geldes werde in neue Projekte investiert. Unter anderem arbeitet Midjourney an einem Video-Generator, der Runways Gen-3 und sogar dem Sora-Modell von OpenAI ebenbürtig sein soll. Wobei das Team hier einen anderen Ansatz verfolgen will als die Konkurrenz. Geplant ist auch ein KI-3D-Modellgenerator, der es erlaubt, mit einfachen Kommandos vollständig dreidimensionale Figuren zu erzeugen, die beispielsweise in Videospiele integriert werden können.

Wie Midjourney jetzt bekannt gab, arbeitet das Unternehmen aber auch an einem Hardware-Projekt. Bereits im Dezember hatte das Team dafür Ahmad Abbas eingestellt. Dieser hatte zuvor unter anderem bei Elon Musks Firma Neuralink an einer Gehirn-Computer-Schnittstelle und bei Apple an der Entwicklung der Mixed-Reality-Brille Apple Vision Pro mitgearbeitet. Außerdem arbeitete er bei Leap Motion, einem von David Holz mitgegründeten Unternehmen, das eine Technologie zur Fingererkennung entwickelte.

Eine mysteriöse Kugel?

Woran Midjourney mit seinem Hardware-Projekt genau arbeitet, ist noch geheim. Nur der Codename ist bekannt: Midjourney Orb. Spekulationen zufolge könnte es sich dabei um eine speziell für KI-Künstler entwickelte Steuerkonsole handeln, die Prompts als Spracheingaben verarbeiten, Bilder und Objekte mit 3D-Kameras scannen kann und mit der generierte Bilder, Videos und 3D-Objekte durch Handgesten manipuliert und verändert werden können. Ähnliche Technologien gibt es bereits. Unter anderem haben einzelne Entwickler Möglichkeiten veröffentlicht, das offene KI-Modell Stable Diffusion mit Drehreglern oder Bewegungssteuerungen zu nutzen.

Werde Mitglied von 1E9!

Hier geht’s um Technologien und Ideen, mit denen wir die Welt besser machen können. Du unterstützt konstruktiven Journalismus statt Streit und Probleme! Als 1E9-Mitglied bekommst du frühen Zugriff auf unsere Inhalte, exklusive Newsletter, Workshops und Events. Vor allem aber wirst du Teil einer Community von Zukunftsoptimisten, die viel voneinander lernen.

Jetzt Mitglied werden!

Es gibt aber auch Vermutungen, dass es sich beim Orb um einen neuartigen Computer oder eine Spielkonsole handeln könnte, die über das Internet als dezentraler Supercomputer vernetzt wird. Denn Ziel des Orb ist es laut David Holz auch, die Leistungsfähigkeit und Effizienz von Midjourney nachhaltig zu verbessern. Auch hat er in Interviews immer wieder darauf hingewiesen, dass er den Bild-Generator von Midjourney als „sehr langsame Videospiel-Engine“ betrachtet. Die Zukunft sei aber „nicht ein Bild pro Minute, sondern 60 Bilder pro Sekunde in räumlichem 3D“. Midjourney solle ein kreativer Sandkasten werden: „Die Leute werden Videospiele damit machen, die Leute werden Filme damit machen, aber das Ziel ist es, eine Open-World-Sandbox zu bauen“.

Dass derartiges grundsätzlich möglich ist, haben erst vor wenigen Tagen einige Entwickler von Google gezeigt. Sie haben mit GameNgen ein KI-System entwickelt, das den Spieleklassiker Doom vollständig in einem KI-Modell simuliert. Dabei werden Bilder des Spielinhalts mit 20 Bildern pro Sekunde durch eine modifizierte Version des Text-zu-Bild-Modells Stable Diffusion 1.4 erzeugt. Die Simulation ist jedoch nicht perfekt. Das Modell ist nicht in der Lage, Informationen langfristig zu speichern und erzeugt teilweise fehlerhafte Bilder.

Hat dir der Artikel gefallen? Dann freuen wir uns über deine Unterstützung! Werde Mitglied bei 1E9 oder folge uns bei Twitter, Facebook, Instagram oder LinkedIn und verbreite unsere Inhalte weiter. Danke!

Sprich mit Job, dem Bot!

Job, der Bot

War der Artikel hilfreich für dich? Hast du noch Fragen oder Anmerkungen? Ich freue mich, wenn du mir Feedback gibst!