Diese Kamera „fotografiert“ Orte komplett mit Künstlicher Intelligenz – und ohne Linse

Ein dänischer Designer hat eine Kamera entworfen, die Orte vollkommen ohne Objektive ablichtet. Stattdessen werden die Bilder rein aus einem Prompt generiert, der den Bildinhalt beschreibt. Erstellt wird das Foto durch eine Künstliche Intelligenz im Internet. Der Designer will dadurch zu einer Debatte darüber anregen, was Fotos eigentlich sind.

Von Michael Förtsch

Vor fast 200 Jahren wurde das erste Foto der Welt aufgenommen. Es stammt von Joseph Nicéphore Niépce und wurde aus seinem Arbeitszimmer im französischen Saint-Loup-de-Varennes angefertigt. Und zwar mit einer Camera Obskura, die eine kleine mit Lavendelöl und Asphalt beschichtete Zinnplatte belichtete. Obwohl die Aufnahme ziemlich unscharf und kontrastarm ausfiel, lässt die bis heute erhaltene Platte den Teil eines Fensters, ein Taubenhaus und ein kleines Gebäude mit Kamin erkennen. Die Kamera von Niépce lichtete die Kulisse so ab, wie sie wirklich war. Genau wie es die Aufgabe einer Kamera ist, oder nicht?

Der in Amsterdam lebende, aus Dänemark stammende Designer Bjørn Karmann will das in Frage stellen. Denn mit der Paragraphica hat er eine Kamera entwickelt, die nur eine Scheinrealität einfängt – mittels Künstlicher Intelligenz.

Auf den ersten Blick gleicht die Kamera des beim Designstudio oio arbeitenden Dänen einer gewöhnlichen Digitalkamera. Sie verfügt über ein Display an der Rückseite, mehrere silberne Stellräder und einem roten Auslöser. Aber dort, wo ein Objektiv mit Linsen sitzen sollte, befindet sich eine bizarre rote Konstruktion, die etwas an einen Stern erinnert. „Sie soll eine Datenantenne symbolisieren, da die Linse nicht mit Licht, sondern mit Daten arbeitet“, sagt Karmann. Die Form sei von Radioantennen, aber auch der sonderbar geformten Nase eines Maulwurfs inspiriert, der seine Umgebung nicht sieht, sondern nur ertasten und über elektrische Reize erspüren kann.

Ganz ähnlich sei es bei der Paragraphica. Wird die Kamera auf eine Szene gerichtet, taucht auf dem Display der Rückseite kein Abbild wie im Sucher einer Digitalkamera auf. Stattdessen ist dort die Beschreibung der Umgebung als Text-Prompt zu sehen: „Ein Foto bei Nacht, aufgenommen bei der Museumsinsel 1, 80538 München. Das Wetter ist klar, die Temperatur beträgt 15 Grad. Das Datum ist der 13. Juni 2023. Ein Museum, eine Brücke und ein Fluss befinden sich in der Nähe.“ Über die Drehräder lassen sich das Sichtfeld, der Stil – etwa ein Foto, ein Öl- und Wasserfarbengemälde – und das Jahr einstellen.

Wird der Auslöser gedrückt, dauert es einige Sekunden, dann erscheint das Bild. Das entspricht nicht dem realen Ort, aber oft durchaus der Beschreibung dessen, was im Prompt steht. „Die meiste Zeit zeigen die Bilder etwas völlig anderes [als die echte Umgebung]“, sagt Karmann. „Aber ich habe festgestellt, dass an Orten, die bekannter sind, die Fotos oft besser ausfallen. Das macht auch total Sinn. Denn die sind dann natürlich besser dokumentiert.“ Erstellt werden die Fotos dieser bizarren Kamera mittels des KI-Text-zu-Bild-Generators Stable Diffusion, der mit Milliarden von Bildern aus dem Internet trainiert wurde und für jeden frei verfügbar ist.

Ein Prozess

Für Bjørn Karmann ist die Paragraphica ein Kunstprojekt – und eine Möglichkeit, sich näher mit dem Thema Künstliche Intelligenz auseinanderzusetzen. „Ich nehme mir gerne schwierige Themen und schwer greifbare Konzepte vor und versuche dafür Formen zu finden, die sie besser verständlich machen“, sagt er. Dazu gehöre eben auch maschinelles Lernen und Denken – und derzeit insbesondere die Möglichkeit mit Künstlicher Intelligenz Kunst zu erstellen. Das erste Mal habe er 2017 bei einer Designagentur mit einer KI namens Pix2Pix gearbeitet. Später sei er auf einer Reise durch Norwegen auf Stable Diffusion aufmerksam geworden.

Die Idee für die KI-Kamera sei daher nicht in einem Heureka-Moment geboren worden, sondern habe sich aus vielen verschieden Einflüssen ergeben. Einer sei das Buch An Immense World gewesen, in dem der Autor Ed Yong sich mit der Wahrnehmung von verschiedenen Lebewesen auseinandersetzt. „Außerdem habe ich viel darüber nachgedacht, welche riesigen Datenberge mit Orten verknüpft sind“, sagt er. Mit einer Google-Suche lassen sich zu vielen Plätzen rund um die Welt verschiedenste Fotos finden. Nahezu die gesamte Erde ist mit Satellitendaten aus dem Weltall erkennbar. Es existieren frei nutzbare Kartendaten, Datenbanken mit Bebauungsinformationen und natürlich lässt sich fast für jeden Winkel des Planeten das aktuelle Wetter bestimmen.

„Wenn man nun diese Gedanken kombiniert, wird einem klar, dass die großen KI-Modelle heute eine ziemlich gute Vorstellung davon haben könnten, wie unsere Welt aussieht oder ein bestimmter Ort, wenn man sie mit ein den nötigen Parametern füttert“, sagt Karmann. Er glaube zwar nicht, dass heutige KI-Modelle so etwas wie ein Bewusstsein besitzen, aber findet die Vorstellung faszinierend, dass sich ein KI-Modell ohne optische Informationen, nur basierend auf Daten, die in den Prompt eingetippt werden, eine Vorstellung eines Ortes machen kann. Sich also eine Wahrnehmung simulieren lässt – und das basierend auf Prozessen, die ein Mensch wohl nie vollständig nachempfinden kann.

Erinnerungsrealität?

Von der Idee zur Kamera dauerte es nur rund sechs Wochen gedauert. Das Gehäuse erstellte der Designer mit einem 3D-Drucker. Im Inneren befinden sich einige Kabel und ein Raspberry-Pi-Einplatinen-Computer, der über das Smartphone mit dem Internet verbunden ist und über ein GPS-Signal die Standortdaten erfragten kann. Über den Standort dann brauchbare Ortsinformationen zu ermitteln, sei mit die größte Herausforderung gewesen, meint Karmann. Denn um das Wetter, Angaben zum Aussehen des Ortes und andere Prompt-taugliche Informationen zu akkumulieren, musste Karmann eine eigene Software entwickeln, die genau diese aus verschiedenen Quellen sammelt und zusammensetzt.

Der Rest sei hingegen vergleichsweise einfach. Der Prompt wird über eine Schnittstelle an einen Server übermittelt, auf dem Stable Diffusion läuft und das Bild generiert. Das Open-Source-Bildmodell sei „am einfachsten aufsetzbar“ gewesen – daher habe er sich dafür und nicht etwa für DALLE 2 entschieden. Und mit einer niedrigen Zahl an Berechnungsschritten zeige Stable Diffusion auch noch interessante Artefakte, die den KI-Ursprung des Bildes erkennen lassen. Das fertige Bild wird dann zurück an die Kamera gesendet und angezeigt. „Der Raspberry Pi macht also eigentlich recht wenig“, sagt Karmann daher. „Das meiste geschieht im Internet.“

Für den Designer sind die entstehenden Bilder eindeutig keine Fotografien. Aber er wolle mit diesem Projekt schon in Frage stellen, „was heute noch ein Foto ist“. Denn viele Fotografien werden inzwischen ungefragt durch Künstliche Intelligenz verbessert, so dass sie nicht die Realität, sondern fast ausschließlich ein idealisiertes Abbild dergleichen erstellen. „Wir haben uns allerdings so sehr an diese manipulierten Bilder gewöhnt, dass wir sie ganz klar als Fotos akzeptieren“, sagt der Designer. „Die Paragraphica treibt das gewissermaßen auf die Spitze.“ Denn ihre Fotos basieren vollkommen auf Daten und Berechnungen, die das Motiv gänzlich von der Realität entkoppeln.

Werde Mitglied von 1E9!

Hier geht’s um Technologien und Ideen, mit denen wir die Welt besser machen können. Du unterstützt konstruktiven Journalismus statt Streit und Probleme! Als 1E9-Mitglied bekommst du frühen Zugriff auf unsere Inhalte, exklusive Newsletter, Workshops und Events. Vor allem aber wirst du Teil einer Community von Zukunftsoptimisten, die viel voneinander lernen.

Jetzt Mitglied werden!

Die Scheinrealität kann, wie Karmann sagt, dennoch einen Wert haben und ganz reale Gefühle hervorrufen. „Ich fand die Bilder meiner Heimatstraße etwa sehr überraschend, da sie einige wirklich emotionale und fast traumartige Erinnerungen hervorgerufen haben“, sagt er. „Beispielsweise wenn die Gebäude und das Licht genauso aussehen, wie ich es bei bestimmten Momenten in Erinnerung habe. Das lässt mich dann schon darüber grübeln, ob die Fotos der Paragraphica nicht vielleicht genauso wie unsere Erinnerungen sind: irgendwie diffus, aber überzeugend genug. Es ist merkwürdig.“

Wer die Paragraphica selbst austesten mag, der kann das über die Website des Designers in vollends digitaler Weise tun. Bis vor kurzem ging das kostenfrei, aber mittlerweile müssen für einige digitale Schnappschüsse zwei Euro entrichtet werden. Denn jedes berechnete Bild kostet Bjørn Karmann mehrere Cent – und das Interesse an der Kamera ist durchaus groß. Er hofft daher, die Kamera und ihre Fotos in Zukunft in einem Museum ausstellen zu können.

Hat dir der Artikel gefallen? Dann freuen wir uns über deine Unterstützung! Werde Mitglied bei 1E9 oder folge uns bei Twitter, Facebook, Instagram oder LinkedIn und verbreite unsere Inhalte weiter. Danke!

Sprich mit Job, dem Bot!

Job, der Bot

War der Artikel hilfreich für dich? Hast du noch Fragen oder Anmerkungen? Ich freue mich, wenn du mir Feedback gibst!

5 „Gefällt mir“