Leere Räume verkaufen sich schlecht
Kennt jeder Makler: Du stehst in einer leeren Wohnung, machst Fotos, lädst sie ins Exposé hoch. Weiße Wände, nackter Boden, vielleicht noch ein paar Kabel aus der Wand. Der Interessent scrollt durch die Bilder und denkt sich: „Kann ich mir nichts drunter vorstellen."
Und genau da verlierst du Leute. Studien zeigen, dass möblierte Immobilien bis zu 20 Prozent schneller verkauft werden. Aber echtes Home Staging kostet zwischen 2.000 und 8.000 Euro pro Objekt. Bei einem Mietobjekt rechnet sich das einfach nicht. Und auch bei Eigentumswohnungen überlegt man sich zweimal, ob man das Geld in die Hand nimmt.
Es gibt zwar Home-Staging-Firmen, die fotografierte Räume nachträglich digital möblieren. Aber das dauert ein bis drei Tage und kostet pro Bild 30 bis 50 Euro. Wenn du 15 Bilder pro Objekt hast, bist du schnell bei 500 Euro und wartest trotzdem zwei Tage auf die Ergebnisse.
Foto rein, möbliertes Bild raus
Genau dieses Problem habe ich für einen Kunden aus der Immobilienbranche gelöst. Die Idee ist simpel: Der Makler lädt ein Foto hoch, wählt einen Stil aus und bekommt in wenigen Sekunden ein fertig möbliertes Bild zurück. Kein Warten, kein externes Dienstleister-Ping-Pong.
Dabei geht es nicht nur um „Sofa reinsetzen". Das Tool hat verschiedene Modi. Virtual Staging packt Möbel und Deko in leere Räume. Der Renovierungs-Modus zeigt, wie der Raum nach einer Modernisierung aussehen könnte, neuer Boden, frische Wände, moderne Küche. Und dann gibt es noch Decluttering: Wenn eine Wohnung bewohnt ist und überall Kram rumsteht, entfernt die KI das Chaos und zeigt den Raum aufgeräumt.
Das Besondere: Die KI versteht den Raum. Sie erkennt Fenster, Türen, Lichtverhältnisse und die Proportionen. Die Möbel werden nicht einfach draufgeklebt wie ein Sticker, sondern perspektivisch korrekt eingefügt mit passenden Schatten und Lichtreflexionen. Das Ergebnis sieht realistisch aus, nicht wie ein schlechtes Photoshop-Compositing.
Wie das im Makler-Alltag aussieht
Ein Makler fährt zur Besichtigung. Er hat sein Handy dabei, wie immer. Er fotografiert die Räume, öffnet die Plattform im Browser (das Ganze läuft als PWA, also wie eine App, aber ohne App Store) und lädt die Fotos direkt hoch. Noch auf dem Parkplatz vor dem Objekt kann er dem Interessenten zeigen: „Hier, so könnte das Wohnzimmer aussehen."
Das klingt nach einem netten Gimmick, ist aber ein echter Wettbewerbsvorteil. Der Interessent steht im leeren Raum und kann sich nichts vorstellen? Handy raus, Foto machen, 30 Sekunden später die möblierte Version zeigen. Das ist ein komplett anderes Verkaufsgespräch.
Und fürs Exposé spart es richtig Zeit. Statt auf einen externen Dienstleister zu warten, hat der Makler die Bilder sofort. Objekt fotografieren, Bilder durch die Plattform jagen, Exposé ist am selben Tag online. Bei Mietwohnungen, wo es auf Geschwindigkeit ankommt, ist das Gold wert.
Was sich für die Makler verändert hat
Die Makler, die die Plattform nutzen, berichten vor allem über drei Dinge.
Erstens: Die Verweildauer auf den Exposés ist gestiegen. Wenn Interessenten durch Bilder von möblierten Räumen scrollen, bleiben sie länger dran. Die Bilder erzählen eine Geschichte, man kann sich vorstellen, wie es wäre, dort zu wohnen. Das ist bei leeren Räumen einfach nicht der Fall.
Zweitens: Die Anfragen werden qualifizierter. Wer sich durch möblierte Bilder angesprochen fühlt und dann eine Besichtigung bucht, hat schon eine viel konkretere Vorstellung. Weniger „Mal gucken"-Termine, mehr Leute die wirklich kaufen oder mieten wollen.
Drittens: Die Kosten für externe Bildbearbeitung sind praktisch auf null gesunken. Kein Warten mehr auf Dienstleister, keine Abstimmungsschleifen, kein „Können Sie den Tisch nochmal anders positionieren". Der Makler macht es selbst, in Sekunden, so oft er will.
Wie funktioniert das technisch?
Jetzt wird es etwas nerdiger. Wer nur den Business-Nutzen mitnehmen wollte, kann direkt zum Fazit springen. Für alle anderen, hier ist ein Blick unter die Haube.
Die Plattform ist als Multi-Tenant SaaS aufgebaut. Das Frontend läuft auf Nuxt 4 mit TypeScript, das Backend auf Laravel 12. Die KI-Jobs werden über einen separaten Python-Worker abgewickelt, der mit Temporal orchestriert wird.
Temporal ist dabei der stille Held. Es ist ein Workflow-Engine, der dafür sorgt, dass langlebige Prozesse zuverlässig durchlaufen. Wenn mitten im Job die Verbindung zur KI-API abbricht, setzt Temporal an genau der Stelle wieder an, wo es aufgehört hat. Kein verlorener Job, kein kaputtes Ergebnis. Für den Nutzer sieht das so aus: Bild hochladen, kurz warten, fertiges Bild runterladen. Was im Hintergrund passiert, bekommt er nicht mit.
Für die eigentliche Bildgenerierung nutzen wir zwei Modelle. Google Imagen 3 für die Hauptgenerierung und Replicate mit ControlNet für spezielle Steuerungs-Szenarien, wo wir mehr Kontrolle über Struktur und Perspektive brauchen. Das Bild durchläuft erst eine Vorverarbeitung mit OpenCV, dann analysiert Google Gemini den Raum (Fenster, Türen, Lichtquellen, Proportionen) und dann generiert Imagen 3 das finale Bild.
Der gesamte Flow sieht so aus: Nutzer lädt Foto hoch, das Backend erstellt einen Processing Job und sendet ihn an Temporal. Der Worker holt das Bild aus dem S3-kompatiblen Storage (wir nutzen Hetzner Object Storage, EU-gehostet, DSGVO-konform), bearbeitet es und schickt das Ergebnis per Webhook zurück ans Backend. Der Nutzer sieht in der Oberfläche einen Fortschrittsbalken und bekommt dann das fertige Bild.
Ein paar technische Details die vielleicht interessant sind: Die Plattform ist komplett mit UUID-Primärschlüsseln aufgebaut, unterstützt Multi-Tenancy mit vier Isolationsebenen (Datenbank, Applikation, Storage, API), und die Authentifizierung läuft über Laravel Sanctum mit optionalem Google OAuth. Die PWA-Funktionalität kommt über Vite PWA mit Service Worker, sodass die App auch bei schlechtem Netz zuverlässig funktioniert.
Die Infrastruktur läuft komplett auf Hetzner Cloud, orchestriert mit Docker und Traefik als Reverse Proxy. Deployment geht über GitHub Actions, die Infrastruktur ist mit Terraform definiert. Kundendaten, Datenbank und Storage liegen vollständig in der EU. Für die KI-Bildgenerierung werden Bilddaten verschlüsselt an die API-Anbieter (Google Imagen, Replicate) übermittelt, dort aber nicht gespeichert oder zum Training verwendet.
Fazit
Virtual Staging mit KI ist kein Zukunftsthema mehr. Es funktioniert heute, es ist bezahlbar und es verändert, wie Immobilien vermarktet werden. Für Makler, die viele Objekte betreuen, ist das ein echtes Werkzeug, das den Unterschied macht: schnellere Vermarktung, bessere Exposés, weniger Kosten für externe Dienstleister.
Das Schöne an dem Ansatz: Die Technik verschwindet komplett im Hintergrund. Der Makler muss kein Technik-Experte sein. Foto hochladen, Stil wählen, fertig. Die ganze Komplexität mit KI-Modellen, Workflow-Orchestrierung und Cloud-Infrastruktur passiert unsichtbar. Und genau so soll es sein.