Google Gemini: 3D-Figuren als Foto

Über Google Gemini hatte ich in meinem Blog bisher noch nichts gepostet, einfach weil ich bisher keinen Anlass sah, Gemini zu verwenden. Neugierig war ich jedoch auf die Möglichkeit, 3D-Figuren als Foto zu erstellen mittels „Nano Banana“.
In diesem WDR-Artikel wurde ein recht komplexer Prompt beschrieben, mit dem eben diese 3D-Figurenerstellung realisiert werden könne: https://www1.wdr.de/nachrichten/google-gemini-nano-banana-ki-bilder-trend-100.html

Mein Test von Google Gemini Nano Banana

1. Persönliche Anmeldung bei Google (https://gemini.google.com/)

2. Hochladen eines schon 2023 mittels DALL-E erzeugten KI-Bildes und dazu Eingabe Prompt

„Create a 1/6 scale commercialized figurine of the characters in the picture, in a realistic style, in a real environment. The figurine is placed on a computer desk. The figurine has a round transparent acrylic base, with no text on the base. The content on the computer screen is a 3D modeling process of this figurine. Next to the computer screen is a toy packaging box, designed in a style reminiscent of high-quality collectible figures, printed with original artwork. The packaging features two-dimensional flat illustrations and a logo ([Waschbär]).“

3. Download des erzeugten Bildes und Wiederholen des Prompts für ein zweites Ergebnis

Die beiden Ergebnisse (zum Vergrößern anklicken)

Google Gemini Testergebnis 1 | Google Gemini Testergebnis 2

Mein Fazit

Die Verwendung von bereits getesteten aufwendigen Prompts kann sehr viel Zeit sparen und sehr interessante Ergebnisse ermöglichen. Diese unterscheiden sich – wie üblich bei KI – bei mehrfacher Eingabe des gleichen Prompts durchaus stark voneinander.

Workflow-Screenshots (zum Vergrößern anklicken)

Workflow Bild 1 | Workflow Bild 2

Hinweis: Die Testergebnisse sind bereits vom 23.9.2025.

KI-Video in 10 Minuten

Die KI-Möglichkeiten entwickeln sich rasant. Für das folgende Video hätte man früher Tage gebraucht, hier mittels HeyGen von meinem Softwaretest bis zum Ergebnis nur 10 Minuten und das ganz ohne intellektuellen Aufwand. Lediglich Prompt eingeben und den Rest macht die Software ganz alleine.

Um so einfacher es wird, KI zu benutzen, desto wertvoller wird eigenes Denken und Produzieren. KI zur Unterstützung ist eine gute Hilfe, allerdings vermute ich, dass leider vielfach künftig die reine Bequemlichkeit siegen wird.

s.a. https://www.heygen.com/

Der Workflow in 3 Screenshots (Bilder zum Vergrößern anklicken)

Video Agent Test - Bild 1 | Video Agent Test - Bild 2 | Video Agent Test - Bild 3

Das Ergebnis: Raccoon Apartment Hunt (23s, auf meinem Webserver)

Prompt: „A vlog-style video from the perspective of a raccoon standing in line with a bunch of people waiting to view an apartment.“