The Professional Raccoon Collection – Erstellung thematischer Symbole mit Nano Banana

Angeregt durch einen Beispiel-Prompt von Nano Banana, nun ein eigener Versuch, thematische Symbole zu erstellen – natürlich wie immer bei meinen KI-Tests anhand des Themenbereichs „Waschbär“.
Gesamtdauer: ca. 10 Minuten

1) Einloggen bei gemini.google.com

2) Prompt „Create a collection of icons representing racoons doing human jobs, they belong together as a single theme. Put them in a 3×3 grid. The background is white. Make the icons in a colorful and tactile 3D style. No text.

3) Weitere Ergebnisse anfordern, nun verbunden mit der Aufforderung zur Erläuterung der gezeigten Jobs

Mit mehreren Versuchen und etwas Konkretisierung im Dialog wurden die Ergebnisse recht gut, finde ich. Und Nano Banana merkte selbst, dass bei der Erstellung Fehler passiert waren und schlug vor „I’ve noticed the AI got a little „creative“ by blending some outfits (like the guitar-playing firefighter). Would you like me to try one more grid to get a clean set of specific, distinct jobs like a Pilot, a Yoga Instructor, or a Construction Worker?
Beim genauen Hinschauen sieht man auch hier noch falsche Kombinationen von Outfits. Lesenswert war auch die Nano Banana Beschreibung zum „lineup for this professional crew“ (s.u.) 😉

*****************************************************************************

Start-Prompt:

Ergebnis 2:

Ergebnis 4:

Erfragte Beschreibung zum „lineup for this professional crew“:

The Professional Raccoon Collection

The Airline Pilot: Standing tall in a crisp navy uniform with gold stripes and a captain’s hat, he’s ready for takeoff (probably to a destination with high-quality snacks).

The Yoga Instructor: Finding total „zen“ on a colorful mat, this raccoon is proving that even „trash pandas“ can have great flexibility and inner peace.

The Architect/Construction Lead: Reviewing blue prints with a yellow hard hat and a tool belt, he’s clearly the one in charge of the latest neighborhood „build.“

The News Reporter: Dressed in a sharp suit and holding a microphone, he’s reporting live from the city center on the latest dumpster-related breaking news.

The Sunflower Gardener: A very classic gardener look with denim overalls, a straw hat, and a giant sunflower. He’s definitely the one with the green thumb.

The Barista: Hard at work behind a detailed espresso machine, this raccoon is brewing up a „Trash-iato“ for the morning rush.

The Mail Carrier: A dedicated civil servant with a blue uniform and a leather satchel, delivering important letters across the forest.

The Firefighter: Geared up in high-visibility yellow turnout gear with a heavy-duty rope, standing proudly in front of a big red fire truck.

The Librarian: Looking very scholarly with wire-rimmed glasses and a vintage cardigan, he’s making sure the books are returned on time.

 

Isometric scenes

Vordefinierte KI-Prompts können ganz nützlich sein. Hier ein Beispiel, das für Google Gemini (Nano Banana) definiert wurde, gekürzt frei nach https://x.com/pavolrusnak/status/1995165498774802607?s=61

Present a clear, 45° top-down isometric miniature 3D cartoon scene of Hamburg, featuring its most iconic landmarks and architectural elements. At the top-center, place the title “Hamburg” in large bold text.

Den Prompt habe ich – jeweils nach persönlicher Anmeldung bei den beiden Diensten – gleich lautend sowohl für Google Gemini verwendet als auch für ChatGPT.

Ergebnis Google Gemini (zum Vergrößern anklicken):

Ergebnis ChatGPT (zum Vergrößern anklicken):

 

Google Gemini: 3D-Figuren als Foto

Über Google Gemini hatte ich in meinem Blog bisher noch nichts gepostet, einfach weil ich bisher keinen Anlass sah, Gemini zu verwenden. Neugierig war ich jedoch auf die Möglichkeit, 3D-Figuren als Foto zu erstellen mittels „Nano Banana“.
In diesem WDR-Artikel wurde ein recht komplexer Prompt beschrieben, mit dem eben diese 3D-Figurenerstellung realisiert werden könne: https://www1.wdr.de/nachrichten/google-gemini-nano-banana-ki-bilder-trend-100.html

Mein Test von Google Gemini Nano Banana

1. Persönliche Anmeldung bei Google (https://gemini.google.com/)

2. Hochladen eines schon 2023 mittels DALL-E erzeugten KI-Bildes und dazu Eingabe Prompt

„Create a 1/6 scale commercialized figurine of the characters in the picture, in a realistic style, in a real environment. The figurine is placed on a computer desk. The figurine has a round transparent acrylic base, with no text on the base. The content on the computer screen is a 3D modeling process of this figurine. Next to the computer screen is a toy packaging box, designed in a style reminiscent of high-quality collectible figures, printed with original artwork. The packaging features two-dimensional flat illustrations and a logo ([Waschbär]).“

3. Download des erzeugten Bildes und Wiederholen des Prompts für ein zweites Ergebnis

Die beiden Ergebnisse (zum Vergrößern anklicken)

Google Gemini Testergebnis 1 | Google Gemini Testergebnis 2

Mein Fazit

Die Verwendung von bereits getesteten aufwendigen Prompts kann sehr viel Zeit sparen und sehr interessante Ergebnisse ermöglichen. Diese unterscheiden sich – wie üblich bei KI – bei mehrfacher Eingabe des gleichen Prompts durchaus stark voneinander.

Workflow-Screenshots (zum Vergrößern anklicken)

Workflow Bild 1 | Workflow Bild 2

Hinweis: Die Testergebnisse sind bereits vom 23.9.2025.

KI-Video in 10 Minuten

Die KI-Möglichkeiten entwickeln sich rasant. Für das folgende Video hätte man früher Tage gebraucht, hier mittels HeyGen von meinem Softwaretest bis zum Ergebnis nur 10 Minuten und das ganz ohne intellektuellen Aufwand. Lediglich Prompt eingeben und den Rest macht die Software ganz alleine.

Um so einfacher es wird, KI zu benutzen, desto wertvoller wird eigenes Denken und Produzieren. KI zur Unterstützung ist eine gute Hilfe, allerdings vermute ich, dass leider vielfach künftig die reine Bequemlichkeit siegen wird.

s.a. https://www.heygen.com/

Der Workflow in 3 Screenshots (Bilder zum Vergrößern anklicken)

Video Agent Test - Bild 1 | Video Agent Test - Bild 2 | Video Agent Test - Bild 3

Das Ergebnis: Raccoon Apartment Hunt (23s, auf meinem Webserver)

Prompt: „A vlog-style video from the perspective of a raccoon standing in line with a bunch of people waiting to view an apartment.“

5-Sekunden-KI-Videos mit Bing Video Creator

Dank des Heise-Artikels vom 4.6.25 zum neuen Bing Video Creator (https://www.heise.de/news/Microsoft-spendiert-Bing-einen-KI-Video-Ersteller-10425495.html) im Folgenden eigene kostenlos erzeugte Testergebnisse als LOOP-Videos auf meinem Webserver.
Die in Bing verwendete Komponente Sora ist bei OpenAI schon länger erhältlich, allerdings dort lediglich über ein kostenpflichtiges Abo (s.a. https://openai.com/de-DE/sora/).
Microsoft bietet über die Bing App nun die Erstellung von Videos im Seitenverhältnis 9:16 in 480p und zwar mit einer Dauer von 5 Sekunden Länge.

Waschbär-Motive finde ich sehr geeignet zum Testen von KI-Anwendungen, daher auch hier meine entsprechenden Prompts.
Die KI ist – wie bei Bing bzw. OpenAI üblich – gestaltend tätig, ohne dass man selbst jedes Detail angibt. Bei Videos ist daher spannend, welche Bewegungen von der KI akzentuiert wurden. Noch geht das Erstellen eines Videos nur aus der Bing-App heraus und nicht über die Desktop-Version, doch das wird sich sicherlich bald ändern. Auf die jeweiligen Ergebnisse musste ich tatsächlich jeweils mehr als 2 Stunden warten, aber das habe ich für meine kostenlosen Tests gerne in Kauf genommen.

Versuch 1: Fishing Raccoon

„a raccoon who goes fishing with a sun flower in a pond in front of the Louvre. evening light“

Die Umsetzung finde ich gelungen mit Bewegungen des Wassers und Drehbewegung des Waschbärs bei entspanntem Ambiente.
Die Prompt-Idee habe ich für diesen Sora-Test recycelt, aber ohne Hommingberger Gepardenforelle (s.a. https://www.heise.de/foto/galerie/suche/foto/?keyword=gepardenforelle).

Versuch 2: Juggling Raccoon

„a raccoon at the beach juggling balls during a thunderstorm while a herring gull watches“

Die Möwe fehlt leider im Ergebnis, aber das Video zeigt einen sehr hektischen Waschbären, was gut zum Gewitter-Setting passt. Er will schnell mit seinem Training fertig werden, bevor das Wetter noch schlechter wird und es nicht nur über dem Wasser regnet 😉

***

Laut Heise-Artikel werden die Bing-Videos bis zu 90 Tagen bei Microsoft gespeichert; hier die Links zu meinen 2 Versuchen: