ID's Blog – by Ingrid Dethloff

Mai 24, 2026

12 Versionen vom Ich

Nie war es einfacher, sich selbst in andere Settings/Situationen hineinzu(ver)setzen im Rahmen eines Bildes. Vorhandene Prompt-Kataloge geben Anregungen und die Prompt-Beispiele können hinsichtlich eigener Ideen leicht editiert werden. Auch fremdsprachige Prompt-Beispiele sind kein Hindernis mehr z. B. per DeepL-Übersetzung.
Die folgenden Ergebnisse basieren alle auf Prompts von https://bananaprompts.com/de/explore (Filter: „Beliebt“)

Die mit eigenen Änderungen angepassten Prompts nach Google-Anmeldung eingegeben bei https://gemini.google.com/app?hl=de, jeweils das gleiche Foto von mir hochgeladen – fertig.

Ende 2022 hatte ich mit der KI-Anwendung Dream by Wombo meine ersten KI-Bilder generiert – also noch keine 4 Jahre her und doch liegen einige Welten zwischen den damaligen und heutigen Möglichkeiten zur KI-Bildgenerierung. Und leider ist kaum noch zu erkennen, was echt ist und was nicht – bei manchen Motiven hilft natürlich etwas gesunder Menschenverstand 😉

Links zu den erzeugten Einzelbildern und Dokumentation der Prompts:

Bild 1 | Bild 2 | Bild 3 | Bild 4

Bild 5 | Bild 6 | Bild 7 | Bild 8

Bild 9 | Bild 10 | Bild 11 | Bild 12

PDF mit Beschreibung der genutzten Prompts

April 13, 2026

Mit KI zum Video: 2 Text-to-Video-Tools im Vergleich

Lediglich ein kurzer Prompt im Webbrowser für eine fiktive Story – was machen bei einem kleinen Test zwei KI-Tools in der Free-Version daraus? Die Ergebnisse unterscheiden sich stark in Länge, Stil, Stimmung und den eingesetzten gestalterischen Möglichkeiten der Videoproduktion.

Test 1: Canva
Canva ist für Mediendesign sowie Zusammenarbeit durchaus beliebt und bietet auch eine Funktion, per Text-Prompt ein Video zu erstellen. Nach Prompt-Eingabe in der etwas versteckten Video-Option „Magic Media“ (Video -> YouTube-Video -> Magic Media -> Videos) wurde sehr schnell ein Video mit 5 Sekunden Länge erzeugt. Das Ergebnis war durchaus beachtenswert, wenngleich etwas künstlich.
Unter dem Prompt-Eingabe-Fenster befindet sich ja auch folgender Canva-Hinweis: „Dies ist eine neue Technologie. Szenen mit Menschen oder Tieren können etwas seltsam aussehen“.
Nachträglich hinzugefügt via Timeline habe ich dann noch als Text-Element eine Überschrift und als Audio-Element „AI Voice“ mit kurzem Text. Die eingeblendeten Musik-Beispiele wären kostenpflichtig gewesen – erst über die Suche nach Begriffen hätte man auch einige verwendbare Sounds gefunden… Lokaler MP4-Download war möglich; für eine etwaige Freigabe ist gut zu wissen: Die Zugriffsebene „Jeder mit dem Link“ vergibt standardmäßig im Sinne einer Zusammenarbeit gleich Bearbeitungsrechte fürs Design – ggf. also umstellen/reduzieren auf „Darf ansehen“.
Informationen zu Canva-Möglichkeiten und -Preismodellen: https://www.canva.com/de_de/

https://canva.link/d870ykw1l68rqzq (nur ansehen)
Prompt „im frühlingshaften Londoner Park sieht eine Frau einen Waschbär, der auf einen Uhu oben im Baum schaut“

******

Test 2: HeyGen
HeyGen ist rein auf Videos spezialisiert „At HeyGen, our mission revolves around empowering individuals through accessible AI video generation“ und verfolgt mit seinem Video Agent den Anspruch „Not a tool. Not a copilot. It’s a creative agent doing the work for you.“ Zentral ist die Möglichkeit, einen (z. B. auch selbst erstellten) Sprecher-Avatar zu wählen mit Voiceover für die einzelnen Szenen – in Kombination mit der Aktivierung des KI-Videogenerierungsmodells „Seedance 2.0“ konnte mein bisheriger eigener Foto-Avatar jedoch nicht genutzt werden.
Nach Eingabe des Prompts machte der AI Agent dann wirklich alles von alleine und listete dabei stets die jeweiligen Schritte (inkl. Thoughts) auf: Beschreibung der Szenen, Medienauswahl, Vertonung, Untertitel etc.
Das Video-Ergebnis wirkte auf mich dabei sehr seriös und realitätsnah mit persönlichem Touch, dauerte in der Generierung jedoch ca. 45 Minuten für die vom AI Agent vorgesehenen ca. 28 Sekunden (tatsächlich 21) – Da war die Mail „Your video is ready“ durchaus nützlich.
Gut zu wissen: Über „Edit a copy in AI Studio“ könnte man nun auch eine gezielte eigene Video-Weiterbearbeitung mit Elementen, Medien, Musik etc. vornehmen, was ich mir hier gespart habe.
Lokaler MP4-Download war möglich; eine etwaige Freigabe ist standardmäßig mit der Berechtigung „Ansehen und Kommentieren“ verbunden.
Informationen zu HeyGen-Möglichkeiten und -Preismodellen s. https://www.heygen.com/

https://app.heygen.com/videos/c138debb239949d2bba62d76dabd75ac
Prompt „Lisa is wearing a blue suit and walks on the streets of London thinking about something. Scene change: Spring – She is now in a park with a lake and sees a raccoon looking up at an eagle owl on a tree. She smiles and the video ends.“

Screenshot während Generierung des Videos

April 5, 2026

Mixed-Dimension Illusion

Interessante Effekte liefert folgender Nano Banana Prompt: https://nanoprompts.org/prompt-handbook/spatial-design#case318
In meinem Prompt nun statt der Katze ein Uhu, statt dem gemütlichen Zimmer eine Bibliothek und voilà:

Meine Eingabe bei Google Gemini, frei nach s.o.:

„A historical library room where the wall looks like a giant paper illustration, flat ink lines and watercolor washes, yet a corner of the „paper wall“ is peeled back, revealing a fully 3D forest behind it. The peeled edge curls outward like thick cardstock, casting a real shadow on the illustrated surface. The illusion: the 2D drawn objects (drawn shelves) cast realistic 3D shadows, while the 3D forest casts faint „ink“ shadows as if it is becoming a drawing. An eagle owl with a mouse sits half-in, half-out: front claws in 3D forest moss, back body with wings in 2D sketch form, seamlessly blended. Soft morning light, gentle pastel palette, tactile paper fibers visible, high detail, whimsical but believable „mixed-dimension“ realism.“

Eine schnelle Realisierung von interessanten kreativen Bild-Ergebnissen ganz ohne aufwändige Bildbearbeitung – KI macht es möglich. Wie sich wohl in Zukunft die Zugänge zu KI-Tools entwickeln werden? Nach den hohen Investitionsausgaben für KI ist der Weg zur Monetarisierung noch unklar. Ob die User-Daten von gläsernen Kunden „genügen“ oder die künftigen KI-Möglichkeiten für Privatpersonen (zusätzlich) hinter teuren Abos verschwinden?
Sehr nützlich finde ich das am 27.3.26 erschienene c’t Sonderheft „Geld & Daten“, um Mechanismen zu verstehen und auch etwas gegensteuern zu können (https://www.heise.de/news/Jetzt-erhaeltlich-c-t-Sonderheft-Geld-Daten-11241014.html).

***

Der bei meinen KI-Tests „obligatorische“ Waschbär darf natürlich in diesem Blogbeitrag nicht fehlen – ebenfalls mittels adaptiertem Nano Banana Beispiel-Prompt erzeugt.

März 29, 2026

Uhu-Live-Webcam

Die Marburger Uhu-Familie mit Höhen und Tiefen live verfolgen zu können, war eine intensive Erfahrung. Der NABU Videozusammenschnitt mit Stand 17.3.-18.3.2026, d. h. noch vor der schließlich dramatischen Entwicklung, kann gut vermitteln, warum sich so viele Zuschauende für die Uhus interessiert haben: https://www.youtube.com/watch?v=46MbgIGoZHw

Danke an den NABU – ohne Eingreifen wäre es zumindest für die Küken wohl nicht gut ausgegangen. Schön, das der NABU-YouTube-Kanal sowohl Videos von der Kükenfütterung in der Wildtierstation als auch der Reaktion der Uhu-Mutter veröffentlicht hat und sich somit weiter „kümmert“. Zum YouTube-Kanal NABU Marburg:
https://www.youtube.com/@NABU_Marburg

Da der Nistkasten-Livestream inzwischen wieder online ist, konnte ich heute früh tatsächlich für einige Minuten noch einmal Lisbeth (?) live sehen.

Screenshot vom NABU Marburg Nistkasten der Elisabethkirche

Screenshot vom NABU Marburg Nistkasten der Elisabethkirche, 29.3.2026, 7:47 (MESZ)

NABU Hintergrundinformationen:

Livestream vom Nistkasten:

https://www.youtube.com/watch?v=KsMWO3l_pbM
Mit weiteren interessanten Links, z. B. zur Google Docs Zeitstempeldatei. Dort war zu lesen, dass heute Nacht 2 Uhus anwesend waren und ein Zurückspulen im Stream z. B. zu 3:36 Uhr bestätigte dies – Es sieht für mich allerdings nicht nach Hugo, sondern nach „Herausscheuchen“ eines anderen Uhus durch Lisbeth aus.

Februar 4, 2026

The Professional Raccoon Collection – Erstellung thematischer Symbole mit Nano Banana

Angeregt durch einen Beispiel-Prompt von Nano Banana, nun ein eigener Versuch, thematische Symbole zu erstellen – natürlich wie immer bei meinen KI-Tests anhand des Themenbereichs „Waschbär“.
Gesamtdauer: ca. 10 Minuten

1) Einloggen bei gemini.google.com

2) Prompt „Create a collection of icons representing racoons doing human jobs, they belong together as a single theme. Put them in a 3×3 grid. The background is white. Make the icons in a colorful and tactile 3D style. No text.“

3) Weitere Ergebnisse anfordern, nun verbunden mit der Aufforderung zur Erläuterung der gezeigten Jobs

Mit mehreren Versuchen und etwas Konkretisierung im Dialog wurden die Ergebnisse recht gut, finde ich. Und Nano Banana merkte selbst, dass bei der Erstellung Fehler passiert waren und schlug vor „I’ve noticed the AI got a little „creative“ by blending some outfits (like the guitar-playing firefighter). Would you like me to try one more grid to get a clean set of specific, distinct jobs like a Pilot, a Yoga Instructor, or a Construction Worker?“
Beim genauen Hinschauen sieht man auch hier noch falsche Kombinationen von Outfits. Lesenswert war auch die Nano Banana Beschreibung zum „lineup for this professional crew“ (s.u.) 😉

*****************************************************************************

Start-Prompt:

Start-Prompt

Ergebnis 2:

Ergebnis 4:

Erfragte Beschreibung zum „lineup for this professional crew“:

The Professional Raccoon Collection

The Airline Pilot: Standing tall in a crisp navy uniform with gold stripes and a captain’s hat, he’s ready for takeoff (probably to a destination with high-quality snacks).

The Yoga Instructor: Finding total „zen“ on a colorful mat, this raccoon is proving that even „trash pandas“ can have great flexibility and inner peace.

The Architect/Construction Lead: Reviewing blue prints with a yellow hard hat and a tool belt, he’s clearly the one in charge of the latest neighborhood „build.“

The News Reporter: Dressed in a sharp suit and holding a microphone, he’s reporting live from the city center on the latest dumpster-related breaking news.

The Sunflower Gardener: A very classic gardener look with denim overalls, a straw hat, and a giant sunflower. He’s definitely the one with the green thumb.

The Barista: Hard at work behind a detailed espresso machine, this raccoon is brewing up a „Trash-iato“ for the morning rush.

The Mail Carrier: A dedicated civil servant with a blue uniform and a leather satchel, delivering important letters across the forest.

The Firefighter: Geared up in high-visibility yellow turnout gear with a heavy-duty rope, standing proudly in front of a big red fire truck.

The Librarian: Looking very scholarly with wire-rimmed glasses and a vintage cardigan, he’s making sure the books are returned on time.