{"id":2429,"date":"2023-12-03T12:56:32","date_gmt":"2023-12-03T11:56:32","guid":{"rendered":"https:\/\/blog.idethloff.de\/wordpress\/?p=2429"},"modified":"2024-01-02T16:23:57","modified_gmt":"2024-01-02T15:23:57","slug":"ki-bildgeneratoren","status":"publish","type":"post","link":"https:\/\/blog.idethloff.de\/wordpress\/?p=2429","title":{"rendered":"KI-Bildgeneratoren"},"content":{"rendered":"<p>Die Thematik &#8222;KI-Bildgeneratoren&#8220; (&#8222;text-to-image-models&#8220; als Teil von &#8222;generative artificial intelligence&#8220;) ist spannend und sehr dynamisch in der Entwicklung und Preisgestaltung. <strong>Im Folgenden eine Zusammenfassung der Basics aus meiner pers\u00f6nlichen Sicht mit Stand Anfang Dezember 2023.<\/strong><\/p>\n<hr \/>\n<p><img loading=\"lazy\" decoding=\"async\" title=\"Dreamstudio Beispiel\" src=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/dreamstudio-01b-598312_a%20teacher,%20modern%20line%20icon,%20cute%20young%20character%20_xl-1024-v1-0.png\" alt=\"Dreamstudio Beispiel\" width=\"85\" height=\"85\" \/> <img loading=\"lazy\" decoding=\"async\" title=\"RunwayML Beispiel\" src=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/runway%2002d%20a%20raccoon%20Franz%20Marc.jpg\" alt=\"RunwayML Beispiel\" width=\"149\" height=\"90\" \/> <img loading=\"lazy\" decoding=\"async\" title=\"ChatGPT Plus Beispiel\" src=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/03a-DALL-E.png\" alt=\"ChatGPT Plus Beispiel\" width=\"85\" height=\"85\" \/> <img loading=\"lazy\" decoding=\"async\" title=\"Supermachine Beispiel\" src=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/supermachine-03-midj-YEOE7PC02DIKTRT1AWH8.png\" alt=\"Supermachine Beispiel\" width=\"85\" height=\"85\" \/>\u00a0 <img loading=\"lazy\" decoding=\"async\" title=\"Bing Chat Beispiel\" src=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/bing_chat01-_f1ee4259-fc4e-4f21-a903-cd4314203f20.jpg\" alt=\"Bing Chat Beispiel\" width=\"85\" height=\"85\" \/><\/p>\n<hr \/>\n<p><strong>DALL-E, Midjourney und Stable Diffusion (incl. SDXL) sind die verbreitetsten und bekanntesten KI-Bildgenerator-Modelle<\/strong>. Im Unterschied zu DALL-E und Midjourney macht Stable Diffusion den Quellcode zug\u00e4nglich. Unter der Funktion &#8222;KI-Bildgenerator&#8220; verstehe ich zun\u00e4chst grundlegend das Erstellen von fotorealistischen oder k\u00fcnstlerischen Bildern durch eine beschreibende Texteingabe (Prompt) &#8211; oft gibt es dabei Custom Models f\u00fcr das Generieren von Bildern in unterschiedlichen Stilen. Dar\u00fcber hinaus bieten die KI-Bildgeneratoren noch viele weitere Funktionen.<br \/>\n<strong>KI-generierte Bilder sind manchmal nur schwer von echten Bildern zu unterscheiden<\/strong> &#8211; Indikatoren f\u00fcr KI-generierte Bilder k\u00f6nnen falsche\/sinnlose Text-Beschriftungen sein, doppelte oder fehlerhafte Elemente und auch mit der Darstellung von Fingern\/Haut gibt es oft sichtbare Probleme.<\/p>\n<p><strong>Die Prompts sollten die Szene und Eigeschaften beschreiben und k\u00f6nnen Anweisungen zu Handlung, Umgebung, Licht, Anordnung der Elemente, Stil, Blickwinkel und Emotion beinhalten.<\/strong><br \/>\nMan k\u00f6nnte sich auch in <em>ChatGPT Plus<\/em> einen passenden Prompt erstellen lassen, indem man seine W\u00fcnsche dort kurz formuliert: &#8222;Erstelle mir einen Prompt f\u00fcr ein Bild, das (&#8230;) zeigt.&#8220; und Inspiration f\u00fcr die Ausarbeitung erh\u00e4lt (s. <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/20231202-prompterstellung-chatgptplus.jpg\" target=\"_blank\" rel=\"noopener\">ChatGPT Plus Panda-Beispiel<\/a>).<br \/>\nOder falls ChatGPT Plus durch diese Anforderung gleich ein Bild liefert, hinterher nachfragen &#8222;Wie lautet der f\u00fcr das Bild verwendete Prompt?&#8220;, um etwaige \u00c4nderungsw\u00fcnsche besser in Auftrag geben zu k\u00f6nnen.<br \/>\n<strong>Ausgefeilte Prompts werden von verschiedenen Diensten durchaus unterschiedlich interpretiert und dann ggf. in Teilen ignoriert\/missverstanden. In der Regel gibt es auch ein Zeichenlimit.<\/strong> Daher ist es gut, darauf zu achten, was vom jeweiligen Dienst an Beispielen angeboten wird oder systemseitig an Ergebnis-R\u00fcckmeldungen erfolgt &#8211; bei ChatGPT Plus z. B. &#8222;Here is the icon symbolizing a teacher, designed with a minimalistic and expressive style&#8220;.<br \/>\n<em>Stable Diffusion<\/em> bietet einen &#8222;prompts search engine&#8220; an: <a href=\"https:\/\/stablediffusionweb.com\/prompts\" target=\"_blank\" rel=\"noopener\">https:\/\/stablediffusionweb.com\/prompts<\/a><br \/>\n<em>Craiyon<\/em> etwa zeigt unten immer einen Block &#8222;Inspirations&#8220; mit Prompts und Ergebnissen an, die inhaltlich in Relation stehen zu der Eingabe, die man selbst oben gerade im Eingabefeld macht. Bzgl. Prompts bei <em>Midjourney<\/em> s.u. Artikel.<br \/>\nW\u00e4hrend in ChatGPT Plus die Bilder rein per Textchat-Aufforderungen generiert und angepasst werden, ist es in KI-Bildgenerator-Programmen \u00fcblich, dass parallel zum Prompt viele weitere Einstellungen ausgew\u00e4hlt werden k\u00f6nnen.<\/p>\n<p><strong>DALL-E<\/strong> ist (wie ich <a href=\"https:\/\/blog.idethloff.de\/wordpress\/?p=2384\" target=\"_blank\" rel=\"noopener\">hier<\/a> schon beschrieben habe) \u00fcber verschiedene Dienste\/Webseiten nutzbar &#8211; in der derzeit aktuellsten Version DALL-E3 kostenlos m.W.n. nur \u00fcber Microsoft-Account, entweder per <a href=\"https:\/\/www.bing.com\/create\" target=\"_blank\" rel=\"noopener\">https:\/\/www.bing.com\/create<\/a> oder direkt im Bing Chat, was ich bisher \u00fcbersehen hatte (daher hier heute dieses Bing Chat Graureiher-Beispiel: <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/bing-chat-graureiher-01.jpg\" target=\"_blank\" rel=\"noopener\">Bild1<\/a>, <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/bing_chat-graureiher-02.jpg\" target=\"_blank\" rel=\"noopener\">Bild2<\/a>). Selbst nutze ich meinen kostenpflichtigen Zugang \u00fcber die ChatGPT Plus-Integration, die den Riesenvorteil hat, dass im Rahmen von Textchat schon l\u00e4nger Bilder generiert und modifiziert werden k\u00f6nnen mit &#8211; wie ich finde &#8211; beeindruckender Output-Qualit\u00e4t und inzwischen sogar auch f\u00fcr eigene erstellte GPTs (s. mein GPT &#8222;Cheery Creator&#8220;: <a href=\"https:\/\/chat.openai.com\/g\/g-sQbPSW1Rx-cheery-creator\" target=\"_blank\" rel=\"noopener\">https:\/\/chat.openai.com\/g\/g-sQbPSW1Rx-cheery-creator<\/a>).<br \/>\nAuff\u00e4llig ist, dass bei ChatGPT Plus-Prompts durchaus Meldungen kommen im Sinne von &#8222;I&#8217;m sorry, but I&#8217;m unable to generate images that (&#8230;), as it goes against our content policy&#8220;. Eine St\u00e4rke von den Bildgeneratoren sind Bilder im Stile von ber\u00fchmten K\u00fcnstlern und da muss man dann &#8211; je nach Dienst &#8211; schon genau sein mit den Lebensdaten: &#8222;im Stile von Franz Marc&#8220; ist auch bei ChatGPT Plus erlaubt.<\/p>\n<p><strong>Midjourney<\/strong> bietet leider keinen Testzugang und ist nur \u00fcber kostenpflichtiges Abo nutzbar via <a href=\"https:\/\/www.midjourney.com\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.midjourney.com\/<\/a><br \/>\nAls Ersatz f\u00fcr einen pers\u00f6nlichen Test dient mir dieser Artikel: <a href=\"https:\/\/bootcamp.uxdesign.cc\/the-ultimate-midjourney-cheat-sheet-2023-copy-paste-prompt-for-any-style-779049396dbe\" target=\"_blank\" rel=\"noopener\">https:\/\/bootcamp.uxdesign.cc\/the-ultimate-midjourney-cheat-sheet-2023-copy-paste-prompt-for-any-style-779049396dbe<\/a><\/p>\n<p><strong>Stable Diffusion<\/strong> wird in verschiedenen Diensten genutzt wie z. B. diesen beiden an der Entwicklung beteiligten Firmen, bei denen es nach Registrierung einige kostenlose Credits gibt. Zum Kurz-Test habe ich 3 verschiedene Prompt-Beispiele jeweils in die u.g. Dienste eingegeben und dann Screenshots der Oberfl\u00e4che und ersten Ergebnisse erstellt, s.u. PDFs.<br \/>\nPrompt 1 = a teacher, modern line icon, cute young character avatar, smiling, icon design, minimalistic, black line on white background<br \/>\nPrompt 2 = a raccoon Franz Marc style<br \/>\nPrompt 3 = cute young female sitting on a beach reading a book, photo realistic style<\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li><strong>Stability AI Dream Studio<\/strong>: <a href=\"https:\/\/dreamstudio.ai\" target=\"_blank\" rel=\"noopener\">https:\/\/dreamstudio.ai<\/a> (<a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/20231202-dreamstudio-stablediffusion.pdf\" target=\"_blank\" rel=\"noopener\">Testergebnis-PDF<\/a>) (<a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/dreamstudio-01b-598312_a%20teacher,%20modern%20line%20icon,%20cute%20young%20character%20_xl-1024-v1-0.png\" target=\"_blank\" rel=\"noopener\">Einzelbild 1b<\/a>, <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/dreamstudio-01c-598313_a%20teacher,%20modern%20line%20icon,%20cute%20young%20character%20_xl-1024-v1-0.png\" target=\"_blank\" rel=\"noopener\">Einzelbild 1c<\/a>, <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/dreamstudio-02c-162981_a%20raccoon%20Franz%20Marc%20style%20_xl-1024-v1-0.png\" target=\"_blank\" rel=\"noopener\">Einzelbild 2c<\/a>, <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/dreamstudio-02d-162980_a%20raccoon%20Franz%20Marc%20style%20_xl-1024-v1-0.png\" target=\"_blank\" rel=\"noopener\">Einzelbild 2d<\/a>, <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/dreamstudio-03d-881119_cute%20young%20female%20sitting%20on%20a%20beach%20reading%20a%20boo_xl-1024-v1-0.png\" target=\"_blank\" rel=\"noopener\">Einzelbild 3d<\/a>)<br \/>\n<hr \/>\n<\/li>\n<li><strong>Runway AI<\/strong>: <a href=\"https:\/\/runwayml.com\/\" target=\"_blank\" rel=\"noopener\">https:\/\/runwayml.com\/<\/a> (<a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/20231202-runwayml.pdf\" target=\"_blank\" rel=\"noopener\">Testergebnis-PDF<\/a>) (<a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/runway%2001%20a%20teacher%20modern%20lin.jpg\" target=\"_blank\" rel=\"noopener\">Einzelbild 1a<\/a>, <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/runway%2002a%20a%20raccoon%20Franz%20Marc.jpg\" target=\"_blank\" rel=\"noopener\">Einzelbild 2a<\/a>, <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/runway%2002d%20a%20raccoon%20Franz%20Marc.jpg\" target=\"_blank\" rel=\"noopener\">Einzelbild 2d<\/a>, <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/runway%2003a%20cute%20young%20female%20si.jpg\" target=\"_blank\" rel=\"noopener\">Einzelbild 3a<\/a>, <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/runway%2003d%20cute%20young%20female%20si.jpg\" target=\"_blank\" rel=\"noopener\">Einzelbild 3d<\/a>)<br \/>\nDie Firma Runway machte k\u00fcrzlich Schlagzeilen bzgl. &#8222;Motion Brush &#8211; A unique interface that allows you to direct specific movements across your generation with a simple brush stroke.&#8220; \u00dcbersetzt hei\u00dft das, auf einem generierten Bild gew\u00fcnschte Stellen zu markieren, die dann animiert werden k\u00f6nnen zu einem Video (s.a. <a href=\"https:\/\/academy.runwayml.com\/gen2\/gen2-motion-brush\" target=\"_blank\" rel=\"noopener\">https:\/\/academy.runwayml.com\/gen2\/gen2-motion-brush<\/a>).<\/p>\n<hr \/>\n<\/li>\n<li>Interessant klingt auch &#8222;<strong>Supermachine<\/strong>&#8220; der Firma Riku (<a href=\"https:\/\/supermachine.art\/\" target=\"_blank\" rel=\"noopener\">https:\/\/supermachine.art\/<\/a>), die Stable Diffusion XL verwendet, aber auch andere KI-Modelle wie z. B. den Stil von Midjourney simulieren k\u00f6nnen soll (<a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/20231202-supermachine.pdf\" target=\"_blank\" rel=\"noopener\">Testergebnis-PDF<\/a>) (<a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/supermachine-01-ZPQ1Y38O26O3IQ29SUFO.png\" target=\"_blank\" rel=\"noopener\">Einzelbild 1<\/a>, <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/supermachine-02-OD2ZMNQJJSODDX3WY39U.png\" target=\"_blank\" rel=\"noopener\">Einzelbild 2<\/a>, <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/supermachine-03-midj-YEOE7PC02DIKTRT1AWH8.png\" target=\"_blank\" rel=\"noopener\">Einzelbild 3 MJ<\/a>, <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/supermachine-03-sdxl-FB7W9SJBCT9OSKTF06AP.png\" target=\"_blank\" rel=\"noopener\">Einzelbild 3 SDXL<\/a>).<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>Zum Vergleich mit Stable Diffusion hier die 3 Prompts, wie sie ChatGPT Plus mit DALL-E3 interpretiert hat (<a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/20231202-chatgptplus.pdf\" target=\"_blank\" rel=\"noopener\">Testergebnis-PDF<\/a>) (<a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/01-DALL-E.png\" target=\"_blank\" rel=\"noopener\">Einzelbild 1<\/a>, <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/02-DALL-E.png\" target=\"_blank\" rel=\"noopener\">Einzelbild 2<\/a>, <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/03-DALL-E.png\" target=\"_blank\" rel=\"noopener\">Einzelbild 3<\/a>, <a href=\"https:\/\/www.idethloff.de\/blogfiles\/20231202\/03a-DALL-E.png\" target=\"_blank\" rel=\"noopener\">Einzelbild 3a<\/a>).<\/p>\n<p>&nbsp;<\/p>\n<p><strong>Abschlie\u00dfend noch der Hinweis auf von mir benutzte Bildgeneratoren ohne jegliche Registrierung und mit zumindest einigen kostenlosen Funktionen:<\/strong><\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li><strong>dream by Wombo<\/strong>: <a href=\"https:\/\/dream.ai\/\" target=\"_blank\" rel=\"noopener\">https:\/\/dream.ai\/<\/a> Dieser Dienst war eine Empfehlung der c&#8217;t 2022, Heft25, und sorgte mit den damals erzeugten Bildern f\u00fcr einen privaten Waschb\u00e4r-Kunst-Kalender schon Weihnachten 2022 f\u00fcr Begeisterung.<br \/>\n<hr \/>\n<\/li>\n<li><strong>Craiyon (Modell DALL\u00b7E mini)<\/strong>: <a href=\"https:\/\/www.craiyon.com\/\" target=\"_blank\" rel=\"noopener\">https:\/\/www.craiyon.com\/<\/a> Kostenlos f\u00fcr Privatzwecke und einfach nutzbar, ben\u00f6tigt ca. 1min.<br \/>\n<hr \/>\n<\/li>\n<li>(Update 2.1.24)<br \/>\n<strong>Stable Diffusion Online<\/strong>: <a href=\"https:\/\/stablediffusionweb.com\/\" target=\"_blank\" rel=\"noopener\">https:\/\/stablediffusionweb.com\/<\/a><br \/>\nOhne Registrierung, ohne Anmeldung, allerdings aufw\u00e4ndige cookie policy und Generieren dauert einige Minuten. Ergebnisse in CC0 1.0 Lizenz<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Die Thematik &#8222;KI-Bildgeneratoren&#8220; (&#8222;text-to-image-models&#8220; als Teil von &#8222;generative artificial intelligence&#8220;) ist spannend und sehr dynamisch in der Entwicklung und Preisgestaltung. Im Folgenden eine Zusammenfassung der Basics aus meiner pers\u00f6nlichen Sicht mit Stand Anfang Dezember 2023. \u00a0 DALL-E, Midjourney und Stable Diffusion (incl. SDXL) sind die verbreitetsten und bekanntesten KI-Bildgenerator-Modelle. Im Unterschied zu DALL-E und Midjourney &hellip; <\/p>\n<p class=\"link-more\"><a href=\"https:\/\/blog.idethloff.de\/wordpress\/?p=2429\" class=\"more-link\"><span class=\"screen-reader-text\">\u201eKI-Bildgeneratoren\u201c <\/span>weiterlesen<\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2,22],"tags":[],"class_list":["post-2429","post","type-post","status-publish","format-standard","hentry","category-e-learning","category-ki"],"_links":{"self":[{"href":"https:\/\/blog.idethloff.de\/wordpress\/index.php?rest_route=\/wp\/v2\/posts\/2429","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.idethloff.de\/wordpress\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.idethloff.de\/wordpress\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.idethloff.de\/wordpress\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.idethloff.de\/wordpress\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=2429"}],"version-history":[{"count":25,"href":"https:\/\/blog.idethloff.de\/wordpress\/index.php?rest_route=\/wp\/v2\/posts\/2429\/revisions"}],"predecessor-version":[{"id":2479,"href":"https:\/\/blog.idethloff.de\/wordpress\/index.php?rest_route=\/wp\/v2\/posts\/2429\/revisions\/2479"}],"wp:attachment":[{"href":"https:\/\/blog.idethloff.de\/wordpress\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=2429"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.idethloff.de\/wordpress\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=2429"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.idethloff.de\/wordpress\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=2429"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}