Stable Diffusion locally on MacBook Air via App „Draw Things“

It would be nice to have a local installation of the open source text-to-image model Stable Diffusion… that was my idea this weekend. As I didn’t find any convincing installation manuals and even wasn’t sure if my Windows PC’s hardware would be sufficient, a very simple article about „Draw Things“ came to my attention: https://www.unidigital.news/draw-things-ki-bilder-kostenlos-unterwegs-generieren/ Unfortunately my iPad and my iPhone are too old, but with my MacBook Air (M1,2020) the installation was no problem:
Downloading the app „Draw Things“ from the Apple Store and afterwards downloading the proposed model „SDXL Refiner v1.0 (8-bit)“. My first text prompt with default options, 1024×1024 etc. and waiting time of some minutes, was a disaster, my second prompt was a disaster and so it went… double things and not nearly what I wanted. O.k., I’m a little bit spoiled because of mostly using ChatGPTPlus and Bing Image Creator, but what was that thing? Totally disappointed, I deleted all the results.

Here is one disturbing example from today „young woman holding an umbrella“:

image with model SDXL Refiner v.10 8-bit
(click to enlarge)

Today, I thought maybe I should be modest and download/install an older Stable Diffusion model in my „Draw Things“ app and therefore chose „Generic (Stable Diffusion v2.1)“ which would result in a lower resolution image 512×512. For my prompt I chose something about cats (because, normally „cats always work“) and finally, I got results resembling a cat:

image with model Generic, Stable Diffusion v2.1image with model Generic, Stable Diffusion v2.1image with model Generic, Stable Diffusion v2.1image with model Generic, Stable Diffusion v2.1
(click to enlarge)

The good results with the older model led me to the assumption, that the SDXL model was the problem and I googled… a YouTube video „Fix Double-Headed Glitches in Stable Diffusion with Kohya Hires Fix!“ helped me understand the problem (Link: https://youtu.be/SbgMwHDXthU?feature=shared). As I don’t have a local installation but the Apple Store App „Draw Things“, I can’t install any extensions, but I looked instead at the menu „Advanced“ in my „Draw Things“: There is indeed already a solution, that means a configuration option named „High resolution fix“ (description „[…] it avoids duplicate objects when generating directly“), which I simply had to enable in order to avoid double heads in my results.

First result after enabling „High Resolution Fix“:

image with model SDXL Refiner v.10 8-bit
(click to enlarge)

That’s the problem with news articles regarding the topic IT or AI: they become obsolete faster than you can think – I don’t mean any offense – and next time, I will go through the advanced options even when I don’t want to experiment deeper with a software.

At last, I can start generating images with my local installation of Stable Diffusion via App „Draw Things“:

Draw Things Screenshot
(click to enlarge)

Thanks to the developer of „Draw Things: AI Generation“!

Bookmarks zu AI & Education

Diesen Blogbeitrag möchte ich nutzen, um einige Links aufzulisten, die ich sehr interessant finde.

VERANSTALTUNGEN ZU CHATGPT

  • … gab und gibt es wie Sand am Meer. An der RPTU waren wir am 20.12.22 früh dabei mit der Einladung zu einem Vortrag von Prof. Weßels unter dem Titel „ChatGPT in der modernen Lehre“. Hier der Link zur YouTube-Aufzeichnung:
    https://youtu.be/_QaVNFuH6Cw

NEWS UND PUBLIKATIONEN ZU KI

KI-TOOLS

OpenSource KI-Chatbot HuggingChat

HuggingChat
Q: https://huggingface.co/chat/

Gestern las ich bei Heise (Link) einen Artikel über den neuen OpenSource-Chatbot namens „HuggingChat“. Das klang spannend und musste bald ausprobiert werden. Die Chatbots sind schnell und so konnte ich heute früh, während ich in der Telefon-Warteschleife beim VRN hing, um nach dem Stand meines „Deutschlandlandtickets Job“ nachzufragen, am PC bei HuggingChat meine Fragen platzieren, die ich im Dezember 20222 schon ChatGPT gestellt hatte. Das manuelle Verfassen des folgenden Blogartikels dauerte dann natürlich deutlich länger.

Zugang: https://huggingface.co/chat/ ohne Registrierung
Hinweis: „This application is for demonstration purposes only“, Version „v0“ April 2023
Current Model: „For now, it’s running OpenAssistant’s latest LLaMA based model“: OpenAssistant/oasst-sft-6-llama-30b

 

Bsp. 1 Why should I go to a lecture at a university if I am a student? (Link zum Screenshot)

Bsp. 2 What is your recommendation for an interactive live seminar with some students at university and some students at home? (Link zum Screenshot)

Bsp. 3 How should a learning management course look like in order to be motivating for students? (Link zum Screenshot)

Bsp. 4 Generate an easy multiple choice question relating to the topic sports and AI with 4 wrong answers and 1 correct answer. (Link zum Screenshot)

Bsp. 5 Which 5 aspects do I need to know about RPTU? (Link zum Screenshot 1 / Link zum Screenshot 2)

Bsp. 6 Write a poem about a racoon who wants to move to Heidelberg, but doesn’t find an appartment. (Link zum Screenshot)

Mein kurzes Fazit:

  • „HuggingChat“ ist schon ziemlich gut, wenngleich ChatGPT „besser“ war. Wie auch bei ChatGPT sind die gegebenen Antworten nicht immer inhaltlich korrekt.
  • Mit „HuggingChat“ hatte ich deutlich mehr Missverständnisse bzgl. meiner Prompt-Formulierungen, die ich im Dezember 2022 allerdings auch nicht unbedingt perfekt überlegt hatte. (Bsp. 4 und 5)
    Vom Hinweis auf „refrain from asking me sensitive personal information“ bis hin zu inhaltlich komplett an der Sache vorbei.
  • Interessant ist auch die Art der Rückfragen und wann sie vom Chatbot gestellt wurden und wann nicht. Bei Fragen mit einer Abkürzung wie im Bsp. 5 fände ich eine Rückfrage elementar, da es eigentlich immer mehrere Möglichkeiten gibt, was gemeint ist.
    RPTU ohne Rückfrage als „reptile parenting techniques unleashed“-Website zu interpretieren, ist schon sehr schräg, zumal es so ein Portal wohl gar nicht gibt 😉
  • Bei HuggingChat scheint es eine Maximallänge der Antworten zu geben, bei der Chatbot-Antworten einfach mitten im Wort abbrechen, was sehr irritierend ist. (Bsp. 1, 3, 5)

Ganz klar im Vorteil ist, wer seine Prompts gut formuliert, auch aufgrund Hintergrundwissens über die zugrunde liegenden Modelle. Diese Erfahrung habe ich auch vor allem bei KI-Bildgeneratoren gemacht. Ob „Prompt Engineer“ ein neues gut bezahltes Berufsfeld wird oder nicht, wird sich zeigen. Die Suche und Bewertung von Informationen ist ja eine Kernaufgabe von Bibliothekaren – ich erinnere mich noch an mein Studium in Hamburg, wo wir Mitte der 80er die Formulierung von GRIPS/DIRS-Anfragen in kostenpflichtigen Datenbanken gelernt haben… (= General Relation based Information Processing System/DIMDI’S Information Retrieval System)

ChatGPT News und ChatGPT Teach-Out

OpenAI’s ChatGPT – Selten war ein Thema so präsent in Medien, Hochschulen und bei den üblichen Akteuren im Bereich des Lernens. Fast täglich gibt es Berichte über neue Entwicklungen bzgl. ChatGPT und Konkurrenz-Systemen – es wird unübersichtlich, was man selbst derzeit in Deutschland (kostenlos) ausprobieren kann, z. B.

    • ChatGPT4 (s.a. https://www.youtube.com/watch?v=oc6RV5c1yd0) steht als „ChatGPT Plus“ eigentlich nur zahlenden Kunden zur Verfügung – Das „gewohnte“ chat.openai.com basiert derzeit auf ChatGPT3.5 und ist sehr oft überlastet.
    • Microsoft (als einer der OpenAI-Investoren) bietet über persönliches Microsoft-Login und Warteliste mit „Bing Chat“ in seinem Edge-Browser eine Verbindung von Suchmaschine und AI an. In Edge kann dann auch ein „Bing Sidebar“ zum Erstellen von Text mit Auswahl bzgl. Stil, Format und Länge genutzt werden. (s.a. https://www.youtube.com/watch?v=bsFXgfbj8Bc)
    • Der Zugang zu Googles Konkurrenzprodukt „Google Bard“, über Google-Login und Warteliste, ist derzeit noch nicht in Deutschland möglich. (s.a. https://blog.google/technology/ai/try-bard/)

Aufgrund der rasanten Geschwindigkeit der AI-Entwicklungen vielleicht auch gerade der Versuch zu bremsen / zu regulieren, so z. B.

***

University of Michigan: ChatGPT Teach-Out
via Coursera
https://www.coursera.org/learn/chatgpt-teach-out
Spannend finde ich immer den internationalen Blick, daher an diesem Wochenende ein Besuch des Coursera-MOOCs „ChatGPT Teach-Out“. Gerade bei einem derartigen Thema ist inhaltliche Aktualität essentiell, was Aufwand für die Ersteller/Betreuung eines MOOCs bedeutet – vielleicht auch daher an vielen Stellen nach meinem ersten Eindruck in diesem MOOC der Hinweis „Text generated with the support of ChatGPT.“
Der MOOC bietet in vielen sehr kurzen Videos einen guten Überblick zum Thema ChatGPT. Dabei wird auch auf das so wichtige „Prompt engineering“ eingegangen sowie auf die ganze Bandbreite juristischer Aspekte, ethischer Aspekte und Auswirkungen auf Education, Wirtschaft und Gesellschaft.

***

Einige persönliche Notizen aus dem MOOC

  • „GPT-4 takes what you prompt it with and just runs with it“ … „From one perspective, it’s a tool, a thing you can use to get useful tasks done in language (…) From another perspective, it’s a system that can make dreams, thoughts, ideas, flourish in text in front of you.“
  • „Writing good search prompts or search queries is a skill and it’s very, very related to your writing or communication ability.“
  • „People are experimenting like crazy.“
  • Jobs will be redefined – makes jobs more interesting and more productive.
  • „First time white-collar workers will begin to fear machines as competitors for their jobs.“
  • How do we train knowledge workers to work in tandem with AI technologies in creative processes?
  • Conversational personal digital assistant, augment own human capital.
  • „It’s rapidly moving. We wouldn’t want to necessarily just teach how to interface with exactly the current version of ChatGPT.“
  • ChatGPT/AI as a teammate and as a tool.
  • „Help us draft any kind of text.“
  • Useful: output as tables or slides.
  • Create learning material adjusted to the level of each student.
  • „Middle of the road effect, really good at giving basic advice – think of it just as an aggregate of what people have thought.“
  • „Is in the hand of a private company – what questions get answered and what don’t.“

Ausprobiert: ChatGPT

ChatGPT wurde von OpenAI Ende November 2022 als Research Realease für die Öffentlichkeit freigegeben zwecks weiterer Forschung und zum Erhalt von Feedback. Seitdem wird in Fachcommunities und Medien mehr oder minder aufgeregt diskutiert: Was bedeutet ChatGPT für Universitäten und Bildung?

Einige Daten zu ChatGPT

  • Wer steckt dahinter? https://openai.com/about/
  • Was ist das Ziel von ChatGPT? ChatGPT ist ein großes Sprachmodell, das von OpenAI trainiert wurde, um Text in verschiedenen Sprachen zu verstehen und zu generieren.
  • Was heißt GPT eigentlich? Generative Pre-trained Transformer
  • Wie erfolgt der Zugang? Webseite, https://chat.openai.com/
    Nicht zu verwechseln mit diversen Produktivität-Smartphone-Apps mit teils ausgesprochen ähnlichen Icons, In-App-Käufen und Versprechen wie „Write a paper in seconds“
  • Login? Mit Google Account, Microsoft Account oder kostenlos anlegbarem OpenAI-Account (Name, Mail, Mobilnummer)
  • Hinweise beim Zugang? „This is a free research preview. Our goal is to get external feedback in order to improve our systems and make them safer. While we have safeguards in place, the system may occasionally generate incorrect or misleading information and produce offensive or biased content. It is not intended to give advice.“
  • Kosten? „During the research preview, usage of ChatGPT is free.“

Einige Empfehlungen aus der Education-Community

Statt mehr Kontrolle (sowieso kaum möglich) und Verhindern des Einsatzes von ChatGPT wurde in der Community z. B. Folgendes empfohlen:

  • Lernprozesse beurteilen, nicht das finale Produkt
  • Auf kleinere Gruppen mit viel Diskussion setzen
  • Mehr mündliche Prüfungen einbauen
  • KI offiziell erlauben mit Quellenangabe und sinnvoll in die LV integrieren
  • KI-erzeugte Texte manuell verbessern bzw. inhaltlich korrigieren lassen
  • KI als Lerninhalt

Wikipedia schreibt zu ChatGPT „ChatGPT was launched in November 2022 and has garnered attention for its detailed responses and articulate answers, although its factual accuracy has been criticized.“ Letzteres kann ich bestätigen, zudem man keine Chance hat, die Quellen für die Antworten von ChatGPT nachzuvollziehen! Auf „Nachfrage“ erfährt man dann eventuell, dass etwas „not intended to be taken as a fact“ ist oder  ein „fictional example“ war (!) Wer sich für ein Beispiel für von ChatGPT erzeugte nicht korrekte Fakten interessiert, s.u. Abschnitt zu meiner Suchanfrage zur RPTU.

Eigene Tests von ChatGPT

Für mich ist der große Unterschied zu vorigen Entwicklungen, dass das KI-Tool ChatGPT kostenlos für jedermann niederschwellig über eine Webseite zugänglich und nutzbar ist.
Die vorigen KI-Entwicklungen, die auf Tagungen teils schon diskutiert wurden, waren eher nicht nachvollziehbar oder gar zum persönlichen Ausprobieren. Das erklärt auch gewissermaßen den aktuellen Hype um ChatGPT.
KI ist seit Jahren zwar irgendwie ein Thema in Deutschland, aber wer hat schon verstanden, was es wirklich bedeutet und welche Dinge damit konkret möglich werden, zumal der Algorithmen-Aspekt für die meisten eine abschreckende Barriere bedeuten dürfte… Einen frühen sehr guten Beitrag zur Verbreitung von Wissen bzgl. KI leisteten die Finnen seit 2018 mit ihrem sehr bekannt gewordenen Kurs „Elements of AI“.
Und mit ChatGPT steht nun die Webseite https://chat.openai.com zur Verfügung, die nach Login z. B. per Google-Account mit dem dahinterliegenden „Transformer Language Model“ Erstaunliches leistet, um dank KI menschenähnliche Konversationen in Textform zu erzeugen:
In der Benutzeroberfläche, die einer Messaging App ähnelt, einfach eine Frage stellen, einen Befehl eingeben oder einen Chat mit GPT beginnen. Am Besten auf Englisch (geht aber auch auf Deutsch). Die Formulierung der eigenen Eingabe hat natürlich Auswirkungen auf das Ergebnis. So können umfangreiche Texte erzeugt werden (das ist der Aspekt, der derzeit Universitäten aufschreckt – Zitat „game changer“ bzgl. Prüfungen&Assessment), Programmcode geschrieben, Sachverhalte einfach erklärt werden, Gedichte erstellt, Multiple Choice Fragen kreiert werden etc.

Funktionierende Beispiele

Hinweis: Aus Platzgründen habe ich im Folgenden die Ergebnisse meiner 5 dargestellten Beispiel-Konversationen mit ChatGPT nur verlinkt zu einem jeweiligen Screenshot!

Nach ca. 9 Sekunden hatte ich stets eine Reaktion, die einem schnellen Tippen eines Gegenübers ähnelte und dabei sprachlich nicht mehr als Computer identifizierbar war. Wenn nicht das System wegen Überlastung mit „Request timed out“ oder „Too many requests, please slow down“ reagierte oder gar mit Absturz.

Vergleichweise „einfache“ Anfragen, da es im Netz dazu genug Trainings-Material gab, wurden fachlich recht überzeugend beantwortet und würden manche persönliche (Kurz-)Beratung ersetzen können:

  • Bsp. 1: Why should I go to a lecture at a university if I am a student? (Link zum Screenshot)
  • Bsp. 2: What is your recommendation for an interactive live seminar with some students at university and some students at home? (Link zum Screenshot)
  • Bsp. 3: How should a learning management course look like in order to be motivating for students? (Link zum Screenshot)

Auch bei der Aufforderung, MCs zu erzeugen, kamen auf den ersten Blick gute Ergebnisse – per anschließendem Klick auf „Try again“ in leicht abgewandelter Form:

  • Bsp. 4: Generate an easy multiple choice question relating to the topic sports and AI with 4 wrong answers and 1 correct answer. (Link zum Screenshot)

 

Und nun ein problematisches Beispiel zur Suchanfrage „RPTU“

Schwieriger wurde es für ChatGPT, als ich Fragen zu der am 1.1.23 neu an den Start gehenden RPTU (Link zur Webseite der RPTU) stellte und damit auf das Grundproblem von ChatGPT stieß, u.U. sprachlich überzeugend falsche Fakten zu produzieren. Ja, die GPT-Datenbasis ist von 2021 und die RPTU-Entwicklungen bzgl. Namen etc. tatsächlich neue(re)n Datums, aber dennoch… Der Beginn war zunächst noch überzeugend:

  • Bsp. 5: Which 5 aspects do I need to know about RPTU?

[ChatGPT]: „It is difficult to provide a response without more context about what „RPTU“ stands for and what topic or field it pertains to. Could you please provide more information about the topic or context in which you are interested in learning about RPTU?“
Nachdem ich ergänzte per ‚RPTU is „Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau“‚ wurde es interessant und sehr schnell erhielt ich eine halbe Seite Text, darunter falsche Daten zur Gründung und zu den Partnern. Darauf angesprochen Would you like to correct your first answer as RPTU was not founded in 1970?antwortete ChatGPT sehr höflich „Thank you for bringing this to my attention. I apologize for any confusion I may have caused. I was unable to find any information about the founding date of Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau (RPTU). I recommend verifying the founding date of RPTU with a reliable source.“ Meine erneute Nachfrage „why did you choose 1970 as founding date of RPTU?“ blieb unbeantwortet wegen „Request timed out“ und „Too many requests, please slow down.“ Damit war mein gestriger Test dann auch beendet.

Leider konnte ich heute nicht direkt fortsetzen, denn auf die gleiche Frage Which 5 aspects do I need to know about RPTU?“ war ChatGPT heute Mittag sofort der Meinung „RPTU stands for Remote Power Transmission Unit, which is a device used to transmit electrical power over long distances using high-voltage transmission lines….“
Das konnte ich so nicht stehenlassen und erkundigte mich „When I asked you yesterday, why did you choose 1970 as founding date of RPTU?“ Die höfliche Antwort von ChatGPT: „I apologize, but I am unable to recall previous conversations or information that you have provided. In order to accurately answer your question, it would be helpful if you could provide more context or specify which information you are referring to.“
Der Aufforderung kam ich gerne nach:
[ID]: „You said: Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau (RPTU) is a technical university located in Kaiserslautern and Landau, Germany. Here are five things you might want to know about RPTU: 1. History: RPTU was founded in 1970 as a merger of the Technical University of Kaiserslautern and the University of Applied Sciences in Landau.“
[ChatGPT]: „I apologize for the confusion. The information I provided about the Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau (RPTU) was not intended to be taken as fact. RPTU is not a real university, and I provided the information as a fictional example to illustrate the types of information that might be relevant to know about a technical university.“
Für mich eine interessante „War ja alles nicht so gemeint“-Reaktion von ChatGPT – das Training von ChatGPT erfolgte ja auch auf Basis von menschlichen Konversationen – und dazu kann ich nur sagen: Ein Riesenthema wird sein, erzeugte Texte/Antworten von ChatGPT überhaupt auf deren Korrektheit zu beurteilen! Das fördert sicherlich auch das genaue Lesen…

Trotz aller Kritik an ChatGPT: Ich war sehr beeindruckt, und jeder sollte unbedingt die Möglichkeit nutzen, dieses derzeit kostenlose Tool einmal selbst auszuprobieren!

***

Ein Gedicht

Jedenfalls war ich nach diesen Tests in der Stimmung, mich aufs komplett Fiktive zu verlegen und ich ließ ChatGPT ein Gedicht über einen Waschbär erstellen, der nach Heidelberg ziehen wollte, aber keine Wohnung fand 🙂

Frohe Weihnachten; alles wird gut!

Waschbaer-Gedicht