Cheery Creator – Chatbot GPT

Soeben habe ich meinen ersten Chatbot (powered by GPT-4) generiert und ich bin noch ganz hin und weg, wie einfach es war und wie beachtlich das Ergebnis ist! Kein Wunder, dass OpenAI momentan den Zugriff limitiert (keine neuen ChatGPT Plus-Kunden und zeitliche Limitierung bei Bestandskunden). Auch ich wurde kurz nach dem Fertigstellen meines GPTs und einigen Testläufen für einige Stunden „ausgesperrt“ – Das lässt Zeit für den folgenden Blogbeitrag.

Spoiler: Mein GPT ist inzwischen „Public“ und kann gerne getestet werden, s.u.

Das Erstellen eines Chatbots

Über den ChatGPT Plus-Menüpunkt „Explore“ kann man …

  • in wenigen Sätzen seine Idee für den Chatbot beschreiben
  • einen Titel vergeben (oder sich vorschlagen lassen)
  • ein Logo generieren lassen und per Chat anpassen
  • Beispiel-Prompts für die Startseite akzeptieren oder ändern
  • einfache Anpassungen machen, z. B. was in einem 2. Schritt passieren soll oder welche etwaigen Nachfragen immer oder zufällig gestellt werden sollen
  • uvm.

Beim Editieren ist der Bildschirm zweigeteilt: links der GPT Builder  mit Create-Chat zum Konfigurieren (inkl. einem Configure-Formular, in dem man auch Funktionen deaktivieren könnte) und rechts die große Vorschau mit dem Bereich zum sofortigen Testen.

Der Rest passiert automatisch und ChatGPT Plus generiert die Dialoge und Bilder dann wie üblich entsprechend seines Modells. Bei meiner Idee ist garantiert, dass die Ergebnisse nicht langweilig werden…

Freigabe: Den eigenen Chatbot kann man für ausgewählte Personen, die den Link kennen, freigeben (=Default) oder als Public. Den „Cheery Creator“ ausprobieren können allerdings nur Personen mit ChatGPT Plus-Account, denn der Link alleine und ein kostenloser OpenAI-Account reichen nicht.

Meine Idee: „Cheery Creator“

Die Zeiten sind düster genug, etwas verbale Aufheiterung per ganz kurzem Textchat kann nicht schaden und DALL-E3 generiert generell hervorragende Bilder. Warum also nicht Beides kombinieren und noch dazu mit der Idee von Ausmal-Motiven? Und natürlich immer mit Waschbär!

Beispiel Cheery Creator (zum Vergrößern anklicken)

 


Update: Inzwischen habe ich wieder Zugriff auf ChatGPT Plus und noch ein wenig getestet. Die Ergebnisse waren so schön, dass ich den „Cheery Creator“ nun als „Public“ freigegeben habe – wer mag (und ein ChatGPT-Plus-Abo hat), kann also gerne unter dem angegebenen Link testen.

Hier geht es zum „Cheery Creator“:
https://chat.openai.com/g/g-sQbPSW1Rx-cheery-creator

 

 

ChatGPT Plus und Bilderkennung

Und schon wieder hat sich ChatGPT Plus deutlich verändert: Endlich ist das Dropdown-Menü weg und die sonst nur alternativ auswählbaren Optionen „browse the web“, „analyze data“ und „generate images“ (= DALL-E3) sind jetzt direkt in GPT-4 enthalten. Lediglich die Plugins sind nun noch eine alternative Auswahloption. Btw, meine bisherigen Plugins sind aktuell weg – ob wegen des kürzlichen ChatGPT Plus-Updates oder anderer Gründe bleibt mir unklar.

chatgptplus-01.jpg   chatgptplus-02.jpg

Komplett neu in ChatGPT Plus ist die Möglichkeit, eigene GPTs zu erzeugen oder per „Explore“ von anderen bereits erstellte GPTs zu nutzen – doch das ist ein spannender Test für einen anderen Tag.

 

Test der Bilderkennungsfunktion per Upload eigener Fotos

Denn genauer anschauen möchte ich mir heute die viel gelobte Bilderkennungsfunktion, von der ich inzwischen annehme, dass ich sie noch gar nicht hatte, als ich versucht hatte, sie zu testen (s. Blogbeitrag vom 1.10.23). 

 

Beispiel 1: Gebäude „where is this?“

20231110-chatgptplus-03-chat.jpg

Ergebnis: Dieses Mal auf Anhieb korrekt erkannt (vgl. Blogbeitrag vom 1.10.23).

 

Beispiel 2: Geldsumme „what is the total?“

20231110-chatgptplus-04-chat.jpg

Ergebnis: Nicht schlecht, aber ChatGPT Plus machte bei der Erkennung aus einer 20 eine 50 – immerhin stimmte dann die Summe aus seinen erkannten Einzelpositionen.

 

Beispiel 3: Uhrzeit „what time is it?“

20231110-chatgptplus-05-chat.jpg

Ergebnis: Das scheint generell ein Problem zu sein, wie ich neulich in einem Artikel gelesen habe – wegen entsprechender Trainingsdaten kommt hier sowieso immer 10:10 Uhr heraus. Nunja, eine kleine Variation hat ChatGPT Plus bei mir ja zunächst versucht mit dem Ergebnis 10:09.

Da reizte es mich doch, den gleichen Prompt „what time is it?“ mit einem Foto einer digitalen Zeitanzeige zu probieren.

20231110-chatgptplus-06-chat.jpg

Ergebnis: Bei einem Uhrenfoto mit digitaler Anzeige war ChatGPT Plus wieder auf sicherem Terrain und lieferte korrekt die abgebildete Uhrzeit. Beim ersten Versuch gab es allerdings nur eine Fehlermeldung.

 

Auch heute finde ich die ChatGPT Plus-Ergebnisse beeindruckend, wenngleich man wirklich genau hinsehen muss (Geldsumme) und eben den Trainingsbesonderheiten eines LLM unterliegt (die man normalerweise ja nicht kennt), d.h. somit JEDES Ergebnis von ChatGPT Plus erst einmal kritisch hinterfragen sollte, wenn man nicht um Kreativität gebeten hat.

ChatGPTPlus und DALL-E-3

Welche KI-Dienste in welcher Version wo nutzbar sind, wird zunehmend unübersichtlicher… Den KI-Bildgenerator-Dienst DALL-E kann ich mittlerweile an 3 verschiedenen Stellen nutzen:

  1. DALL-E-2: Via labs.openai.com mit (aufgrund frühen Registrierens) monatlich 15 neuen credits und mit Bildergalerie.
  2. DALL-E-3: Über ChatGPT-Plus-Dropdown-Option im Rahmen vom Textchat. Lokaler Download der Bilder ohne DALL-E-Icon. Noch kein Sharing des Chats inkl. Bildern möglich. Bilder auch nicht importierbar in meine DALL-E-Galerie unter labs.openai.com.
  3. DALL-E-3: Via https://www.bing.com/create „Image Creator“ nach Microsoft-Anmeldung.
    Der Zugang über Bing Chat hingegen hat bei mir „Aufgrund der hohen Nachfrage“ nicht funktioniert.

 

ChatGPT Plus

Der Zugang zu DALL-E-3 durch ChatGPTPlus hat mir sehr gut gefallen bzgl. Möglichkeiten und Ergebnissen. Gleich beim ersten Versuch mit meinem langen Prompt kam ein sehr gutes Ergebnis und durch eine weitere Eingabe auch die gewünschte Veränderung. Im Gegensatz zu der Bilderstellung via labs.openai.com enthalten die Ergebnisse nicht das typische bunte Icon, sind aber nach Download dann auch Standalone und nicht mehr in eine DALL-E-Galerie einbindbar. Es bleibt beim typischen Exportformat 1024×1024. Mein deutscher Eingabeprompt wurde automatisch in englisch übersetzt:

  • Erstelle mir ein farbenfrohes photorealistisches Bild mit einem Waschbär, der eine Sonnenblume in der Pfote hält, ein Buch liest und unter einem blauen Sonnenschirm in einem Liegestuhl an einem Strand sitzt. Im Hintergrund grünes Meer und Wellen sowie 1 Apfelbaum mit gelben Äpfeln.“
  • Photorealistic image showcasing a colorful beach setting. A raccoon, with a sunflower clutched in its paw, is immersed in a book, comfortably resting on a beach chair under a bright blue parasol. The background vividly portrays the greenish hue of the sea with waves lapping at the shore. Adjacent to the scene is an apple tree laden with yellow fruits.“

Erstes Ergebnis (Bild 1 und 2):

Bild1, Ergebnis 1 | Bild2, Ergebnis 1

Verbessertes Ergebnis (Bild 1 und 2):
„The tail of the raccoon should be in colors grey and black instead of yellow and black.“

Bild1, Ergebnis 2 | Bild2, Ergebnis 2

(Link zu PDF mit Testergebnissen)

 

Exkurs Microsoft Image Creator

Das erste Image-Creator-Ergebnis mit dem gleichen Prompt war ziemlich „falsch“, da das Kernelement „Waschbär“ überhaupt nicht umgesetzt wurde und ich habe auch keine Möglichkeit gesehen, das Ergebnis zu verfeinern. Daher an dieser Stelle schon Ende meines Tests.

Image Creator Ergebnis

(Link zu PDF mit Testergebnissen)

Promptvergleich ChatGPT und ChatGPT Plus (GPT-4)

Im Rahmen der Vorbereitung des Workshops auf der RPTU „Summer School Studium und Lehre 2023“ hatte ich im August 2023 einige Prompt-Beispiele mit der kostenlosen Version von ChatGPT 3.5 erstellt. Seit kurzem habe ich privat ein Abo von „ChatGPT Plus“ und habe die gleichen Prompts heute in GPT-4 (Variante Default, Stand Januar 2022) eingegeben. Natürlich würde man auch innerhalb derselben Version von ChatGPT bei mehrfacher Eingabe der gleichen Prompts unterschiedliche Ergebnisse erhalten, so dass die folgenden Ergebnisse nur bedingt aussagekräftig sind.
Dennoch: „ChatGPT Plus“ war im Ergebnis umfangreicher (auch mit Erklärungen), arbeitete stärker mit Rückfragen, ließ sich auch nicht mehr auf Halluzinationen bei Abkürzungen ein, erweiterte beim Programmierauftrag und bot Ergebnisse nun öfter als „Copy Code“ an so z. B. bei den erwünschten Flashcards.

Die Beispiele 1-4 basieren auf vordefinierten Prompts aus dem TUM-ChatGPT4-Cookbook; die Beispiele 5-8 sind frei formuliert. Die Links führen zu auf meinem Webspace abgelegten PDFs mit Screenshots der jeweiligen Chatverläufe.

 

ChatGPT 3.5
(kostenlos)
ChatGPT Plus
(Abo GPT-4)
1 BSP-ChatGPT-Discussion ChatGPT ChatGPT Plus
2 BSP-ChatGPT-OpenQuestions ChatGPT ChatGPT Plus
3 BSP-ChatGPT-Quiz ChatGPT ChatGPT Plus
4 BSP-ChatGPT-Storytelling ChatGPT ChatGPT Plus
5 BSP-ChatGPT-Flashcards ChatGPT ChatGPT Plus
6 BSP-ChatGPT-Halluzinieren ChatGPT ChatGPT Plus
7 BSP-ChatGPT-LessonPlan ChatGPT ChatGPT Plus
8 BSP-ChatGPT-Programmcode ChatGPT ChatGPT Plus

Gestartet: ChatGPT Plus

ChatGPT ist sehr beeindruckend – Bestechend ist die auf den ersten Blick sehr einfache Nutzung, die schon zu respektablen Ergebnissen führt.
Momentan tut sich gerade viel hinsichtlich zusätzlicher Möglichkeiten, die nur in der kostenpflichtigen Version „ChatGPT Plus“ angeboten werden. Hier der Link zu den Release Notes: https://help.openai.com/en/articles/6825453-chatgpt-release-notes

Das Starten des Abos ist sehr einfach, lediglich Kreditkarte und Adresse waren nötig.
Screenshot Abo ChatGPT Plus
Die Plugins und Beta Features der kostenpflichtigen Version „ChatGPT Plus“ waren gar nicht so einfach zu finden. Davon abgesehen, gibt es hier auch größere Unterschiede, was über die Desktop-Version und was über die Mobile-Version (z. B. iOS-App) möglich ist.

In der Desktop-Version erfolgt die Konfiguration über „Settings & Beta“ / „Beta features“. Momentan (1.10.2023) gibt es bei mir 3 Einträge, die man grundsätzlich und später dann per „Mouse-Over über GPT-4“ aktivieren könnte (nur eine Option zur Zeit):

  • Browse with Bing
  • Advanced Data Analysis (m.E.n. besonders interessant für File-Upload)
  • Plugins (Aktuell einige Hundert im Store, die man installieren könnte. Nach Installation nur jeweils max. 3 vorinstallierte parallel bei einem Chat nutzbar. Die fremden Dienste werden von ChatGPT Plus bei Bedarf eingesetzt und sind nur teils ohne weitere Registrierung nutzbar.)

Screenshot ChatGPT Plus Beta Features
Screenshot ChatGPT Plus Beta Features
Die Begrenzung auf eine der Optionen ist für mich nicht wirklich nachvollziehbar und man muss sehr aufpassen, was gerade eingestellt ist, bevor man unten seinen Prompt eingibt. Das was oben eingestellt ist, schlug bei mir in einem Versuch auch durch, als ich eine alte Chat-Anfrage aus der History fortgeführt habe, d.h. eine „Browse with Bing“-History konnte dann plötzlich nicht mehr im Internet suchen, weil im Account aktuell gerade „Advanced Data Analysis“ aktiviert war…

Bzgl. Plugins habe ich die u.g. angetestet und recht gute Ergebnisse erhalten. In einem späteren Blogbeitrag mehr dazu.
Screenshot ChatGPT Plus Plugins

Das Browsen im Internet war früher schon einmal kurz bei ChatGPT möglich, nun ist es wieder da und zeigt ärgerlicherweise nur live kurz an, welche Quelle benutzt wurde (da muss man also sehr genau hinschauen) – am Ende einer Antwort steht dann nur noch „Finished Browsing“; bei mir wurde die englische Wikipedia benutzt. Zur Beurteilung der Antworten wäre es sinnvoller, dass die Quelle dauerhaft zu sehen bliebe.
Screenshot ChatGPT Finished Browsing

Wenig geglückt ist mir bisher die sinnvolle Nutzung der Bilderkennung per File Upload.
Gut zu wissen, damit man nicht lange vergeblich sucht: Nur wenn oben gerade „Advanced Data Analysis“ aktiviert ist, erhält man in der Desktop-Version überhaupt das Plus-Symbol für die Upload-Möglichkeit!
Screenshot ChatGPT Advanced Data Analysis

Screenshot ChatGPT Advanced Data Analysis Bildupload-Beispiel
Wenn für die Upload-Bilderkennung eine Internetsuche erforderlich ist, aber nur eine Beta-Funktion zur Zeit aktiviert werden kann, wie soll das gehen? Nunja, die Vermutung Washington D.C. ist ja nicht gar so verkehrt – in einem anderen Versuch ergab das gleiche Bild übrigens die Einschätzung, dass es sich um die Space Needle in Seattle, Washington, handele…

Abschließend noch kurz zur iOS-App-Version von ChatGPT Plus: Hier gibt es bei mir derzeit nur „Browse with Bing“, d.h. keine Upload-Möglichkeit und keine Plugins wie bei der Desktop-Version. Dafür kann man in der App über „Settings / New features“ reine „Voice conversations“ aktivieren. Neu bei diesem Feature ist, dass man es über das Kopfhörer-Symbol rechts oben startet und dann komplett ausschließlich per Sprache chattet. Erst nach Beenden sieht man wie gewohnt den nun in Text übertragenen Chat.
Screenshot ChatGPT iOS App
Kommentare über diese Funktion waren euphorisch und ich muss sagen, es fühlte sich wirklich sehr real an und in Sachen Unterhaltung zu „why a student should attend a lecture“ ist ChatGPT sehr kompetent 🙂