ChatGPT Plus und Bilderkennung

Und schon wieder hat sich ChatGPT Plus deutlich verändert: Endlich ist das Dropdown-Menü weg und die sonst nur alternativ auswählbaren Optionen „browse the web“, „analyze data“ und „generate images“ (= DALL-E3) sind jetzt direkt in GPT-4 enthalten. Lediglich die Plugins sind nun noch eine alternative Auswahloption. Btw, meine bisherigen Plugins sind aktuell weg – ob wegen des kürzlichen ChatGPT Plus-Updates oder anderer Gründe bleibt mir unklar.

chatgptplus-01.jpg   chatgptplus-02.jpg

Komplett neu in ChatGPT Plus ist die Möglichkeit, eigene GPTs zu erzeugen oder per „Explore“ von anderen bereits erstellte GPTs zu nutzen – doch das ist ein spannender Test für einen anderen Tag.

 

Test der Bilderkennungsfunktion per Upload eigener Fotos

Denn genauer anschauen möchte ich mir heute die viel gelobte Bilderkennungsfunktion, von der ich inzwischen annehme, dass ich sie noch gar nicht hatte, als ich versucht hatte, sie zu testen (s. Blogbeitrag vom 1.10.23). 

 

Beispiel 1: Gebäude „where is this?“

20231110-chatgptplus-03-chat.jpg

Ergebnis: Dieses Mal auf Anhieb korrekt erkannt (vgl. Blogbeitrag vom 1.10.23).

 

Beispiel 2: Geldsumme „what is the total?“

20231110-chatgptplus-04-chat.jpg

Ergebnis: Nicht schlecht, aber ChatGPT Plus machte bei der Erkennung aus einer 20 eine 50 – immerhin stimmte dann die Summe aus seinen erkannten Einzelpositionen.

 

Beispiel 3: Uhrzeit „what time is it?“

20231110-chatgptplus-05-chat.jpg

Ergebnis: Das scheint generell ein Problem zu sein, wie ich neulich in einem Artikel gelesen habe – wegen entsprechender Trainingsdaten kommt hier sowieso immer 10:10 Uhr heraus. Nunja, eine kleine Variation hat ChatGPT Plus bei mir ja zunächst versucht mit dem Ergebnis 10:09.

Da reizte es mich doch, den gleichen Prompt „what time is it?“ mit einem Foto einer digitalen Zeitanzeige zu probieren.

20231110-chatgptplus-06-chat.jpg

Ergebnis: Bei einem Uhrenfoto mit digitaler Anzeige war ChatGPT Plus wieder auf sicherem Terrain und lieferte korrekt die abgebildete Uhrzeit. Beim ersten Versuch gab es allerdings nur eine Fehlermeldung.

 

Auch heute finde ich die ChatGPT Plus-Ergebnisse beeindruckend, wenngleich man wirklich genau hinsehen muss (Geldsumme) und eben den Trainingsbesonderheiten eines LLM unterliegt (die man normalerweise ja nicht kennt), d.h. somit JEDES Ergebnis von ChatGPT Plus erst einmal kritisch hinterfragen sollte, wenn man nicht um Kreativität gebeten hat.