• 10x-Klasse
  • Posts
  • Ist das GPT-4o Sprachmodul wirklich so beeindruckend, wie im Vorstellungsvideo?

Ist das GPT-4o Sprachmodul wirklich so beeindruckend, wie im Vorstellungsvideo?

Außerdem: Leider keinen Deep Dive, dafür aber ...

Lesezeit: ~ 4 Min.

Moin liebe 10xer,

dieses Wochenende habe ich es leider aufgrund von Geburtstagsfeier meiner Partnerin und Vorbereitung auf Geschäftsreise nach Toulouse nicht geschafft, meinen Deep Dive fertig zu machen.

Dazu ist mir letzte Woche ein Anfängerfehler passiert: Ich habe nicht jedes Medium getestet, sodass nichts passiert ist, wenn ihr mein Video angeklickt habt 😄

Was für ein Trottel…

Deswegen hier noch einmal:

Was habe ich also heute für euch?

👀 Falls du die letzte Ausgabe verpasst hast: Erstelle eine Woche voller LinkedIn-Posts in 30 Min. (100% Cringe-sicher!!)

  1. Link Empfehlungen: 

  2. Chart: Sind wir

  3. Beitrag der Woche: Google hat mal wieder verkackt

  4. Kuratierter Bereich: xAIs bestätigt die Blase

  5. Deep Dive: Erstelle eine Woche voller LinkedIn-Posts in 30 Min.

CHART
📊 Der unglaubliche Fortschritt der großen Sprachmodelle (LLMs)

Ich kann euch wirklich empfehlen, diese animierte Video auf 𝕏 anzuschauen:

Das Erstaunlichste ist der Sprung von Anthropic auf den Level von OpenAI im März diesen Jahres. Ein vielleicht einmaliger Anstieg der Performance, die einen fragen lässt, ob sie durch einen erneuten solchen Anstieg an OpenAI vorbeiziehen.

DER BEITRAG DER WOCHE
📰 ChatGPT-Voice: Nicht so wie in der Demo.

Ich habe die letzte Woche damit verbracht, mit dem ChatGPT-Sprachmodus zu spielen, der neuesten Iteration von ChatGPT-4o, mit dem man sprechen kann. Falls du nicht weiß, kannst du es dir hier im Schnelldurchlauf durchlesen: Link.

Wenn du noch nicht gesehen hast, wozu er fähig sein soll, lies meinen Bericht zur Vorstellung des Sprachmodus, als GPT-4o eingeführt wurde – es fühlte sich definitiv wie ein Blick in die Zukunft der KI-Assistenten an.

Hier ist meine ehrliche Reaktion: Es ist das erste Mal, dass ich das Gefühl habe, ein echtes Gespräch mit einer KI zu führen, ohne ständige 3-Sekunden-Pausen und „Entschuldigung, könntest du das noch einmal sagen?“ Liebe Grüße an Siri…

Der wahre Game-Changer ist die Geschwindigkeit. Stelle dem Sprachmodus jede Frage, wie „Erzähl mir von neuronalen Netzwerken“, und er antwortet sehr schnell. Das sind die Momente, in denen es Sinn ergibt, die Applikation zu nutzen:

  1. Wenn ich mit ChatGPT interagieren will, aber lieber sprechen als tippen möchte (z.B. unterwegs, beim Diktieren von Notizen, Brainstorming-Sitzungen oder Lernen neuer Themen)

  2. Wenn ich normalerweise Siri verwenden würden

Natürlich ist der Sprachmodus nicht ohne Macken.

Etwa alle fünf Fragen versteht der Sprachmodus mich falsch und schweift dann ab. Als ich nach Außerirdischen fragte, sprach er stattdessen über Alienware. Offensichtlich spricht ein Computer lieber über Alienware… (Gamer wissen, was ich meine)

Er unterbricht auch (OpenAI hat ihn wirklich darauf trainiert, Menschen zu imitieren!). Jedes Mal, wenn du eine Pause machst, um nachzudenken und den nächsten Satz zu formulieren, nimmt ChatGPT oft an, dass du fertig bist und beginnt zu antworten.

Und ja, er halluziniert wie das alte ChatGPT.

Warum es wichtig ist: Aktuell ist der ChatGPT-Sprachmodus hauptsächlich ein unterhaltsames Spielzeug. Aber wenn mehr Nutzer Zugang dazu bekommen, werden wir sehen, dass er sowohl auf produktive als auch auf, na ja, kopfschmerzverursachende Weise angewendet wird.

Einige Nutzer mit Zugang zum Sprachmodus gingen direkt dazu über, ihn als Partner zu verwenden. Sind wir an diesem Punkt wirklich noch überrascht? Nope.

DER KURATIERTE BEREICH
🚒 Weitere News im Schnelldurchlauf

🚀 Tech & Tools

⛈️ Microsofts KI-Wettervorhersagemodell

Microsoft-Forscher haben Aurora vorgestellt, ein neues KI-Grundlagenmodell, das genaue Vorhersagen für eine Vielzahl von Wetterszenarien, einschließlich extremer Ereignisse oder Gebiete mit begrenzten Daten liefert.
Das Modell mit 1,3 Mrd. Parametern kann eine globale Luftverschmutzungsvorhersage für 5 Tage in weniger als 60 Sek. erstellen. Aurora liefert auch 10-Tage-Vorhersagen für die ganze Welt in hoher Auflösung und übertrifft die besten bisherigen Modelle. (Link)

OpenAI untersucht die inneren Abläufe von GPT

OpenAI hat ein neues Papier veröffentlicht, in dem eine Methode zur “Rückentwicklung” von Konzepten, die von KI-Modellen gelernt wurden, und zum besseren Verständnis der inneren Abläufe von ChatGPT beschrieben wird. Das Papier wurde von Mitgliedern des kürzlich aufgelösten Superalignment-Teams verfasst (hier berichtet), darunter Ilya Sutskever und Jan Leike.

🗣️ Gossip

Aktuelle und ehemalige Mitarbeiter führender KI-Labore, darunter OpenAI, Anthropic und DeepMind, haben einen offenen Brief veröffentlicht, in dem sie Unternehmen auffordern, den Schutz von Whistleblowern zu erweitern, damit Mitarbeiter ohne Angst vor Vergeltungsmaßnahmen vor potenziellen KI-Gefahren warnen können.
Mehrere Forscher haben Threads über ihre Erfahrungen gepostet, wobei Daniel Kokotajlo enthüllte, dass er OpenAI verlassen hat, nachdem er die Hoffnung verloren hatte, dass das Unternehmen verantwortungsbewusst handeln würde.

Die soziale Plattform Cara ist in der vergangenen Woche von 40.000 auf 650.000 Nutzer gewachsen, da die auf Künstler fokussierte, anti-KI-Social-Media-App einen Zustrom von Traffic im Zuge der Gegenreaktion auf Metas KI-Politik verzeichnet.

OUTRO
Wie ich dir helfen kann, wenn du bereit bist:

Mein (kostenloses) KI-Starterkit in Notion (Link)

Die Tools, die ich jeden Tag verwende & wärmstens empfehle:

  1. Beehiiv.com* - mein Newsletter-Programm, das mir >1.000 Abonnenten gebracht hat

  2. Perplexity.ai - Die Suchmaschine der KI-Ära - mehr Infos hier

  3. Decktopus.com* - Erstelle qualitativ hochwertige Präsentation in Sekunden

  4. Typeshare.co* - Meine All-in-One Social Media Content-Creation Suite, die dir die am besten funktionierenden Templates für die unterschiedlichen Kanäle anbietet

  5. Hypefury.com* - Mein Social-Media-Tool, mit dem ich mein Twitter auf > 2.500 Follower gebracht habe

  6. Copy.ai - Mit KI Inhalte generieren, wie Titel, E-Mails und Social-Media-Beiträge

  7. Scribe AI* - mein Tool für technische Dokumentation bei Kunden, die automatisch mitdenkt und die Veröffentlichung per Klick kinderleicht macht

  8. Screenstory.io* - Loom auf Steroiden - erstelle Gifs, Tutorials & andere Videos

  9. Guidde.com*- Erstelle super schnell Videoanleitungen für dein Team

  10. Descript.com - Nutze ich derzeit für Video- und Podcast-Bearbeitung (coming soon)

  11. Looka.com - Erstelle schnell deine Brandutensilien mit der Hilfe von KI

Die Tools sind in der Frequenz der Anwendung gelistet.

*Gesponserte/Affiliate Links