10x-Klasse
Posts
Ist das GPT-4o Sprachmodul wirklich so beeindruckend, wie im Vorstellungsvideo?

Ist das GPT-4o Sprachmodul wirklich so beeindruckend, wie im Vorstellungsvideo?

Außerdem: Leider keinen Deep Dive, dafür aber ...

Lennart Orlando
12. Juni 2024

Lesezeit: ~ 4 Min.

Moin liebe 10xer,

dieses Wochenende habe ich es leider aufgrund von Geburtstagsfeier meiner Partnerin und Vorbereitung auf Geschäftsreise nach Toulouse nicht geschafft, meinen Deep Dive fertig zu machen.

Dazu ist mir letzte Woche ein Anfängerfehler passiert: Ich habe nicht jedes Medium getestet, sodass nichts passiert ist, wenn ihr mein Video angeklickt habt 😄

Was für ein Trottel…

Deswegen hier noch einmal:

Link zu meinem Kurzvideo →

Was habe ich also heute für euch?

👀 Falls du die letzte Ausgabe verpasst hast: Erstelle eine Woche voller LinkedIn-Posts in 30 Min. (100% Cringe-sicher!!)

Link Empfehlungen:
Chart: Sind wir
Beitrag der Woche: Google hat mal wieder verkackt
Kuratierter Bereich: xAIs bestätigt die Blase
Deep Dive: Erstelle eine Woche voller LinkedIn-Posts in 30 Min.

LINK EMPFEHLUNGEN
📊 Meine besten Funde aus der letzten Woche

🛠️ Werkzeuge & Tools

✍️ Wiki-Artikel auf Knopfdruck: Das KI-Startup Perplexity hat eine neue Funktion namens Pages eingeführt, die es den Nutzern ermöglicht, einfach anpassbare, optisch ansprechende KI-generierte Artikel, Anleitungen und Berichte zu erstellen, die Quellenangaben enthalten (Link)

🧠 7 KI-Kreativitätshacks von Moritz Kremb: Entfessele deine Kreativität mit diesen bewährten KI-Brainstorming-Techniken, von SCAMPER bis Gegenteiltag (Link)

📚 Das einfache Geheimnis eines $200.000/Monat Business: Entdecke, wie Indie-Autoren in Kindle-Nischen Gold finden, indem sie ein wenig bekanntes Datentool verwenden (Link)

🏭 Welches KI-Modell ist wirklich das Beste?: Schau dir die SEAL-Ranglisten der besten KI-Chatbots von heute an, die von unabhängigen Experten bewertet werden (Link)

🩺 Simpler Prompt, um mit deinem zukünftigen Selbst zu sprechen?: Die KI-Forscher hinter “Future You” haben ein Papier veröffentlicht und einen Prompt erstellt, der dir hilft, Angst und negative Emotionen zu reduzieren, indem du mit deinem “zukünftigen Selbst” sprichst. Schau es dir hier an und probiere es aus! (Link)

CHART
📊 Der unglaubliche Fortschritt der großen Sprachmodelle (LLMs)

Ich kann euch wirklich empfehlen, diese animierte Video auf 𝕏 anzuschauen:

Foundational model wars over the past 12 months
OpenAI vs Google vs Anthropic vs 01 AI vs Meta vs Cohere vs Alibaba vs Mistral vs Databricks vs Nous Research & 10000+ more
— Chief AI Officer (@chiefaioffice)
10:25 PM • May 22, 2024

Das Erstaunlichste ist der Sprung von Anthropic auf den Level von OpenAI im März diesen Jahres. Ein vielleicht einmaliger Anstieg der Performance, die einen fragen lässt, ob sie durch einen erneuten solchen Anstieg an OpenAI vorbeiziehen.

DER BEITRAG DER WOCHE
📰 ChatGPT-Voice: Nicht so wie in der Demo.

Bildquelle: beebom.com

Ich habe die letzte Woche damit verbracht, mit dem ChatGPT-Sprachmodus zu spielen, der neuesten Iteration von ChatGPT-4o, mit dem man sprechen kann. Falls du nicht weiß, kannst du es dir hier im Schnelldurchlauf durchlesen: Link.

Wenn du noch nicht gesehen hast, wozu er fähig sein soll, lies meinen Bericht zur Vorstellung des Sprachmodus, als GPT-4o eingeführt wurde – es fühlte sich definitiv wie ein Blick in die Zukunft der KI-Assistenten an.

Hier ist meine ehrliche Reaktion: Es ist das erste Mal, dass ich das Gefühl habe, ein echtes Gespräch mit einer KI zu führen, ohne ständige 3-Sekunden-Pausen und „Entschuldigung, könntest du das noch einmal sagen?“ Liebe Grüße an Siri…

Der wahre Game-Changer ist die Geschwindigkeit. Stelle dem Sprachmodus jede Frage, wie „Erzähl mir von neuronalen Netzwerken“, und er antwortet sehr schnell. Das sind die Momente, in denen es Sinn ergibt, die Applikation zu nutzen:

Wenn ich mit ChatGPT interagieren will, aber lieber sprechen als tippen möchte (z.B. unterwegs, beim Diktieren von Notizen, Brainstorming-Sitzungen oder Lernen neuer Themen)
Wenn ich normalerweise Siri verwenden würden

Natürlich ist der Sprachmodus nicht ohne Macken.

Etwa alle fünf Fragen versteht der Sprachmodus mich falsch und schweift dann ab. Als ich nach Außerirdischen fragte, sprach er stattdessen über Alienware. Offensichtlich spricht ein Computer lieber über Alienware… (Gamer wissen, was ich meine)

Er unterbricht auch (OpenAI hat ihn wirklich darauf trainiert, Menschen zu imitieren!). Jedes Mal, wenn du eine Pause machst, um nachzudenken und den nächsten Satz zu formulieren, nimmt ChatGPT oft an, dass du fertig bist und beginnt zu antworten.

Und ja, er halluziniert wie das alte ChatGPT.

Warum es wichtig ist: Aktuell ist der ChatGPT-Sprachmodus hauptsächlich ein unterhaltsames Spielzeug. Aber wenn mehr Nutzer Zugang dazu bekommen, werden wir sehen, dass er sowohl auf produktive als auch auf, na ja, kopfschmerzverursachende Weise angewendet wird.

Einige Nutzer mit Zugang zum Sprachmodus gingen direkt dazu über, ihn als Partner zu verwenden. Sind wir an diesem Punkt wirklich noch überrascht? Nope.

DER KURATIERTE BEREICH
🚒 Weitere News im Schnelldurchlauf

🚀 Tech & Tools

⛈️ Microsofts KI-Wettervorhersagemodell

Microsoft-Forscher haben Aurora vorgestellt, ein neues KI-Grundlagenmodell, das genaue Vorhersagen für eine Vielzahl von Wetterszenarien, einschließlich extremer Ereignisse oder Gebiete mit begrenzten Daten liefert.
Das Modell mit 1,3 Mrd. Parametern kann eine globale Luftverschmutzungsvorhersage für 5 Tage in weniger als 60 Sek. erstellen. Aurora liefert auch 10-Tage-Vorhersagen für die ganze Welt in hoher Auflösung und übertrifft die besten bisherigen Modelle. (Link)

OpenAI untersucht die inneren Abläufe von GPT

OpenAI hat ein neues Papier veröffentlicht, in dem eine Methode zur “Rückentwicklung” von Konzepten, die von KI-Modellen gelernt wurden, und zum besseren Verständnis der inneren Abläufe von ChatGPT beschrieben wird. Das Papier wurde von Mitgliedern des kürzlich aufgelösten Superalignment-Teams verfasst (hier berichtet), darunter Ilya Sutskever und Jan Leike.

🗣️ Gossip

Aktuelle und ehemalige Mitarbeiter führender KI-Labore, darunter OpenAI, Anthropic und DeepMind, haben einen offenen Brief veröffentlicht, in dem sie Unternehmen auffordern, den Schutz von Whistleblowern zu erweitern, damit Mitarbeiter ohne Angst vor Vergeltungsmaßnahmen vor potenziellen KI-Gefahren warnen können.
Mehrere Forscher haben Threads über ihre Erfahrungen gepostet, wobei Daniel Kokotajlo enthüllte, dass er OpenAI verlassen hat, nachdem er die Hoffnung verloren hatte, dass das Unternehmen verantwortungsbewusst handeln würde.

Die soziale Plattform Cara ist in der vergangenen Woche von 40.000 auf 650.000 Nutzer gewachsen, da die auf Künstler fokussierte, anti-KI-Social-Media-App einen Zustrom von Traffic im Zuge der Gegenreaktion auf Metas KI-Politik verzeichnet.

DEEP DIVE
🤿 Diese Woche fällt aus 😱

Hier könnt ihr die letzten Ausgaben lesen:

Am nächsten Montag werde ich dann wieder für euch da sein.

OUTRO
Wie ich dir helfen kann, wenn du bereit bist:

✅ Mein (kostenloses) KI-Starterkit in Notion (Link)

✅ Die Tools, die ich jeden Tag verwende & wärmstens empfehle:

Beehiiv.com* - mein Newsletter-Programm, das mir >1.000 Abonnenten gebracht hat
Perplexity.ai - Die Suchmaschine der KI-Ära - mehr Infos hier
Decktopus.com* - Erstelle qualitativ hochwertige Präsentation in Sekunden
Typeshare.co* - Meine All-in-One Social Media Content-Creation Suite, die dir die am besten funktionierenden Templates für die unterschiedlichen Kanäle anbietet
Hypefury.com* - Mein Social-Media-Tool, mit dem ich mein Twitter auf > 2.500 Follower gebracht habe
Copy.ai - Mit KI Inhalte generieren, wie Titel, E-Mails und Social-Media-Beiträge
Scribe AI* - mein Tool für technische Dokumentation bei Kunden, die automatisch mitdenkt und die Veröffentlichung per Klick kinderleicht macht
Screenstory.io* - Loom auf Steroiden - erstelle Gifs, Tutorials & andere Videos
Guidde.com*- Erstelle super schnell Videoanleitungen für dein Team
Descript.com - Nutze ich derzeit für Video- und Podcast-Bearbeitung (coming soon)
Looka.com - Erstelle schnell deine Brandutensilien mit der Hilfe von KI

Die Tools sind in der Frequenz der Anwendung gelistet.

_{*Gesponserte/Affiliate Links}