Wird KI seinem Hype gerecht?

Außerdem: Microsofts unglaubliches Small-Language-Model Phi 3, VASA-1 & Modernas Wette auf ChatGPT

Lesezeit: ~ 5 Min.

Hej hej,

diese Woche muss ich die Episode in zwei Teile aufteilen:

  • heute gibt es nur News und

  • Mittwoch mache ich euch den nächsten Deep Dive fertig

Der Grund dafür ist, dass ich Montag und Dienstag geschäftlich in Schweden bin, wofür ich noch einiges vorbereiten musste.

News: Vielleicht habt ihr es bereits gemerkt: Ich habe jetzt die Domain 10x-klasse.com gekauft. Alles bleibt wie bisher, aber vielleicht stößt du kurzfristig auf ein paar technische Probleme beim Redirect oder meine Mails kommen vorübergehend in deinen Spam.

👀 Falls ihr die letzte Ausgabe verpasst habt: Die Content-Strategie & wie du personalisierte Inhalte mit ChatGPT erstellst

Was wir heute vorhaben:

CHART DER WOCHE
📊 Small Language Models - der neue Trend, der sich selbst überholt

Die schiere Geschwindigkeit neuer KI-Modellveröffentlichungen in letzter Zeit ist fast schon nervig.

Vor zwei Wochen war es Gemini Pro 1.5 und Grok 1.5. Letzte Woche war es Llama 3. Und diese Woche ist es Phi 3 (probiere es auf HuggingFace aus).

Phi 3 ist Microsofts neuestes Juwel und das führende kleine Modell (SML) auf dem Markt. Einfach gesagt, sind kleinere KI-Modelle darauf ausgelegt, schneller, günstiger und effizienter zu sein als umfangreichere Modelle wie GPT-4. Daher sind kleine Modelle besonders gut in einfacheren Aufgaben, wie dem Zusammenfassen von Texten. Hier kannst du dir ein Beispiel anschauen, wie schnell Llama 3 auf den Chips von Groq läuft (ich hatte hier über Groq mit “q”, nicht mit “k” berichtet):

Mit all diesen neuen Modellen, die auf den Markt kommen, versuchen die Leute herauszufinden, welche die Crème de la Crème sind. Ein Ansatz wird als Benchmarking bezeichnet.

Benchmarks sind eine Reihe von standardisierten Tests, die Forscher ihre KI-Modelle durchführen lassen. Sie sind im Grunde die SAT-Prüfungen für KI. Es gibt einen Test namens MMLU, bei dem Anthropic's Claude 79,0, Googles Gemini 81,9 und Metas Llama 3 82,0 erreichten. Ein anderer heißt HumanEval, bei dem Claude 73,0, Gemini 71,9 und Llama 3 81,7 erzielten.

Ob Benchmarks wirklich die Nützlichkeit eines Chatbots für den Durchschnitts-Joe widerspiegeln oder ob sie nur Metriken sind, an die KI-Firmen ihre Chatbots anpassen, damit sie Dinge wie "[x-Modell] ist jetzt der leistungsstärkste Chatbot laut Benchmarks, blablabla" prahlen können, steht jedoch zur Debatte.

Ein weiterer Maßstab, die LMSYS Chatbot Leaderboard, lässt tatsächlich Hunderttausende von Menschen jedes Modell testen und dann abstimmen, welches das beste ist.

ChatGPT-4 Turbo ist #1, gefolgt von Claude 3 Opus und Gemini 1.5 Pro.

Meine Lösung? Teste alle Chatbots und sieh, welcher für deine täglichen Arbeitstasks am nützlichsten ist. Es geht mehr um den gefühlten "Vibe" als um alles Andere, da die Leistung für dich wahrscheinlich kaum spürbar sein wird.

DER KURATIERTE BEREICH
🚒 Top News: Wird KI seinem Hype aktuell gerecht?

Trotz der übertriebenen Prognosen, die wir oft von Tech-CEOs über KI während der Gewinnkonferenzen hören, hier ein Realitätscheck: KI im Jahr 2024 ist nicht sooo beeindruckend.

Ja, ich habe es gesagt und nehme mir damit selbst den Wind aus den Segeln.

Das heißt nicht, dass sie wertlos ist – wenn sie richtig genutzt wird, kann die heutige KI die Produktivität in Bereichen wie Programmierung, Inhaltserstellung und Personalwesen um 20-40% steigern.

Die heutige KI ist noch nicht in der Lage, die meisten Jobs zu ersetzen: Sie kämpft mit komplexen Aufgaben, produziert Fehler und kann sich nicht einmal selbst auf Zoom stumm schalten (wie deine Eltern).

Der Grund, warum wir das ansprechen, ist, dass viele Leute zu große Träume davon haben, wie bald KI wirklich alles revolutionieren wird. So sehr, dass sogar die großen Tech-Unternehmen ihre eigene Hype zurückfahren:

„Wie lange kann die von künstlicher Intelligenz angetriebene Rallye an der Wall Street weitergehen, ohne klare Beweise dafür, dass generative KI den Geschäften einen bedeutenden Schub gibt?“

Selbst Sam Altman, der Mann, der das Ding baut, gibt zu, dass KI ein laufendes Projekt ist:

„Ich denke, derzeit sind die Erwartungen extrem hoch. Die Realität ist immer noch ziemlich schlecht. Ehrlich gesagt, sind diese Modelle nicht so gut. Ich denke, sehr schnell werden die Erwartungen beginnen zu sinken…“

Hier ist meine Meinung: Trotz der Skepsis und des Hypes werden diejenigen, die KI-unterstützte Werkzeuge anwenden können, die High-Performer von morgen sein. Und über Chatbots hinaus bin ich überzeugt, dass das, was das Geschäftsleben wirklich verwandeln und Produktivität freisetzen wird, KI-Agents (Glossar) sind.

🤝 Deals & Partnerschaften

💉 Moderna sieht Ergebnisse mit ChatGPT Enterprise.

Erinnert ihr euch an Moderna, den Biotech-Pionier hinter dem zweitbesten Covid-19-Impfstoff von BionTech?

Das inzwischen 42 Mrd. Dollar schwere Unternehmen arbeitet mit OpenAI zusammen, um die Entwicklung anderer lebensrettender mRNA-Medikamente zu beschleunigen und natürlich die Produktivität seiner Mitarbeiter zu erhöhen.

Zwei Punkte aus der Partnerschaft, die herausstechen:

  • 100% des Legal-Teams verwenden ChatGPT Enterprise (dieser Plan verwendet eure Daten nicht, um seine Modelle zu trainieren).

  • Moderna verzeichnet eine enorme Adoption von GPTs, auch bekannt als spezialisierte Versionen von ChatGPT.

Tatsächlich haben Moderna und seine Mitarbeiter (mit Hilfe von OpenAI) über 750 GPTs erstellt!

  • Ein GPT namens „Dose ID“ überprüft klinische Daten und visualisiert große Datensätze

  • Ein weiterer, „Policy Bot GPT“, hilft Mitarbeitern, schnell Antworten auf interne Richtlinien zu finden, ohne endlose Dokumente durchsuchen zu müssen

  • Ein Corporate GPT übersetzt Biotech-Fachjargon in Laienbegriffe für Investoren-Updates

  • Mein Favorit, der Contract Companion GPT, kann jeden Vertrag „lesen“:

GPTs können dabei helfen, repetitive Prozesse oder Aufgaben zu automatisieren, die normalerweise Praktikanten vorbehalten sind. Ein kluger Zug von Moderna war es, Führungskräfte UND Mitarbeiter dazu zu ermutigen, spezialisierte GPTs für ihre spezifischen Bedürfnisse zu entwickeln und sie mit Kollegen zu teilen.

Auf der anderen Seite: 65% der Top-20-Pharmaunternehmen haben ChatGPT am Arbeitsplatz aufgrund von Bedenken über das Leaken sensibler interner Daten verboten.

🛠️ Werkzeuge & Tools

🖼️ Microsoft hat eine KI entwickelt, die Bilder in sprechende Figuren animiert.

Gerade als wir dachten, KI könnte nicht seltsamer werden, präsentierte Microsoft ein neues KI-Modell namens "VASA-1", das jedes statische Bild zum "Sprechen" und "Singen" bringen kann. Ich hatte bereits hier dazu berichtet.

Die Videos klingen unheimlich echt:

Zwei Fragen:

  • Warum klang dieser Clip besser als 95% der KI-Musik, die ich bisher gehört habe?

  • Warum verwendet ein 3 Billionen Dollar schweres Unternehmen wie Microsoft seine Zeit und Geld, um die Mona Lisa rappen zu lassen?

Im besten Fall könnte dieses Tool zur Erzeugung von KI-Videos Unternehmen helfen, Kunden auf neue Weise zu binden.

Sofortige Videos von jedem, der alles sagt und echt aussieht/klingt = enorme Zeitersparnis. Stell dir vor, du verwendest ein einzelnes Bild von Apple-CEO Tim Cook, um endlose Marketingvideos zu erstellen, in denen er das Apple Vision Pro bewirbt.

Genau daran arbeiten Unternehmen wie HeyGen und Synthesia (speziell mit KI-Avataren):

Im schlimmsten Fall könnte diese Technologie jedoch die sehr berechtigte Sorge verstärken, dass KI zur Erstellung von hyperrealistischen Deepfake-Inhalten verwendet wird, die die Realität verzerren.

Das ist eine berechtigte Sorge, denn das passiert bereits im großen Maßstab:

  • KI-Deepfake-Videos, die Prominente wie Tom Hanks und Mr. Beast imitieren und gefälschte Produkte bewerben, sind viral gegangen.

  • Zwei A-Liste indische Schauspieler, Ranveer Singh und Aamir Khan, waren Opfer von KI-Klonvideos, die sie fälschlicherweise als Unterstützer bestimmter politischer Parteien darstellten.

Microsoft hat in seiner Ankündigung das potenzielle Missbrauchsrisiko anerkannt und hat „keine Pläne, eine Online-Demo, API, Produkt, zusätzliche Implementierungsdetails oder damit verbundene Angebote zu veröffentlichen“.

Das ist wahrscheinlich eine weise Entscheidung, insbesondere da Deepfakes derzeit das wichtigste KI-bezogene Thema sind, das von Regulierungsbehörden angegangen wird.

🚀 Tech

🤖 Musk gibt Neuigkeiten zu Optimus

Elon Musk gab neue Updates zu Teslas autonomen Robotern Optimus während des Quartalsberichts Q1 2024 des Unternehmens bekannt – er betonte, dass Tesla eher als ein KI- oder Robotikunternehmen und nicht als Automobilhersteller angesehen werden sollte.

Musk sagte, er glaube, dass Optimus „wertvoller als alles andere [im Unternehmen] zusammen“ sein werde.

🏛️ Regulierung

🇪🇺 Die EU könnte wegen Wettbewerbsbedenken das Microsoft-OpenAI-Geschäft untersuchen

Die Europäische Kommission erwägt laut Reuters eine kartellrechtliche Untersuchung der 13 Mrd. Dollar schweren Investition von Microsoft in OpenAI, unter Hinweis auf mögliche Wettbewerbsbeschränkungen. Diese mögliche Untersuchung folgt bestehenden Prüfungen durch die britische Wettbewerbs- und Marktaufsichtsbehörde und die US-amerikanische Federal Trade Commission. Die Meldung findet ihr hier →

DEEP DIVE
Ich hoffe, ich schaffe es am Mittwoch!

OUTRO
Wie ich dir helfen kann, wenn du bereit bist:

Mein (kostenloses) KI-Starterkit in Notion (Link)

Die Tools, die ich jeden Tag verwende & wärmstens empfehle:

  1. Beehiiv.com* - mein Newsletter-Programm, das mir >1.000 Abonnenten gebracht hat

  2. Perplexity.ai - Die Suchmaschine der KI-Ära - mehr Infos hier

  3. Decktopus.com* - Erstelle qualitativ hochwertige Präsentation in Sekunden

  4. Typeshare.co* - Meine All-in-One Social Media Content-Creation Suite, die dir die am besten funktionierenden Templates für die unterschiedlichen Kanäle anbietet

  5. Hypefury.com* - Mein Social-Media-Tool, mit dem ich mein Twitter auf > 2.000 Follower gebracht habe

  6. Copy.ai - Mit KI Inhalte generieren, wie Titel, E-Mails und Social-Media-Beiträge

  7. Scribe AI* - mein Tool für technische Dokumentation bei Kunden, die automatisch mitdenkt und die Veröffentlichung per Klick kinderleicht macht

  8. Screenstory.io* - Loom auf Steroiden - erstelle Gifs, Tutorials & andere Videos

  9. Guidde.com*- Erstelle super schnell Videoanleitungen für dein Team

  10. Descript.com - Nutze ich derzeit für Video- und Podcast-Bearbeitung (coming soon)

  11. Looka.com - Erstelle schnell deine Brandutensilien mit der Hilfe von KI

Die Tools sind in der Frequenz der Anwendung gelistet.

*Gesponserte/Affiliate Links

Wie hat dir der heutige Newsletter gefallen?

Login oder Abonnieren um an umfragen teilzunehmen.