10x-Klasse
Posts
Wird KI seinem Hype gerecht?

Wird KI seinem Hype gerecht?

Außerdem: Microsofts unglaubliches Small-Language-Model Phi 3, VASA-1 & Modernas Wette auf ChatGPT

Lennart Orlando
30. April 2024

Lesezeit: ~ 5 Min.

Hej hej,

diese Woche muss ich die Episode in zwei Teile aufteilen:

heute gibt es nur News und
Mittwoch mache ich euch den nächsten Deep Dive fertig

Der Grund dafür ist, dass ich Montag und Dienstag geschäftlich in Schweden bin, wofür ich noch einiges vorbereiten musste.

Capture von meinem Instagram-Account

News: Vielleicht habt ihr es bereits gemerkt: Ich habe jetzt die Domain 10x-klasse.com gekauft. Alles bleibt wie bisher, aber vielleicht stößt du kurzfristig auf ein paar technische Probleme beim Redirect oder meine Mails kommen vorübergehend in deinen Spam.

👀 Falls ihr die letzte Ausgabe verpasst habt: Die Content-Strategie & wie du personalisierte Inhalte mit ChatGPT erstellst

Was wir heute vorhaben:

Chart der Woche : Small Language Models - der neue Trend, der sich selbst überholt
News der Woche: Wird KI seinem Hype gerecht?
Deep Dive: Fällt auf (hoffentlich) Mittwoch

CHART DER WOCHE
📊 Small Language Models - der neue Trend, der sich selbst überholt

Phi-3-Modelle vs. andere SLMs - Microsoft

Die schiere Geschwindigkeit neuer KI-Modellveröffentlichungen in letzter Zeit ist fast schon nervig.

Vor zwei Wochen war es Gemini Pro 1.5 und Grok 1.5. Letzte Woche war es Llama 3. Und diese Woche ist es Phi 3 (probiere es auf HuggingFace aus).

Phi 3 ist Microsofts neuestes Juwel und das führende kleine Modell (SML) auf dem Markt. Einfach gesagt, sind kleinere KI-Modelle darauf ausgelegt, schneller, günstiger und effizienter zu sein als umfangreichere Modelle wie GPT-4. Daher sind kleine Modelle besonders gut in einfacheren Aufgaben, wie dem Zusammenfassen von Texten. Hier kannst du dir ein Beispiel anschauen, wie schnell Llama 3 auf den Chips von Groq läuft (ich hatte hier über Groq mit “q”, nicht mit “k” berichtet):

Because anyone can work with them, open models are likely to improve very quickly, creating a lot of capabilities focused on factors ranging from speed to costs.
Here is the new Llama 3 70B being served by Groq (with a q) at 224 tokens/second. This is real-time of me using it.
— Ethan Mollick (@emollick)
5:18 PM • Apr 19, 2024

Mit all diesen neuen Modellen, die auf den Markt kommen, versuchen die Leute herauszufinden, welche die Crème de la Crème sind. Ein Ansatz wird als Benchmarking bezeichnet.

Benchmarks sind eine Reihe von standardisierten Tests, die Forscher ihre KI-Modelle durchführen lassen. Sie sind im Grunde die SAT-Prüfungen für KI. Es gibt einen Test namens MMLU, bei dem Anthropic's Claude 79,0, Googles Gemini 81,9 und Metas Llama 3 82,0 erreichten. Ein anderer heißt HumanEval, bei dem Claude 73,0, Gemini 71,9 und Llama 3 81,7 erzielten.

Ob Benchmarks wirklich die Nützlichkeit eines Chatbots für den Durchschnitts-Joe widerspiegeln oder ob sie nur Metriken sind, an die KI-Firmen ihre Chatbots anpassen, damit sie Dinge wie "[x-Modell] ist jetzt der leistungsstärkste Chatbot laut Benchmarks, blablabla" prahlen können, steht jedoch zur Debatte.

Ein weiterer Maßstab, die LMSYS Chatbot Leaderboard, lässt tatsächlich Hunderttausende von Menschen jedes Modell testen und dann abstimmen, welches das beste ist.

ChatGPT-4 Turbo ist #1, gefolgt von Claude 3 Opus und Gemini 1.5 Pro.

Meine Lösung? Teste alle Chatbots und sieh, welcher für deine täglichen Arbeitstasks am nützlichsten ist. Es geht mehr um den gefühlten "Vibe" als um alles Andere, da die Leistung für dich wahrscheinlich kaum spürbar sein wird.

DER KURATIERTE BEREICH
🚒 Top News: Wird KI seinem Hype aktuell gerecht?

Trotz der übertriebenen Prognosen, die wir oft von Tech-CEOs über KI während der Gewinnkonferenzen hören, hier ein Realitätscheck: KI im Jahr 2024 ist nicht sooo beeindruckend.

Ja, ich habe es gesagt und nehme mir damit selbst den Wind aus den Segeln.

Das heißt nicht, dass sie wertlos ist – wenn sie richtig genutzt wird, kann die heutige KI die Produktivität in Bereichen wie Programmierung, Inhaltserstellung und Personalwesen um 20-40% steigern.

👀Two early papers find the effects of generative AI on knowledge work are completely unprecedented in modern history
Separate studies of both writers and programmers find 50% increases in productivity with AI, and higher performance and satisfaction. And this is just the start.
— Ethan Mollick (@emollick)
8:55 PM • Mar 2, 2023

Die heutige KI ist noch nicht in der Lage, die meisten Jobs zu ersetzen: Sie kämpft mit komplexen Aufgaben, produziert Fehler und kann sich nicht einmal selbst auf Zoom stumm schalten (wie deine Eltern).

Der Grund, warum wir das ansprechen, ist, dass viele Leute zu große Träume davon haben, wie bald KI wirklich alles revolutionieren wird. So sehr, dass sogar die großen Tech-Unternehmen ihre eigene Hype zurückfahren:

„Wie lange kann die von künstlicher Intelligenz angetriebene Rallye an der Wall Street weitergehen, ohne klare Beweise dafür, dass generative KI den Geschäften einen bedeutenden Schub gibt?“

Richard Waters, FT

Amazon-CEO Andy Jassy sagte Investoren im Februar, dass die kurzfristigen KI-Einnahmen „relativ gering“ seien.
Führungskräfte von Salesforce sagten, dass ihre KI-Angebote 2024 keinen „wesentlichen Beitrag“ zum Umsatzwachstum leisten würden.
Microsoft berichtete, dass die Einnahmen seiner Azure AI-Plattform nur etwa 1% des erwarteten Gesamtumsatzes des Unternehmens ausmachen.

Selbst Sam Altman, der Mann, der das Ding baut, gibt zu, dass KI ein laufendes Projekt ist:

„Ich denke, derzeit sind die Erwartungen extrem hoch. Die Realität ist immer noch ziemlich schlecht. Ehrlich gesagt, sind diese Modelle nicht so gut. Ich denke, sehr schnell werden die Erwartungen beginnen zu sinken…“

Sam Altman auf 20VC

Hier ist meine Meinung: Trotz der Skepsis und des Hypes werden diejenigen, die KI-unterstützte Werkzeuge anwenden können, die High-Performer von morgen sein. Und über Chatbots hinaus bin ich überzeugt, dass das, was das Geschäftsleben wirklich verwandeln und Produktivität freisetzen wird, KI-Agents (Glossar) sind.

🤝 Deals & Partnerschaften

💉 Moderna sieht Ergebnisse mit ChatGPT Enterprise.

Erinnert ihr euch an Moderna, den Biotech-Pionier hinter dem zweitbesten Covid-19-Impfstoff von BionTech?

Das inzwischen 42 Mrd. Dollar schwere Unternehmen arbeitet mit OpenAI zusammen, um die Entwicklung anderer lebensrettender mRNA-Medikamente zu beschleunigen und natürlich die Produktivität seiner Mitarbeiter zu erhöhen.

Zwei Punkte aus der Partnerschaft, die herausstechen:

100% des Legal-Teams verwenden ChatGPT Enterprise (dieser Plan verwendet eure Daten nicht, um seine Modelle zu trainieren).
Moderna verzeichnet eine enorme Adoption von GPTs, auch bekannt als spezialisierte Versionen von ChatGPT.

Tatsächlich haben Moderna und seine Mitarbeiter (mit Hilfe von OpenAI) über 750 GPTs erstellt!

Ein GPT namens „Dose ID“ überprüft klinische Daten und visualisiert große Datensätze
Ein weiterer, „Policy Bot GPT“, hilft Mitarbeitern, schnell Antworten auf interne Richtlinien zu finden, ohne endlose Dokumente durchsuchen zu müssen
Ein Corporate GPT übersetzt Biotech-Fachjargon in Laienbegriffe für Investoren-Updates
Mein Favorit, der Contract Companion GPT, kann jeden Vertrag „lesen“:

Bildquelle: openai.com

GPTs können dabei helfen, repetitive Prozesse oder Aufgaben zu automatisieren, die normalerweise Praktikanten vorbehalten sind. Ein kluger Zug von Moderna war es, Führungskräfte UND Mitarbeiter dazu zu ermutigen, spezialisierte GPTs für ihre spezifischen Bedürfnisse zu entwickeln und sie mit Kollegen zu teilen.

Auf der anderen Seite: 65% der Top-20-Pharmaunternehmen haben ChatGPT am Arbeitsplatz aufgrund von Bedenken über das Leaken sensibler interner Daten verboten.

🛠️ Werkzeuge & Tools

🖼️ Microsoft hat eine KI entwickelt, die Bilder in sprechende Figuren animiert.

Gerade als wir dachten, KI könnte nicht seltsamer werden, präsentierte Microsoft ein neues KI-Modell namens "VASA-1", das jedes statische Bild zum "Sprechen" und "Singen" bringen kann. Ich hatte bereits hier dazu berichtet.

Die Videos klingen unheimlich echt:

Microsoft just dropped VASA-1.
This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba
10 wild examples:
1. Mona Lisa rapping Paparazzi
— Min Choi (@minchoi)
2:57 AM • Apr 18, 2024

Zwei Fragen:

Warum klang dieser Clip besser als 95% der KI-Musik, die ich bisher gehört habe?
Warum verwendet ein 3 Billionen Dollar schweres Unternehmen wie Microsoft seine Zeit und Geld, um die Mona Lisa rappen zu lassen?

Im besten Fall könnte dieses Tool zur Erzeugung von KI-Videos Unternehmen helfen, Kunden auf neue Weise zu binden.

Sofortige Videos von jedem, der alles sagt und echt aussieht/klingt = enorme Zeitersparnis. Stell dir vor, du verwendest ein einzelnes Bild von Apple-CEO Tim Cook, um endlose Marketingvideos zu erstellen, in denen er das Apple Vision Pro bewirbt.

Genau daran arbeiten Unternehmen wie HeyGen und Synthesia (speziell mit KI-Avataren):

Watch an AI grown man go through more mood swings in a few seconds than a hormonal teenager
Seriously impressive stuff from @synthesiaIO - the avatars understand the script and adjust facial expressions, voice and demeanour — without any input/editing
— Matt Turck (@mattturck)
1:38 PM • Apr 18, 2024

Im schlimmsten Fall könnte diese Technologie jedoch die sehr berechtigte Sorge verstärken, dass KI zur Erstellung von hyperrealistischen Deepfake-Inhalten verwendet wird, die die Realität verzerren.

Das ist eine berechtigte Sorge, denn das passiert bereits im großen Maßstab:

KI-Deepfake-Videos, die Prominente wie Tom Hanks und Mr. Beast imitieren und gefälschte Produkte bewerben, sind viral gegangen.
Zwei A-Liste indische Schauspieler, Ranveer Singh und Aamir Khan, waren Opfer von KI-Klonvideos, die sie fälschlicherweise als Unterstützer bestimmter politischer Parteien darstellten.

Microsoft hat in seiner Ankündigung das potenzielle Missbrauchsrisiko anerkannt und hat „keine Pläne, eine Online-Demo, API, Produkt, zusätzliche Implementierungsdetails oder damit verbundene Angebote zu veröffentlichen“.

Das ist wahrscheinlich eine weise Entscheidung, insbesondere da Deepfakes derzeit das wichtigste KI-bezogene Thema sind, das von Regulierungsbehörden angegangen wird.

🚀 Tech

🤖 Musk gibt Neuigkeiten zu Optimus

Elon Musk gab neue Updates zu Teslas autonomen Robotern Optimus während des Quartalsberichts Q1 2024 des Unternehmens bekannt – er betonte, dass Tesla eher als ein KI- oder Robotikunternehmen und nicht als Automobilhersteller angesehen werden sollte.

Musk sagte, er glaube, dass Optimus „wertvoller als alles andere [im Unternehmen] zusammen“ sein werde.

Das volle Transkript findest du hier →
meine ChatGPT Zusammenfassung hier →

🏛️ Regulierung

🇪🇺 Die EU könnte wegen Wettbewerbsbedenken das Microsoft-OpenAI-Geschäft untersuchen

Die Europäische Kommission erwägt laut Reuters eine kartellrechtliche Untersuchung der 13 Mrd. Dollar schweren Investition von Microsoft in OpenAI, unter Hinweis auf mögliche Wettbewerbsbeschränkungen. Diese mögliche Untersuchung folgt bestehenden Prüfungen durch die britische Wettbewerbs- und Marktaufsichtsbehörde und die US-amerikanische Federal Trade Commission. Die Meldung findet ihr hier →

DEEP DIVE
Ich hoffe, ich schaffe es am Mittwoch!

OUTRO
Wie ich dir helfen kann, wenn du bereit bist:

✅ Mein (kostenloses) KI-Starterkit in Notion (Link)

✅ Die Tools, die ich jeden Tag verwende & wärmstens empfehle:

Beehiiv.com* - mein Newsletter-Programm, das mir >1.000 Abonnenten gebracht hat
Perplexity.ai - Die Suchmaschine der KI-Ära - mehr Infos hier
Decktopus.com* - Erstelle qualitativ hochwertige Präsentation in Sekunden
Typeshare.co* - Meine All-in-One Social Media Content-Creation Suite, die dir die am besten funktionierenden Templates für die unterschiedlichen Kanäle anbietet
Hypefury.com* - Mein Social-Media-Tool, mit dem ich mein Twitter auf > 2.000 Follower gebracht habe
Copy.ai - Mit KI Inhalte generieren, wie Titel, E-Mails und Social-Media-Beiträge
Scribe AI* - mein Tool für technische Dokumentation bei Kunden, die automatisch mitdenkt und die Veröffentlichung per Klick kinderleicht macht
Screenstory.io* - Loom auf Steroiden - erstelle Gifs, Tutorials & andere Videos
Guidde.com*- Erstelle super schnell Videoanleitungen für dein Team
Descript.com - Nutze ich derzeit für Video- und Podcast-Bearbeitung (coming soon)
Looka.com - Erstelle schnell deine Brandutensilien mit der Hilfe von KI

Die Tools sind in der Frequenz der Anwendung gelistet.

_{*Gesponserte/Affiliate Links}