- 10x-Klasse
- Posts
- Wie du mit Claude Daten interaktiv darstellen kannst
Wie du mit Claude Daten interaktiv darstellen kannst
Außerdem: OpenAI veröffentlicht endlich seine sprechende KI!
Lesezeit: ~ 4 Min.
Dieser Newsletter enthält gesponserte/Affiliate-Links.
Moin liebe 10xer,
wie eigentlich erwartet, wird sich Apple Intelligence weiter verzögern. Trotzdem werden die ersten Sachen für Entwickler in iOS 18.1 rauskommen und vor allem die neue Siri UI sieht gut aus.
Welches Apple-Intelligenz-Feature interessiert dich am meisten? |
Login oder Abonnieren um an umfragen teilzunehmen. |
Keine Woche vergeht, ohne ein absolut verrücktes KI-generiertes Video. Dieses Mal aber nicht, weil es so gut ist:
Was gibt es also Neues von der KI-Front?
👀 Falls du die letzte Ausgabe verpasst hast: Disruptiert KI die Internetsuche? SearchGPT ist da
Deep Dive: Der Underdog, der absolut abliefert: Claude 3.5 Sonnet
Chart der Woche: Gemini das erste Mal auf Platz 1 der Rangliste
Beitrag der Woche: OpenAI testet (endlich) sein Sprachmodul
SPONSOR DER AUSGABE
🎠 Eine meiner Lieblings-Apps
Da ich regelmäßig Präsentationen erstellen muss oder versuche, Inhalte zumindest halbwegs ansehnlich zu gestalten, ist Gamma meine favorisierte Applikation geworden. Ich bin mega stolz darauf, sie hier bewerben zu können:
An entirely new way to present ideas
Gamma’s AI creates beautiful presentations, websites, and more. No design or coding skills required. Try it free today.
DEEP DIVE
🤿 9 beeindruckende Dinge, die du mit Claudes neuem Artifacts-Tool machen kannst
Seit dem Release von Llama 3.1 in der letzten Woche habe ich viele Benchmarks auf X gesehen, die es mit ChatGPT und Claudes besten Modellen vergleichen. Ob diese Benchmarks zuverlässig oder genau sind, ist noch offen – schließlich ist es erst eine Woche her, seit 3.1 veröffentlicht wurde.
Ein Trend fällt jedoch auf: Claude 3.5 Sonnet landet nahezu immer ganz oben auf den Listen (Beispiele: 1, 2, 3).
Das brachte uns zur Frage: Was kannst du heute eigentlich mit Claude 3.5 Sonnet machen? Überraschenderweise eine Menge – besonders, wenn du Claudes neues Tool namens Artifacts nutzt.
Zuerst, was sind Artifacts? Es sind eigenständige Fenster, die rechts von deinem Chat erscheinen. Claude erstellt sie automatisch für eigenständige Inhalte über 15 Zeilen, die du bearbeiten oder wiederverwenden möchtest, wenn du die entsprechende Einstellung aktiviert hast (hier erfährst du, wie du sie nutzen kannst).
Nun, hier sind 9 erstaunliche Dinge, die du mit Claude 3.5 Sonnet tun kannst:
Dokumentenanalysen: Allie hat in 46 Sekunden 3 interaktive Dashboards aus 100 Seiten Amazon-Aktionärsberichten erstellt. Ihr Tipp: Schreibe „MAKE IT 100X MORE INTERACTIVE“ für krasse Ergebnisse (Link)
Datenvisualisierung vereinfachen: Razia Aliani nutzte Claude, um Daten zu analysieren, zu visualisieren und einfache Präsentationen direkt im Chat zu erstellen (Link)
Interaktive Dashboards erstellen: CJ verwandelte ein Pitch-Deck mit nur einem Prompt in ein interaktives Dashboard für Investoren (Link)
Funktionale Soundboards bauen: Ammaar baute mit der ElevenLabs API einen KI-Soundeffekte-Generator, indem er die API-Dokumentation einfügte (Link)
Spiele programmieren: Allie programmierte eine voll funktionsfähige Mancala-Webanwendung in 25 Sekunden mit nur einem Screenshot der Spielanleitung (Link)
Infografiken und SVGs erstellen: Ethan Mollick erstellte eine Infografik aus einem 78-seitigen PDF und rekonstruierte ein Gemälde als SVG (Link)
Physiksimulationen animieren: Rafal Wilinski brachte eine 3D-Physiksimulation mit WebGL in einem Versuch zum Laufen (Link)
Persönliche Kalender anpassen: Sully Omar baute einen einfachen Google Calendar-Klon mit Claudes Artifacts (Link)
Entscheidungsbots erstellen: Allie entwickelte einen interaktiven Entscheidungsbot, indem sie Claude große Mengen an Daten und Präferenzen zuführte (Link)
Ich finde es sehr beeindruckend, wie Anthropic undercover mit Artifacts eine neue Möglichkeit der Interaktion mit Chatbots entwickelt hat. Schade, dass sie immer noch so wenig bekannt sind.
CHART DER WOCHE
📊 Gemini 1.5 Pro - ein neuer Spitzenreiter
In den letzten zwei Wochen hat die KI-Welt Schlag auf Schlag neue Releases präsentiert: Meta's neues Open-Source-Modell Llama 3.1, ChatGPT 4-o Mini, Apple Intelligence... und jetzt zieht Google nach.
Haben wir das Beste bis zum Schluss aufgehoben? Denn Googles neues Modell, Gemini 1.5 Pro "experimental 0801", führt derzeit die LMSYS-Rangliste als bester Chatbot an. Seit der überraschenden Ankündigung werfen die Leute auf X ihre schwierigsten Fragen an es – die Ergebnisse gut, aber noch inkonsistent. War jedoch erwartbar, schließlich ist es ein Experiment.
Warum das wichtig ist: In den letzten drei Monaten wurden sieben große Modelle veröffentlicht. Jeder große Anbieter hat ein Frontmodell, und jedes ist auf seine Weise konkurrenzfähig. Letzte Woche führte Meta Llama 3.1 die Charts an, diese Woche hat Google fast beiläufig die Spitze erklommen – ohne große Blogpost-Ankündigung, nur ein paar Tweets vom Team.
Worauf es ankommt: Der Trend geht dahin, dass zukünftige Releases durch Spezialfähigkeiten (wie Programmieren, Mathematik, mehrsprachige Leistung) echte Leistungsgewinne erzielen werden.
Gemini's Spezialgebiet? Ganz klar Mathematik (kein Wunder bei dem Namen…). Es ist auf Platz 1 bei der Lösung von Mathematikproblemen, in den Top 1-2 beim Befolgen von Anweisungen und in den Top 5 bei kniffligen Englisch-Aufgaben und Programmierung.
Mein Fazit: Ich hoffe, dass sich zum Ende des Jahres die unterschiedlichen Firmen mit ihren Modellen einen Schwerpunkt aussuchen, in dem ihre Modelle am besten performen. Somit könnte man sich damit anfreunden, ein Werkzeug für die Anwendungsfälle, die man im Alltag am meisten nutzt, anzuwerden.
Jeder kann das Modell kostenlos im Google AI Studio testen, indem er Modell > Gemini 1.5 Pro Experimental 0801 auswählt. Aber Achtung: Diese Version ist speziell für Entwickler-Feedback gedacht.
DER BEITRAG DER WOCHE
📰 OpenAI testet endlich sein Sprachmodul
… und es soll ziemlich krass sein!
Hast du schon mal darüber nachgedacht, eine neue Sprache zu lernen? Da ich in einem internationalen Umfeld arbeite und durch meinen Klieten Airbus viel mit Franzosen & Spaniern zu tun habe, habe ich aufgrund meines Vorteils durch meine italienischen Vorfahren ständig das Bedürfnis, min. eine der anderen romanischen Sprachen anzugehen.
Nun, das Lernen einer neuen Sprache ist ein Top-Anwendungsfall für ChatGPT’s neuen Advanced Voice Mode (sprechende KI) - wenn man Zugang dazu bekommt!
Ich warte geduldig auf meinen Zugang und weine innerlich, weil ich nicht auf OpenAIs cooler Early-Access-Liste stehe. Um meine FOMO (Fear of Missing Out) noch schlimmer zu machen, habe ich mich in den sozialen Medien umgesehen.
Erste Eindrücke: Es scheint schnell, mit kaum Verzögerungen und ziemlich unterhaltsam. Es mache auch Pausen (es füge Kommata für Atempausen in seine Transkripte ein) und sei viel besser darin, dich nicht zu unterbrechen, während du sprichst.
Leute auf X und Reddit teilen Demos - hier sind 8 Beispiele, wofür die Leute Advanced Mode bereits nutzen:
Sprachen lernen: Wie Spanisch, und das in verschiedenen Akzenten (#1, #2)
Witze reißen: In unterschiedlichen Lautstärken und Tönen (Link)
Text vorlesen: Während es sich an Live-Feedback anpasst (Link)
Geschichten erzählen: Mit Hintergrundgeräuschen (Link)
Beide Rollen in einer Szene spielen: (Link)
Lieder singen: Mit einem bestimmten Vibe (Link)
Kleingedrucktes vorlesen: Am Ende von Medikamenten-Werbung (Link)
Rufen: Mit Echo! (Link)
Schnell zählen: Keine Ahnung warum, aber cool zu wissen! (Link)
Beatboxen! (Link)
Was du übrigens nicht machen kannst:
Mit benutzerdefinierten GPTs verwenden
Texten und dann sprechen lassen
Geräusche machen - es sei denn, es „performt“ sie
Wie gut führt es das alles wirklich aus? Es scheint ein bisschen Glücksache zu sein.
Bei Akzenten hört man bei dem französischen Versuch, dass der amerikanische Akzent im französischen Wort nicht zu überhören ist.
Es ist auch amüsant, dass ChatGPT sagt, es müsse vor dem Sprechen “atmen”. Wahrscheinlich eine gute Idee, denn Advanced Voice ist bisher die menschlichste, sprechende KI, die wir gesehen haben. Es fühlt sich wirklich so an, als wäre da ein Mensch auf der anderen Seite des Bildschirms, obwohl es leider (und traurig) nicht ScarJo ist.
Wann dürfen wir den Rest von uns damit rechnen? Sieht so aus, als ob es später im Herbst soweit sein wird, aber ich halte euch natürlich auf dem Laufenden.
WAS SONST NOCH SO LOS WAR
🚒 Das News-Feuerwerk
🚀 Tech
Neuer Amazon-Chip
Amazon hat seinen neuesten KI-Chip vorgestellt, der bis zu 50% leistungsstärker als die von NVIDIA angebotenen Chips sein soll und nur die Hälfte kostet. Dies ist Teil der Bemühungen, die Abhängigkeit von externen Chips für die AWS KI-Cloud-Dienste zu reduzieren.
🔨 Tools
Meta enthüllt SAM 2 zur fortschrittlichen Video-KI-Bearbeitung
Meta hat das Segment Anything Model 2 (kurz: SAM 2) vorgestellt, ein fortschrittliches KI-Modell, das Objekte in Echtzeit durch Video-Sequenzen identifizieren und verfolgen kann. Es kann jedes Objekt in einem Video segmentieren und in wenigen Klicks Ausschitte erstellen - ein kostenloses Demotool kannst du hier testen →
Meta stellt das Modell Open Source zur Verfügung und veröffentlicht eine große, annotierte Datenbank mit 50.000 Videos, die für das Training verwendet wurden.
Runway präsentiert Bild-zu-Video-KI
Runway hat auf 𝕏 angekündigt, dass Gen-3 Alpha, das beliebte KI-Modell zur Text-zu-Video-Generierung des Startups, jetzt auch hochwertige Videos aus Standbildern erstellen kann
. Die generierten Videos sind entweder 5 oder 10 Sekunden lang und erfordern "Credits", die über die Abonnement-Stufen von Runway bezahlt werden müssen.
Um das Tool auszuprobieren, besuche die Runway-Website und klicke auf „Try Runway Now“ →
Regulierung
EUs AI Act tritt in Kraft: Big Tech drohen potentiell Strafen
Seit gestern, dem 1. August, ist das neue EU-Gesetz zu Künstlicher Intelligenz (AI Act) in Kraft. US-Technologiegiganten riskieren jetzt Geldstrafen von bis zu $41 Mio. oder 7% ihrer globalen Umsätze, falls sie gegen das Gesetz verstoßen.
OUTRO
Wie ich dir helfen kann, wenn du bereit bist:
✅ Mein (kostenloses) KI-Starterkit in Notion (Link)
✅ Mein kostenloser Guide zum Aufbau einer Online-Präsenz mit Hilfe von KI-Werkzeugen (Link)
✅ Die Tools, die ich jeden Tag verwende & wärmstens empfehle:
Beehiiv.com* - mein Newsletter-Programm, das mir >1.000 Abonnenten gebracht hat
Perplexity.ai - Die Suchmaschine der KI-Ära - mehr Infos hier
Decktopus.com* - Erstelle qualitativ hochwertige Präsentation in Sekunden
Typeshare.co* - Meine All-in-One Social Media Content-Creation Suite, die dir die am besten funktionierenden Templates für die unterschiedlichen Kanäle anbietet
Hypefury.com* - Mein Social-Media-Tool, mit dem ich mein Twitter auf > 2.500 Follower gebracht habe
Scribe AI* - mein Tool für technische Dokumentation bei Kunden, die automatisch mitdenkt und die Veröffentlichung per Klick kinderleicht macht
Screenstory.io* - Loom auf Steroiden - erstelle Gifs, Tutorials & andere Videos
Guidde.com*- Erstelle super schnell Videoanleitungen für dein Team
Descript.com - Nutze ich derzeit für Video- und Podcast-Bearbeitung (coming soon)
Die Tools sind in der Frequenz der Anwendung gelistet.
*Gesponserte/Affiliate Links
Wie hat dir der heutige Newsletter gefallen? |
Login oder Abonnieren um an umfragen teilzunehmen. |