- 10x-Klasse
- Posts
- KI-Grundlagen 3: Wie du die KI für dich arbeiten lässt - Prompt-Engineering
KI-Grundlagen 3: Wie du die KI für dich arbeiten lässt - Prompt-Engineering
Außerdem: Revolutionäre Vorstellung von Runway & Amazons Antwort auf OpenAI
Moin ✌🏼
Ich habe - wie versprochen - an einer Anleitung gearbeitet, wie man eigene GPTs mit OpenAI’s neuen Funktionen baut. Den Entwurf findet ihr hier:
In der nächsten Ausgabe sollte ich den Leitfaden bzw. die Anleitung fertig haben und mit euch teilen können. Eventuell erfolgt nächste Woche vorerst die letzte Ausgabe für dieses Jahr, da ich - wie bereits angekündigt - umziehen werde.
Was wir heute abhandeln:
🤿 Deep Dive: KI-Grundlagen 3 - Prompt-Engineering
🔥 Amazon: Das neue LLM “Olympus”
💡 Idee der Woche: KI-Agents & ihr Einfluss auf die Arbeitswelt
🚒 News: DeepMind sowie Runway (KI-Videoerstellung)
📊 Chart der Woche: Der Kampf um eure Aufmerksamkeit
🤿 KI-Grundlagen 3: Prompt-Engineering
Falls du die vorherigen Ausgaben zu den KI-Grundlagen verpasst hast, kannst du sie hier nachholen: KI-Grundlagen 1: und KI-Grundlagen 2.
Was du heute lernen wirst:
Wie ein strukturierter Prompt aufgebaut ist
Prompt-Beispiele zur Inhaltserstellung
Prompt-Beispiele zum Kochen
Prompt-Beispiele zum Programmieren
Die Frage, die man am meisten gestellt bekommt, wenn man KI-begeistert ist, lautet: Was kann ich denn damit machen?
Um die Frage heute ganz konkret zu beantworten, werde ich einige Prompt-Anwendungsfälle (engl. use cases) darstellen.
Doch erst noch einmal zurück an den Anfang. Wie kannst du ChatGPT dazu bringen, das zu tun, was du möchtest?
Crash-Kurs zu Prompt-Engineering
Strukturierte Prompts machen dich zum Bediener einer Maschine, die das macht, was du willst. Es ist wie Programmieren, aber in natürlicher Sprache und mit eingeschränkter Ausgabe. Um dich schnell auf ein fortgeschrittenes Level zu bringen, gebe ich dir hier die Struktur, um Prompts optimal zu gestalten:
Aufgabe: Definiere das Ziel klar und sei präzise. Einfache vs. komplexe Beispiele:
Einfach: "Erstelle ein 3-Monats-Ernährungsprogramm."
Komplex: "Analysiere gesammeltes Nutzerfeedback, fasse die Top 3 Verbesserungsvorschläge zusammen und kategorisiere den Rest nach Wichtigkeit."
Kontext: Gib relevante Hintergrundinformationen an, um die Anfrage mit wichtigen Informationen aus deiner Umgebung auf deine Person/Situation zuzuschneiden. Mehr Kontext hilft ChatGPT, dich und deine Bedürfnisse zu verstehen.
Beispiele: Das Einbeziehen von Beispielen zur Leitung von Struktur und Stil kann die Qualität des Outputs erheblich verbessern. Beispiele ermöglichen es ChatGPT, den Stil, die Struktur und den Ton von nahezu allem nachzuahmen.
Persona: Übernehme eine spezifische Sichtweise und erhalte Antworten aus einer bestimmten Perspektive. Z.B.: Therapeut, Geschäftsführer, Mathelehrer usw.
Format: Gib das gewünschte Ausgabeformat an, wie Tabelle, Stichpunkte, E-Mail, Codeblöcke – ChatGPT ist großartig darin, Inhalte auf einzigartige Weise bereitzustellen.
Ton: Lege die Stimmung des Outputs fest – locker, formell, enthusiastisch usw., um sicherzustellen, dass dein Inhalt emotional ansprechend ist.
Nun kommen wir zu konkreten Prompt-Anwendungsfällen.
Inhaltserstellungs-Frameworks
Bitte schreibe einen Entwurf für eine Marketingkampagne unter Verwendung des 'Situation-Komplikation-Lösung'-Frameworks, das eine [Situation], mit der [ideale Kundenpersona] konfrontiert ist, darstellt, die [Komplikation], die sich aus der Situation ergibt, diskutiert und unser [Produkt/Dienstleistung] als die [Lösung] für das Problem präsentiert. Beende mit einem Call-to-Action, der den Leser dazu ermutigt, die Lösung zu nutzen.
Bitte schreibe einen Entwurf für eine Marketingkampagne unter Verwendung des 'Emotional Value Proposition'-Frameworks, das sich an die [emotionalen Bedürfnisse] von [idealer Kundenpersona] richtet und unser [Produkt/Dienstleistung] als Lösung präsentiert, die diese Bedürfnisse erfüllt. Identifiziere die [gewünschte Emotion], erstelle eine [Geschichte], die diese Emotion hervorruft, und füge [Kundenbewertungen] hinzu, die diese Emotion nach der Verwendung unseres Produkts erlebt haben.
Schreibe einen Entwurf für eine Marketingkampagne unter Verwendung des 'Customer Journey Map'-Frameworks, das die Reise von [Bewusstsein] zu [Konversion] für [ideale Kundenpersona] visualisiert und Inhalte erstellt, die sich auf jede Phase ausrichten. Identifiziere ihre [Schmerzpunkte] und präsentiere unser [Produkt/Dienstleistung] als Lösung für diese Probleme, indem du die [Merkmale] und [Vorteile] unseres Produkts hervorhebst und erklärst, wie es [ihre Situation verbessern] kann.
Kochen & Rezepte - Agieren als “Chef”
Ich möchte, dass du als mein persönlicher Koch agierst. Ich werde dir von meinen Ernährungsvorlieben und Allergien erzählen, und du wirst mir Rezepte vorschlagen, die ich ausprobieren kann. Du solltest nur mit den Rezepten antworten, die du empfiehlst, und nichts anderem. Schreibe keine Erklärungen. Meine erste Anfrage lautet: "Ich bin Vegetarier und suche nach gesunden Abendessenideen."
Ich benötige jemanden, der köstliche Rezepte vorschlagen kann, die nahrhafte Lebensmittel enthalten, aber auch einfach und nicht zeitaufwendig sind, daher für beschäftigte Leute wie uns geeignet sind, unter Berücksichtigung anderer Faktoren wie Kosteneffizienz, sodass das Gesamtgericht gesund und gleichzeitig wirtschaftlich ist! Meine erste Anfrage – „Etwas Leichtes, aber Erfüllendes, das schnell in der Mittagspause gekocht werden könnte“
Programmieren & administrieren
Ich möchte, dass du als Senior Frontend-Entwickler agierst. Ich werde dir Details eines Projekts beschreiben, und du wirst das Projekt mit diesen Tools codieren: Create React App, yarn, Ant Design, List, Redux Toolkit, createSlice, thunk, axios. Du solltest die Dateien in einer einzigen index.js-Datei zusammenführen und nichts Anderes. Schreibe keine Erklärungen. Meine erste Anfrage lautet: "Erstelle eine Pokemon-App, die Pokemons mit Bildern auflistet, die vom PokeAPI-Sprites-Endpunkt kommen."
Erstelle eine TypeScript-Funktion, die die implizite Volatilität unter Verwendung des Black-Scholes-Modells berechnet. Die Eingaben sind der zugrundeliegende Preis, der Ausübungspreis, der risikofreie Zinssatz und der Optionspreis. Schreibe es Schritt für Schritt, mit einer Erklärung für jeden Schritt.
Ich möchte, dass du als Linux-Terminal agierst. Ich werde Befehle eingeben und du antwortest mit dem, was das Terminal anzeigen sollte. Ich möchte, dass du nur mit der Ausgabe des Terminals in einem einzigen Codeblock antwortest und nichts anderes. Schreibe keine Erklärungen. Gib keine Befehle ein, es sei denn, ich weise dich dazu an. Wenn ich dir etwas auf Englisch mitteilen muss, mache ich das, indem ich den Text in geschweifte Klammern setze {so wie das hier}. Mein erster Befehl ist pwd.
Fazit - die Möglichkeiten sind endlos
Ihr könnt euch vorstellen, wie ungemein vielschichtig die unterschiedlichen Anwendungsfälle sind. Der beste Weg ist, es selbst herauszufinden, indem du es selbst versuchst. Dazu gibt es viele Möglichkeiten:
Ich hoffe, ich konnte euch überzeugen, eines der Tools einfach auszuprobieren.
🔥 Hot: Amazon arbeitet an KI-Modell 'Olympus' 📦
TL;DR: Amazon investiert Berichten von Reuters zufolge Millionen in die Ausbildung eines massiven Sprachmodells mit dem Codenamen 'Olympus', um mit KI-Führern wie OpenAI zu konkurrieren, und plant, es letztendlich in seine Alexa-Lautsprecher und Online-Plattform zu integrieren.
Die Details:
Olympus soll 2 Billionen Parameter haben, was es zu einem der weltweit größten KI-Modelle machen könnte (GPT-4 hatte 1 Billion).
Das Projekt wird von Rohit Prasad, dem ehemaligen Leiter von Alexa und jetzt Amazons Chef-Wissenschaftler für AGI, geleitet.
Amazon glaubt, dass hauseigene, hochmoderne Modelle einen Vorteil für seine AWS-Angebote gegenüber Wettbewerbern bieten könnten.
Das vorherige LLM 'Titan' wurde verzögert, nachdem Amazons Führungskräfte den Start von ChatGPT als „weit überlegen“ gegenüber ihrem Modell empfanden.
Warum das wichtig ist: Obwohl derzeit hinterherhinkend, hat Amazon die Ressourcen und die Reichweite, um schnell aufzuholen. Die Integration eines massiven LLM in ein Produkt wie Alexa könnte ein weiterer Moment der Massenadaption für KI-Verbrauchertechnologie sein.
Sie haben auch einige interessante Daten, auf denen ihr LLM trainieren kann, die andere nicht haben: Was du kaufst.
🔥 Hot: Google rollt neue KI-Suche aus
TL;DR: Googles KI-getriebene Suchrevolution, die zuerst in den USA, Indien und Japan eingeführt wurde, ist jetzt ein globales Phänomen und erreicht über 120 Länder und Gebiete. Die Search Generative Experience (SGE = Googles Antwort auf Bing Chat) definiert die Suche neu, indem sie konversationelle, umfassende Antworten in natürlicher Sprache bietet. Diese Expansion ist nicht nur geografisch; sie bringt auch mehrsprachige Unterstützung mit der Einbeziehung von Spanisch, Portugiesisch, Koreanisch und Indonesisch, neben bereits bestehenden Sprachen wie Englisch, Hindi und Japanisch. Klicke auf das Video unten, um zu sehen, was diese KI-gesteuerte Suche leisten kann…
Innovative Interaktionen und tiefere Einblicke
Google testet einen neuen Ansatz, um den Suchprozess zu vereinfachen. Nutzer können ihre Abfragehistorie verfolgen und nahtlos auf Folgefragen auf der Suchergebnisseite zugreifen, wobei Googles Werbeeinblendungen effektiver integriert werden.
Bildungsförderung mit KI
Google erweitert seine KI-Suche, indem es Definitionen für komplexe Begriffe in Antworten anbietet, die über Wissenschaft und Wirtschaft hinausgehen und Bereiche wie Programmierung und Gesundheit umfassen. Diese Funktion, die in den USA beginnt und international ausgeweitet wird, verspricht, Informationen zugänglicher und verständlicher zu machen.
Blick in die Zukunft
Während Google weiterhin in KI-gesteuerte Suche innoviert, bleibt das Engagement für eine weltweite Expansion stark. Hema Budaraju, Senior Director of Product Management, sieht eine Zukunft reich an KI-Fortschritten, die ausgefeilte Suchfähigkeiten einem ständig wachsenden globalen Publikum bringen.
💡 Idee der Woche: Wie KI unsere Arbeitswelt durch Agenten verändern wird
In fünf Jahren wirst du nicht mehr verschiedene Apps für unterschiedliche Aufgaben verwenden müssen. Du wirst deinem Gerät einfach in Alltagssprache sagen, was du tun möchtest – sei es das Erstellen eines Dokuments, das Anfertigen einer Tabelle, das Planen eines Meetings, das Analysieren von Daten, das Senden einer E-Mail oder sogar das Kaufen von Kinokarten. Je nachdem, wie viele Informationen du mit ihm teilst, wird die Software persönlich reagieren können, da sie ein tiefes Verständnis für dein Leben hat. In naher Zukunft wird jeder, der online ist, in der Lage sein, einen Assistenten zu haben, der von künstlicher Intelligenz angetrieben wird und weit über alles hinausgeht, was man heute bekommen kann.
Diese Art von Software – etwas, das auf natürliche Sprache reagiert und viele verschiedene Aufgaben auf der Grundlage seines Wissens über den Benutzer erfüllen kann – wird als Agent bezeichnet.
Agenten werden nicht nur verändern, wie jeder mit Computern interagiert. Sie werden auch die Softwareindustrie umkrempeln und die größte Revolution im Computing seit dem Übergang von Tastenbefehlen zu Icons auf dem Bildschirm einläuten.
Agenten werden in der Gesundheitsversorgung helfen, grundlegende Diagnostik durchzuführen und medizinische Beratung zu bieten, was besonders in armen Ländern von Vorteil ist.
Im Bildungsbereich werden Agenten das Lernen personalisieren und Lehrer bei ihrer Arbeit unterstützen.
Im Bereich der Produktivität werden Agenten Aufgaben wie Geschäftsplanung und Meeting-Unterstützung übernehmen.
Im Bereich Unterhaltung und Einkauf werden Agenten personalisierte Empfehlungen geben und Einkäufe tätigen können.
Warum das wichtig ist
Die Entwicklung von KI-Agenten ist wichtig, da sie den Zugang zu personalisierten Dienstleistungen demokratisieren und in Schlüsselbereichen wie Gesundheitswesen und Bildung bedeutende Verbesserungen ermöglichen. Diese Technologie hat das Potenzial, die Effizienz und Personalisierung in unserem täglichen Leben erheblich zu steigern und könnte zu einer der bedeutendsten technologischen Revolutionen seit der Einführung von Smartphones und dem Internet werden.
🚒 Was diese Woche noch wichtig war
🖌️ Runway deutet die Zukunft der KI-Videos mit Motion Brush an
Es bekommt vielleicht nicht so viel Aufmerksamkeit, wie es verdient, aber Runway könnte das Startup mit den besten KI-Videogenerierungswerkzeugen sein. Nach großen Fortschritten in der Leistung im letzten Jahr kündigte das Unternehmen kürzlich Motion Brush an – ein Werkzeug, das Bilder mit einem einfachen Pinselwerkzeug in bewegte Videos verwandelt.
Obwohl das Tool noch nicht veröffentlicht wurde, könnten sich einige riesige neue Möglichkeiten für die Inhaltsproduktion ergeben. Stelle dir vor, du generierst ein Bild mit KI und verwandelst dieses Bild dann mit Motion Brush in ein kurzes Video – ohne jemals eine Kamera zu berühren oder eine Zeile Code zu schreiben.
Die Verringerung des Aufwands, der Zeit, der Kosten und des technischen Fachwissens, die ein solcher technologischer Fortschritt mit sich bringt, könnte einen Boom in der Videoproduktion auslösen. Einige neue Anwendungsfälle, an die wir denken könnten:
Deine Präsentationen zum Leben erwecken, indem du Diagramme in bewegte Bilder umwandelst
Alte Familienfotos in bewegte Erinnerungen umwandeln
Stockfotos für Landing-Pages und Werbeanzeigen in kurze Videos aufwerten
Hier kannst du ein Video des Motion Brush-Werkzeugs in Aktion ansehen:
Introducing, Motion Brush.
A new way to add controlled movement to your generations.
Coming soon to Gen-2.
— Runway (@runwayml)
5:41 PM • Nov 10, 2023
🧠 Deep Mind hat die Stufen von AGI definiert
Forscher von Google DeepMind haben ein Framework von "Levels of AGI" vorgeschlagen, der auf Leistung und Allgemeinheit basiert und darauf abzielt, den Fortschritt in Richtung menschenähnlicher KI zu standardisieren sowie zu verfolgen. Die Stufenliste folgt auf die Vorhersage des DeepMind-Mitbegründers Shane Legg, der im letzten Monat eine 50% Chance auf eine AGI bis 2028 prognostizierte.
🧰 Chart der Woche: KI-Apps im Wettbewerb um Aufmerksamkeit
Google plant Berichten zufolge eine Investition in Höhe von „mehreren hundert Millionen Dollar“ in Character.ai, nur wenige Wochen nachdem das Unternehmen zugestimmt hatte, rund $2 Mrd. in ein anderes KI-Startup, Anthropic, zu stecken.
Character.ai, das Anfang dieses Jahres in einer Finanzierungsrunde 150 Millionen Dollar einnahm und das Unternehmen mit 1 Milliarde Dollar bewertete, hat bereits Verbindungen zu dem Suchriesen, da es von ehemaligen Google-Mitarbeitern gegründet wurde, die zuvor an seinen großen Sprachmodellen gearbeitet hatten.
Wie bei Konkurrenten wie ChatGPT sind die monatlichen Besuche der Plattform seit dem Sommer laut Daten von Similarweb via Variety bescheiden zurückgegangen – aber seine Nutzer verbringen immer noch viel Zeit damit, so zu tun, als würden sie mit jedem sprechen, von Tony Soprano bis Napoleon Bonaparte.
Gif-Quelle: tenor.com
Charakterisierung von Maschinen
Entwickler haben sich beeilt, Chatbots mit ausgeprägten „Personas“ und Charaktereigenschaften auszustatten, um sie von der ständig wachsenden Menge an gesichtslosen Maschinen abzuheben. Im September kündigte beispielsweise Meta seine Reihe von KI mit eingebauter „Persönlichkeit“ im Messenger an, während Elon Musks xAI Anfang November Grok enthüllte, einen Chatbot mit einem „rebellischen Zug“.
In dieser Hinsicht ist Character.ai schon seit einiger Zeit mehrere Schritte voraus – und die Nutzer scheinen nicht genug zu bekommen. Tatsächlich generiert der Chatbot seit seinem Start im September letzten Jahres täglich über 1 Mrd. Wörter, geliefert von Bots, die Berühmtheiten, fiktionalen Charakteren und historischen Figuren ähneln. Die Nutzer des Chatbots verbringen fast 5x länger in einer typischen Interaktion als ChatGPT-Fans mit dem OpenAI-Bot, wobei Desktop- und Mobilnutzer von Character.ai im August erstaunliche 33 Minuten pro Besuch auf der Plattform verbrachten.
Das war’s!
Wie fandest du den heutigen Newsletter?Feedback hilft mir, die Qualität zu verbessern. |
Login oder Abonnieren um an umfragen teilzunehmen. |