• 10x-Klasse
  • Posts
  • Die ultimative Anleitung für Text-zu-Bild-Generierung mit Midjourney - für Anfänger

Die ultimative Anleitung für Text-zu-Bild-Generierung mit Midjourney - für Anfänger

So etwas habt ihr noch nie gesehen!

Moin ✌🏼

Letzte Woche ist ausgefallen, weil ich auf der Hochzeit meines besten Freundes war.

Nachdem wir bereits mehrmals Deep Dives Richtung ChatGPT gemacht habe, machen wir diese Woche einen deepen Deep Dive zur aktuell besten Bildgenerierungsplattform Midjourney.

Doch erst wie immer die News!

INHALTSVERZEICHNIS

  • Sind die großen Unternehmen spät dran oder ist der Hype doch noch nicht vorbei?

  • News zur Anwendung von KI in der Supply-Chain (Lieferkette)

  • Teil 1/3 zur ultimativen Text-zu-Bildgenerierungsplattform Midjourney

Lesezeit: < 10 Minuten

🔥 Ist der Hype vorbei oder beginnt er erst?

Jeder, der in der Wirtschaft tätig ist, wird mir zustimmen: Ich kann es einfach nicht mehr hören, dass jedes Unternehmen jetzt angeblich ein KI-Unternehmen ist.

Interessanterweise scheinen die Führungskräfte von Spitzenunternehmen genau das Gegenteil zu tun - sie können nicht aufhören, über KI zu sprechen. Vielleicht in der Hoffnung, dass sie für Investoren attraktiver werden, wenn sie ihre Unternehmen als "KI-Vorreiter" positionieren (s. NVIDIA oder Intel).

Aber warum sinkt die Nutzung von ChatGPT dann?

Mehrere Quellen und Berichte zeigen einen Rückgang der monatlich aktiven Nutzer (MAUs) von ChatGPT 👇️

Während Schulferien und die fehlende API-Nutzung (wer nicht weiß, was eine API ist, empfehle ich diesen Artikel) zwei mögliche Ursachen sind, möchte ich das größere Problem aufschlüsseln, das dabei eine Rolle spielt: die KI-Benutzerfreundlichkeit (usability).

Wenn du das liest und ChatGPT täglich nutzt, gratuliere ich dir - du gehörst wahrscheinlich zum oberen Prozent.

Die meisten Menschen haben kaum eine Vorstellung davon, wie sie Tools wie ChatGPT / LLMs / Generative AI nutzen können. Und alle warten darauf, dass ihnen jemand einen geheimen Killer-Anwendungsfall verrät (der übrigens extrem personen- und kontextabhängig ist).

Nimm die Tatsache, dass ChatGPT als eine Fähigkeit angepriesen wird. Wenn ein Produkt als Skill bzw. Fertigkeit angepriesen wird, soll damit zum Ausdruck gebracht werden, dass es schwer zu benutzen ist und Training/Übung erfordert, einen Wert herauszuholen.

ChatGPT und die Einführung von (generativer) KI im weiteren Sinne fallen absolut in diesen Bereich. Es braucht Zeit, Mühe und eine beträchtliche Anlaufzeit, um KI vollständig in unsere tägliche Arbeit und unser Leben zu integrieren.

Wir sehen, dass viele Menschen über Aufwand und Nutzen nachdenken, oder? Sollten Sie jetzt die Zeit und Energie investieren, um bahnbrechende Anwendungsfälle für KI zu finden, oder sollten Sie warten, bis sie sich durchgesetzt hat und benutzerfreundlich ist?

Während die Schlagzeilen einen Rückgang der ChatGPT-Nutzung ankündigen, stellen diese Schlagzeilen für diejenigen, die die Zeit investieren, die Fähigkeiten erlernen und ihre eigenen Anwendungsfälle entwickeln, eine große Chance dar.

Wer gewinnt als bereits einen Vorteil?

Aus dem bereits besprochenen Bericht von McKinsey über KI, der Anfang August veröffentlicht wurde, geht hervor, dass 79 % der befragten Personen zumindest in gewissem Maße mit den Werkzeugen in Berührung gekommen sind, obwohl nur 22 % der Befragten angaben, dass sie persönlich sie regelmäßig bei ihrer eigenen Arbeit einsetzen.

Am meisten nutzen es deine Freunde aus dem Marketing und Vertrieb: 14 % der Befragten gaben an, dass ihr Unternehmen generative KI regelmäßig in dieser Funktion einsetzt, mehr als in jeder anderen.

Die häufigsten Anwendungsfälle, die in der Umfrage genannt wurden, waren:

  • die Erstellung erster Textentwürfe

  • die Personalisierung von Marketingmaterialien

  • die Erkennung von Trends oder

  • die Kommunikation mit Kunden durch Chatbots

Wer möchte tiefer einsteigen?

Aus euren Antworten auf meine Onboarding-Umfrage - deren Ergebnisse ihr hier sehen könnt - weiß ich, dass viele von euch (ca. 93 %) noch Neulinge oder Anfänger im Umgang mit KI-Tools seid. Ich plane gerade einen kostenlosen Schnellkurs, um Step-by-Step zu erklären, wie man die wichtigsten Tools anwenden kann.

Wenn Du Interesse hast, kannst du hier anmelden, welcher Bereich dich am meisten interessiert:

Worauf soll der Fokus gelegt werden?

Der Schnellkurs soll in < 2 Std. durch sein.

Login oder Abonnieren um an umfragen teilzunehmen.

🚒 Was diese Woche noch wichtig war

KI hilft multinationalen Unternehmen, den Druck in der Lieferkette zu verringern - Mehr dazu →

KI ist in der Lieferkette nicht neu, aber die Art und Weise, wie einige Unternehmen sie einsetzen, ist es. Laut einem Bericht der Financial Times nutzen Unternehmen wie Maersk, Siemens und Unilever generative KI, um neue Lieferanten zu finden und Verträge abzuschließen.

Drei Takeaways:

  1. Generative KI wird zunehmend von multinationalen Unternehmen eingesetzt, um Lieferkettenprobleme zu bewältigen und Geschäftsprozesse zu optimieren.

  2. Neue gesetzliche Anforderungen (s. Lieferkettengesetz) treiben das Interesse und die Investitionen in KI-gesteuerte Lieferkettenlösungen voran.

  3. Trotz der Vorteile von KI stehen Versandunternehmen weiterhin vor Herausforderungen, insbesondere angesichts des Rückgangs der globalen Nachfrage nach Seefracht.

Wie KI-Innovationen das Wachstum in Enterprises fördern können - Mehr dazu →

Der Artikel mit David Shrier - bekannter Futurist - diskutiert, wie KI Unternehmen dabei helfen kann, ein exponentielles Wachstum zu erzielen. Er betont, dass KI nicht nur zur Automatisierung von Aufgaben verwendet werden sollte, sondern auch zur Schaffung neuer Geschäftsmodelle und zur Steigerung des Unternehmenswerts. Erinnert mich stark an Industrie 4.0 😬

Wie KI den Fluggesellschaften hilft, die Auswirkungen von Kondensstreifen auf das Klima abzuschwächen - Mehr dazu →

Google hat mit der Flugindustrie zusammengearbeitet, um KI und Satellitenbilder zu nutzen, um die Erwärmungseffekte von Kondensstreifen zu reduzieren. Kondensstreifen, die dünnen, weißen Linien, die man manchmal hinter Flugzeugen sieht, haben einen überraschend großen Einfluss auf unser Klima. Der IPCC-Bericht von 2022 stellte fest, dass durch Kondensstreifen erzeugte Wolken etwa 35% des globalen Erwärmungseffekts der Luftfahrt ausmachen. Hier die wichtigsten Erkenntnisse:

  1. Ergebnisse der Testflüge: Piloten von American Airlines flogen 70 Testflüge über sechs Monate und nutzten Googles KI-basierte Vorhersagen, um Höhen zu vermeiden, die wahrscheinlich Kondensstreifen erzeugen würden. Die Analyse ergab, dass die Piloten die Kondensstreifen um 54% reduzieren konnten.

  2. Treibstoffverbrauch: Ein weiteres signifikantes Ergebnis des Tests war, dass Flüge, die versuchten, Kondensstreifen zu vermeiden, 2% mehr Treibstoff verbrauchten. Dennoch könnte der gesamte Treibstoffeinfluss über alle Flüge einer Fluggesellschaft hinweg so niedrig wie 0,3% sein.

  3. Die Zukunft: Google wird die Forschung und Entwicklung fortsetzen, um die Vermeidung zu automatisieren, die Kondensstreifen mit dem höchsten Einfluss zu zielen und die satellitengestützte Überprüfung zu verbessern.

🤿 Deep Dive: Text-zu-Bildgenerierung mit Midjourney

Midjourney Prompt: a person with machine-enhanved devices, portrait

Dies ist Teil 1/3 der ultimativen Anleitung für Midjourney

Wenn du regelmäßig Bilder mit einem KI-gesteuerten Tool wie Midjourney erstellst, kennst du wahrscheinlich die Herausforderungen. Vielleicht bittest du es um eine Illustration von Menschen bei der Arbeit, und es liefert dir nur Bilder aus der Mad Men-Ära, die vor Testosteron strotzen. Oder du sagst, es soll dir einen Strauß ohne Rosen machen, und es gibt dir ein Blumenquartett, würdig für Die Schöne und das Biest.

In den letzten Monaten habe ich viel Zeit damit verbracht, die Fähigkeiten von Midjourney auszutesten – ich bin von Natur aus neugierig und liebe es, mich durch meine Produktivität zu profilieren. Ich habe mich durch die detaillierte Dokumentation von Midjourney gewühlt, folge smarten Kreatoren (neues Wort für “creatives” von Pip Klöckner gelernt), die Tipps zu Midjourney twitterten, und öffentliche Kanäle in Midjourneys Discord verfolgt.

Midjourney bietet zahlreiche Optionen, um die Ausgabe zu steuern, und ist äußerst leistungsstark und anpassbar. Trotz seiner Benutzeroberfläche ist es nicht intuitiv und erfordert Forschung und Übung, ähnlich wie das Erlernen von Tastaturkürzeln in Apps (die ich liebe 🙏🏼).

Da dies eine simple Art ist, die Bilder für meine Newsletter zu generieren, habe ich mich richtig intensiv mit Midjourney beschäftigt und einen Leitfaden geschrieben.

In diesem Artikel führe ich dich durch die mächtigsten und nützlichsten Techniken, die mir begegnet sind. Wir werden folgendes behandeln:

  • Einstieg in Midjourney

  • Verstehen von Midjourneys Eigenheiten bei der Interpretation von Promps

  • Nachträgliches Anpassen von Midjourneys Bildausgaben

  • Experimentieren mit verschiedenen Stilen und Inhalten

  • Hochladen und Kombinieren von Bildern, um über Bildinjektionen neue zu erstellen

  • Brainstorming von Kunstoptionen mit Parametern wie "Chaos" und "seltsam"

  • Finalisieren des Seitenverhältnisses deiner generierten Ausgabe

  • Und vieles mehr.

Einstieg (für Anfänger)

Der schwierigste Teil bei der Verwendung von Midjourney ist, dass es noch keine offizielle Web-App gibt und die gesamte Benutzererfahrung vorne über Discord stattfindet. Daher ist die Reihenfolge der Schritte zur Einrichtung etwas kompliziert, und du musst deine Midjourney-Bilder über Discord-Chatrooms (Kanäle) erstellen.

Wenn du bereits einige Grundkenntnisse über Midjourney und seine Benutzeroberfläche hast, möchtest du vielleicht zum Abschnitt "Prompt-Engineering" weitergehen. Wenn du Anfänger bist, folge den Schnellstartanweisungen von Midjourney, um dich einzurichten. Bevor du in diesem Leitfaden weitermachst, stelle sicher, dass:

  • Du ein Discord-Konto erstellt hast

  • Du dich bei Midjourney angemeldet hast (leider gibt es keine kostenlose Testversion mehr)

  • Du dem Discord-Server von Midjourney beigetreten bist

  • Du einem "Anfänger"-Kanal im Discord-Server von Midjourney beigetreten bist

In jedem Anfängerkanal, dem du beitrittst, wirst du Tausende von anderen Leuten sehen, die Aufforderungen senden, und die Bilder, die Midjourney für sie erstellt. Am Anfang habe ich viel gelernt, indem ich die Ansätze anderer Leute analysiert habe.

Privater Zugang zu Midjourney

Wenn deine Firma oder Gemeinschaft einen eigenen Discord-Server hat, kannst du einen Midjourney-Bot für den internen Gebrauch hinzufügen. So kannst du Bilder erstellen, ohne in einem überfüllten, öffentlichen Anfängerkanal zu arbeiten, und du kannst die von deinen Kollegen oder der direkten Gemeinschaft erstellten Bilder leichter durchsehen. (Hinweis: Midjourney behält sich immer noch das Recht vor, deine Bilder an anderen Stellen, wie ihrer Showcase-Seite, zu zeigen.) Du kannst auch Direktnachrichten mit einem Midjourney-Bot aktivieren, wenn du lieber privat arbeiten möchtest (so dass nur du sie sehen kannst).

Also, jetzt, wo alles eingerichtet ist, wie benutzt du Midjourney?

Die Magie passiert mit /imagine. Um mit Midjourney zu interagieren, musst du zuerst einen Befehl in dem Discord-Anfängerkanal eingeben, dem du beigetreten bist. Ein Befehl bezieht sich auf die Aktion, die du von Midjourney möchtest. Der gebräuchlichste ist /imagine, gefolgt von deinem Textprompt, der Midjourney sagt, welches Bild es erstellen soll.

/imagine <dein Textprompt>

Du kannst in deinem Prompt so spezifisch oder vage sein, wie du möchtest. Dann drücke Enter, um zu sehen, was das Modell erstellt. In weniger als einer Minute solltest du ein Raster von 4 Bildern sehen, das Midjourney dir zurückgeschickt hat. Hier ist ein Beispiel, das du ausprobieren kannst:

/imagine cute robot, white background

Nach dem Erhalt der Rasterausgabe siehst du darunter einige Optionen:

  • U → Hochskalieren: Wählt eines der vier aus und vergrößert es / verbessert seine Auflösung, damit du es verwenden kannst.

  • V → Variieren: Erzeugt Variationen aus der ausgewählten Ausgabe

  • 🔄 → Wiederholen: Benutze diese Option, wenn du denselben Prompt noch einmal ausführen möchtest, um mehr Ergebnisse zu sehen.

Die Optionen gelten im Uhrzeigersinn. Wenn dir also das Bild oben rechts (2) besonders gut gefällt, klicke auf U2. und erhältst sofort die hochskalierte Version. Um das hochskalierte Bild herunterzuladen: Klicke darauf, um es in voller Größe zu öffnen, und wähle dann mit der rechten Maustaste "Bild speichern".

Herzlichen Glückwunsch! Jetzt weißt du, wie du Midjourney wie 95% seiner Benutzer benutzen kannst. Wenn du wissen willst, wie die Top 5% Midjourney nutzt, um die verrücktesten Dinge damit zu machen, lies die nächste Ausgabe nächste Woche, in der wir folgende Punkte besprechen werden:

  • So you generated an image, now what?

  • Prompt-Engineering: Where the Magic happens

  • Die häufigsten Fehler beim Prompten

  • Nachträgliche Bearbeitung

  • Das “Mischen” von Bildern

  • u. v. m.!