In meinem letzten Beitrag habe ich die Grundlagen der Codex App von 0 bis 1 behandelt, mit Fokus auf die Benutzeroberfläche und die grundlegende Konfiguration. Nachdem das Fundament gelegt ist, wird es Zeit, es Zeit, es Zeit, Codex App für Aufgaben zu nutzen, die tatsächlich die Effizienz steigern und Kosten senken, um Ihr Unternehmen vollständig zu unterstützen.
Der heutige Artikel führt Sie in reale Szenarien, um die verborgenen Geheimnisse von Codex zu erleben – von grundlegend bis fortgeschritten und von Funktionen bis zu Anwendungsfällen. So meistern Sie Codex in einem Durchgang! 🔥
- Unverzichtbar für Büroangestellte: Mit Codex**: Mit Codex die „Büro-Vier“ erstellen – Word, PDF, PPT (bildbasiert vs. HTML-basiert) und Sheets.
- Coole 3D-Videos selbst erstellen: Mit Codex + HyperFrames / Remotion (three.js) die „Top Ten chinesische Animationsfilme“ische Animationsfilme“ erstellen.
- Früh ins Bett, früh raus: Mit Codex eine schön gestaltete Website erstellen, die die Vorteile von frühem Schlaf analysiert, auf Vercel bereitstellen und dann mit Codex OpenRouter für vergleichende Experimente mit dem neuen Ring-Modell steuern.
- Unverzichtbar für Content Creator: Mit Codex lange Bild-für-Bild-Tutorials erstellen – Codex sich selbst steuern lassen, mehrere parallele Dialoge führen und Screenshots samt Unschärfe in einem Durchführung in einem Durchgang.
- E-Commerce-Automation: Codex + Playwright zur Browsersteuerung, um schmerzfreie Massenproduktlistungen auf Pinduoduo zu ermöglichen.
Spielerisch lernen und dabei Geld verdienen – das ist mein Ziel, und ich teile es mit euch allen. Genug der Vorrede, los geht's!
1. Unverzichtbar für Büroangestellte: Word, PDF, PPT und Sheets erstellen
Früher musste man Monate damit verbringen, diese Tools zu meistern, um einen Aktivitätsplan, Projektbericht, Kursunterlagen, Beratungsbericht oder Mitarbeiterschulungsmaterialien zu erstellen. Aber jetzt reicht in Codex ein einziger Prompt, um schön formatierte und datengenaue Word-, PDF-, PPT- und Sheets-Dateien zu generieren.
Um dies zu demonstrieren, habe ich eine Demo erstellt:
Bitte führen Sie im aktuellen Dialog eine Büro-Suite-Demonstrationsaufgabe zum Thema „Codex App Content-Produktionsworkflow“ durch. Anforderungen: 1. Echte Word-, PDF-, PPTX- und XLSX-Dateien generieren; 2. Jede Datei muss tatsächlichen Inhalt haben, nicht leer sein; 3. Teilen Sie mir den tatsächlichen Pfad jeder Datei nach der Generierung mit; 4. Versuchen Sie, eine Vorschau oder Dateiliste für meine Tutorial-Screenshots zu generieren; 5. Stellen Sie abschließend eine Abnahmeprüfliste bereit, um zu bestätigen, dass alle vier Dateien existieren, geöffnet werden können und keine Platzhalterinhalte sind.
Abnahmeergebnisse:
- Screenshot der Word-Dokumentenverifizierung:

- Screenshot der PDF-Dateiverifizierung:

- Screenshot der PPT-Präsentationsverifizierung:

- Screenshot der Sheets-Tabellenverifizierung:

Selbst ohne optimierte Fähigkeiten oder Prompts sind diese Ergebnisse hervorragend! Die derzeit auf X angesagteste PPT-Methode ist das HTML-basierte Zeichnen, das mit Traditionen bricht. Eine Alternative ist die Generierung bildbasierter PPTs.
Route 1: Bildbasierte PPT
Das bedeutet, Codex zuerst 16:9-Visuals generieren zu lassen und diese dann in die PPT einzufügen. Jede Folie ist im Wesentlichen ein vollständiges Bild. Der Effekt ist recht gut, da das zugrunde liegende Modell GPT2-image ist. Diese sind dennoch auf verschiedene Weise bearbeitbar; schreibt mir eine DM, wenn ihr an der Dokumentation interessiert seid.


Route 2: HTML-basierte PPT
Dies ist eine in letzter Zeit sehr beliebte Route. Anstelle traditioneller Software verwendet man HTML, CSS und JS, um Folien zu schreiben. Die Vorteile umfassen Browser-Vorschau, Animationen, Interaktivität, codegesteuerte Layouts und einfachen Export. Viele Open-Source-Fähigkeiten dafür sind auf X über die Grok-Suche verfügbar.

2. Coole 3D-Videos selbst erstellen: Codex + HyperFrames / Remotion für „Top Ten chinesische Animationsfilme
Wechseln wir von der Arbeit zu etwas Coolerem. Ich habe Codex + HyperFrames / Remotion (three.js) verwendet, um ein 3D-Video zu erstellen. Die Kernlogik: Codex schreibt Code und rendert, three.js kümmert sich um 3D-Visuals, Minimax um die Erzählung, yt-dlp lädt Clips herunter und Remotion verwandelt Web-Animationen in Videos.
Schritte:
1.:
- Erklären Sie die Anforderung klar an Codex klar.
- Anforderungen abstimmen – Codex bitten, anzuhalten und nachfragen lassen, ob etwas unklar ist.
- „Hoch“ und „Vollzugriff“ für @browser und @computer aktivieren.
- Das Endprodukt erhalten und verfeinern.
Dies validiert die Kette „Auto-Skripterstellung -> Materialsuchen -> Auto-Download -> Highlight-Identifizierung -> Auto-Synchronisation -> Auto-Schnitt“. Dies kann für KI-Traffic-Monetarisierung, E-Commerce und Werbung kommerzialisiert werden.

3. Früh ins Bett, früh raus: Mit einem Prompt eine Website erstellen und auf Vercel bereitstellen
Viele KI-Enthusiasten haben unregelmäßige Zeitpläne, weil KI zu viel Spaß macht. Ich habe Codex habe eine Website zum Thema „Früh ins Bett, früh raus“ erstellt, um Gesundheit zu fördern. Eine kleine App oder Website zu erstellen, ist mit einem Prompt wie diesem einfach:
Bitte generieren Sie eine Website über frühes Schlafengehen und frühes Aufstehen. Anforderungen: 1. Schönes Layout; 2. 3D-Animationen; 3. Vorteile analysieren; 4. Umsetzungsschritte; 5. Echte, lauffähige Website; 6. Lokale Vorschau starten und Bereitstellung auf Vercel.

Codex erstellte mehr als nur eine statische Seite (bereitgestellt unter: https://codex-1-html-css-js-2.vercel.app/); es enthielt eine 3D-Zirkadianrhythmus-Szene, Pläne und Selbsttest-Punktzahlen.


Sie können Codex auch zum Testen neuer Modelle auf OpenRouter verwenden. Beispielsweise habe das neue Ring-2.6-1T (kostenlose) Modell von Ant Group getestet. Da Codex mein lokales Terminal nicht direkt für Claude Code steuern konnte, ließ, habe ich es die OpenRouter-Website öffnen und eine einseitige HTML-Site mit dem Ring-Modell generieren lassen.

Die von Ring generierte Version seht ihr hier: https://ring-sleep-site.vercel.app/

Dies ist eine großartige Möglichkeit, Modellfähigkeiten kostenlos zu testen. Sie können diese Logik sogar nutzen, um GPT-4o Pro über die Weboberfläche durch Codex zu nutzen.

4. Unverzichtbar für Content Creator: Lange Bild-für-Bild-Tutorials erstellen
Dies ist ein Szenario, das ich oft nutze. Mein vorheriges virales Tutorial zu 80 % von Codex erstellt, einschließlich Text, Screenshots und Unschärfe. Der Schlüssel liegt in „Prompt-Genauigkeit“ und „Stilübertragung“. Sie müssen Ihre Logik und Struktur vorgeben, nicht nur eine vage Richtung.

Ich habe meine Schreibgewohnheiten in eine „Yichen-Tutorial-Schreibfähigkeit“ für Codex destilliert, die es aufrufen kann. Sie können Codex sogar mehrere Dialoge öffnen lassen, um sich selbst zu überwachen und Aufgaben parallel auszuführen, was die Effizienz drastisch steigert.

5. E-Commerce-Automation: Codex + Playwright für Pinduoduo-Massenlistung
Für einen Pinduoduo-Händler war der Schmerzpunkt das manuelle Ausfüllen von Tausenden von SKU-Datenzeilen im Backend.

Zunächst schlug ich Computer Use vor, aber Pinduoduo blockierte es. Also wechselten wir zu Playwright. Playwright steuert steuert den Browser durch Identifizierung von Elementen, nicht nur durch „Anschauen“ des Bildschirms, was es für Massenaufgaben stabiler macht.

Codex übernahm die gesamte Kette: Excel lesen, Felder zuordnen, Playwright-Skripte schreiben und Ergebnisse protokollieren. Dies verwandelte eine einmalige Aufgabe in einen wiederverwendbaren Unternehmensprozess.


6. Häufige Fallstricke und Lösungen
- Fallstrick 1: Computer Use ist nicht universell. Einige Websites erkennen Automatisierung. Verwenden Sie Playwright mit
stealthund verwenden Sie angemeldete Browser-Instanzen wieder. - Fallstrick 2: Codex kann keine offenen lokalen Terminals steuern. Es kann den Bildschirm sehen, aber keine Befehle an externe Prozesse senden. Verwenden Sie die Webversion oder das integrierte Terminal von Codex.
- Fallstrick 3: Anweisungen statt Logik geben. Wenn Sie nur „schreibene Sie einen Artikel“ sagen, wird die Ausgabe schlecht sein. Geben Sie ein Framework und Ihre eigenen hochwertigen Beispiele zur Stilnachahmung vor.
7. Mein Verständnis von Codex
Codex ist mehr als ein Chatbot. Es kann Inhalte produzieren, Daten analysieren (wie WeChat-Protokolle), Browser automatisieren und andere KI-Aufgaben überwachen. Sein Potenzial ist grenzenlos.
8. Empfohlener Lernpfad für Anfänger
- Bilder generieren.
- Office-Dokumente generieren.
- Eine kleine HTML-Seite erstellen.
- Lokale Vorschau und Vercel-Bereitstellung.
- Bild-für-Bild-Tutorials.
- HTML-PPTs und Video-Animationen.
- Geschäftsautomatisierung.
9. Preise und Nutzungshinweise
Die kostenlose Version ist sehr eingeschränkt eingeschränkt. Ich empfehle ein GPT Plus- oder Pro-Abonnement. Wenn Sie Proxy-Probleme haben, stellen Sie sicher, dass Sie WSS_PROXY und WS_PROXY in ~/.codex/config.toml konfigurieren und für macOS launchctl setenv verwenden.

Viel Spaß mit Codex! Wenn Sie komplexe Geschäftsszenarien haben, die optimiert werden müssen, können Sie sich gerne melden.





