So holen Sie das Beste aus Codex heraus: Einblicke vom offiziellen Team

Autor: jason (@jxnlco

Original:

jason

@jxnlco

20. Mai

Artikel

Das Beste aus Codex herausholen

Die meisten Entwickler setzen Coding-Agenten zunächst zum Programmieren ein: Repository inspizieren, einen Diff erstellen, Tests durchführen und einen Pull-Request eröffnen.

Das bleibt zwar der Kernbereich von Codex. Aber ein Großteil der Arbeit, die wir am Computer erledigen, dreht sich letztlich um Code: Terminalbefehle ausführen, im Web surfen, APIs aufrufen, Dokumente exportieren, auf Ereignisse reagieren oder Automatisierungsprozesse auslösen. Wenn Codex in diese Bereiche vordringt, fühlt es sich nicht mehr wie ein enger „Programmierassistent", sondern wie ein „Allround-Mitarbeiter", der bei allen möglichen Computeraufgaben helfen kann.

Die neuen Funktionen von Codex machen diesen Wandel spürbar. Aktuelle Threads können sich Ihren Kontext merken, verschiedene Werkzeuge aufrufen, generierte Artefakte anzeigen und nahtlos zwischen verschiedenen Eingabeaufforderungen wechseln – so müssen Sie sich nicht jedes Mal neu „vorstellen", wenn Sie einen Chat beenden.

Um das volle Potenzial von Codex auszuschöpfen, müssen Sie diese Experten-Tricks kombinieren:

Dauerhafte Threads, die sich langfristig an Kontext erinnern können
Flexibler Einsatz von Spracheingabe, Aufgabensteuerung und Aufgabenwarteschlange, während Sie die Kontrolle behalten
Erweiterung der Reichweite von Codex über die Codebasis hinaus mithilfe von Browsern, Computer-Nutzung, MCP-Servern (ein universeller Standard für KI, um sicher auf lokale Daten und Tools zuzugreifen) und verschiedenen Konnektoren
Codex weiterarbeiten lassen, während Sie nicht am Computer sind, mithilfe von Thread-Automatisierungen und Zielen
Geschickte Nutzung des Seitenfensters, um generierten Code, Dokumente, Folien und andere Dateien jederzeit zu überprüfen

Dauerhafte Threads

Dauerhafte Threads: Langlebige Codex-Threads, die Ihren Arbeitskontext über mehrere Nutzungshinweg erhalten.

Das Anheften von Threads ist eine hervorragende Möglichkeit, diese dauerhaften Unterhaltungen jederzeit griffbereit zu halten. Das ist ein Segen für Workflows, die wiederholt vorangetrieben werden müssen, zum Beispiel:

Ein dedizierter „Chief of Staff"-Thread (der Ihnen bei alltäglichen Aufgaben hilft)
Ein Thread speziell für Produkteinführungen
Ein Thread für die Überprüfung von Dokumentationen
Ein Überwachungs-Thread, der sich auf externe Daten konzentriert

Dies sind keine „Chat-und-verbrenn"-Gespräche; es sind dauerhafte Arbeitsbereiche. Im Laufe der Zeit kann Codex jederzeit zu diesen Gesprächen zurückkehren und sich an Ihre früheren Entscheidungen, persönlichen Vorlieben und den aktuellen Fortschritt erinnern. Ohne diese Funktion müssten Sie ihm jedes Mal alle diese Hintergrundinformationen von Grund auf neu füttern.

Die Verknüpfung zum Anheften macht dies äußerst praktisch. Durch Drücken von Befehl-1 bis Befehl-9 können Sie sofort wieder in diese gespeicherten, dedizierten Threads einsteigen und weiterarbeiten.

Spracheingabe

Spracheingabe ist nützlich, weil sie die ursprünglichsten, rohen Gedanken in Ihrem Kopf einfängt, bevor Sie sie sorgfältig in Text fassen müssen.

Codex verfügt über eine integrierte Spracheingabe. Dies ist besonders effektiv für vage Ideen, die „leicht zu sagen, aber mühsam zu tippen" sind. Zum Beispiel:

„Ich erinnere mich, dass jemand namens Ben das in Slack erwähnt hat.

Ich habe die Details vergessen.

Finde es für mich."

Für einen KI-Agenten, der selbstständig suchen, Kontext sammeln und Ihnen Bericht erstatten kann, reichen diese wenigen Sätze, um mit der Arbeit zu beginnen.

Wenn Sie eine vage Idee im Kopf haben, die noch nicht ausgereift ist, funktioniert es auch überraschend gut, zwei oder drei Minuten „vor sich hin zu murmeln" und all Ihre Gedanken auf einmal auszuspucken.

Die Aufzeichnung von Transkriptionen folgt derselben Logik. Eine ungeschliffene Besprechungsaufzeichnung oder ein diktierten Planentwurf ist oft wertvoller als eine kurze Zusammenfassung. Denn diese rohen Aufzeichnungen bewahren Ihren zögernden Tonfall, die betonten Punkte und all die unvollendeten Geistesblitze.

Steuerung und Warteschlange

Wenn Sie Spracheingabe mit der direkten Steuerung laufender Aufgaben kombinieren, zeigt sich ihre wahre Stärke.

Wenn eine Aufgabe ausgeführt wird und Sie möchten:

Aufgabensteuerung: Codex mitten in der Aufgabe unterbrechen, bevor es fertig ist, und ihm eine neue Richtung geben.

Dies ist praktisch, wenn Sie feststellen, dass die KI vom Kurs abkommt, und Sie sie korrigieren müssen, bevor sie gegen eine Wand läuft. Während Sie es beispielsweise eine Website überprüfen lassen, können Sie im Seitenfenster Dinge anmerken und direkt seine Arbeit unterbrechen:

„Mach das etwas kleiner"
„Der Abstand zwischen diesen beiden Elementen sieht nicht richtig aus"
„Dieser Text ist falsch geschrieben"

Aufgabenwarteschlange: Codex die nächste Aufgabe zuweisen, nachdem es den aktuellen Schritt abgeschlossen hat.

Die Aufgabenwarteschlange ist anders. Sie unterbricht die laufende Aufgabe nicht, sondern stellt die neue Aufgabe ans Ende der Warteschlange. Sie können ihm sagen:

„Sende den Vorschau-Link an den Reviewer in Slack, sobald dieser Job erledigt ist."

Einfach ausgedrückt: „Steuerung" ändert, was Codex gerade tut, während „Warteschlange" festlegt, was es als Nächstes tun soll. Beide Funktionen ermöglichen es Ihnen, während der Aufgabenausführung ein Gefühl der „menschlichen Kontrolle" zu behalten.

Tools und Reichweite

Sobald ein Thread ein kontinuierliches Gedächtnis hat, stellt sich die nächste Frage: Was kann er berühren? Die Tentakel von Codex können sich schichtweise nach außen ausdehnen:

$browser: Ein In-App-Browser, der im Seitenfenster läuft und mit dem Codex Webseiten überprüfen und markieren kann.
@chrome: Kann auf den Anmeldestatus Ihres Browsers zugreifen, um Chrome-basierte Workflows zu verwalten.
@computer: Speziell für Aufgaben, die nur über eine grafische Desktop-Benutzeroberfläche (GUI) erledigt werden können.

$browser eignet sich für Web-Reviews im Seitenfenster; @chrome für Browser-Arbeiten, die Ihren Konto-Login erfordern; und @computer für Aufgaben, bei denen auf dem Desktop herumgeklickt werden muss.

MCP-Server und verschiedene Konnektoren erweitern diese Fähigkeit weiter in Ihren gesamten Workflow hinein. Slack-Integration sowie verschiedene MCP-Tool-Konnektoren und MCP-Leitfäden sind wichtig, weil viele kritische Aufgaben oft als Chat-Nachricht, E-Mail im Posteingang oder Terminproblem beginnen, bevor sie zu Code werden.

Skills ermöglichen die Wiederverwendung wiederkehrender Workflows. Sobald sich ein Workflow als nützlich erwiesen hat, können Sie ihn als Skill festigen, damit Codex ihn beim nächsten Mal direkt ausführen kann, ohne den Ablauf von Grund auf neu lernen zu müssen.

Von überall arbeiten

Das Konzept des Arbeitens mit Codex von überall aus durchbricht die traditionelle Einschränkung, dass wir „zwingend vor einem Computer sitzen müssen, um zu arbeiten". Eine Aufgabe kann auf Ihrem Mac (vollgepackt mit Dateien, Berechtigungen und lokalen Umgebungen) beginnen und dann stillschweigend weiterlaufen, wenn Sie Ihren Schreibtisch verlassen und auf Ihrem Telefon nachsehen.

Dies ist besonders in fragmentierten Arbeitszeiten nützlich. Sie können Codex eine lange Aufgabe auf Ihrem Computer ausführen lassen und dann Ihren Schreibtisch verlassen, um einen Kaffee zu holen. Wenn es während Ihrer Abwesenheit eine Frage hat, können Sie direkt per Telefon antworten, seinen nächsten Schritt genehmigen oder ihm eine neue Richtung geben, bevor Sie zurückkehren. Ihre lokale Umgebung bleibt dort still und leise am Arbeiten, während Sie sich frei bewegen.

Automatisierungen

Automatisierungsfunktionen ermöglichen es Codex, automatisch nach einem von Ihnen festgelegten Zeitplan zu arbeiten. Für Aufgaben, die jeden Tag von Grund auf neu beginnen müssen (wie das Erstellen täglicher Berichte oder routinemäßige Codebasis-Prüfungen), verwenden Sie die „geplante Automatisierung". Wenn Sie jedoch die Arbeit in einem Gespräch mit historischem Gedächtnis vorantreiben möchten, verwenden Sie die „Thread-Automatisierung".

Thread-Automatisierung: Wie ein zeitgesteuerter „Herzschlag"-Mechanismus, der periodisch in denselben Codex-Thread zurückkehrt, um nach einem festgelegten Zeitplan weiterzuarbeiten.

Das Anheften von Threads ist nützlich, erfordert aber dennoch, dass Sie aktiv darauf zurückgreifen. Die „Thread-Automatisierung" hingegen kann alle paar Minuten oder Stunden selbstständig nach dem Rechten sehen, bis eine bestimmte Bedingung erfüllt ist, und sogar die Prüffrequenz basierend auf der Situation anpassen.

Zum Beispiel kann Ihr „Chief of Staff"-Thread alle 30 Minuten laufen:

Überprüfe alle 30 Minuten meinen Slack und Gmail auf Nachrichten, die verarbeitet werden müssen, aber noch nicht beantwortet wurden.

Hilf mir, sie zu priorisieren.

Wenn mich jemand etwas fragt, recherchiere so tiefgehend wie möglich und helf mir, eine Antwort zu entwerfen, aber sende sie nicht direkt ab.

Wenn Sie zu Ihrem Computer zurückkehren, ist die zeitaufwändigste „Hintergrund-Sammelarbeit" oft schon erledigt. Als Mensch müssen Sie nur noch die endgültige Entscheidung zum Senden treffen.

Die Thread-Automatisierung eignet sich auch perfekt für „Rückkopplungsschleifen". Sie kann stillschweigend Ihre Kommentare in PRs, Google Docs oder Slack verfolgen und während Ihrer Abwesenheit automatisch Folgemaßnahmen vorantreiben.

Stellen Sie sich ein Animationsproduktions-Szenario vor: Ein Prüfer postet ein Video in Slack. Die Thread-Automatisierung kann periodisch den Diskussionsfortschritt prüfen; sobald Änderungsvorschläge eingehen, rendert sie automatisch eine neue Version, erwähnt dann den Prüfer im ursprünglichen Thread mit @ und antwortet mit dem neuen Video. Wenn eine Software-Integrationsschnittstelle den letzten Upload nicht automatisch abschließen kann, kann sie sogar die „Desktop-Automatisierung" mobilisieren, um den letzten Schritt über die GUI zu erledigen.

Diese vollständige, geschlossene Schleife überspannt Slack (für den Feedback-Empfang), die Codebasis (für das Rendern) und Desktop-Automatisierungstools (für den finalen Upload).

Ziele

Wenn eine Aufgabe eine klare Ziellinie hat und der KI-Agent kontinuierlich auf dieses Ziel hinarbeiten kann, entfaltet sich die Kraft der Ziele in voller Pracht.

Ziele: Langfristigere Codex-Aufgaben mit einer klaren Ziellinie, auf die die KI über einen Zeitraum hinweg kontinuierlich zusteuert.

Ein schlechtes Ziel ist so formuliert:

Setze den Plan in dieser Markdown-Datei um.

Ein gutes Ziel muss ein messbares Erfolgskriterium haben.

Ein Ingenieur, der beispielsweise ein internes Tool von Python nach Rust migrieren möchte, kann das neue Verzeichnis einrichten, das Ziel festlegen und eine klare Ziellinie ziehen:

Die Entwicklung dieser neuen Version ist erst abgeschlossen, wenn alle Komponententests bestanden sind.

Die Zielsetzung besteht im Wesentlichen aus der Kombination von „kontinuierlicher Ausführung" mit einem „Verifizierer". Sie als Mensch definieren das gewünschte Ergebnis, die Bedingungen für den Abbruch und die Signale, die verwendet werden, um zu beurteilen, ob Codex der Ziellinie näher kommt.

Nützliche Verifizierer umfassen:

Ein vollständiger Satz von Testfällen
Ein Benchmark-Performance-Test
Ein konsistent reproduzierbarer Fehler
Eine Verifikationsmatrix
Ein End-to-End-Workflow, der immer funktionieren muss

Ambition ist wichtig, aber Ambition ohne Verifizierungsmechanismus ist nur Wunschdenken.

Das Seitenfenster

Die Seitenfenster-Funktion hält Ihre generierten Arbeitsergebnisse direkt neben Ihrem Chatfenster. Sie müssen keine Dateien mehr exportieren und mühsam zwischen verschiedenen Programmen hin- und herwechseln; Sie können sie direkt an Ort und Stelle überprüfen. Die generierten Ergebnisse können Code sein, aber auch Folien, PDFs, Webseiten, Tabellenkalkulationen oder andere generierte Inhalte.

Es ist besonders gut geeignet für vier Arten von Arbeiten:

Inspizieren generierter Artefakte
Kommentieren von Bereichen, die geändert werden müssen
Bedienen von Weboberflächen
Überprüfen von Änderungen an Code oder Dateien

Das Seitenfenster ermöglicht Benutzern das direkte Anzeigen von Markdown-Dokumenten, Tabellenkalkulationen, Datentabellen, einfachen Dokumenten und Folien. Sie können Dateien inspizieren, kommentieren und ändern, ohne Ihren bestehenden Arbeitsablauf zu unterbrechen.

Ihre Folien oder PDFs bleiben direkt neben dem Dialogfeld geöffnet und warten auf Ihre Überprüfung und Änderung zu jeder Zeit.

Der In-App-Browser ermöglicht es Codex, gerenderte Webseiten direkt zu inspizieren, zu steuern und sogar direkt auf Ihre Anmerkungen auf der Seite zu reagieren. Kommentare auf Webseiten oder Dateien bleiben alle in dieser Arbeitsschleife; es ist nicht mehr nötig, sie wie früher in separate Übergabeaufgaben aufzuteilen.

Die Webseite wird sowohl zu seinem Ausgabeergebnis als auch zu einem Bedienfeld, das Sie manipulieren können. Codex kann eine Seite erstellen, sie im Seitenfenster öffnen, selbst inspizieren, Fehler beheben und dann iterativ optimieren – alles an Ort und Stelle.

Die folgenden Szenarien sind mit dem Seitenfenster besonders effektiv:

Verwendung einer einzelnen index.html für leichte statische Darstellungen
Ausführen von Storybook zur Überprüfung von UI-Komponenten
Verwendung von Remotion Studio für codegenerierte Animationen
Folienpräsentationen im Browser
Daten-Apps für Datenanalyse-Workflows

Eine einfache index.html-Datei kann sich in eine unterhaltsame interaktive App verwandeln, ohne dass ein Server eingerichtet werden muss. Darüber hinaus kann die Thread-Automatisierung diese statischen Dateien im Laufe der Zeit leise aktualisieren, sodass bei Ihrer Rückkehr immer der neueste Fortschritt auf Sie wartet.

Geteiltes Gedächtnis

Wenn diese langlebigen Threads die Grenzen eines einzelnen Chats überschreiten und sich ein Gedächtnis teilen können, macht ihre Nützlichkeit einen qualitativen Sprung.

Geteiltes Gedächtnis: Dauerhafter Kontext, der außerhalb einer einzelnen Unterhaltung gespeichert wird und es zukünftigen Arbeiten ermöglicht, auf Basis klarer, nachvollziehbarer Informationen fortzufahren.

Ein relativ sicherer Ansatz ist es, diese beständigen Threads in einem Obsidian-Vault zu „verankern". Einfach ausgedrückt: Erstellen Sie einen Ordner zum Speichern von Textdateien im Klartextformat. Es ist unkompliziert, ermöglicht Ihnen jederzeit das Anzeigen, Ändern und Verschieben und ist langlebig. Teams können diesen Ordner in jede beliebige Cloud-Plattform legen, wie Git, Dropbox, Google Drive oder andere Synchronisierungstools.

Ihr Vault könnte so aussehen:

[text]

vault/

├── TODO.md

├── people/

├── projects/

├── agent/

└── notes/

Im Stammverzeichnis können Sie eine AGENTS.md-Datei ablegen. Hier können Sie Regeln für Codex festlegen: wie es diesen Vault aktualisieren soll, wenn es neue Dinge über Personen, Projekte, Entscheidungen und Aufgaben erfährt.

Kopieren Sie nicht blind eine bestimmte Vault-Struktur. Was Sie tun müssen, ist, Ihrem KI-Agenten zu „lehren": Wohin der dauerhafte Kontext gehört, welcher Kontext behalten werden muss und wann er nicht an Dateien herumspielen soll.

Eine praktische AGENTS.md-Anleitung könnte Folgendes besagen:

Behandle ~/vault als deinen langfristigen Arbeitsgedächtnisbereich.
Versuche, Notizen organisiert zu halten; lass keine fragmentierten Aufzeichnungen überall herumliegen.
Kategorisiere Aufgaben, Personen, Projekte, tägliche Zusammenfassungen und Entwürfe genau.
Speichere getroffene Entscheidungen, aufgetretene Blockaden, Verantwortliche, Daten und nützliche Links ordnungsgemäß.
Wenn es keine substanziellen neuen Fortschritte gibt, ändere keine Dateien im Vault nach dem Zufallsprinzip.

Codebasen dienen der Speicherung von Code. Dieser Vault dient der Speicherung von fortlaufendem Kontext: Wer ist beteiligt, was wurde geändert, wo es hakt, wer als Nächstes nachfasst und jene Details, die zwischen zwei Chats vollständig verloren gehen würden.

Wichtiger Kontext sollte niemals ausschließlich im Textprotokoll eines einzigen Chats eingeschlossen sein. Schreiben Sie ihn auf und legen Sie ihn dorthin, wo der nächste Thread ihn sofort aufnehmen kann.

Codex selbst bietet auch offizielle Gedächtnisfunktionen unter Einstellungen > Personalisierung > Gedächtnis. Sie sind wie eingebaute lokale Notizzettel, die verwendet werden, um Ihre persönlichen Vorlieben, häufige Workflows und häufig auftretende Fallstricke zu merken. Diese Funktion soll jedoch den von Ihnen klar niedergeschriebenen Kontext ergänzen, nicht ersetzen. Die Chronicle-Gedächtniskomponente folgt derselben Logik und hilft Codex, Gedächtnis aus dem zu extrahieren und aufzubauen, was kürzlich auf Ihrem Bildschirm passiert ist.

Vom Code nach außen

Obwohl Codex mit dem Schreiben von Code als seinem Hauptgeschäft begann, können jetzt viele periphere Aufgaben rund um den Code innerhalb desselben Systems erledigt werden: sei es über MCP-Server, Weboberflächen, Desktop-Steuerung, Thread-Automatisierung oder Dateien, die direkt im Seitenfenster überprüft werden können.

Dies ändert völlig die Art und Weise, wie wir es steuern. „Aufgabensteuerung" kann seine Aktionen unterbrechen; „Aufgabenwarteschlange" kann die nächsten Schritte arrangieren; „Thread-Automatisierung" ermöglicht es dem System, weiterzulaufen, wenn Sie nicht da sind; und „Zielsetzung" zieht eine klare Ziellinie, die Codex weiß, wohin es weiter sprinten muss.

Das heutige Codex kann bereits einen vollständigen Workflow bewältigen: vom Hören von Anweisungen über die Ausführung von Aufgaben bis hin zur abschließenden Überprüfung von Dateien. Selbst wenn diese Aufgaben das Gebiet der Codebasis längst überschritten haben, meistert es sie dennoch mühelos.

Dauerhafte Threads

Spracheingabe

Steuerung und Warteschlange

Tools und Reichweite

Von überall arbeiten

Automatisierungen

Ziele

Das Seitenfenster

Geteiltes Gedächtnis

Vom Code nach außen

Use YouMind to read viral articles deeply

Aktuelle virale Artikel

How to turn a boring app into $10M with one mascot

60 Claude Opus 4.8 Workflows That Make Money While You Sleep

Scaling Laws, Honestly

5 Mind-Blowing AI Techniques from DeNA Chair Tomoko Namba

No Foreign Card Needed: Two Steps to Securely Subscribe to Claude Codex and Set Up a Private VPN

Complete Guide to Claude Fable 5's 'Agent Functions'

So holen Sie das Beste aus Codex heraus: Einblicke vom offiziellen Team

Dauerhafte Threads

Spracheingabe

Steuerung und Warteschlange

Tools und Reichweite

Von überall arbeiten

Automatisierungen

Ziele

Das Seitenfenster

Geteiltes Gedächtnis

Vom Code nach außen

Use YouMind to read viral articles deeply

Verwandle dein Markdown in einen sauberen 𝕏-Artikel

Aktuelle virale Artikel

How to turn a boring app into $10M with one mascot

60 Claude Opus 4.8 Workflows That Make Money While You Sleep

Scaling Laws, Honestly

5 Mind-Blowing AI Techniques from DeNA Chair Tomoko Namba

No Foreign Card Needed: Two Steps to Securely Subscribe to Claude Codex and Set Up a Private VPN

Complete Guide to Claude Fable 5's 'Agent Functions'