Codex を最大限に活用する方法：公式チームからのインサイト

著者: jason (@jxnlco

原文:

jason

@jxnlco

5月20日

記事

Codex を最大限に活用する

ほとんどの開発者が最初にコーディングエージェントを使うのは、コードを書くためです。リポジトリを調べ、差分を生成し、テストを実行し、プルリクエストを送信する。これが基本的な流れです。

これは今でも Codex の中心的な役割です。しかし、私たちがコンピューター上で行う作業のほとんどは、本質的にコードに関連しています。ターミナルコマンドの実行、ウェブの閲覧、API の呼び出し、ドキュメントのエクスポート、様々なイベントへの応答、自動化プロセスのトリガーなどです。Codex がこれらの領域にまで対応できるようになると、もはや単なる「プログラミングアシスタント」という狭い範囲を超え、あらゆるコンピューター業務を支援してくれる「万能な働き手」へと進化します。

Codex の新機能によって、この変革は現実のものとなりつつあります。現在のスレッドは、あなたのコンテキストを記憶し、様々なツールを呼び出し、生成されたアーティファクトを表示し、異なるプロンプト間をシームレスに移行できるため、チャットのたびに「自己紹介」をやり直す必要がなくなります。

Codex の可能性を余すところなく引き出すには、以下のエキスパート級のテクニックを組み合わせる必要があります。

長期にわたって記憶を保持できる永続的なスレッド
音声入力、タスクの方向転換、タスクのキューイングを柔軟に使いこなし、常に制御権を維持する
ブラウザ、コンピューター操作、MCP（Model Context Protocol）サーバー（AI がローカルデータやツールに安全に接続するための汎用標準）、および各種コネクタを使用して、Codex のリーチをコードベースの外にまで拡張する
スレッド自動化とゴールを活用して、コンピューターから離れている間も作業を継続させる
サイドパネルを駆使して、生成されたコード、ドキュメント、スライド、その他のファイルをいつでも確認する

永続的なスレッド

永続的なスレッド: 複数回の使用にわたって作業コンテキストを維持する、長期稼働する Codex スレッド。

スレッドをピン留めすることは、これらの永続的な会話をいつでもすぐに利用できるようにしておくための優れた方法です。これは、繰り返し進める必要があるワークフローにとっては天の恵みと言えるでしょう。例えば、以下のようなものです。

専任の「参謀」スレッド（日々の雑務を処理するため）
製品ローンチ専用のスレッド
ドキュメントレビュー用のスレッド
外部データに焦点を当てた監視スレッド

これらは「話して終わり」のチャットボックスではありません。持続的なワークスペースです。時間が経つにつれて、Codex はいつでもこれらの会話に戻り、以前の決定事項、あなたの個人的な好み、現在の進行状況を思い出すことができます。この機能がなければ、その都度、背景情報をすべて最初から与え直さなければなりません。

ピン留めのショートカットはこれを非常に実用的にします。Command-1 から Command-9 を押すだけで、保存された専用スレッドに瞬時にジャンプして作業を再開できます。

音声入力

音声入力は、慎重にテキストに練り上げる前の、頭の中にある最も原始的で生の考えを捉えることができるため、非常に有用です。

Codex には音声入力が組み込まれています。これは、「言うのは簡単だけど、打つのが面倒」といった曖昧なアイデアに特に効果的です。例えば、

「そういえば、Ben って人が Slack でこれについて言及してたんだよね。

詳細は忘れちゃったけど。

探してきてくれない？」

AI エージェントが自ら検索し、コンテキストを収集し、報告できるのであれば、この数行の言葉で作業を開始するのに十分です。

頭の中でまだ完全に形になっていないぼんやりとしたアイデアがある場合、2、3分かけて「ぶつぶつ」と話し、考えを一度に全部吐き出してしまうのも驚くほど効果的です。

録音の文字起こしも同じ論理です。洗練されていない会議の記録や、口述で作成した計画の草案は、簡潔な要約よりも価値があることがよくあります。なぜなら、それらの生の記録には、ためらいがちな口調、強調した点、そして未完のひらめきがそのまま残されているからです。

タスクの方向転換とキューイング

音声入力を、実行中のタスクを直接制御する機能と組み合わせると、その真価が発揮されます。

タスク実行中に、以下のような操作が必要になった場合を考えてみてください。

タスクの方向転換: タスクが完了する前に Codex に割り込み、新しい指示を与えること。

これは、AI が軌道から外れていることに気づき、行き詰まる前に修正する必要がある場合に便利です。例えば、Codex にウェブサイトをレビューさせている間に、サイドパネルで指摘しつつ、直接作業に割り込むことができます。

「これを少し小さくして」
「この2つの要素の間隔がおかしい」
「このコピー、書き方が間違ってるよ」

タスクのキューイング: Codex が現在のステップを完了した後、次のタスクを割り当てること。

タスクのキューイングはこれとは異なります。実行中のタスクを中断するのではなく、新しいタスクを待ち行列の最後に追加します。次のように指示できます。

「この作業が終わったら、プレビューリンクを Slack でレビュアーに送って」

簡単に言えば、「方向転換」は Codex が今やっていることを変更することで、「キューイング」は次にやるべきことを手配することです。どちらの機能も、タスク実行中に「人間と機械が一体となった」制御感を維持することを可能にします。

ツールとリーチ

スレッドが継続的な記憶を持つようになれば、次に考えるべきは「何にアクセスできるか」です。Codex の触手は階層的に外側へと広げることができます。

$browser: サイドパネルで動作するアプリ内ブラウザ。Codex はここでウェブページをレビューし、マークアップできます。
@chrome: ブラウザのログイン状態にアクセスし、Chrome ベースのワークフローを処理できます。
@computer: デスクトップの GUI を介してのみ完了できるタスクに特化しています。

$browser はサイドパネルでのウェブレビューに適しており、@chrome はアカウントログインが必要なブラウザ内作業に、@computer はコンピューターのデスクトップ上でクリック操作が必要なタスクに使用します。

MCP サーバーと各種コネクタは、この機能をさらにワークフロー全体に拡張します。Slack 連携、および様々な MCP ツールコネクタと MCP ガイドは、多くの重要なタスクがコードになる前に、チャットメッセージ、受信箱のメール、またはスケジュールの問題として始まることが多いため、重要です。

スキルを使用すると、反復的なワークフローを再利用可能にできます。あるワークフローが有用であることが証明されたら、それをスキルとして確立し、次回から Codex がプロセスを一から学習し直すことなく直接実行できるようにすることができます。

どこからでも作業可能

Codex とどこからでも作業するという概念は、「作業するためにはコンピューターの前に座っていなければならない」という従来の制限を完全に打ち破ります。タスクは、ファイル、権限、ローカル環境が揃った Mac 上で開始され、その後、机を離れてスマートフォンで確認している間も、静かにバックグラウンドで進行し続けることができます。

これは、細切れの時間を有効活用するのに非常に便利です。Codex に長時間かかるタスクをコンピューター上で実行させ、席を離れてコーヒーを飲みに行くことができます。もし外出中に質問が発生した場合は、スマートフォンから直接返信し、次のアクションを承認したり、新しい指示を与えたりしてから席に戻ることができます。あなたが自由に動き回っている間も、ローカル環境は静かにそこで作業を続けています。

自動化

自動化機能により、Codex はあなたが設定したスケジュールに従って自動的に作業できます。毎日のレポート生成や定期的なコードベースチェックなど、毎回初期状態から開始する必要があるタスクには「スケジュール自動化」を使用します。しかし、履歴を記憶した会話内で作業を進める必要がある場合は、「スレッド自動化」を使用します。

スレッド自動化: タイマー式の「鼓動」メカニズムのようなもので、設定されたスケジュールに従って、定期的に同じ Codex スレッドに戻り作業を続けます。

スレッドのピン留めは便利ですが、それでもユーザーが能動的にそのスレッドに戻る必要があります。一方、「スレッド自動化」は、数分ごと、または数時間ごとに自動的にチェックインし、特定の条件が満たされるまで作業を続け、状況に応じてチェックインの頻度を調整することも可能です。

例えば、「参謀」スレッドを 30 分ごとに実行するように設定できます。

30 分ごとに、私の Slack と Gmail をチェックして、まだ返信が必要で処理されていないメッセージがないか確認して。

優先順位をつけて教えて。

誰かが質問してきたら、できるだけ詳しく調べて、返信の下書きを作成して。でも、直接送信しないでね。

コンピューターに戻ったときには、最も時間のかかる「背景情報の収集」作業はたいてい終わっています。人間であるあなたは、最終的に送信するかどうかの決断を下すだけで済みます。

スレッド自動化は「フィードバックループ」の処理にも最適です。PR や Google ドキュメント、Slack 上のコメントを静かに監視し、あなたが離席している間に、関連する修正を自動的に進めることができます。

アニメーション制作のシナリオを想像してみてください。レビュアーが Slack に動画を投稿します。スレッド自動化は定期的に議論の進行状況をチェックし、修正提案が届き次第、自動的に新しいバージョンをレンダリングし、元のスレッドでレビュアーを @メンションして新しい動画を返信します。もしソフトウェアの連携インターフェースが最終的なアップロードを自動で完了できない場合は、「デスクトップ自動化」を動員して、GUI 経由で最後のステップを完了させることさえ可能です。

この完全なクローズドループは、フィードバックを受け取る Slack、レンダリングを行うコードベース、そして最終アップロードを行うデスクトップ自動化ツールにまたがっています。

ゴール

タスクに明確なゴールがあり、AI エージェントがその目標に向かって継続的に作業できる場合、ゴールの力は真に爆発します。

ゴール: 明確な終了条件を持つ、より長期間実行される Codex タスク。AI は一定期間、そのゴールに向かって走り続けます。

悪いゴールの設定例:

この Markdown ファイルの計画を実行して。

良いゴールには、測定可能な成功基準が含まれていなければなりません。

例えば、内部ツールを Python から Rust に移行したいエンジニアは、新しいディレクトリを設定し、ゴールを設定し、明確な終了線を引くことができます。

この新しいバージョンの開発は、すべての単体テストが合格した時点で完了とする。

ゴールの設定は、本質的に「継続的な実行」と「検証者」を組み合わせることです。人間であるあなたが、望ましい結果、いつ停止するかの条件、そして Codex がゴールに近づいているかどうかを判断するために使用するシグナルを定義します。

有用な検証者には以下のようなものがあります。

完全なテストケース一式
ベンチマークパフォーマンステスト
一貫して再現可能なバグ
検証マトリクス
常にパスしなければならないエンドツーエンドのワークフロー

野心は重要ですが、検証メカニズムのない野心は単なる願望に過ぎません。

サイドパネル

サイドパネル機能は、生成された作業結果をチャットウィンドウのすぐ隣に表示します。ファイルをエクスポートして、異なるソフトウェアを行ったり来たりする面倒はもうありません。その場でレビューできます。生成される結果はコードであることもあれば、スライド、PDF、ウェブページ、スプレッドシート、あるいはその他の生成物であることもあります。

この機能は、特に4種類の作業を処理するのに優れています。

生成されたアーティファクトの検査
修正が必要な領域への注釈付け
ウェブインターフェースの操作
コードやファイルに対する変更のレビュー

サイドパネルを使用すると、ユーザーは Markdown ドキュメント、スプレッドシート、データテーブル、プレーンドキュメント、スライドをその場で直接表示できます。既存のワークフローを中断することなく、ファイルの検査、注釈付け、修正を行うことができます。

スライドや PDF はダイアログボックスのすぐ隣に開いたままになり、いつでもレビューや修正を待っています。

アプリ内ブラウザにより、Codex はレンダリングされたウェブページを直接検査し、制御し、さらにはページ上であなたが行った注釈に直接応答することができます。ウェブページやファイルへのコメントはすべてこの作業ループ内に収まり、以前のように別々の引き継ぎタスクに分割する必要はもうありません。

ウェブページは、Codex にとって出力結果であると同時に、あなたが操作できるコントロールパネルにもなります。Codex はページを構築し、サイドパネルで開き、自分で検査し、バグを修正し、そして同じものをその場で継続的に反復・最適化できます。

以下のシナリオでは、サイドパネルが特に効果を発揮します。

単一の index.html を使用した軽量な静的表示
Storybook を実行して UI コンポーネントをレビュー
Remotion Studio を使用したコード生成アニメーション
ブラウザで表示するスライドプレゼンテーション
データ分析フローのためのデータアプリ

シンプルな index.html ファイルは、サーバーをセットアップすることなく、楽しいインタラクティブなアプリに変わります。さらに、スレッド自動化はこれらの静的ファイルを時間の経過とともに静かに更新できるため、戻ってきたときには常に最新の進捗があなたを待っています。

共有メモリ

これらの長期稼働スレッドが単一のチャットの境界を越えてメモリを共有できるようになると、その有用性は質的に飛躍します。

共有メモリ: 単一の会話の外部に保存される永続的なコンテキスト。将来の作業が、明確で追跡可能な情報に基づいて進められるようにします。

比較的安全なアプローチの1つは、これらの永続的なスレッドを Obsidian ボールトに「アンカー」することです。簡単に言えば、プレーンテキストファイルを保存するためのフォルダを作成します。これは簡単で、いつでも表示、修正、移動が容易で、長期間持続します。チームはこのフォルダを、Git、Dropbox、Google ドライブ、その他の同期ツールなど、任意のクラウドドライブに配置できます。

ボールトは次のようになります。

[text]

vault/

├── TODO.md

├── people/

├── projects/

├── agent/

└── notes/

ルートディレクトリには、AGENTS.md ファイルを配置できます。ここで、Codex のルールを設定します。つまり、人物、プロジェクト、決定事項、TODO について新しいことを学習した場合に、このボールトをどのように更新すべきかを指示します。

特定のボールト構造を盲目的にコピーしないでください。あなたがすべきことは、AI エージェントを「教育」することです。つまり、永続的なコンテキストをどこに置くべきか、どのコンテキストを保持する必要があるか、そしてファイルをいつ改変してはいけないかを教えるのです。

実用的な AGENTS.md ガイドは、次のように記述されるかもしれません。

~/vault をあなたの長期記憶領域として扱ってください。
ノートは整理整頓するように心がけ、断片的な記録が散らばらないようにしてください。
TODO、人物、プロジェクト、日次サマリー、ドラフトを正確に分類してください。
下された決定、遭遇した障害、責任者、日付、有用なリンクを適切に保存してください。
実質的な新しい進捗がない限り、ボールト内のファイルをむやみに変更しないでください。

コードベースはコードを保存するためのものです。このボールトは、進行中のコンテキストを保存するためのものです。誰が関わっているか、何が変更されたか、どこで行き詰まっているか、誰が次にフォローアップするか、そして2つのチャットの間で途切れてしまうと完全に失われてしまうような詳細情報を保存します。

重要なコンテキストを、決して単一のチャットのテキスト記録だけに閉じ込めてはいけません。それらを書き留め、次のスレッドがすぐに引き継げる場所に置いてください。

Codex 自体も、公式のメモリ機能を設定 > パーソナライゼーション > メモリに提供しています。これらは組み込みのローカルメモ帳のようなもので、あなたの個人的な好み、一般的なワークフロー、よく遭遇する落とし穴を記憶するために使用されます。ただし、この機能はあなたが明示的に書き留めたコンテキストを補完するためのものであり、置き換えるものではありません。Chronicle メモリコンポーネントも同様の論理に従い、Codex が画面上で最近起こったことからメモリを抽出して構築するのを支援します。

コードから外へ

Codex はコードを書くことを主な役割として始まりましたが、現在ではコードを取り巻く多くの周辺タスクをこの同じシステム内で処理できるようになりました。MCP サーバー、ウェブインターフェース、デスクトップ制御、スレッド自動化、そしてサイドパネルで直接レビューできるファイルなど、その範囲は多岐にわたります。

これは私たちの制御方法を完全に変えます。「タスクの方向転換」は行動の途中で割り込み、「タスクのキューイング」は次のステップを手配し、「スレッド自動化」は私たちがいない間もシステムを稼働させ続け、「ゴール設定」は明確な終了線を引いて、Codex がどこに向かって走り続けるべきかを示します。

今日の Codex は、すでに完全なワークフローを実行できます。指示を聞き、タスクを実行し、最終的なファイルのレビューに至るまで。たとえこれらのタスクがコードベースの範囲をはるかに超えていたとしても、Codex はそれらを難なく処理します。

永続的なスレッド

音声入力

タスクの方向転換とキューイング

ツールとリーチ

どこからでも作業可能

自動化

ゴール

サイドパネル

共有メモリ

コードから外へ

Use YouMind to read viral articles deeply

最近のバイラル記事

60 Claude Opus 4.8 Workflows That Make Money While You Sleep

Scaling Laws, Honestly

Porting Fable 5 Behavior to Sonnet: Everything Needed Was in the Official Anthropic Docs

No Foreign Card Needed: Two Steps to Securely Subscribe to Claude Codex and Set Up a Private VPN

I Gave My Second Brain 1,500 Conversations and It Changed Everything

How To Build Your Own LLM from Scratch (The 5-Stage Pipeline Behind GPT and Claude)

Codex を最大限に活用する方法：公式チームからのインサイト

永続的なスレッド

音声入力

タスクの方向転換とキューイング

ツールとリーチ

どこからでも作業可能

自動化

ゴール

サイドパネル

共有メモリ

コードから外へ

Use YouMind to read viral articles deeply

あなたの Markdown をきれいな 𝕏 記事に

最近のバイラル記事

60 Claude Opus 4.8 Workflows That Make Money While You Sleep

Scaling Laws, Honestly

Porting Fable 5 Behavior to Sonnet: Everything Needed Was in the Official Anthropic Docs

No Foreign Card Needed: Two Steps to Securely Subscribe to Claude Codex and Set Up a Private VPN

I Gave My Second Brain 1,500 Conversations and It Changed Everything

How To Build Your Own LLM from Scratch (The 5-Stage Pipeline Behind GPT and Claude)