
2026 年版:マルチエージェント・コーディング・スタックの構築方法(完全コース)
AI features
- Views
- 772K
- Likes
- 760
- Reposts
- 108
- Comments
- 55
- Bookmarks
- 2.6K
TL;DR
本ガイドでは、大量のコーディングタスクには Kimi K2.6 を、複雑な推論には Claude を活用することで、開発者のワークフローを最適化し、低コストで最高レベルの成果を上げる方法を解説します。
Reading the 日本語 translation
誰もが最高の AI コーディングエージェントについて議論している
これを保存しておいてください :)
Claude Code のファンは Claude を支持し、Cursor のファンは Cursor を支持し、GPT のファンは GPT を支持します。誰もがまるで宗教のように自分の陣営を選び、そこに留まります。
一方で、実際に最も多くの作業を出荷している開発者は、単一のツールに忠誠を誓っていません。彼らは複数のエージェントを実行し、各タスクを最も低コストで最高の出力を得られるエージェントに振り分けています。
言われてみれば当然のことのように聞こえます。
しかし、実際にそれを実践している人はほとんどいません。
私も約 2 週間前までは実践していませんでした。すべてを Claude Code で実行していました。テストの作成、モジュールのリファクタリング、ボイラープレートの生成、API の構築、すべてを Claude で行っていました。そして、その作業品質は素晴らしいものでした。品質に関してはまったく不満はありません。
問題は請求額でした。
エージェンティックなコーディングタスクを毎日、終日実行すると、トークンコストは急速に積み上がります。そして、入力トークン 100 万あたり $5、出力トークン 100 万あたり $25 という価格では、「毎日終日」は、エージェントに任せる作業を制限せざるを得なくなるほど高額になります。それでは、そもそもの意味がありません。
そこで、私はオープンソースの代替手段を探し始めました。Claude を置き換えるためではありません。Claude レベルの推論が必要なく、実際に必要なものに対して過剰に支払っていた 80% のタスクを処理するためです。
その探求は、私が予想していなかったものへと私を導きました。
私が見つけたもの(そして、なぜそれをほとんど無視したのか)
正直に言います。誰かが最初に Kimi K2.6 を見てみるよう勧めてきたとき、私はほとんどそれを却下するところでした。北京の Moonshot AI によるコーディングモデル? 疑念がありました。
それからベンチマークを見ました。
Kimi K2.6 は SWE-Bench Verified で 80.2% を記録しました。Claude Opus 4.6 は 80.8% でした。GPT-5.2 は 80.0% でした。
これらの数値は実質的に同じです。価格が 7 倍も異なるモデルを、わずか小数点以下の差で分けているだけなのです。
次に、OpenRouter のプログラミングリーダーボードを見ました。Kimi K2.6 は #1 に位置していました。
そして価格を見ました。入力トークン 100 万あたり $0.80。出力トークン 100 万あたり $3.60。
疑念は消えました。
このモデルには、Kimi Code と呼ばれるターミナルファーストのコーディングエージェントが付属しています。オープンソース。Apache 2.0 ライセンス。GitHub に完全なソースコードがあります。
検査、修正、セルフホスティングが可能です。全体が Claude Code と同じようにターミナルから実行されます。
インストールして、実際のプロジェクトに向け、テストを開始しました。
実際のセットアップ方法
インストールは煩わしいほど簡単です。
Python 3.10+ が必要で、それだけです。1 つのコマンドで完了します。
bash
1pip install kimi-code
その後、起動します:
bash
1kimi
これで完了です。初回は /login を実行して認証するよう求められます。その後は、毎回のセッションが即座に開始されます。
また、マーケットプレイスから VS Code 拡張機能もインストールし、エディター内で使用できるようにしました。Zed をネイティブサポートし、ACP を介して Cursor や JetBrains とも統合できます。つまり、どのようなセットアップでも適合します。
合計セットアップ時間:5 分未満。
2 週間のテスト
実際のテストを行いました。おもちゃのプロジェクトではありません。「ToDo アプリを書いて」ではありません。実際のワークフローからの実際の作業を投入しました。
以下が、実際に試した内容とその結果です。
テスト 1:ゼロから完全な REST API を構築
データベースモデル、認証、CRUD エンドポイント、エラーハンドリング、テスト。通常、Claude で 2 〜 3 時間のエージェント時間を消費する種類のタスクです。
Kimi Code はまず全体の構造を計画しました。次に、以前の自身の決定を参照しながら、ファイルごとに実行しました。幻覚のインポートはありません。壊れた依存関係はありません。互いに矛盾するファイルもありません。
K2.6 には、コードを書く前に問題を推論する思考モードがあります。この計画ステップが違いを生みます。ただ生成を開始するのではなく、まず設計を行います。結果は、大規模なクリーンアップではなく、微調整のみが必要な動作する API でした。
テスト 2:12 ファイルにわたるモジュールのリファクタリング
これは、ほとんどのコーディングエージェントが完全に失敗するポイントです。ファイル 3 で何かを変更した結果、ファイル 7 が壊れたり、既に変更した内容を見失ったりします。
K2.6 は、全体を通して一貫性を保ちました。これまで見慣れていたものと比較して、平均ステップ数が約 35% 削減されました。不要なステップが減れば、消費されるトークンが減り、コスト削減効果はさらに大きくなります。
テスト 3:既存のコードベース用のテストスイートを生成
単純作業です。まさに Claude で過剰に支払っていた種類のタスクです。Kimi Code はそれをきれいに処理しました。派手でも革命的でもありません。ただ、コストを大幅に抑えつつ、堅実で一貫した出力を提供しました。
2 週間後の結論: 日常のコーディングタスクの約 85 〜 90% において、出力品質は以前得ていたものと機能的に見分けがつきませんでした。残りの 10 〜 15%、深く複雑なアーキテクチャ推論タスクについては、今でも Claude に振り分けています。
作業の大部分における 85% のコスト削減は、漸進的なものではありません。それは私の運用方法を変えました。
何時間も節約してくれた MCP のトリック
ここが、移行をほぼ摩擦のないものにした部分です。
Kimi Code は Model Context Protocol を標準でサポートしています。完全な MCP 互換性です。そして、設定形式は既に使用しているものと互換性があります。
そのため、Claude Code や他のツールから既存の MCP 設定を持っている場合、1 つのコマンドで移行できます:
bash
1kimi --mcp-config-file your-existing-config.json
すべての MCP サーバー、すべてのツール接続、すべてが即座に転送されます。
または、サーバーを個別に追加することもできます:
bash
1kimi mcp add --transport http context7 <https://mcp.context7.com/mcp>
接続状況を確認:
bash
1kimi mcp list
接続をテスト:
bash
1kimi mcp test context7
ツールエコシステム全体がそのまま移行できます。 これが、これが単なる孤立した実験ではないと気付いた瞬間でした。それは、私が既に構築していたすべてのものに直接接続されました。
毎日使っているワークフローコマンド
エージェント内に入ると、これらが日々実際に重要となるコマンドと機能です:
Ctrl-X - シェルモードを切り替えます。エージェントを離れずに任意のターミナルコマンドを実行できます。ウィンドウの切り替えは不要。コンテキストの損失もありません。小さな機能に聞こえますが、これは画期的です。
/sessions - セッションを表示および切り替えます。「毎回最初からやり直す」ではない、真のセッション管理です。
--continue - 最後のセッションを中断したところから正確に再開します。
/compact - これは過小評価されている機能です。コンテキストウィンドウがいっぱいになりそうなとき、/compact はエージェントに会話履歴を要約させ、重要な情報を保持します。スペースを解放し、新しいセッションを開始せずに作業を続けられます。ステータスバーにコンテキスト使用状況インジケーターがあるので、いつ使用すべきか常に把握できます。
kimi --yolo - すべてのファイル変更を自動承認します。エージェントの動作を信頼し、最大速度を求める場合にのみ使用してください。未知のコードベースでは危険です。自身のプロジェクトでは驚くほど効果的です。
kimi acp - IDE 統合用の ACP モードで起動します。Zed や JetBrains を使用している場合、これが接続方法です。
私の期待をはるかに超えた機能
Agent Swarm について話す必要があります。これは、現在ほとんどの開発者が使用しているツールには真の同等品がない機能だからです。
Agent Swarm により、K2.6 は複雑なタスクで最大 100 のサブエージェントを並行して調整できます。順次ではなく、並行してです。
私が驚愕したユースケース:誰かが 40 の学術 PDF を投入し、完全に引用されたデータセット付きの 10 万語の文献レビューを、たった 1 回のセッションで得たのです。
現在人々が実行している他の実際の例:
- 100 件の求人情報を処理し、100 件の個別に調整された履歴書を作成
- 1 つの天体物理学論文を、20,000 行のデータセットと 14 の出版品質のチャートを備えた 40 ページのレポートに変換
- 1 つのプロンプトで、実際の歴史的な見出しを持つ 10 のタブロイド誌の表紙を生成
これは、通常はカスタムスクリプト作成と数時間の手動オーケストレーションを必要とするレベルのバッチ処理です。それが、たった 1 つのプロンプトで実現します。
Agent Swarm は現在、Web インターフェースで実行でき、CLI サポートも準備中です。大量のファイル、ドキュメント、またはデータの処理を含むワークフローがあれば、これだけで時間を費やす価値があります。
誰も語らない部分:デザインセンス
フロントエンド機能をテストする予定はありませんでした。バックエンドとツールに焦点を当てていました。しかし、私のフィードで誰かが K2.6 で構築したポートフォリオサイトを投稿しており、それが AI 生成とは信じられませんでした。
そこで、Kimi のエージェントインターフェースを通じて自分でテストしました。
K2.6 は GLSL シェーダー、WebGL、Three.js を記述します。デザインの語彙を理解しています。「ブルータリズム」や「リキッドメタル」、「シネマティック」と言えば、出力は実際にそれらの美学に一致します。一般的な AI の粗製濫造的な方法ではなく、人間のデザイナーが構築したように見える方法で。
生成される Web アプリには、データベースと認証が自動的に配線されて組み込まれています。静的なページを得るのではありません。実際のバックエンド配管を備えた機能的なアプリケーションを得るのです。
シェーダーベースのヒーローアニメーションを備えたポートフォリオサイトを構築するよう依頼しました。一発で。その出力は、デザインスタジオからなら数千ドルかかるでしょう。
この瞬間、私は K2.6 を「単なるコーディングモデル」として考えるのをやめました。それはフルスタックのクリエイティブツールです。
現在の実際のスタック
このセットアップを 2 週間実行した後の、私のワークフローは次のとおりです:
高ボリュームのコーディング作業(リファクタリング、テスト、ボイラープレート、API、ドキュメント、ファイル処理)の場合 - Kimi Code に振り分けます。これは日常業務の約 85% を占めます。出力品質は必要なものに一致します。コストは以前支払っていた額のほんの一部です。
複雑なアーキテクチャ推論(深いマルチエージェントオーケストレーション、最大の信頼性を必要とする非常に長いエージェンティックループ、斬新なシステム設計)の場合 - Claude に振り分けます。これが残りの 15% です。Claude は依然として最も難しい推論タスクで優位性があり、必要なときにその代価を払うことに何の問題もありません。
バッチ処理(大量のファイル、ドキュメント、または並列実行を含むタスク)の場合 - Agent Swarm を使用します。私のスタックでこれを実行できるものは他にありません。
総合結果: 週間 API 支出は約 85% 減少しました。エージェントの使用を制限するのをやめたため、出力量は増加しました。より多くのものを、より速く、より低コストで出荷しています。
これは「最高の」ツールを見つけることではありません。すべてのタスクが適切なツールで適切なコストで実行されるスタックを構築することです。
正直な評価
率直にお伝えします。皆さんにその価値があると思うからです。
K2.6 が明らかに勝っている点:
- コスト。Opus 4.7 より 7 倍安い。GLM-5.1 よりほぼ 50% 安い。同じパフォーマンスレベルで。これは議論の余地がありません。
- オープンソース。Hugging Face で完全な重みを公開。Apache 2.0。必要ならセルフホスト。必要なら修正。ベンダーロックインはありません。
- バッチ処理。Agent Swarm には、現在 Claude や GPT のエコシステムに真の同等品はありません。
- フロントエンドデザイン。生成される Web アプリケーションの美的品質は、真にクラス最高です。
- 効率性。K2.5 と比較して、同じ結果に到達するまでのステップ数が 35% 減少。ステップ数が減ればトークンが減り、コストが削減されます。
Claude が依然として勝っている点:
- 最も複雑な英語の指示に従う能力。タスクが、数百のエージェンティックステップにわたる非常に詳細な制約への完全な準拠を必要とする場合、Claude の方が依然として信頼性が高いです。
- エコシステムの成熟度。Anthropic の開発者エコシステムは、西側ではより確立されています。
- コンテキストウィンドウ。Claude は最大 100 万トークンを提供します。K2.6 は 262K を提供します。ほとんどのタスクでは 262K で十分以上です。大規模なコードベース分析には、Claude に利点があります。
本当に互角の領域:
- SWE-Bench および標準的なコーディングベンチマーク。数値は互いに小数点以下の範囲内です。ここで勝者を宣言するのは不誠実でしょう。
本当の問いかけ
2026 年の AI コーディングエージェント市場は、忠誠心に関するものではありません。レバレッジに関するものです。
オープンソースモデルが同じ出力を提供するのに、プレミアム価格の API を通じて日常的なコーディングタスクを実行するのに費やす 1 時間 1 時間が、あなたが燃やしているお金です。
今年、先を行く開発者は、マルチエージェントスタックを構築する人々です。適切なタスクに、適切な価格で適切なツールを。チームを選んで他を見ようとしない人々ではありません。
2 週間前、私はコーディング作業の 85% に対して、必要以上の 7 倍の金額を費やしていました。
今は違います。
ツールはそこにあります。ベンチマークは公開されています。セットアップには 5 分かかります。
唯一の問いは、自分でテストするのか、それとも他の全員が先にテストするのを待つのか、ということです。
これを読んでいるほとんどの人は、すべてのタスクに全額を支払い続けるでしょう。真のスタックを構築する人々は、30 日以内に彼らの周りを何周も先に走っているでしょう。
私は主要な AI ツールとワークフローをすべて解説しているので、皆さんが一人で理解する必要はありません。
私をフォローしてください @eng_khairallah1 。開発者ツール、ワークフロー、テクニックの詳細を提供しています。無駄は一切なし。本当に使えるものだけです。
これがお役に立てば幸いです、Khairallah ❤️


