ワンコマンドでインストール。ワンログインで起動。2 週目には、教えたことのないワークフローを自動で構築する。
リスボン在住の 29 歳のフリーランス自動化コンサルタントは、クライアント向けに「文字起こしの取得」「投稿の下書き」「受信箱の整理」という同じ 3 つの作業に毎晩時間を費やしていた。3 月、彼はこれらすべてを、1 台の $5 VPS で動作する単一のエージェントに移行した。彼はスマートフォンの Telegram からそのエージェントに指示を送る。ラップトップを閉じていても、エージェントは動き続ける。
そのエージェントの名は Hermes。Nous Research によって開発された。Hermes は、学習ループを内蔵した唯一のエージェントである。5 ステップ以上のタスクを実行すると、その方法をスキルファイルに書き出し、次回以降に再利用する。彼の声、フォーマット、チェック項目は一度保存され、それらがずれるたびに修正される。モデルのファインチューニングは不要だ。フォルダを 1 つ与えるだけでよい。
1. Hermes とは何か、一言で表すと
経験からスキルを生成し、自身の過去のセッションを検索し、会話を超えてあなたの仕事の仕方のモデルを構築する、自己改善型エージェント。$5 VPS、GPU ボックス、あるいはアイドル時にはほとんどコストがかからないサーバーレス環境で実行できる。任意のモデルを指定可能:Nous Portal、OpenRouter、OpenAI、または独自のエンドポイント。hermes model で切り替えられ、コードの変更は不要。
2. ワンコマンドでインストール
Mac または Linux の場合:
curl -fsSL
Windows には PowerShell インストーラが、スマートフォンには Termux 経由のインストール方法が用意されている。インストール後、すぐに hermes doctor を実行しよう。プロバイダ設定の欠落、環境変数の破損、パスの誤りを、タイポで 1 時間を無駄にする前に特定してくれる。
3. ワンログインで起動
hermes setup --portal を実行する。1 回の OAuth で、1 つのモデルと 4 つのツール(Web 検索、画像生成、テキスト読み上げ、クラウドブラウザ)をカバーする。5 つの API キーを個別に収集する必要はない。ツールごとに独自のキーを使いたい場合は、hermes setup を実行して完全な手順に従うか、あるいは Blank Slate を選択してターミナルとファイルツールのみで開始し、残りは自分で有効にすることもできる。
4. 思考の余地のあるモデルを与える
Hermes は起動時に、コンテキストが 64,000 トークン未満のモデルを拒否する。ウィンドウが小さすぎると、マルチステップのツール呼び出しジョブを処理できない。Claude、GPT、Gemini、Qwen、DeepSeek はすべてこの基準をクリアしている。ローカルモデルを実行する場合は、コンテキストを最低 64K に設定しよう。
5. 2 つの方法で実行する
ターミナル:hermes またはモダンなインターフェースには hermes --tui。ゲートウェイ:hermes gateway で Telegram、Discord、Slack、WhatsApp、Signal、メールに対応。どちらも 1 つのセッションデータベースを共有する。デスクでジョブを開始し、電車の中でスマートフォンから完了させる。同じメモリ、同じスキルが使える。
6. 作業をスキルとして教える
スキルはプレーンな知識ファイルである。~/.hermes/skills/ に配置すれば、登録なしで即座に有効になる。エージェントが必要としたときだけ読み込まれるため、使用されるまでトークンを消費しない。hermes skills list で一覧表示し、hermes skills install で Hub からさらにスキルを取得できる。困難なタスクの後、Hermes はその方法をスキルとして自動保存することを提案する。そのループを監視したい場合は、write_approval: true を設定し、書き込まれるすべてのスキルを承認しよう。
7. 作業を分割させる

delegate_task ツールは、それぞれ独自のツールセットとクリーンなコンテキストを持つサブエージェントを生成する。1 つが調査し、1 つが下書きを作成し、1 つがレビューする。これらはすべて同時に実行される。各サブエージェントは新しい状態で開始するため、必要なものはすべてあらかじめ渡しておく必要がある。頻繁に利用するクライアントには、プロファイルを活用しよう。1 台のマシン上で、エージェントごとに個別の設定、キー、メモリ、Telegram ボットを設定できる。
8. スケジュールを設定する
内蔵の cron 機能が、インターバルでジョブを実行し、結果を任意のプラットフォームに配信する。フォルダ内の新しいファイル、朝 7 時のブリーフィング、週次レポート。どれもボタンを押す必要はない。ターミナルツールを Docker バックエンドと組み合わせると、永続的なサンドボックスのように動作する。パッケージを一度インストールすれば、セッション中はそのまま残る。
9. 何に活用するか
- コンテンツ:yt-dlp で文字起こしを取得し、スキル内で投稿を作成し、公開前に承認のために Telegram に下書きを送信する。
- 受信箱とカレンダー:メールやメッセージング経由で、読み取り、整理、下書き返信、スロット予約を実行する。
- リサーチ:サブエージェントを複数の情報源に展開し、要約を 1 つのレポートに集約する。
- コード:
github-pr-workflowスキルを通じて、リポジトリ全体のコードレビュー、リファクタリング、実行を実行する。 - ドキュメント:50 の PDF を読み込み、数値を抽出し、構造化されたブリーフを返す。
10. どのように収益を得るか

セットアップそのものではなく、アウトプットを販売しよう。3 つの具体的な方法:
- 代行自動化。クライアントの受信箱から CRM へのフローや予約フローを一度構築し、セットアップ費用と継続的なリテーナーを請求する。エージェンシーは、これらの構築に対して、1 件あたり数百ドルから数千ドルで価格設定している(自己報告ベース)。
- コンテンツ制作。顔出しなしのチャンネルやクライアントの投稿パイプラインを、動画入力から投稿出力までエンドツーエンドで運用する。
- 製品化されたスキル。ワークフローをスキルとしてパッケージ化し、Skills Hub を通じて他のユーザーがインストールできるように共有する。
これが持続可能な理由となる計算式:エージェントは $5 のサーバーで稼働し、サブエージェントを調整するコードのトークンコストは 0、モデル呼び出しのコストのみが発生する。固定費は低く抑えられ、作業は複利的に積み上がっていく。
エージェントは疲れることなく、昨日学んだことを決して忘れない。
お読みいただきありがとうございます
もしこの記事が、試行錯誤に費やす週末を 1 つでも節約してくれたなら、それこそが本意です。今後のビルドログや公開するスキルをフォローしていただき、`hermes setup` を自ら実行する日のために、このページをブックマークしておいてください。何かを作り上げたら、ぜひそのエージェントが何を学んだのか教えてください。





