Claude Proに加入して「multi-agent-shogun」を導入してみた — AI足軽10体が戦国口調で並列作業する世界

もともとAIはChatGPTの有料プランをメインに使っていたのですが、日本語の文章生成の自然さでClaudeの無料アカウントも併用していました。ただ無料プランだと使えるモデルに限りがあって、より高性能なOpusモデルやClaude Codeをちゃんと試したいなとずっと思っていたのですが、先日ついにClaudeのProプランに加入しました。

Claude Codeを入れたら、ずっと気になっていた「multi-agent-shogun」をついに動かしてみた、というのが今回の話です。数ヶ月前に制作者のおしおさんの記事を読んだのがきっかけで、「将軍に命令したら足軽が並列で動く」という仕組みにかなり惹かれていたのですが、当時はまだマルチエージェント(複数のAIを同時に動かして作業させる仕組み)自体が珍しかったし、そもそもClaude Codeの導入すらしていなかったので見送っていました。

もう一つ興味を引いたのが、エージェント同士がお互いの成果物をレビューできるという仕組みです。これって文章制作でもかなり使えるんじゃないかと。「書く→別のエージェントがチェック→修正」が自動で回るなら、さまざまな場面で活用できそうだなと思ったのが最終的な動機でした。 結果としてChatGPTにREADMEを読ませながらサポートしてもらい、つまずきつつも数時間でスマホからの接続まで到達できたので、経緯をまとめておきます。

そもそもmulti-agent-shogunって何?

multi-agent-shogunは、Claude Codeをベースにした無料・オープンソースのマルチエージェントフレームワークです。名前の通り戦国時代の軍制がモチーフになっていて、AIエージェントに「将軍」「家老」「足軽」「軍師」という役割を振って、複数のタスクを同時に処理させる仕組みになっています。 構成はこんな感じです。

役職人数役割
上様(人間)1人将軍に自然言語で命令を出すだけ
将軍(Shogun)1体命令を受けて作業指示に変換し、家老に渡す
家老(Karo)1体指示を細かく分解して足軽に割り振る
足軽(Ashigaru)7体実作業を並列で実行する働き手
軍師(Gunshi)1体難しいタスクの戦略立案や品質チェック

人間がやることは将軍に「これやって」と命令するだけ。あとは家老が「誰に何をやらせるか」を自動で判断して足軽に展開してくれます。軍師は難易度が高いタスクを専門で受け持つ参謀的な存在で、他の足軽が作った成果物の品質チェックも担当するみたいです。

ちなみに全員が戦国口調で報告してきます。「承知つかまつった!」「任務完了でござる!」「切腹を免れ…」という感じで、見ていて普通に面白いのですが、これが単なるネタではなく、通知が来たときに「あ、これはエージェントのステータス報告だな」とすぐ分かるという副産物もあります。出力結果なのか報告なのかが一目瞭然になるのは、地味にありがたいなと。

何が面白いのか

個人的に「これはすごいな」と思ったポイントが2つあります。

まず、調整のためのコストがかからないこと。

普通、複数のAIエージェントを連携させると「誰が何をやっているか確認する」だけでAPIの利用料が発生するのですが、Shogunではエージェント同士のやりとりがディスク上のファイル(YAML=設定ファイルの一種)とtmux(ターミナル画面を複数に分割して同時表示できるツール)のコマンドだけで完結しています。つまり10体動かしても、課金されるのは実際の作業分だけ。

おしおさんの記事によると、もし定期的にタスクを確認しに行く方式にしていたら1日5万回以上のAPIコールが発生して破産するところだったそうで、このあたりの設計はかなり考えられているなと感心しました。

もう一つが、全エージェントの動きがリアルタイムで見えること。

tmuxの各画面に足軽たちが割り当てられていて、それぞれが何をやっているかが丸見えになっています。中で何が起きているか分からないブラックボックスにならないのは安心感があります。おしおさんが「一生見ていられる」と書いていたのですが、実際に動かしてみると確かにワチャワチャ動いている足軽たちを眺めているだけでけっこう楽しい。

さらに、作業中に繰り返しパターンを検知すると「これSkill化したら便利じゃないですか?」と提案してくる機能もあるそうで、普通に仕事をぶち込んでいるだけで勝手にナレッジが蓄積されていく仕組みになっています。

おしおさんの記事にあった「属人化の解消が仕事してるだけで勝手に実現される」という話は、なるほどなと思いました。

また、おしおさんの最初の記事はZennでかなりバズっていたのですが、技術記事というより読み物として面白いですよ。

Claude Code公式のエージェント機能とどう違う?

じつはClaude Code自体にも公式のマルチエージェント機能があって、「サブエージェント」と「Agent Teams」の2つが用意されています。

最初におしおさんの記事を読んだ数ヶ月前はまだAgent Teams自体がなかったのですが、2026年に入ってから急速に整備されてきた印象です。せっかくなので違いを整理してみました。

項目サブエージェントAgent Teams(実験的)multi-agent-shogun
構造1つのセッション内で別のAIに委任複数セッションが共有タスクリストで連携将軍→家老→足軽+軍師の階層構造
同時に動ける数基本1つずつ(逐次)複数(チームメイト単位)最大10体が同時稼働
AI同士の連携親に結果を返すだけ。AI同士は会話不可共有リスト+直接メッセージでやりとり可能ファイル+tmuxコマンドでやりとり
連携にかかるコストAPIコールが発生トークン消費が通常の3〜4倍ほぼゼロ(ファイル+tmux)
動いてる様子が見えるかログのみtmux対応(オプション)全画面がリアルタイムで丸見え
対応するAIツールClaude CodeのみClaude Codeのみ4種類(Claude Code / OpenAI Codex / GitHub Copilot / Kimi Code)
スマホから操作不可不可Androidアプリあり
品質チェックなしチームメイト間で可能軍師が品質チェックを担当
料金ProまたはMax契約内(※注)ProまたはMax契約内(消費が大きい)ツール自体は無料(OSS)。AIの利用料は別途必要

※ Claude CodeはProプラン(月額$20)でも使えます。ただし使用量の上限はMaxより少なく、Maxには5x(月額$100)と20x(月額$200)の2段階があります。最新情報は公式の料金ページでご確認ください。

ざっくり言うと、サブエージェントは手軽だけど1つずつしか動かせないしAI同士で会話ができない。Agent Teamsは直接やりとりできるけど、まだ実験的機能でコストが大きい。Shogunはファイルという「手紙」でやりとりする設計のため連携コストが小さく、しかも全員の動きが見えるという作りになっています。

個人的にShogunに惹かれた一番の理由は、さっきも書いた内部でレビューが回るという点です。軍師が品質チェックを担当してくれるので、たとえば「文章を書く→軍師がチェック→修正」みたいなサイクルを自動で回せるんじゃないかと。サブエージェントだと親にしか報告できないので、こういうクロスチェックの仕組みは作りにくいんですよね。

ChatGPTの利用枠でGPTモデルも使えるか聞いてみた

比較表で「対応するAIツール」が4種類あると書いたのですが、その中にOpenAI Codex CLIが含まれています。ChatGPTの有料アカウントを持っているので、できればその利用枠の中でGPTモデルもShogunの足軽として使えたら嬉しいなと。

Claude Proの利用枠だけだと心もとないので、一部の作業をGPT側に回せれば負荷分散にもなりそうです。 で、この件をChatGPTに聞いてみました(ShogunのREADMEを読ませた上での相談です)。

回答をざっくりまとめると、同じUbuntuユーザー環境でCodex CLIにサインイン済みなら、Shogunからもそのまま使える可能性が高いとのことでした。

Codex CLIは初回起動時にChatGPTアカウントで認証して、その情報をローカルに保存する仕組みになっているため、Shogunが同じ環境から codex コマンドを呼ぶなら保存済みの認証がそのまま使われるそうです。 確認方法もシンプルで、Ubuntuのターミナルで codex と打ってみて、追加のログインを求められなければOKとのこと。逆にログイン画面が出るなら、まだUbuntu側ではサインインできていないということになります。

ただし注意点もあって、Windows側でCodexにサインインしていてもWSLのUbuntu側には共有されないケースがあるらしいです。認証情報の保存場所がOS環境ごとに分かれているため、というのが理由みたいなのですが…ここはまだ実際に試していないので、動かしてみた結果はまた別途書こうと思います。

ちなみに最近知ったのですが、Claude Code本体にも「LLM Gateway」という仕組みがあって、環境変数を書き換えるだけで接続先をAnthropic以外のLLMに向けられるようになっているそうです。LiteLLM Proxy(APIの形式を自動的に変換してくれる中間サーバー)を挟めば、GPT系やGemini、さらにはローカルで動かすオープンソースのLLMにもルーティングできるみたいで。つまり将来的にはShogunのマルチCLI対応を使わなくても、Claude Code単体で複数のLLMを使い分けるマルチエージェント環境が作れる可能性があります。ただ、設定がそれなりに必要そうだし、ChatGPTの有料プラン枠がそのまま使えるかどうかは別の話なので、このあたりはもう少し情報を追ってみたいところです。

導入してみた — つまずきポイント3つ

環境はWindows+WSL2(Windowsの中でLinuxを動かす仕組み)で、Claude Codeは入れてある状態からスタートしました。ChatGPTにGitHubのREADMEを読ませて「次は何をすればいい?」と聞きながら進めたのですが、素直に一発で入るタイプではなかったです。

1. Windowsのフォルダで作業してたらエラーが出る

最初の大きなつまずきがこれでした。READMEのWindows向け手順では C:\tools\multi-agent-shogun にファイルを置く流れになっているのですが、セットアップ中にPythonの仮想環境(venv)を作る工程でエラーが出ます。

しかもエラーメッセージが「python3-venvが必要かもしれません」と案内してくるので、最初はその通りにパッケージを入れ直したりして無駄に時間を溶かしてしまいました。

ChatGPTに状況を説明したところ「WSLからWindows側のフォルダ(/mnt/c/配下)を使うと権限周りの問題で動かないことがある。Linux側のホームに移してみたら?」と言われて、プロジェクトをUbuntu側の ~/tools/multi-agent-shogun に移したら通りました。正直なぜそれで解決するのかは完全には理解できていないのですが(汗)、WSLでは「Windowsのファイルシステムを使うかLinuxのファイルシステムを使うか」で挙動が変わるらしい、くらいの理解です。Windowsユーザーは要注意なポイントだと思います。

2. dashboard.mdは「見るもの」だった

これは完全に自分の勘違いなのですが、READMEに「ダッシュボードで進捗確認できる」と書かれていたので、何かコマンドを打てばダッシュボードが起動するのかと思っていました。 実際にはdashboard.mdはただのマークダウンファイル(テキストファイルの一種)で、将軍システムを起動した後に家老が進捗状況を書き込んでいくためのファイルでした。

VSCodeのプレビュー機能で開いておけばリアルタイムで内容が更新されていくのが見える、という仕組みです(本命は3.に書かれているAndroidアプリでの確認でしょう)。

分かってしまえば単純なのですが、「ダッシュボード」という言葉から勝手にWebの管理画面みたいなものを想像してしまっていたので、最初はちょっと混乱しました。

3. Androidアプリに入れるパスを間違えていた

Shogunには専用のAndroidアプリ(コンパニオンアプリ)があって、スマホからSSH(リモート接続)でPCの将軍セッションに入れるのですが、接続設定でハマりました。

設定画面にホスト・ポート・ユーザー・プロジェクトパス・tmuxセッション名を入れるのですが、プロジェクトパスに C:\tools\... とWindows側のパスを入れていたのが間違いでした。 SSH接続先はWSLの中のLinuxなので、Linux側のパスを入れる必要があるわけです。今回だと /home/(ユーザー名)/tools/multi-agent-shogun が正解でした。ChatGPTに「パスが違うんじゃないか」と指摘されて直したら一発で通ったのですが、WindowsとWSLとSSHが絡むと「どこから見たパスなのか」がこんがらがりやすいです。

スマホから将軍セッションに入れた

外出先からもスマホで接続したかったので、Tailscale(端末同士を簡単にVPN接続できるサービス)を使ってみました。

ただ、WindowsとWSLで同時にTailscaleを動かすのは公式的に非推奨らしく、接続経路をどうするかで少し悩みました。結局のところChatGPTに相談しながら設定を整理した結果つながったのですが、自分で全部理解して解決したかと言われると正直怪しいです(笑)

ともあれ、最終的にはLAN内だけでなく外出先からもAndroidで将軍セッションに入れるところまでいけました。 おしおさんのAndroidアプリ記事にも書かれていたのですが、マルチエージェントの操作って「指示を出す」のがメインの仕事なので、スマホの音声入力との相性がかなり良いです。

image : おしお スマホアプリでエージェントタブを開いたところ

9つの画面を同時にモニタリングしたり、AIの利用量がどのくらい残っているかを確認するレートリミットモニターも付いていて、実用面でもよくできています。しかも戦国BGMまで付いてくる(笑)。

PCの前に座っていなくても「足軽の進捗確認して」とスマホに喋るだけで状況が分かるので、ここまで来るとちょっと感動します。

プログラミングしなくても使えるのか

Shogunは「コードを書くための開発ツール」という印象が強いかもしれませんが、おしおさんの記事を読み込んでいくと、実はかなりの割合がライティングや調べものに使われていることが分かります。

御前試合の記事では「足軽8人が日々さまざまなライティングタスクをこなしている。将軍が指示を出し、家老が采配し、足軽が書く。完全に会社」と書かれていて、SEO記事を7本同時に書かせるといった使い方が普通に行われていました。

つまりShogunの本質は「コードを書く道具」ではなく、「重い仕事を複数のAIに分業させる道具」なんだなと。プログラミングをしない場合でも、「調べる」「比べる」「書く」「チェックする」を同時に回せるのは、普通にAIチャットを1つ使うのとはだいぶ違う体験になりそうです。

ChatGPTにも同じ質問をしてみたところ、「Shogunを”AIの会議室”として使うのが一番しっくり来る」という表現が返ってきて、なるほどなと思いました。1人のAIに長々と考えさせるより、役割を分けて同時に動かすほうが、視点の偏りが出にくくなるという話です。 具体的にプログラミングなしで使えそうなパターンを、おしおさんの実例やChatGPTの分析も踏まえていくつか整理してみます。

1. 調べものの並列化

何かを調べるとき、1つのAIに全部聞くと回答が1方向に偏りがちなのですが、Shogunなら足軽ごとに切り口を変えて同時に調べさせることができます。たとえば新製品の紹介記事を書く前に、足軽1に公式サイトからスペックを整理させ、足軽2に競合製品の比較を、足軽3にSNSでの評判収集を、足軽4に過去の類似製品のレビュー傾向を、それぞれ同時に投げるイメージです。家老がそれをまとめてくれるので、リサーチフェーズがかなり圧縮できそうな気がします。

2. 企画や提案の壁打ち

ChatGPTが「一番相性がいい」と推していたのがこのパターンです。何か企画を考えるとき、賛成意見だけでなく「懸念点を洗い出す足軽」「実施コストを見積もる足軽」「反対意見を想定する足軽」を同時に動かすことで、1回のやりとりで多角的な検討ができるようになります。1人のAIに聞くと「いいですね!」で終わりがちなところを、わざと反対意見を出させる足軽がいるのは面白い仕組みだなと。

3. 長い文書の下準備

提案書、報告書などの長い文書を作る前に、構成案・要点整理・想定される質問・弱い部分の指摘を同時に出させるという使い方です。本文を全部書かせるより、骨組みと検証を並列で回して、最後に人間が仕上げるほうが精度が上がりそうです。

おしおさんのSkill一覧にも「記事ネタ発掘」「コンテンツ設計書出力」といった記事の下準備に特化したものがいくつかあって、この使い方は実際にかなり回っている印象でした。

4. ブラウザ操作の自動化

おしおさんが最近の記事で紹介していたCDP(Chrome DevTools Protocol)連携は、Shogunから直接Windowsのブラウザを操作できる仕組みです。

ログイン済みのセッションがそのまま使えるので、SaaSの管理画面でのデータ入力やスクリーンショット撮影といった「毎回同じ手順を繰り返す作業」を自動化できます。

おしおさんは「年間何百時間ものクリック作業が消えた」と書いていたのですが、これはプログラミングというよりも定型業務の撲滅に近い話で、設定さえできれば非エンジニアにも恩恵がありそうです。

ただ、最初のSkill設定はそれなりにハードルがあるので、ここはまだ自分では試せていません。

いずれの使い方にも共通するのは、「何を決めたいか」「何案ほしいか」「最後にどんな形で出してほしいか」を最初にはっきり書くのがコツだということです。目的が曖昧なまま投げると、人数が多い会議と同じで散らかるだけになるので。。。このあたりは普通のAIチャットでも同じですが、エージェントが10体いる分、指示の精度がより重要になるんだろうなと感じています。

やってみてどうだったか

今回やってみて思ったのは、multi-agent-shogun自体はかなり面白いけれど、Windows・WSL・SSH・Tailscale・Androidと5つのレイヤーが絡むので、どこで問題が起きているのかを切り分けるのがけっこう大変だったということです。

自力で全部解決した感じではまったくなくて、ChatGPTに「次これ試してみて」と言われるまま進めたら数時間で動いた、というのが正直なところでした。

ただ、逆に言えばChatGPTにREADMEを読ませて「今こういう状況なんだけど」と説明すれば、だいたい次にやるべきことを教えてくれるので、1つずつ潰していけばちゃんと動きます。

肝心の「マルチエージェントで文章制作のレビューを回す」という当初の目的については、まだ本格的には試せていません。ただ、仕組みとしては軍師が品質チェックを担当する設計になっているので、タスクの定義次第ではかなり使えそうな気がしています。と

りあえずしばらくは色々なタスクを投げてみて、どこまで実用になるか試してみるつもりです。

制作者のおしおさんのリポジトリは更新がかなり頻繁で、マルチCLI対応(Claude Code以外にOpenAI CodexやGitHub Copilotにも対応)やGUIダッシュボードなど、機能追加のペースが速いです。数ヶ月前に記事を読んだ時点からだいぶ構成が変わっていて、軍師の追加もその一つでした。活発に開発が続いているプロジェクトなので、気になる方はGitHubをウォッチしてみてくださいね。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です