<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>ChatGPT | ぷくおの物欲まみれ</title>
	<atom:link href="https://pukuo-pukupuku.com/archives/tag/chatgpt/feed" rel="self" type="application/rss+xml" />
	<link>https://pukuo-pukupuku.com</link>
	<description>なんでも「ある」ブログ</description>
	<lastBuildDate>Sat, 25 Apr 2026 06:59:23 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	

<image>
	<url>https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2018/12/cropped-d9bec980eae5dddc0e202b1a3203f68a.jpg?fit=32%2C32&#038;ssl=1</url>
	<title>ChatGPT | ぷくおの物欲まみれ</title>
	<link>https://pukuo-pukupuku.com</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">152258915</site>	<item>
		<title>Claude Proに加入して「multi-agent-shogun」を導入してみた — AI足軽10体が戦国口調で並列作業する世界</title>
		<link>https://pukuo-pukupuku.com/archives/multi-agent-shogun-claude-pro-2026.html</link>
					<comments>https://pukuo-pukupuku.com/archives/multi-agent-shogun-claude-pro-2026.html#respond</comments>
		
		<dc:creator><![CDATA[pukuo]]></dc:creator>
		<pubDate>Sat, 25 Apr 2026 06:59:23 +0000</pubDate>
				<category><![CDATA[4.ガジェット]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[Claude]]></category>
		<category><![CDATA[Code]]></category>
		<category><![CDATA[エージェント]]></category>
		<guid isPermaLink="false">https://pukuo-pukupuku.com/?p=31055</guid>

					<description><![CDATA[<p>もともとAIはChatGPTの有料プランをメインに使っていたのですが、日本語の文章生成の自然さでClaudeの無料アカウントも併用していました。ただ無料プランだと使えるモデルに限りがあって、より高性能なOpusモデルやC...</p>
The post <a href="https://pukuo-pukupuku.com/archives/multi-agent-shogun-claude-pro-2026.html">Claude Proに加入して「multi-agent-shogun」を導入してみた — AI足軽10体が戦国口調で並列作業する世界</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></description>
										<content:encoded><![CDATA[<p>もともとAIはChatGPTの有料プランをメインに使っていたのですが、日本語の文章生成の自然さでClaudeの無料アカウントも併用していました。ただ無料プランだと使えるモデルに限りがあって、より高性能なOpusモデルやClaude Codeをちゃんと試したいなとずっと思っていたのですが、先日ついにClaudeのProプランに加入しました。</p>
<p>Claude Codeを入れたら、ずっと気になっていた「multi-agent-shogun」をついに動かしてみた、というのが今回の話です。数ヶ月前に制作者の<a target="_blank" href="https://zenn.dev/shio_shoppaize/articles/5fee11d03a11a1" target="_blank" rel="noopener">おしおさんの記事</a>を読んだのがきっかけで、「将軍に命令したら足軽が並列で動く」という仕組みにかなり惹かれていたのですが、当時はまだマルチエージェント（複数のAIを同時に動かして作業させる仕組み）自体が珍しかったし、そもそもClaude Codeの導入すらしていなかったので見送っていました。</p>
<p>もう一つ興味を引いたのが、エージェント同士がお互いの成果物をレビューできるという仕組みです。これって文章制作でもかなり使えるんじゃないかと。「書く→別のエージェントがチェック→修正」が自動で回るなら、さまざまな場面で活用できそうだなと思ったのが最終的な動機でした。 結果としてChatGPTにREADMEを読ませながらサポートしてもらい、つまずきつつも数時間でスマホからの接続まで到達できたので、経緯をまとめておきます。</p>
<h2>そもそもmulti-agent-shogunって何？</h2>
<p><a target="_blank" href="https://github.com/yohey-w/multi-agent-shogun" target="_blank" rel="noopener">multi-agent-shogun</a>は、Claude Codeをベースにした無料・オープンソースのマルチエージェントフレームワークです。名前の通り戦国時代の軍制がモチーフになっていて、AIエージェントに「将軍」「家老」「足軽」「軍師」という役割を振って、複数のタスクを同時に処理させる仕組みになっています。 構成はこんな感じです。</p>
<table border="1">
<thead>
<tr>
<th>役職</th>
<th>人数</th>
<th>役割</th>
</tr>
</thead>
<tbody>
<tr>
<td>上様（人間）</td>
<td>1人</td>
<td>将軍に自然言語で命令を出すだけ</td>
</tr>
<tr>
<td>将軍（Shogun）</td>
<td>1体</td>
<td>命令を受けて作業指示に変換し、家老に渡す</td>
</tr>
<tr>
<td>家老（Karo）</td>
<td>1体</td>
<td>指示を細かく分解して足軽に割り振る</td>
</tr>
<tr>
<td>足軽（Ashigaru）</td>
<td>7体</td>
<td>実作業を並列で実行する働き手</td>
</tr>
<tr>
<td>軍師（Gunshi）</td>
<td>1体</td>
<td>難しいタスクの戦略立案や品質チェック</td>
</tr>
</tbody>
</table>
<p>人間がやることは将軍に「これやって」と命令するだけ。あとは家老が「誰に何をやらせるか」を自動で判断して足軽に展開してくれます。軍師は難易度が高いタスクを専門で受け持つ参謀的な存在で、他の足軽が作った成果物の品質チェックも担当するみたいです。</p>
<p>ちなみに全員が戦国口調で報告してきます。「承知つかまつった！」「任務完了でござる！」「切腹を免れ…」という感じで、見ていて普通に面白いのですが、これが単なるネタではなく、通知が来たときに<strong>「あ、これはエージェントのステータス報告だな」</strong>とすぐ分かるという副産物もあります。出力結果なのか報告なのかが一目瞭然になるのは、地味にありがたいなと。</p>
<h3>何が面白いのか</h3>
<p>個人的に<strong>「これはすごいな」</strong>と思ったポイントが2つあります。</p>
<p>まず、<strong>調整のためのコストがかからない</strong>こと。</p>
<p>普通、複数のAIエージェントを連携させると「誰が何をやっているか確認する」だけでAPIの利用料が発生するのですが、Shogunではエージェント同士のやりとりがディスク上のファイル（YAML＝設定ファイルの一種）とtmux（ターミナル画面を複数に分割して同時表示できるツール）のコマンドだけで完結しています。つまり10体動かしても、課金されるのは実際の作業分だけ。</p>
<p>おしおさんの記事によると、もし定期的にタスクを確認しに行く方式にしていたら1日5万回以上のAPIコールが発生して破産するところだったそうで、このあたりの設計はかなり考えられているなと感心しました。</p>
<p>もう一つが、<strong>全エージェントの動きがリアルタイムで見える</strong>こと。</p>
<p>tmuxの各画面に足軽たちが割り当てられていて、それぞれが何をやっているかが丸見えになっています。中で何が起きているか分からないブラックボックスにならないのは安心感があります。おしおさんが「一生見ていられる」と書いていたのですが、実際に動かしてみると確かにワチャワチャ動いている足軽たちを眺めているだけでけっこう楽しい。</p>
<p>さらに、作業中に繰り返しパターンを検知すると「これSkill化したら便利じゃないですか？」と提案してくる機能もあるそうで、普通に仕事をぶち込んでいるだけで勝手にナレッジが蓄積されていく仕組みになっています。</p>
<p>おしおさんの記事にあった「属人化の解消が仕事してるだけで勝手に実現される」という話は、なるほどなと思いました。</p>
<p>また、おしおさんの<a target="_blank" href="https://zenn.dev/shio_shoppaize/articles/5fee11d03a11a1" target="_blank" rel="noopener">最初の記事</a>はZennでかなりバズっていたのですが、技術記事というより読み物として面白いですよ。</p>
<h2>Claude Code公式のエージェント機能とどう違う？</h2>
<p>じつはClaude Code自体にも公式のマルチエージェント機能があって、「サブエージェント」と「Agent Teams」の2つが用意されています。</p>
<p>最初におしおさんの記事を読んだ数ヶ月前はまだAgent Teams自体がなかったのですが、2026年に入ってから急速に整備されてきた印象です。せっかくなので違いを整理してみました。</p>
<table style="height: 576px; width: 100%;" border="1">
<thead>
<tr style="height: 48px;">
<th style="height: 48px;">項目</th>
<th style="height: 48px;">サブエージェント</th>
<th style="height: 48px;">Agent Teams（実験的）</th>
<th style="height: 48px;">multi-agent-shogun</th>
</tr>
</thead>
<tbody>
<tr style="height: 72px;">
<td style="height: 72px;">構造</td>
<td style="height: 72px;">1つのセッション内で別のAIに委任</td>
<td style="height: 72px;">複数セッションが共有タスクリストで連携</td>
<td style="height: 72px;">将軍→家老→足軽＋軍師の階層構造</td>
</tr>
<tr style="height: 48px;">
<td style="height: 48px;">同時に動ける数</td>
<td style="height: 48px;">基本1つずつ（逐次）</td>
<td style="height: 48px;">複数（チームメイト単位）</td>
<td style="height: 48px;">最大10体が同時稼働</td>
</tr>
<tr style="height: 72px;">
<td style="height: 72px;">AI同士の連携</td>
<td style="height: 72px;">親に結果を返すだけ。AI同士は会話不可</td>
<td style="height: 72px;">共有リスト＋直接メッセージでやりとり可能</td>
<td style="height: 72px;">ファイル＋tmuxコマンドでやりとり</td>
</tr>
<tr style="height: 48px;">
<td style="height: 48px;">連携にかかるコスト</td>
<td style="height: 48px;">APIコールが発生</td>
<td style="height: 48px;">トークン消費が通常の3〜4倍</td>
<td style="height: 48px;">ほぼゼロ（ファイル＋tmux）</td>
</tr>
<tr style="height: 72px;">
<td style="height: 72px;">動いてる様子が見えるか</td>
<td style="height: 72px;">ログのみ</td>
<td style="height: 72px;">tmux対応（オプション）</td>
<td style="height: 72px;">全画面がリアルタイムで丸見え</td>
</tr>
<tr style="height: 72px;">
<td style="height: 72px;">対応するAIツール</td>
<td style="height: 72px;">Claude Codeのみ</td>
<td style="height: 72px;">Claude Codeのみ</td>
<td style="height: 72px;">4種類（Claude Code / OpenAI Codex / GitHub Copilot / Kimi Code）</td>
</tr>
<tr style="height: 48px;">
<td style="height: 48px;">スマホから操作</td>
<td style="height: 48px;">不可</td>
<td style="height: 48px;">不可</td>
<td style="height: 48px;">Androidアプリあり</td>
</tr>
<tr style="height: 48px;">
<td style="height: 48px;">品質チェック</td>
<td style="height: 48px;">なし</td>
<td style="height: 48px;">チームメイト間で可能</td>
<td style="height: 48px;">軍師が品質チェックを担当</td>
</tr>
<tr style="height: 48px;">
<td style="height: 48px;">料金</td>
<td style="height: 48px;">ProまたはMax契約内（※注）</td>
<td style="height: 48px;">ProまたはMax契約内（消費が大きい）</td>
<td style="height: 48px;">ツール自体は無料（OSS）。AIの利用料は別途必要</td>
</tr>
</tbody>
</table>
<p><small>※ Claude CodeはProプラン（月額$20）でも使えます。ただし使用量の上限はMaxより少なく、Maxには5x（月額$100）と20x（月額$200）の2段階があります。最新情報は<a target="_blank" href="https://claude.com/pricing" target="_blank" rel="noopener">公式の料金ページ</a>でご確認ください。</small></p>
<p>ざっくり言うと、サブエージェントは手軽だけど1つずつしか動かせないしAI同士で会話ができない。Agent Teamsは直接やりとりできるけど、まだ実験的機能でコストが大きい。Shogunはファイルという「手紙」でやりとりする設計のため連携コストが小さく、しかも全員の動きが見えるという作りになっています。</p>
<p>個人的にShogunに惹かれた一番の理由は、さっきも書いた<strong>内部でレビューが回る</strong>という点です。軍師が品質チェックを担当してくれるので、たとえば「文章を書く→軍師がチェック→修正」みたいなサイクルを自動で回せるんじゃないかと。サブエージェントだと親にしか報告できないので、こういうクロスチェックの仕組みは作りにくいんですよね。</p>
<h3>ChatGPTの利用枠でGPTモデルも使えるか聞いてみた</h3>
<p>比較表で「対応するAIツール」が4種類あると書いたのですが、その中にOpenAI Codex CLIが含まれています。ChatGPTの有料アカウントを持っているので、できればその利用枠の中でGPTモデルもShogunの足軽として使えたら嬉しいなと。</p>
<p>Claude Proの利用枠だけだと心もとないので、一部の作業をGPT側に回せれば負荷分散にもなりそうです。 で、この件をChatGPTに聞いてみました（ShogunのREADMEを読ませた上での相談です）。</p>
<p>回答をざっくりまとめると、<strong>同じUbuntuユーザー環境でCodex CLIにサインイン済みなら、Shogunからもそのまま使える可能性が高い</strong>とのことでした。</p>
<p>Codex CLIは初回起動時にChatGPTアカウントで認証して、その情報をローカルに保存する仕組みになっているため、Shogunが同じ環境から <code>codex</code> コマンドを呼ぶなら保存済みの認証がそのまま使われるそうです。 確認方法もシンプルで、Ubuntuのターミナルで <code>codex</code> と打ってみて、追加のログインを求められなければOKとのこと。逆にログイン画面が出るなら、まだUbuntu側ではサインインできていないということになります。</p>
<p>ただし注意点もあって、Windows側でCodexにサインインしていてもWSLのUbuntu側には共有されないケースがあるらしいです。認証情報の保存場所がOS環境ごとに分かれているため、というのが理由みたいなのですが&#8230;ここはまだ実際に試していないので、動かしてみた結果はまた別途書こうと思います。</p>
<p>ちなみに最近知ったのですが、Claude Code本体にも「LLM Gateway」という仕組みがあって、環境変数を書き換えるだけで接続先をAnthropic以外のLLMに向けられるようになっているそうです。LiteLLM Proxy（APIの形式を自動的に変換してくれる中間サーバー）を挟めば、GPT系やGemini、さらにはローカルで動かすオープンソースのLLMにもルーティングできるみたいで。つまり将来的にはShogunのマルチCLI対応を使わなくても、Claude Code単体で複数のLLMを使い分けるマルチエージェント環境が作れる可能性があります。ただ、設定がそれなりに必要そうだし、ChatGPTの有料プラン枠がそのまま使えるかどうかは別の話なので、このあたりはもう少し情報を追ってみたいところです。</p>
<h2>導入してみた — つまずきポイント3つ</h2>
<p>環境はWindows＋WSL2（Windowsの中でLinuxを動かす仕組み）で、Claude Codeは入れてある状態からスタートしました。ChatGPTにGitHubのREADMEを読ませて「次は何をすればいい？」と聞きながら進めたのですが、素直に一発で入るタイプではなかったです。</p>
<h3>1. Windowsのフォルダで作業してたらエラーが出る</h3>
<p>最初の大きなつまずきがこれでした。READMEのWindows向け手順では <code>C:\tools\multi-agent-shogun</code> にファイルを置く流れになっているのですが、セットアップ中にPythonの仮想環境（venv）を作る工程でエラーが出ます。</p>
<p>しかもエラーメッセージが「python3-venvが必要かもしれません」と案内してくるので、最初はその通りにパッケージを入れ直したりして無駄に時間を溶かしてしまいました。</p>
<p>ChatGPTに状況を説明したところ「WSLからWindows側のフォルダ（/mnt/c/配下）を使うと権限周りの問題で動かないことがある。Linux側のホームに移してみたら？」と言われて、プロジェクトをUbuntu側の <code>~/tools/multi-agent-shogun</code> に移したら通りました。<strong>正直なぜそれで解決するのかは完全には理解できていない</strong>のですが（汗）、WSLでは「Windowsのファイルシステムを使うかLinuxのファイルシステムを使うか」で挙動が変わるらしい、くらいの理解です。Windowsユーザーは要注意なポイントだと思います。</p>
<h3>2. dashboard.mdは「見るもの」だった</h3>
<p>これは完全に自分の勘違いなのですが、READMEに「ダッシュボードで進捗確認できる」と書かれていたので、何かコマンドを打てばダッシュボードが起動するのかと思っていました。 実際にはdashboard.mdはただのマークダウンファイル（テキストファイルの一種）で、将軍システムを起動した後に家老が進捗状況を書き込んでいくためのファイルでした。</p>
<p>VSCodeのプレビュー機能で開いておけばリアルタイムで内容が更新されていくのが見える、という仕組みです（本命は3.に書かれているAndroidアプリでの確認でしょう）。</p>
<p>分かってしまえば単純なのですが、「ダッシュボード」という言葉から勝手にWebの管理画面みたいなものを想像してしまっていたので、最初はちょっと混乱しました。</p>
<h3>3. Androidアプリに入れるパスを間違えていた</h3>
<p>Shogunには専用のAndroidアプリ（コンパニオンアプリ）があって、スマホからSSH（リモート接続）でPCの将軍セッションに入れるのですが、接続設定でハマりました。</p>
<p>設定画面にホスト・ポート・ユーザー・プロジェクトパス・tmuxセッション名を入れるのですが、プロジェクトパスに <code>C:\tools\...</code> とWindows側のパスを入れていたのが間違いでした。 <strong>SSH接続先はWSLの中のLinuxなので、Linux側のパスを入れる必要がある</strong>わけです。今回だと <code>/home/（ユーザー名）</code><code>/tools/multi-agent-shogun</code> が正解でした。ChatGPTに「パスが違うんじゃないか」と指摘されて直したら一発で通ったのですが、WindowsとWSLとSSHが絡むと「どこから見たパスなのか」がこんがらがりやすいです。</p>
<h2>スマホから将軍セッションに入れた</h2>
<p>外出先からもスマホで接続したかったので、Tailscale（端末同士を簡単にVPN接続できるサービス）を使ってみました。</p>
<p>ただ、WindowsとWSLで同時にTailscaleを動かすのは公式的に非推奨らしく、接続経路をどうするかで少し悩みました。結局のところChatGPTに相談しながら設定を整理した結果つながったのですが、<strong>自分で全部理解して解決したかと言われると正直怪しい</strong>です（笑）</p>
<p>ともあれ、最終的にはLAN内だけでなく外出先からもAndroidで将軍セッションに入れるところまでいけました。 <a target="_blank" href="https://zenn.dev/shio_shoppaize/articles/shogun-android-app" target="_blank" rel="noopener">おしおさんのAndroidアプリ記事</a>にも書かれていたのですが、マルチエージェントの操作って「指示を出す」のがメインの仕事なので、スマホの音声入力との相性がかなり良いです。</p>
<div style="width: 1090px" class="wp-caption alignnone"><img data-recalc-dims="1" fetchpriority="high" decoding="async" class="size-large" src="https://i0.wp.com/static.zenn.studio/user-upload/deployed-images/dcf61a34c758486eebaf6479.png?resize=728%2C1577&#038;ssl=1" width="728" height="1577" /><p class="wp-caption-text">image : おしお スマホアプリでエージェントタブを開いたところ</p></div>
<p>9つの画面を同時にモニタリングしたり、AIの利用量がどのくらい残っているかを確認するレートリミットモニターも付いていて、実用面でもよくできています。しかも戦国BGMまで付いてくる（笑）。</p>
<p>PCの前に座っていなくても「足軽の進捗確認して」とスマホに喋るだけで状況が分かるので、ここまで来るとちょっと感動します。</p>
<h2>プログラミングしなくても使えるのか</h2>
<p>Shogunは「コードを書くための開発ツール」という印象が強いかもしれませんが、おしおさんの記事を読み込んでいくと、実はかなりの割合がライティングや調べものに使われていることが分かります。</p>
<p>御前試合の記事では「足軽8人が日々さまざまなライティングタスクをこなしている。将軍が指示を出し、家老が采配し、足軽が書く。完全に会社」と書かれていて、SEO記事を7本同時に書かせるといった使い方が普通に行われていました。</p>
<p>つまりShogunの本質は「コードを書く道具」ではなく、<strong>「重い仕事を複数のAIに分業させる道具」</strong>なんだなと。プログラミングをしない場合でも、「調べる」「比べる」「書く」「チェックする」を同時に回せるのは、普通にAIチャットを1つ使うのとはだいぶ違う体験になりそうです。</p>
<p>ChatGPTにも同じ質問をしてみたところ、「Shogunを&#8221;AIの会議室&#8221;として使うのが一番しっくり来る」という表現が返ってきて、なるほどなと思いました。1人のAIに長々と考えさせるより、役割を分けて同時に動かすほうが、視点の偏りが出にくくなるという話です。 具体的にプログラミングなしで使えそうなパターンを、おしおさんの実例やChatGPTの分析も踏まえていくつか整理してみます。</p>
<h3>1. 調べものの並列化</h3>
<p>何かを調べるとき、1つのAIに全部聞くと回答が1方向に偏りがちなのですが、Shogunなら足軽ごとに切り口を変えて同時に調べさせることができます。たとえば新製品の紹介記事を書く前に、足軽1に公式サイトからスペックを整理させ、足軽2に競合製品の比較を、足軽3にSNSでの評判収集を、足軽4に過去の類似製品のレビュー傾向を、それぞれ同時に投げるイメージです。家老がそれをまとめてくれるので、リサーチフェーズがかなり圧縮できそうな気がします。</p>
<h3>2. 企画や提案の壁打ち</h3>
<p>ChatGPTが「一番相性がいい」と推していたのがこのパターンです。何か企画を考えるとき、賛成意見だけでなく「懸念点を洗い出す足軽」「実施コストを見積もる足軽」「反対意見を想定する足軽」を同時に動かすことで、1回のやりとりで多角的な検討ができるようになります。1人のAIに聞くと「いいですね！」で終わりがちなところを、わざと反対意見を出させる足軽がいるのは面白い仕組みだなと。</p>
<h3>3. 長い文書の下準備</h3>
<p>提案書、報告書などの長い文書を作る前に、構成案・要点整理・想定される質問・弱い部分の指摘を同時に出させるという使い方です。本文を全部書かせるより、骨組みと検証を並列で回して、最後に人間が仕上げるほうが精度が上がりそうです。</p>
<p>おしおさんのSkill一覧にも「記事ネタ発掘」「コンテンツ設計書出力」といった記事の下準備に特化したものがいくつかあって、この使い方は実際にかなり回っている印象でした。</p>
<h3>4. ブラウザ操作の自動化</h3>
<p>おしおさんが最近の記事で紹介していたCDP（Chrome DevTools Protocol）連携は、Shogunから直接Windowsのブラウザを操作できる仕組みです。</p>
<p>ログイン済みのセッションがそのまま使えるので、SaaSの管理画面でのデータ入力やスクリーンショット撮影といった「毎回同じ手順を繰り返す作業」を自動化できます。</p>
<p>おしおさんは「年間何百時間ものクリック作業が消えた」と書いていたのですが、これはプログラミングというよりも定型業務の撲滅に近い話で、設定さえできれば非エンジニアにも恩恵がありそうです。</p>
<p>ただ、最初のSkill設定はそれなりにハードルがあるので、ここはまだ自分では試せていません。</p>
<p>いずれの使い方にも共通するのは、<strong>「何を決めたいか」「何案ほしいか」「最後にどんな形で出してほしいか」を最初にはっきり書く</strong>のがコツだということです。目的が曖昧なまま投げると、人数が多い会議と同じで散らかるだけになるので。。。このあたりは普通のAIチャットでも同じですが、エージェントが10体いる分、指示の精度がより重要になるんだろうなと感じています。</p>
<h2>やってみてどうだったか</h2>
<p>今回やってみて思ったのは、multi-agent-shogun自体はかなり面白いけれど、Windows・WSL・SSH・Tailscale・Androidと5つのレイヤーが絡むので、どこで問題が起きているのかを切り分けるのがけっこう大変だったということです。</p>
<p>自力で全部解決した感じではまったくなくて、ChatGPTに「次これ試してみて」と言われるまま進めたら数時間で動いた、というのが正直なところでした。</p>
<p>ただ、逆に言えばChatGPTにREADMEを読ませて「今こういう状況なんだけど」と説明すれば、だいたい次にやるべきことを教えてくれるので、1つずつ潰していけばちゃんと動きます。</p>
<p>肝心の「マルチエージェントで文章制作のレビューを回す」という当初の目的については、まだ本格的には試せていません。ただ、仕組みとしては軍師が品質チェックを担当する設計になっているので、タスクの定義次第ではかなり使えそうな気がしています。と</p>
<p>りあえずしばらくは色々なタスクを投げてみて、どこまで実用になるか試してみるつもりです。</p>
<p>制作者のおしおさんのリポジトリは更新がかなり頻繁で、マルチCLI対応（Claude Code以外にOpenAI CodexやGitHub Copilotにも対応）やGUIダッシュボードなど、機能追加のペースが速いです。数ヶ月前に記事を読んだ時点からだいぶ構成が変わっていて、軍師の追加もその一つでした。活発に開発が続いているプロジェクトなので、気になる方はGitHubをウォッチしてみてくださいね。</p>
<div class="btn-wrap aligncenter simple"><a target="_blank" href="https://zenn.dev/shio_shoppaize">おしお</a></div>
<div class="btn-wrap aligncenter simple"><a target="_blank" href="https://github.com/yohey-w/multi-agent-shogun" target="_blank" rel="noopener">multi-agent-shogun（GitHub）</a></div>
<div class="btn-wrap aligncenter simple"><a target="_blank" href="https://amzn.to/4txlpSV">ChatGPTのその次へ！マンガでわかるClaude Code（クロードコード）超入門: AI仕事術×ファイル自動整理×CLAUDE.md 非エンジニアでもデスクトップアプリで今すぐ始める完全ガイド 漫画22ページ+図解30枚付き</a></div>
<div class="btn-wrap aligncenter simple"><a target="_blank" href="https://amzn.to/3QmpPNM">会話でわかる！ノンプログラマーのためのClaude超入門 -Claude Code/Cowork/チャット対応-</a></div>The post <a href="https://pukuo-pukupuku.com/archives/multi-agent-shogun-claude-pro-2026.html">Claude Proに加入して「multi-agent-shogun」を導入してみた — AI足軽10体が戦国口調で並列作業する世界</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></content:encoded>
					
					<wfw:commentRss>https://pukuo-pukupuku.com/archives/multi-agent-shogun-claude-pro-2026.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">31055</post-id>	</item>
		<item>
		<title>ChatGPT-5が来た！でも私が本当に注目しているのはCopilotの進化</title>
		<link>https://pukuo-pukupuku.com/archives/chatgpt-5.html</link>
					<comments>https://pukuo-pukupuku.com/archives/chatgpt-5.html#respond</comments>
		
		<dc:creator><![CDATA[pukuo]]></dc:creator>
		<pubDate>Fri, 08 Aug 2025 13:17:18 +0000</pubDate>
				<category><![CDATA[PC]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[Copilot]]></category>
		<category><![CDATA[GPT-5]]></category>
		<category><![CDATA[Microsoft]]></category>
		<category><![CDATA[OpenAI]]></category>
		<guid isPermaLink="false">https://pukuo-pukupuku.com/?p=29991</guid>

					<description><![CDATA[<p>8月8日未明、OpenAIがついにGPT-5を発表しました。 長文処理や推論の深さ、精度の向上など、“賢さ”が格段に強化された印象で、SNSや技術系サイトではすでに「物語生成がヤバい」「コーディングが別次元」といった話題...</p>
The post <a href="https://pukuo-pukupuku.com/archives/chatgpt-5.html">ChatGPT-5が来た！でも私が本当に注目しているのはCopilotの進化</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></description>
										<content:encoded><![CDATA[<p class="p1">8月8日未明、OpenAIがついに<span class="s1"><b>GPT-5</b></span>を発表しました。</p>
<p class="p1">長文処理や推論の深さ、精度の向上など、“賢さ”が格段に強化された印象で、SNSや技術系サイトではすでに「物語生成がヤバい」「コーディングが別次元」といった話題でもちきりです。</p>
<p class="p1">でも、私が本当に期待しているのは、ChatGPT-5そのものではなく、<span class="s1"><b>毎日の業務ツールとして使っているMicrosoft Office版のCopilot</b></span>なんです。</p>
<h3><b>Copilotの現状：正直、まだ「まだまだ」でしかない</b></h3>
<h4><b>Word</b></h4>
<p class="p1">文章校正を頼んでも、「ちょっとよくなった？」というレベル。意図に沿わない方向にぶれがちで、結局ChatGPT経由で貼り付け直す手間が…。</p>
<h4><b>Excel</b></h4>
<p class="p1">関数提案は的外れが多く、複雑な式ではほぼお手上げ。相当わかりやすい構成のデータでないと分析らしいこともできません。</p>
<h4><b>Outlook</b></h4>
<p class="p1">受信メールの文脈まで踏まえた自然な返信支援はまだ実用レベルには達していません。</p>
<h4><b>PowerPoint</b></h4>
<p class="p1">「資料作成が一発で生成できる」と聞いていたのに、実際はレイアウトも構成もうーん…という出来。むしろ自分で作るほうが早いことも。</p>
<p class="p1">つまり、<span class="s1"><b>有料版のCopilotでこれ</b></span>ですから、期待していた日常業務の効率化にはまだ遠いなと感じています。</p>
<h3><b>今朝触ったGPT-5：それでも希望は見えてきた</b></h3>
<p class="p1">実際にGPT-5を少し触ってみると、まるで“o4の親しみやすさ”と“o3の正確さ”が融合したような応答品質。</p>
<p class="p1">しかも、Zennの性能評価でも以下の点で大幅な進化が報告されています：</p>
<ul>
<li>
<p class="p1">リアルタイムルーター：質問内容に応じて「高速モード⇄深い推論モード」を自動切替</p>
</li>
<li>
<p class="p1">ハルシネーション45％減少：事実性と信頼性の大幅向上</p>
</li>
<li>
<p class="p1">モデル展開：gpt-5、mini、nanoと用途に合わせた選別が可能</p>
</li>
</ul>
<p class="p1">特に「必要なときに必要なだけ考える」リアクティブな推論モードは、これまでのCopilotには通じなかった“適材適所の回答”を得られる布石になりそうです。</p>
<h3><b>GPT-5搭載Copilotで“劇的に改善”してほしい4つのこと</b></h3>
<ol start="1">
<li>
<p class="p1"><b>Wordの文章校正精度向上<br />
</b><b></b>　長文の意図や文脈を理解して、一貫性のある提案を。</p>
</li>
<li>
<p class="p1"><b>Excelの関数提案精度向上<br />
</b><b></b>　複雑な条件式や、AI向けに構成していないデータの正確な分析。</p>
</li>
<li>
<p class="p1"><b>Outlookでの自然なメール返信<br />
</b><b></b>　背景ややり取りの流れを踏まえた柔軟な文章提案。</p>
</li>
<li>
<p class="p1"><b>PowerPointの実用的な資料生成<br />
</b><b></b>　構成・フォーマット・文章すべてで整ったスライド。（他社AIでは既に優秀な例もあるので頑張ってほしい！）</p>
</li>
</ol>
<h3><b>管理面でも“一本化”メリットは大きい</b></h3>
<p class="p1">CopilotはMicrosoft 365の管理画面から使用状況を可視化できるのが強み。</p>
<div style="width: 770px" class="wp-caption alignnone"><img data-recalc-dims="1" decoding="async" class="size-large" src="https://i0.wp.com/assets.st-note.com/img/1754636351-P9h6GbZKHJ7mxerFft8yEaI4.png?resize=728%2C189&#038;ssl=1" width="728" height="189" /><p class="wp-caption-text">▲Microsoft 365 Copilotの管理画面では、こんな風にどのアプリでどのように活用されているか等が一目瞭然</p></div>
<p class="p1">したがって、GPT-5相当の性能がOfficeアプリに統合されるなら、</p>
<ul>
<li>
<p class="p1"><strong>セキュリティ面で安心（Microsoftエコシステム内にデータ完結）</strong></p>
</li>
<li>
<p class="p1"><strong>ツール切り替えが不要（ChatGPTとの併用が減る）</strong></p>
</li>
<li>
<p class="p1"><strong>管理者による利用状況の把握が可能</strong></p>
</li>
</ul>
<p class="p1">といった、企業側がAI導入の判断材料にできる“使えるAI”になる可能性があります。</p>
<h3><b>まとめ：期待と現実の折り合いを見つけたい</b></h3>
<p class="p1">現状のCopilotには正直「イライラするレベル」の結果も多々あり、はっきりいってChatGPTがメイン。Copilotは時折性能が良くなっていないか確認するだけの状態で、お金を捨てているような状況（恐ろしいことに、企業向けCopilotは月単位ではなく年単位契約&#8230;）。</p>
<p class="p1">ただ今回、GPT-5発表当日から（実は数日前から）CopilotでもGPT-5モデルが利用可能になり、Officeアプリのモデルも切り替わっているらしいです。</p>
<div id="attachment_29992" style="width: 852px" class="wp-caption aligncenter"><img data-recalc-dims="1" decoding="async" aria-describedby="caption-attachment-29992" data-attachment-id="29992" data-permalink="https://pukuo-pukupuku.com/archives/chatgpt-5.html/screenshot-78" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/08/1831cfd0a10b5d56d7ad44628fca1ab4.jpg?fit=842%2C508&amp;ssl=1" data-orig-size="842,508" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;Screenshot&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;Screenshot&quot;,&quot;orientation&quot;:&quot;0&quot;}" data-image-title="Screenshot" data-image-description="" data-image-caption="&lt;p&gt;▲ Copilotのモード変更ダイアログに「Smart（GPT-5）」が追加されました！！&lt;/p&gt;
" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/08/1831cfd0a10b5d56d7ad44628fca1ab4.jpg?fit=728%2C439&amp;ssl=1" class="size-full wp-image-29992" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/08/1831cfd0a10b5d56d7ad44628fca1ab4.jpg?resize=728%2C439&#038;ssl=1" alt="" width="728" height="439" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/08/1831cfd0a10b5d56d7ad44628fca1ab4.jpg?w=842&amp;ssl=1 842w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/08/1831cfd0a10b5d56d7ad44628fca1ab4.jpg?resize=300%2C181&amp;ssl=1 300w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/08/1831cfd0a10b5d56d7ad44628fca1ab4.jpg?resize=768%2C463&amp;ssl=1 768w" sizes="(max-width: 728px) 100vw, 728px" /><p id="caption-attachment-29992" class="wp-caption-text">▲ Copilotのモード変更ダイアログに「Smart（GPT-5）」が追加されました！！</p></div>
<p class="p1">早い段階でo4やo3が使えていれば評価は変わったかもしれませんが、<strong>ようやく「GPT-5」が搭載されて「使えるようになってきた」段階だと思っています。</strong></p>
<p class="p1">ただ、Microsoftは詰めが甘い部分もあると認識しているので、期待しすぎず、でも進化は見逃さない——そんな距離感で見守っていきたいと思います。</p>
<p class="p1"><strong>とはいえ、もしChatGPTやGeminiの進化をキャッチアップできなければ、Copilotを切るだけでなく、OfficeからGoogle Workspaceへの完全移行も選択肢に入るかもしれません。</strong></p>
<p class="p1">実際、オンライン共同編集の使い勝手ではGoogleが優秀ですし…。</p>
<p class="p1">すでに乗り換えられた方がいれば、ぜひコメントで経験談を教えていただけると嬉しいです！</p>The post <a href="https://pukuo-pukupuku.com/archives/chatgpt-5.html">ChatGPT-5が来た！でも私が本当に注目しているのはCopilotの進化</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></content:encoded>
					
					<wfw:commentRss>https://pukuo-pukupuku.com/archives/chatgpt-5.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">29991</post-id>	</item>
		<item>
		<title>ChatGPTの画像生成。黄色みが強い画像はこのプロンプトですっきり</title>
		<link>https://pukuo-pukupuku.com/archives/created-by-the-ai-is-very-yellowish.html</link>
		
		<dc:creator><![CDATA[pukuo]]></dc:creator>
		<pubDate>Tue, 22 Apr 2025 10:28:35 +0000</pubDate>
				<category><![CDATA[PC]]></category>
		<category><![CDATA[AIM]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[LLM]]></category>
		<category><![CDATA[ジブリ風]]></category>
		<category><![CDATA[チャットGPT]]></category>
		<category><![CDATA[画像生成]]></category>
		<category><![CDATA[黄色い]]></category>
		<category><![CDATA[黄色み]]></category>
		<guid isPermaLink="false">https://pukuo-pukupuku.com/?p=29717</guid>

					<description><![CDATA[<p>ジブリ風の絵に一発で加工できるようになって話題になったChatGPTの画像生成。 著作権とかどうなの？と物議を醸したものの、文科省から作風の類似のみなら著作権侵害にはあたらないという見解も出されてますね。 もちろん本職の...</p>
The post <a href="https://pukuo-pukupuku.com/archives/created-by-the-ai-is-very-yellowish.html">ChatGPTの画像生成。黄色みが強い画像はこのプロンプトですっきり</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></description>
										<content:encoded><![CDATA[<p>ジブリ風の絵に一発で加工できるようになって話題になったChatGPTの画像生成。</p>


<p>著作権とかどうなの？と物議を醸したものの、文科省から作風の類似のみなら著作権侵害にはあたらないという見解も出されてますね。</p>


<p>もちろん本職の方が描く絵には敵わないのでしょうが、さっと写真をこのジブリ風をはじめ、さまざまなテイストに加工できるのは写真を撮るのとはまた違った楽しさ。</p>


<p>そんなAIによる写真加工ですが黄色みが強い画像になっていませんか？</p>


<p>ぷくおも、そもそもそういうものだと思って使っていましたが、今回修正できる簡単なプロンプトを発見。</p>


<h2>黄色みが強いイラストにしないために</h2>


<p>もったいつけるのもアレなんで、簡単にいうと加工したいプロンプトの中に「色温度は7500kで」という一文を加えるだけ。</p>


<h3>こうして出来上がったイラストがこちら。</h3>


<p>もともとはこんな風に、やっぱり黄色みが強い</p>


<img data-recalc-dims="1" loading="lazy" decoding="async" data-attachment-id="29722" data-permalink="https://pukuo-pukupuku.com/archives/created-by-the-ai-is-very-yellowish.html/8bc2cc58-906d-4be6-915c-0ff9628a49f5" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/8BC2CC58-906D-4BE6-915C-0FF9628A49F5.jpg?fit=853%2C1280&amp;ssl=1" data-orig-size="853,1280" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}" data-image-title="8BC2CC58-906D-4BE6-915C-0FF9628A49F5" data-image-description="" data-image-caption="" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/8BC2CC58-906D-4BE6-915C-0FF9628A49F5.jpg?fit=682%2C1024&amp;ssl=1" class="aligncenter size-large wp-image-29722" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/8BC2CC58-906D-4BE6-915C-0FF9628A49F5.jpg?resize=682%2C1024&#038;ssl=1" alt="" width="682" height="1024" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/8BC2CC58-906D-4BE6-915C-0FF9628A49F5.jpg?resize=682%2C1024&amp;ssl=1 682w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/8BC2CC58-906D-4BE6-915C-0FF9628A49F5.jpg?resize=200%2C300&amp;ssl=1 200w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/8BC2CC58-906D-4BE6-915C-0FF9628A49F5.jpg?resize=768%2C1152&amp;ssl=1 768w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/8BC2CC58-906D-4BE6-915C-0FF9628A49F5.jpg?w=853&amp;ssl=1 853w" sizes="auto, (max-width: 682px) 100vw, 682px" />


<p>それが、こんな感じで爽やかな色味に変身</p>


<img data-recalc-dims="1" loading="lazy" decoding="async" data-attachment-id="29723" data-permalink="https://pukuo-pukupuku.com/archives/created-by-the-ai-is-very-yellowish.html/f47abe86-a049-4051-b154-2b45dcb902b2" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/F47ABE86-A049-4051-B154-2B45DCB902B2.jpg?fit=853%2C1280&amp;ssl=1" data-orig-size="853,1280" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;1&quot;}" data-image-title="F47ABE86-A049-4051-B154-2B45DCB902B2" data-image-description="" data-image-caption="" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/F47ABE86-A049-4051-B154-2B45DCB902B2.jpg?fit=682%2C1024&amp;ssl=1" class="aligncenter size-large wp-image-29723" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/F47ABE86-A049-4051-B154-2B45DCB902B2.jpg?resize=682%2C1024&#038;ssl=1" alt="" width="682" height="1024" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/F47ABE86-A049-4051-B154-2B45DCB902B2.jpg?resize=682%2C1024&amp;ssl=1 682w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/F47ABE86-A049-4051-B154-2B45DCB902B2.jpg?resize=200%2C300&amp;ssl=1 200w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/F47ABE86-A049-4051-B154-2B45DCB902B2.jpg?resize=768%2C1152&amp;ssl=1 768w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/F47ABE86-A049-4051-B154-2B45DCB902B2.jpg?w=853&amp;ssl=1 853w" sizes="auto, (max-width: 682px) 100vw, 682px" />


<h2>色温度について</h2>


<p>詳しい方ならお分かりでしょうが、色温度とは光の色を数値で表す尺度で、白熱電球の色温度は3,000k程度、日中の太陽光の色温度は5,000～6,000K程度と言われています。</p>


<p>この色温度という尺度は光そのものだけでなく写真やディスプレイの色味でも使われていますね。</p>


<p>そんな色温度。実は文化的背景等によって快適と思える色温度が違うそう。</p>


<h3>快適に感じる色温度と文化の関係</h3>


<p class="p1">1. 日本や韓国など東アジア圏</p>


<p class="p1">一般的に 高めの色温度（5000K〜7500K） を好む傾向があり、屋内でも「白っぽくて明るい光＝清潔・集中できる」という文化的な感覚がある。</p>


<p class="p1">2. 欧米（特に西欧・アメリカ）</p>


<p class="p1">低めの色温度（2700K〜3500K） の「暖かい光」を好む傾向が強い。 暖炉文化や間接照明が根づいていて、「暖色＝落ち着く・リラックス」という感覚が一般的。</p>


<p class="p1">3. 中東・アフリカ</p>


<p class="p1">日差しが強い地域では、屋内の光はやや低めで「まぶしくない」方が快適に感じられることが多い。</p>


<h3 class="p1">「人種」ごとの感覚ってあるの？</h3>


<p class="p3">厳密には「人種による生物学的な差」というよりも、「育った環境に根ざした習慣や美的感覚」の影響が大きいのだそう。</p>


<p class="p3">例えば同じアジア系の人でも、欧米で育った人は電球色の暖かい照明の方が落ち着くと感じることもあるし、逆に外国人でも日本で暮らしていれば「昼白色」が好きになることもあるのだとか。ということで、やっぱり文化的な背景に影響されるんですね。</p>


<h2>なぜ色温度が「低め」になりやすいのか？</h2>
<p>とはいえ、生成するのはAI。どうして色温度低めの画像になるのかというと&#8230;</p>


<h4 class="p1">1. 学習データの偏り（文化的・商業的なもの）</h4>


<p class="p3">学習している画像データの多くは、ネットや商業デザインの世界から集められたものが中心。</p>


<p class="p3">そして特に「イラスト」「広告写真」「映画のワンシーン」などは、以下のような傾向があるそう。：</p>


<p class="p1">欧米スタイル中心 → これは暖色寄りの照明（2700K〜3500K）が多く使われる文化 ノスタルジック演出 → 色温度を下げて雰囲気を出す処理が一般的 「フィルム調」加工 → 黄色〜オレンジ系を好む傾向</p>


<p class="p3">つまり、AIとしては「よく見る＝人が好む」ものを再現しようとしてる結果、暖色寄り（色温度低め）に寄りがちになるとのこと。</p>


<h4 class="p1">2. AIモデル設計の安全性と好感度重視</h4>


<p class="p3">一般に、あまり青白い（高色温度な）画像は以下のように“冷たい印象”や“無機質”に見えることがある。</p>


<p class="p1"><strong>人の肌が青ざめて見える 雰囲気が寒々しく、感情的に共感されにくい</strong></p>


<p class="p3">そのため、AIモデルとしては「安全で、誰からも好かれやすいトーン＝ちょい暖色気味」に設定されやすいって背景もあるんだとか。</p>


<h3 class="p1">最後にちょっと裏話的なこと</h3>


<p class="p3">ちなみに、ChatGPTが使っている画像生成エンジン（たとえばDALL·Eなど）は、プロンプトから「色温度」を直接読み取って物理的に調整しているわけではないそう。</p>


<p class="p3">だから、「色温度7500Kで」って言われても、実際はそれを表現するための言い換えや演出表現（例：クールな朝の光、青みがかった自然光）として翻訳して、なるべく近づけてるんだそうですよ。</p>The post <a href="https://pukuo-pukupuku.com/archives/created-by-the-ai-is-very-yellowish.html">ChatGPTの画像生成。黄色みが強い画像はこのプロンプトですっきり</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">29717</post-id>	</item>
		<item>
		<title>ここ最近はずっと会議用の文字起こしソフト探しからの生成AIにはまっていました。</title>
		<link>https://pukuo-pukupuku.com/archives/llm_transcript_1.html</link>
					<comments>https://pukuo-pukupuku.com/archives/llm_transcript_1.html#respond</comments>
		
		<dc:creator><![CDATA[pukuo]]></dc:creator>
		<pubDate>Sun, 29 Dec 2024 01:15:51 +0000</pubDate>
				<category><![CDATA[4.ガジェット]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[AI議事録取れる君]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[Gemini]]></category>
		<category><![CDATA[LLM]]></category>
		<category><![CDATA[notta]]></category>
		<category><![CDATA[スマート書記]]></category>
		<category><![CDATA[文字起こし]]></category>
		<category><![CDATA[生成AI]]></category>
		<guid isPermaLink="false">https://pukuo-pukupuku.com/?p=29392</guid>

					<description><![CDATA[<p>久しぶりの投稿となってしまいましたが、タイトルにあるようにここ最近はずっと会議用の文字起こしソフト探しからの生成AIにはまっていました。 仕事でつきものなのが議事録。ぷくおが議事録作成担当だったのはかなり昔のことですが、...</p>
The post <a href="https://pukuo-pukupuku.com/archives/llm_transcript_1.html">ここ最近はずっと会議用の文字起こしソフト探しからの生成AIにはまっていました。</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></description>
										<content:encoded><![CDATA[<p><img data-recalc-dims="1" loading="lazy" decoding="async" data-attachment-id="29399" data-permalink="https://pukuo-pukupuku.com/archives/llm_transcript_1.html/image-579" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?fit=400%2C335&amp;ssl=1" data-orig-size="400,335" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}" data-image-title="image" data-image-description="" data-image-caption="" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?fit=400%2C335&amp;ssl=1" class="size-full wp-image-29399 aligncenter" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?resize=400%2C335&#038;ssl=1" alt="" width="400" height="335" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?w=400&amp;ssl=1 400w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?resize=300%2C251&amp;ssl=1 300w" sizes="auto, (max-width: 400px) 100vw, 400px" /></p>
<p>久しぶりの投稿となってしまいましたが、タイトルにあるようにここ最近はずっと会議用の文字起こしソフト探しからの生成AIにはまっていました。</p>
<p>仕事でつきものなのが議事録。ぷくおが議事録作成担当だったのはかなり昔のことですが、とはいえ今も変わらず会議をやったら議事録が必要で、それに時間と大きな会議では文字起こしを外注するコストが気になっていました。</p>
<h2>文字起こしサービスを試してみた</h2>
<p>そんな訳で、文字起こしをしてくれるサービスを検索してみると、AIを利用して高精度に文字起こしができる！とうたわれたサービスがいくつも出てきます。</p>
<p>数ある製品の中で、次の条件で絞ってみました。</p>
<ul>
<li><strong>話している人の自動分離（話者分離・識別）</strong></li>
<li><strong>用語登録が可能かどうか</strong></li>
<li><strong>会議中にリアルタイムで文字起こしをした際に、タイムスタンプをつけられるか（発言が不明瞭で明らかに後で修正が必要なところとか）</strong></li>
<li><strong>「あー」とか「えー」といった不要な言葉の除去（フィラー処理というらしい）</strong></li>
<li><strong>Teams等と連携して、できた議事録や議事概要をすぐに展開できるか</strong></li>
</ul>
<p>こうして見つけてきたのが「<a target="_blank" href="https://gijirokukun.com/">AI議事録取れる君</a>」や「<a target="_blank" href="https://www.smartshoki.com/">スマート書記</a>」、「<a target="_blank" href="https://www.notta.ai">Notta</a>」といったサービス。</p>
<p>どれも有料サービスで、AI議事録取れる君だけはスマホやタブレットからの利用は不可（様々なブラウザで設定を変えてもだめでした）以外はある意味似たり寄ったりで、ファイルをアップロードして文字起こしすることも可能。</p>
<p><strong>個人的には大企業や東京都でも利用されているというスマート書記が、多少高価ではあるものの期待していたのですが、正直ICレコーダーで録音した会議の音声を文字起こしした感想はどれもイマイチ。</strong></p>
<p>概要だとそれらしくまとまっていますが、発言を一つ一つ見てみると、逆によく概要をまとめたなと思えるような出来栄えで、断定で終わっているのに文字起こしでは「？」の疑問形で終わってたりしていて、まだまだ高いけど外注するしかないと思っていました。</p>
<p>なお、この３サービスのテストを終えた後に「<a target="_blank" href="https://securememo-cloud.com">SecureMemoCloud</a>」というサービスを見つけたのですが、こちらはほぼ完成版の議事録を作成できる！と書かれていて、こちらも大手企業で使用されているのでかなりうまくいくのかもしれません。</p>
<h2>大規模生成AI「Gemini」を試したら驚きの結果に</h2>
<p><strong>文字起こしソフトの利用を諦めかけていた頃に見つけたのが、Googleの大規模言語モデル（LLM）である「Gemini」。</strong></p>
<p>Geminiは最近バージョン2が登場して、一番有名と思われるChatGPTの高性能版と同じぐらいの性能だと言われていますが、GeminiはGoogle AI Studioというサービスを利用すれば単独で音声ファイルや画像認識ができるのが特徴（2024年末現在、ChatGPTは同社のWhisperというモデルを使用しないと録音データの入力ができなかった）。</p>
<p><div id="attachment_29397" style="width: 738px" class="wp-caption alignnone"><img data-recalc-dims="1" loading="lazy" decoding="async" aria-describedby="caption-attachment-29397" data-attachment-id="29397" data-permalink="https://pukuo-pukupuku.com/archives/llm_transcript_1.html/screenshot-37" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?fit=2418%2C2014&amp;ssl=1" data-orig-size="2418,2014" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;Screenshot&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;Screenshot&quot;,&quot;orientation&quot;:&quot;1&quot;}" data-image-title="Screenshot" data-image-description="" data-image-caption="&lt;p&gt;Screenshot&lt;/p&gt;
" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?fit=728%2C606&amp;ssl=1" class="size-large wp-image-29397" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=728%2C606&#038;ssl=1" alt="" width="728" height="606" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=1024%2C853&amp;ssl=1 1024w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=300%2C250&amp;ssl=1 300w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=768%2C640&amp;ssl=1 768w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=1536%2C1279&amp;ssl=1 1536w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=2048%2C1706&amp;ssl=1 2048w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?w=1456&amp;ssl=1 1456w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?w=2184&amp;ssl=1 2184w" sizes="auto, (max-width: 728px) 100vw, 728px" /><p id="caption-attachment-29397" class="wp-caption-text">Screenshot</p></div></p>
<p>画面右上にあるモデルから利用したいAIモデルを選択し、画面下の＋ボタンから文字起こししたい録音データをアップロード。そして下のチャット欄に「このデータを日本語で文字起こしして」なんて感じで命令するとどんどんと文字起こししてくれます。</p>
<p><div id="attachment_29395" style="width: 738px" class="wp-caption alignnone"><img data-recalc-dims="1" loading="lazy" decoding="async" aria-describedby="caption-attachment-29395" data-attachment-id="29395" data-permalink="https://pukuo-pukupuku.com/archives/llm_transcript_1.html/screenshot-35" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?fit=1266%2C1534&amp;ssl=1" data-orig-size="1266,1534" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;Screenshot&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;Screenshot&quot;,&quot;orientation&quot;:&quot;0&quot;}" data-image-title="Screenshot" data-image-description="" data-image-caption="&lt;p&gt;▲Gemini 2.0で出てきた意味不明な出力例&lt;/p&gt;
" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?fit=728%2C882&amp;ssl=1" class="size-large wp-image-29395" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?resize=728%2C882&#038;ssl=1" alt="" width="728" height="882" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?resize=845%2C1024&amp;ssl=1 845w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?resize=248%2C300&amp;ssl=1 248w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?resize=768%2C931&amp;ssl=1 768w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?w=1266&amp;ssl=1 1266w" sizes="auto, (max-width: 728px) 100vw, 728px" /><p id="caption-attachment-29395" class="wp-caption-text">▲Gemini 2.0で出てきた意味不明な出力例</p></div></p>
<p>最初、高性能なGemini 2.0で文字起こししたときはなぜか「うーんうーん」という意味不明な呟きだったり、「○○○○○○」というエラー？が大量生産されてしまいましたが、Gemini 1.5 Proで設定したら、外注しているテープ起こしサービスよりも高精度の文字起こしが出来てびっくり。</p>
<p><div id="attachment_29396" style="width: 738px" class="wp-caption alignnone"><img data-recalc-dims="1" loading="lazy" decoding="async" aria-describedby="caption-attachment-29396" data-attachment-id="29396" data-permalink="https://pukuo-pukupuku.com/archives/llm_transcript_1.html/screenshot-36" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?fit=1236%2C648&amp;ssl=1" data-orig-size="1236,648" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;Screenshot&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;Screenshot&quot;,&quot;orientation&quot;:&quot;0&quot;}" data-image-title="Screenshot" data-image-description="" data-image-caption="&lt;p&gt;▲文字起こしが出来た部分をちょっとだけ。これだけ文字起こししてくれたら外注不要になりますね&lt;/p&gt;
" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?fit=728%2C382&amp;ssl=1" class="size-large wp-image-29396" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?resize=728%2C382&#038;ssl=1" alt="" width="728" height="382" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?resize=1024%2C537&amp;ssl=1 1024w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?resize=300%2C157&amp;ssl=1 300w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?resize=768%2C403&amp;ssl=1 768w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?w=1236&amp;ssl=1 1236w" sizes="auto, (max-width: 728px) 100vw, 728px" /><p id="caption-attachment-29396" class="wp-caption-text">▲文字起こしが出来た部分をちょっとだけ。これだけ文字起こししてくれたら外注不要になりますね</p></div></p>
<h3>プロンプト</h3>
<p>なお、冒頭で紹介した文字起こしサービスと違って、LLMでは文字起こしをするにしてもプロンプトでどのように音声データを処理してほしいかお願いする必要があります。</p>
<p>今回試したのは次のとおり。</p>
<p><div class="c_box intitle glay_box type_normal"><div class="box_title"><span class="span__box_title">今回のプロンプト</span></div>この会議の録音音声を、日本語で書き起こしてください。原文は可能な限り変更せず、「えーっと」、「え、」、「あ、」などの意味のない音声のみ削除してください。話者分離を行ってください。文章は適宜改行を入れ、話者が変わる際は空白行を入れて読みやすくしてください。</div></p>
<p>なお、AIの制限上ある程度の文字起こしをすると止まってしまうので、「続きをやって」なんていうふうにするとどんどんと文字起こしをしてくれます。</p>
<p>この辺りはまたもっと良いプロンプトができたら残しておきたいと思います。</p>
<p>&nbsp;</p>
<p>さっと手軽に使うのであれば、PLAUD Noteシリーズも良さそうだなと思いました。<br />
</p>The post <a href="https://pukuo-pukupuku.com/archives/llm_transcript_1.html">ここ最近はずっと会議用の文字起こしソフト探しからの生成AIにはまっていました。</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></content:encoded>
					
					<wfw:commentRss>https://pukuo-pukupuku.com/archives/llm_transcript_1.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">29392</post-id>	</item>
	</channel>
</rss>
