<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>LLM | ぷくおの物欲まみれ</title>
	<atom:link href="https://pukuo-pukupuku.com/archives/tag/llm/feed" rel="self" type="application/rss+xml" />
	<link>https://pukuo-pukupuku.com</link>
	<description>なんでも「ある」ブログ</description>
	<lastBuildDate>Tue, 22 Apr 2025 10:28:35 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	

<image>
	<url>https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2018/12/cropped-d9bec980eae5dddc0e202b1a3203f68a.jpg?fit=32%2C32&#038;ssl=1</url>
	<title>LLM | ぷくおの物欲まみれ</title>
	<link>https://pukuo-pukupuku.com</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">152258915</site>	<item>
		<title>ChatGPTの画像生成。黄色みが強い画像はこのプロンプトですっきり</title>
		<link>https://pukuo-pukupuku.com/archives/created-by-the-ai-is-very-yellowish.html</link>
		
		<dc:creator><![CDATA[pukuo]]></dc:creator>
		<pubDate>Tue, 22 Apr 2025 10:28:35 +0000</pubDate>
				<category><![CDATA[PC]]></category>
		<category><![CDATA[AIM]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[LLM]]></category>
		<category><![CDATA[ジブリ風]]></category>
		<category><![CDATA[チャットGPT]]></category>
		<category><![CDATA[画像生成]]></category>
		<category><![CDATA[黄色い]]></category>
		<category><![CDATA[黄色み]]></category>
		<guid isPermaLink="false">https://pukuo-pukupuku.com/?p=29717</guid>

					<description><![CDATA[<p>ジブリ風の絵に一発で加工できるようになって話題になったChatGPTの画像生成。 著作権とかどうなの？と物議を醸したものの、文科省から作風の類似のみなら著作権侵害にはあたらないという見解も出されてますね。 もちろん本職の...</p>
The post <a href="https://pukuo-pukupuku.com/archives/created-by-the-ai-is-very-yellowish.html">ChatGPTの画像生成。黄色みが強い画像はこのプロンプトですっきり</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></description>
										<content:encoded><![CDATA[<p>ジブリ風の絵に一発で加工できるようになって話題になったChatGPTの画像生成。</p>


<p>著作権とかどうなの？と物議を醸したものの、文科省から作風の類似のみなら著作権侵害にはあたらないという見解も出されてますね。</p>


<p>もちろん本職の方が描く絵には敵わないのでしょうが、さっと写真をこのジブリ風をはじめ、さまざまなテイストに加工できるのは写真を撮るのとはまた違った楽しさ。</p>


<p>そんなAIによる写真加工ですが黄色みが強い画像になっていませんか？</p>


<p>ぷくおも、そもそもそういうものだと思って使っていましたが、今回修正できる簡単なプロンプトを発見。</p>


<h2>黄色みが強いイラストにしないために</h2>


<p>もったいつけるのもアレなんで、簡単にいうと加工したいプロンプトの中に「色温度は7500kで」という一文を加えるだけ。</p>


<h3>こうして出来上がったイラストがこちら。</h3>


<p>もともとはこんな風に、やっぱり黄色みが強い</p>


<img data-recalc-dims="1" fetchpriority="high" decoding="async" data-attachment-id="29722" data-permalink="https://pukuo-pukupuku.com/archives/created-by-the-ai-is-very-yellowish.html/8bc2cc58-906d-4be6-915c-0ff9628a49f5" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/8BC2CC58-906D-4BE6-915C-0FF9628A49F5.jpg?fit=853%2C1280&amp;ssl=1" data-orig-size="853,1280" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}" data-image-title="8BC2CC58-906D-4BE6-915C-0FF9628A49F5" data-image-description="" data-image-caption="" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/8BC2CC58-906D-4BE6-915C-0FF9628A49F5.jpg?fit=682%2C1024&amp;ssl=1" class="aligncenter size-large wp-image-29722" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/8BC2CC58-906D-4BE6-915C-0FF9628A49F5.jpg?resize=682%2C1024&#038;ssl=1" alt="" width="682" height="1024" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/8BC2CC58-906D-4BE6-915C-0FF9628A49F5.jpg?resize=682%2C1024&amp;ssl=1 682w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/8BC2CC58-906D-4BE6-915C-0FF9628A49F5.jpg?resize=200%2C300&amp;ssl=1 200w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/8BC2CC58-906D-4BE6-915C-0FF9628A49F5.jpg?resize=768%2C1152&amp;ssl=1 768w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/8BC2CC58-906D-4BE6-915C-0FF9628A49F5.jpg?w=853&amp;ssl=1 853w" sizes="(max-width: 682px) 100vw, 682px" />


<p>それが、こんな感じで爽やかな色味に変身</p>


<img data-recalc-dims="1" decoding="async" data-attachment-id="29723" data-permalink="https://pukuo-pukupuku.com/archives/created-by-the-ai-is-very-yellowish.html/f47abe86-a049-4051-b154-2b45dcb902b2" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/F47ABE86-A049-4051-B154-2B45DCB902B2.jpg?fit=853%2C1280&amp;ssl=1" data-orig-size="853,1280" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;1&quot;}" data-image-title="F47ABE86-A049-4051-B154-2B45DCB902B2" data-image-description="" data-image-caption="" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/F47ABE86-A049-4051-B154-2B45DCB902B2.jpg?fit=682%2C1024&amp;ssl=1" class="aligncenter size-large wp-image-29723" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/F47ABE86-A049-4051-B154-2B45DCB902B2.jpg?resize=682%2C1024&#038;ssl=1" alt="" width="682" height="1024" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/F47ABE86-A049-4051-B154-2B45DCB902B2.jpg?resize=682%2C1024&amp;ssl=1 682w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/F47ABE86-A049-4051-B154-2B45DCB902B2.jpg?resize=200%2C300&amp;ssl=1 200w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/F47ABE86-A049-4051-B154-2B45DCB902B2.jpg?resize=768%2C1152&amp;ssl=1 768w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/04/F47ABE86-A049-4051-B154-2B45DCB902B2.jpg?w=853&amp;ssl=1 853w" sizes="(max-width: 682px) 100vw, 682px" />


<h2>色温度について</h2>


<p>詳しい方ならお分かりでしょうが、色温度とは光の色を数値で表す尺度で、白熱電球の色温度は3,000k程度、日中の太陽光の色温度は5,000～6,000K程度と言われています。</p>


<p>この色温度という尺度は光そのものだけでなく写真やディスプレイの色味でも使われていますね。</p>


<p>そんな色温度。実は文化的背景等によって快適と思える色温度が違うそう。</p>


<h3>快適に感じる色温度と文化の関係</h3>


<p class="p1">1. 日本や韓国など東アジア圏</p>


<p class="p1">一般的に 高めの色温度（5000K〜7500K） を好む傾向があり、屋内でも「白っぽくて明るい光＝清潔・集中できる」という文化的な感覚がある。</p>


<p class="p1">2. 欧米（特に西欧・アメリカ）</p>


<p class="p1">低めの色温度（2700K〜3500K） の「暖かい光」を好む傾向が強い。 暖炉文化や間接照明が根づいていて、「暖色＝落ち着く・リラックス」という感覚が一般的。</p>


<p class="p1">3. 中東・アフリカ</p>


<p class="p1">日差しが強い地域では、屋内の光はやや低めで「まぶしくない」方が快適に感じられることが多い。</p>


<h3 class="p1">「人種」ごとの感覚ってあるの？</h3>


<p class="p3">厳密には「人種による生物学的な差」というよりも、「育った環境に根ざした習慣や美的感覚」の影響が大きいのだそう。</p>


<p class="p3">例えば同じアジア系の人でも、欧米で育った人は電球色の暖かい照明の方が落ち着くと感じることもあるし、逆に外国人でも日本で暮らしていれば「昼白色」が好きになることもあるのだとか。ということで、やっぱり文化的な背景に影響されるんですね。</p>


<h2>なぜ色温度が「低め」になりやすいのか？</h2>
<p>とはいえ、生成するのはAI。どうして色温度低めの画像になるのかというと&#8230;</p>


<h4 class="p1">1. 学習データの偏り（文化的・商業的なもの）</h4>


<p class="p3">学習している画像データの多くは、ネットや商業デザインの世界から集められたものが中心。</p>


<p class="p3">そして特に「イラスト」「広告写真」「映画のワンシーン」などは、以下のような傾向があるそう。：</p>


<p class="p1">欧米スタイル中心 → これは暖色寄りの照明（2700K〜3500K）が多く使われる文化 ノスタルジック演出 → 色温度を下げて雰囲気を出す処理が一般的 「フィルム調」加工 → 黄色〜オレンジ系を好む傾向</p>


<p class="p3">つまり、AIとしては「よく見る＝人が好む」ものを再現しようとしてる結果、暖色寄り（色温度低め）に寄りがちになるとのこと。</p>


<h4 class="p1">2. AIモデル設計の安全性と好感度重視</h4>


<p class="p3">一般に、あまり青白い（高色温度な）画像は以下のように“冷たい印象”や“無機質”に見えることがある。</p>


<p class="p1"><strong>人の肌が青ざめて見える 雰囲気が寒々しく、感情的に共感されにくい</strong></p>


<p class="p3">そのため、AIモデルとしては「安全で、誰からも好かれやすいトーン＝ちょい暖色気味」に設定されやすいって背景もあるんだとか。</p>


<h3 class="p1">最後にちょっと裏話的なこと</h3>


<p class="p3">ちなみに、ChatGPTが使っている画像生成エンジン（たとえばDALL·Eなど）は、プロンプトから「色温度」を直接読み取って物理的に調整しているわけではないそう。</p>


<p class="p3">だから、「色温度7500Kで」って言われても、実際はそれを表現するための言い換えや演出表現（例：クールな朝の光、青みがかった自然光）として翻訳して、なるべく近づけてるんだそうですよ。</p>The post <a href="https://pukuo-pukupuku.com/archives/created-by-the-ai-is-very-yellowish.html">ChatGPTの画像生成。黄色みが強い画像はこのプロンプトですっきり</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">29717</post-id>	</item>
		<item>
		<title>ここ最近はずっと会議用の文字起こしソフト探しからの生成AIにはまっていました。</title>
		<link>https://pukuo-pukupuku.com/archives/llm_transcript_1.html</link>
					<comments>https://pukuo-pukupuku.com/archives/llm_transcript_1.html#respond</comments>
		
		<dc:creator><![CDATA[pukuo]]></dc:creator>
		<pubDate>Sun, 29 Dec 2024 01:15:51 +0000</pubDate>
				<category><![CDATA[4.ガジェット]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[AI議事録取れる君]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[Gemini]]></category>
		<category><![CDATA[LLM]]></category>
		<category><![CDATA[notta]]></category>
		<category><![CDATA[スマート書記]]></category>
		<category><![CDATA[文字起こし]]></category>
		<category><![CDATA[生成AI]]></category>
		<guid isPermaLink="false">https://pukuo-pukupuku.com/?p=29392</guid>

					<description><![CDATA[<p>久しぶりの投稿となってしまいましたが、タイトルにあるようにここ最近はずっと会議用の文字起こしソフト探しからの生成AIにはまっていました。 仕事でつきものなのが議事録。ぷくおが議事録作成担当だったのはかなり昔のことですが、...</p>
The post <a href="https://pukuo-pukupuku.com/archives/llm_transcript_1.html">ここ最近はずっと会議用の文字起こしソフト探しからの生成AIにはまっていました。</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></description>
										<content:encoded><![CDATA[<p><img data-recalc-dims="1" decoding="async" data-attachment-id="29399" data-permalink="https://pukuo-pukupuku.com/archives/llm_transcript_1.html/image-579" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?fit=400%2C335&amp;ssl=1" data-orig-size="400,335" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}" data-image-title="image" data-image-description="" data-image-caption="" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?fit=400%2C335&amp;ssl=1" class="size-full wp-image-29399 aligncenter" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?resize=400%2C335&#038;ssl=1" alt="" width="400" height="335" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?w=400&amp;ssl=1 400w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?resize=300%2C251&amp;ssl=1 300w" sizes="(max-width: 400px) 100vw, 400px" /></p>
<p>久しぶりの投稿となってしまいましたが、タイトルにあるようにここ最近はずっと会議用の文字起こしソフト探しからの生成AIにはまっていました。</p>
<p>仕事でつきものなのが議事録。ぷくおが議事録作成担当だったのはかなり昔のことですが、とはいえ今も変わらず会議をやったら議事録が必要で、それに時間と大きな会議では文字起こしを外注するコストが気になっていました。</p>
<h2>文字起こしサービスを試してみた</h2>
<p>そんな訳で、文字起こしをしてくれるサービスを検索してみると、AIを利用して高精度に文字起こしができる！とうたわれたサービスがいくつも出てきます。</p>
<p>数ある製品の中で、次の条件で絞ってみました。</p>
<ul>
<li><strong>話している人の自動分離（話者分離・識別）</strong></li>
<li><strong>用語登録が可能かどうか</strong></li>
<li><strong>会議中にリアルタイムで文字起こしをした際に、タイムスタンプをつけられるか（発言が不明瞭で明らかに後で修正が必要なところとか）</strong></li>
<li><strong>「あー」とか「えー」といった不要な言葉の除去（フィラー処理というらしい）</strong></li>
<li><strong>Teams等と連携して、できた議事録や議事概要をすぐに展開できるか</strong></li>
</ul>
<p>こうして見つけてきたのが「<a target="_blank" href="https://gijirokukun.com/">AI議事録取れる君</a>」や「<a target="_blank" href="https://www.smartshoki.com/">スマート書記</a>」、「<a target="_blank" href="https://www.notta.ai">Notta</a>」といったサービス。</p>
<p>どれも有料サービスで、AI議事録取れる君だけはスマホやタブレットからの利用は不可（様々なブラウザで設定を変えてもだめでした）以外はある意味似たり寄ったりで、ファイルをアップロードして文字起こしすることも可能。</p>
<p><strong>個人的には大企業や東京都でも利用されているというスマート書記が、多少高価ではあるものの期待していたのですが、正直ICレコーダーで録音した会議の音声を文字起こしした感想はどれもイマイチ。</strong></p>
<p>概要だとそれらしくまとまっていますが、発言を一つ一つ見てみると、逆によく概要をまとめたなと思えるような出来栄えで、断定で終わっているのに文字起こしでは「？」の疑問形で終わってたりしていて、まだまだ高いけど外注するしかないと思っていました。</p>
<p>なお、この３サービスのテストを終えた後に「<a target="_blank" href="https://securememo-cloud.com">SecureMemoCloud</a>」というサービスを見つけたのですが、こちらはほぼ完成版の議事録を作成できる！と書かれていて、こちらも大手企業で使用されているのでかなりうまくいくのかもしれません。</p>
<h2>大規模生成AI「Gemini」を試したら驚きの結果に</h2>
<p><strong>文字起こしソフトの利用を諦めかけていた頃に見つけたのが、Googleの大規模言語モデル（LLM）である「Gemini」。</strong></p>
<p>Geminiは最近バージョン2が登場して、一番有名と思われるChatGPTの高性能版と同じぐらいの性能だと言われていますが、GeminiはGoogle AI Studioというサービスを利用すれば単独で音声ファイルや画像認識ができるのが特徴（2024年末現在、ChatGPTは同社のWhisperというモデルを使用しないと録音データの入力ができなかった）。</p>
<p><div id="attachment_29397" style="width: 738px" class="wp-caption alignnone"><img data-recalc-dims="1" loading="lazy" decoding="async" aria-describedby="caption-attachment-29397" data-attachment-id="29397" data-permalink="https://pukuo-pukupuku.com/archives/llm_transcript_1.html/screenshot-37" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?fit=2418%2C2014&amp;ssl=1" data-orig-size="2418,2014" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;Screenshot&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;Screenshot&quot;,&quot;orientation&quot;:&quot;1&quot;}" data-image-title="Screenshot" data-image-description="" data-image-caption="&lt;p&gt;Screenshot&lt;/p&gt;
" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?fit=728%2C606&amp;ssl=1" class="size-large wp-image-29397" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=728%2C606&#038;ssl=1" alt="" width="728" height="606" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=1024%2C853&amp;ssl=1 1024w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=300%2C250&amp;ssl=1 300w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=768%2C640&amp;ssl=1 768w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=1536%2C1279&amp;ssl=1 1536w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=2048%2C1706&amp;ssl=1 2048w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?w=1456&amp;ssl=1 1456w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?w=2184&amp;ssl=1 2184w" sizes="auto, (max-width: 728px) 100vw, 728px" /><p id="caption-attachment-29397" class="wp-caption-text">Screenshot</p></div></p>
<p>画面右上にあるモデルから利用したいAIモデルを選択し、画面下の＋ボタンから文字起こししたい録音データをアップロード。そして下のチャット欄に「このデータを日本語で文字起こしして」なんて感じで命令するとどんどんと文字起こししてくれます。</p>
<p><div id="attachment_29395" style="width: 738px" class="wp-caption alignnone"><img data-recalc-dims="1" loading="lazy" decoding="async" aria-describedby="caption-attachment-29395" data-attachment-id="29395" data-permalink="https://pukuo-pukupuku.com/archives/llm_transcript_1.html/screenshot-35" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?fit=1266%2C1534&amp;ssl=1" data-orig-size="1266,1534" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;Screenshot&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;Screenshot&quot;,&quot;orientation&quot;:&quot;0&quot;}" data-image-title="Screenshot" data-image-description="" data-image-caption="&lt;p&gt;▲Gemini 2.0で出てきた意味不明な出力例&lt;/p&gt;
" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?fit=728%2C882&amp;ssl=1" class="size-large wp-image-29395" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?resize=728%2C882&#038;ssl=1" alt="" width="728" height="882" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?resize=845%2C1024&amp;ssl=1 845w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?resize=248%2C300&amp;ssl=1 248w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?resize=768%2C931&amp;ssl=1 768w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?w=1266&amp;ssl=1 1266w" sizes="auto, (max-width: 728px) 100vw, 728px" /><p id="caption-attachment-29395" class="wp-caption-text">▲Gemini 2.0で出てきた意味不明な出力例</p></div></p>
<p>最初、高性能なGemini 2.0で文字起こししたときはなぜか「うーんうーん」という意味不明な呟きだったり、「○○○○○○」というエラー？が大量生産されてしまいましたが、Gemini 1.5 Proで設定したら、外注しているテープ起こしサービスよりも高精度の文字起こしが出来てびっくり。</p>
<p><div id="attachment_29396" style="width: 738px" class="wp-caption alignnone"><img data-recalc-dims="1" loading="lazy" decoding="async" aria-describedby="caption-attachment-29396" data-attachment-id="29396" data-permalink="https://pukuo-pukupuku.com/archives/llm_transcript_1.html/screenshot-36" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?fit=1236%2C648&amp;ssl=1" data-orig-size="1236,648" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;Screenshot&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;Screenshot&quot;,&quot;orientation&quot;:&quot;0&quot;}" data-image-title="Screenshot" data-image-description="" data-image-caption="&lt;p&gt;▲文字起こしが出来た部分をちょっとだけ。これだけ文字起こししてくれたら外注不要になりますね&lt;/p&gt;
" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?fit=728%2C382&amp;ssl=1" class="size-large wp-image-29396" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?resize=728%2C382&#038;ssl=1" alt="" width="728" height="382" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?resize=1024%2C537&amp;ssl=1 1024w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?resize=300%2C157&amp;ssl=1 300w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?resize=768%2C403&amp;ssl=1 768w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?w=1236&amp;ssl=1 1236w" sizes="auto, (max-width: 728px) 100vw, 728px" /><p id="caption-attachment-29396" class="wp-caption-text">▲文字起こしが出来た部分をちょっとだけ。これだけ文字起こししてくれたら外注不要になりますね</p></div></p>
<h3>プロンプト</h3>
<p>なお、冒頭で紹介した文字起こしサービスと違って、LLMでは文字起こしをするにしてもプロンプトでどのように音声データを処理してほしいかお願いする必要があります。</p>
<p>今回試したのは次のとおり。</p>
<p><div class="c_box intitle glay_box type_normal"><div class="box_title"><span class="span__box_title">今回のプロンプト</span></div>この会議の録音音声を、日本語で書き起こしてください。原文は可能な限り変更せず、「えーっと」、「え、」、「あ、」などの意味のない音声のみ削除してください。話者分離を行ってください。文章は適宜改行を入れ、話者が変わる際は空白行を入れて読みやすくしてください。</div></p>
<p>なお、AIの制限上ある程度の文字起こしをすると止まってしまうので、「続きをやって」なんていうふうにするとどんどんと文字起こしをしてくれます。</p>
<p>この辺りはまたもっと良いプロンプトができたら残しておきたいと思います。</p>
<p>&nbsp;</p>
<p>さっと手軽に使うのであれば、PLAUD Noteシリーズも良さそうだなと思いました。<br />
</p>The post <a href="https://pukuo-pukupuku.com/archives/llm_transcript_1.html">ここ最近はずっと会議用の文字起こしソフト探しからの生成AIにはまっていました。</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></content:encoded>
					
					<wfw:commentRss>https://pukuo-pukupuku.com/archives/llm_transcript_1.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">29392</post-id>	</item>
	</channel>
</rss>
