<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生成AI | ぷくおの物欲まみれ</title>
	<atom:link href="https://pukuo-pukupuku.com/archives/tag/%e7%94%9f%e6%88%90ai/feed" rel="self" type="application/rss+xml" />
	<link>https://pukuo-pukupuku.com</link>
	<description>なんでも「ある」ブログ</description>
	<lastBuildDate>Thu, 27 Feb 2025 04:05:18 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	

<image>
	<url>https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2018/12/cropped-d9bec980eae5dddc0e202b1a3203f68a.jpg?fit=32%2C32&#038;ssl=1</url>
	<title>生成AI | ぷくおの物欲まみれ</title>
	<link>https://pukuo-pukupuku.com</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">152258915</site>	<item>
		<title>AlexaがAIで超進化！「Alexa+」発表！　自然な会話、記憶力、自動タスク実行…どこまで賢くなる？</title>
		<link>https://pukuo-pukupuku.com/archives/alexa-plus_feb2025.html</link>
					<comments>https://pukuo-pukupuku.com/archives/alexa-plus_feb2025.html#respond</comments>
		
		<dc:creator><![CDATA[pukuo]]></dc:creator>
		<pubDate>Thu, 27 Feb 2025 03:40:56 +0000</pubDate>
				<category><![CDATA[ニュース]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[Alexa]]></category>
		<category><![CDATA[Amazon]]></category>
		<category><![CDATA[アレクサ]]></category>
		<category><![CDATA[アレクサプラス]]></category>
		<category><![CDATA[生成AI]]></category>
		<guid isPermaLink="false">https://pukuo-pukupuku.com/?p=29544</guid>

					<description><![CDATA[<p>Amazonが2月26日にニューヨークで開催した製品発表イベントで、AIを搭載したAlexaの大型アップデート「Alexa+」を発表しました。まるでSFの世界が近づいてきたような、驚きの進化を遂げているんです！ 今回の「...</p>
The post <a href="https://pukuo-pukupuku.com/archives/alexa-plus_feb2025.html">AlexaがAIで超進化！「Alexa+」発表！　自然な会話、記憶力、自動タスク実行…どこまで賢くなる？</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></description>
										<content:encoded><![CDATA[<p>Amazonが2月26日にニューヨークで開催した製品発表イベントで、AIを搭載したAlexaの大型アップデート「Alexa+」を発表しました。まるでSFの世界が近づいてきたような、驚きの進化を遂げているんです！</p>
<p>今回の「Alexa+」、一体何がすごいのか？どこまで進化するのか？気になるポイントを早速チェックしていきましょう！</p>
<h2>まるで人間！自然で記憶力も抜群に進化したAlexa+</h2>
<p>従来のAlexaとは一線を画す「Alexa+」の最大の特徴は、<strong>生成AI</strong>を搭載したことによる、驚異的な進化です。具体的に見ていきましょう。</p>
<ol>
<li><strong>会話が自然で流暢に！文脈も理解</strong><br />
これまでのAlexaは、どうしても機械的な印象がありましたが、「Alexa+」では、より人間らしい、自然で流暢な会話が可能になります。会話の文脈を理解し、適切な応答ができるようになったというのは、まさにAIの進化を感じさせますね。</li>
<li><strong>長い会話も記憶！過去の質問も覚えている</strong><br />
驚くべきは、長い会話を記憶し、以前の質問を覚えていること。これにより、まるで人間同士のような、より深く、継続的な対話が実現できるのだそう。今のアレクサは連続での会話をサポートしていますが、実際使っていると直前の話を無視してしまったりするので期待大です。</li>
<li><strong>ユーザーを学習！好みや生活リズムに合わせた個別対応</strong><br />
AIの得意技、パーソナライズも進化。「Alexa+」は、ユーザーの好みや日常生活のリズムを学習し、個別化された対応が可能になります。使えば使うほど、自分好みに進化していくAIアシスタントって、まさに理想的。とはいえ、我が家は家族で利用しているので、そのあたりがどのようにパーソナライズされていくのかも気になるところ。</li>
<li><strong>家族のあれこれも記憶！レシピから重要日、食事の好みまで</strong><br />
家族のレシピや重要な日付、食事の好みなどを記憶し、適切な提案ができるようになるのも嬉しいポイント。家族みんなでAlexa+を共有すれば、より便利で快適なスマートホームが実現しそうです。</li>
</ol>
<h2>スマートホームをさらに賢く！高度なタスクも自動実行</h2>
<img data-recalc-dims="1" fetchpriority="high" decoding="async" data-attachment-id="29546" data-permalink="https://pukuo-pukupuku.com/archives/alexa-plus_feb2025.html/%e3%82%b9%e3%82%af%e3%83%aa%e3%83%bc%e3%83%b3%e3%82%b7%e3%83%a7%e3%83%83%e3%83%88-2025-02-27-125721" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/02/437aefdd6a8758c2391a86c8796e0316.jpg?fit=1356%2C829&amp;ssl=1" data-orig-size="1356,829" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}" data-image-title="スクリーンショット 2025-02-27 125721" data-image-description="" data-image-caption="" data-medium-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/02/437aefdd6a8758c2391a86c8796e0316.jpg?fit=300%2C183&amp;ssl=1" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/02/437aefdd6a8758c2391a86c8796e0316.jpg?fit=728%2C445&amp;ssl=1" class="alignnone size-large wp-image-29546" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/02/437aefdd6a8758c2391a86c8796e0316.jpg?resize=728%2C445&#038;ssl=1" alt="" width="728" height="445" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/02/437aefdd6a8758c2391a86c8796e0316.jpg?resize=1024%2C626&amp;ssl=1 1024w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/02/437aefdd6a8758c2391a86c8796e0316.jpg?resize=300%2C183&amp;ssl=1 300w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/02/437aefdd6a8758c2391a86c8796e0316.jpg?resize=768%2C470&amp;ssl=1 768w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2025/02/437aefdd6a8758c2391a86c8796e0316.jpg?w=1356&amp;ssl=1 1356w" sizes="(max-width: 728px) 100vw, 728px" />
<p>「Alexa+」の進化は、会話だけにとどまりません。スマートホームをさらに賢く便利にする、様々な新機能が追加されています。</p>
<ol>
<li><strong>デバイス連携がパワーアップ！より高度なタスクが可能に</strong><br />
音楽の部屋間移動、Fire TVでの特定シーンへのスキップ、Ring カメラを使用した家の周りの出来事の要約など、より高度なタスクを実行できるようになります。スマートホームデバイスとの連携がさらに深まり、Alexa+が中心となって家全体をコントロールしてくれる未来が想像できます。</li>
<li><strong>文書やメールも記憶！後で質問に答えてくれる</strong><br />
なんと、「Alexa+」は文書やメールの内容を記憶し、後で質問に答えることができるようになります。これは、仕事で忙しい時など、後で確認したい情報をAlexa+に記憶させておけば、必要な時にすぐに教えてもらえる、という便利な使い方ができそうですね。</li>
<li><strong>600万以上のデバイスと連携！スマートホーム管理をもっと賢く</strong><br />
600万以上のAlexaデバイスと連携し、より賢くホームを管理できるようになります。既にAlexaと連携ができるPhilips HueやRoborockなどの製品との連携も今まで以上に強化され、スマートホームのハブとしてのAlexa+の役割がますます重要になりそうです。</li>
<li><strong>インターネットを自動操作！ユーザーに代わってタスクを完了</strong><br />
そして、驚くべき機能が、インターネットを自動的に操作して、ユーザーに代わってタスクを完了できること。例えば、オーブンの修理サービスを自動的に手配してくれる、なんてことも可能になるそうです。これはまさに、SF映画に出てくるような未来のAIアシスタントそのものですね！</li>
<li><strong>様々なデバイスで利用可能！デバイス間での連携もシームレス</strong><br />
Echoデバイスだけでなく、モバイルアプリ、ブラウザベースの体験など、様々なデバイスでAlexa+を利用できるようになります。デバイス間で会話の文脈を維持し、シームレスに対話を継続できるというのも嬉しいポイントです。</li>
</ol>
<h2>気になる料金と対応デバイス、日本語対応は？</h2>
<p>これだけ進化した「Alexa+」、気になるのは料金と手持ちのEchoデバイスで使えるかどうか、そして日本語対応ですよね。</p>
<h3>料金は？</h3>
<p>「Alexa+」は、<strong>Amazon Primeユーザーには無料</strong>で提供されるとのこと！Prime会員なら、追加料金なしで最新のAIアシスタントが使えるなんて、太っ腹！　ただし、Alexaを全く使わない人ならAlexa＋はいらないのでAmazonPrimeの広告導入をやめてほしいと思ったりもしそうですね&#8230;<br />
Amazon Prime会員以外の場合は、<strong>月額19.99ドル</strong>で利用可能。月額料金は少々高めですが、モバイルのAlexaアプリやどのブラウザからでもアクセス可能とのことなので、基本的な生成AIの使用感が他LLMと変わらないのであれば、Alexaデバイスとの連携や各種サービスとの接続ができるAlexa＋もありかもしれないですね。</p>
<h3>対応デバイスは？</h3>
<p>多くの従来のEchoデバイスが「Alexa+」に対応しますが、<strong>一部の古い世代のデバイスは非対応</strong>となります。お手持ちのデバイスが対応しているか、以下のリストで確認してみてください。</p>
<p><strong>早期対応デバイス（※アメリカ版なので、日本は不明）</strong></p>
<ul>
<li>Echo Show21</li>
<li>Echo Show15</li>
<li>Echo Show10</li>
<li>Echo Show8</li>
</ul>
<p><strong>対応デバイス</strong></p>
<ul>
<li>Echo（第2世代以降）</li>
<li>Echo Dot（第2世代以降）</li>
<li>Echo Pop</li>
<li>Echo Spot（第2世代）</li>
<li>Echo Show（第2世代以降）</li>
</ul>
<p><strong>非対応デバイス</strong></p>
<ul>
<li>Echo（第1世代）</li>
<li>Echo Dot（第1世代）</li>
<li>Echo Plus（第1世代）</li>
<li>Echo Tap</li>
<li>Echo Spot（第1世代）</li>
</ul>
<h3>日本語対応は？</h3>
<p>残念ながら、現時点では「Alexa+」の<strong>日本語対応については具体的な情報は発表されていません</strong>。しかし、従来のAlexaでは日本語と英語のマルチリンガルモードが利用可能であることを考えると、今後のアップデートで日本語対応も期待できるかもしれません。続報に期待しましょう！</p>
<h2>まとめ：Alexa+でスマートホームが次のレベルへ！</h2>
<p>今回の発表で、Alexaは単なる音声アシスタントから、より家庭内の秘書のような AIパートナーへと進化を遂げたと言えるでしょう。「Alexa+」によって、スマートホームは次のレベルへと進み、私たちの生活は便利で豊かになるはず。</p>
<p>特に、インターネットを自動的に操作してタスクを完了してくれる機能は、まさにゲームチェンジャー。逆に、開発はしているようですがいまいちパッとしないAppleのホームデバイスはますます差を付けられた感がありますね。</p>
<div class="btn-wrap aligncenter simple"><a target="_blank" href="https://www.amazon.com/dp/B0DCCNHWV5">Alexa＋（英語サイト）</a></div>
<p>&nbsp;</p>The post <a href="https://pukuo-pukupuku.com/archives/alexa-plus_feb2025.html">AlexaがAIで超進化！「Alexa+」発表！　自然な会話、記憶力、自動タスク実行…どこまで賢くなる？</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></content:encoded>
					
					<wfw:commentRss>https://pukuo-pukupuku.com/archives/alexa-plus_feb2025.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">29544</post-id>	</item>
		<item>
		<title>ここ最近はずっと会議用の文字起こしソフト探しからの生成AIにはまっていました。</title>
		<link>https://pukuo-pukupuku.com/archives/llm_transcript_1.html</link>
					<comments>https://pukuo-pukupuku.com/archives/llm_transcript_1.html#respond</comments>
		
		<dc:creator><![CDATA[pukuo]]></dc:creator>
		<pubDate>Sun, 29 Dec 2024 01:15:51 +0000</pubDate>
				<category><![CDATA[4.ガジェット]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[AI議事録取れる君]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[Gemini]]></category>
		<category><![CDATA[LLM]]></category>
		<category><![CDATA[notta]]></category>
		<category><![CDATA[スマート書記]]></category>
		<category><![CDATA[文字起こし]]></category>
		<category><![CDATA[生成AI]]></category>
		<guid isPermaLink="false">https://pukuo-pukupuku.com/?p=29392</guid>

					<description><![CDATA[<p>久しぶりの投稿となってしまいましたが、タイトルにあるようにここ最近はずっと会議用の文字起こしソフト探しからの生成AIにはまっていました。 仕事でつきものなのが議事録。ぷくおが議事録作成担当だったのはかなり昔のことですが、...</p>
The post <a href="https://pukuo-pukupuku.com/archives/llm_transcript_1.html">ここ最近はずっと会議用の文字起こしソフト探しからの生成AIにはまっていました。</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></description>
										<content:encoded><![CDATA[<img data-recalc-dims="1" decoding="async" data-attachment-id="29399" data-permalink="https://pukuo-pukupuku.com/archives/llm_transcript_1.html/image-579" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?fit=400%2C335&amp;ssl=1" data-orig-size="400,335" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}" data-image-title="image" data-image-description="" data-image-caption="" data-medium-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?fit=300%2C251&amp;ssl=1" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?fit=400%2C335&amp;ssl=1" class="size-full wp-image-29399 aligncenter" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?resize=400%2C335&#038;ssl=1" alt="" width="400" height="335" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?w=400&amp;ssl=1 400w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/image.png?resize=300%2C251&amp;ssl=1 300w" sizes="(max-width: 400px) 100vw, 400px" />
<p>久しぶりの投稿となってしまいましたが、タイトルにあるようにここ最近はずっと会議用の文字起こしソフト探しからの生成AIにはまっていました。</p>
<p>仕事でつきものなのが議事録。ぷくおが議事録作成担当だったのはかなり昔のことですが、とはいえ今も変わらず会議をやったら議事録が必要で、それに時間と大きな会議では文字起こしを外注するコストが気になっていました。</p>
<h2>文字起こしサービスを試してみた</h2>
<p>そんな訳で、文字起こしをしてくれるサービスを検索してみると、AIを利用して高精度に文字起こしができる！とうたわれたサービスがいくつも出てきます。</p>
<p>数ある製品の中で、次の条件で絞ってみました。</p>
<ul>
<li><strong>話している人の自動分離（話者分離・識別）</strong></li>
<li><strong>用語登録が可能かどうか</strong></li>
<li><strong>会議中にリアルタイムで文字起こしをした際に、タイムスタンプをつけられるか（発言が不明瞭で明らかに後で修正が必要なところとか）</strong></li>
<li><strong>「あー」とか「えー」といった不要な言葉の除去（フィラー処理というらしい）</strong></li>
<li><strong>Teams等と連携して、できた議事録や議事概要をすぐに展開できるか</strong></li>
</ul>
<p>こうして見つけてきたのが「<a target="_blank" href="https://gijirokukun.com/">AI議事録取れる君</a>」や「<a target="_blank" href="https://www.smartshoki.com/">スマート書記</a>」、「<a target="_blank" href="https://www.notta.ai">Notta</a>」といったサービス。</p>
<p>どれも有料サービスで、AI議事録取れる君だけはスマホやタブレットからの利用は不可（様々なブラウザで設定を変えてもだめでした）以外はある意味似たり寄ったりで、ファイルをアップロードして文字起こしすることも可能。</p>
<p><strong>個人的には大企業や東京都でも利用されているというスマート書記が、多少高価ではあるものの期待していたのですが、正直ICレコーダーで録音した会議の音声を文字起こしした感想はどれもイマイチ。</strong></p>
<p>概要だとそれらしくまとまっていますが、発言を一つ一つ見てみると、逆によく概要をまとめたなと思えるような出来栄えで、断定で終わっているのに文字起こしでは「？」の疑問形で終わってたりしていて、まだまだ高いけど外注するしかないと思っていました。</p>
<p>なお、この３サービスのテストを終えた後に「<a target="_blank" href="https://securememo-cloud.com">SecureMemoCloud</a>」というサービスを見つけたのですが、こちらはほぼ完成版の議事録を作成できる！と書かれていて、こちらも大手企業で使用されているのでかなりうまくいくのかもしれません。</p>
<h2>大規模生成AI「Gemini」を試したら驚きの結果に</h2>
<p><strong>文字起こしソフトの利用を諦めかけていた頃に見つけたのが、Googleの大規模言語モデル（LLM）である「Gemini」。</strong></p>
<p>Geminiは最近バージョン2が登場して、一番有名と思われるChatGPTの高性能版と同じぐらいの性能だと言われていますが、GeminiはGoogle AI Studioというサービスを利用すれば単独で音声ファイルや画像認識ができるのが特徴（2024年末現在、ChatGPTは同社のWhisperというモデルを使用しないと録音データの入力ができなかった）。</p>
<div id="attachment_29397" style="width: 738px" class="wp-caption alignnone"><img data-recalc-dims="1" decoding="async" aria-describedby="caption-attachment-29397" data-attachment-id="29397" data-permalink="https://pukuo-pukupuku.com/archives/llm_transcript_1.html/screenshot-37" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?fit=2418%2C2014&amp;ssl=1" data-orig-size="2418,2014" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;Screenshot&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;Screenshot&quot;,&quot;orientation&quot;:&quot;1&quot;}" data-image-title="Screenshot" data-image-description="" data-image-caption="&lt;p&gt;Screenshot&lt;/p&gt;
" data-medium-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?fit=300%2C250&amp;ssl=1" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?fit=728%2C606&amp;ssl=1" class="size-large wp-image-29397" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=728%2C606&#038;ssl=1" alt="" width="728" height="606" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=1024%2C853&amp;ssl=1 1024w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=300%2C250&amp;ssl=1 300w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=768%2C640&amp;ssl=1 768w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=1536%2C1279&amp;ssl=1 1536w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?resize=2048%2C1706&amp;ssl=1 2048w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?w=1456&amp;ssl=1 1456w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/b613181e61e3ee52d162a43bda1db03c.jpg?w=2184&amp;ssl=1 2184w" sizes="(max-width: 728px) 100vw, 728px" /><p id="caption-attachment-29397" class="wp-caption-text">Screenshot</p></div>
<p>画面右上にあるモデルから利用したいAIモデルを選択し、画面下の＋ボタンから文字起こししたい録音データをアップロード。そして下のチャット欄に「このデータを日本語で文字起こしして」なんて感じで命令するとどんどんと文字起こししてくれます。</p>
<div id="attachment_29395" style="width: 738px" class="wp-caption alignnone"><img data-recalc-dims="1" loading="lazy" decoding="async" aria-describedby="caption-attachment-29395" data-attachment-id="29395" data-permalink="https://pukuo-pukupuku.com/archives/llm_transcript_1.html/screenshot-35" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?fit=1266%2C1534&amp;ssl=1" data-orig-size="1266,1534" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;Screenshot&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;Screenshot&quot;,&quot;orientation&quot;:&quot;0&quot;}" data-image-title="Screenshot" data-image-description="" data-image-caption="&lt;p&gt;▲Gemini 2.0で出てきた意味不明な出力例&lt;/p&gt;
" data-medium-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?fit=248%2C300&amp;ssl=1" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?fit=728%2C882&amp;ssl=1" class="size-large wp-image-29395" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?resize=728%2C882&#038;ssl=1" alt="" width="728" height="882" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?resize=845%2C1024&amp;ssl=1 845w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?resize=248%2C300&amp;ssl=1 248w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?resize=768%2C931&amp;ssl=1 768w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/c7d52efca94a4de327eeeb1a42e53e6b.jpg?w=1266&amp;ssl=1 1266w" sizes="auto, (max-width: 728px) 100vw, 728px" /><p id="caption-attachment-29395" class="wp-caption-text">▲Gemini 2.0で出てきた意味不明な出力例</p></div>
<p>最初、高性能なGemini 2.0で文字起こししたときはなぜか「うーんうーん」という意味不明な呟きだったり、「○○○○○○」というエラー？が大量生産されてしまいましたが、Gemini 1.5 Proで設定したら、外注しているテープ起こしサービスよりも高精度の文字起こしが出来てびっくり。</p>
<div id="attachment_29396" style="width: 738px" class="wp-caption alignnone"><img data-recalc-dims="1" loading="lazy" decoding="async" aria-describedby="caption-attachment-29396" data-attachment-id="29396" data-permalink="https://pukuo-pukupuku.com/archives/llm_transcript_1.html/screenshot-36" data-orig-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?fit=1236%2C648&amp;ssl=1" data-orig-size="1236,648" data-comments-opened="1" data-image-meta="{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;Screenshot&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;Screenshot&quot;,&quot;orientation&quot;:&quot;0&quot;}" data-image-title="Screenshot" data-image-description="" data-image-caption="&lt;p&gt;▲文字起こしが出来た部分をちょっとだけ。これだけ文字起こししてくれたら外注不要になりますね&lt;/p&gt;
" data-medium-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?fit=300%2C157&amp;ssl=1" data-large-file="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?fit=728%2C382&amp;ssl=1" class="size-large wp-image-29396" src="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?resize=728%2C382&#038;ssl=1" alt="" width="728" height="382" srcset="https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?resize=1024%2C537&amp;ssl=1 1024w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?resize=300%2C157&amp;ssl=1 300w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?resize=768%2C403&amp;ssl=1 768w, https://i0.wp.com/pukuo-pukupuku.com/wp-content/uploads/2024/12/72236ff3b9f53d42090cade4b1935d95.jpg?w=1236&amp;ssl=1 1236w" sizes="auto, (max-width: 728px) 100vw, 728px" /><p id="caption-attachment-29396" class="wp-caption-text">▲文字起こしが出来た部分をちょっとだけ。これだけ文字起こししてくれたら外注不要になりますね</p></div>
<h3>プロンプト</h3>
<p>なお、冒頭で紹介した文字起こしサービスと違って、LLMでは文字起こしをするにしてもプロンプトでどのように音声データを処理してほしいかお願いする必要があります。</p>
<p>今回試したのは次のとおり。</p>
<div class="c_box intitle glay_box type_normal"><div class="box_title"><span class="span__box_title">今回のプロンプト</span></div>この会議の録音音声を、日本語で書き起こしてください。原文は可能な限り変更せず、「えーっと」、「え、」、「あ、」などの意味のない音声のみ削除してください。話者分離を行ってください。文章は適宜改行を入れ、話者が変わる際は空白行を入れて読みやすくしてください。</div>
<p>なお、AIの制限上ある程度の文字起こしをすると止まってしまうので、「続きをやって」なんていうふうにするとどんどんと文字起こしをしてくれます。</p>
<p>この辺りはまたもっと良いプロンプトができたら残しておきたいと思います。</p>
<p>&nbsp;</p>
<p>さっと手軽に使うのであれば、PLAUD Noteシリーズも良さそうだなと思いました。<br />The post <a href="https://pukuo-pukupuku.com/archives/llm_transcript_1.html">ここ最近はずっと会議用の文字起こしソフト探しからの生成AIにはまっていました。</a> first appeared on <a href="https://pukuo-pukupuku.com">ぷくおの物欲まみれ</a>.]]></content:encoded>
					
					<wfw:commentRss>https://pukuo-pukupuku.com/archives/llm_transcript_1.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">29392</post-id>	</item>
	</channel>
</rss>
