音声入力をもっと「使える音声入力」にしてくれるAI
2026年は毎月新しいことを何かひとつはやってみるということで、
1月 チャットGPT(AI)Pro版1ヶ月お試し
2月 Obsidian(メモアプリ)導入、Gemini(GoogleのAI)に課金
3月 NotebookLM(AI)を使い始める
4月 Aqua Voiceに月額の課金←イマココ!!

Gemini に Aqua Voice について聞いてみた。
>>Aqua Voiceとはどんなものか、簡単に教えて!
Aqua Voiceは、一言で言えば**「声でドキュメントを作成・編集することに特化した、AI音声メモアプリ」**です。
単なる文字起こしツールとは異なり、AI(LLM)を活用して「話した内容を構造化し、整える」ことに重点を置いています。主な特徴は以下の通りです。
主な特徴と機能
- 音声による編集(Voice-first Editing): 録音したあとに「今の内容を箇条書きにして」「この部分をもう少し丁寧に書き直して」といった指示を声で出すだけで、AIがテキストを書き換えてくれます。
- 高い要約・整形能力: 独り言のようなとりとめのない話でも、文脈を汲み取ってタイトルを付けたり、議事録やブログの下書き、タスクリストなどの形式に整えたりするのが得意です。
- マルチデバイス対応: iPhoneアプリやWebブラウザから利用でき、外出先で録音したものを後からPCで整理するといった連携がスムーズです。
- 直感的な操作: 録音ボタンを押して話すだけなので、キーボード入力を介さずに思考をそのまま言語化できます。
どんな人に向いているか
「書き起こされた文章を後から手動で直すのが面倒」と感じる方や、歩きながら、あるいは家事などの作業をしながら思考を整理して、そのまま完成度の高いメモを残したいという方に適しています。
最初の音声ジャーナリングは録音してNotebookLMに投げる方法を試してた。
今まで手帳やノートを使ったアナログなジャーナリングをしてきたが、Youtubeで見た「音声ジャーナリング」というのに興味を持ち、やり始めたのがきっかけ。
iPhoneの録音アプリを使ってまずは「年月日と朝のジャーナリング」と言う。あとは思いつくままにひたすらしゃべる。
車を運転しながらになるので、考えたことを書いたりっていうのはできないため、録音であれば思ったこととか今感じていることを話せばいいだけなので簡単。ただ、簡単なんだけど普段しゃべり慣れていないせいか、そんなに長い間思ったことをしゃべり続けられないもんだね。
家に帰ったらNotebookLMに音声データを共有する。録音始めに年月日と「朝のジャーナリング」とか「帰りのジャーナリング」または時間などを入れておくとテキスト化する際に「時系列にまとめて」と伝えると一日の流れを見やすい形でまとめてくれる。
NotebookLMは話した内容をある程度簡潔にまとめてしまうため、いろいろ喋ったわりに出てくる答えがさっぱりしちゃう印象があった。多分その辺はルールの設定をやっていけば解決できる部分ではあるかもしれない。
しかし録音してNotebookLMに共有して、出てきた回答をコピーしてObsidianに貼るという一連の動作はちょっと面倒くさい。
そこで気になっていたAqua VoiceというAI音声メモアプリを導入してみることにしました。入力そのものが音声入力になるので、Obsidianに直接音声で入力することができます。一応初期設定では「えー・・・」とか「あー・・・」とかフィラーと呼ばれる言葉を削除してくれて、しゃべったことをそのまんまにテキスト化してくれるっていう感じ。
ただ、ここで一つ問題点。考えながら喋っていると、同じ言葉を繰り返したり、喋ってたことを言い直したりすることがあるんだけど、それらも全て文字となって入力されてしまい、まとまらない文章がバーッと並ぶような形になってきて、データとして残すのはいいとしても、見返すとなるととても読みにくい文章になっていたんだよね。
そこで今度はGeminiに「Aqua voice」の問題点について聞いてみた。そしたら・・・
「話の内容を要約しすぎず、かつ口語特有の重複や言い直し、フィラー(えー、あのー等)を徹底的に削除して、自然な書き言葉に整えてください。同じ意味の言葉が連続している場合は、最も適切な表現一つにまとめてください。」
と、カスタム設定に指示したらいいですよ!って教えてくれる。
AIのことはAIに聞くのが良いと友人も勝間和代も言っておりました。(注:友人が勝間和代ではありません)
ということで、今こうやって音声を使ってブログを書くことができています。ほんとすげえ。
(ここでiPhone純正の音声入力にチェンジ)
これをiphone13のiPhone純正の音声入力を使うと、こんな感じでこんな感じで各入力することになってしまいます。
IPhone純正っていう言葉をiPhone 13に書き間違えているし、喋ることを迷いながら話していたので、「こんな感じ」という言葉を連続で喋ってたみたいなんだけど、喋った言葉がそのまんま続けて入力されてしまいます。
今、このブログをiPhoneで喋って書いているけれど、フリック入力よりも素早く確実に文字を入力できるっていうのがめちゃくちゃ便利。パソコンであってもタイピングするよりも明らかにしゃべる方が入力スピードが速い。
しばらくブログを更新できてなかったけど、Aqua Voiceを使うことで、これからもっと頻繁に発信活動をしていきたいなと思いました。まる。



