🧠 概要:
概要
この記事では、特に合成音声を作成するために自分用の録音ツールを開発したことについて述べています。筆者は、「ゲーミングアロエ」名義で、合成音声を自分の声で作ることに挑戦しており、様々なツールを試しながら、自分のニーズに合わせた録音ツール「AloeVoiceRecorder」を作成した経緯が語られています。
要約
- 筆者は自分の声を使った合成音声を作りたいと考えている。
- いくつかのツール(coefontやUTAU)を試したが、結果に満足できなかった。
- 特に、coefontでは自分の声の収録には追加のポイントが必要で、無課金では自由に使えなかった。
- UTAUでは発音に課題があり、まずは話す能力を向上させたい。
- さらに効果的な方法を模索してTTS技術を検討し、自分用の音声データを収録するツールを作ることを決心。
- プログラミングの知識はなかったが、自分でアプリを作成することに挑戦。
- 開発したアプリ「AloeVoiceRecorder」は、セリフをCSVから読み込み、録音ができる機能を持つ。
- 自分の声を使った合成音声を作成することを目標に、録音ツールの使い勝手を向上させることを楽しんでいる。
こんにちは、ゲーミングアロエだよ~♥
相変わらずなんの知識もなく、なんとなく自分の声で合成音声を作りたいと思ってcoefontとかUTAUをちょっと試してみたんだけど、試した結果思ったことが【coefontの場合】・手始めに800文収録してそれなりに良いかも?って思ったあとにもっと収録したら精度上がって良いのかなって思って、2800文(収録できるMAXは3000文とかだった気がする)やってみたけど800分のときよりイマイチな仕上がりになっちゃったのでボツ。
またとりなおそうかなと思いつつなんとこれ自分の声で収録したものを使うのにもポイントが必要っぽくて自分の声なのに課金しないと全然自由に使えないので(サービス的には仕方ないけど)収録の手間に見合うのか…?ってなった。よくわからないうちに最初に付与されたポイントつかいきっててもうサンプル再生以外では無課金で聴けないという…
ちなみにわたしのcoefont(800文収録)はこれ↓
【UTAUの場合】
・なんとか連続音?とかいうので収録して原音調整とかもよくわからないながらも歌わせられた。けど、ところどころ発音おかしいところがあったり課題ありありだけど歌わせるより先にまず話すのをしっかりできたらいいなって思った
からなんかもう他の方法で作れないかな?って思ってとりあえずTTS(Text-To-Speechの略らしい)とかいうのでやってみることにした🎀
全く知識がないので当然なにをやったら良いかわからず、GPTとGeminiを行き来して必要なことっぽいものが若干わかってきた。とりあえずまず学習させるための自分の声の音声データ的なのが必要で、それを録音するのに適したツールはすでにいろいろあるらしいのだけど使い方覚えるの大変そうだから自分用のものをつくることにした♥
(全くプログラミングはわからないけどこの数週間でいくつかアプリを作ったのでなんとなくそのほうが良い気がした🌵というかシンプルにAIに聞きながらアプリをつくるのにハマっている)
じゃーん
配色がかわいいでしょ
ひとまず完成したのがAloeVoiceRecorder(アロエボイスレコーダー)!
なんかセリフとか書いてあるCSVを読み込んで、セリフを見ながら録音できる。UTAUの挑戦で使ったoremoを参考にしつつ録音に必要そうな機能をつけた🎀
自分の好きなファイル名+連番で保存できるようにしたのでたぶんあとでデータが扱いやすいとおもう(よくわからないけど)
exe化してすぐ使えるようになったのでおそらく使うとき便利🌵
保存先フォルダを隠す機能は普段絶対いらないけどこのnoteみたいにスクショを貼りたいとき画像加工で隠すのだるいからつけたwww
ということで、ちょくちょくすすめて最終的に自分の声でペラペラ喋る合成音声をつくれたらいいなって感じ!
ばいばーい
Views: 1