スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

音声合成 wavファイルの再生

画像をいじっていたら,今度は音も出してみたくなった.
ということで今日はロボットに今流行の音声デモをやらせるべく,wavファイルの再生プログラムにトライ.Windowsでwavファイルを再生するのはとてもカンタン.mmsystem.hをインクルードしてPlaySound()関数にファイル名を渡すだけ.(VC++6.0の基本プログラムはここ.)

Txtのセリフを音声合成させるには,MicrosoftのTxt To Speech機能(Agentというらしい)を使うのがいちばん手っ取り早い.Windows-XPでは標準で英語がインストールされていて,追加で日本語Agentもダウンロードできる.これを応用したフリーソフトもたくさんあり,プログラムに組み込むことも出来そうだ.
ただ,音声品質は「とりあえず意味は通じる」というレベルであり,お世辞にも流暢とはいえない(特に日本語).これは,一つ一つの言葉を母音や子音の組み合わせで一から構築しているためだろう.一方,多数の単語を人の肉声からサンプリングしておいて,これをうまくつながるように組み合わせて文にする方法もある.この方式での音声合成アルゴリズムがここで試せる.

同じサンプルで比較したもの(wavファイル):
①MicroSoftのテキストスピーチ(日本語-女性)
②PENTAXの音声合成(日本語-女性)

①MicroSoftのテキストスピーチ(英語-男性)
②PENTAXの音声合成(英語-女性)

②のほうが圧倒的に自然な会話に近いことがわかる.②の方式は大容量のメモリーを必要とするのがネックだが,最近は不揮発メモリの大容量化が著しいので,おそらくこっちのほうが今後は主流になるだろう.そのうち組み込みマイコンでも十分再生可能になるに違いない.


スポンサーサイト

この記事へのコメント

トラックバック

URL :

プロフィール

もやね

Author:もやね
長野県在住の会社員(メカニカル・エンジニア).
ロボットは完全な趣味としてやってます.
E-mail:
mo_ya_ne[a]yahoo.co.jp
[a]⇒@

最近の記事
最近のコメント
最近のトラックバック
月別アーカイブ
カテゴリー
FC2カウンター
ブログ内検索
RSSフィード
リンク
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。