国立情報研監修  おしゃべりなコンピュータ

             音声合成技術の現在と未来 (2015) 

2016.8.19

●  はじめに

 国立情報学研究所は、新書版の丸善ライブラリーに、情報研シリーズと称して、研究内容をやさしく紹介しています。

サイエンス・ライターも参加して読みやすい内容にしているのが特徴で、本書も、山岸、徳田、戸田ら三人の研究者に

みわよしこさんというフリーランス・ライターが加わっています。

 

 第1章「コンピュータの声」に囲まれた私たちの日常 では、交通機関や商業施設でのアナウンスが、人間の声からコンピュータの声に

かなり置き換わっている現状が紹介されます。現場の担当者が文字テキストを書き換えるだけで放送内容の変更追加ができるので、

彼らの業務の内容と質に大きな変化を与えるというメリットがあるそうです。

 第1章の最後に、名古屋工業大学の正門の大型ディスブレーに映し出されている「メイちゃん」という看板娘が紹介されます。

音声認識機能ももっているわけですが、「学生食堂はどこですか?」というような想定内の質問にはちゃんと答えてくれます。

「彼氏はいますか?」のようなふざけた質問には、怒った表情で、「怒りますよ!」と答えるようです。

 最近では、ヒューマノイドによる案内嬢、受付嬢も登場していますので、急速に広まっていくでしょうね。

 

 第2章 歌うコンピュータ では、器楽だけではつまらないと思っていたDTM愛好家が、2007年8月のボーカロイド「初音ミク」の

登場により、「歌」が作れるようになったことが紹介されます。 初音ミクの可愛らしい声は、声優の藤田咲さんの声から作ったものです。

 2013年に、CeVIOプロジェクトによって開発された女声の「さとうさらら」「すずきつづみ」、男声の「タカハシ」は、完全にコンピュータによって

音声合成されたものです。「元気」「普通」「悲しみ」「怒り」といった感情を容易に設定することができます。

歌を歌えるのは「さとうさらら」だけですが、発声タイミング・高さ・大きさ・ビブラートなどの表情を細かく指定することができます。

ツールが無料で公開されていますので、多くの人のクリエイティブ活動に活発に使われることが期待されています。

 

 第3章 化けるコンピュータ では、片思いの彼女に話しかけてもらえるように音声合成につとめるマサトくんの話が紹介されます。

道義的に微妙な感じがすると思う方のために、「ご安心ください。この物語は完全なフィクションです。」と結んでいます。

 2014年12月に、ミュージシャンhideの生誕50周年を記念して新曲「子 ギャル」がリリースされました。

hideは、このアルバムのレコーディング中に他界してしまい、ヴォーカルの録音ができておらず、長らく幻の新曲となっていましたが、

残されたhideの声をもとに音声合成して、リリースにつながったということです。

 

 第4章 踏み越えるコンピュータ では、難病のALSで声を失った人達の、自分の声で話したいという切実な願いにこたえるための

音声合成の話が紹介されます。

 第5章 話すコンピュータ は、言葉の壁を乗り越えるための通訳コンピュータの話ですが、機械翻訳はまだまだ難しそうです。

 第6章 おしゃべりなコンピュータの未来 では、「振り込め詐欺」などへの悪用の危険があることが指摘されます。

 

 

ホームページアドレス: http://music.geocities.jp/enjoydtm/


自分のホームページを作成しようと思っていますか?
Yahoo!ジオシティーズに参加