歌声情報処理<情報学>

下手な歌が味のある歌に! ~世界最高峰の音声合成技術者が拓く感動的な歌声の世界

森勢将雅(もりせまさのり)先生

山梨大学 工学部 コンピュータ理工学科/大学院総合研究部

ボーカロイドに馴染んでいる人たちなら、我々では不自然に感じる合成歌唱に人間以上の魅力を感じるかもしれない。コンピュータの合成音で、人間を超える感動的な歌声を作れないか? 世界最高峰の音声合成技術者が挑みます。

まずクイズからどうぞ。次の3つの音声を聴いてください。3つのうち、どれが合成音でしょうか?

答は3つとも合成音。えっ、あれが合成音?、と思った人にタネ明かししましょう。音声は高さと音色で構成されています。音声から高さと音色を精密に取り出せば、人間と同じに聴こえる音声が合成できるのです。これぞ世界最高峰の音声合成技術!

私はこのような音声に関する研究をかれこれ10年続けています。この最高峰の音声合成技術を使って、うれしそうな声を悲しそうな声を混ぜて中間的な声を作るとか、人間とボーカロイドの声を混ぜて新しい表現を生むといった技術を創り出しています。

 

では音声合成技術で、救いがたいオンチな人の歌声をうまく聞こえるようにすることはできるのでしょうか? こちらを聞いてください。

 

この音声映像は「川の流れのように」を歌う男性です。男性の生の歌唱と音声合成をした2つを比較しています。ね、高さだけを加工してやるだけでグンと上手く聴こえるでしょう。 

 

私は、歌詞と譜面を入力し、高低と音色を加工するソフトを作りました。その技術を公開して、二次創作を呼びかけたら、たくさんの作品が集まってきましたよ。

では合成音で、人を感動させる歌声を作ることはできるのでしょうか。

歌声の研究者は、概して、なぜか人間の声、しかもうまい人の声を作りたがりますが、私は、それは絶対条件ではないと考え取り組んでいます。例えば漫画の世界でも、非人間的=不自然ではありませんし、非人間的でも感動させられると思うんです。

 

また、ボーカロイドを聞きなれた世代とそうでない世代で、音の感じ方も違うのかもしれない。それを脳を計測して明らかすべく、今は医学部と協力して実験も進めています。

 

司会者・落合陽一先生×竹川佳成先生の一言

 

竹川先生――コンピュータ合成音は、人間ぽくないけど感動せずにいられないという、このビジョンはすごいですねえ。

落合先生――コンピュータは生活にどう入っていくかって今後の課題ですけど、音楽は一番人の心に語りかけてきますね。

 

興味がわいたら

『おしゃべりなコンピュータ 音声合成技術の現在と未来』

山岸順一、徳田恵一、戸田智基、みわよしこ(丸善出版)

現在の音声合成技術でどのようなことが実現されているのか、さらに、音声合成技術の将来がわかります。理論的なお話は出てこないため、高校生でも気軽に読めると思います。(歌声合成技術については、新しい分野のため、まだこういった本が存在しないのです。)

[出版社のサイトへ]

 

森勢先生インタビュー

歌声情報処理は使われて洗練される。全ての技術は特許を取らず公開

森勢先生インタビュー

山梨大学 工学部 コンピュータ理工学科/大学院総合研究部

歌声情報処理でリードする大学・研究者

※情報処理学会第78回大会 IPSJ-ONE講演より

<慶應義塾大学日吉キャンパス協生館藤原洋記念ホールにて>

他の若手IT研究者の記事を読む

 

⇒先生のプレゼンが見られます(IPSJ-ONEのページへ)

http://ipsj-one.org/2016/videos/2_morise_fs.mp4