歌声情報処理<情報学>

歌声情報処理は使われて洗練される。全ての技術は特許を取らず公開

森勢先生インタビュー

山梨大学 工学部 コンピュータ理工学科/大学院総合研究部

◆先生の専門分野である「歌声情報処理」はどのような分野でしょうか。

 

音声・歌声情報処理は、コンピュータがテキストを読み上げ、表情豊かに歌ってくれる、さらには、ある人の声を別人に変換するボイスチェンジャーなどを作ることができる学問分野です。人間が発話した音声をテキストに変換する音声認識とは異なりますが、音声の分析や、人間が音声をどのように捉えているかなど、共通するところも多いです。

 

人間がどのように音を感じているかについては心理学的側面の追究が、魅力的な歌声合成のためには演奏表現の追究が必要であり、そのためには音楽に関する学問も必要となります。すでに広く使われているVocaloidでは、人間らしくない歌声から人間に近い歌声までたくさんの作品が存在します。合成の方法、演奏表情やイントネーションの加工、人間らしさの知覚など、幅広い分野を横断して研究されているのが音声・歌声情報処理分野の特徴と言えます。

 

◆先生が、発展させようとしているご研究とその方向性は、どのようなものですか。

 

誰でも手軽に音声を録音し加工して楽しめる文化の実現を目指しています。そのためには、高度な音声処理技術を開発し、誰でも使いやすいソフトウェアとして実装することが必要です。現在の技術は、特許により使われにくいなど問題があるため、私は、全ての技術の特許を取らずオープンソースで公開するようにしています。音声合成技術が様々なところで使われ洗練していくことで、計算機がテキストを自分の声で読み上げる、感情豊かに歌う、あるいは、自分の声を別人に変えるボイスチェンジャーなどが実現可能になるでしょう。基盤となるツールを駆使し、様々な人が多様に研究を進めることができる環境を作ることが当面の目標です。

 

◆先生は研究テーマをどのように見つけていますか。

 

これまで実現されていなかったことと、現在の技術でどこまで実現されているかを様々な媒体(新聞・ニュースだけではなく、ニコニコ動画等のインターネット媒体も含む)で調べ、自分でできそうな課題に落とし込むことで研究の種を作っています。

特に歌声合成技術はニコニコ動画にアップロードされることがありますので、それを参考に、例えば「この歌い方はどういう加工なのだろう?」と疑問を持ち、自分にできそうなことを探しています。

 

◆この分野に関心を持った高校生へのアドバイスをいただけますか。

 

・私の連絡先は公開していますので、メールでもTwitterでも構いませんのでご相談ください。直接話を聞きたい場合は、メールで日程調整と聞きたいことを確認して頂ければお話する内容を事前に準備しておきます。

 

・UTAUなど音声や歌声を合成するためのフリーソフトがすでに複数公開されていますので、それらを使って自分の声で話す(歌う)ソフトを作ってみましょう。作った結果、うまくいかないところが出てきますので、その原因について考え音源の完成度を高めてみてください。これが、音声・歌声情報処理の基礎を知る大切な勉強になります。

 

◆高校時代は、何に熱中していましたか。

 

ゲームとプログラミングに熱中していました。学校での勉強という意味ではあまり模範的ではない学生でしたが、ゲームを通じてプログラムが動作する仕組みを知ることができたため、プログラミングに関連する科目の得点は高かったと記憶しています。

 

◆研究室などでは、どのような指導をされていますか。

 

今の日本社会に順応しつつ、目上の人に自分の意見を適切に伝えることができる人材、高い能力だけではなく、社会が求めるマナーを最低限理解した常識的な人間に育てることを目指しています。

 

■森勢研究室HP

http://ml.cs.yamanashi.ac.jp/

 

興味がわいたら

『おしゃべりなコンピュータ 音声合成技術の現在と未来』

山岸順一、徳田恵一、戸田智基、みわよしこ(丸善出版)

現在の音声合成技術でどのようなことが実現されているのか、さらに、音声合成技術の将来がわかります。理論的なお話は出てこないため、高校生でも気軽に読めると思います。(歌声合成技術については、新しい分野のため、まだこういった本が存在しないのです。)

[出版社のサイトへ]

森勢先生の記事を読む

下手な歌が味のある歌に!

~世界最高峰の音声合成技術者が拓く感動的な歌声の世界

森勢将雅(もりせまさのり)先生

山梨大学 工学部 コンピュータ理工学科/大学院総合研究部