知識発見とデータマイニング

その人の行動を理解し、その人に新たな気づきを提供するレコメンドを

深澤佑介さんインタビュー

東京大学 人工物工学研究センター 客員研究員

◆研究分野である「知識発見とデータマイニング」とはどのような分野ですか。

 

データマイニングは、大量のデータの中から機械学習や深層学習の技術を使って知識を取り出す手法です。手法は昔から提案されていましたが、ビッグデータの必要性の理解が深まり、データを整備し集める活動が盛んに行われ始めたのは最近で、実世界での応用はまだ始まったばかりです。特に、今まではドメインエキスパートの経験と勘に基づいて判断していたことが、データマイニングの技術を使って適切に判断できるようになってきています。

 

例えば、アメリカの著名なデータサイエンティストのネイト・シルバー氏は、選挙の過去データ、人口統計、世論調査を用いてアメリカ合衆国の各州の結果を予想しています。2008年の大統領選挙では合衆国50州のうち49州における勝者を正確に予測し、2012年の大統領選挙では全50州における勝者を的中させました。これは、選挙の専門家であるその他のジャーナリストが行った予想を大幅に上回るものであり、大変な反響を呼びました。

 

もう一つの例として、皆さんもAmazonに代表されるECサイトで買い物を経験されたことがあると思います。ECサイトでは「これを買った人はこれを買っています」といった利便性の高いレコメンデーションがなされますが、これも人々の膨大な購買の履歴をもとに計算された結果です。今後も様々な分野でデータに基づく予測、知識発見が相次ぐことと思います。

 

◆深澤さんご自身は、どのように研究を発展させたいと思っていますか。

 

私は、人々の行動を理解し、その人に合ったサービスや情報を届けたいと考えています。一般に技術分野としては、レコメンデーション(情報推薦)の分野になります。過去の研究の多くは協調フィルタリングと呼ばれる、類似している他者を探し出し、その他者の行動履歴に合わせてレコメンデーションする方式です。例えば、マイケル・ジャクソンを聴いている人にはマイケル・ジャクソンの他の曲が推薦されます。しかしながら、このような表層的な情報に基づくレコメンデーションでは、精度は担保されるものの、新たな発見につながらず、創造性の枯渇やユーザの成長を阻害することが指摘されています[1]。羽生先生の書籍でも同じような指摘がありました[2]。

 

私は、単にサービスを使った履歴だけでなく、普段の行動からユーザを理解した上で、レコメンドすることにより、新たな気づきにつながるレコメンドができるのではないかと考えています。IPSJ-ONEでご紹介した研究は、スマートホンに表れる行動からユーザが不安に感じていたりするかどうかを検知する研究でした。今後、この研究を発展させていくことで、例えば、ユーザが全く知らない曲だとしても、スマホから検知した心理状態に合わせて曲を選ぶことで、よりユーザの気づきにつながる曲を推薦することができるのではないかと考えています。

 

[1] イーライ・パリサー『閉じこもるインターネット』早川書房 (2012) 

[2] 羽生善治『大局観』角川書店 (2011)

 

 

◆研究テーマをどのように見つけたのでしょうか。

 

修士課程ではロボットの行動制御に関する研究をしていました。部屋の掃除をしたり、段ボールを所定の位置にまでお片付けしたりするロボットです。トライ&エラーを繰り返すことで、ロボットが人間のような行動ができるよう学習させました。その過程で人間はどうしてこのような行動をとることができるのだろうか、人によって同じ目的でも異なる行動になるのはなぜだろうか、といったように人の行動をもっと理解したいというのが現在のテーマのきっかけになります。

 

◆この分野に関心を持った高校生にアドバイスをお願いします。

 

もしご興味を持っていただいたら、パソコンでプログラミングして機械学習や深層学習を試されるのがよいかと思います。現在はPythonで簡単に試せるツールが公開されており、すぐに試す環境が整っています。もし自信がわいてきたら、Kaggleなどのデータマイニング競技会で予測精度を競ってみてもよいかもしれません。

 

◆高校時代は、何に熱中していましたか。

 

水泳を水泳スクール、水泳部含めて小学校から高校3年最後まで続けられたのはよかったですね。たいして速くなかったですが。高校2年生からは数学、物理のあらゆる受験問題をいかに少ない公式で解けるかに熱中していました。

 

 

◆研究室の卒業生は、どのような就職先で、どのような仕事をされていますか。

 

 

普段は企業に勤めておりますが、大学の客員研究員という立場で複数の学生さんの研究指導の支援をさせていただいています。外国の方も多く様々な進路で活躍されています。得意分野を生かし、データマイニングを専門にした仕事をしているケースが多いです。

・(中国人、博士、女性)中国の大学で准教授として勤務。データマイニング関連が専門。

・(ギリシャ人、修士、男性)ドイツでベンチャー企業に就職。

・(日本人、修士、男性)大手通信企業に就職、ビッグデータ関連の業務に従事。

・(日本人、学士、男性)データマイニング関連のベンチャー企業を創業。各種講演に講師として呼ばれている。

 

 

◆ホームページはこちら

http://www.yusukefukazawa.com

 

興味がわいたら

『大局観』

羽生善治(角川新書)

羽生善治の棋士生活25年を通して得た勝負に対する考え方を「大局観」としてまとめた書籍です。若いときの勝負に対する考え方と、経験を積んだ後の勝負に対する考え方の変化が興味深く書かれています。人工知能は教師データを与えてあげればそれを真似するような挙動は可能ですが、未知の問題に対してはまだ脆弱です。経験を積んだ人間が持つ「大局観」は未知の問題の解決の一つのキーになると思われます。これからの人工知能の発展に興味を持つ高校生に読んでいただければと思います。

 

高校生に特に読んでほしいのは、P22。将棋に負けた時の言葉です。大局観とは何かに通ずると思います。

「確かに反省は必要だが、・・・経験や体験を自分自身の実力を上げていくうえで必要不可欠なプロセスとして受け止め、消化し、昇華させることが大切なのである」

 

最近、人工知能の分野では、深層学習の活用が人気を集めており、深層学習では高次のレベルの学習が可能といわれています。ただ、実際にどのような学習が行われているかはっきりはわかっていません。この引用部分の「大局観」が今後の人工知能がまだできていない領域で今後の発展で重要なキーワードになるのではないかと感じています。

 

さらに、本書からは、この研究分野に関しては、以下の点を知ることができます。

 

■確率・サンプリングについて

将棋の先攻・後攻で有利・不利が変わるか、あるいは、振り駒による先攻・後攻の決め方が平等かどうか、何局させば信頼度のあるデータになるか、などの例をもとに確率・サンプリングについて随想している。

 

■不確実性について

将棋では予想外の手を指されることがあるが、予想外の事象について不確実性の観点から考察している。

 

■機械と人間の決定的な違い

コンピュータが指す将棋と人間が指す将棋の違いについて随想している。さらに、将来、その違いがどのようになっていくかについて予想している。

 

■Google検索について

Google検索により利便性は高まったものの驚きのある新たな発見が少なくなる可能性があり、一般にフィルターバブルといわれている(イーライ・パリサー『閉じこもるインターネット』)。将棋の棋譜検索でも同じような危険性があるのではと述べ、どうすれば検索による知識獲得と新たな気づき発見を両立させるかについて随想している。

 

[出版社のサイトへ]

『脳・心・人工知能 数理で脳を解き明かす』

甘利俊一(講談社ブルーバックス)

トップレベルの研究者が平易な言葉で最先端の人工知能研究を脳や心とつなげて解説しています。情報系に興味のある学生全般におすすめです。

[出版社のサイトへ]

 

『情報理論』

甘利俊一(ちくま学芸文庫)

通信・情報理論の記念碑的な論文(クロード・E・シャノンの通信の数学的理論)を高校生で十分にわかるように解説された論文です。タイトルは専門的ですが、文庫本であり、数式は高校レベルで書かれています。普段気にすることがない、通信や情報の仕組みに気づくことができます。Computer Scienceは最新の研究が注目され、大学で研究される際には最新の研究成果からスタートすると思いますが、そのときに過去の理論体系を知っておくと理解が非常に速く、またオリジナルなアイデアも出やすいと思います。

[出版社のサイトへ]

中高生にこちらもおススメ

『私の個人主義』

夏目漱石(講談社学術文庫)

自分の進路について悩んでいる方にお勧めです。漱石が就業、留学を経て、「ああ、ここにおれが進むべき道があった!」という感嘆にまで至る過程に励まされると思います。

[出版社のサイトへ]

 

Epic 2014

2004年の作品で2014年のWebの未来を予想しています。レコメンデーションがあらゆる場所に浸透するとどういった世界になるか未来予想をしています。2004年時点で、Fakeニュースの出現やTwitterを通じた個人の発信を予測しており、衝撃的です。

YouTubeで視聴できます。https://www.youtube.com/watch?v=Afdxq84OYIU

 

そのほか、眉村卓、筒井康隆、星新一等SF作家の作品もおススメです。

 

「知識発見とデータマイニング」の記事を読む

スマホがあなたのココロの未来を予想する

深澤佑介さん 東京大学 人工物工学研究センター 客員研究員