画像処理<コンピュータビジョン>

「○○さえできればなあ」が発想の源泉。なぜ研究されていないのかも考える

坂本竜基さんインタビュー

ヤフー株式会社 先端技術応用室長

 

◆先生の研究分野である、画像処理の中の「コンピュータビジョン」について説明してください。

 

例えば、普段は自然に行えている「まっすぐ歩く」ことすら、目をつぶれば非常に困難な行動になります。これは、人間は眼から入ってくる情報を処理して、様々なことを判断し行動している証拠です。では、この人間にとって非常に重要な視覚からの情報を使った認識や判断を、人間のような脳みそを持たないコンピュータにもやらせてみるならば、どういう処理をすればよいのかを考えるのがコンピュータビジョンと呼ばれる研究分野です。スマホのカメラアプリなどの身近なエンタテイメントにも使われますし、ロボットや自動運転といった最新技術にも応用が盛んな分野です。

 

◆先生が、目指している研究はどのようなものでしょうか。

 

インターネットが扱うメディアはテキストから画像、画像から映像へと、伝えたい物事に対する情報のチャンネルをよりリッチになっていく方向で進歩してきています。この進歩の先にある究極の姿は対象物を実際にその場で観察するのと全く同じ情報を伝達することですが、ではその究極に近づくために映像の次にリッチなコンテンツは何でしょうか。これにはいろいろな答えが考えられますが、その一つは対象物を3次元コンテンツとして見せることにあると私は考えています。人は何かを観察するとき、手にとって「回して」みます。この回す行為が今のインターネットではできません。対象を回して観察することができる新しいメディアを創造する、これが我々が行っている研究開発の目標です。百聞は一見に如かず。このWebページをご覧になってください。

http://apps.yahoo-labs.jp/p3d/

 

 

◆先生は研究テーマをどのように見つけたのでしょうか。

 

自分が当たり前のように触れている物事がより便利になるにはどうすればいいのかということを考えたとき、「○○さえできればなあ」と思うことがあります。この○○は研究テーマを考える上でとてもストレートで強力な発想の仕方だと思います。しかし、同時に、その○○はなぜ今のところ実現していないのかということも考えないと研究としては成立しません。実現は原理上不可能なのか、研究開発をすれば可能になるものなのか。後者であれば研究する価値があることなので、あとはその分野の勉強を始めていけばよいと思います。

 

興味がわいたら

『アイアンバディ』

左藤真通(講談社)

ロボットを作るエンジニアの物語ですが、コンピュータビジョンを専門にしている女性が出てきますので、ソフトウェアエンジニアがどのような役割か知りたい人に。

[出版社のサイトへ]

『四次元の世界』

都筑卓司(講談社ブルーバックス)

現代のコンピュータサイエンスはデータを高次元で処理することがほとんどです。次元と言われると難しそうでしり込みしてしまうかもしれませんが、本書は一次元から順を追ってわかりやすく説明してくれており、しかも短く簡潔なので読む人を選びません。前半を読んだ時点で、四次元ポケットから道具が飛び出てくる理由もわかります。

[出版社のサイトへ]

こちらも高校生におすすめ

『ハルロック』

西餅(講談社)

読めば中高生でも手を伸ばせば作れるテクノロジーが一通りわかり、しかも起業までエンカレッジしてくれるコミックス。

[出版社のサイトへ]

映画『ソーシャル・ネットワーク』

デヴィッド・フィンチャー監督。フェイスブックが急激に成長していく過程が描かれており、一介のエンジニアが作るサービスが社会現象になっていく様子が俯瞰できます。

 

坂本さんの記事を読む

ネット上の画像をくるっと回せば、よりわかる! ~鍵は運動視差

坂本竜基さん ヤフー株式会社 先端技術応用室長