自然言語処理

言葉を理解し、知識を増やし始めたコンピュータたち

黒橋禎夫先生 京都大学 大学院情報学研究科 知能情報学専攻 (工学部 電気電子工学科兼担)

第2回 言葉は曖昧なもの。コンピュータはどうやって理解するのか

コンピュータはどうやって人間の言葉を理解しているのでしょうか。その謎に迫るためにも、言葉の持っている役割について少し考えていきましょう。言葉の一番基本的な役割は、ものごとに名前をつけることです。私たちは1人1人名前がついていますし、身のまわりのものにはすべて名前がついています。「講義」、「質問」など、目に見えないものにも名前がついています。名前をつけることによって初めて、私たちはそのことについて語り合うことができるのです。このように、言葉にはラベル付けの機能があります。

 

それから、言葉は、言葉と言葉の間の関係をいくらでも複雑に表現することができます。言葉は、誰がどうしただけでなく、その後、誰かが何かして、それが原因でどうなったという、非常に複雑なことを表現できるわけです。それが言葉の基本的な機能です。

 

これらの基本的な機能をベースにして、実際に言葉が使われています。よく言われることですが、言葉には3つの機能があります。
 1つめは考えること。人間は考えるとき、頭の中で言葉を使って考えています。
 2つめは会話です。私たちは言葉を使ってコミュニケーションをしています。
 3つめは記録の機能です。文章に記すときには、もちろん言葉を使います。文字にして言葉を記録することで、人類の知識が集積していって、文明につながっていくわけです。

 

言葉は人間にとって、とても重要な道具で、私たちは毎日使っています。でも、同時に言葉にはいつも曖昧さがつきまといます。私たち人間は、言葉が使われる状況を判断し、いろいろな情報を脳でうまく統合して処理しますので、言葉の曖昧性をほとんど感じてはいません。しかし、コンピュータにとっては曖昧なものを処理することがとても難しいのです。

 

図1
図1

例えば、図1 がアルファベットの文字だとしたら、これは何に見えるでしょう。でも、これだけ見ても、よくわかりませんよね。

ところが、図2のように書かれていたらどうでしょう。「CAT」ですね。「CAT」ですから、真ん中の字は「A」となります。上の方はちょっとサボってつながっていないというぐらいに思ってしまいますね。

図2
図2

ところが、同じ字でも図3のように書いてあれば、どうでしょう。これは「THE」に見えます。そして、真ん中の文字は「H」だというふうに思うでしょう。

図3
図3

同じ文字でも、前後の文字に何が来るかによって、真ん中の文字の意味するものがまったく違うものになります。この前後の情報のことを「文脈」といいます。人間は自然に文脈の情報を集めて、曖昧な部分を補い、正しい解釈をしているのです。

 

興味がわいたら  Book Guide

『「わかる」とは何か』

長尾真(岩波新書)

IT、クローンなど、生活の中につぎつぎと押し寄せてくる科学技術を題材に、科学的理解とは、人間的理解とは何かを考える。長尾先生は、元京都大学総長で、専門は、自然言語処理・画像処理・パターン認識。パターン認識の分野では、手書き文字の認識方式を提案した。弟子も多く、黒橋禎夫先生のその一人だ。

[出版社のサイトへ]

『人工知能は人間を超えるか ディープラーニングの先にあるもの』 松尾豊(角川EPUB選書)

人工知能は人類を滅ぼすのか。日本トップクラスの人工知能の研究者の著者が、「いま人工知能ができること、できないこと、これからできるようになること」をわかりやすく解説する。

[出版社のサイトへ]

『あなたの声で操作できる iPhone Siri かんたんガイド』

橋本佳幸(秀和システム)

iPhoneの音声認識パーソナルアシスタント機能「Siri」を解説。「Siri」は自然言語処理を用いて、質問に答えている。基本操作やカスタマイズ方法、Siriの仕組み、日常での利用方法などがわかる。著者は株式会社NewtonJapan代表取締役。iPad/iPhoneを使った様々なサービスを企画・開発している。

[出版社のサイトへ]

『スマホは「声」で動かせ』

鈴木清幸(ダイヤモンド社)

著しい音声認識技術の発展で、議事録作成作業が5分の1に減った。今まで1日30件しかできなかった医療検査結果の読み取りが、150件できるようになり、残業がゼロになったという。著者は音声認識システムの株式会社アドバンスト・メディアの会長。

[出版社のサイトへ]

『IBM 奇跡の“ワトソン”プロジェクト: 人工知能はクイズ王の夢をみる』

スティーヴン・ベイカー 土屋政雄:訳(早川書房)

IBMが開発した、自然言語を理解する驚異のスーパーコンピュータ「ワトソン」。2011年、ワトソンは世界屈指の難易度をほこるアメリカのクイズ番組「ジョパディ!」に出場し、みごと人間チャンピオンをやぶり優勝したのだ。開発から優勝するまでの、技術者の激闘1500日を描く。

[出版社のサイトへ]

『翻訳夜話』

村上春樹、柴田元幸(文春新書)

東大教授(現在は名誉教授)で翻訳家の柴田元幸先生と、小説家であり翻訳家の村上春樹の肩の凝らない翻訳談義。翻訳が楽しくてしかたがないという2人。2人の翻訳を比べてみる試みも。翻訳アプリの発展を考える上でも、興味深い。

[出版社のサイトへ]