手書き文字認識/パターン認識

手書きという「人の温かさ」がある情報をコンピュータで扱う技術に興味

耒代(きただい) 誠仁先生インタビュー

桜美林大学 リベラルアーツ学群 情報科学専攻プログラム

◆先生の研究分野である「手書き文字認識」分野を簡単にご説明ください。

 

手書き文字認識は、「手書き文字の画像、文字を書く動作などから字種を判断すること、あるいはその手段」です。画像や動作には字種に応じたパターンが存在しますので、手書き文字認識は一種のパターン認識といえます。私の研究は文字画像による情報検索ですので、厳密には認識、つまり字種の判断を行っていませんが、技術としては手書き文字認識由来のものを多く利用しています。

 

実際の画像や動作には、字種と関係が深い情報と無関係な情報が混在しています。例えば、文字を書くときに使ったペンの色は字種とは関係ありません。しかし、文字が書かれた紙の色とペンの色の違いは字種を判断する重要な情報です。また、ペン先を紙から持ち上げている間の動作は字種とは関係ありませんが、ペン先を持ち上げた位置と再び紙に下した位置は字種と関係が深い重要な情報です。目的に沿った情報だけを上手に抽出して適切に処理することは、高精度な認識を実現するための重要な研究課題となります。

 

◆先生の研究とその目指すものを教えてください。

 

情報技術を人文科学分野に応用するための研究を行っています。私の主たる専門を一つ挙げると「手書き文字認識」になるのですが、実際にはヒューマンインタフェース、情報通信とプロトコル、プログラムの高速化と可搬性向上など様々な情報技術を動員して人文科学、とくに古文書のデジタル化と活用(デジタルアーカイブ)に関する研究を行っています。最終的には、多くの人が手軽にどこからでも(ユビキタスに)古文書の情報にアクセスして、そこに記された内容を現代の社会に生かせるような情報検索技術の実現を目標としています。

 

◆先生は研究テーマをどのように見つけましたか。

 

手書き文字認識の技術を学び始めたのは、手書きという「人の温かさ」がある情報をコンピュータで扱う技術に興味を持ったことが大きなきっかけだったと思います。その先に古文書の研究を見据えていたわけではないのですが、大学/大学院での活動を通して類が友を呼んだのか、私の考え方に理解を示してくれる方に恵まれ、大学の研究者としてのポストを得ながら、奈良文化財研究所、東京大学史料編纂所などいくつかの研究機関と共同研究を行うに至っています。現代の理工系の研究のうち、研究者が一人で実施できるものはほとんどありません。どんな考え方の人と一緒に研究がしたいのか、という価値観をしっかりと持ちながら、進むべき道を選び、しっかり学んでいくことが大事だと思います。

 

◆この分野に関心を持った高校生にアドバイスをいただけますか。

 

皆さんは、computerという英単語に「計算機」という訳がついていることはご存知かもしれません。コンピュータはその名前の通り計算をする道具です。しかし、例えば手書き文字をどのように加工すれば計算の対象、つまり計算式の項にできるのでしょうか。手書き文字に限らず、コンピュータで扱う情報はすべて数値(の集合)である必要があります。すでに実現されている情報の数値化について調べ、身の回りの様々な情報をどうすれば数値化できるのか考えてみましょう。

 

◆先生は高校時代、何に熱中していましたか。

 

通っていた高校では原動機付自転車での通学が許されていて、オートバイや車、そして工学全般への興味を強める要因になりました。また、剣道をしていた関係で大学の部活動にお邪魔して練習することが何度かあったのですが、指導をしていた大学の先生が格好良く見えたのが、大学の先生に対して憧れを持つきっかけになったと思っています。

 

◆先生の研究室の卒業生は、どのような就職先(業種)で、どのような仕事(職種)をされていますか。

 

以前に勤務していた東京農工大学で指導を担当した卒業生は、日立、楽天などの情報関連の部門で活躍しています。また、とある県警の科学捜査研究所で筆跡鑑定を担当しながら研究を続けている卒業生とは、共同研究者として今でも一緒に活動しています。

 

現在勤務している桜美林大学では、つい先日まで基礎教育を担当する教育部門に属していたため、学生の就職に直接関わる機会がありませんでした。今後は専門的な教育を通して就職関係の指導にも関わっていきたいと思います。

 

◆研究室や授業では、どのような指導をされていますか。

 

学生が問題意識を持って授業や研究に取り組めるように、古文書に関する各種デジタルデータ、プログラムを動作させるハードウェアなどに実際に触れてもらうことを心掛けています。また、場合によっては共同研究先まで学生に同行してもらい、様々な分野の専門家の話を聴く機会を設けています。情報技術自体は抽象的な存在ですから、その具体的な応用先を認識してもらうことが大切だと思っています。

 

興味がわいたら

『弱みを強みに 手書きをデジタルに』

中川正樹(OROCO PLANNING CO.,LTD.)

著者の中川先生は、東京農工大学の先生。手書き文字認識、パターン認識の第一人者ですが、それに限らず、理工系の研究者を目指す人が知っておくべき様々なこと―技術との接し方や研究者としての心構え、研究資金の重要性と獲得方法などが記されています。「鶏口となるも牛後となるなかれ」といった志を持つ人には特におすすめです。

 

筆者はオペレーティングシステムの研究者としてコンピュータへの理解を深めながら、まだメインメモリが1MBに満たない時代に「手書き」というアナログな情報をデジタル化する重要性に気付き、他者に先駆けて大規模な手書きデジタルデータの収集に成功し、その後も手書き文字認識をはじめいくつかの分野で第一線の研究者として活躍し続けました。筆者の業績は、特に日本の手書き文字認識の分野においては、研究の歴史そのものといえます。本書は、研究の起点から今後の行く末までを一通り知ることができる貴重な存在です。

 

研究者はきっと好きなことだけやっているのだろう、といった誤解も社会の一部にはありますが、実際には多くの研究者が自分の力で研究費を稼ぎ、他者の評価に晒されながら、独創的な研究活動のために戦っています。本書には、惜しまれながらも引退間近となった筆者が研究者生活を通して学び、感じ取ってきた様々なことが記録されています。

 

筆者は自身のことを天邪鬼(あまのじゃく)と称しています。これは、現実社会に生きながら他の人とは全く異なる独創性が求められる研究者の立場をよく表した言葉です。その立場を忘れたとき、研究者の視野は限りなく狭くなります。一方で、その立場を正しく意識すれば、視野は限りなく広がります。一つのことに囚われず、複数の研究対象から新しい発想を紡ぎだす筆者のスタイルは、天邪鬼である自分を意識し続けることで得られた真骨頂だと思います。研究者を目指す人には、本書を通して正しいビジョンを身につけてもらいたいと思います。

[出版社のサイトへ]

『ご冗談でしょう、ファイマンさん』

リチャード・Pファイマン 大貫昌子:訳(岩波現代文庫)

ノーベル賞物理学者の自伝。科学者、研究者にあこがれる人にはぜひ読んでもらいたい書籍です。ファイマン氏のような人生を送れる研究者は一握りに過ぎませんが、皆さんの心の中に据えるべき理想について学ぶことができる良書です。

[出版社のサイトへ]

耒代(きただい)先生の記事を読む

古文書の読めない字を読み解くアプリ

耒代(きただい) 誠仁先生

桜美林大学 リベラルアーツ学群 情報科学専攻プログラム