PEOPLE & CULTUREひと・文化

ホーム >  ひと・文化 >  インタビュー 内海 慶

研究開発グループ リサーチャ
HMI

内海 慶

Kei Uchiumi

PROFILE

2013年入社
ポータル 自然言語処理技術

「誰も解けていない問題を解く」そこに研究者としての醍醐味がある

入社前から自然言語処理の研究に取り組む内海さん。現在は教師なし学習による自然言語処理の研究に注力しています。その研究に至るまでには、内海さん自身の数学の素養、コーディング技術、アルゴリズムに関する知識といった基礎に加えて、いくつもの「良い出会い」に恵まれたそうです。その出会いと、自身が研究で成し遂げたいことについて伺いました。

数学に魅せられ、実装する楽しさを追う日々

高専時代から、複雑な数学の問題を解くのが好きでした。そのせいか、今もコードを書いていれば幸せという人間なんです。例えば、論文に載っていたアルゴリズムを実装してみたり、より効率が良くて計算量が少ないアルゴリズムを自分で考えて実装したりしています。

そして、好きで身に付けた数学的知識やアルゴリズムの考え方が、研究の中で非常に役立っていることを感じます。例えば、高専から大学に編入した時に、国立研究開発法人産業技術総合研究所からやってきた先生と一緒に音声検索システムを改良した研究でも、それを実感しましたね。

巡り合わせが重なり、自然言語処理の世界へ

大学進学当初は、自分で何を研究しようかはっきり決めておらず、教授からその研究を任された形でのスタートでしたが、大学院は言語処理の研究を行いました。そして、修士号取得後は大手ポータルサイト運営会社に就職し、自然言語処理の部署に配属されました。自分は「検索」の研究をやりたかったので、ちょっとがっかりしたのを覚えています。ところが、そこの先輩の言語処理に機械学習を利用する研究に、大きな影響を受けることになりました。

その先輩は当時、SVM(Support Vector Machine:教師あり学習を基にしたパターン認識モデル)やパーセプトロン(ニューラルネットワークの一種)を自然言語分析に利用することに取り組まれていて、私はこれを見て自然言語処理にも機械学習を利用できる可能性を感じ、自分で勉強してプログラムを実装し始めました。そして構文解析や形態素解析などを学ぶうちに、自然言語処理の研究にすっかりのめり込んでいきました。

自然言語処理の基礎研究は「総合格闘技」といわれることがよくあります。これは、言語の知識だけではダメで、数学、アルゴリズム、コードの実装力など様々な知識がないと使えるプログラムを作れないからです。こういうところも魅力で、次第に言語処理の基礎の部分を研究したいと強く思うようになりました。そうこうするうちに、先輩と一緒に仕事をするようになり、当時は自然言語処理関連の論文を年に1本くらい出していましたね。

振り返ってみると、私は色々な巡り合わせに恵まれ、そのおかげで研究者としても、「後から伸びる」ことができたと感じます。

自然言語処理の教師なし学習研究が、機械との自然な会話への第一歩

デンソーアイティーラボラトリ(以下、ITラボ)入社後も希望通り継続して自然言語処理の研究に取り組んでいます。現在、実用化が進んでいる機械学習やニューラルネットワークでは大量のデータを用意し、人間が正解のデータに「正解」とラベルを付ける必要があります。しかし、自然言語の世界では、学習用のデータはどんどん生まれてきます。例えば、ブログやツイッター、製品へのクチコミなど、人の行動によって生まれるテキストデータそのものが潜在的な訓練データとなります。雑談の音声認識データであったとしてもそれは対話データとして訓練データとなります。こうして私たちが話している会話も学習に使えるデータです。莫大な量の自然言語のデータを見て、正解をいちいち人間が付けていては、どうやっても追い付きません。

そこで私は、自然言語処理における教師なし学習の研究で、プログラムに正解データがない大量の言語データを与えて、潜在的なルールや構造を自ら学習していくプログラムの研究をしています。今は、構文解析を教師なし学習でどのようにしてコードとして実装するかを試みていて、教師なし学習で形態素解析と品詞推定まではできました。

このインタビューの直後、10月1日からは共同研究先の奈良先端科学技術大学院大学に職場が移り、そこでは構文解析に取り組むつもりです。さらに、文章の意味を機械に理解させることまでできればいいのですが、それは少し時間がかかりそうです。市販のスマートスピーカーを使ったことがある人はお気付きだと思いますが、まだ言葉の意味を十分に理解するというレベルにはなっていません。キーワード検索で頻度の高い言葉を選ぶ手法を取り、例えば「冷蔵庫にミルクはある?」と聞くと、「スーパーマーケットにあります」と答えるとか。

基礎研究が進むと、認識した文章の意味を機械が理解し、行間を読むということも可能になるでしょう。これが実現すれば、機械が人間の話し言葉の意味を完全に理解して会話に応じることができるようになります。

ただ、私の興味としては、今の研究を応用して機械を人間の話し相手にするための研究を進めていくよりも、自然言語処理の教師なし学習の確立の礎となる基礎研究を続けていきたいですね。

基礎研究を深めていけば、自然言語処理に留まらず、既に実用化の進んでいるニューラルネットワークで、大量の正解データを使ってやっと実現していることを少量の正解データでも実現できるようになったり、人が正解を作るのが難しいタスクでも行えるようになるからです。

未解決の難題こそインパクトを生み出す

多くの企業では、どうしてもビジネスに繋がるまで長い時間がかかる基礎研究より、直近にビジネスに結び付く研究に傾倒しがちです。でも、それでは既存の研究の組み合わせが多くなり、新たに世界に大きなインパクトを残すことはできません。

しかし、幸いなことにITラボでは、予算や期間について、あまり心配せずに基礎研究に取り組める環境があります。この基礎研究をし続けられる点が、私がITラボを選んだ最大の理由かも知れません。このような環境のおかげで、私は常に「解けていない問題はないか?」ということに集中し研究を行うことができています。

最近は、既に誰かが解いている問題を、よりうまく解くという研究が多いのですが、私はそういう研究はあまり意味がないと感じているので「解けない問題を解く」「できないことに真剣に取り組む」ことを研究でやり続けたいと思っています。その方がずっと面白いじゃないですか。

同じ目的意識を持っている人なら、勉強しながら研究できる

研究者を志す学生さんには、研究に強い興味があって、やる気があれば、私のようにいくらでも後から伸びることができると思うので、ぜひITラボに来てもらえたらと思います。

ITラボは決して大きな会社ではありません。それに、自然言語処理を研究している人は他にほとんどいません。でも、ITラボでは学会参加も奨励していて、学会活動で人脈を広げることができます。そこで、良い先生と出会うチャンスは山ほどあります。

自然言語処理に関して、まだ十分な知識はないけれど、ITラボの研究にとても興味がある、自然言語処理研究に興味があるなど、同じ目的意識を持っている方であれば、長期的に一緒に勉強しながら研究できると思うので。ITラボで研究しながら大学院に通える制度もありますので、希望すれば博士号も取得できますしね。

一覧へ

ラボで働くRecruit

採用情報