PEOPLE & CULTUREひと・文化

ホーム >  ひと・文化 >  インタビュー 塚原 裕史

研究開発グループ シニアリサーチャ
HMI

塚原 裕史

Hiroshi Tukahara

PROFILE

2006年入社
地図情報処理

新しいテーマを提案できる関係

デンソーとの共同事業として、ロボットなどの対話協調の研究に取り組む塚原さん。そのバックグラウンドには、物理学、数学に対する飽くなき知識欲があります。幾何学の発想で強化学習の高速計算アルゴリズムを導き、場の理論をヒントに言語における空間的な関係の計算手法を発想する、まさに理論とアルゴリズムの世界を自在に行き来する研究者である塚原さんに、理論と研究の関係について伺いました。

重要になる「対話」というインターフェイスを担当

私の今の研究テーマは、生活支援ロボットの「対話」インターフェイスです。元々は自動運転の課題である「ドライバーの眠気防止」のために、雑談するシステムを研究していました。また、音声認識操作のアルゴリズムを、デンソーが新規事業として展開する地域情報サービス「ライフビジョン」で配布するタブレットのユーザインタフェースに応用する研究に取り組んできました。

その延長で、トヨタから生活支援ロボットHSR(Human Support Robot)の提供を受けて、対話インターフェイスを研究しています。HSRは国内だけでも多くの大学、研究機関や企業に提供されており、ワールドロボットサミットでも、「パートナーロボットチャレンジ」というコンペティションが開催されています。トヨタとしても、多くの研究者に提供することで、ロボットの有用性を模索する狙いがあるのだと思います。

「ロボットとの対話」というと、トヨタのKIROBO miniのようなコミュニケーションロボットを思い浮かべる人も多いかも知れませんが、私たちが研究しているのは、それだけではなく実空間の中で物を動かしたり操作するロボットとの対話です。例えば、「テーブルの上にあるコップの隣にiPhoneを置く」という音声情報は文字列に変換できますが、これでロボットを動かすには、まず、文字列のうちどの部分がオブジェクトで、どれが空間的な関係を指しているかを自然言語処理して認識させます。次に、3次元の空間関係を理解して処理し、その認識を基にどう行動させるか、すなわちアクチュエーターをどう動かすかを指示します。

さらに、正しく指示するためには言葉と実世界を対応させる「グラウンディング」が重要です。「テーブルにコップを置く」という言葉の背景には、「テーブルが存在することを認識して、コップの底面をテーブルに接するように配置し、手を放す」という暗黙知が存在します。工場のロボットであれば決まった環境で決まった作業なのでプログラミングで対応できても、家庭で動くロボットは千差万別の環境を想定して非定型な作業をする必要があります。場合によっては、人間と協調する必要もあります。

これは、自動運転車との音声インターフェイスにも共通しますね。道路形状や周辺環境は千差万別なので、人の言葉の意味を理解し、システムで処理できないことは人間が協調して安全に運転できることが必要になるのです。お茶の水女子大学の小林一郎先生や慶應義塾大学の大前学先生との共同研究では、実際に音声対話で自動運転車に運転指示を与えて操作する研究を進めています。こうした研究を通して、新たな研究テーマをデンソーに提案しています。

過去の学びは全て繋がっている

現在は対話インターフェイスの研究をしていますが、学生時代は物理学を専攻していました。学部ではカオス、修士課程では非平衡系の相転移現象、博士課程では結晶や高分子などの統計力学模型の非河解性についての研究で、博士号を取得しています。これらの研究を通して得た計算幾何学のアルゴリズムを用いたプログラミングスキルを活かし、新卒で入社した会社では、地図システムを開発していました。地図情報処理が欠かせない応用分野の一つとしてITS(Intelligent Transport Systems)があるということでデンソーとの繋がりができ、2006年にデンソーアイティーラボラトリ(以下、ITラボ)に入社しました。入社当初のITラボは、画像認識技術に取り組み始めたところでした。私自身がニューラルネットワークを使うようになったのはその時です。

ニューラルネットワークを勉強し始めて驚いたのが、学生時代に勉強した物理学や数学の知見が活かせることでした。例えば、統計物理学で学ぶベイズ理論は、学習器の性能を評価、モデル化するために必須です。ちなみに数年前には、幾何学的な双対変換を利用して強化学習の高速計算モデルを導きました。

ニューラルネットワークを使った研究テーマを探していた時に、ドライブレコーダーをテーマにしてはどうかというアイデアが出ました。しかし当時は、一般車両にはほとんど搭載されていない時代です。搭載率を上げていくためには、ドライブレコーダーが「事故時のドライブではなく、普段のドライブを記録する」という発想で、京都大学の西田豊明先生との共同研究で、車載映像に加えてドライブ中の会話をデータベースとして蓄積するシステムを考えました。これが、音声インターフェイスの研究を始めたきっかけです。

大学時代から今まで、様々なテーマに取り組みました。バラバラに見えるかもしれませんが、私にとってはその時重要だと思う方向に向かう、自然な流れでした。今思えば、全てのテーマが繋がっているのです。そして過去の研究は決して無駄にはなっていません。

物理学的な直感でブレイクスルーを狙う

最初の会社からITラボに転職したのは、研究ができる場所だと思ったから。前職の時も、大学院時代から取り組んでいた高分子トポロジーの研究は続けていましたが、時間は限られていました。この会社なら物作りだけでなく研究に取り組めると考えたのが、転職の決め手となりました。

入社して思うのは「この会社ほど研究に専念させてくれる環境はない」ということ。一人一人の社員が研究者であって「生涯研究者を貫く」をスローガンとしてやれているのは、この会社だからこそだと思います。

仕事以外の時間は数学や物理の本を読んでいることが多いですね。そこからアイデアが出てくることもあります。最近は量子コンピュータツイスター理論やスピン幾何学に興味があります。これらは純粋に知的好奇心で勉強していますが、もう少し実利的なものとしてクリフォード代数と共形幾何学を組み合わせた幾何学的代数にも興味を持っています。言語で表現された空間的関係を正しく理解するには「基準点」がどこに設定されているかを認識することが大切なのですが、クリフォード代数を使って3次元空間を5次元のミンコフスキー空間に埋め込むことで、基準点を意識した空間的計算ができ、グラウンディングの研究に応用できるのではないかと考えています。

純粋な研究ができる会社といっても、何らかの社会還元は必要で、理論物理や数理物理そのものを目的とした研究はやはり難しいのは事実です。でも、例えば材料開発というテーマで「良いモーターを作るための磁性体材料研究」という形で、その根本原理を明らかにするための理論の研究はできるでしょう。量子コンピュータであれば、いかに暗号をセキュアにするかという観点から、実用化に向けた研究を進めるのもありだと思います。現在、深層学習により音声認識や画像認識の精度が飛躍的に向上していますが、今後は意味解析や知識処理が重要になっていくでしょう。このような問題を扱うためには自然言語処理が不可欠になると考えています。一見、デンソーとは関係ないようにも見えますが、必ず将来必要になると私は信じています。

目標は、デンソーの中で「対話といったらITラボの塚原」といわれるようになることです。段々そうなりつつありますが、もっとデンソーの中で「対話」というテーマを重視してもらえるように存在感を増すのが自分の課題だと思っています。

一覧へ

ラボで働くRecruit

採用情報