Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

NAIST_statement of_purpose

22,983 views

Published on

  • Be the first to comment

  • Be the first to like this

NAIST_statement of_purpose

  1. 1. 【出願研究科】情報科学研究科 【氏名】【希望講座】自然言語処理学講座【取り組みたい研究テーマ】関連性理論をベースにした自然言語処理 私が NAIST で取り組みたいテーマは、 「関連性理論をベースにした自然言語処理」です。本小論文では、まず、なぜこのテーマを選択したのかという理由について説明し、次にテーマの具体的な内容について述べます。後半では、なぜ NAIST を志望するのかという理由と、NAIST を進学するにあたっての抱負について述べたいと思います。 私はこれまで一貫して「言語によるコミュニケーションメカニズムの探求とその応用」について興味をもってきました。具体的には、言語哲学や心理・神経言語学に取り組み、主に「言語とは何か」や「人がどのように言語を処理するのか」について研究してきました。しかし、その一方で、言語理論や、言語処理における仮説などを、コンピュータへ応用し、機械翻訳や質問応答など、社会に直接的に役立つ形にしたいという思いがありました。そして、社会人経験を経て、改めてその思いを実現させたいと思い、この度 NAIST を受験するに至りました。 私は将来、ひとつの文章にこだわらず、対話のやりとりのなかで発話者の意図を汲み取れるようなシステムを実現したいと考えています。それは、現在の検索システムのような、キーワードをもとにしたものではなく、例えば、 「ピザが食べたい」と入力すると、 「デリバリーが良いですか、それとも近場のイタリアンレストランが知りたいですか?」というような、人と人が対話するような形で、発話者の要求に応える、というようなものです。 このようなシステムを実現するためには、当然対話を解析するための自然言語処理技術が必要になります。これまで自然言語処理研究では、一つの文における形態素解析や係り受け解析、意味解析などの分野では一定の成果があり、かな漢字変換や検索エンジンといった応用もなされています[1, 2]。 しかしその一方で、解析の範囲が二つ以上の文章になると、 「彼」や「その」といった指示代名詞、指示連体詞の解析(照応解析)や、代名詞の省略解析の精度が下がってしまうという問題が起こっています。また、質問応答や機械翻訳といった応用分野においても、十分な精度を出すことができていません。 では、なぜ複数の文章になると精度が下がるのでしょうか。その原因は、文章が長くなることによって、単純に解析の複雑性が増すということだけでなく、①文と文の間にある潜在的なコンテクスト(例:場所や時刻)や、②世界に関する百科事典的な情報(例:バナナは食べるものである) 、そして③人間が持つ認知的な特徴(例:文法的に複雑な文よりも単純な文の方が処理しやすい)に関して十分な解析ができていない、ということが考えられます。これに対し現在では、Google Mapや Wikipedia 等を始め、先に述べたような様々な情報が大規模データとして蓄積されているため、これらを活用するという手段が考えられます。しかしさらに厄介な問題として考えられるのは、仮に潜在的なコンテクストや百科事典的な情報、認知的な特徴を解析するための情報が十分に手に入ったとしても、どのような順序で、どの程度の時間で、どのように解析するのか、という制約を与える理論を適用する必要がある、ということです。なぜなら、制約がなければ延々と情報を集め続けてしまい解析できなくなる、というフレーム問題に陥るからです。 1
  2. 2. 【出願研究科】情報科学研究科 【氏名】 そこで私は、語用論における関連性理論をベースにすることで、この問題の解決に取り組みたいと考えます。関連性理論とは、D.Sperber と D.Wilson によって提唱された、人間の認知やコミュニケーションについての理論で、 「人は他者の発話を解釈する際、情報の関連性(文脈効果)が大きく、そして解釈に必要な労力(処理コスト)が小さくなる意味・解釈を選択する」というものです 「警官は自転車で逃げる泥棒を追いかけた」という文は、構文や単語の意味だけを考[3]。例えば、えると二つの解釈が可能です。つまり、 「1. 警官は自転車で、逃げる泥棒を追いかけた。 (自転車に乗っているのは警官) 」と「2. 警官は、自転車で逃げる泥棒を追いかけた。 (自転車に乗っているのは泥棒) 」の二つです。しかし、 「警官が自転車でパトロールをしていた」という文脈が背景にあれば、関連性が高くなる解釈は前者であり、 「泥棒は自転車を路地裏に止めておいた」という文脈があれば、関連性が高い解釈は後者となります。このように関連性理論では、「文脈効果」の最大化と「処理コスト」の最小化というプロセスを通して、最適な解釈を選択することが可能になります。私はこの関連性理論をベースにし、照応解析や省略解析など、文脈の解釈に必要な解析技術の精度を向上させたいと思います。そして解析精度を上げることで、質問応答や機械翻訳といった応用技術に対するブレイクスルーになれば良いと思います。 以上のような研究テーマに取り組むにあたって、なぜ NAIST を志望するのかという理由については、大きく二つあります。一つ目は NAIST の自然言語処理講座松本研究室の環境です。松本研究室では、日本語形態素解析システム ChaSen 「茶筌」や日本語テキストコーパス「NAIST TextCorpus」など、自然言語処理研究を行う上で必要なツールやデータが整備されており、質の高い研究が行われています。また世界の第一線で活躍されている方も多く、学生主体の勉強会が盛んである点も、大変魅力的に思っています。理由の二つ目は、NAIST そのものの環境です。NAIST では、学生に対するサポートが整っており、研究に専念できる環境があります。また情報科学以外のバックグラウンドを持つ学生に対するカリキュラムも準備されており、情報科学について体系的な学習をしたことのない自分にとっては、とても有難い制度です。さらに NAIST は、国内でもトップレベルの質の高い教育を行っているだけでなく、国際的にも最先端分野の研究が多数行われている大学院であることは、大変魅力的です。 私は、社会人出身という、他の受験生とは異なるバックグラウンドを持っており、不安がないわけではありません。しかし、自分自身にとって NAIST への進学は新しい挑戦であり、NAIST での研究生活を通して、さらに自分自身を成長させたいと考えています。そして、今までの自分の経験を活かして、他の学生にも良い刺激を与えられればと思います。私は NAIST の優秀な先生方、先輩方に恥じないような研究を行い、自然言語処理研究の分野に貢献するとともに、私たちの生活を快適で便利なものにしたいと思います。【参考文献】[1] Taku Kudo, Kaoru Yamamoto, and Yuji Matsumoto. Applying conditional random fields to Japanese morphologicalanalysis. In Proceedings of EMNLP, pp. 230–237 (2004)[2] 森信介,土屋雅稔,山地治,長尾真. 確率的モデルによる仮名漢字変換. 情報処理学会論文誌. Vol.40, No.7,pp.2946-2953. (1999).[3] Deirdre Wilson, Timothy Wharton[著] 今井邦彦[編]. 最新語用論入門 12 章 pp. 59-68. (2009) 2

×