研究組織 『日本語フレームネット班』
| 班 長 | |
|---|---|
| 小原京子 | 慶應義塾大学理工学部 |
| 研究分担者 | |
| 斎藤博昭 | 慶應義塾大学理工学部 |
| 藤井聖子 | 東京大学総合文化研究科 |
| 佐藤弘明 | 専修大学商学部 |
URL
http://jfn.st.hc.keio.ac.jp/ja/
研究目的
1.現在構築中の日本語フレームネットを、これまでの語彙の意味情報に加え構文の意味情報をも含む語彙・構文複合資源へと発展させていくことと、2.そのような語彙・構文複合資源としての日本語フレームネット構築を通じて、「代表性を有する大規模日本語書き言葉コーパス」(BCCWJ)の均衡性・代表性を確認し、その有効な活用方法を提示していくことである。
目的1に関しては、文の意味を記述するには文中の自立語の意味情報を記述するのみでは不十分で、構文の持つ意味情報についても記述する必要があるため、従来の語彙データベース(Lexicon)に加え構文データベース(Constructicon)をも含んだ複合資源としての日本語フレームネットを構築する。
目的2に関しては、BCCWJ内の全ジャンルを意味フレームに基づく指標を用いて調査し、全体としての均衡性・代表性を確認する。また、BCCWJのコア・データに全文テキストアノテーションし、他のタグ体系に基づくタグ付け結果と比較・統合する。
研究計画
言語分析と言語処理の両方の側面から行う。言語分析班は、目的1「語彙・構文複合資源としての日本語フレームネットの構築」の中核を成す語彙データベースと構文データベース構築のためのアノテーション作業全般とデータ分析を担当する。言語処理班は、目的1に関して日本語フレームネットデータベースとツール類の更新管理を行い、さらに語彙データベースと構文データベースの検索・表示インターフェースやツールの開発、英語フレームネットその他の言語資源とのリンク、自然言語処理分野における日本語フレームネットの応用を担当する。目的2「BCCWJの評価・活用」に関しては、言語分析班と言語処理班の両方が行う。
初年度は、構文データベース構築のためのパイロットスタディを開始し、BCCWJへの語彙アノテーションと、BCCWJコア・データへの全文テキストアノテーションを行う。
次年度は、語彙アノテーション、全文テキストアノテーションに加え構文アノテーションを行い、これらの結果に基づくBCCWJの評価・活用結果の報告を行う。
