日本語コーパスHOME > 研究組織 > 意見情報班
研究組織 『意見情報班』
| 班 長 | |
|---|---|
| 関 洋平 | 筑波大学 |
| 分担者 | |
| 神門 典子 | 国立情報学研究所 |
| 連携研究者 | |
| 柏野 和佳子 | 国立国語研究所 言語資源研究系 |
| 佐野 大樹 | 国立国語研究所コーパス開発センター |
| 研究協力者 | |
| 稲垣 陽一 | (株)きざしカンパニー |
| 栗山 和子 | 白百合女子大学 |
| 藤沢 仁子 | 総合研究大学院大学/国立情報学研究所 |
| Bernard Brosseau-Villeneuve | 国立情報学研究所 |
URL
http://www2.kde.ics.tut.ac.jp/~seki/jcorpus_opinion/
研究目的
本研究では、日本語コーパス中の複数の文書ジャンルのデータを対象として、意見情報を分析するためのコーパスの作成と評価に取り組む。 本研究の目標は2つある。
- 意見情報、具体的には誰が何についてどのような態度(肯定的・否定的あるいは感情・判断・評価)で意見を述べているか、という情報をコーパスにタグ付けすることにより、評判分析や世論調査などの定量的な分析(ある話題について肯定的な意見を述べている人がどれだけいるか)を行うための基盤を提供する。
- 意見のやり取り、特に、文書中の発言とコメントのつながりの抽出が可能となるモデルを提案し、情報をタグ付けし、複数の文書ジャンルにおいて有効性を検証する。
研究計画
平成21年度は、国会会議録、Yahoo!知恵袋(もし可能ならばYahoo!ブログも)などを対象として、NTCIR意見分析コーパスで定義したタグセットと意見アノテーションツールを拡張しつつ、意見分析コーパスを作成する。
まず、1) 国際評価会NTCIRで用いた意見タグセット、2) 意見のタイプに関する理論(Appraisal Theory)、3) 意見のやり取り、発言とコメントのつながりを含む文書ジャンルへの適性等を考慮しながら、小規模のコーパスへのアノテーションを試行しつつ、適切な意見タグセットを決定する。
意見を抽出し提示する応用面についての有用性の評価については、研究分担者・研究協力者と相談しながらモデル化を進める。次に、定義した意見タグセットをもとに意見ツール(プロトタイプ実装済み)を拡張し、実際の日本語コーパスデータを用いて意見分析コーパスを作成する。
平成22年度は、作成した意見分析コーパスをもとに、意見情報を集約・簡約するなどの応用面について検証を進める。
