本領域では、現代日本語のコーパス言語学的研究の基盤を整備するために、大規模な現代日本語書き言葉コーパスを構築します。このコーパスには著作権処理を施して、どなたにでも利用していただけるものとします。また、構築途上のコーパスを様々な領域で実際に活用することにより、コーパスの評価を実施します。狭義の言語学だけでなく、国語教育、日本語教育、辞書編集、自然言語処理などの幅広い領域での活用と評価を行います。
NEWS
  • 事後評価結果
    本領域に関する事後評価に関しては、6月に評価用資料を文科省に提出し、9月29日にヒアリングをうけましたが、本日、その結果が公表されました。評価結果は「A(研究領域の設定目的に照らして、期待どおりの成果があった)」でした。以下に評価委員会の所見を引用します。

    ----------------------------------------------------
    ■総合所見
    本領域の第一の目標である「現代日本語書き言葉均衡コーパス」の作成についても、第二の目標であるコーパス日本語学の可能性の探索についても十分な成果が得られた。特に短期間で大変有用なコーパスを構築したことの意義は大きい。今後、多くの研究者がこれを活用して優れた研究成果をあげることを期待する。また今回構築されたデータベースを一層国際水準に近づけるべく研究の継続を期待する。

    ■評価の着目点毎の所見
    (a) 研究領域の設定目的の達成度
    本領域の設定目的として応募時に選択された対象は次の三つであった。(1)「研究の発展段階の観点からみて成長期にあり、研究の一層の発展が期待される研究領域である」(2)「学術の整合性ある発展の観点からみて重要であるが立ち遅れており、その進展に特別の配慮を必要とする研究領域である」(3)「領域の発展が他の研究領域の研究の発展に大きな波及効果をもたらす等、学術研究における先導的又は基盤的意義を有する」。本領域はこれらの設定目的を十分に達成したと評価できる。
     本領域の第一の目標である「現代日本語書き言葉均衡コーパス」の作成について、目標値を上回る一億五百万語を蓄積したコーパスが完成しており、全面的に達成されたものと評価する。第二の目標であるコーパス日本語学の可能性の探索は、言語学のみならず、日本語学、日本語教育、辞典編集、自然言語処理など幅広い分野における活用の可能性を探ることであったが、この点については、5つの計画研究班と4つの公募研究班が、非常に高い業績生産性を示した。また、従来から協力関係を構築してきた人文系言語研究者と理工系自然言語処理研究者との研究協力も一層の発展を果たし、新たな研究対象・研究手法の開発が期待できる。本特定領域研究を通じて、若手研究者を多数育成し、多くの研究機関等に配属する機会が得られたことにより、今後の当該分野の発展に大きな可能性を開いた。日本におけるコーパスの構築とそれに基づく言語研究は、欧米や韓国、台湾などに比べて立ち遅れていたが、本特定領域研究を通して、その状況が大きく改善されたと認められる。データベースの質をさらに高め、一層国際水準に近づけるべく研究の継続を期待する。

    (b) 研究成果
     「現代日本語書き言葉均衡コーパス」の作成についても、コーパス日本語学の可能性の探索についても、十分な成果がでている。「書き言葉均衡コーパス」は約六千五百万語の書籍コーパスを含み、その代表性において優れたものであると評価できる。高い精度のコアデータ、言語解析ツールの開発など、多大な成果をあげていて、当該分野における発展に貢献したと高く評価できる。今後は、今回構築されたデータベースを一層国際水準に近づけるべく研究の継続を期待する。
     本領域の先導的または基礎的意義としては、コーパスを利用した応用研究の成果として、国語教育用の語彙表と漢字表が公開され、また日本語頻度辞書の編集が進んでいる点等が特筆されるべきである。コーパス公開は、多くの利用者を得、コーパスによる日本語研究を活性化したものと評価される。形態素解析のために構築された電子化辞書UniDicが公開され、形態素解析用の辞書の新標準として定着しつつある。またiPhoneやiPad等のOSの一部にも利用されるなど、応用的意義が著しい。

    (c) 研究組織
     計画研究・公募研究ともに高い生産性を示し、全体として十分な成果が得られた。

    (d) 研究費の使用
     特に問題点を指摘する意見はなかった。

    (e) 当該学問分野、関連学問分野への貢献度
    上記のとおり、先導的・基礎的研究として大きな成果をあげており、関連学問分野に対しても、社会に対しても重要な貢献をするものである。

    (f) 若手研究者育成への貢献度
    若手研究者を多数育成し、多くの研究機関等に配属するなど、大きな貢献があったと認められる。
    ----------------------------------------------------

    この評価結果をもって本領域の活動が完全に終了したことになります。今後は国立国語研究所言語資源研究系の共同研究を通じてコーパス日本語学の発展に貢献する所存です。

    領域代表者:前川喜久雄 (2011年10月17日)


    (2011.10.17)
  • 『現代日本語書き言葉均衡コーパス』オンライン公開のご案内

    『現代日本語書き言葉均衡コーパス』(BCCWJ)のオンライン公開を開始します。先日の講演会で公開した「中納言」によるオンライン検索です。短単位検索、長単位検索、文字列検索の三通りの方法で1億語を超えるデータが検索できます。もともと有償での公開を想定していましたが、まだシステムが安定していないので、当面無償で公開します。

    利用にあたっては書面による申請が必要です。下記で「利用申請」ボタンをクリックすると、利用条件が示されますので、熟読のうえ、利用申請を行ってください。 http://chunagon.ninjal.ac.jp
    有償化の時期は未定ですが、その際は、あらためて契約をかわしていただくことになります。また、従来から公開してきているデモンストレーション用全文検索サイトは「少納言」と名前をかえたうえで、従来通りの機能を無償で提供しています。

    『現代日本語書き言葉均衡コーパス』データ全体のDVDによる公開は10月を予定しています。こちらは有償での公開となります。詳しい情報は後日お知らせします。

    (2011.08.04)
  • 『現代日本語書き言葉均衡コーパス』完成記念講演会は終了しました。
    前日までに290名の事前登録があり、登録を打ち切る盛況でした。


    (2011.08.04)
  • 『現代日本語書き言葉均衡コーパス』完成記念講演会のお知らせ

    『現代日本語書き言葉均衡コーパス』(BCCWJ)の完成とオンライン公開を記念して二日間の講演会を開催します。特定領域研究関係者による報告のほか、初日には招待講演2件、二日目にはシンポジウムを開催します。

    日程:2011年8月2,3日
    会場:JR共済ビルカンファレンスホール 地図はこちら
    プログラム:プログラムはこちら
    参加費:無料ですが、こちらで事前申込をお願いします


    (2011.07.28)
  • *************************************
    【緊急】公開ワークショップ開催中止のお知らせ
    *************************************

    標記の公開ワークショップは予定通り開催の予定でしたが、
    つい先ほど(13日18:00)、会場である時事通信社からの要請で、
    開催を中止せざるをえなくなりました。本当に直前の連絡と
    なり申し訳ございません。

    地方からご参加の方のなかには、既に東京に移動されている
    方も多いと思いますが、時事通信社支配人との交渉の結果、
    開催は絶対に不可との回答でした。

    今回の時事通信社の判断には、気象庁が本日午後に発表し
    た大規模な余震発生確率(今後3日で70%以上)が強い動機
    となっており、万が一の場合の人命尊重の見地からの要請と
    のことで、私としても最終的に中止要請を受け入れることにい
    たしました。苦渋の決断であったことをご理解くださいますよう、
    お願い申しあげます。

    明日以降は予定の時間に私ほか数名が会場で待機し、この
    連絡がまにあわなかった参加者の方に対応する予定です。

    出張費用の支出との関係で中止の理由書が必要になる場合は
    ご連絡ください。

    以上、参加予定のみなさまにとりいそぎ連絡いたします。

    領域代表者:前川喜久雄
    2011.03.13

    なお従来から公開してきております「KOTONOHA『現代日本語
    書き言葉均衡コーパス』検索でもさいと」は、本日より1億480
    万語に拡張されて公開されています。是非、ご試用ください。
    http://www.kotonoha.gr.jp/demo/
    (2011.03.13)
  • 最終公開ワークショップ(研究成果報告会)を開催します

    本領域も本年度末で5年間の活動を終えることになります。5年間の成果を総括
    するための最終公開ワークショップを3月14日(月)〜16日(水)の3日間にわたっ
    て開催します。

    会場:時事通信ホール
     3月14日(月)10:30〜17:00 総括報告、サテライトセッション、計画班報告
     3月15日(火)10:00〜17:30 公募班報告、デモ・ポスターセッション、
                 シンポジウム「日本語コーパスと外国語としての日本語研究」
     3月16日(水)10:00〜16:00 計画班研究発表、デモ・ポスターセッション
     
    ○プログラム等の詳細は次のサイトをご覧下さい。
    http://www.ilcc.com/corpus/

    ○参加費:無料、ただし上記サイトでのお申し込みが必要です。
    ※参加希望者多数につき、早めにお申し込みください。
    (2011.01.27)
  • <BCCWJモニター公開データ利用者ポスター発表募集のお知らせ>

    国立国語研究所では,現在構築中の「現代日本語書き言葉均衡コーパス」(BCCWJ)の一部(許諾のとれた著作物)を「モニター公開データ」として研究者(大学院生を含む)の学術研究利用に限定して公開しています。

    「BCCWJモニター公開データ」は,コーパスの構築や活用に有益なフィードバックを得ること,また,コーパスを使った新しい日本語研究の進展を図ることを目的としています。その一環として,昨年度に引き続き,年度末の公開ワークショップにモニター公開データ利用者の発表の場を設けます。今年度は特定領域研究の最終年度にあたり,最後のワークショップになります。みなさまの積極的なご応募をお待ちします。

    1.名  称:特定領域研究「日本語コーパス」平成22年度公開ワークショップ
    2.開 催 日:2011年3月14日(月)
    3.場  所:時事通信ホール(東京都中央区銀座5-15-8)
    4.アクセス:http://www.jiji.com/hall/access.html
    5.主  催:特定領域研究「日本語コーパス」総括班
    6.応募資格:
    「BCCWJモニター公開データ」の利用者の方はどなたでも応募できます。
    ■「BCCWJモニター公開データ」は申し込みにより配布しています。
    未入手の方は,以下のサイトの「モニター公開」をご覧下さい。
    http://www.ninjal.ac.jp/kotonoha/ex_8.html

    7.発表内容:
    「BCCWJモニター公開データ」を利用した調査研究であれば,内容は自由です。
    想定される主な対象分野は,日本語学,言語学,言語教育(日本語教育,国語
    教育等),言語情報処理,辞書学,言語政策等ですが,これら以外の分野の
    発表も歓迎します。
    8.発表形式:ポスター発表のみ。
    9.主要日程:
     2010年12月28日(火) 応募締め切り
     2011年 1月 4日(火) 採否の通知
     2011年 1月31日(月) 予稿集用完成原稿締め切り
     2011年 3月14日(月) ポスター発表当日

    10.応募手続:
    (1) 2010年12月28日(火)までに,
    発表タイトル,お名前,御所属,身分(教員,大学院生等の別),400字程度の
    発表要旨,モニター公開データのバージョン(2008年度版あるいは2009年度版)
    を以下の受付メールアドレスに送って下さい。
    ・受付メールアドレス: tokuteicorpus@ninjal.ac.jp
    (@を半角に変えて下さい)

    (2) 採択された場合は,2011年1月31日(月)までに予稿集用の完成原稿を上記受付メールアドレスに添付ファイルで送って下さい。ファイルはPDFあるいはMSWORDで作成し,A4判で4〜10枚(ただし偶数ページで)。書式は以下の論文を参考にして下さい(書式の詳細は採択の際にお知らせします)。
    http://www.tokuteicorpus.jp/result/pdf/2006_014.pdf

    11.注意事項:
    発表者に対し,主催者側が旅費交通費等の費用を支給することはありません。

    お問い合せは,上記の受付メールアドレスまでお願いします。

    (2010.12.01)
  • 平成22年度全体会議を開催しました

    2010年8月30、31の両日に国立国語研究所(東京都立川市)で、全体会議を開催しました。全体会議は毎年この時期に開催する領域関係者による非公開の研究成果発表会です。今年は各班の進捗状況報告12件に加えて、27件の研究発表がおこなわれ、予稿集は240頁に達しました。参加者は初日が82名、二日目が91名(両日参加74名)で過去最大の数字となりました。

    (2010.09.03)
  • 平成21年度の公開ワークショップ(研究成果報告会)を開催します

    今年の公開ワークショップも、3月14日(日)〜16日(火)の3日間の開催と
    なります。初日(14日)は、『現代日本語書き言葉均衡コーパス』モニター公開
    版を利用した研究発表のためのサテライトセッションで15件の発表があります。
    15,16の両日は例年と同じ公開成果発表会です(会場が14日と15日〜16日
    とで違いますのでご注意ください)。

    ○日時
    3月14日(日) 13:00〜17:30 サテライトセッション
    3月15日(月) 10:00〜17:00 研究成果報告
    3月16日(火) 10:00〜16:00 研究成果報告 

    ○場所
    3月14日(日):国立国語研究所講堂
    〒190-8561 東京都立川市緑町10-2
    http://www.ninjal.ac.jp/utility/access.html

    3月15日(月)〜16日(火):東京工業大学大岡山キャンパス東工大蔵前会館くらまえホール
    〒152-8550 東京都目黒区大岡山2-12-1 
    http://www.somuka.titech.ac.jp/ttf/access/index.html
     
    ○プログラム等の詳細は次のサイトをご覧下さい。
    http://www.ilcc.com/corpus/

    ○参加費:無料、ただし上記サイトでのお申し込みが必要です。
    ※参加希望者多数につき、早めにお申し込みください。
    (2010.02.18)
  • 「BCCWJモニター公開データ利用者サテライトセッション」のお知らせ

    コーパスを用いた新しい日本語研究の可能性を切り開き、今後の日本語研究の充実を図るため、昨年度に引き続き、年度末の公開ワークショップにサテライトセッションを設けます。みなさまの研究成果を発表する機会としてご利用下さい。コーパスを使った本格的な日本語研究はまだ緒に付いたばかりです。みなさまの積極的なご応募をお待ちします。

    ■名  称:「BCCWJモニター公開データ利用者サテライトセッション」
    ■開 催 日:2010年3月14日(日)
    ■場  所:国立国語研究所(東京都立川市)
    ■主  催:特定領域研究「日本語コーパス」 総括班

    ■応募資格:
    「BCCWJモニター公開データ」の利用者の方はどなたでも応募できます。

    ■発表内容:
    「BCCWJモニター公開データ」を利用した調査研究であれば、内容は自由です。想定される主な対象分野は、日本語学、言語学、言語教育(日本語教育、国語教育等)、言語情報処理、辞書学、言語政策等ですが、これらに限定するわけではありません。

    ■発表形式:口頭発表及びポスター発表を予定しています。

    ■主要日程:
    2009年12月24日(木) 応募締め切り
    2010年 1月 7日(木) 採否の通知
    2010年 2月15日(月) 予稿集用完成原稿締め切り
    2010年 3月14日(日) サテライトセッション

    ■応募手続:
    (1)2009年12月24日(木)までに、発表タイトル、お名前、御所属、400字程度の発表要旨、モニター公開データのバージョン(2008年度版あるいは2009年度版)、希望する発表形式(口頭発表、ポスター発表のいずれか)を以下の受付メールアドレスに送って下さい。メール以外の方法での応募はご遠慮ください。
    ・受付メールアドレス:tokuteicorpus@ninjal.ac.jp
    (@を半角に変えてください。)

    (2)採択された場合は、2010年2月15日(月)までに予稿集用の完成原稿を上記受付メールアドレスに添付ファイルで送って下さい。ファイルはPDFあるいはMSWORD で作成し,A4判で4〜10枚(ただし偶数ページで)。書式は以下の論文を参考にして下さい(書式の詳細は採択の際にお知らせします)。
    http://www.tokuteicorpus.jp/result/pdf/2006_014.pdf

    ■注意事項:
    (1)会場・日程の都合により、ご希望の発表形式を変更させていただく場合があります。
    (2)サテライトセッションでの発表者に対し主催者側が旅費交通費等の費用を支給することはありません。
    (2009.12.16)
各研究班からのお知らせ−最新投稿リスト

» 2011/01/27 総括班 「」
最終公開ワークショップ(研究成果報告会)を開催します 本領域も本年度末で5年間の活動を終えることになります。5年間の成...... [続きを読む]

» 2010/12/01 総括班 「公開ワークショップ発表募集」
<BCCWJモニター公開データ利用者ポスター発表募集のお知らせ> 国立国語研究所では,現在構築中の「現代日本語書き言葉均衡コ...... [続きを読む]

» 2010/05/24 日本語教育班 「日本語教育班共催WS開催のお知らせ」
ワークショップ 「日本語教育とコーパス」 ・日時:2010年6月12日(土)13:00-17:00 ・場所:麗澤大学 生涯教育プラザ棟 PC...... [続きを読む]

» 2010/05/11 日本語教育班 「班会議を開催しました」
今年度第1回日本語教育班会議を5月8日(日)に早稲田大学26号館402教室にて開催しました。 1.【11:00-12:00】 進捗状況報...... [続きを読む]

» 2010/01/25 日本語教育班 「班会議を開催しました。」
今年度第3回班会議を1月23日(土)に早稲田大学22号館で開催し、各担当者が進捗状況を報告しました。... [続きを読む]

□E-mail:tokuteicorpus@kokken.go.jp(全角@を半角@に置き換えてください)