形態素解析辞書UniDic

UniDicとは

UniDicの特長

  • 国立国語研究所で規定した「短単位」という揺れがない斉一な単位で設計されています。
  • 語彙素・語形・書字形・発音形の階層構造を持ち,表記の揺れや語形の変異にかかわらず同一の見出しを与えることができます。(詳しくはこちらのページをご覧ください。)
  • アクセントや音変化の情報を付与することができ,音声処理の研究に利用することができます。
  • 詳しくは多様な目的に適した形態素解析システム用電子化辞書の開発(PDF)をご覧ください。

UniDicに関する情報

新着情報
  • 2010/11/24 (水) UniDic-1.3.12 Windows版パッケージを更新(unidic1312a-pkg.exe)
    • Windows 7に対応しました。辞書には変更はありません。
  • 2009/12/25 (金) UniDic-1.3.12ソース辞書 修正版をリリース
    • ソース辞書のアーカイブで抜け落ちていたファイル(right-id.def)を追加しました。辞書には変更はありません。また、以前のものでも利用上特に問題はありません。
  • 2009/08/14 (金) UniDic-1.3.12 修正版をリリース
  • 2009/07/31 (金) UniDic-1.3.12 リリース
    • MeCab版の辞書に仮名形やアクセント型などを出力するようにしました。
    • 「名詞-固有名詞-組織名」を廃止しました。
    • UniDicに関する情報(解析精度見出し語数)を更新しました。
  • 2009/05/07 (木) UniDic-1.3.11 リリース
    • 顔文字などを追加し、Web文書に対応しました。
    • UniDicに関する情報(解析精度見出し語数)を更新しました。
  • 2008/08/01 (金) UniDicに関する情報(解析精度見出し語数)を掲載しました。
  • 2008/07/16 (水) UniDic-1.3.9 リリース
    • MeCab版辞書の並び順を変更しました (発音形の精度向上)。
  • 2008/04/25 (金) UniDic-1.3.8 リリース
    • 新たに語種情報に対応しました。
    • ChaSen版に加え、MeCab版をリリースしました。
  • 2007/11/04 (日) Windows版パッケージを更新(unidic-chasen_win135a.exe)
  • 2007/10/12 (金) UniDic-chasen-1.3.5 リリース
UniDicの利用
  • 利用許諾条件にしたがい,利用者登録後、無償でダウンロードして利用できます。
  • 関連ツールとして,数字の読みなどを正しく解析するための変換用スタイルシート「NumTrans」「ChaOne」,解析のためのGUI「茶まめ」(Windows版のみ)を公開しています。

  • UniDicを利用した研究を行う際には、参考文献のページにある文献を参考にしてください。
著作権
  • 本サイトで公開中のUniDicの著作権は,伝康晴・山田篤・小椋秀樹・小磯花絵・小木曽智信が保持します。
UniDic Copyright © 2007-2010 DEN Yasuharu, YAMADA Atsushi, OGURA Hideki, KOISO Hanae, OGISO Toshinobu
問い合わせ先
  • Tel: 042-540-4300 (国立国語研究所代表)
  • E-mail: unidic◎ninjal.ac.jp