Mecab (形態素解析エンジン)のインストールメモ

@Homeのタスクで形態素解析する必要がでてきたので、MECABをUbunt14.04にパッケージでインストールしたときのメモ。ユーザ辞書の作成で少しはまった。

以下のサイトを参照した。

  • https://gist.github.com/YoshihitoAso/9048005
  • https://gist.github.com/Haroperi/48dbd30b557c585ad287

インストール

  • $ sudo apt-get install mecab libmecab-dev mecab-ipadic
  • $ sudo aptitude install mecab-ipadic-utf8
  • $ sudo apt-get install python-mecab

ユーザ辞書の作成

  • ユーザ辞書の元になるcsvファイルを作成する。ここではファイル名をuser.dicとする。
    • グリーンティ,,,1,名詞,一般,*,*,*,*,グリーンティ,グリーンティ,グリーンティ
  • csvファイルのあるディレクトリへ移動
    • 例: cd  ~/catkin_ws/src/restaurant_voice
  • 辞書を作成する
    • $ `mecab-config –libexecdir`/mecab-dict-index -d /usr/share/mecab/dic/ipadic -u user.dic -f utf-8 -t utf-8 user.csv
  • mecabの設定ファイルを編集する
    • ユーザ辞書登録
      /etc/mecabrcの9行目を以下のように設定
      userdic = /home/user_name/catkin_ws/src/restaurant_voice/user.dic

終わり

コメント

タイトルとURLをコピーしました