さくらインターネットに自前の辞書を設定する方法
今後辞書にキーワードを追加とかやってみたいので、自前の辞書を見るようにします。
こちらを参考にしました。
さくらインターネットにPerl版のMeCab(形態素解析)を導入する
ちょっと読んでみたら、仕組みは単純みたいです。
デフォルトだと、
/usr/local/etc/mecabrc
を見に行くんですね。
でも、ホームディレクトリに
/home/****/.mecabrc
があると、こちらを優先的に見てくれます。
というわけで、コピーして書き込み権をつけます。
$ cd $ cp -i /usr/local/etc/mecabrc .mecabrc $ chmod u+w .mecabrc
viで編集します。
試しに、適当な存在しないディレクトリをdicdirに指定してみます。
; ; Configuration file of MeCab ; ; $Id: mecabrc.in,v 1.3 2006/05/29 15:36:08 taku-ku Exp $; ; ;dicdir = /usr/local/lib/mecab/dic/ipadic dicdir = /usr/local/lib/mecab/dic/hoge ; userdic = /home/foo/bar/user.dic ; output-format-type = wakati ; input-buffer-size = 8192 ; node-format = %m\n ; bos-format = %S\n ; eos-format = EOS\n
これで実行してみると・・・
~]$ mecab param.cpp(69) [ifs] no such file or directory: /usr/local/lib/mecab/dic/hoge/dicrc
ちゃんと見に行く先が変わりました!
というわけで、インストールされた場所を指定してみます。
dicdir = /home/****/local/home/****/local/lib/mecab/dic/naist-jdic
見比べてみます。
デフォルト辞書
めかぶの辞書のインストールが何故かうまくいかない。 め 名詞,一般,*,*,*,*,め,メ,メ かぶ 動詞,自立,*,*,五段・ラ行,体言接続特殊2,かぶる,カブ,カブ の 助詞,連体化,*,*,*,*,の,ノ,ノ 辞書 名詞,一般,*,*,*,*,辞書,ジショ,ジショ の 助詞,連体化,*,*,*,*,の,ノ,ノ インストール 名詞,一般,*,*,*,*,インストール,インストール,インストール が 助詞,格助詞,一般,*,*,*,が,ガ,ガ 何故か 副詞,一般,*,*,*,*,何故か,ナゼカ,ナゼカ うまく 形容詞,自立,*,*,形容詞・アウオ段,連用テ接続,うまい,ウマク,ウマク いか 動詞,自立,*,*,五段・カ行促音便,未然形,いく,イカ,イカ ない 助動詞,*,*,*,特殊・ナイ,基本形,ない,ナイ,ナイ 。 記号,句点,*,*,*,*,。,。,。
新辞書
めかぶの辞書のインストールが何故かうまくいかない。 め 名詞,一般,*,*,*,*,め,メ,メ,, かぶ 動詞,自立,*,*,五段・ラ行,体言接続特殊2,かぶる,カブ,カブ,かぶ/被, の 助詞,連体化,*,*,*,*,の,ノ,ノ,, 辞書 名詞,一般,*,*,*,*,辞書,ジショ,ジショ,, の 助詞,連体化,*,*,*,*,の,ノ,ノ,, インストール 名詞,一般,*,*,*,*,インストール,インストール,インストール,, が 助詞,格助詞,一般,*,*,*,が,ガ,ガ,, 何故 副詞,助詞類接続,*,*,*,*,何故,ナゼ,ナゼ,, か 助詞,副助詞/並立助詞/終助詞,*,*,*,*,か,カ,カ,, うまく 形容詞,自立,*,*,形容詞・アウオ段,連用テ接続,うまい,ウマク,ウマク,うまく/上手く, いか 動詞,自立,*,*,五段・カ行促音便,未然形,いく,イカ,イカ,いか/逝か, ない 助動詞,*,*,*,特殊・ナイ,基本形,ない,ナイ,ナイ,, 。 記号,句点,*,*,*,*,。,。,。,,
区切りは変わってないですけど、feature文字列?がちょっと変わっています。
ディスカッション
コメント一覧
まだ、コメントがありません