今更mecabの話題です

mecabは統計ソフトRでもcranからインストールして使えます。しかしRに頼らずにウィンドウズに直接インストールをしても使えます。多分興味のある方はいちどやってみたことがあると思います。

 

ウィンドウズ版のmecabをダウンロードしインストールして、実行するとコマンドプロンプトが出てきます。

次に、分析をしたいテキストファイル

「〇〇.txt」を用意して、(文字コードUTF-8) 、コマンドプロンプトをそのテキストのあるところで開きます。

 

(余談ですが、そこの場所で直接コマンドプロンプトを立ち上げたいときは、シフトを押しながら右クリックでメニューにコマンドプロンプトが現れるので時間短縮になります。)

 

そして、コマンドプロンプトの命令で、

mecab.exe  〇〇.txt  -o  out.txt 

と入力して実行します。

 

そうすると、out.txt に品詞の解析結果が表示されます。

 

Rも簡単さでは大差はありませんが、いちいちプロンプトを立ち上げるのもめんどくさいかもしれません。

 

ちなみに、昔分析をした頃にはなかなか精度は良かったのですがたまに単語の途中でぶつ切れになり間違って解析されているところが散見されていました。なので鵜呑みにはできないと思います。

 

今後テキストマイニングの勉強を本格的にしたいと考えています。