本リポジトリでは、国立情報学研究所経由で提供を行っている「不満カテゴリ辞書データ」のためのスクリプトを公開しています。 本リポジトリのコードを利用すると、不満カテゴリ辞書データを利用して、簡便にカテゴリ分類の実施が可能です。
本リポジトリのコードを利用したカテゴリ分類結果については、国立情報学研究所のページを参照してください。
Python3.5で動作を確認しています。 Python2x系では動作をしません。
NIIのリポジトリからダウンロードした辞書ファイルのJSONファイルを ./dictionary-data
以下に配置します。
JapaneseTokenizerのReadmeを読み、形態素解析器のインストールを実施してください。
python setup.py install
python get_wikipedia_text.py
python evaluate_dictionary.py
python get_category_score.py