Python による日本語自然言語処理〜系列ラベリングによる実世界テキスト分析〜

発表スケジュール: 2019/09/16 14:40-15:10 (30min)
場所: D会議室
レベル: Beginner
発表/資料: JP
発表スライド: nagisa-tutorial-pycon2019.pdf
Speaker Deck: Slides

nagisa による単語分割と品詞タグ付けの実装方法

基本的な使い方: basic_usage.ipynb [Colab notebook]
ワードクラウドの作成: word_cloud.ipynb [Colab notebook]

Python による固有表現抽出モデルの実装方法

事前準備: Speaker Deck
京都大学ウェブ文書リードコーパスの前処理: preprocess_kwdlc.py
固有表現抽出モデルの学習: train_kwdlc_model.py
学習済みモデルの利用方法: predict_kwdlc_model.py
固有表現ごとの正解率の確認: evaluate_kwdlc_model.py

参考リンク