Skip to content

BERTによる日本語固有表現抽出のファインチューニング用プログラム

License

Notifications You must be signed in to change notification settings

jurabiinc/bert-ner-japanese

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

bert-ner-japanese

BERTによる日本語固有表現抽出のファインチューニング用プログラム

使用方法

パッケージのインストール

requirements.txtに書かれているパッケージをインストールします。

学習用データのダウンロード

stockmarkteam/ner-wikipedia-datasetから学習用データセット(ner.json)をダウンロードし、リポジトリ直下のdatasetディレクトリに保存します。

BERT入力データの作成

create_tagged_token.pyを実行して、ダウンロードした学習用データを、BERTの入力データの形式に変換します。 作成されたデータは、dataset/ner_tagged.jsonに出力されます。

学習の実行

train.pyを実行して、ファインチューニングを行います。 学習済みのモデルは、modelディレクトリに出力されます。

テスト

test.pyを実行して、固有表現が抽出できることを確認して下さい。

About

BERTによる日本語固有表現抽出のファインチューニング用プログラム

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages