Skip to content

Morizeyao/Decoders-Chinese-TF2.0

Repository files navigation

基于Tensorflow 2.0 与 Huggingface 的 Transformers 的 GPT2 与 Transformer-XL 训练代码

(本项目不保证能稳定运行)

使用方法

  • pip install -r requirements.txt
  • 将scripts文件夹中的几个sh文件拷贝到拷贝到根目录。
  • 运行prepare_data.sh预处理。
  • 然后运行train_gpt2_keras.sh训练。
  • 运行generate_gpt2_keras.sh生成。

数据格式

  • 本项目采用的语料格式为一个txt文件,每一行是一个json的列表,这个列表中包含了一篇文章。

About

GPT2 training script for Chinese in Tensorflow 2.0

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published