Skip to content

一个关于中文的抽取式和基于BERT的摘要模型

Notifications You must be signed in to change notification settings

zhiyou720/chinese_summarizer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

25 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

后续工作

我又去翻了翻老代码,试了下效果,这个效果说实话挺垃圾的。

之前为了保证效果,还搞了很多句法分析在里面,太复杂了。

之后抽空写一个纯生成的摘要模型。

2021.7.7

抽取式摘要过于复杂,为保证效果,涉及到多种复杂NLP技术,不是未来发展方向。

如果后续有时间,我会考虑实现一个基于transformer的端到端生成式摘要模型。

欢迎一起讨论

Data Preprocess

  • Standford Core NLP Toolkit

https://stanfordnlp.github.io/CoreNLP/

set classpath C:\Users\VY\Desktop\Project\chinese_summarizer\utils\stanford-corenlp-full-2017-06-09\stanford-corenlp-3.8.0.jar

python preprocess.py

Train

python train.py

Test

  • make data

python preprocess.py -oov_test True -data_name DATA_NAME -raw_path RAW_PATH

About

一个关于中文的抽取式和基于BERT的摘要模型

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages