Skip to content

中山大学 自然语言处理项目:中文语言模型。Keras实现,BiLSTM框架。

Notifications You must be signed in to change notification settings

SleepingMonster/Keras_BiLSTM_Language-Model

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Keras_BiLSTM_Language-Model

中山大学 自然语言处理项目:中文语言模型。

Keras实现,BiLSTM框架。

Readme

实验环境

  • keras 2.3.1版本和tensorflow 2.2版本(或者其他相匹配的kerastensorflow版本)

  • keras_contrib库、gensim库、pickle库、tqdm

实验工具

jupyter notebook

文件组织

  • 词向量:sgns.wiki.word 文件
  • 代码code文件夹:
    • task2.ipynb(jupyter notebook格式)和task2.py,建议执行task2.ipynb
    • 逐块执行即可得到训练EPOCH次数之后的测试集的预测结果,并会输出预测结果。
      • EPOCH的取值可在train函数的参数中进行调整。
    • 结果:训练集迭代运行25次之后的结果保存为result.txt文件。
  • 数据集data文件夹:
    • SIGHAN Microsoft Research数据集的数据。
    • 包含msr_trainmsr_test_gold文件。
      • 两种格式:.txt.utf8,前者是方便阅读创建的,后者才是真正程序使用的。
    • result.txt文件为预测结果文件。
  • 实验报告:
    • report.pdf语言模型实验报告.md
  • 项目要求:期中作业.pdf

About

中山大学 自然语言处理项目:中文语言模型。Keras实现,BiLSTM框架。

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published