Skip to content

CyanYoung/chinese_word_segment_2

Repository files navigation

Chinese Word Segment 2018-11

1.preprocess

clean() 删去无用字符,打乱后 train 70% / dev 20% / test 10% 划分

2.represent

convert() 分别删去、记录空格得到 sent、label,pad() 填充为相同长度

3.build

通过 rnn、s2s 构建序列标注模型,计算 mask_loss、mask_acc

4.segment

predict() 比较原句和填充长度得到 mask_pred,在为 1 的字后插入空格

Releases

No releases published

Packages

No packages published

Languages