Chinese Word Segment 2018-11 1.preprocess clean() 删去无用字符,打乱后 train 70% / dev 20% / test 10% 划分 2.represent convert() 分别删去、记录空格得到 sent、label,pad() 填充为相同长度 3.build 通过 rnn、s2s 构建序列标注模型,计算 mask_loss、mask_acc 4.segment predict() 比较原句和填充长度得到 mask_pred,在为 1 的字后插入空格