分词结果严重错误 #173

wencan · 2023-10-15T13:14:27Z

cython-3.0.2 pkuseg-0.0.25

pkuseg.pkuseg().cut('本书由百度官方出品，百度公司CTO王海峰博士作序，张钹院士、李未院士、百度集团副总裁吴甜联袂推荐。')

输出是：
['本书', '由', '百度', '官方', '出品', '，', '百度', '公司', 'CTO王', '海峰', '博士', '作', '序', '，', '张', '钹', '院士', '、', '李', '未', '院士', '、', '百度', '集团', '副总裁', '吴甜', '联袂', '推荐', '。']

lcyyyyyyyyyyy · 2023-10-15T13:15:02Z

***@***.***，本次回复为系统自动回复！

lucasjinreal · 2023-10-24T03:20:52Z

放弃吧，这库已经不维护了

viviananana · 2024-03-28T15:37:15Z

seg = pkuseg.pkuseg(model_name='web') # 程序会自动下载所对应的细领域模型
text = seg.cut('本书由百度官方出品，百度公司CTO王海峰博士作序，张钹院士、李未院士、百度集团副总裁吴甜联袂推荐。') # 进行分词
print(text)
输出：
['本书', '由', '百度', '官方', '出品', '，', '百度', '公司', 'CTO', '王海峰', '博士', '作序', '，', '张钹', '院士', '、', '李未', '院士', '、', '百度', '集团', '副总裁', '吴甜', '联袂', '推荐', '。']

我试了一下结果还蛮正常哎

liusen373 · 2024-05-16T10:44:36Z

seg = pkuseg.pkuseg(model_name='web') # 程序会自动下载所对应的细领域模型 text = seg.cut('本书由百度官方出品，百度公司CTO王海峰博士作序，张钹院士、李未院士、百度集团副总裁吴甜联袂推荐。') # 进行分词 print(text) 输出： ['本书', '由', '百度', '官方', '出品', '，', '百度', '公司', 'CTO', '王海峰', '博士', '作序', '，', '张钹', '院士', '、', '李未', '院士', '、', '百度', '集团', '副总裁', '吴甜', '联袂', '推荐', '。']

我试了一下结果还蛮正常哎

因为你用的是web模型，用default模型结果就和楼主一样了

lcyyyyyyyyyyy · 2024-05-16T10:45:10Z

***@***.***，本次回复为系统自动回复！

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

分词结果严重错误 #173

分词结果严重错误 #173

wencan commented Oct 15, 2023

lcyyyyyyyyyyy commented Oct 15, 2023 via email

lucasjinreal commented Oct 24, 2023

viviananana commented Mar 28, 2024

liusen373 commented May 16, 2024

lcyyyyyyyyyyy commented May 16, 2024 via email

分词结果严重错误 #173

分词结果严重错误 #173

Comments

wencan commented Oct 15, 2023

lcyyyyyyyyyyy commented Oct 15, 2023 via email

lucasjinreal commented Oct 24, 2023

viviananana commented Mar 28, 2024

liusen373 commented May 16, 2024

lcyyyyyyyyyyy commented May 16, 2024 via email