Skip to content

wbchief/2022CCF_BDCI_fewshot_data_classification_baseline

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 

Repository files navigation

CCF BDCI 小样本数据分类任务 baseline

参考说明

预训练模型:macbert 下载链接: https://huggingface.co/hfl/chinese-macbert-base 

说明

创新是国家发展、民族复兴的不竭动力。近年来,随着政策扶植、国家工业化水平和国民教育水平提高,我国的专利申请量快速增长,专利检索、查新、管理等需求也不断增加。为了满足以上需求,提升专利服务质量,通常需要建立多个维度的专利分类体系。常见的分类体系有国际专利分类(IPC)、联合专利分类(CPC)、欧洲专利分类(ECLA)等,但是这些分类体系比较复杂,专业性强,对非IP人员而言使用有一定的困难。智慧芽作为国际领先的知识产权SaaS平台,根据用户的搜索习惯等因素,制定了一套新的专利分类体系,从而提升用户的使用体验。 比赛地址:https://www.datafountain.cn/competitions/582

运行说明

环境

python 3.7.12 pytorch 1.7.1 transformers 4.18.0

运行

修改src下的配置文件config.py 数据路径 修改scripts 下的训练脚本和预测脚本

结果

微调10轮

线下:0.42 线上:.41901556898

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published