Topic Classification with Different Approaches

Topic Classification 을 다음과 같은 다양한 방법론으로 해결합니다.

1. Classification

Classifier를 이용해 사전학습모델(PLM)을 Fine-tuning 하는 방법입니다.
일반적으로 Classification 테스크에서 사용되는 방법입니다. BLOG

2. Masked Language Modeling (MLM)

MLM Head를 이용해 프롬프트의 [MASK] 토큰을 예측하는 방법입니다.
Verbalizer로 예측한 토큰과 레이블을 연결해 MLM 테스크를 분류 테스크로 전환합니다. BLOG
참고: Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference
License :This project is licensed under the Apache License, Version 2.0. See the LICENSE file for details.

3. Matching

텍스트와 레이블 사이의 함의(Entaliment) 여부를 예측하는 방법입니다.
다중 분류 테스크를 이진 분류 테스크로 전환해 해결합니다. BLOG
참고: Entailment as Few-Shot Learner

4. Seq2Seq

인코더 모델이 아닌 Seq2Seq 모델을 이용해 분류 테스크를 해결합니다.
디코더로부터 출력된 마지막 토큰의 표현을 이용해 분류를 수행합니다. BLOG

Citing

@article{schick2020exploiting,
  title={Exploiting Cloze Questions for Few-Shot Text Classification and Natural Language Inference},
  author={Timo Schick and Hinrich Schütze},
  journal={Computing Research Repository},
  volume={arXiv:2001.07676},
  url={http://arxiv.org/abs/2001.07676},
  year={2020}
}
@article{schick2020small,
  title={It's Not Just Size That Matters: Small Language Models Are Also Few-Shot Learners},
  author={Timo Schick and Hinrich Schütze},
  journal={Computing Research Repository},
  volume={arXiv:2009.07118},
  url={http://arxiv.org/abs/2009.07118},
  year={2020}
}
@article{wang2020entailment,
  title={Entailment and Few-Shot Learner},
  author={Sinong Wang, Han Fang, Madian Khabsa, Hanzi Mao, Hao Ma},
  journal={Computing Research Repository},
  volume={arXiv:2104.14690},
  url={http://arxiv.org/abs/2009.07118},
  year={2020}
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Topic Classification with Different Approaches

1. Classification

2. Masked Language Modeling (MLM)

3. Matching

4. Seq2Seq

Citing

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 124 Commits
Classification		Classification
MLM		MLM
Matching		Matching
Seq2Seq		Seq2Seq
images		images
LICENSE		LICENSE
README.md		README.md

License

snumin44/topic-classification

Folders and files

Latest commit

History

Repository files navigation

Topic Classification with Different Approaches

1. Classification

2. Masked Language Modeling (MLM)

3. Matching

4. Seq2Seq

Citing

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages