-
-
Notifications
You must be signed in to change notification settings - Fork 45
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
이용자 사전 기능 강화 #37
Labels
Comments
기분석 패턴을 등록하는 기능은 0.11.0 버전에서 Lines 295 to 323 in 380ccd4
|
bab2min
added a commit
that referenced
this issue
Feb 1, 2024
0.17.0버전부터 공백을 포함한 다어절 단어를 사전에 등록할 수 있도록 개선되었습니다. |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
기능 설명
현재 이용자 사전에는 형태소 1개짜리 단어만 등록이 가능하다. 공백을 포함하는 여러 단어를 추가하거나 특정 패턴의 분석 방법을 설정해 등록할 수 있도록 하면 유용할듯.
여러 단어로 구성된 엔트리 등록
복합 명사
혹은복합명사
라는 표현을 만나면복합_명사/NNP
로 분석할 수 있도록 단어를 추가한다이 기능은 형태소 Trie를 탐색시 공백으로 분리된 토큰을 한 덩어리로 묶어서 처리하는 기능이 지원되어야 개발 가능함.
기분석된 패턴 등록
튕겼
을 만나면튕기다/VV + 었/EP
으로 분석할 수 있도록 사전에 표층형-실질형을 등록한다.이미 내부 사전에는
chunks
라는 이름으로 여러 형태소를 한 덩어리로 묶고 이에 고유한 Form을 배정하는 기능이 등록되어 있음. 이 기능을 이용자 사전에서도 접근가능하도록 수정하면 될 것으로 보임.Kiwi/include/kiwi/Form.h
Lines 10 to 20 in 844474e
The text was updated successfully, but these errors were encountered: