Skip to content
This repository has been archived by the owner on Apr 15, 2020. It is now read-only.

기분석 사전 관리 기능 추가 #7

Closed
9bow opened this issue Mar 19, 2019 · 2 comments
Closed

기분석 사전 관리 기능 추가 #7

9bow opened this issue Mar 19, 2019 · 2 comments
Assignees
Labels
enhancement New feature or request
Milestone

Comments

@9bow
Copy link
Member

9bow commented Mar 19, 2019

기능 설명

기분석 사전인 fwd.user 파일을 관리할 수 있는 기능을 추가합니다.
fwd.user 파일의 형태는 다음과 같습니다.

  • # 문자로 시작하는 행은 무시합니다.
  • 공백인 행도 무시합니다.
  • TAB문자로 구분하여 기분석 어절 [TAB] 형태소/품사 [SPACE] 형태소/품사 ... 형태로 작성합니다.
  • 한 행에 2개 이상의 TAB 문자 존재하거나, 형태소 또는 품사가 없을 경우 에러를 발생하고 불러오기를 멈춥니다.

추가 정보

기분석 사전은 KOMORAN 프로젝트의 user_data/fwd.user 파일로 존재합니다. 링크

@9bow 9bow added the enhancement New feature or request label Mar 19, 2019
@9bow 9bow self-assigned this Mar 22, 2019
@9bow
Copy link
Member Author

9bow commented Mar 22, 2019

기분석 사전의 관리 화면은 2개의 컬럼(기분석 어절형태소/품사``[SPACE]``형태소/품사``...)을 갖습니다.
이 때, 분석 결과를 파싱하는 것에 시간이 걸려 milestone을 v0.7로 변경합니다.

@9bow
Copy link
Member Author

9bow commented Sep 3, 2019

#20 과 관련하여, 업로드 하는 파일 내의 #으로 시작하는 문장은 별도로 처리하지 않습니다.
#코멘트가 달려있는 경우 => 잘못된 형태의 파일로 에러를 출력합니다.
#가나다\t가나/NNP 다/EF => 기분석 어절이 #가나다인 것으로 간주합니다. 이후 모델 빌드 시 KOMORAN에 #가 포함된 형태로 제공되어 주석 처리됩니다. (사용자가 일부 기분석 어절을 예외 처리하고 싶을 때 주석처럼 사용)

Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

1 participant