-
BERT-CRF-ENTITY
일단 몇개 데이터 포맷 맞춰서 만든다음 넣어보는게 좋을듯함
- 발화데이터여서 우리가 원하는 데이터 나오지 않을 가능성
- 발화 데이터 사용
- $$$으로 데이터 구분
- 한국인이 만듬
devjwsong/bert-crf-entity-extraction-pytorch#1
사용가능
- sports.txt
- restaurant-search.txt
- food-ordering.txt
restaurant-search.txt 랑 관련있으니 이거로 해보기
# original self.config['hidden_size'] = bert_config.dim # fixed self.config['hidden_size'] = bert_config.hidden_size
src/data_process.py 사용
inputs
labels
-
NER-BERT-CRF
GitHub - Louis-udm/NER-BERT-CRF
일단 파이썬 파일 하나로 되어있어서 코랩에서 돌리기에도 좋을듯함
그냥 다 복사해서 노트북 파일에 넣어도 될듯
- 돌려보기
- 모델 구조
- 함수가 하는 역활
- 어떤 pre-trained 모델 사용하는지
- 무슨 라이브러리 사용하는지
- 예시
- BERT-base ← transformers
- CRF ← pytorch
- Data
- 어떤 데이터 사용
- 데이터의 구조
- 우리가 데이터 변경 어떻게 할지
- 우리에 맞게 fine-tune가능한지
- 성능은 괜찮은지
- 코랩에서 1 epoch 당 시간
-
BERT-BiLSTM-CRF
일단 보류
- 중국어로 써있는게 많음
GitHub - Dhanachandra/bert_crf: BERT CRF model for Name Entity Recognition in pytorch