- LangChain : 조현상
- Fine-tuning : 차민수
- Hugging Face : 정의현
- Embedding - intfloat/multilingual-e5-base
- DB - FAISS
- Tokenizer - rtzr/ko-gemma-2-9b-it
중소벤처기업부_혁신창업사업화자금(융자) , ./test_source/중소벤처기업부_혁신창업사업화자금(융자).pdf , 2022년 혁신창업사업화자금(융자)의 예산은 얼마인가요?
위와 같은 쿼리가 주어졌을 때 리트리버를 통해 쿼리에 대한 답변 생성
-> 2022년 혁신창업사업화자금(융자)의 예산은 2조 78억원입니다.
- PDF 텍스트 추출
- 텍스트를 chunk로 분할
- Document 객체 리스트 생성
- Document 임베딩
- DB 저장 및 리트리버 생성
- LLM 모델 세팅
- RAG 체인 진행
- GPU 한계로 무거운 모델 사용 불가
- 자원의 한계가 있기 때문에 가벼운 모델이라도 여러 번 테스트 불가