클로드 코드로 RAG만들었는데 혹시 몰라 클로드 코드에게 물어봤다.
RAG가 만들기 힘들다던데 클로드 코드로 만든게 문제가 될 것인지에 대해……
그랬더니 RAG(Retrieval-Augmented Generation) 개발이 어려운 주요 이유를 몇가지 알려주고는
Claude Code로 만들 때 예상되는 문제를 알려주네..
후자는 사람이 테스트로 결과 확인하고 선택해줘야 하는 것들로 보임
RAG 개발이 어려운 주요 이유
1. 청킹(Chunking) 전략
문서를 어떤 크기로 나눌지, 어디서 자를지 결정하기 어려움 너무 작으면 문맥 손실, 너무 크면 검색 정확도 저하
2. 임베딩 품질
어떤 임베딩 모델을 쓸지, 한국어 지원이 잘 되는지 도메인 특화 용어가 잘 임베딩되는지
3. 검색 정확도
관련 문서를 못 찾거나 엉뚱한 문서를 가져오는 문제 리랭킹, 하이브리드 검색 등 튜닝 필요
4. 프롬프트 엔지니어링
검색 결과를 LLM에 어떻게 전달할지 환각(hallucination) 방지
|
Claude Code로 만들 때 예상되는 문제
기술적으로는 충분히 가능합니다. 다만 주의할 점들이 있어요:
벡터 DB 선택: Pinecone, Weaviate, Chroma 등 외부 서비스 연동 필요 반복적 실험: 청킹 크기, 검색 파라미터 등 많은 시행착오가 필요한데, 이건 어떤 도구를 써도 마찬가지 평가 어려움: "잘 작동하는지" 정량적으로 측정하기 어려움 |
그리고 결론으로 클로드 코드가 말해준것.
RAG 자체의 어려움이지 Claude Code의 한계는 아니에요. 오히려 빠르게 프로토타입 만들고 반복하기엔 좋은 선택일 수 있습니다.