VPC 환경에서 이용 가능합니다.
서비스 이용 신청 완료 후, RAG 시스템을 이용한 검색 모델 테스트를 진행하려면 사용자가 검색 테스트에 활용하려는 데이터 파일을 색인하는 과정을 진행해야 합니다. 여기서는 서비스 생성 순서, 데이터 설정 방법 및 서비스 삭제 방법을 설명하고, RAG 개발 가이드를 안내합니다.
서비스 생성 순서는 다음과 같습니다.
서비스 생성
Services 메뉴에서 서비스 생성을 진행하는 방법은 다음과 같습니다.
- 네이버 클라우드 플랫폼 콘솔의 VPC 환경에서
> Services > AI Services > RAG 메뉴를 차례대로 클릭해 주십시오. - Services 메뉴를 클릭해 주십시오.
- [서비스 생성] 버튼을 클릭해 주십시오.
- 서비스 생성 페이지에서 서비스 설정 정보를 입력 후 [다음] 버튼을 클릭해 주십시오.
- 데이터 설정 단계에서 필요한 정보를 입력 후 [다음] 버튼을 클릭해 주십시오.
- Retrieval 설정 단계에서 필요한 정보를 입력 후 [다음] 버튼을 클릭해 주십시오.
- Generation 설정 단계에서 CLOVA Studio 서비스와 연동 및 필요한 정보를 입력 후 [다음] 버튼을 클릭해 주십시오.
- 최종 확인 단계에서 입력된 정보를 확인해 주십시오.
- [확인] 버튼을 클릭해 주십시오.
서비스는 999개까지 생성할 수 있습니다.
1. 서비스 설정
서비스 설정에서 다음의 정보를 입력해 주십시오.
서비스 설정
- 서비스명: 3~20 자까지 입력 가능
- 서비스 설명: 최대 50 자까지 입력 가능
2. 데이터 설정
데이터 설정에서 다음의 정보를 설정해 주십시오.
데이터 연동 방식 선택
- 연동 방식: NCP Object Storage 및 RESTful API 중 선택
- NCP Object Storage: 네이버 클라우드 플랫폼의 Object Storage 버킷에 보관된 데이터를 색인
- RESTful API: API로 색인 데이터를 직접 호출
Object Storage 상품에 대한 자세한 정보는 다음의 페이지를 참조해 주십시오.
데이터 설정
데이터 연동 방식에서 NCP Object Storage를 선택한 경우, 색인할 데이터 파일을 설정해 주십시오.
- Object Storage 버킷: Object Storage 상품에서 생성한 버킷 개수 표시
- [새로 고침] 버튼: 선택된 버킷 내 파일 목록의 새로 고침 실행
- Object Storage 버킷: Object Storage 상품에서 생성한 버킷 목록 표시
- 파일 사이즈 최대 100MB
- 지원 가능한 이미지 포맷: .jpg, .png, .tiff
- 지원 가능한 문서 포맷: .pdf, .pptx, .docx, .hwp, .hwpx, .txt
- 지원 가능한 데이터파일 포맷: .md, .json, .xml
- Object Storage 버킷: Object Storage 상품에서 생성한 버킷 목록 표시
- 파일 목록: 버킷 내에 보관된 데이터 개수 표시
- 파일명: 버킷 내에 보관된 데이터 파일명
- 최근 수정일: 버킷 내에 보관된 데이터의 최종 변경 일시
- 문서: [문서보기] 버튼을 클릭하면 미리보기 화면 제공
- [색인 추가] 버튼: 파일 목록에서 색인 데이터를 선택 후 [색인 추가] 버튼을 클릭하여 색인 대상 목록에 추가
- 색인 대상: 색인 대상에 추가된 파일 개수 표시
- [새로 고침] 버튼: 색인 대상 목록의 새로 고침 실행
- 파일명: 색인 목록에 추가된 데이터 파일명
- 버킷: 데이터 파일을 연동한 Object Storage 버킷 이름
- 최근 수정일: 버킷 내에 보관된 데이터의 최종 변경 일시
- 파일 크기: 색인 대상인 데이터 파일 크기
- 문서: [문서보기] 버튼을 클릭하면 미리보기 화면 제공
- 색인 현황: 색인 진행 상태 표시 (실패, 완료, 확인 필요, 색인중, 색인 대기중)
- 삭제: [삭제] 버튼을 클릭하면 해당 데이터 파일을 목록에서 삭제
데이터 색인이 시작되면 과금이 발생합니다.
RESTful API를 선택한 경우 데이터 설정 항목은 표시되지 않습니다.
데이터 연동 설정
이미지 파일을 색인할 경우 텍스트 데이터 인식 방법을 설정해 주십시오.
- 모델 선택: 현재 기본 모델만 제공
- OCR 진행 여부: 이미지 내 텍스트를 CLOVA OCR 기능을 이용하여 색인
- PDF 기준으로 최대 10장까지 지원
OCR 기능을 활용할 경우 추가 요금이 발생할 수 있습니다.
3. Retrieval 설정
Retrieval 설정에서 다음의 정보를 입력해 주십시오.
Chunking 방식
- 방식: 긴 텍스트의 검색을 용이하게 하기 위해 작게 쪼개는 방식이며, 현재 기본 설정만 제공
- Passage: 검색 결과 문서의 텍스트를 참고할 영역 크기 설정
- 256~4096 까지 입력 가능
- 기본 설정값 512
- Overlap: 검색 결과에서 개별 영역 사이의 겹침 비율을 조절하여 텍스트를 적절하게 분리시키는 설정값
- 0에서 Passage 값의 절반(0 ~ Passage/2)까지 입력 가능
- 기본 설정값 128
임베딩 모델
- 모델명: 임베딩을 진행할 모델 선택. 현재 기본 설정만 제공
벡터 DB
- DB: 벡터 DB를 선택. 현재 기본 설정만 제공
- K: 검색 결과에 표시되는 출처 개수
- 1~10 까지 입력 가능
- 기본 설정값 5
4. Generation 설정
Generation 설정에서 다음의 정보를 입력해 주십시오.
모델 설정
- [CLOVA Studio API 가이드]: CLOVA Studio API 필수 연동을 위한 이동 링크 제공
- [링크 방문]: CLOVA Studio 서비스 화면 으로 이동
- 모델명: 답변 생성에 사용되는 LLM 모델 이름
- 모델 확인: CLOVA Studio 서비스 화면 으로 이동
- CLOVA Studio API Key: CLOVA Studio 서비스와 연동하기 위한 CLOVA Studio API Key 값
CLOVA Studio 서비스에 대한 자세한 정보는 다음의 페이지를 참조해 주십시오.
CLOVA Studio 기능을 활용할 경우 추가 요금이 발생할 수 있습니다.
Prompt 설정
- 서비스에게 답변 방식에 대한 명령어를 입력하는 영역
- 기본 설정: 사용자가 Prompt 설정을 하지 않을 경우 제공되는 기본 설정값
Parameter 설정
- Top P: 언어 모델이 결과 생성을 시도한 전체 횟수 중 특정 토근의 생성 횟수를 확인하여 해당 토큰의 생성 확률을 계산. 해당 계산 시 기준값 P를 설정하여 특정 토큰의 확률이 기준값 P에 미치지 못할 경우 결과에서 제외
- Top K: 검색 결과 적합도가 높은 순서대로 K번째 토큰까지 결과에 포함 후 나머지는 토큰은 제외
- Maximum Tokens: 결괏값 생성 시 사용하는 최대 토큰 수이며 300~500을 권장
- Temperature: Temperature의 숫자가 낮을 수록 정형적인 답변을 생성하고 숫자가 높을 수록 다양한 문장을 구사하나 문장의 품질은 다소 떨어질 수 있음
5. 최종 확인
1~4단계에서 입력한 서비스 정보를 확인 후 [확인] 버튼을 클릭해 주십시오.
서비스 확인
생성된 서비스 목록은 네이버 클라우드 플랫폼 콘솔의 AI Services > RAG> Services 메뉴에서 확인할 수 있습니다.
Services 메뉴에서 서비스 정보를 확인하는 방법은 다음과 같습니다.
- 네이버 클라우드 플랫폼 콘솔의 VPC 환경에서
> Services > AI Services > RAG 메뉴를 차례대로 클릭해 주십시오. - Services 메뉴를 클릭해 주십시오.
- Services 목록에서 정보를 조회할 서비스의
버튼을 클릭해 주십시오. - 서비스 정보 영역이 펼쳐지면 서비스 정보를 확인해 주십시오.
- 서비스명: 서비스 생성 시 입력한 서비스 이름
- 서비스 설명: 서비스 생성 시 입력한 서비스 설명
- 색인 현황: 데이터 파일에 대한 색인 진행 상태
- 실패: 모든 데이터 파일에 대한 색인을 실패
- 완료: 모든 데이터 파일에 대해 정삭적으로 색인
- 확인: 색인에 실패한 데이터 파일이 1개 이상 존재
- 색인중: 색인중인 데이터 파일이 1개 이상 존재
- 색인 대기중: 실패, 완료, 확인, 색인중을 제외한 기타 상태
서비스 삭제
서비스 목록에서 서비스를 삭제하는 방법은 다음과 같습니다.
- 네이버 클라우드 플랫폼 콘솔의 VPC 환경에서
> Services > AI Services > RAG 메뉴를 차례대로 클릭해 주십시오. - Services 메뉴를 클릭해 주십시오.
- Services 목록에서 삭제할 서비스의
버튼을 클릭해 주십시오.
메뉴를 클릭 후 삭제 메뉴를 클릭해 주십시오.- 서비스 삭제에서 [삭제] 버튼을 클릭해 주십시오.
- 서비스 목록에서 해당 서비스가 삭제 됩니다.
서비스 삭제 시 해당 서비스에 연결되어 있는 평가도 함께 삭제됩니다. 서비스를 삭제하기 전에 신중하게 검토해 주십시오.
RAG 개발 가이드 확인
RAG 서비스에서 API를 연동하는 경우, 다음의 개발 가이드를 참조해 주십시오.
- RAG 서비스 API 가이드: RAG 서비스의 API 가이드로 이동
- CLOVA Studio 사용 가이드: LLM 사용을 위한 필수 연동 서비스인 CLOVA Studio 사용 가이드
- API 호출 및 인증 가이드: 네이버 클라우드 플랫폼의 RESTful API 방식 사용법 안내