- 인쇄
- PDF
작업 관리
- 인쇄
- PDF
Classic/VPC 환경에서 이용 가능합니다.
작업 관리에서는 튜닝 메뉴에서 작업을 생성하고 관리하는 방법과 학습 현황을 확인하는 방법을 설명합니다. 또한 학습이 완료된 작업의 성능 및 정확도를 테스트하기 위한 Inference Test 사용 방법과 테스트 앱을 생성하는 방법을 소개합니다.
새 작업 생성
새 작업을 생성하여 사전 학습된 모델의 일부를 사용자 데이터셋에 맞게 재학습하여 테스트할 수 있습니다.
튜닝 작업 생성을 위해서는 업로드 조건에 적합한 데이터셋이 필요하며, 데이터 건수가 많을수록 튜닝 결과물의 성능이 향상됩니다. 데이터셋에 관한 자세한 내용은 데이터셋을 참고해 주십시오.
새 작업을 생성하는 방법은 다음과 같습니다.
- 네이버 클라우드 플랫폼 콘솔에서 Services > AI Services > CLOVA Studio JP 메뉴를 차례대로 클릭해 주십시오.
- My Product 메뉴를 클릭해 주십시오.
- [CLOVA Studio JP 바로가기] 버튼을 클릭해 주십시오.
- 튜닝 메뉴를 클릭해 주십시오.
- 작업할 종류의 [생성하기] 버튼을 클릭해 주십시오.
- 튜닝은 총 7개의 작업 종류를 제공하고 있으며, 카드 형태로 작업 종류에 대한 설명과 응용 사례를 확인할 수 있습니다.
- 팝업 창이 나타나면 모델 엔진을 선택한 후 [생성] 버튼을 클릭해 주십시오.
- 모델 엔진은 추후 변경할 수 없습니다.
- 모델 엔진에 관한 자세한 설명은 Engine을 참고해 주십시오.
- 작업 이름을 입력해 주십시오.
- 파일 업로드 영역을 클릭하여 개인 정보 및 유해 정보 안내 내용을 확인한 후 데이터셋을 업로드해 주십시오.주의
정상적인 학습 진행 및 성능 보장을 위한 데이터셋 규격을 반드시 준수하여 데이터셋 파일을 업로드해 주십시오. 자세한 내용은 데이터셋을 참고해 주십시오.
- .csv 파일의 경우, 포맷 다운로드를 클릭하여 데이터셋 포맷 파일을 다운로드할 수 있습니다.
- 데이터셋 업로드에 성공한 경우, 파일 업로드 영역에 데이터셋 파일명과 크기가 표시됩니다.
- 데이터셋 업로드에 성공하더라도, 최적의 성능을 위해 개선이 권장될 경우 주의사항 확인을 클릭하여 주의 사항을 확인할 수 있습니다.
- 데이터셋 업로드에 실패한 경우, 파일 업로드 영역에 파일명과 실패 사유 메시지가 표시됩니다. 상세보기를 클릭하여 구체적인 오류사항을 확인할 수 있습니다.
- [다음] 버튼을 클릭해 주십시오.
- 토큰 산정 팝업 창에서 예상 사용 토큰을 확인한 후 [학습] 버튼을 클릭해 주십시오.
- 학습 대기 중 팝업 창의 내용을 확인한 후 [확인] 버튼을 클릭해 주십시오.
- [사용자명] > [내 작업] > [튜닝] 탭에서 학습 현황을 확인할 수 있습니다.
- 사용자 데이터셋 내 토큰 수가 많을수록 튜닝에 더 오랜 시간이 들고, 더 큰 비용이 발생할 수 있습니다.
- 학습 진행에 앞서, 학습을 위한 GPU 확보 및 데이터 전처리를 위해 학습 대기 시간이 최대 6시간 소요될 수 있습니다.
데이터셋
데이터셋 파일에 대한 규격 및 주의 사항, 예시를 확인하여 데이터셋 파일을 올바르게 작성해 주십시오.
데이터셋 파일 규격 및 주의 사항
데이터셋 파일 규격 및 주의 사항은 다음과 같습니다.
- 파일 제목은 2자~30자로 입력해 주십시오.
- 파일 확장자는 .csv와 .jsonl만 지원합니다.
- 파일의 인코딩 형식은 UTF-8 형식을 지원합니다.
- 파일 용량이 50 MB 이하인 파일만 업로드할 수 있습니다.
- 유효한 데이터를 1,000건 이상 입력해 주십시오.
- 문서 분류 작업의 경우, 범주당 데이터셋 건수가 균등해야 하며, 최소 200건 이상의 데이터를 권장합니다. 또한, 분류 라벨은 띄어쓰기와 특수 문자를 제외한 단어 한 개로 구성하기를 권장합니다.
- <예시> 긍정 30%(300건), 부정 30%(300건), 중립 40%(400건)
- 줄 바꿈이 필요할 경우 '\n'으로 구분해 주십시오.
- 개인 정보가 포함된 데이터셋을 업로드하여 발생하는 모든 문제는 사용자 책임입니다.
- 첫 번째 행에는 'Text', 'Completion'이 정확히 포함되어야 하며, 총 두 개의 열로만 구성되어야 합니다.
- 빈 행과 열은 반드시 삭제해 주십시오.
- 파일의 한 행(Text, Completion 쌍)당 공백 포함 총 1,000자 이하여야 합니다. 초과 시, 데이터셋의 일부만 업로드됩니다.
- 각 행은 {"Text": "입력값", "Completion": "원하는 결괏값"}으로 구성되어야 하며, "입력값"과 "원하는 결괏값"에는 적어도 한 글자 이상이 포함되어야 합니다.
- 큰따옴표는 '"'로 표기해 주십시오.
데이터셋 파일 작성 예시
데이터셋 파일 작성 예시는 다음과 같습니다.
문장 교정
문장 교정 데이터셋은 다음과 같이 작성해 주십시오.
대화
대화 작업의 경우, 최적의 성능 보장을 위해 다음과 같이 데이터셋을 작성해 주십시오.
- Text 열에는 3개 이상의 발화문을, Completion 열에는 1개의 발화문을 입력
- Completion 열의 발화 주체는 한 명으로 통일
- Text 열과 Completion 열의 발화 내용이 이어지도록 구성하기를 권장
- 발화 주체(발화자)는 2명으로 제한
- 발화문 앞에 발화 주체 명시 필요(<예시> '고객:', '판매자:')
학습 현황 확인
학습 현황을 확인하는 방법은 다음과 같습니다.
- 네이버 클라우드 플랫폼 콘솔에서 Services > AI Services > CLOVA Studio JP 메뉴를 차례대로 클릭해 주십시오.
- My Product 메뉴를 클릭해 주십시오.
- [CLOVA Studio JP 바로가기] 버튼을 클릭해 주십시오.
- 우측 상단에 있는 [사용자명] 을 선택한 후 [내 작업] > 튜닝 을 클릭해 주십시오.
- 새 작업 생성하기: 클릭하면 [새 작업] 탭으로 이동
- /: 클릭하여 정렬 방식 변경
- 학습 대기중: 학습 대기 중인 상태이며, 클릭하면 학습 대기 중 팝업 창이 나타남
- 학습 중: 학습을 진행 중인 상태이며, 클릭하여 예상 소요 시간 확인 가능
- 학습 완료: 학습을 완료한 상태이며, 클릭하여 작업 정보 확인 및 테스트 가능
- 학습 중단: 학습을 중단한 상태
학습 완료 작업 정보 확인
학습 완료한 작업을 클릭하면 작업 정보를 확인할 수 있습니다.
- 생성 일시: 새 작업 생성 일시
- 학습 완료 일시: 학습을 완료한 일시
- Workflow ID: 학습 중인 작업을 식별하는 ID
- Problem Type: 작업 종류
- Model Engine: 학습된 언어 모델의 종류
- Dataset: 학습에 사용한 데이터셋 파일명
- Train Loss: 모델이 데이터셋에 얼마나 적합한지를 알려주는 수치로, Train Loss가 낮을수록 정답과의 오차가 적음
- Tokens Used: 실제 사용된 토큰 수
학습 중단
학습을 중단하는 방법은 다음과 같습니다.
- 학습 중인 작업의 학습을 중단할 경우, 학습 진행률에 따라 사용된 토큰에 대한 이용 요금이 발생할 수 있습니다.
- 중단한 학습은 재개할 수 없습니다.
학습 대기 중이거나 학습 진행 중인 작업만 중단할 수 있습니다.
- 네이버 클라우드 플랫폼 콘솔에서 Services > AI Services > CLOVA Studio JP 메뉴를 차례대로 클릭해 주십시오.
- My Product 메뉴를 클릭해 주십시오.
- [CLOVA Studio JP 바로가기] 버튼을 클릭해 주십시오.
- 우측 상단에 있는 [사용자명] 을 선택한 후 [내 작업] > 튜닝 을 클릭해 주십시오.
- 학습을 중단할 작업을 클릭해 주십시오.
- [중단] 버튼을 클릭해 주십시오.
- 학습 중단 팝업 창의 내용을 확인한 후 [중단] 버튼을 클릭해 주십시오.
- 대기 중인 학습을 중단한 경우, 기존에 업로드했던 데이터셋 파일이 모두 소실됩니다.
- 진행 중인 학습을 중단한 경우, 기존에 업로드했던 데이터셋 파일 및 작업이 소실되며 작업 생성 시 고지하였던 토큰이 사용됩니다.
학습 완료 작업 활용
학습 완료된 작업의 테스트 앱을 생성하기 전, 성능 및 정확도를 테스트할 수 있도록 Inference Test 기능을 제공합니다.
테스트를 완료한 후 테스트 앱을 생성할 수 있으며, 공유 URL을 통해 작업을 공유할 수도 있습니다.
Inference Test
Inference Test 기능을 통해 테스트하는 방법은 다음과 같습니다.
- 네이버 클라우드 플랫폼 콘솔에서 Services > AI Services > CLOVA Studio JP 메뉴를 차례대로 클릭해 주십시오.
- My Product 메뉴를 클릭해 주십시오.
- [CLOVA Studio JP 바로가기] 버튼을 클릭해 주십시오.
- 우측 상단에 있는 [사용자명] 을 선택한 후 [내 작업] > 튜닝 을 클릭해 주십시오.
- 학습 완료 상태인 작업 중 테스트할 작업을 클릭해 주십시오.
- Input 영역에 입력값을 입력한 후 [실행] 버튼을 클릭해 주십시오.
- 공백을 포함하여 최대 2,000자까지 입력할 수 있습니다.
- Output 영역에 학습을 통해 생성된 결괏값이 출력됩니다.
- 충분한 테스트를 통해 성능 및 정확도를 검증해 주십시오.
- 입력값은 해당 작업에 사용된 데이터셋의 'Text'와 유사한 길이 및 형식으로 입력하는 것을 권장합니다.
- 대화 Inference Test 시 다음과 같이 발화문을 입력해 주십시오.
- 데이터셋의 'Text' 내 발화문과 동일한 개수, 동일한 패턴으로 발화문을 입력해 주십시오.
<예시> 'Text' 내 발화문 개수가 3개인 경우, Input 영역에 3개의 발화문 입력Input Output 올바른 예시: 고객: 언제 배송되나요? 판매자: 고객님 어제 주문하신 건 말씀이시죠? 고객: 네 맞습니다. 판매자: 내일 배송 예정입니다. 잘못된 예시: 고객: 언제 배송되나요? 판매자: 내일 배송 예정입니다. 판매자: 조금만 더 기다려주세요. - 발화 주체를 포함하여 데이터셋의 'Text' 내 발화문과 유사한 형식으로 발화문을 입력해 주십시오.
<예시>Input Output 올바른 예시: 고객: 언제 배송되나요? 판매자: 내일 배송 예정입니다. 잘못된 예시: 언제 배송되나요? 내일 배송 예정입니다.
- 데이터셋의 'Text' 내 발화문과 동일한 개수, 동일한 패턴으로 발화문을 입력해 주십시오.
- 업로드한 데이터셋의 일부는 튜닝된 모델의 성능 검증에 사용되므로, Inference Test 결과가 사용자 데이터셋 내용과 일치하지 않을 수 있습니다.
테스트 앱 생성
테스트 앱을 생성하는 방법은 다음과 같습니다.
- 네이버 클라우드 플랫폼 콘솔에서 Services > AI Services > CLOVA Studio JP 메뉴를 차례대로 클릭해 주십시오.
- My Product 메뉴를 클릭해 주십시오.
- [CLOVA Studio JP 바로가기] 버튼을 클릭해 주십시오.
- 우측 상단에 있는 [사용자명] 을 선택한 후 [내 작업] > 튜닝 을 클릭해 주십시오.
- 테스트 앱을 생성할 작업을 클릭해 주십시오.
- [테스트 앱 생성] 버튼을 클릭해 주십시오.
- 테스트 앱 이름을 입력한 후 [생성] 버튼을 클릭해 주십시오.
- 테스트 앱이 생성되며, 테스트 앱 팝업 창이 나타납니다.
- 테스트 앱의 API 정보를 확인할 수 있으며, AI Filter 사용 여부를 설정할 수 있습니다.(API에 관한 자세한 내용은 CLOVA Studio JP API 가이드 참고)
- 코드 타입은 curl과 python이 제공됩니다.
- [복사] 버튼을 클릭하여 API 정보를 클립보드에 복사할 수 있습니다.
- [재발급] 버튼을 클릭하여 API Gateway Key를 재발급할 수 있습니다.
- 가이드 보기를 클릭하면 AI Filter 가이드를 확인할 수 있습니다.
- 테스트 앱이 생성되며, 테스트 앱 팝업 창이 나타납니다.
- 테스트 앱을 생성하여 사용에 문제가 없는지 확인한 후 서비스 앱을 신청할 수 있습니다. 서비스 앱을 신청하려면 서비스 앱 신청 양식을 작성해주십시오. 서비스 앱 신청에 관한 자세한 내용은 서비스 앱 신청을 참고해 주십시오.
- 앱 신청 현황을 확인하려면 앱 신청 현황 확인을 참고해 주십시오.