작업 관리
  • PDF

작업 관리

  • PDF

Classic/VPC 환경에서 이용 가능합니다.

작업 관리에서는 튜닝 메뉴에서 작업을 생성하고 관리하는 방법과 학습 현황을 확인하는 방법을 설명합니다. 또한 학습이 완료된 작업의 성능 및 정확도를 테스트하기 위한 Inference Test 사용 방법과 테스트 앱을 생성하는 방법을 소개합니다.

새 작업 생성

새 작업을 생성하여 사전 학습된 모델의 일부를 사용자 데이터셋에 맞게 재학습하여 테스트할 수 있습니다.

참고

튜닝 작업 생성을 위해서는 업로드 조건에 적합한 데이터셋이 필요하며, 데이터 건수가 많을수록 튜닝 결과물의 성능이 향상됩니다. 데이터셋에 관한 자세한 내용은 데이터셋을 참고해 주십시오.

새 작업을 생성하는 방법은 다음과 같습니다.

  1. 네이버 클라우드 플랫폼 콘솔에서 Services > AI Services > CLOVA Studio 메뉴를 차례대로 클릭해 주십시오.
  2. My Product 메뉴를 클릭해 주십시오.
  3. [CLOVA Studio 바로가기] 버튼을 클릭해 주십시오.
  4. 튜닝 메뉴를 클릭해 주십시오.
  5. 작업할 종류의 [생성하기] 버튼을 클릭해 주십시오.
    • 튜닝은 총 7개의 작업 종류를 제공하고 있으며, 카드 형태로 작업 종류에 대한 설명과 응용 사례를 확인할 수 있습니다.
  6. 팝업 창이 나타나면 모델 엔진을 선택한 후 [생성] 버튼을 클릭해 주십시오.
    • 모델 엔진은 추후 변경할 수 없습니다.
    • 모델 엔진에 관한 자세한 설명은 Engine을 참고해 주십시오.
  7. 작업 이름을 입력해 주십시오.
  8. 파일 업로드 영역을 클릭하여 개인 정보 및 유해 정보 안내 내용을 확인한 후 데이터셋을 업로드해 주십시오.
    주의

    정상적인 학습 진행 및 성능 보장을 위한 데이터셋 규격을 반드시 준수하여 데이터셋 파일을 업로드해 주십시오. 자세한 내용은 데이터셋을 참고해 주십시오.

    • .csv 파일의 경우, 포맷 다운로드를 클릭하여 데이터셋 포맷 파일을 다운로드할 수 있습니다.
    • 데이터셋 업로드에 성공한 경우, 파일 업로드 영역에 데이터셋 파일명과 크기가 표시됩니다.
    • 데이터셋 업로드에 성공하더라도, 최적의 성능을 위해 개선이 권장될 경우 주의사항 확인을 클릭하여 주의 사항을 확인할 수 있습니다.
    • 데이터셋 업로드에 실패한 경우, 파일 업로드 영역에 파일명과 실패 사유 메시지가 표시됩니다. 상세보기를 클릭하여 ​구체적인 오류사항을 확인할 수 있습니다.
  9. [다음] 버튼을 클릭해 주십시오.
  10. 토큰 산정 팝업 창에서 예상 사용 토큰을 확인한 후 [학습] 버튼을 클릭해 주십시오.
  11. 학습 대기 중 팝업 창의 내용을 확인한 후 [확인] 버튼을 클릭해 주십시오.
참고
  • 사용자 데이터셋 내 토큰 수가 많을수록 튜닝에 더 오랜 시간이 들고, 더 큰 비용이 발생할 수 있습니다.
  • 학습 진행에 앞서, 학습을 위한 GPU 확보 및 데이터 전처리를 위해 학습 대기 시간이 최대 6시간 소요될 수 있습니다.

데이터셋

데이터셋 파일에 대한 규격 및 주의 사항, 예시를 확인하여 데이터셋 파일을 올바르게 작성해 주십시오.

데이터셋 파일 규격 및 주의 사항

데이터셋 파일 규격 및 주의 사항은 다음과 같습니다.

공통

  • 파일 제목은 2자~30자로 입력해 주십시오.
  • 파일 확장자는 .csv와 .jsonl만 지원합니다.
  • 파일의 인코딩 형식은 UTF-8 형식을 지원합니다.
  • 파일 용량이 50 MB 이하인 파일만 업로드할 수 있습니다.
  • 유효한 데이터를 1,000건 이상 입력해 주십시오.
  • 문서 분류 작업의 경우, 범주당 데이터셋 건수가 균등해야 하며, 최소 200건 이상의 데이터를 권장합니다. 또한, 분류 라벨은 띄어쓰기와 특수 문자를 제외한 단어 한 개로 구성하기를 권장합니다.
    • <예시> 긍정 30%(300건), 부정 30%(300건), 중립 40%(400건)
  • 줄 바꿈이 필요할 경우 '\n'으로 구분해 주십시오.
  • 개인 정보가 포함된 데이터셋을 업로드하여 발생하는 모든 문제는 사용자 책임입니다.

.csv 파일
clovastudio-tuning_csv_ko

  • 첫 번째 행에는 'Text', 'Completion'이 정확히 포함되어야 하며, 총 두 개의 열로만 구성되어야 합니다.
  • 빈 행과 열은 반드시 삭제해 주십시오.
  • 파일의 한 행(Text, Completion 쌍)당 공백 포함 총 1,000자 이하여야 합니다. 초과 시, 데이터셋의 일부만 업로드됩니다.

.jsonl 파일
clovastudio-tuning_jsonl_ko

  • 각 행은 {"Text": "입력값", "Completion": "원하는 결괏값"}으로 구성되어야 하며, "입력값"과 "원하는 결괏값"에는 적어도 한 글자 이상이 포함되어야 합니다.
  • 큰따옴표는 '"'로 표기해 주십시오.

데이터셋 파일 작성 예시

데이터셋 파일 작성 예시는 다음과 같습니다.

  • 문장 교정
    문장 교정 데이터셋은 다음과 같이 작성해 주십시오.
    clovastudio-tuning_dataformat1_ko

  • 대화
    대화 작업의 경우, 최적의 성능 보장을 위해 다음과 같이 데이터셋을 작성해 주십시오.
    clovastudio-tuning_dataformat2_ko

    • Text 열에는 3개 이상의 발화문을, Completion 열에는 1개의 발화문을 입력
    • Completion 열의 발화 주체는 한 명으로 통일
    • Text 열과 Completion 열의 발화 내용이 이어지도록 구성하기를 권장
    • 발화 주체(발화자)는 2명으로 제한
    • 발화문 앞에 발화 주체 명시 필요(<예시> '고객:', '판매자:')

학습 현황 확인

학습 현황을 확인하는 방법은 다음과 같습니다.

  1. 네이버 클라우드 플랫폼 콘솔에서 Services > AI Services > CLOVA Studio 메뉴를 차례대로 클릭해 주십시오.
  2. My Product 메뉴를 클릭해 주십시오.
  3. [CLOVA Studio 바로가기] 버튼을 클릭해 주십시오.
  4. 우측 상단에 있는 [사용자명] 을 선택한 후 [내 작업] > 튜닝 을 클릭해 주십시오.

tuning_mypage.png

* 새 작업 생성하기: 클릭하면 [새 작업] 탭으로 이동
* i-clovastudio_card/i-clovastudio_list: 클릭하여 정렬 방식 변경
* 학습 대기중: 학습 대기 중인 상태이며, 클릭하면 학습 대기 중 팝업 창이 나타남
* 학습 중: 학습을 진행 중인 상태이며, 클릭하여 예상 소요 시간 확인 가능
* 학습 완료: 학습을 완료한 상태이며, 클릭하여 작업 정보 확인 및 테스트 가능
* 학습 중단: 학습을 중단한 상태

학습 완료 작업 정보 확인

학습 완료한 작업을 클릭하면 작업 정보를 확인할 수 있습니다.
clovastudio-tuning_info_ko

  • 생성 일시: 새 작업 생성 일시
  • 학습 완료 일시: 학습을 완료한 일시
  • Workflow ID: 학습 중인 작업을 식별하는 ID
  • Problem Type: 작업 종류
  • Model Engine: 학습된 언어 모델의 종류
  • Dataset: 학습에 사용한 데이터셋 파일명
  • Train Loss: 모델이 데이터셋에 얼마나 적합한지를 알려주는 수치로, Train Loss가 낮을수록 정답과의 오차가 적음
  • Tokens Used: 실제 사용된 토큰 수

학습 중단

학습을 중단하는 방법은 다음과 같습니다.

주의
  • 학습 중인 작업의 학습을 중단할 경우, 학습 진행률에 따라 사용된 토큰에 대한 이용 요금이 발생할 수 있습니다.
  • 중단한 학습은 재개할 수 없습니다.
참고

학습 대기 중이거나 학습 진행 중인 작업만 중단할 수 있습니다.

  1. 네이버 클라우드 플랫폼 콘솔에서 Services > AI Services > CLOVA Studio 메뉴를 차례대로 클릭해 주십시오.
  2. My Product 메뉴를 클릭해 주십시오.
  3. [CLOVA Studio 바로가기] 버튼을 클릭해 주십시오.
  4. 우측 상단에 있는 [사용자명] 을 선택한 후 [내 작업] > 튜닝 을 클릭해 주십시오.
  5. 학습을 중단할 작업을 클릭해 주십시오.
  6. [중단] 버튼을 클릭해 주십시오.
  7. 학습 중단 팝업 창의 내용을 확인한 후 [중단] 버튼을 클릭해 주십시오.
    • 대기 중인 학습을 중단한 경우, 기존에 업로드했던 데이터셋 파일이 모두 소실됩니다.
    • 진행 중인 학습을 중단한 경우, 기존에 업로드했던 데이터셋 파일 및 작업이 소실되며 작업 생성 시 고지하였던 토큰이 사용됩니다.

학습 완료 작업 활용

학습 완료된 작업의 테스트 앱을 생성하기 전, 성능 및 정확도를 테스트할 수 있도록 Inference Test 기능을 제공합니다.
테스트를 완료한 후 테스트 앱을 생성할 수 있으며, 공유 URL을 통해 작업을 공유할 수도 있습니다.

Inference Test

Inference Test 기능을 통해 테스트하는 방법은 다음과 같습니다.

  1. 네이버 클라우드 플랫폼 콘솔에서 Services > AI Services > CLOVA Studio 메뉴를 차례대로 클릭해 주십시오.
  2. My Product 메뉴를 클릭해 주십시오.
  3. [CLOVA Studio 바로가기] 버튼을 클릭해 주십시오.
  4. 우측 상단에 있는 [사용자명] 을 선택한 후 [내 작업] > 튜닝 을 클릭해 주십시오.
  5. 학습 완료 상태인 작업 중 테스트할 작업을 클릭해 주십시오.
  6. Input 영역에 입력값을 입력한 후 [실행] 버튼을 클릭해 주십시오.
    clovastudio-tuning_interfacetest_ko
    • 공백을 포함하여 최대 2,000자까지 입력할 수 있습니다.
    • Output 영역에 학습을 통해 생성된 결괏값이 출력됩니다.
    • 충분한 테스트를 통해 성능 및 정확도를 검증해 주십시오.
참고
  • 입력값은 해당 작업에 사용된 데이터셋의 'Text'와 유사한 길이 및 형식으로 입력하는 것을 권장합니다.
  • 대화 Inference Test 시 다음과 같이 발화문을 입력해 주십시오.
    • 데이터셋의 'Text' 내 발화문과 동일한 개수, 동일한 패턴으로 발화문을 입력해 주십시오.
      <예시> 'Text' 내 발화문 개수가 3개인 경우, Input 영역에 3개의 발화문 입력
      Input Output
      올바른 예시: 고객: 언제 배송되나요? 판매자: 고객님 어제 주문하신 건 말씀이시죠? 고객: 네 맞습니다. 판매자: 내일 배송 예정입니다.
      잘못된 예시: 고객: 언제 배송되나요? 판매자: 내일 배송 예정입니다. 판매자: 조금만 더 기다려주세요.
    • 발화 주체를 포함하여 데이터셋의 'Text' 내 발화문과 유사한 형식으로 발화문을 입력해 주십시오.
      <예시>
      Input Output
      올바른 예시: 고객: 언제 배송되나요? 판매자: 내일 배송 예정입니다.
      잘못된 예시: 언제 배송되나요? 내일 배송 예정입니다.
  • 업로드한 데이터셋의 일부는 튜닝된 모델의 성능 검증에 사용되므로, Inference Test 결과가 사용자 데이터셋 내용과 일치하지 않을 수 있습니다.

테스트 앱 생성

테스트 앱을 생성하는 방법은 다음과 같습니다.

  1. 네이버 클라우드 플랫폼 콘솔에서 Services > AI Services > CLOVA Studio 메뉴를 차례대로 클릭해 주십시오.
  2. My Product 메뉴를 클릭해 주십시오.
  3. [CLOVA Studio 바로가기] 버튼을 클릭해 주십시오.
  4. 우측 상단에 있는 [사용자명] 을 선택한 후 [내 작업] > 튜닝 을 클릭해 주십시오.
  5. 테스트 앱을 생성할 작업을 클릭해 주십시오.
  6. [테스트 앱 생성] 버튼을 클릭해 주십시오.
  7. 테스트 앱 이름을 입력한 후 [생성] 버튼을 클릭해 주십시오.
    • 테스트 앱이 생성되며, 테스트 앱 팝업 창이 나타납니다.
      clovastudio-playground_testapp_ko
      • 테스트 앱의 API 정보를 확인할 수 있으며, AI Filter 사용 여부를 설정할 수 있습니다.(API에 관한 자세한 내용은 CLOVA Studio API 가이드 참고)
      • 코드 타입은 curlpython이 제공됩니다.
      • [복사] 버튼을 클릭하여 API 정보를 클립보드에 복사할 수 있습니다.
      • [재발급] 버튼을 클릭하여 API Gateway Key를 재발급할 수 있습니다.
      • 가이드 보기를 클릭하면 AI Filter 가이드를 확인할 수 있습니다.
참고
  • 테스트 앱을 생성하여 사용에 문제가 없는지 확인한 후 서비스 앱을 신청할 수 있습니다. 서비스 앱을 신청하려면 서비스 앱 신청 양식을 작성해주십시오. 서비스 앱 신청에 관한 자세한 내용은 서비스 앱 신청을 참고해 주십시오.
  • 앱 신청 현황을 확인하려면 앱 신청 현황 확인을 참고해 주십시오.

이 문서가 도움이 되었습니까?