도구 활용
    • PDF

    도구 활용

    • PDF

    Article Summary

    Classic/VPC 환경에서 이용 가능합니다.

    도구 활용에서는 익스플로러 메뉴에서 제공하는 다양한 도구의 활용 방법을 설명합니다. CLOVA Studio JP에서는 현재 일괄 생성 도구와 데이터 확장 도구를 제공하고 있습니다.

    일괄 생성

    일괄 생성은 사용자가 업로드한 대량의 작업을 일괄 처리하고 결과물 관리하는 도구입니다.

    사용 방법

    일괄 생성 도구 사용 방법은 다음과 같습니다.

    1. 네이버 클라우드 플랫폼 콘솔에서 Services > AI Services > CLOVA Studio JP 메뉴를 차례대로 클릭해 주십시오.
    2. My Product 메뉴를 클릭해 주십시오.
    3. [CLOVA Studio JP 바로가기] 버튼을 클릭해 주십시오.
    4. 익스플로러 메뉴를 클릭해 주십시오.
      • CLOVA Studio JP 홈 화면에서 기능 소개 영역의 [익스플로러 둘러보기] 버튼을 클릭해도 됩니다.
    5. [도구] 탭 메뉴를 클릭한 다음 일괄 생성[시작하기] 버튼을 클릭해 주십시오.
    6. 사용자가 업로드한 데이터를 처리하는데 필요한 기본 학습 모델인 모델 엔진을 선택해 주십시오.
      • CLOVA Studio JP가 제공하는 기본 학습 모델을 선택하는 경우
        • 패턴 학습을 위한 프롬프트 템플릿 작성 필요
        • 프롬프트 템플릿은 플레이그라운드 작성 요령과 유사
        • 프롬프트 템플릿은 최소 3개 세트 이상의 예시로 구성되어야 하며, 각 예시 세트 사이에 ###을 넣어 세트 구분
        • 프롬프트 템플릿은 반드시 {text}로 종료되어야 함
      • 튜닝을 통해 사용자가 학습 모델을 직접 생성하는 경우
        • 생성 방법은 튜닝 참조
    7. 사용자가 처리할 데이터셋인 시드 데이터셋을 업로드해 주십시오.
      • 업로드한 데이터셋의 패턴을 분석하여 비슷한 유형의 데이터셋으로 확장
      • 시드 데이터셋 확장자는 csv, jsonl만 지원
      • 시드 데이터는 최소 10개 셋 이상 업로드해야 하며, 1개 셋당 1,000자 이하로 입력
      • 모델 엔진에서 튜닝 모델을 선택한 경우 시드 데이터셋의 작업 유형이 튜닝 모델의 작업 유형과 일치해야 함
        clovastudio-explorer02_seed_ko
    8. [실행] 버튼을 클릭해 주십시오.
      • [실행] 버튼: 클릭 시 작업 확인 팝업 창을 확인 가능
      • [확인] 버튼: 클릭 시 작업이 시작되며 작업 내역을 확인 및 다운로드 할 수 있는 내 작업 탭 메뉴로 이동
        clovastudio-explorer02_bulk_ko
      • [중단] 버튼: 클릭 시 작업이 중단되며 이전 화면으로 복귀
      • 데이터 확장 작업은 동시에 1건만 수행 가능(계정 별 1건)
    주의
    • 일괄 작업은 데이터 1건 생성당 10초가 소요되며 시스템 환경에 따라 달라질 수 있습니다.
    • 작업이 시작되면 중단이 불가능하며, 서비스 이용에 대한 과금이 시작되므로 유의하여 진행해 주십시오.

    작업 결과 확인 및 다운로드

    일괄 생성 작업에 대한 결과를 확인하고 결과물을 다운로드하는 방법은 다음과 같습니다.

    1. 네이버 클라우드 플랫폼 콘솔에서 Services > AI Services > CLOVA Studio JP 메뉴를 차례대로 클릭해 주십시오.
    2. My Product 메뉴를 클릭해 주십시오.
    3. [CLOVA Studio JP 바로가기] 버튼을 클릭해 주십시오.
    4. 화면의 우측 상단에서 사용자 계정 메뉴를 클릭해 주십시오.
    5. [내 작업] 탭 메뉴를 클릭한 다음 [익스플로러] 탭을 클릭해 주십시오.
    6. [일괄 생성] 버튼을 클릭해 주십시오.
    7. 작업 결과를 확인하고 필요한 경우 결과물을 다운로드해 주십시오.
      clovastudiojp-explorer02_result_ko
      • 다운로드: 작업이 완료되어 결과물 다운로드 가능
      • 요청 중: 작업 수행 중
      • 중단: 작업 중단
      • 기간 만료: 결과물 다운로드 기간 만료(작업 완료 시점으로부터 7일)

    데이터 확장

    데이터 확장은 사용자가 업로드한 데이터 샘플을 원하는 양만큼 확장하고 관리하는 도구입니다.

    사용 방법

    데이터 확장 도구 사용 방법은 다음과 같습니다.

    1. 네이버 클라우드 플랫폼 콘솔에서 Services > AI Services > CLOVA Studio JP 메뉴를 차례대로 클릭해 주십시오.
    2. My Product 메뉴를 클릭해 주십시오.
    3. [CLOVA Studio JP 바로가기] 버튼을 클릭해 주십시오.
    4. 익스플로러 메뉴를 클릭해 주십시오.
      • CLOVA Studio JP 홈 화면에서 기능 소개 영역의 [익스플로러 둘러보기] 버튼을 클릭해도 됩니다.
    5. [도구] 탭 메뉴를 클릭한 다음 데이터 확장[시작하기] 버튼을 클릭해 주십시오.
    6. 사용자가 업로드한 데이터를 확장하는데 필요한 기본 학습 모델인 모델 엔진을 선택해 주십시오.
    7. 사용자에게 최종적으로 제공될 데이터의 총 개수를 입력해 주십시오.
      • 최소 20열부터 최대 50,000열까지 입력 가능(열=데이터셋 개수)
      • 업로드한 시드 데이터 셋의 개수보다 높은 값으로 입력
      참고

      사용자가 10개의 데이터셋을 업로드하고 원하는 데이터 수에 20을 입력하는 경우 업로드한 10개의 데이터셋과 신규로 생성된 10개의 데이터셋이 제공됩니다.

    8. 확장하려는 데이터셋의 유형을 판독하기 위한 기본 재료인 시드 데이터셋을 업로드해 주십시오.
      • 업로드한 데이터셋의 패턴을 분석하여 비슷한 유형의 데이터셋으로 확장
      • 시드 데이터셋 확장자는 csv, jsonl만 지원
      • 시드 데이터는 최소 10개 열(row) 이상 업로드해야 하며, 열당 공백 포함 1,000자 이하로 입력
      참고

      10개의 키워드별 장·단점 추출 데이터셋을 업로드한 다음 원하는 데이터 수를 20으로 입력하면 다음과 같은 결과물이 제공됩니다.
      clovastudio-explorer02_dataset_ko

    9. [실행] 버튼을 클릭해 주십시오.
      • [실행] 버튼: 클릭 시 작업 확인 팝업 창을 확인 가능
      • [확인] 버튼: 클릭 시 작업이 시작되며 작업 내역을 확인 및 다운로드 할 수 있는 [내 작업] 탭 메뉴로 이동
        clovastudio-explorer02_expand_ko
      • [중단] 버튼: 클릭 시 작업이 중단되며 이전 화면으로 복귀
      • 데이터 확장 작업은 동시에 1건만 수행 가능(계정 별 1건)
    주의
    • 일괄 작업은 데이터 1건 생성당 10초가 소요되며 시스템 환경에 따라 달라질 수 있습니다.
    • 작업이 시작되면 중단이 불가능하며, 서비스 이용에 대한 과금이 시작되므로 유의하여 진행해 주십시오.

    작업 결과 확인 및 다운로드

    데이터 확장 작업에 대한 결과를 확인하고 결과물을 다운로드하는 방법은 다음과 같습니다.

    1. 네이버 클라우드 플랫폼 콘솔에서 Services > AI Services > CLOVA Studio JP 메뉴를 차례대로 클릭해 주십시오.
    2. My Product 메뉴를 클릭해 주십시오.
    3. [CLOVA Studio JP 바로가기] 버튼을 클릭해 주십시오.
    4. 화면의 우측 상단에서 사용자 계정 메뉴를 클릭해 주십시오.
    5. [내 작업] 탭 메뉴를 클릭한 다음 [익스플로러] 탭을 클릭해 주십시오.
    6. [데이터 확장] 버튼을 클릭해 주십시오.
    7. 작업 결과를 확인하고 필요한 경우 결과물을 다운로드해 주십시오.
      clovastudiojp-explorer02_result_ko
      • 다운로드: 작업이 완료되어 결과물 다운로드 가능
      • 요청 중: 작업 수행 중
      • 중단: 작업 중단
      • 기간 만료: 결과물 다운로드 기간 만료(작업 완료 시점으로부터 7일)

    데이터 확장 & 일괄 생성 활용팁

    1. 데이터 확장으로 튜닝을 위한 학습 데이터 셋을 생성 해 보세요
      • 활용팁
        • 튜닝 학습을 하기 위해서는 최소 1천 개 이상의 데이터셋이 필요합니다.
        • 사용자가 1천 개의 데이터셋을 일일히 만들어야 하는 번거로움을 데이터 확장을 통해 해결합니다.
        • 데이터 확장은 Output(completion)이 정해져있는 정답형 작업보다 새로운 문장을 생성하는 창작형 작업에 더 적합합니다.
      • 활용 예시: 케어콜 대화 데이터셋 확장
        • 사용자가 데이터 확장에 사용할 시드 데이터셋을 확보합니다. 케어콜 대화 셋 생성을 위하여 대화턴 100개를 생성하였습니다.
        • 튜닝에 필요한 최소 데이터 수인 1천 개로 확장합니다. (모델 엔진: Choco)
        • 100개의 대화턴이 1천 개로 확장되어 결과물로 나옵니다.
        • 데이터의 유효성을(오류) 검사하여 튜닝 학습을 위한 데이터셋 1천 개를 확보합니다.
      • 예시 파일 다운로드:케어콜 대화 데이터 셋 확장

        1-1. 케어콜_데이터증강_시드데이터.csv

        1-2. 케어콜_데이터증강_결과물.csv

    2. 일괄 생성으로 튜닝 학습한 엔진의 성능을 테스트해 주십시오.
      • 활용팁
        • 데이터 확장을 통해 확보한 1천 개의 데이터셋을 통해 튜닝 학습을 진행합니다.
        • 튜닝 학습이 잘 되었는지 성능 확인을 위하여 Inference Test를 진행합니다.
        • Inference Test는 Input(text)을 한 개씩 넣어 한 건의 Output(completion)을 받아보아야 하지만, 일괄 생성을 통해 여러 개의 Input(text)을 넣고 한번에 돌려볼 수 있습니다.
      • 활용 예시: 케어콜 대화 데이터셋 튜닝 학습 후 성능 테스트
        • 위에서 확장한 1천 개의 결과물을 튜닝학습 시킵니다. (대화 튜닝, Choco_LoRA)
        • 일괄 생성에서 학습한 튜닝 모델을 모델 엔진으로 호출합니다.
        • 성능 테스트를 위해 Input(text) 값만 채워진 시드 데이터셋을 준비합니다.
        • 시드 데이터셋을 업로드하고 일괄 생성을 실행합니다.
        • 주어진 Input(text)에 알맞은 Output(completion)이 생성되어 결과물로 나옵니다.
        • 원하는 결과물이 산출되었는지 유효성 테스트를 통해 튜닝 모델의 성능을 점검합니다.
      • 예시 파일 다운로드: 케어콜 대화 데이터셋 튜닝 및 일괄 생성

        2-1. 케어콜_튜닝학습_데이터셋.csv

        2-2. 케어콜_일괄생성_시드데이터.csv

        2-3. 케어콜_일괄생성_결과물.csv

    3. 일괄 생성은 반복적인 Input(text)을 통해 다양한 Output(completion)을 생성하는데에 더 적합합니다.
      • 활용팁 <일괄 생성을 통한 데이터 확장(증강)>
        • 적은 개수의 Input(text)으로 다양한 Output(completion)을 생성하여 데이터를 확장합니다.
        • 활용 예시: 상황에 맞는 크리스마스 문구 생성
        • 일괄 생성 서비스 화면에서 상황별 크리스마스 문구 생성 프롬프트 템플릿을 작성합니다. (프롬프트 템플릿 작성팁)
          clovastudiojp-explorer02_prompt-template_ko
        • 시드 데이터 셋 구성을 위하여 5개의 상황을(Input_text) 부여하되 각각의 상황을 20번씩 복사+붙여넣기 하여 총 100개의 시드 데이터셋을 만들어 줍니다.
          clovastudiojp-explorer02_seed-dataset_ko
        • 5개의 Input(text) 값에 대하여 각기 다른 Output(completion)을 스무번씩 생성하기 때문에 총 100개의 새로운 데이터를 확보할 수 있습니다.
      • 예시 파일 다운로드: 일괄 생성을 통한 크리스마스 문구 생성 데이터 셋 확장

        3-1. 크리스마스문구_일괄생성_시드데이터.csv

        3-2. 크리스마스문구_일괄생성_결과물.csv

    일괄 생성: 프롬프트 템플릿 작성팁

    1. 데이터 확장은 주어진 시드데이터를 기반으로 프롬프트를 구성하여 플레이그라운드에서 생성 된 결과값을 반환합니다.
    2. 데이터셋을 다양하게 업로드 할 수록 더욱 랜덤하게 프롬프트를 구성하기 때문에 시드 데이터셋은 결과물에 큰 영향을 줄 수 있습니다.
    3. 결과물이 어떻게 나올지 예측해보기 위하여 플레이그라운드에서 다양한 프롬프트를 작성하고 테스트 해 주십시오.
      clovastudiojp-explorer02_playground_ko

    이 문서가 도움이 되었습니까?

    What's Next
    Changing your password will log you out immediately. Use the new password to log back in.
    First name must have atleast 2 characters. Numbers and special characters are not allowed.
    Last name must have atleast 1 characters. Numbers and special characters are not allowed.
    Enter a valid email
    Enter a valid password
    Your profile has been successfully updated.