데이터셋 생성 및 관리
    • PDF

    데이터셋 생성 및 관리

    • PDF

    Article Summary

    Classic/VPC 환경에서 이용 가능합니다.

    데이터셋 생성 및 관리에서는 데이터셋 구성 시 주의 사항을 안내하고, 데이터셋을 생성, 수정, 업로드, 삭제하는 방법을 설명합니다.

    데이터셋 구성 시 주의 사항

    AiTEMS는 데이터셋 학습을 기반으로 사용자 맞춤 추천 서비스를 제공하기 때문에 데이터셋을 구성하는 것이 매우 중요합니다.
    데이터셋 구성 시 주의 사항은 다음과 같습니다.

    • 데이터셋 유형은 user, item, interaction로, 3가지 유형의 데이터셋을 바탕으로 학습을 진행합니다. 따라서 각 유형별 데이터셋을 필수로 구성해야 합니다.
      각 데이터셋 유형에 대한 설명은 다음과 같습니다.
      • user(사용자): 사용자 정보(연령, 성별 등)가 담긴 메타데이터
      • item(항목): 항목과 관련된 정보(가격, 출시일, 카테고리 등)가 담긴 메타데이터
      • interaction(상호작용): 사용자와 항목 간의 상호작용으로 얻은 기록이 담긴 메타데이터
    • 데이터셋 구성 시 필수 스키마 필드와 동일한 필드를 반드시 구성해야 합니다.
      데이터셋 유형필수 필드(Not NULL)
      userUSER_ID (string)
      itemITEM_ID (string)
      interactionUSER_ID (string)
      ITEM_ID (string)
      TIMESTAMP (long)
    • 데이터셋 필드는 필드 이름뿐만 아니라 필드의 순서 및 필드 이름의 대소문자가 스키마 필드와 일치해야 합니다.
    • user 데이터셋과 item 데이터셋의 필수 필드에 중복된 데이터 값을 입력하지 않아야 합니다.

    데이터셋 생성

    학습에 사용할 데이터셋을 생성합니다. 데이터셋 이름을 기준으로 관리할 수 있으며, 데이터셋이 생성되면 고유한 데이터셋 ID가 할당됩니다.

    참고
    • 학습을 진행하려면 데이터셋을 유형별로 모두 생성해야 합니다.
    • 데이터셋을 생성하려면 업로드할 데이터셋 파일이 준비되어 있어야 합니다. 데이터셋 파일 구성에 관한 자세한 내용은 데이터셋 구성 시 주의 사항을 참조해 주십시오.
    • csv 또는 csv.gz 형식의 파일만 데이터셋 파일로 사용할 수 있습니다.

    데이터셋을 생성하는 방법은 다음과 같습니다.

    1. 네이버 클라우드 플랫폼 콘솔의 Region 메뉴와 Platform 메뉴에서 이용 중인 환경을 클릭해 주십시오.
    2. Services > AI Services > AiTEMS 메뉴를 차례대로 클릭해 주십시오.
    3. Dataset 메뉴를 클릭해 주십시오.
    4. [Dataset 생성] 버튼을 클릭해 주십시오.
    5. Dataset 생성 화면이 나타나면 데이터셋 이름을 입력하고 데이터셋 정보를 설정해 주십시오.
      • 데이터셋 이름: 데이터셋을 관리하는 기준으로, 5~20자 사이로 입력
        • 영어로 시작해야 하며 영어, 숫자, '_', '-'만 입력할 수 있습니다.
      • 설명: 데이터셋에 대한 설명 입력
      • 데이터셋 유형: 데이터셋의 유형 선택(user/item/interaction)
        • 데이터셋 유형에 대한 자세한 설명은 데이터셋 구성 시 주의 사항을 참조해 주십시오.
        • 데이터셋을 생성한 후에는 데이터셋 유형을 수정할 수 없습니다.
      • 스키마 선택: 데이터셋의 필수 구성 요소인 스키마를 선택하거나 새롭게 생성
        • 생성된 스키마가 없는 경우, 새로운 Schema 만들기를 선택하여 새로운 스키마를 생성할 수 있습니다.
        • 새로운 Schema 만들기를 선택할 경우, 새로운 스키마 필드 구성을 위한 영역이 나타납니다.
      • Data 선택: 학습을 진행할 데이터셋 파일의 선택 방법을 선택
        • Object Storage 에서 선택: Object Storage의 AiTEMS 버킷에 데이터셋 파일이 업로드되어 있는 경우 선택
        • 파일에서 선택: Object Storage의 AiTEMS 버킷에 데이터셋 파일이 업로드되어 있지 않은 경우 선택하며, 선택하여 파일을 업로드할 경우 버킷에 자동 저장
    6. 스키마 선택에서 새로운 Schema 만들기를 선택한 경우, 스키마 정보를 설정한 후 [추가] 버튼을 클릭해 주십시오.
      • 스키마 이름: 스키마를 관리하는 기준으로, 3~20자 사이로 입력
      • 스키마 설명: 스키마에 대한 설명 입력
      • 필드 이름: 데이터셋 파일의 필드 이름과 동일하게 입력
      • 필드 타입: 입력할 데이터 유형 선택(string/float/long/double/int/boolean/null)
      • 범주형 필드 여부: 범주가 정해진 데이터 입력 시 Y로 설정
      • i-aitems_order을 드래그 앤 드롭하여 필드의 순서를 변경할 수 있습니다.
    7. Data 선택에서 Object Storage 에서 선택을 선택한 경우, 업로드할 데이터셋을 클릭하여 선택해 주십시오.
      • AiTEMS 버킷에 업로드된 파일만 선택할 수 있습니다.
    8. Data 선택에서 파일에서 선택을 선택한 경우, 마우스로 파일을 끌고 오거나 여기를 클릭하세요 영역에 파일을 드래그 앤 드롭하거나 해당 영역을 클릭하여 파일을 선택해 주십시오.
      • 선택한 파일은 버킷 / 경로에 표시되는 경로에 자동 업로드됩니다.
    9. [생성] 버튼을 클릭해 주십시오.
    10. 알림 팝업 창의 [확인] 버튼을 클릭해 주십시오.
      • 데이터셋이 생성되어 데이터셋 목록에 추가됩니다.

    데이터셋 수정

    데이터셋의 설명을 수정하거나 스키마와 데이터셋 파일을 변경할 수 있습니다.

    참고

    데이터셋 생성 시 선택한 데이터셋 유형은 수정할 수 없습니다.

    데이터셋을 수정하는 방법은 다음과 같습니다.

    1. 네이버 클라우드 플랫폼 콘솔의 Region 메뉴와 Platform 메뉴에서 이용 중인 환경을 클릭해 주십시오.
    2. Services > AI Services > AiTEMS 메뉴를 차례대로 클릭해 주십시오.
    3. Dataset 메뉴를 클릭해 주십시오.
    4. 데이터셋 목록에서 수정할 데이터셋을 클릭해 주십시오.
    5. 데이터셋 수정 팝업 창이 나타나면 수정할 사항을 적용한 후 [저장 및 업로드] 버튼을 클릭해 주십시오.
    6. 데이터셋 파일을 변경하려면 데이터 수정 팝업 창에서 [경로 변경 및 업로드] 버튼을 클릭하고 변경할 파일을 클릭하여 선택한 후 [경로 변경 및 업로드] 버튼을 클릭해 주십시오.
      • Dataset 화면의 [데이터셋 업로드] 버튼을 클릭해서 데이터셋 파일을 변경할 수도 있습니다.(데이터셋 업로드 참조)
    7. 알림 팝업 창의 [확인] 버튼을 클릭해 주십시오.
      • 데이터셋 파일을 변경한 경우, 대기중 상태로 변경되며 데이터셋 파일 업로드 성공 여부에 따라 상태가 변경됩니다.

    데이터셋 업로드

    데이터셋 파일을 변경할 수 있습니다.

    참고
    • 데이터셋 파일을 변경하려면 변경하려는 파일이 Object Storage의 AiTEMS 버킷에 저장되어 있어야 합니다.
    • 데이터셋 수정을 통해서도 데이터셋 파일을 변경할 수 있습니다.

    데이터셋을 업로드하는 방법은 다음과 같습니다.

    1. 네이버 클라우드 플랫폼 콘솔의 Region 메뉴와 Platform 메뉴에서 이용 중인 환경을 클릭해 주십시오.
    2. Services > AI Services > AiTEMS 메뉴를 차례대로 클릭해 주십시오.
    3. Dataset 메뉴를 클릭해 주십시오.
    4. 데이터셋 목록에서 데이터셋 파일을 업로드할 데이터셋을 클릭해 주십시오.
    5. [데이터셋 업로드] 버튼을 클릭해 주십시오.
    6. 데이터셋 업로드 팝업 창에서 업로드할 데이터셋 파일을 클릭하여 선택한 후 [업로드 요청] 버튼을 클릭해 주십시오.
    7. 알림 팝업 창의 [확인] 버튼을 클릭해 주십시오.
      • 대기중 상태로 변경되며 데이터셋 파일 업로드 성공 여부에 따라 상태가 변경됩니다.

    데이터셋 삭제

    데이터셋을 삭제하는 방법은 다음과 같습니다.

    참고

    서비스에 연결된 데이터셋은 삭제할 수 없습니다. 먼저 해당 서비스를 삭제하거나 서비스에 연결된 데이터셋을 변경한 후 데이터셋을 삭제해 주십시오.

    1. 네이버 클라우드 플랫폼 콘솔의 Region 메뉴와 Platform 메뉴에서 이용 중인 환경을 클릭해 주십시오.
    2. Services > AI Services > AiTEMS 메뉴를 차례대로 클릭해 주십시오.
    3. Dataset 메뉴를 클릭해 주십시오.
    4. 데이터셋 목록에서 삭제할 데이터셋을 클릭해 주십시오.
    5. [삭제] 버튼을 클릭해 주십시오.
    6. 데이터셋 삭제 팝업 창이 나타나면 데이터셋 이름을 입력한 후 [삭제] 버튼을 클릭해 주십시오.
      • 데이터셋이 삭제되어 목록에서 사라집니다.

    이 문서가 도움이 되었습니까?

    What's Next
    Changing your password will log you out immediately. Use the new password to log back in.
    First name must have atleast 2 characters. Numbers and special characters are not allowed.
    Last name must have atleast 1 characters. Numbers and special characters are not allowed.
    Enter a valid email
    Enter a valid password
    Your profile has been successfully updated.