데이터 문제

Prev Next

VPC 환경에서 이용 가능합니다.

Cloud Data Box 서비스를 이용하면서 다음과 같은 문제를 겪을 수 있습니다. 문제별 원인과 해결 방법을 확인하고 적절하게 조치해 주십시오.

HUE에서 데이터 조회 불가

HUE에서 데이터가 조회되지 않습니다.

원인

Hive 테이블이 생성되지 않았습니다.

해결 방법

제공되는 샘플 데이터를 활용하여 Hive 테이블을 생성하면 데이터를 조회할 수 있습니다. 스크립트 실행을 비롯한 자세한 내용은 샘플 데이터 조회를 참조해 주십시오.

Jupyter Notebook에서 데이터 집계 지연

Jupyter Notebook에서 데이터 집계가 오래 걸립니다.

원인

네이버 클라우드 플랫폼에서 제공하는 네이버 데이터의 용량은 약정 전 기준 10TB, 약정 후 기준 50TB입니다. 데이터 용량으로 인해 집계가 오래 걸릴 수 있습니다.

해결 방법

데이터 집계는 Hue, Zeppelin, Hive CLI에서 수행하는 것을 권장합니다.

JSON 파일 형식으로 반출

데이터 박스 이용 중 반출 신청 시 선택 가능한 파일 유형은 테이블, 이미지, 코드, 모델, 라이선스만 있습니다. 단순한 형식의 JSON 파일로 반출하고 싶습니다.

원인

JSON 파일은 반출 신청이 불가합니다.

해결 방법

csv 포맷의 테이블 파일, 또는 이미지나 코드 등의 파일로 반출 신청을 진행해 주십시오.

반출 신청 반려

"테이블 구성이 맞지 않습니다"라는 사유로 반출 신청이 반려되었습니다.
데이터에 문제가 없는데 반출 신청이 반려되었습니다.

원인

다음과 같은 경우, 반출 신청이 반려될 수 있습니다.

  • 파일 내 테이블 구조 오류
  • 여러 테이블 구조의 데이터 존재
  • 파일 내 필드 개수 다름

해결 방법

  • 하나의 파일에는 하나의 테이블 구조의 데이터만 존재해야 합니다. 하나의 파일에 여러 테이블의 데이터를 포함하고 있는 것은 아닌지 확인한 후 테이블 구조를 변경해 주십시오.
  • 파일 내 테이블에서 필드의 개수가 다른 것은 아닌지 확인해 주십시오.
참고

이 가이드에서 필요한 정보를 찾지 못했거나 추가로 필요한 정보가 있으신 경우, 언제든지 아래의 피드백 아이콘을 클릭하여 의견을 보내 주십시오. 전달해 주신 의견을 참고하여 더 유용한 정보를 제공하겠습니다.