Data Catalog 로 외부 Hive Metastore 연동 (옵션)

Prev Next

VPC 환경에서 이용 가능합니다.

네이버 클라우드 플랫폼 Data Catalog 로 Cloud Hadoop의 Hive Metastore 저장소 연동하는 방법을 소개합니다.

사전 작업

  1. Data Catalog 이용 신청을 해주십시오.
    • Data Catalog 이용과 관련한 자세한 내용은 Data Catalog 시작 가이드를 참조해 주십시오.

Data Catalog로 Hive Metastore를 사용하려면

  1. Cloud Hadoop 2.0 버전 이상에서만 연동 가능합니다.
  2. Data Catalog 저장소에 N개의 Cloud Hadoop 클러스터들이 자유롭게 연동하여 사용할 수 있습니다.

외부 Hive Metastore로 연동

Cloud Hadoop 생성시 Data Catalog 서비스의 카탈로그 사용 여부를 체크하여 생성하면 자동으로 연동됩니다.
Cloud Hadoop에서 제공하는 Hive , Presto , Trino , Impala , Spark 서비스도 Data Catalog를 메타 저장소로 사용하여 이용 가능합니다.

chadoop-datacatalog-cluster_ko.png

Cloud Hadoop 과 연동된 Data Catalog 상태에 대해서는 클러스터 상세정보를 통해서 확인하실 수 있습니다.

chadoop-datacatalog_ko.png

연동이 정상적으로 완료되었는지 확인하려면 Hue > Hive에서 아래 명령어를 실행하여 Data Catalog 상품에서 생성했던 데이터베이스 목록이 출력되는지 확인해 주십시오.

show databases;

Data Catalog 사용 시 고려사항

  1. LOCATION을 지정하지 않고 Hive 테이블을 생성하면 Data Catalog 생성 시 사용한 오브젝트 스토리지 버킷 주소로 저장됩니다.
  2. Cloud Hadoop 클러스터를 삭제하여도 Data Catalog 에 생성된 테이블 정보는 그대로 유지됩니다.