Tableau 연동
    • PDF

    Tableau 연동

    • PDF

    Article Summary

    VPC 환경에서 이용 가능합니다.

    Tableau는 빠르고 쉬운 데이터 시각화를 지원하여 현재 많이 사용되는 BI 솔루션 중 하나입니다.
    이 가이드는 네이버 클라우드 플랫폼의 Cloud Hadoop과 Tableau를 연동하는 방법을 소개합니다.

    Tableau에 대한 자세한 내용은 Tableau 공식 홈페이지를 참조해 주십시오.

    사전작업

    1. Cloud Hadoop 클러스터를 생성해 주십시오.
      • Cloud Hadoop 클러스터 생성에 관한 자세한 내용은 Cloud Hadoop 시작 가이드를 참조해 주십시오.
    2. Object Storage를 생성해 주십시오.
      • Object Storage 생성에 관한 자세한 내용은 Object Storage 개요 가이드를 참조해 주십시오.
    3. Windows 서버를 생성해 주십시오.
      • Windows 서버 생성에 관한 자세한 내용은 Server 시작 가이드를 참조해 주십시오.
    참고

    Cloud Hadoop과 Windows 서버는 같은 VPC 내에 생성하는 것을 권장합니다.

    1. ACG를 설정해 주십시오.
      • Cloud Hadoop ACG 접근 소스에 Windows 서버 IP를 입력하고, 허용 포트에는 8286 포트를 추가해 주십시오.
        hadoop-vpc-use-ex14_pre1_vpc_ko

    Hive에서 Table 생성

    1. Object Storage에 샘플 데이터 파일을 업로드해 주십시오.

      • 여기에서 샘플 데이터를 다운로드한 후 압축을 해제하고 Object Storage > Bucket ManagementAllstarFull.csv 파일을 업로드해 주십시오.
        chadoop-4-5-001_ko
    2. Hue Hive 편집기에서 Table을 생성해 주십시오.

    DROP table allstarfull;
    
    CREATE external TABLE if not EXISTS `allstarfull` (
            `playerID` VARCHAR(20),
            `yearID` INT,
            `gameNum` INT,
            `gameID` VARCHAR(30),
            `teamID` VARCHAR(4),
            `lgID` VARCHAR(4),
            `GP` INT,
            `startingPos` INT
    )
    ROW FORMAT DELIMITED
    FIELDS TERMINATED BY ','
    location 's3a://deepdrive-hue/input/lahman2012/allstarfull';
    
    1. 간단한 쿼리를 이용해서 테이블이 제대로 생성되었는지 확인해 주십시오.
    SELECT * FROM allstarfull;
    

    Presto Connector 추가

    1. Presto > [CONFIGS] > Advanced connectors.properties에서 connector를 추가해 주십시오.
      • Hive Connector를 추가해야 하므로 connectors.to.add에 다음과 같이 입력해 주십시오.
    {"hive":["connector.name=hive-hadoop2",
            "hive.metastore.uri=thrift://<METASTORE-HOST-IP>:9083",
            "hive.config.resources=/etc/hadoop/conf/core-site.xml,/etc/hadoop/conf/hdfs-site.xml",
            "hive.s3.use-instance-credentials=false",
            "hive.s3.aws-access-key=<API-ACCESS-KEY>",
            "hive.s3.aws-secret-key=<API-SECRET-KEY>",
            "hive.s3.endpoint=https://kr.object.private.ncloudstorage.com"]
            }
    

    hadoop-vpc-use-ex14_connect1_vpc_ko

    참고

    <METASTORE-HOST-IP>는 마스터 노드(m-001)의 Private IP 주소입니다. Ambari UI > Hosts 메뉴에서 확인할 수 있습니다.

    1. 변경된 구성을 적용하기 위해 재시작이 필요합니다. 우측 상단의 [ACTIONS] > Restart All 을 클릭한 후, 팝업창의 [CONFIRM RESTART ALL] 버튼을 클릭해 주십시오.
    참고

    Presto에서 Hive data warehouse에 저장한 데이터를 분석하는 자세한 방법은 Presto로 Hive warehouse 데이터 분석 가이드를 참조해 주십시오.

    Tableau 설치

    아래 과정들은 모두 Windows 서버에서 진행됩니다.

    1. Tableau 홈페이지에서 Tableau Desktop을 다운로드해 주십시오.
    2. Presto 홈페이지에서 Presto JDBC 드라이버(presto-jdbc-0.268.jar)를 다운로드해 주십시오.
    3. Tableau가 설치된 경로의 Drivers 디렉터리에 Presto JDBC 드라이버를 옮겨 주십시오.
      hadoop-vpc-use-ex14_install1_vpc_ko
    참고

    Tableau는 Presto 뿐만 아니라 스프레드시트부터 데이터베이스 등 다양한 데이터를 탐색할 수 있습니다. 지원되는 커넥터는 Tableau Desktop 및 웹 작성 도움말에서 확인하실 수 있습니다.

    nginx-ssl.crt 인증서 설치

    1. Cloud Hadoop 엣지 노드에서 /etc/nginx/ssl/nginx-ssl.crt 인증서를 Windows 서버로 가져와 주십시오.

    2. nginx-ssl.crt 인증서를 더블 클릭한 뒤, [인증서 설치] 버튼을 클릭해 주십시오.
      hadoop-vpc-use-ex14_install3_vpc_ko

    3. 로컬 컴퓨터를 선택한 뒤, [다음] 버튼을 클릭해 주십시오.
      hadoop-vpc-use-ex14_install4_vpc_ko

    4. 모든 인증서를 다음 저장소에 저장을 선택 후 인증서 저장소를 선택해 주십시오.

      • 인증서 저장소는 신뢰할 수 있는 루트 인증 기관으로 설정합니다.
        hadoop-vpc-use-ex14_install5_vpc_ko
    5. [마침] 버튼을 클릭하여 인증서 설치를 완료해 주십시오.
      hadoop-vpc-use-ex14_install6_vpc_ko

    Tableau Desktop에서 Presto 접속

    1. Tableau Desktop 을 실행 후 서버에 연결 > 자세히 > Presto를 선택해 주십시오.
      hadoop-vpc-use-ex14_visual1_vpc_ko
    2. 접속 정보를 입력한 뒤 [로그인] 버튼을 클릭해 주십시오.
    접속 정보 
     - 서버 : Presto 클러스터의 도메인
     - 포트 : Presto Coordinator의 포트(8286)
     - 카탈로그 : 사용할 카탈로그의 이름
     - 스키마 : 사용할 스키마의 이름
     - 사용자 이름 : 사용할 유저의 이름
     - SSL 필요 : 체크
    

    hadoop-vpc-use-ex14_visual2_vpc_ko

    테이블 및 레코드 확인

    1. 포함을 클릭하고 검색하여 해당 스키마의 테이블을 확인해 주십시오.
      hadoop-vpc-use-ex14_visual3_vpc_ko

    2. [지금 업데이트] 버튼을 클릭하여 테이블 안의 데이터들을 불러와 주십시오.
      hadoop-vpc-use-ex14_visual4_vpc_ko

    3. 새 시트를 만들어서 드래그 앤 드롭만으로 간단히 시각화할 수 있습니다.
      hadoop-vpc-use-ex14_visual5_vpc_ko

    참고

    Tableau 사용에 대한 더 자세한 내용은 Tableau 공식 홈페이지를 참조해 주십시오.


    이 문서가 도움이 되었습니까?

    Changing your password will log you out immediately. Use the new password to log back in.
    First name must have atleast 2 characters. Numbers and special characters are not allowed.
    Last name must have atleast 1 characters. Numbers and special characters are not allowed.
    Enter a valid email
    Enter a valid password
    Your profile has been successfully updated.