Tableau 連携

Prev Next

VPC環境で利用できます。

Tableauは、迅速かつ簡単なデータ可視化をサポートし、現在多く使用されている BIソリューションの1つです。
本ガイドでは、NAVERクラウドプラットフォームの Cloud Hadoopと Tableauを連携する方法を紹介します。

Tableauの詳細については、Tableau公式ホームページをご参照ください。

事前タスク

  1. Cloud Hadoopクラスタを作成します。
  2. Object Storageを作成します。
  3. Windowsサーバを作成します。
参考

Cloud Hadoopと Windowsサーバは同じ VPC内に作成することをお勧めします。

  1. ACGを設定します。
    • Cloud Hadoop ACGアクセスソースに Windowsサーバの IPアドレスを入力し、許可ポートには8286ポートを追加します。
      hadoop-vpc-use-ex14_pre1_vpc_ko

Hiveで Tableを作成

  1. Object Storageにサンプルデータファイルをアップロードします。

    • こちらからサンプルデータをダウンロードした後、解凍して Object Storage > Bucket ManagementAllstarFull.csv ファイルをアップロードします。
      chadoop-4-5-001_ko
  2. Hue Hiveエディタで Tableを作成します。

DROP table allstarfull;

CREATE external TABLE if not EXISTS `allstarfull` (
        `playerID` VARCHAR(20),
        `yearID` INT,
        `gameNum` INT,
        `gameID` VARCHAR(30),
        `teamID` VARCHAR(4),
        `lgID` VARCHAR(4),
        `GP` INT,
        `startingPos` INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
location 's3a://deepdrive-hue/input/lahman2012/allstarfull';
  1. 簡単なクエリを利用して、テーブルが正しく作成されたかを確認します。
SELECT * FROM allstarfull;

Presto Connector追加

  1. Presto > [CONFIGS] > Advanced trino.connectors.propertiesで connectorを追加します。
    • Hive Connectorを追加する必要があるので、connectors.to.addに以下のように入力します。
{"hive":["connector.name=hive-hadoop2",
        "hive.metastore.uri=thrift://<METASTORE-HOST-IP>:9083",
        "hive.config.resources=/etc/hadoop/conf/core-site.xml,/etc/hadoop/conf/hdfs-site.xml",
        "hive.s3.use-instance-credentials=false",
        "hive.s3.aws-access-key=<API-ACCESS-KEY>",
        "hive.s3.aws-secret-key=<API-SECRET-KEY>",
        "hive.s3.endpoint=https://kr.object.private.ncloudstorage.com"]
        }

hadoop-vpc-use-ex14_connect1_vpc_ko

参考

<METASTORE-HOST-IP>はマスターノード(m-001)の Private IPアドレスです。Ambari UI > Hostsメニューで確認できます。

  1. 変更された構成を適用するために再起動が必要です。画面右上の [ACTIONS] > Restart Allをクリックし、ポップアップの [CONFIRM RESTART ALL] ボタンをクリックします。
参考

Prestoで Hive data warehouseに保存したデータを分析する詳しい方法は、Prestoで Hive warehouseデータを分析ガイドをご参照ください。

Tableauのインストール

以下のプロセスはすべて Windowsサーバで行われます。

  1. Tableauホームページから Tableau Desktopをダウンロードします。
  2. Prestoホームページから Presto JDBCドライバ(presto-jdbc-0.268.jar)をダウンロードします。
  3. Tableauがインストールされているパスの Driversディレクトリに Presto JDBCドライバを移行します。
    hadoop-vpc-use-ex14_install1_vpc_ko
参考

Tableauは Prestoのみでなく、スプレッドシートからデータベースなど様々なデータを検索できます。サポートしているコネクタは、Tableau Desktopと ウェブ作成ヘルプで確認できます。

nginx-ssl.crt証明書のインストール

  1. Cloud Hadoopエッジノードから、/etc/nginx/ssl/nginx-ssl.crt証明書を Windowsサーバにインポートします。

  2. nginx-ssl.crt証明書をダブルクリックし、 [証明書のインストール] ボタンをクリックします。
    hadoop-vpc-use-ex14_install3_vpc_ko

  3. ローカルコンピュータを選択し、 [次へ] ボタンをクリックします。
    hadoop-vpc-use-ex14_install4_vpc_ko

  4. すべての証明書を次のストレージに保存を選択した後、証明書ストレージを選択します。

    • 証明書ストレージは、信頼できるルート認証機関に設定します。
      hadoop-vpc-use-ex14_install5_vpc_ko
  5. [完了] ボタンをクリックし、証明書のインストールを完了します。
    hadoop-vpc-use-ex14_install6_vpc_ko

Tableau Desktopから Prestoにアクセス

  1. Tableau Desktopを起動し、サーバにアクセス > 詳細 > Prestoを選択します。
    hadoop-vpc-use-ex14_visual1_vpc_ko
  2. アクセス情報を入力し、 [ログイン] ボタンをクリックします。
アクセス情報 
 - サーバ: Prestoクラスタのドメイン
 - ポート: Presto Coordinatorのポート(8286)
 - カタログ: 使用するカタログの名前
 - スキーマ: 使用するスキーマの名前
 - ユーザー名: 使用するユーザーの名前
 - SSLが必要: チェック

hadoop-vpc-use-ex14_visual2_vpc_ko

テーブルとレコードの確認

  1. 含めるをクリックして検索し、そのスキーマのテーブルを確認します。
    hadoop-vpc-use-ex14_visual3_vpc_ko

  2. [今すぐアップデート] ボタンをクリックし、テーブル内のデータを呼び出します。
    hadoop-vpc-use-ex14_visual4_vpc_ko

  3. 新しいシートを作成し、ドラッグアンドドロップするだけで簡単に可視化できます。
    hadoop-vpc-use-ex14_visual5_vpc_ko

参考

Tableauの使用に関する詳細については、Tableau公式ホームページをご参照ください。