VPC環境で利用できます。
Tableauは、迅速かつ簡単なデータ可視化をサポートし、現在多く使用されている BIソリューションの1つです。
本ガイドでは、NAVERクラウドプラットフォームの Cloud Hadoopと Tableauを連携する方法を紹介します。
Tableauの詳細については、Tableau公式ホームページをご参照ください。
事前タスク
- Cloud Hadoopクラスタを作成します。
- Cloud Hadoopクラスタ作成に関する詳細は、Cloud Hadoop を開始するガイドをご参照ください。
- Object Storageを作成します。
- Object Storage作成に関する詳細は、Object Storage の概要ガイドをご参照ください。
- Windowsサーバを作成します。
- Windowsサーバ作成に関する詳細は、Server を開始するガイドをご参照ください。
Cloud Hadoopと Windowsサーバは同じ VPC内に作成することをお勧めします。
- ACGを設定します。
- Cloud Hadoop ACGアクセスソースに Windowsサーバの IPアドレスを入力し、許可ポートには8286ポートを追加します。

- Cloud Hadoop ACGアクセスソースに Windowsサーバの IPアドレスを入力し、許可ポートには8286ポートを追加します。
Hiveで Tableを作成
-
Object Storageにサンプルデータファイルをアップロードします。
- こちらからサンプルデータをダウンロードした後、解凍して Object Storage > Bucket Managementに
AllstarFull.csvファイルをアップロードします。

- こちらからサンプルデータをダウンロードした後、解凍して Object Storage > Bucket Managementに
-
Hue Hiveエディタで Tableを作成します。
DROP table allstarfull;
CREATE external TABLE if not EXISTS `allstarfull` (
`playerID` VARCHAR(20),
`yearID` INT,
`gameNum` INT,
`gameID` VARCHAR(30),
`teamID` VARCHAR(4),
`lgID` VARCHAR(4),
`GP` INT,
`startingPos` INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
location 's3a://deepdrive-hue/input/lahman2012/allstarfull';
- 簡単なクエリを利用して、テーブルが正しく作成されたかを確認します。
SELECT * FROM allstarfull;
Presto Connector追加
- Presto > [CONFIGS] > Advanced trino.connectors.propertiesで connectorを追加します。
- Hive Connectorを追加する必要があるので、connectors.to.addに以下のように入力します。
{"hive":["connector.name=hive-hadoop2",
"hive.metastore.uri=thrift://<METASTORE-HOST-IP>:9083",
"hive.config.resources=/etc/hadoop/conf/core-site.xml,/etc/hadoop/conf/hdfs-site.xml",
"hive.s3.use-instance-credentials=false",
"hive.s3.aws-access-key=<API-ACCESS-KEY>",
"hive.s3.aws-secret-key=<API-SECRET-KEY>",
"hive.s3.endpoint=https://kr.object.private.ncloudstorage.com"]
}

<METASTORE-HOST-IP>はマスターノード(m-001)の Private IPアドレスです。Ambari UI > Hostsメニューで確認できます。
- 変更された構成を適用するために再起動が必要です。画面右上の [ACTIONS] > Restart Allをクリックし、ポップアップの [CONFIRM RESTART ALL] ボタンをクリックします。
Prestoで Hive data warehouseに保存したデータを分析する詳しい方法は、Prestoで Hive warehouseデータを分析ガイドをご参照ください。
Tableauのインストール
以下のプロセスはすべて Windowsサーバで行われます。
- Tableauホームページから Tableau Desktopをダウンロードします。
- Prestoホームページから Presto JDBCドライバ(presto-jdbc-0.268.jar)をダウンロードします。
- Tableauがインストールされているパスの Driversディレクトリに Presto JDBCドライバを移行します。

Tableauは Prestoのみでなく、スプレッドシートからデータベースなど様々なデータを検索できます。サポートしているコネクタは、Tableau Desktopと ウェブ作成ヘルプで確認できます。
nginx-ssl.crt証明書のインストール
-
Cloud Hadoopエッジノードから、/etc/nginx/ssl/nginx-ssl.crt証明書を Windowsサーバにインポートします。
- エッジノードにアクセスする方法は、SSHでクラスタノードにアクセスガイドをご参照ください。

- エッジノードにアクセスする方法は、SSHでクラスタノードにアクセスガイドをご参照ください。
-
nginx-ssl.crt証明書をダブルクリックし、 [証明書のインストール] ボタンをクリックします。

-
ローカルコンピュータを選択し、 [次へ] ボタンをクリックします。

-
すべての証明書を次のストレージに保存を選択した後、証明書ストレージを選択します。
- 証明書ストレージは、信頼できるルート認証機関に設定します。

- 証明書ストレージは、信頼できるルート認証機関に設定します。
-
[完了] ボタンをクリックし、証明書のインストールを完了します。

Tableau Desktopから Prestoにアクセス
- Tableau Desktopを起動し、サーバにアクセス > 詳細 > Prestoを選択します。

- アクセス情報を入力し、 [ログイン] ボタンをクリックします。
アクセス情報
- サーバ: Prestoクラスタのドメイン
- ポート: Presto Coordinatorのポート(8286)
- カタログ: 使用するカタログの名前
- スキーマ: 使用するスキーマの名前
- ユーザー名: 使用するユーザーの名前
- SSLが必要: チェック

テーブルとレコードの確認
-
含めるをクリックして検索し、そのスキーマのテーブルを確認します。

-
[今すぐアップデート] ボタンをクリックし、テーブル内のデータを呼び出します。

-
新しいシートを作成し、ドラッグアンドドロップするだけで簡単に可視化できます。

Tableauの使用に関する詳細については、Tableau公式ホームページをご参照ください。