- 印刷する
- PDF
Tableauの連携
- 印刷する
- PDF
VPC環境で利用できます。
Tableauは迅速で簡単なデータ可視化をサポートしており、現在広く用いられているBIソリューションの一つです。
このガイドでは、NAVERクラウドプラットフォームのCloud HadoopとTableauを連携する方法を紹介します。
Tableauに関する詳細については、Tableau公式サイトをご参照ください。
事前作業
- Cloud Hadoopクラスターを作成します。
- Cloud Hadoop クラスターの作成の詳細については、Cloud Hadoopを開始するガイドを参照してください。
- Object Storageを作成します。
- Object Storageの作成に関する詳細については、Object Storageの概要をご参照ください。
- Windows Serverを作成します。
- Windows Serverの作成に関する詳細については、Serverを開始するをご参照ください。
Cloud HadoopとWindows Serverは、同じVPC内に作成することをお勧めします。
- ACGを設定します。
- Cloud Hadoop ACGアクセスソースにWindowsサーバー IP を入力し、許可ポートに 8286 ポートを追加します。
- Cloud Hadoop ACGアクセスソースにWindowsサーバー IP を入力し、許可ポートに 8286 ポートを追加します。
Hiveでテーブルの作成
Object Storageにサンプルデータファイルをアップロードします。
- こちらからサンプルデータをダウンロードして圧縮を解凍し、Object Storage > Bucket Managementに
AllstarFull.csv
ファイルをアップロードします。
- こちらからサンプルデータをダウンロードして圧縮を解凍し、Object Storage > Bucket Managementに
HUE Hiveエディタでデーブルを作成します。
DROP table allstarfull;
CREATE external TABLE if not EXISTS `allstarfull` (
`playerID` VARCHAR(20),
`yearID` INT,
`gameNum` INT,
`gameID` VARCHAR(30),
`teamID` VARCHAR(4),
`lgID` VARCHAR(4),
`GP` INT,
`startingPos` INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
location 's3a://deepdrive-hue/input/lahman2012/allstarfull';
- 簡単なクエリを用いてテーブルに正常に作成されたか確認します。
SELECT * FROM allstarfull;
Prestoコネクタの追加
- Presto > [CONFIGS] > Advanced connectors.propertiesでコネクタを追加します。
- Hiveコネクタを追加する必要があるため、connectors.to.addに以下のように入力します。
{"hive":["connector.name=hive-hadoop2",
"hive.metastore.uri=thrift://<METASTORE-HOST-IP>:9083",
"hive.config.resources=/etc/hadoop/conf/core-site.xml,/etc/hadoop/conf/hdfs-site.xml",
"hive.s3.use-instance-credentials=false",
"hive.s3.aws-access-key=<API-ACCESS-KEY>",
"hive.s3.aws-secret-key=<API-SECRET-KEY>",
"hive.s3.endpoint=https://kr.object.private.ncloudstorage.com"]
}
<METASTORE-HOST-IP>
はm-001ノードのプライベートIPアドレスです。Ambari > Hostsで確認できます。
- 変更された構成を適用するには再始動が必要です。右上の [ACTIONS] > Restart All をクリックし、ポップアップウィンドウの [CONFIRM RESTART ALL] ボタンをクリックしてください。
PrestoでHiveデータウェアハウスに保存したデータを分析する詳しい方法については、PrestoでHive Warehouseデータの分析ガイドをご参照ください。
Tableauのインストール
以下のすべてはWindows Serverで行われます。
- Tableau公式サイトでTableau Desktopをダウンロードします。
- Presto公式サイトでPresto JDBCドライバー(presto-jdbc-0.268.jar)をダウンロードします。
- TableauがインストールされたパスのDriversディレクトリにPresto JDBCドライバーを移動します。
TableauはPrestoだけでなく、スプレッドシートからデータベースに至るまで様々なデータを探索できます。対応するコネクタについては、Tableau Desktop と Web 作成のヘルプで確認できます。
nginx-ssl.crt証明書のインストール
Cloud Hadoopエッジノードから /etc/nginx/ssl/nginx-ssl.crt 証明書をWindows Serverにインポートします。
- エッジノードにアクセスする方法については、クラスタノードにSSHアクセスするガイドをご参照ください。
- エッジノードにアクセスする方法については、クラスタノードにSSHアクセスするガイドをご参照ください。
nginx-ssl.crt 証明書をダブルクリックし、[証明書のインストール] ボタンをクリックします。
「ローカル」を選択し、[次へ] ボタンをクリックします。
すべての証明書を次の保存場所に保存を選択し、証明書の保存場所を選択します。
- 証明書の保存場所は信頼できるルート認証局に設定します。
- 証明書の保存場所は信頼できるルート認証局に設定します。
[完了] ボタンをクリックして証明書のインストールを完了します。
Tableau DesktopでPrestoにアクセス
Tableau Desktopを実行し、サーバに接続 > 詳しく見る > Presto を選択します。
アクセス情報を入力し、[ログイン] ボタンをクリックします。
アクセス情報
- サーバ:Prestoクラスタのドメイン
- ポート:Prestoコーディネーターのポート(8286)
- カタログ:使用するカタログの名前
- スキーマ:使用するスキーマの名前
- ユーザー名:使用するユーザーの名前
- SSLの必要性:チェック
テーブルとレコードの確認
含むをクリックして検索を行い、そのスキーマのテーブルを確認します。
[今すぐアップデート] ボタンをクリックしてデーブル内のデータをインポートします。
新しいシートを作成し、ドラッグ&ドロップだけで簡単に可視化できます。
Tableauの使用に関する詳細については、公式サイトで確認できます。