Documentation Index

Fetch the complete documentation index at: https://guide.ncloud-docs.com/llms.txt

Use this file to discover all available pages before exploring further.

Tableau 連携

Prev Next

VPC環境で利用できます。

Tableauは、迅速かつ簡単なデータ可視化をサポートし、現在多く使用されている BIソリューションの1つです。
本ガイドでは、NAVERクラウドプラットフォームの Cloud Hadoopと Tableauを連携する方法を紹介します。

Tableauの詳細については、Tableau公式ホームページをご参照ください。

事前タスク

  1. Cloud Hadoopクラスタを作成します。
  2. Object Storageを作成します。
  3. Windowsサーバを作成します。
参考

Cloud Hadoopと Windowsサーバは同じ VPC内に作成することをお勧めします。

  1. ACGを設定します。
    • Cloud Hadoop ACGアクセスソースに Windowsサーバの IPアドレスを入力し、許可ポートには8286ポートを追加します。
      hadoop-vpc-use-ex14_pre1_vpc_ko

Hiveで Tableを作成

  1. Object Storageにサンプルデータファイルをアップロードします。

    • こちらからサンプルデータをダウンロードした後、解凍して Object Storage > Bucket ManagementAllstarFull.csv ファイルをアップロードします。
      chadoop-4-5-001_ko
  2. Hue Hiveエディタで Tableを作成します。

DROP table allstarfull;

CREATE external TABLE if not EXISTS `allstarfull` (
        `playerID` VARCHAR(20),
        `yearID` INT,
        `gameNum` INT,
        `gameID` VARCHAR(30),
        `teamID` VARCHAR(4),
        `lgID` VARCHAR(4),
        `GP` INT,
        `startingPos` INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
location 's3a://deepdrive-hue/input/lahman2012/allstarfull';
  1. 簡単なクエリを利用して、テーブルが正しく作成されたかを確認します。
SELECT * FROM allstarfull;

Presto Connector追加

  1. Presto > [CONFIGS] > Advanced trino.connectors.propertiesで connectorを追加します。
    • Hive Connectorを追加する必要があるので、connectors.to.addに以下のように入力します。
{"hive":["connector.name=hive-hadoop2",
        "hive.metastore.uri=thrift://<METASTORE-HOST-IP>:9083",
        "hive.config.resources=/etc/hadoop/conf/core-site.xml,/etc/hadoop/conf/hdfs-site.xml",
        "hive.s3.use-instance-credentials=false",
        "hive.s3.aws-access-key=<API-ACCESS-KEY>",
        "hive.s3.aws-secret-key=<API-SECRET-KEY>",
        "hive.s3.endpoint=https://kr.object.private.ncloudstorage.com"]
        }

hadoop-vpc-use-ex14_connect1_vpc_ko

参考

<METASTORE-HOST-IP>はマスターノード(m-001)の Private IPアドレスです。Ambari UI > Hostsメニューで確認できます。

  1. 変更された構成を適用するために再起動が必要です。画面右上の [ACTIONS] > Restart Allをクリックし、ポップアップの [CONFIRM RESTART ALL] ボタンをクリックします。
参考

Prestoで Hive data warehouseに保存したデータを分析する詳しい方法は、Prestoで Hive warehouseデータを分析ガイドをご参照ください。

Tableauのインストール

以下のプロセスはすべて Windowsサーバで行われます。

  1. Tableauホームページから Tableau Desktopをダウンロードします。
  2. Prestoホームページから Presto JDBCドライバ(presto-jdbc-0.268.jar)をダウンロードします。
  3. Tableauがインストールされているパスの Driversディレクトリに Presto JDBCドライバを移行します。
    hadoop-vpc-use-ex14_install1_vpc_ko
参考

Tableauは Prestoのみでなく、スプレッドシートからデータベースなど様々なデータを検索できます。サポートしているコネクタは、Tableau Desktopと ウェブ作成ヘルプで確認できます。

nginx-ssl.crt証明書のインストール

  1. Cloud Hadoopエッジノードから、/etc/nginx/ssl/nginx-ssl.crt証明書を Windowsサーバにインポートします。

  2. nginx-ssl.crt証明書をダブルクリックし、 [証明書のインストール] ボタンをクリックします。
    hadoop-vpc-use-ex14_install3_vpc_ko

  3. ローカルコンピュータを選択し、 [次へ] ボタンをクリックします。
    hadoop-vpc-use-ex14_install4_vpc_ko

  4. すべての証明書を次のストレージに保存を選択した後、証明書ストレージを選択します。

    • 証明書ストレージは、信頼できるルート認証機関に設定します。
      hadoop-vpc-use-ex14_install5_vpc_ko
  5. [完了] ボタンをクリックし、証明書のインストールを完了します。
    hadoop-vpc-use-ex14_install6_vpc_ko

Tableau Desktopから Prestoにアクセス

  1. Tableau Desktopを起動し、サーバにアクセス > 詳細 > Prestoを選択します。
    hadoop-vpc-use-ex14_visual1_vpc_ko
  2. アクセス情報を入力し、 [ログイン] ボタンをクリックします。
アクセス情報 
 - サーバ: Prestoクラスタのドメイン
 - ポート: Presto Coordinatorのポート(8286)
 - カタログ: 使用するカタログの名前
 - スキーマ: 使用するスキーマの名前
 - ユーザー名: 使用するユーザーの名前
 - SSLが必要: チェック

hadoop-vpc-use-ex14_visual2_vpc_ko

テーブルとレコードの確認

  1. 含めるをクリックして検索し、そのスキーマのテーブルを確認します。
    hadoop-vpc-use-ex14_visual3_vpc_ko

  2. [今すぐアップデート] ボタンをクリックし、テーブル内のデータを呼び出します。
    hadoop-vpc-use-ex14_visual4_vpc_ko

  3. 新しいシートを作成し、ドラッグアンドドロップするだけで簡単に可視化できます。
    hadoop-vpc-use-ex14_visual5_vpc_ko

参考

Tableauの使用に関する詳細については、Tableau公式ホームページをご参照ください。