Data Forest の利用シナリオ

Prev Next

VPC環境で利用できます。

Data Forestの利用シナリオを説明します。

Step 1. アカウント作成

  1. NAVERクラウドプラットフォームコンソールの VPC環境で、 i_menu > Services > Big Data & Analytics > Data Forestメニューを順にクリックします。
  2. Accounts[アカウント作成] ボタンをクリックします。
  3. アカウント名に「df-test」と入力してアカウントのパスワードを入力し、 [作成] ボタンをクリックします。
参考

Step 2. アプリ作成

  1. Data Forest > Apps をクリックし、[App作成] ボタンをクリックします。
  2. アプリ情報を入力します。
    • アカウント名: 「df123」と入力
    • アプリのタイプ: 「HUE-4.7.0」を選択
    • アプリ名: 「my-hue」と入力
    • 稼働時間: 「604800」と入力
    • キュー: 「Longlived」を選択
      df-quick-start_1-1_ko
  3. 基本設定を完了し、 [次へ] ボタンをクリックします。
  4. 最終確認し、 [作成] ボタンをクリックします。
参考

ブラウザでプロキシを設定

Firefoxブラウザでのプロキシ設定

Firefoxブラウザでプロキシを設定する方法は、次の通りです。

  1. Firefoxブラウザを開きます。
  2. ブラウザ右上の df-quick-start_i-firefox > 設定 > ネットワーク設定 > [設定] ボタンをクリックします。
  3. インターネットプロキシへのアクセス設定 > 手動プロキシ設定 >をクリックします。
  4. SOCKSホスト情報を入力します。
    • SOCKS v5を選択
    • SOCKSホスト: 127.0.0.1と入力
    • ポート: 9494
      df-quick-start_firefox_ko
  5. 「パスワードが保存されている場合は認証時に入力を省略する」、「SOCKS v5を使用する時にプロキシ DNS」のチェックボックスをクリックします。
  6. プロキシの設定が完了すると、 [確認] ボタンをクリックします。
参考

Data Forestサーバにアクセスしない場合、プロキシへのアクセス設定を「No Proxy(プロキシを使用しない)」に変更しないとインターネットを正常に使用できません。

macOSの Chromeブラウザでのプロキシ設定

Macの OSで Chromeブラウザでプロキシを設定する方法は、次の通りです。

cmdで次のコマンドを実行します。

$ /Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome --proxy server="socks5://127.0.0.1:9876"

Windowsの Chromeブラウザでのプロキシ設定

Windowsの OSで Chromeブラウザでプロキシを設定する方法は、次の通りです。

  1. Chromeアイコンを右クリックし、 プロパティ をクリックします。
  2. Chromeプロパティ画面が表示されたら [ショートカット] タブ > 対象(T) の入力されたテキストの末尾に --proxy-server="socks5://127.0.0.1:9876"を追加します。

Step 3. Quick linksアクセスの確認

アプリから Quick Linksにアクセスできるかどうかを確認する方法は、次の通りです。

  1. NAVERクラウドプラットフォームコンソールの VPC環境で、 i_menu > Services > Big Data & Analytics > Data Forest > Data Forest > Appsメニューを順にクリックします。
  2. Hueアプリをクリックして詳細情報領域を開きます。
  3. アプリの詳細情報領域で Quick links のリンクをクリックします。
  4. 正常にアクセスされたか確認します。
    • 正常にアクセスされるとトンネリングが完了したことを意味し、HUEアプリを通じて HDFSのファイルを管理できます。
参考

Quick linksに関する詳細は、Quick linksアクセスをご参照ください。

Step 4. Zeppelin、HiveServerアプリの連携

Apache Zeppelin、Apache HiveServerアプリを連携する方法は、次の通りです。

  1. 「HIVESERVER2-LDAP-3.1.0」、「DEV-1.0.0」、「ZEPPELIN-0.10.1」アプリを作成します。
  2. 作成した Zeppelinアプリをクリックし、 Quick linkszeppelin URLにアクセスします。
    df-quick-start_2-2_ko
  3. アカウント名と、そのアカウントの作成時に入力したパスワードを入力してログインします。
  4. 画面右上のアカウントをクリックし、 Interpreter をクリックします。
    df-hive_12_vpc_ko
  5. JDBCインタープリターを検索します。
    df-quick-start_zeppelin03
  6. 画面右上の [edit] ボタンをクリックします。
    df-quick-start_zeppelin04
  7. 以下のように Propertiesに hive.password 項目を追加します。
    df-quick-start_zeppelin05
    • Hive.driver: JDBC driverクラスパス(org.apache.hive.jdbc.HiveDriver)を入力
    • hive.password: ログインしたアカウントのパスワードを入力
    • hive.proxy.user.property: hive.server2.proxy.userを入力
    • hive.splitQueries: trueを入力
    • hive.url: Hiveserver2-ldapアプリ作成時に提供される JDBC connection string Exampleを入力
      • アカウントの作成時に設定したパスワードに特殊文字が含まれている場合、urlエンコードで置換してから入力
    • hive.user: アカウント名(df-test)を入力
  8. Dependencies > artifact 項目に /usr/hdp/current/hive-client/jdbc/hive-jdbc-3.1.0.3.1.0.0-78-standalone.jar を入力します。
    df-quick-start_zeppelin06
  9. [Save] ボタンをクリックします。
  10. 作成されたコードと同様に、Data Forestで作成した Hive DBとテーブルの読み取りと書き込みを行えるステータスになります。
    df-quick-start_zeppelin08

Step 5. アプリ削除

使用しなくなったアプリは削除できます。 アプリを削除する方法は、次の通りです。

  1. NAVERクラウドプラットフォームコンソールの VPC環境で、 i_menu > Services > Big Data & Analytics > Data Forest > Data Forest > Appsメニューを順にクリックします。
  2. アプリリストで削除したいアプリを選択し、 [終了] ボタンをクリックします。
  3. 終了した(Finished)アプリを選択し、 [削除] ボタンをクリックします。

Step 6. アカウント削除

使用しなくなったアカウントは削除できます。 アカウントを削除する方法は、次の通りです。

  1. NAVERクラウドプラットフォームコンソールの VPC環境で、 i_menu > Services > Big Data & Analytics > Data Forest > Accounts メニューを順にクリックします。
  2. 削除したいアカウントを選択し、 [削除] ボタンをクリックします。