HDFS を使用する

Prev Next

VPC環境で利用できます。

Data Forestで HDFSを活用する方法を説明します。

HDFSの名前空間

Data Forestで提供する HDFSは、NameNodeサーバ情報(ホスト名、ポート)を利用して HDFSにアクセスする代わりに、HDFSの論理名である名前空間を利用して HDFSにアクセスします。
Data Forestで提供する HDFSの名前空間は「koya」、「tata」です。

# HDFS NAMESPACE : koya
hdfs://koya/<hdfs path>

# HDFS NAMESPACE : tata
hdfs://tata/<hdfs path>

名前空間 Quota情報の確認

アカウントの詳細情報領域で、各アカウントに設定された HDFS Quota情報を確認できます。

  1. NAVERクラウドプラットフォームコンソールの VPC環境で、i_menu > Services > Big Data & Analytics > Data Forest > Accountsメニューを順にクリックします。
  2. アカウントの詳細情報を確認するためにアカウント領域をクリックします。
    • name quota(ファイル数) : HDFS名前空間で使用可能なファイル数
    • space quota(容量) : HDFSの名前空間で使用可能な容量
      df-eco-hdfs_01_vpc_ko

名前空間 Quota設定の変更

名前空間のファイル数と容量を変更する方法は、次の通りです。

  1. NAVERクラウドプラットフォームコンソールの VPC環境で、i_menu > Services > Big Data & Analytics > Data Forest > Accountsメニューを順にクリックします。
  2. アカウントを選択し、 [アカウント設定変更] > HDFS Quota変更ボタンをクリックします。
    df-eco-hdfs_12_vpc_ko
  3. 変更する名前空間を選択した後、変更後のファイル数と変更後のファイル容量を入力し、 [変更] ボタンをクリックします。
    df-eco-hdfs_03_vpc_ko

Hueアプリで HDFSにファイルをアップロード

Apache Hueアプリを利用して HDFSにファイルをアップロードする方法は、次の通りです。

  1. Hueアプリにログインします。
    • Data Forestアカウントとパスワードでログイン
  2. 画面右上の [Upload] ボタンをクリックします。
    df-eco-hdfs_10_vpc_ko
  3. [Select Files] ボタンをクリックします。
  4. ファイルをアップロードします。
    df-eco-hdfs_11_vpc_ko
  5. ファイルのアップロードが完了したら、HDFS上にアップロードされたファイルリストが表示されたか確認します。
    例) bank.csvファイルをサンプルとしてアップロードした場合
    df-eco-hdfs_06_vpc_ko

Hueアプリで HDFSファイルをダウンロード

Hueアプリで HDFSファイルをダウンロードする方法は、次の通りです。

  1. Hueアプリにログインします。
    • Data Forestアカウントとパスワードでログイン
  2. 画面左側メニューの [Files] をクリックします。
  3. ダウンロードするファイルを選択し、 [Actions] > Downloadをクリックします。
    例) 「bank.csv」ファイルを選択した場合
    df-eco-hdfs_07_vpc_ko