データボックスの作成

Prev Next

VPC環境で利用できます。

Cloud Data Boxご利用の申し込みを完了した後は、データボックスを作成できます。データボックスの作成時には、データボックスを使用するための分析サービスと分析サービスにアクセスするためのサーバを設定します。

1. インフラサービス選択

データボックスを使用するには、Cloud Hadoop、TensorFlowなどの分析サービスと分析サービスにアクセスするための Connectサーバを選択する必要があります。

  • Connectサーバ: Windows OSが提供されるサーバとして、Connectサーバの Puttyを用いて Cloud Hadoopと Ncloud TensorFlow Serverにアクセスできます。また、Connectサーバのウェブブラウザで ambari、zeppelin、jupyter Notebookなどを利用できます。
  • SSL VPN: 提供されるサーバにアクセスするには、必ず SSL VPNを利用する必要があります。
  • NAS: 外部ネットワークとの通信がブロックされた後、外部からファイルを持ち込んだり、分析結果を外部に持ち出すために使用します。NASは Cloud Hadoop、TensorFlow CPUと TensorFlow GPU、リナックスサーバにすべてマウントされて提供されるので、Cloud Hadoopと Ncloud TensorFlow Serverと Linuxサーバ間で簡単にファイルを共有できます。

データボックスを作成する方法は、次の通りです。

  1. NAVERクラウドプラットフォームコンソールの VPC環境で、 i_menu > Services > Big Data & Analytics > Cloud Data Boxメニューを順にクリックします。
  2. [データボックスの申し込み] ボタンをクリックします。
  • データを分析するインフラ環境を設定する画面が表示されます。
  1. Connectサーバの仕様と台数を選択します。
    • Connectサーバ1台につき2つのユーザーアカウントを作成でき、最大2人が同時にアクセスできますので、アナリストの人数に合わせて Connectサーバの数を選択します。
  2. 必要な SSL VPNアカウント数を選択します。
    • SSL VPN接続時にメール認証または携帯電話認証が必要なため、ユーザーごとに1つの SSL VPNアカウントを申し込む必要があります。
    • SSL VPNは Connectサーバの3倍まで申し込みできます。
  3. 作成する NASの容量と数量を入力し、 [追加] ボタンをクリックします。
    • NASボリュームのデフォルト容量は500GB~10,000GBであり、100GB単位で追加できます。
    • 以前の NASボリュームを再利用する場合、新規 NASを作成する必要はありません。以前の NASボリュームを再利用しない場合は、必ず1つ以上の NASを作成する必要があります。
    • NASは最大4つまで作成できます。
  4. Cloud Hadoop領域でエッジノードとマスターノードを選択します。
    • エッジノード数とマスターノード数は固定値なので変更できません。
  5. Cloud Hadoop領域でワーカーノードを選択し、ワーカーノードの数を選択します。
    • ワーカーノードの数は、データボックスの作成が完了した後は変更できません。
  6. Ncloud TensorFlow Serverの仕様と数を設定します。
    • Ncloud TensorFlow Server(CPU)または Ncloud TensorFlow Server(GPU)は必ず1つ以上申し込む必要があります。
  7. 追加で作成する Linuxサーバがある場合、サーバ OSと仕様、数を選択して [追加] ボタンをクリックします。
  8. 申し込み内容を確認した後、 [次へ] ボタンをクリックします。
    clouddatabox-add_new_1_ko
参考
  • 最近7日以内に返却されたデータボックスがある場合、 以前のデータボックスの NASを再利用する 項目が有効になります。 以前のデータボックスの NASを再利用する のチェックボックスをクリックすると、以前のデータボックスの NASボリュームを再利用できます。
  • 以前のデータボックスの NASは、データボックスの作成完了時に提供されるのではなく、データ供給の申し込みを完了した後、外部ネットワークとの通信がすべてブロックされた後に提供されます。

2. サービス情報入力

データボックス名を入力して Connectサーバ、Cloud Hadoop、TensorFlow(CPU/GPU)サーバのアクセス情報を設定するステップです。各サーバのアカウント名は自動で作成され、パスワードのみ設定します。データボックス名とアクセス情報を設定する方法は、次の通りです。

  1. データボックス名を入力します。
    • ハングル、英語、数字、記号「-」のみ許可し、3~20文字以内で入力
  2. Connectサーバのパスワードを入力します。
    • Connectサーバには2つのアカウントを作成
    • Connectサーバのアカウントは「ncp1」、「ncp2」で作成される
  3. Hadoopクラスタのパスワードを入力します。
    • Cloud Hadoopのアカウントは「ncp」で作成される
  4. TensorFlow(CPU/GPU)サーバのパスワードを入力します。
    • TensorFlowのアカウントは「root」で作成される
  5. 追加した Linuxサーバのパスワードを入力します。
    • Linuxサーバのアカウントは「root」で作成される
  6. 入力した内容を確認し、 [確認] ボタンをクリックします。
    clouddatabox-add_new_2_ko

3. 最終確認

前のステップで申し込んだ内容を最終確認し、データボックスの作成をリクエストするステップです。データボックスの作成が完了するまでは、数時間以上がかかることがあります。データボックスの作成が完了した後には、作成完了メールが送信されます。データ作成情報を最終確認する方法は、次の通りです。

  1. データボックス名が正常に申し込まれたか確認します。
  2. インフラサービスが正常に申し込まれたか確認します。
  3. 内容をすべて確認し、 [確認] ボタンをクリックします。