VPC環境で利用できます。
Cloud Data Boxご利用の申し込みを完了した後は、データボックスを作成できます。データボックスの作成時には、データボックスを使用するための分析サービスと分析サービスにアクセスするためのサーバを設定します。
1. インフラサービス選択
データボックスを使用するには、Cloud Hadoop、TensorFlowなどの分析サービスと分析サービスにアクセスするための Connectサーバを選択する必要があります。
- Connectサーバ: Windows OSが提供されるサーバとして、Connectサーバの Puttyを用いて Cloud Hadoopと Ncloud TensorFlow Serverにアクセスできます。また、Connectサーバのウェブブラウザで ambari、zeppelin、jupyter Notebookなどを利用できます。
- SSL VPN: 提供されるサーバにアクセスするには、必ず SSL VPNを利用する必要があります。
- NAS: 外部ネットワークとの通信がブロックされた後、外部からファイルを持ち込んだり、分析結果を外部に持ち出すために使用します。NASは Cloud Hadoop、TensorFlow CPUと TensorFlow GPU、リナックスサーバにすべてマウントされて提供されるので、Cloud Hadoopと Ncloud TensorFlow Serverと Linuxサーバ間で簡単にファイルを共有できます。
データボックスを作成する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Cloud Data Boxメニューを順にクリックします。 - [データボックスの申し込み] ボタンをクリックします。
- データを分析するインフラ環境を設定する画面が表示されます。
- Connectサーバの仕様と台数を選択します。
- Connectサーバ1台につき2つのユーザーアカウントを作成でき、最大2人が同時にアクセスできますので、アナリストの人数に合わせて Connectサーバの数を選択します。
- 必要な SSL VPNアカウント数を選択します。
- SSL VPN接続時にメール認証または携帯電話認証が必要なため、ユーザーごとに1つの SSL VPNアカウントを申し込む必要があります。
- SSL VPNは Connectサーバの3倍まで申し込みできます。
- 作成する NASの容量と数量を入力し、 [追加] ボタンをクリックします。
- NASボリュームのデフォルト容量は500GB~10,000GBであり、100GB単位で追加できます。
- 以前の NASボリュームを再利用する場合、新規 NASを作成する必要はありません。以前の NASボリュームを再利用しない場合は、必ず1つ以上の NASを作成する必要があります。
- NASは最大4つまで作成できます。
- Cloud Hadoop領域でエッジノードとマスターノードを選択します。
- エッジノード数とマスターノード数は固定値なので変更できません。
- Cloud Hadoop領域でワーカーノードを選択し、ワーカーノードの数を選択します。
- ワーカーノードの数は、データボックスの作成が完了した後は変更できません。
- Ncloud TensorFlow Serverの仕様と数を設定します。
- Ncloud TensorFlow Server(CPU)または Ncloud TensorFlow Server(GPU)は必ず1つ以上申し込む必要があります。
- 追加で作成する Linuxサーバがある場合、サーバ OSと仕様、数を選択して [追加] ボタンをクリックします。
- 申し込み内容を確認した後、 [次へ] ボタンをクリックします。

参考
- 最近7日以内に返却されたデータボックスがある場合、 以前のデータボックスの NASを再利用する 項目が有効になります。 以前のデータボックスの NASを再利用する のチェックボックスをクリックすると、以前のデータボックスの NASボリュームを再利用できます。
- 以前のデータボックスの NASは、データボックスの作成完了時に提供されるのではなく、データ供給の申し込みを完了した後、外部ネットワークとの通信がすべてブロックされた後に提供されます。
2. サービス情報入力
データボックス名を入力して Connectサーバ、Cloud Hadoop、TensorFlow(CPU/GPU)サーバのアクセス情報を設定するステップです。各サーバのアカウント名は自動で作成され、パスワードのみ設定します。データボックス名とアクセス情報を設定する方法は、次の通りです。
- データボックス名を入力します。
- ハングル、英語、数字、記号「-」のみ許可し、3~20文字以内で入力
- Connectサーバのパスワードを入力します。
- Connectサーバには2つのアカウントを作成
- Connectサーバのアカウントは「ncp1」、「ncp2」で作成される
- Hadoopクラスタのパスワードを入力します。
- Cloud Hadoopのアカウントは「ncp」で作成される
- TensorFlow(CPU/GPU)サーバのパスワードを入力します。
- TensorFlowのアカウントは「root」で作成される
- 追加した Linuxサーバのパスワードを入力します。
- Linuxサーバのアカウントは「root」で作成される
- 入力した内容を確認し、 [確認] ボタンをクリックします。

3. 最終確認
前のステップで申し込んだ内容を最終確認し、データボックスの作成をリクエストするステップです。データボックスの作成が完了するまでは、数時間以上がかかることがあります。データボックスの作成が完了した後には、作成完了メールが送信されます。データ作成情報を最終確認する方法は、次の通りです。
- データボックス名が正常に申し込まれたか確認します。
- インフラサービスが正常に申し込まれたか確認します。
- 内容をすべて確認し、 [確認] ボタンをクリックします。