Data Box Frame の作成

Prev Next

VPC環境で利用できます。

Data Box Frameご利用の申し込みが完了したら、Data Box Frameを作成できます。Data Box Frameは、Data Box Frameを管理する管理者が使用する Admin環境とアナリストが使用する分析環境に区分されます。

Data Box Frame の作成

NAVERクラウドプラットフォームコンソールの i_menu > Services > Big Data & Analytics > Data Box Frameページで [データボックスフレーム作成] ボタンをクリックした後、以下の手順を経て新規 Data Box Frameを作成できます。

1.Admin環境作成

Data Box Frameの管理者は、Admin環境を通して分析対象のデータを管理できます。Adminがアクセスするための Adminサーバと共有データが保存される共有データストレージの設定を行います。Data Box Frameの管理のために、必ず1台以上の Adminサーバと共有データのストレージが必要です。

databoxframe-add_add-1_ko

  • Adminサーバ
    • Ubuntu、CentOSをベースイメージとして選択でき、共有データのストレージがマウントされています。
    • Adminサーバの数は最小1台で、最大4台まで作成できます。
  • 共有データの保存
    • 共有データのストレージは Adminサーバと各ボックス内部の Ncloud Tensorflow Server、Linux Server、Hadoop Clusterにマウントされて提供されるので、ファイルを簡単に共有できます。
    • 共有データのストレージは最小1台で最大20台まで利用可能で、500GB~10,000GBを使用できます。作成後に容量を変更できます。
注意

Data Box Frame内の作成できる NAS(共有データのストレージと分析環境の NAS)ボリュームの総容量の合算は最大10TBまで可能で、それ以上必要な場合にお問い合わせにて要請してください。

  • メモ
    • Data Box Frameに関するメモを作成します。
  • インフラ管理権限
    • インフラ管理権限拡大を通じてサーバ管理権限の引き上げとネットワークルールについての別途管理が可能です。
注意

管理者が設定したネットワークルールが公開される場合、データ流出リスクが存在します。データ流出時に顧客と会社の責任範囲は、Data Box Frameサービス約款をご参照ください。

2.分析用 Box環境作成

アナリストは、分析環境を通じて Data Box Frameの管理者が提供するデータとカスタムデータを分析できます。データボックスは、必ず Data Box Frameが1つ以上のものが必要です。
分析環境作成ステップで、ボックス数とインフラ設定を行えます。ボックスは必ず1台以上の Connect Server、Ncloud Tensorflow Server、NASを含める必要があります。

databoxframe-add_add-2_ko

  • Connect Server
    • Windows OSが提供されるサーバとして、Connectサーバの Puttyを用いて Cloud Hadoopと Ncloud TensorFlow Serverにアクセスできます。また、Connectサーバのウェブブラウザで Ambari、Zeppelin、Jupyter Notebookなどを利用できます。
    • Connect Serverの数は最小1台で、最大4台まで作成できます。
  • Ncloud Tensorflow Server
    • Jupyter Notebookが提供されるサーバとして CPU、GPUタイプを選択できます。
    • Ncloud Tensorflow Serverの数はタイプとは関係なく最小1台で、最大4台まで作成できます。
  • Cloud Hadoop
    • Cloud Hadoopクラスタが提供され、1つのクラスタごとに Edgeノード1台、Masterノード2台、Workerノード2~8台を提供します。
    • Hadoopの数は最小0台で、最大2台まで作成できます。
  • サーバ
    • ボックス内部で便利な使用のために CentOSまたは Ubuntuをイメージとして使用する Linuxサーバを提供します。
    • サーバの数は最小0台で、最大4台まで作成できます。
  • NAS
    • 外部ネットワークとの通信が遮断された後に外部からファイルを持ち込むか、分析結果を外部に持ち出すために使用します。NASは Cloud Hadoop、TensorFlow CPUと TensorFlow GPU、Linuxサーバにすべてマウントされて提供されるので、Cloud Hadoopと Ncloud TensorFlow Serverおよび Linuxサーバ間で簡単にファイルを共有できます。
    • NASの数は最小1台で、最大4台まで利用可能で、各 NASは500GB~10,000GBの容量を割り当てられます。
注意

Frame内で作成できる NAS(共有データのストレージと分析環境の NAS)ボリュームの総容量合計は最大10TBまで可能であり、それ以上必要な場合にはお問い合わせにて要請してください。

  • SSL VPN
    • ボックス環境にアクセスするには、必ず SSL VPNを利用する必要があります。
    • SSL VPNは最小1つで、最大 Connect Serverの3倍数だけ作成できます。
  • メモ
    • Data Box Frameに含まれているボックスに関するメモを作成します。
参考
  • Block Storageとは、基本提供ストレージと別途の追加提供ブロックストレージを意味します。
  • 追加ブロックストレージの使用方法は、ブロックストレージを使用するをご参照ください。

3.Boxアクセス情報設定

Data Box Frame名を入力し、Admin環境と各分析環境(ボックス)のアクセス情報を設定するステップです。各サーバのアカウント名は自動で作成され、パスワードのみ設定します。

databoxframe-add_add-3_ko

  • Admin環境設定
    • Data Box Frame名
    • Adminサーバのパスワード
    • 持ち出し審査用 Object Storageの Bucket名
  • 分析環境設定
    • Connect Serverのパスワード
    参考

    インフラ管理権限の拡大時に Connect Serverに Administrator権限を持つ ncp-adminアカウントを付与されることができます。当該アカウントの使用時にご注意ください。

    • Ncloud Tensorflow Serverのパスワード

4.最終確認

前のステップで申し込んだ内容を最終確認し、Data Box Frameの作成をリクエストするステップです。Data Box Frameの作成が完了するまでは、数時間以上がかかることがあります。Data Box Frameの作成が完了した後には、作成完了メールが送信されます。Data Box Frameの作成情報を最終確認する方法は、次の通りです。

databoxframe-add_add-4_ko

  • Data Box Frameの基本情報を確認します。
  • Data Box Frameの Admin環境を確認します。
  • Data Box Frameの Box情報を確認します。
  • 内容をすべて確認し、 [確認] ボタンをクリックします。
参考

作成前に申し込んだ総インフラ規模 Downloadsを通じて Data Box Frameのインフラ情報をダウンロードできます。