VPC環境で利用できます。
Datafence内に作成された Datafence環境(共有ストレージ)と Boxを設定・管理する方法について説明します。
Datafence環境設定
Datafenceサーバと共有ストレージを設定する方法について説明します。利用可能な設定機能は、次の通りです。
- SSL VPN設定: Datafence環境にアクセスできる SSL VPNを設定
- Datafence環境変更: Datafence環境の情報を変更
- サーバ再起動: 選択したサーバを再起動
- NAS容量変更: 共有データストレージ NASの容量を変更
- パスワード再設定: 選択したサーバアクセスアカウントのパスワードを変更
- 外部アクセス ACG設定: 外部から Datafence環境へのアクセス制御ルールを設定
- 内部通信のための ACG設定: Datafence環境内における Datafenceサーバと分析サーバ間の通信ルールを設定
- サーバイメージ作成: 選択したサーバのイメージを作成
- Cloud Hadoopへのアクセスと利用: Connectサーバから Hadoopサーバへのアクセスを設定
SSL VPN設定
Datafence環境にアクセスするには、必ず SSL VPNを利用する必要があります。Datafenceが属する VPCに SSL VPNを作成した後、その SSL VPNを指定して設定できます。
SSL VPNを設定する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブを選択し、 [SSL VPN設定] ボタンをクリックします。
- SSL VPN設定のポップアップで SSL VPNを選択し、 [はい] ボタンをクリックします。
- 選択された SSL VPNが Datafenceアクセス環境に設定されます。
Datafence環境変更
Datafenceサーバを追加、変更、削除したり、共有データストレージである NASの設定を変更できます。
Datafence環境を変更する方法は次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックし、 [Fence環境変更] ボタンをクリックします。
- Datafence環境変更のポップアップで、 Datafence環境作成(共有ストレージ) のステップに必要な情報を変更し、 [次へ] ボタンをクリックします。
- MY Datafenceサーバ
- サーバ追加: 希望する OSタイプ、サーバイメージ、仕様、数量を入力した後、 [追加] ボタンをクリック
- サーバ変更: 登録されたサーバ情報の中で変更可能な項目をクリックして情報を変更
- サーバ削除: 削除したいサーバの [削除] ボタンをクリック
- 共有データの保存
- ボリューム追加: 共有データストレージの容量と数量を入力した後、 [追加] ボタンをクリック
- ボリューム削除: 削除したい NASボリュームの [削除] ボタンをクリック
- メモ: 必要に応じて50文字以内のメモを入力
- MY Datafenceサーバ
- アクセス情報設定のステップで、サーバのアクセスアカウントのパスワードを入力し、 [次へ] ボタンをクリックします。
- 英大小文字、数字、記号を組み合わせて8~14文字を入力できます。記号のうち、引用符、バックティック、₩、/、&、$、スペースは使用できません。
- 追加されたサーバがない場合は、このステップを省略できます。
- 変更した内容を確認し、 [完了] ボタンをクリックします。
- 入力した内容に基づいて Datafenceの設定が変更されます。
サーバ再起動
分析対象データを管理する Datafenceサーバを選択して再起動する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックし、希望する Datafenceサーバを選択した後、 [サーバ再起動] ボタンをクリックします。
- サーバ再起動のポップアップで [はい] ボタンをクリックします。
- 選択したサーバの再起動が開始されます。
NAS容量変更
共有データストレージである NASの容量を変更する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックし、希望する NASボリュームを選択した後、 [NAS容量変更] ボタンをクリックします。
- NAS容量変更のポップアップで変更する容量を入力し、 [確認] ボタンをクリックします。
- NASの容量が入力された通りに変更されます。
パスワード再設定
Datafenceサーバにアクセスするために使用するアカウントのパスワードを変更する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックし、希望する Datafenceサーバを選択した後、 [パスワード再設定] ボタンをクリックします。
- パスワード再設定のポップアップで新しいパスワードを入力します。
- 英大小文字、数字、記号を組み合わせて8~14文字を入力できます。記号のうち、引用符、バックティック、₩、/、&、$、スペースは使用できません。
- [確認] ボタンをクリックします。
外部アクセス ACG設定
Datafenceサーバにはパブリック IPアドレスが割り当てられて外部からアクセスできますが、セキュリティのために ACG(アクセス制御グループ)でアクセスをブロックします。
特定の外部サーバから Datafenceにアクセスする場合は、ACGルールを設定して当該サーバのアクセスを許可してください。ACGルールを設定する方法は、次の通りです。
外部アクセスを許可すると、データが漏洩する経路として使用される可能性があるため、特別な場合に限って使用してください。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックした後、 [外部 → Fenceサーバアクセス ACGルール設定] ボタンをクリックします。
- 確認事項を確認して同意の上、アクセス許可ルールを設定します。
- ルール追加: プロトコル、アクセスソースの IPアドレス、許可ポート、メモを入力し、 [追加] ボタンをクリック
- ルール削除: 入力した情報リストから [削除] ボタンをクリック
- ご希望通りの設定が完了したら、 [確認] ボタンをクリックします。
内部通信 ACG設定
Datafence内の Datafenceサーバと Box内のサーバは基本的に相互通信がブロックされています。
Boxにあるサーバのログ情報やその他の設定値の通信が必要な場合は、ACGルールを設定して内部通信を許可できます。
Datafence内部で Datafenceサーバと Box間の通信を設定する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックした後、 [Fence環境 ↔ データボックス間の通信のための ACGルール設定] ボタンをクリックします。
- 確認事項を確認して同意の上、アクセス許可ルールを設定します。
- ルール追加: 送信方向、プロトコル、許可ポート、メモを入力し、 [追加] ボタンをクリック
- Boxの数に関係なく、Datafence領域と Box領域を対象に入力した特定のポートが開きます。
- ルール削除: 入力した情報リストから [削除] ボタンをクリック
- ルール追加: 送信方向、プロトコル、許可ポート、メモを入力し、 [追加] ボタンをクリック
- ご希望通りの設定が完了したら、 [確認] ボタンをクリックします。
サーバイメージ作成
Datafenceサーバイメージを作成する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックし、希望する Datafenceサーバを選択した後、 [マイサーバイメージ] ボタンをクリックします。
- サーバイメージ作成のポップアップでサーバ情報を確認し、 [作成] ボタンをクリックします。
- サーバイメージが作成されます。
Box設定
Datafence環境に含まれる Boxを設定する方法について説明します。利用可能な設定機能は、次の通りです。
Box追加
Datafence環境内に新しい Boxを追加する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックし、データボックス領域で [Box追加] ボタンをクリックします。
- Box追加のポップアップで、分析環境作成ステップで情報を入力し、 [次へ] ボタンをクリックします。
- Connect Server/Tensorflow Server/Server: 希望するサーバイメージ、仕様、ストレージ容量、数量を入力した後、 [追加] ボタンをクリック
- Hadoop Cluster: ノード別仕様、ストレージ容量、数量を入力した後、 [追加] ボタンをクリック
- NAS: 容量、数量を入力した後、 [追加] ボタンをクリック
- メモ: 必要に応じて50文字以内のメモを入力
参考各インフラの提供仕様および制限は、Datafence作成時の分析用 Box環境の提供仕様と同じです。
- Boxアクセス情報設定のステップで、サーバのアクセスアカウントのパスワードを入力し、 [次へ] ボタンをクリックします。
- 英大小文字、数字、記号を組み合わせて8~14文字を入力できます。記号のうち、引用符、バックティック、₩、/、&、$、スペースは使用できません。
- 入力した内容を確認し、 [完了] ボタンをクリックします。
- Boxが作成されます。
Box変更
既存の Box情報を変更する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックし、希望する Boxを選択した後、 [Box変更] ボタンをクリックします。
- Box変更のポップアップで、分析環境作成ステップで希望する情報を変更し、 [次へ] ボタンをクリックします。
- Connect Server/Tensorflow Server/Server
- サーバ追加: 希望するサーバイメージ、仕様、ストレージ容量、数量を入力した後、 [追加] ボタンをクリック
- サーバ変更: 登録されたサーバ情報の中で変更可能な項目をクリックして情報を変更
- サーバ削除: 削除したいサーバの [削除] ボタンをクリック
- Hadoop Cluster
- クラスタ追加: ノード別仕様、ストレージ容量、数量を入力した後、 [追加] ボタンをクリック
- クラスタ変更: 登録されたクラスタ情報の中で変更可能な項目をクリックして情報を変更
- クラスタ削除: 削除したいクラスタの [削除] ボタンをクリック
- NAS
- ボリューム追加: 容量、数量を入力した後、 [追加] ボタンをクリック
- ボリューム削除: 削除したいボリュームの [削除] ボタンをクリック
- メモ: 必要に応じて50文字以内のメモを入力
- Connect Server/Tensorflow Server/Server
- Boxアクセス情報設定のステップで、サーバのアクセスアカウントのパスワードを入力し、 [次へ] ボタンをクリックします。
- 英大小文字、数字、記号を組み合わせて8~14文字を入力できます。記号のうち、引用符、バックティック、₩、/、&、$、スペースは使用できません。
- 追加されたサーバがない場合は、このステップを省略できます。
- 入力した内容を確認し、 [完了] ボタンをクリックします。
- 入力した内容に基づいて Boxの設定が変更されます。
Box削除
Box環境内で不要な Boxを削除する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックし、希望する Boxを選択した後、 [Box削除] ボタンをクリックします。
- 削除のポップアップで、 [確認] ボタンをクリックします。
- 削除が完了すると Boxはリストから消えます。
Box詳細画面
Boxの詳細画面にアクセスすると、外部ネットワークのブロック有無、共有データの閲覧有無を設定したり、現在のステータスを確認できます。Box内に作成されたインフラ別プロパティを変更することもできます。
My Datafence画面で希望する Datafence名のタブをクリックした後、Boxリストの中から希望する Boxの [表示] ボタンをクリックします。
Box詳細画面は以下のように構成されています。

| 領域 | 説明 |
|---|---|
| ① ステータス表示領域 | Boxに適用されたプロパティと運用ステータスを確認
|
| ② インフラリスト領域 | Box内に作成されたインフラリストの領域
|
外部通信の許可とブロック
分析対象データを管理するためのネットワークを設定します。Boxは基本的にインターネット通信がブロックされますが、分析環境設定中にインターネット接続が必要な場合は、一時的に外部通信を許可してからセキュリティのために再びブロックできます。
外部ネットワークを許可またはブロックする方法は、次の通りです。
外部通信を許可すると、データが漏洩する経路として使用される可能性があるため、特別な場合に限って使用してください。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックし、データボックス領域でリスト内の [表示] ボタンをクリックします。
- Box詳細表示画面の上部にあるネットワーク遮断ステータスのドロップダウンリストボタンをクリックします。
- 外部通信の許可またはブロック有無を選択します。
共有データ閲覧ステータスの変更
分析対象データは、データグループごとに閲覧する機能にて各 Boxにマウントされます。
Datafence管理者は、アナリストの閲覧リクエストを受けたり、タスク実行中に必要に応じて共有データの閲覧有無を変更できます。
共有データの閲覧ステータスを変更する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックし、データボックス領域でリスト内の [表示] ボタンをクリックします。
- Box詳細表示画面上部の共有データ閲覧で [変更] ボタンをクリックします。
- 共有データ閲覧ステータス変更のポップアップで、データグループごとに閲覧有無を設定します。
- [確認] ボタンをクリックします。
- データグループの閲覧ステータスおよび件数が変更されます。
サーバ再起動
Box内の Connectサーバ、TensorFlowサーバ、Linuxサーバの中から選択したサーバを再起動する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックし、データボックス領域でリスト内の [表示] ボタンをクリックします。
- Box詳細表示画面のインフラリストから希望するサーバを選択し、 [サーバ再起動] ボタンをクリックします。
- サーバ再起動のポップアップで [確認] ボタンをクリックします。
- 選択したサーバの再起動が開始されます。
NAS容量変更
Box内の個別ストレージである NASの容量を変更する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックし、データボックス領域でリスト内の [表示] ボタンをクリックします。
- Box詳細表示画面のインフラリストから希望する NASを選択し、 [NAS容量変更] ボタンをクリックします。
- NAS容量変更のポップアップで変更する容量を入力し、 [確認] ボタンをクリックします。
- NASの容量が入力された通りに変更されます。
パスワード再設定
Box内の各サーバおよび Hadoopクラスタにアクセスするために使用するアカウントのパスワードを変更する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックし、データボックス領域でリスト内の [表示] ボタンをクリックします。
- Box詳細表示画面のインフラリストから希望するインフラを選択し、 [パスワード再設定] ボタンをクリックします。
- パスワード再設定のポップアップで新しいパスワードを入力します。
- 英大小文字、数字、記号を組み合わせて8~14文字を入力できます。記号のうち、引用符、バックティック、₩、/、&、$、スペースは使用できません。
- [確認] ボタンをクリックします。
ACG例外設定
Boxはセキュリティのため、基本的に外部からのアクセスがブロックされています。
例外的に特定の外部サーバから Boxにアクセスできるようにするには、ACGルールを設定してアクセスを許可する必要があります。ACGルールを設定する方法は、次の通りです。
外部アクセスを許可すると、データが漏洩する経路として使用される可能性があるため、特別な場合に限って使用してください。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックし、データボックス領域でリスト内の [表示] ボタンをクリックします。
- Box詳細表示画面で [ACG例外設定] ボタンをクリックします。
- 確認事項を確認して同意の上、アクセス許可ルールを設定します。
- ルール追加: 送信方向、プロトコル、アクセスソースの IPアドレス、許可ポート、メモを入力し、 [追加] ボタンをクリック
- ルール削除: 入力した情報リストから [削除] ボタンをクリック
- ご希望通りの設定が完了したら、 [確認] ボタンをクリックします。
サーバイメージ作成
Box内のサーバイメージを作成する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Datafenceメニューを順にクリックします。 - My Datafenceメニューをクリックします。
- 設定する Datafence名のタブをクリックし、データボックス領域でリスト内の [表示] ボタンをクリックします。
- Box詳細表示画面のインフラリストから希望するサーバを選択し、 [マイサーバイメージ] ボタンをクリックします。
- サーバイメージ作成のポップアップでサーバ情報を確認し、 [作成] ボタンをクリックします。
- サーバイメージが作成されます。
Boxアクセス
アナリストは対象データの分析のために渡された Box情報で Boxにアクセスします。Boxへのアクセス方法と Box内部の分析環境へのアクセス方法をご案内します。
Boxへのアクセスの前に SSL VPN接続が必要です。
SSL VPNを接続する方法は、次の通りです。
- SSL VPN Agentをインストールします。
- SSL VPN Agentをインストールする方法は、SSL VPNご利用ガイド(VPC)の SSL VPN Agentをインストールするをご参照ください。
- BIG-IP Edge Clientを実行します。
- BIG-IP Edge Clientにアクセスする方法は、SSL VPNご利用ガイド(VPC)の SSL VPN Agentにアクセスをご参照ください。
- 登録した Username、Passwordを入力し、 [ログオン] ボタンをクリックします。
- 携帯電話またはメールに転送された OTP番号を入力し、 [ログオン] ボタンをクリックします。
Connect Serverアクセス
Boxにインストールした Cloud Hadoopと TensorFlow、Linux、Windows Serverを利用するには、Connect Serverにアクセスする必要があります。Connect Serverへのアクセス方法をご案内します。
- Connectサーバは Windowsベースなので、Connect Serverにアクセスするために PCのリモートデスクトップ接続を実行します。
- Connect Serverの IPアドレスを入力した後、 [接続] ボタンをクリックしてユーザー名とパスワードを入力します。
データストレージ確認
すべての Connect Serverには同じフォルダに NASがマウントされ、マウントの場所は以下のルールに従います。NAS名は Boxの詳細を見るで確認できます。
- ファイルの持ち込み/持ち出し申込用 NAS: C:\mount\NAS名
- 共有ストレージ NAS: C:\mount\nasr\NAS名
Connect/Windows Server NAS使用上の注意事項
現在、Connect Serverと Windows Serverで NASは限定的に使用可能です。以下の項目を十分にご検討のうえ、使用してください。
文字エンコード方式不一致
Datafenceで提供する NASは、Linuxサーバで使用可能な NFSプロトコルを使用します。
Linuxと Windowsの相互の OS間に使用するエンコード方式が異なるので、以下の問題が発生することがあります。
- ファイル名を韓国語で作成した場合、各 OSでファイル名が正確でないことがあります。
- Connect/Windowsで NASにファイルを作成する場合、ファイル名を韓国語で作成するとファイル名が不明な形式で表示されます。
- Linuxで NASにファイルを作成する場合、ファイル名を韓国語で作成すると Connect/Windowsでファイル名が不明な形式で表示されます。
- ファイルの持ち込み時にファイル名が韓国語の場合、Connect/Windowsではファイル名が不明な形式で表示されます。
- ファイルの持ち出し時にファイル名は、Linuxで表示されるファイル名が基準です。Connect/Windowsで作成したファイル名が韓国語のファイルは、Linuxで不明な形式で表示されるので持ち出しはできません。
- Connect/Windowsと Linuxの改行文字の差によってファイル内容が各々異なることがあります。
ファイルとフォルダで使用可能なアクション
Connect/Windows Serverで NASのファイルとフォルダに対して使用可能なアクションは、次の通りです。
ファイル
| GUI (file explorer) | コマンドプロンプト | |
|---|---|---|
| 作成 | O(名前指定不可) | O |
| 読み取り | O | O |
| コピー | O | O |
| 移動 | O | O |
| 削除 | O | O |
| 名前変更 | X | O |
| ファイル内容の変更 | O | - |
フォルダ
| GUI (file explorer) | コマンドプロンプト | |
|---|---|---|
| 作成 | O(名前指定不可) | O |
| コピー | O | O |
| 移動 | O | X |
| 削除 | O | O |
| 名前変更 | X | X |
Cloud Hadoopへのアクセスと利用
Connect Serverで Hadoopにアクセスするための SSH設定は、次の2つのステップを経る必要があります。
- 認証キーを変換
- クラスタノードにアクセス
認証キーを変換
- Connect Serverにアクセスし、PuTTYgenを実行します。
- Type of key to generateで RSAを選択し、 [Load] ボタンをクリックします。
- Users > Public > Desktopにある databox.pemを選択し、openをクリックします。
- pem形式のファイルを検索するには、すべてのタイプのファイルを表示するオプションを選択します。
- 完了の確認ポップアップの内容を確認し、 [OK] ボタンをクリックします。
- [Save private key] ボタンをクリックし、PuTTYで使用できる ppk形式のファイルで保存します。
- PuTTYgenでパスワードなしのキー保存に関する警告が表示されたら、 [Yes] ボタンをクリックします。
- 過去に作成した認証キーと同じ名前で保存します。PuTTYが自動で.ppkファイル拡張子を追加します。
Hadoopノード SSHアクセス
- Connect Serverにアクセスし、PuTTYを実行します。
- Categoryポップアップで Sessionを選択し、各設定項目に以下のように入力します。
- HostName(or IP address) : sshuser@HadoopIP
- Hadoopの IPアドレスは Boxの詳細を見るで確認できます。
- Port : 22
- Categoryウィンドウで Connection > SSH > Auth > Credentialsを選択します。
- Private key file for authenticationで、 [Browse] ボタンをクリックして pemファイルを変換して作成した ppkファイルを選択し、 [Open] ボタンをクリックします。
- 次のように Hadoopに正常にアクセスされたか確認します。
