AI Forest のシナリオ
    • PDF

    AI Forest のシナリオ

    • PDF

    Article Summary

    VPC環境で利用できます。

    AI Forestを利用してHDFSにデータをアップロードしてジョブを実行するシナリオは以下のとおりです。

    ワークスペースの作成

    ワークスペースを作成する方法は以下のとおりです。

    1. NAVERクラウドプラットフォームコンソールで、Services > Big Data & Analytics > Data Forestメニューを順にクリックします。
    2. AI Forest > Workspace > [ワークスペースの作成] > [Advancedワークスペース] をクリックします。
    3. ワークスペースの設定情報を入力します。
      • アカウント名:df-test
      • ワークスペース名:ws
      • ワークスペースタイプ:Singlebatch
    4. DockerイメージはTensorFlowを選択し、イメージのバージョンはr2.3.1-py3を選択します。
      df-af-quickstart_1-4_vpc_ja
    参考

    PyTorchはPythonプログラム用オープンソース機械学習ライブラリです。詳しい内容はPyTorchの公式サイトをご参照ください。

    1. GPUモデルの名前、GPUコア数、メモリ容量はデフォルト値を選択します。
      df-af-mnist_1-5_vpc_ja
    2. データの設定領域に入力情報を入力して [追加] ボタンをクリックします。
      • 入力
        • Input Path:HDFSからコンテナにコピーされる入力データのパス。「/user/{username}/data_in」を入力
        • Input Container Local Path:コンテナにコピー後に保存されたデータのパス。「data_in」を入力
      • 出力
        • Output Path:コンテナからHDFSにコピーされる出力データのパス。「/user/{username}/data_out」を入力
        • Output Container Local Path:コンテナに保存された出力データのパス。「data_out」を入力
          df-af-quickstart_1-6_vpc_ja.png
    3. [次へ] ボタンをクリックします。ワークスペース作成が完了します。

    HDFSにデータをアップロード

    ユーザーがデータセットでモデルを直接学習させる場合、 Data Forestのワークスペース作成時に入力したInput Pathパスにデータセットが位置している必要があります。

    HDFSの以下のパスにデータをアップロードしてください。アップロードしたデータセットは、ワークスペース作成時に入力したInput Container Local Pathパスの下位にコピーされます。

    • hdfs://koya/user/{DataForestアカウント}/data_in
      df-qs_05_vpc_ja.png
    参考

    HUEアプリを利用してHDFSにデータファイルをアップロードしてダウンロードできます。詳しい説明はHDFSを使用するをご参照ください。

    ワークスペースにコードをアップロード

    ワークスペースにコードを作成する方法は以下のとおりです。

    1. NAVERクラウドプラットフォームコンソールで、Services > Big Data & Analytics > Data Forestメニューを順にクリックします。
    2. AI Forest > Workspace Browserをクリックします。
    3. アカウントとワークスペースを選択して [アップロード] ボタンをクリックします。
    4. アップロード画面が表示されたら、run.shファイルをアップロード画面にドラッグアンドドロップします。
      • run.shの作成例
        #!/bin/bash
        ls -l /data_in
        
    5. [転送開始] ボタンをクリックします。
    6. アップロードが完了したら [確認] ボタンをクリックします。

    GPUバッチジョブの提出

    1. NAVERクラウドプラットフォームコンソールで、Services > Big Data & Analytics > Data Forestメニューを順にクリックします。
    2. AI Forest > Workspace Browserをクリックします。
    3. アカウントを選択してワークスペースを選択します。
    4. シェルスクリプトファイルのrun.shファイルのチェックボックスをクリックし、[実行] ボタンをクリックします。
    5. 実行画面が表示されたらCommand項目に./run.shアプリ名aiforestを入力します。
    6. [実行] ボタンをクリックします。
      df-af-quickstart_gpubatch_vpc_ja.png
    7. 実行されたジョブと詳細情報は、AI Forest > DL Appメニューで確認できます。

    実行ログの確認

    実行ログを確認する方法は以下のとおりです。

    1. NAVERクラウドプラットフォームコンソールで、Services > Big Data & Analytics > Data Forest > Appメニューを順にクリックします。
    2. 現在実行中のアプリの詳細情報で、Quick links > AppMaster URLをクリックします。
      df-af-quickstart_log01_vpc_ja
    3. Cluster > Applicationメニューをクリックします。
    4. Name値が「aiforest」で始まるアプリケーションのIDを探してクリックします。
      df-af-quickstart_log02_vpc.png
    5. そのアプリケーションIDのLogsをクリックします。実行したアプリのログを確認できます。
      df-af-quickstart_log03_vpc.png

    この記事は役に立ちましたか?

    Changing your password will log you out immediately. Use the new password to log back in.
    First name must have atleast 2 characters. Numbers and special characters are not allowed.
    Last name must have atleast 1 characters. Numbers and special characters are not allowed.
    Enter a valid email
    Enter a valid password
    Your profile has been successfully updated.