データセットの作成と管理

Prev Next

Classic/VPC環境で利用できます。

データセットの作成と管理では、データセット構成時の注意事項を案内し、データセットを作成、変更、アップロード、削除する方法について説明します。

データセット構成時の注意事項

AiTEMSはデータセット学習を基盤にユーザーカスタム推奨サービスを提供するため、データセットを構成することが非常に重要です。
データセット構成時の注意事項は、次の通りです。

  • データセットタイプは user、item、interactionの3つのタイプのデータセットに基づいて学習を進めます。したがって、各タイプのデータセットを必ず構成する必要があります。
    各データセットタイプについての説明は、次の通りです。
    • user(ユーザー): ユーザー情報(年齢、性別など)が含まれたメタデータ
    • item(項目): 項目に関連する情報(価格、リリース日、カテゴリなど)が含まれたメタデータ
    • Interaction(相互作用): ユーザーと項目間の相互作用によって得られた記録が盛り込まれたメタデータ
  • データセットの構成時に必須スキーマフィールドと同じフィールドを必ず構成する必要があります。
    データセットタイプ 必須フィールド(Not NULL)
    user
    item
    interaction
  • データセットフィールドはフィールド名のみでなく、フィールドの順序およびフィールド名の大文字と小文字がスキーマフィールドと一致する必要があります。
  • userデータセットと itemデータセットの必須フィールドに重複したデータ値を入力してはいけません。

データセット作成

学習に使用するデータセットを作成します。データセット名に基づいて管理でき、データセットが作成されると固有のデータセット IDが割り当てられます。

参考
  • 学習を進めるには、データセットをタイプ別にすべて作成する必要があります。
  • データセットを作成するには、アップロードするデータセットファイルが用意されている必要があります。データセットファイル構成についての詳細は、データセット構成時の注意事項をご参照ください。
  • csvまたは csv.gz形式のファイルのみデータセットファイルとして使用できます。

データセットを作成する方法は次の通りです。

  1. NAVERクラウドプラットフォームコンソールで、 Menu > Services > AI Services > AiTEMSメニューを順にクリックします。
  2. Datasetメニューをクリックします。
  3. [Dataset作成] ボタンをクリックします。
  4. Dataset作成画面が表示されたら、データセット名を入力してデータセット情報を設定します。
    • データセット名: データセットを管理する基準であり、5~20文字で入力
      • 先頭は英字にする必要があり、英数字、「_」、「-」のみ入力できます。
    • 説明: データセットについての説明を入力
    • データセットタイプ: データセットのタイプを選択(user/item/interaction)
      • データセットタイプについての詳細は、データセット構成時の注意事項をご参照ください。
      • データセットを作成した後は、データセットタイプを変更できません。
    • スキーマ選択: データセットの必須構成要素であるスキーマを選択または新たに作成
      • 作成されたスキーマがない場合、新規 Schema作成を選択して新しいスキーマを作成できます。
      • 新規 Schema作成を選択すると、新しいスキーマフィールド構成のための領域が表示されます。
    • Data選択: 学習を進めるデータセットファイルの選択方法を選択
      • Object Storageから選択: Object Storageの AiTEMSバケットにデータセットファイルがアップロードされている場合に選択
      • ファイルから選択: Object Storageの AiTEMSバケットにデータセットファイルがアップロードされていない場合に選択し、選択してファイルをアップロードする場合はバケットに自動保存
  5. スキーマ選択から新規 Schema作成を選択した場合、スキーマ情報を設定して [追加] ボタンをクリックします。
    • スキーマ名: スキーマを管理する基準であり、3~20文字で入力
    • スキーマの説明: スキーマについての説明を入力
    • フィールド名: データセットファイルのフィールド名と同じく入力
    • フィールドタイプ: 入力するデータタイプを選択(string/float/long/double/int/boolean/null)
    • カテゴリ型フィールドの有無: カテゴリが定められたデータを入力する場合、Yに設定
    • i-aitems_orderをドラッグアンドドロップでフィールドの順序を変更できます。
  6. Data選択から Object Storageから選択を選択した場合、アップロードするデータセットをクリックして選択します。
    • AiTEMSバケットにアップロードされたファイルのみ選択できます。
  7. Data選択からファイルから選択を選択した場合、マウスでファイルをドラッグするか、ここをクリックしてくださいの領域にファイルをドラッグアンドドロップするか、その領域をクリックしてファイルを選択します。
    • 選択したファイルは、バケット/パスに表示されるパスに自動アップロードされます。
  8. [作成] ボタンをクリックします。
  9. 通知のポップアップで [確認] ボタンをクリックします。
    • データセットが作成され、データセットリストに追加されます。

データセット変更

データセットの説明を変更したり、スキーマとデータセットファイルを変更できます。

参考

データセットの作成時に選択したデータセットタイプは変更できません。

データセットを変更する方法は、次の通りです。

  1. NAVERクラウドプラットフォームコンソールで、 Menu > Services > AI Services > AiTEMSメニューを順にクリックします。
  2. Datasetメニューをクリックします。
  3. データセットリストから変更するデータセットをクリックします。
  4. データセット変更のポップアップが表示されたら変更事項を適用し、 [保存とアップロード] ボタンをクリックします。
  5. データセットファイルを変更するには、データ変更のポップアップで [パスの変更とアップロード] ボタンをクリックし、変更するファイルをクリックして選択した後、 [パスの変更とアップロード] ボタンをクリックします。
    • Dataset画面の [データセットアップロード] ボタンをクリックしてデータセットファイルを変更することもできます(データセットアップロードを参照)。
  6. 通知のポップアップで [確認] ボタンをクリックします。
    • データセットファイルを変更した場合、待機中のステータスに変更され、データセットファイルアップロードの成否に応じてステータスが変更されます。

データセットアップロード

データセットファイルを変更できます。

参考
  • データセットファイルを変更するには、変更するファイルが Object Storageの AiTEMSバケットに保存されている必要があります。
  • データセット変更を通じてでもデータセットファイルを変更できます。

データセットをアップロードする方法は、次の通りです。

  1. NAVERクラウドプラットフォームコンソールで、 Menu > Services > AI Services > AiTEMSメニューを順にクリックします。
  2. Datasetメニューをクリックします。
  3. データセットリストからデータセットファイルをアップロードするデータセットをクリックします。
  4. [データセットアップロード] ボタンをクリックします。
  5. データセットアップロードのポップアップで、アップロードするデータセットファイルをクリックして選択し、 [アップロードリクエスト] ボタンをクリックします。
  6. 通知のポップアップで [確認] ボタンをクリックします。
    • 待機中のステータスに変更され、データセットファイルアップロードの成否に応じてステータスが変更されます。

データセット削除

データセットを削除する方法は、次の通りです。

参考

サービスに接続されているデータセットは削除できません。まず、当該サービスを削除するか、サービスに接続されたデータセットを変更してからデータセットを削除します。

  1. NAVERクラウドプラットフォームコンソールで、 Menu > Services > AI Services > AiTEMSメニューを順にクリックします。
  2. Datasetメニューをクリックします。
  3. データセットリストから削除するデータセットをクリックします。
  4. [削除] ボタンをクリックします。
  5. データセット削除のポップアップが表示されたらデータセット名を入力し、 [削除] ボタンをクリックします。
    • データセットが削除され、リストから消えます。