Classifier

Prev Next

VPC環境で利用できます。

分類子(Classifier)は、非構造化データのスキャン時にスキーマを決定するための分類機能を提供します。スキャナーは分類子を設定しなくても、CSV、JSON、XMLなどのファイルのスキーマを自動的に推論します。なお、分類子を設定するとフォーマットのないファイルのデータを指定した形式で推測したり、特定のデータのみでメタデータを作成したりすることもできます。Classifierメニューでは分類子を作成し管理できます。

分類子作成

分類子を作成する方法は、次の通りです。

  1. NAVERクラウドプラットフォームコンソールの VPC環境で、i_menu > Services > Big Data & Analytics > Data Catalogメニューを順にクリックします。
  2. Configuration > Classifierメニューを順にクリックします。
  3. [分類子作成] ボタンをクリックします。
  4. 分類子作成のポップアップが表示されたら、分類子情報を入力します。
    • 名前: 分類子の名前
    • タイプ: データファイルの形式
    • 区分設定: データファイル形式に応じて区分設定を入力します。
      • CSV: データの列入力項目を区分する区分記号を選択
      • JSON: 指定したデータのみでメタデータを作成するように Pathを指定
        • 例) $.store.: storeフィールドを指定
        • 例) $.store.book[*].author: storeフィールドの下位にある bookフィールドの下位にある authorフィールドを指定
      • XML: 指定した Nodeデータのみでメタデータを作成するように Row Tagを指定
  5. [作成] ボタンをクリックします。

分類子検索と情報確認

作成した分類子を検索して情報を確認する方法は、次の通りです。

  1. NAVERクラウドプラットフォームコンソールの VPC環境で、i_menu > Services > Big Data & Analytics > Data Catalogメニューを順にクリックします。
  2. Configuration > Classifierメニューを順にクリックします。
  3. 検索窓に分類子名を入力した後、i-datacatalog-searchをクリックして分類子を検索し、情報を確認します。
    • タイプ: データファイルの形式
    • 名前: 分類子の名前
    • 詳細: 分類子作成時に入力した区分設定
    • 作成日時: 分類子の作成日時
    • アップデート日時: 直近に分類子情報を変更した日時

分類子変更

作成した分類子情報を変更する方法は、次の通りです。

  1. NAVERクラウドプラットフォームコンソールの VPC環境で、i_menu > Services > Big Data & Analytics > Data Catalogメニューを順にクリックします。
  2. Configuration > Classifierメニューを順にクリックします。
  3. 変更する分類子をクリックして選択し、 [変更] ボタンをクリックします。
  4. 分類子変更のポップアップが表示されたら、分類子の情報を変更します。
  5. [変更] ボタンをクリックします。

分類子削除

作成した分類子を削除する方法は、次の通りです。

注意
  • 分類子を削除する場合、分類子に接続されたスキャナーが正常動作しないことがあります。
  • 削除した分類子は復旧できません。
  1. NAVERクラウドプラットフォームコンソールの VPC環境で、i_menu > Services > Big Data & Analytics > Data Catalogメニューを順にクリックします。
  2. Configuration > Classifierメニューを順にクリックします。
  3. 削除する分類子をクリックして選択し、 [削除] ボタンをクリックします。
  4. お知らせのポップアップが表示されたら、注意事項を確認して [削除] ボタンをクリックします。