VPC環境で利用できます。
分類子(Classifier)は、非構造化データのスキャン時にスキーマを決定するための分類機能を提供します。スキャナーは分類子を設定しなくても、CSV、JSON、XMLなどのファイルのスキーマを自動的に推論します。なお、分類子を設定するとフォーマットのないファイルのデータを指定した形式で推測したり、特定のデータのみでメタデータを作成したりすることもできます。Classifierメニューでは分類子を作成し管理できます。
分類子作成
分類子を作成する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Data Catalogメニューを順にクリックします。 - Configuration > Classifierメニューを順にクリックします。
- [分類子作成] ボタンをクリックします。
- 分類子作成のポップアップが表示されたら、分類子情報を入力します。
- 名前: 分類子の名前
- タイプ: データファイルの形式
- 区分設定: データファイル形式に応じて区分設定を入力します。
- CSV: データの列入力項目を区分する区分記号を選択
- JSON: 指定したデータのみでメタデータを作成するように Pathを指定
- 例)
$.store.: storeフィールドを指定 - 例)
$.store.book[*].author: storeフィールドの下位にある bookフィールドの下位にある authorフィールドを指定
- 例)
- XML: 指定した Nodeデータのみでメタデータを作成するように Row Tagを指定
- [作成] ボタンをクリックします。
分類子検索と情報確認
作成した分類子を検索して情報を確認する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Data Catalogメニューを順にクリックします。 - Configuration > Classifierメニューを順にクリックします。
- 検索窓に分類子名を入力した後、
をクリックして分類子を検索し、情報を確認します。
- タイプ: データファイルの形式
- 名前: 分類子の名前
- 詳細: 分類子作成時に入力した区分設定
- 作成日時: 分類子の作成日時
- アップデート日時: 直近に分類子情報を変更した日時
分類子変更
作成した分類子情報を変更する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Data Catalogメニューを順にクリックします。 - Configuration > Classifierメニューを順にクリックします。
- 変更する分類子をクリックして選択し、 [変更] ボタンをクリックします。
- 分類子変更のポップアップが表示されたら、分類子の情報を変更します。
- 各項目の詳細は、分類子作成をご参照ください。
- [変更] ボタンをクリックします。
分類子削除
作成した分類子を削除する方法は、次の通りです。
注意
- 分類子を削除する場合、分類子に接続されたスキャナーが正常動作しないことがあります。
- 削除した分類子は復旧できません。
- NAVERクラウドプラットフォームコンソールの VPC環境で、
> Services > Big Data & Analytics > Data Catalogメニューを順にクリックします。 - Configuration > Classifierメニューを順にクリックします。
- 削除する分類子をクリックして選択し、 [削除] ボタンをクリックします。
- お知らせのポップアップが表示されたら、注意事項を確認して [削除] ボタンをクリックします。