Scanner

印刷する
共有
PDF

Scanner

印刷する
共有
PDF

Article Summary

Share feedback

Thanks for sharing your feedback!

VPC環境で利用できます。

スキャナー(Scanner)はソースデータのスキーマを推測し、分類子を活用してデータに合わせたテーブルを作成します。スキャナーの実行周期を設定すると、定期的にデータを収集してメタデータを最新状態にアップデートできます。 Scanner メニューではスキャナーを作成し、実行・管理できます。

Scanner画面

Data Catalog利用のための Scanner メニューの基本的な説明は、次の通りです。

datacatalog-scanner_screen_ko

領域	説明
① メニュー名	現在確認中のメニュー名、照会中のスキャナー数
② 基本機能	Scannerメニューに初回アクセスすると表示される機能 [スキャナー作成] ボタン: クリックしてスキャナーを作成(スキャナー作成を参照) [サービスの詳細を見る] ボタン: クリックして Data Catalogの紹介ページに移動 [更新] ボタン: クリックしてスキャナーリストを更新
③ 作成後の機能	スキャナー作成後に有効になる機能 [実行] ボタン: クリックしてスキャナーを実行(スキャナー実行を参照) [変更] ボタン: クリックしてスキャナー設定を変更(スキャナー変更を参照) [削除] ボタン: クリックしてスキャナーを削除(スキャナー削除を参照) [実行管理] ボタン: クリックしてスキャナー実行管理メニューを表示
④ 検索ボックス	スキャナー名または説明でスキャナーを検索
⑤ スキャナーリスト	照会中のスキャナーリストとして、クリックして詳細情報を確認
⑥ 情報タブ	各タブをクリックして確認するスキャナー情報を選択

スキャナー作成

メタデータを収集するソースデータとスキャン実行オプション情報を設定してスキャナーを作成できます。スキャナーを作成する方法は、次の通りです。

NAVERクラウドプラットフォームコンソールで、 Services > Big Data & Analytics > Data Catalog メニューを順にクリックします。
Scanner メニューをクリックします。
[スキャナー作成] ボタンをクリックします。
スキャンするソースデータの情報を入力します。
- データタイプ : データソースを選択
- コネクション : データソースに接続するためのコネクションを選択
  - [コネクション作成] ボタンをクリックし、コネクションを作成できます。詳細は、コネクション作成をご参照ください。
  - データタイプが Cloud DB類の場合、コネクションを選択すると [接続テスト] ボタンが表示されます。必ず [接続テスト] ボタンをクリックし、接続を確認します。
- パス : スキャンするソースデータのパスを入力
  - 入力したパスのサブパスに対してスキャンを実行します。
  - ソースデータタイプが Cloud DB類の場合、スキャンするテーブル名を入力します。
    - %を入力すると、全データベースをスキャンしてテーブルごとにメタデータテーブルを作成します。
実行オプションを入力します。
- 実行周期 : スキャンを実行する周期を入力
  - オンデマンド : 実行周期なしで、コンソールでスキャナーを直接実行
  - 毎日 / 毎週 / 毎月 : 設定した日時にスキャンを実行
  - クローン : 実行周期をクローン形式で入力
- パターン : 特定データのメタデータ収集を包含/除外するように設定
  - Glob Pattern形式で入力します。
  - 除外設定が包含設定より優先して適用されます。
- 分類子 : データ形式に応じて分類子を選択し、 [追加] ボタンをクリックして分類子を追加
  - ソースデータタイプが Object Storageの場合に設定できます。
  - [分類子作成] ボタンをクリックし、分類子を作成できます。詳細は、分類子作成をご参照ください。
  - をクリックして追加した分類子を削除できます。
[次へ] ボタンをクリックします。
出力データ情報とテーブルアップデート処理方式を入力します。
- データベース : スキャナーを実行して作成するテーブルを接続するデータベースを選択
  - [データベース作成] ボタンをクリックし、データベースを作成できます。詳細は、データベース作成をご参照ください。
- Prefix : 作成するテーブル名の前に追加する文字列を入力
  - 入力しない場合、テーブル名はソースデータ名をベースに自動作成されます。
- スキーマ追加時 : ソースデータのスキーマ変更履歴を検知した場合に行うテーブルアップデート方式を選択
  - テーブル定義更新 : スキーマを新たに作成し、削除されたデータに対するメタデータを削除
  - 新しい列のみ追加 : 新規スキーマを追加し、既存のスキーマは保持
  - 無視 : 既存のスキーマを保持
[次へ] ボタンをクリックします。
スキャナー名と説明を入力し、設定項目を確認して [保存] ボタンをクリックします。

参考

Object Storageデータタイプのスキャナーは、最大30つまで作成できます

スキャナー検索と情報確認

作成したスキャナーを検索して情報を確認する方法は、次の通りです。

NAVERクラウドプラットフォームコンソールで、 Services > Big Data & Analytics > Data Catalog メニューを順にクリックします。
Scanner メニューをクリックします。
検索ボックスでスキャナー名または説明を入力し、をクリックしてスキャナーを検索します。
スキャナーをクリックして情報を確認します。
- 名前 : スキャナーの名前
- 状態 : スキャナーの状態
- 直近の実行結果 : 一番最近のスキャナー実行結果
- 直近の実行日時 : 直近のスキャナー実行日時
- 実行周期 : 設定されたスキャナー実行周期
- 更新日時 : スキャナー設定を変更した一番最近の日時
- [設定情報] タブ: クリックしてスキャナー設定情報を確認
  - 各設定項目に関する詳細は、スキャナー作成をご参照ください。
- [実行履歴] タブ: クリックして最近の10つのスキャナー実行履歴を確認
  - 開始日 / 終了日 : スキャン実行開始/修了日時
  - 実行時間 : スキャン実行にかかった時間
  - 実行結果 : スキャン実行結果
  - 結果サマリー : スキャン実行で追加・変更されたテーブル数、スキャン失敗原因、スキャンキャンセル履歴などの情報を表示
  - [もっと見る] ボタン: クリックして実行履歴をもっと見るポップアップを表示
    - 最近の1年間の実行履歴を確認するか、実行日を指定して実行履歴を照会できる
  - [詳細を見る] ボタン: スキャン実行の詳細は、CLAサービスで確認できます

スキャナー実行

スキャナーをコンソールで手動で実行できます。

注意

パーティションキーは最初のスキャン時にのみ作成され、スキャンの間では追加されません。したがってパーティションキーを追加する場合、テーブルを削除した後にスキャンをもう一度お試しください。ただし、パーティション値はスキャンの間に何度も追加できます。

参考

実行周期を設定したスキャナーは設定に従って自動で実行され、いつでもコンソールで手動で実行できます。

スキャナーを実行する方法は、次の通りです。

NAVERクラウドプラットフォームコンソールで、 Services > Big Data & Analytics > Data Catalog メニューを順にクリックします。
Scanner メニューをクリックします。
実行するスキャナーをクリックして選択し、 [実行] ボタンをクリックします。
- 実行が完了するとスキャナーの状態が 実行待機 、 最近の実行結果 が成功と表示されます。
- 実行中のスキャナーをクリックして選択し、 [実行管理] > 実行停止 を順にクリックしてスキャンを停止できます。

スキャナー実行周期の一時停止と再試行

定期的に自動実行するように設定したスキャナーの自動実行を一時停止するか、一時停止したスキャナーの自動実行を再試行するように設定できます。設定方法は、次の通りです。

NAVERクラウドプラットフォームコンソールで、 Services > Big Data & Analytics > Data Catalog メニューを順にクリックします。
Scanner メニューをクリックします。
[実行管理] ボタンをクリックします。
設定する内容に応じて 実行周期の一時停止 または 実行周期の再試行 をクリックします。
- 実行周期の一時停止 : 定期的に自動実行するように設定したスキャナーの自動実行を一時停止
- 実行周期の再試行 : 一時停止したスキャナーの自動実行を再試行する

スキャナー変更

作成したスキャナー情報を変更する方法は、次の通りです。

参考

実行中のスキャナーは変更できません。

NAVERクラウドプラットフォームコンソールで、 Services > Big Data & Analytics > Data Catalog メニューを順にクリックします。
Scanner メニューをクリックします。
変更するスキャナーをクリックして選択した後、 [変更] ボタンをクリックします。
スキャナー変更画面でスキャナー情報を変更します。
- 各項目に関する詳細は、スキャナー作成をご参照ください。
変更を完了したら、 [保存] ボタンをクリックします。

スキャナー削除

作成したスキャナーを削除する方法は、次の通りです。

注意

削除したスキャナーは復旧できません。

参考

実行中のスキャナーは削除できません。

NAVERクラウドプラットフォームコンソールで、 Services > Big Data & Analytics > Data Catalog メニューを順にクリックします。
Scanner メニューをクリックします。
削除するスキャナーをクリックして選択した後、 [削除] ボタンをクリックします。
お知らせのポップアップが表示されたら、注意事項を確認して [削除] ボタンをクリックします。

この記事は役に立ちましたか?

What's Next

Object Storage Scanner の使用例

Scanner画面
スキャナー作成
スキャナー検索と情報確認
スキャナー実行
スキャナー変更
スキャナー削除

タグ