Table
- 印刷する
- PDF
Table
- 印刷する
- PDF
Article Summary
Share feedback
Thanks for sharing your feedback!
最新のコンテンツが反映されていません。早急にアップデート内容をご提供できるよう努めております。最新のコンテンツ内容は韓国語ページをご参照ください。
VPC環境で利用できます。
テーブル(Table)とは、データの詳細情報とスキーマを持つメタデータの定義です。スキャナーを通じてテーブルを作成するか、ユーザーが直接スキーマを定義してテーブルを作成できます。 Table メニューではテーブルを作成して管理し、収集したメタデータを確認できます。
Table画面
Data Catalog利用のための Table メニューの基本的な説明は、次のとおりです。
領域 | 説明 |
---|---|
① メニュー名 | 現在確認中のメニュー名、照会中のテーブル数 |
② 基本機能 | Tableメニューに初回アクセスすると表示される機能 |
③ 作成後の機能 | テーブル作成後に有効になる機能 |
④ 検索ボックス | データベース名、テーブル名、場所、データフォーマット、タグで検索とソート順序が可能 |
⑤ テーブルリスト | 照会中のテーブルリストとして、クリックして詳細情報を確認 |
⑥ 情報タブ | 各タブをクリックしてその情報を確認 |
テーブル作成
自由にテーブルを作成できます。作成方法は、次のとおりです。
- スキーマ手動定義テーブル作成: データベースおよびスキーマを直接設定してテーブルを作成
- スキャナーを通じたテーブル作成: スキャナーを通じてスキーマを自動で定義してテーブルを作成
スキーマ手動定義テーブル作成
データベースとスキーマを直接設定してテーブルを作成できます。
参考
- Cloud Hadoopのメタストアとして Data Catalogを用いてテーブルとそのスキーマを直接定義し、管理できます(サポート予定)。
- ソース/ターゲットデータを変換処理する ETLジョブ時にも変換のためのスキーマを直接定義できます(サポート予定)。
スキーマ手動定義テーブルを作成する方法は、次のとおりです。
- NAVERクラウドプラットフォームコンソールで、 Services > Big Data & Analytics > Data Catalog メニューを順にクリックします。
- Table メニューをクリックします。
- [テーブル作成] ボタンをクリックします。
- スキーマ手動定義テーブル作成 をクリックして選択し、[次へ] ボタンをクリックします。
- 基本情報を入力します。
- データベース : ドロップダウンメニューをクリックしてテーブルを接続するデータベースを選択
- [データベース作成] ボタンをクリックしてデータベースを作成できます(データベース作成を参照)。
- テーブル名 : テーブル名を入力
- 位置 : テーブルのデータが存在する場所
- 説明 : テーブルについて説明を入力
- データベース : ドロップダウンメニューをクリックしてテーブルを接続するデータベースを選択
- [追加] ボタンをクリックしてスキーマ情報を入力し、ユーザー定義スキーマを追加します。
- データタイプ に関する詳細は、スキーマデータタイプをご参照ください。
- スキーマのチェックボックスをクリックし、 [削除] ボタンをクリックすると追加したスキーマを削除できます。
- ユーザー定義スキーマを追加しない場合、フィールド名が「default」であるスキーマが自動で追加されます。
- パーティション キーを入力する必要がある場合は、[パーティション] 領域をクリックしてパーティション キーを追加します。
- [追加] ボタンをクリック後、入力ボックスにパーティションキー名を入力してパーティションキーを追加します。
- チェックボックスをクリックしてパーティションを選択し、[削除] ボタンをクリックしてパーティション キーを削除できます。
- 必要に応じて、 タグ設定 領域をクリックしてタグを追加します。
- [追加] ボタンをクリックし、入力欄にタグ情報を入力するとタグが追加されます。
- データタイプ に関する詳細は、タグデータタイプをご参照ください。
- タグのチェックボックスをクリックして選択し、 [削除] ボタンをクリックするとタグを削除できます。
- [タグテンプレートをインポート] ボタンをクリックすると、タグテンプレートをインポートするポップアップが表示されます。
- タグテンプレートをクリックして選択し、 [追加] ボタンをクリックすると当該タグテンプレートのタグを追加できます。
- タグテンプレートに関する詳細は、Tag Templateをご参照ください。
- [追加] ボタンをクリックし、入力欄にタグ情報を入力するとタグが追加されます。
- [作成] ボタンをクリックします。
スキーマデータタイプ
手動で定義できるスキーマのデータタイプとタイプ別の説明は、次のとおりです。
データタイプ | 説明 |
---|---|
tinyint | 整数型データ(1Byte) |
smallint | 整数型データ(2Byte) |
int | 整数型データ(4Byte) |
bigint | 整数型データ(8Byte) |
float | 浮動小数型データ(4Byte) |
double | 浮動小数型データ(8Byte) |
decimal | 固定小数型データ |
string | 文字列データ |
char | 固定長さの文字型データ |
varchar | 可変長さの文字型データ |
boolean | trueまたは false値を持つデータ |
binary | char形式のデータ |
timestamp | 日付と時間表現データ、タイムスタンプ |
datetime | 日付と時間表現データ(YYYY-MM-DD HH:MM:SS) |
date | 日付表現データ(YYYY-MM-DD) |
array | 同じタイプのデータの集合体 |
map | キーと値のペアで構成されたデータ |
struct | 様々なタイプのデータと関連スキーマを含むデータ |
uniontype | 様々な構造体のデータタイプを保存できるタイプ |
データタイプ別の詳細設定入力のユースケースは、次のとおりです。
- 例) arrayタイプの詳細設定
ARRAY < STRUCT < place: STRING, start_year: INT > >
- 例) mapタイプの詳細設定
MAP < STRING, ARRAY<STRING> >
- 例) structタイプの詳細設定
STRUCT < place: STRING, start_year: INT >
- 例) uniontypeタイプの詳細設定
UNIONTYPE < INT, DOUBLE, ARRAY<STRING>, STRUCT<a:INT,b:STRING> >
スキャナーを通じたテーブル作成
スキャナーを通じてスキーマを自動で定義し、テーブルを作成する方法は、次のとおりです。
- NAVERクラウドプラットフォームコンソールで、 Services > Big Data & Analytics > Data Catalog メニューを順にクリックします。
- Table メニューをクリックします。
- [テーブル作成] ボタンをクリックします。
- スキャナーを通じたテーブル作成 をクリックして選択し、[次へ] ボタンをクリックします。
- スキャナー作成画面に移動します。
- スキャナーを作成して実行すると、自動でテーブルが作成されます。
- テーブル名はソースデータ名をベースに自動設定されます。
- スキャナー作成と実行に関する詳細は、Scannerをご参照ください。
テーブル検索と情報確認
作成したテーブルを検索して情報を確認する方法は、次のとおりです。
- NAVERクラウドプラットフォームコンソールで、 Services > Big Data & Analytics > Data Catalog メニューを順にクリックします。
- Table メニューをクリックします。
- 検索条件を入力してをクリックし、デーブルを検索します。
- テーブルをクリックして情報を確認します。
- データベース : テーブルが含まれたデータベース名
- テーブル : テーブル名
- 位置 : テーブルのデータが存在する場所
- データフォーマット : スキャンしたデータの形式
- 作成日 : テーブルを初めて作成した日時
- アップデート日 : 一番最近のテーブル情報を変更した日時
- [スキーマ] タブ: クリックしてテーブルに登録されたスキーマを確認
- データタイプ に関する詳細は、スキーマデータタイプをご参照ください。
- [パーティション] タブ: クリックしてテーブルに登録されたパーティションを確認
- [スキーマバージョン] タブ: クリックしてスキーマバージョンリストを確認、バージョンをクリックして当該バージョンのスキーマを確認
- [タグ] タブ: クリックしてテーブルに登録されたタグを確認
- [プロパティ情報] タブ: クリックしてテーブルとソースデータのプロパティ情報を確認
- プロパティキー に関する詳細は、プロパティ情報をご参照ください。
プロパティ情報
テーブル詳細情報領域で、 [プロパティ情報] タブをクリックすると、テーブルとソースデータのプロパティ情報を確認できます。情報項目と項目別の説明は、次のとおりです。
プロパティキー | 説明 |
---|---|
created_time | テーブル作成日時のユニックス時間を表記 |
last_modified_time | テーブルアップデート日時のユニックス時間を表記 |
dataFormat | データソースの形式 |
delimiter | ソースデータが CSVファイルの場合に区分記号 |
dataType | データソースタイプ |
transient_lastDdlTime | テーブル DDLの最終変更日時のユニックス時間を表記 |
scannerName | テーブルを作成したスキャナー名 |
totalSize | スキャン対象がディレクトリの場合、スキャンした総データ容量 |
numFiles | スキャン対象がディレクトリの場合、スキャンした総ファイル数 |
isDirectory | スキャン対象がディレクトリの場合、TRUE表示 |
EXTERNAL | 外部保存 |
scannerId | テーブルを作成したスキャナー ID |
connectionName | データスキャンのために利用したコネクション名 |
inputFormat | Fileを Objectで読み取るための Format形式 |
outputFormat | Objectを Fileで書き込むための Format形式 |
serializationLib | Serializer and Deserializer Library |
clusterNo | スキャンされた Cloud Data Baseサービスのクラスタ番号 |
connectionId | テーブルを作成したスキャナーのコネクション ID |
mysqlCollation | MySQLテーブルの文字列の位置合わせを設定 |
mysqlDataSize | MySQLテーブルのデータサイズ |
mysqlIndexSize | MySQLテーブルのインデックスサイズ |
mysqlIndexes | MySQLテーブルのインデックス数 |
mysqlRows | MySQLテーブルに保存された行(レコード)数 |
mysqlTableSize | MySQLテーブルの合計サイズ |
mssqlCollation | MSSQLテーブルの文字列の位置合わせを設定 |
mssqlDataSize | MSSQLテーブルのデータサイズ |
mssqlIndexSize | MSSQLテーブルのインデックスサイズ |
mssqlIndexes | MSSQLテーブルのインデックス数 |
mssqlRows | MSSQLテーブルに保存された行(レコード)数 |
mssqlTableSize | MSSQLテーブルの合計サイズ |
postgresqlCollation | PostgreSQLテーブルの文字列の位置合わせを設定 |
postgresqlDataSize | PostgreSQLテーブルのデータサイズ |
postgresqlIndexSize | PostgreSQLテーブルのインデックスサイズ |
postgresqlIndexes | PostgreSQLテーブルのインデックス数 |
postgresqlRows | PostgreSQLテーブルに保存された行(レコード)数 |
postgresqlTableSize | PostgreSQLテーブルの合計サイズ |
mongodbAvgObjSize | MongoDBコレクションの平均ドキュメントサイズ |
mongodbFreeStorageSize | MongoDBデータベースで使用できる空きスペースのサイズ |
mongodbIndexSize | MongoDBコレクションのインデックスサイズ |
mongodbIndexes | MongoDBコレクションのインデックス数 |
mongodbRowCount | MongoDBコレクションに保存されたドキュメント(レコード)数 |
mongodbSize | MongoDBデータベースのサイズ |
mongodbStorageSize | MongoDBデータベース保存場所のサイズ |
mongodbTotalSize | MongoDBデータベースの合計サイズ |
テーブル修正
作成したテーブル情報を修正するか、スキーマのバージョンを選択する方法は、次のとおりです。
参考
テーブル名とテーブルが含まれているデータベースは修正できません。
- NAVERクラウドプラットフォームコンソールで、 Services > Big Data & Analytics > Data Catalog メニューを順にクリックします。
- Table メニューをクリックします。
- 修正するテーブルをクリックして選択し、 [修正] ボタンをクリックします。
- テーブル修正画面でテーブル情報を修正します。
- ソースデータの場所、テーブル説明、ソースデータのフォーマット、スキーマ、タグを修正できます。
- スキーマ 領域の バージョン ドロップダウンメニューをクリックし、修正するスキーマバージョンを選択できます。
- 各情報項目に関する詳細は、テーブル作成をご参照ください。
- [保存] ボタンをクリックします。
テーブル削除
作成したテーブルを削除する方法は、次のとおりです。
注意
- テーブルを削除するとテーブルのすべてのメタ情報が削除されます。
- 削除したテーブルが Cloud Hadoop Hiveに接続された Managed Tableの場合、実際データが削除されることがあります(サポート予定)。
- 削除したテーブルは復旧できません。
- NAVERクラウドプラットフォームコンソールで、 Services > Big Data & Analytics > Data Catalog メニューを順にクリックします。
- Table メニューをクリックします。
- 削除するテーブルをクリックして選択し、 [削除] ボタンをクリックします。
- お知らせのポップアップが表示されたら、注意事項を確認して [削除] ボタンをクリックします。
この記事は役に立ちましたか?