データ問題

Prev Next

VPC環境で利用できます。

Cloud Data Boxサービスの利用中に次のような問題が発生することがあります。問題ごとの原因と解決方法を確認し、適切に対処してください。

HUEでデータ照会不可

HUEでデータを照会できません。

原因

Hiveテーブルが作成されませんでした。

解決方法

提供されるサンプルデータを活用して Hiveテーブルを作成すると、データを照会できます。スクリプトの実行を含む詳細については、サンプルデータの照会をご参照ください。

Jupyter Notebookでデータ集計遅延

Jupyter Notebookでデータ集計に時間が長くかかります。

原因

NAVERクラウドプラットフォームで提供する NAVERデータの容量は、契約前基準で10TB、契約後基準で50TBです。データ容量により集計に時間がかかる場合があります。

解決方法

データ集計は Hue、Zeppelin、Hive CLIでの実行をお勧めします。

JSONファイル形式で持ち出し

データボックス利用中、持ち出しの申し込み時に選択できるファイルタイプはテーブル、画像、コード、モデル、ライセンスのみです。単純な形式の JSONファイルで持ち出したいです。

原因

JSONファイルは持ち出しを申し込むことができません。

解決方法

csvフォーマットのテーブルファイル、または画像やコードなどのファイルで持ち出しの申し込みを実行します。

持ち出しの申し込みの却下

「テーブル構成が一致しません」という理由で持ち出しの申し込みが却下されました。
データに問題がないのに、持ち出しの申し込みが却下されました。

原因

次の場合、持ち出しが却下されることがあります。

  • ファイル内のテーブル構造エラー
  • 複数のテーブル構造のデータが存在
  • ファイル内のフィールド数が異なる

解決方法

  • 1つのファイルには1つのテーブル構造のデータのみ存在する必要があります。1つのファイルが複数のテーブルのデータを含んでいないか確認し、テーブル構造を変更します。
  • ファイル内のテーブルでフィールドの数が異なるものがないか確認します。
参考

本ガイドで必要な情報が見つからない場合やさらに必要な情報がある場合は、いつでも以下のフィードバックアイコンをクリックして、ご意見をお寄せください。いただいたご意見を参照して、より有益な情報を提供できるよう努力してまいります。