Cloud Hadoop のトラブルシューティング

Prev Next

VPC環境で利用できます。

Cloud Hadoopサービスの利用中に次のような問題が発生することがあります。問題ごとの原因と解決方法を確認し、適切に対処してください。

Out of Memory(OOM)発生

Out of Memory(OOM)が発生し、サーバ hangが発生しました。

原因

システムメモリ使用量が急激に増加すると、カーネルの OOM Killerが動作し、メモリを大量に使用するプロセスを終了します。この動作によりカーネルプロセスが終了した場合、サーバが hangすることがあります。

解決方法

サーバ hang発生時の対処方法
サポートに VM再起動をリクエストしてください。

サーバ hang防止方法

  • ノードステータスを定期的に確認できるよう、pingチェックおよびプロセス監視用のモニタリングバッチを構成してください。
  • タスク(Job)を実行するエッジノードまたはマスターノードに対してスケールアウトを実行し、負荷を分散させてください。
  • ノード仕様を変更してメモリ容量をスケールアップしてください。

設定変更後のクラスタ動作エラー

Ambariで設定を変更した後、クラスタが正常に動作しません。

原因

Ambariを通じて設定を変更すると、関連する設定が意図せず影響を受け、クラスタが正常に動作しなくなることがあります。

解決方法

Ambariでは、クラスタの設定とバージョン番号が変更時刻順に保存されます。クラスタが異常動作する前のバージョンにロールバックして再起動できます。

HDFS設定を以前のバージョンにロールバックする方法を基準に説明します。

  1. Ambariで、Services > HDFS > Configsタブをクリックします。
  2. cloudhadoop-vpc-troubleshoot-icon ボタンをクリックして以前のバージョンと比較します。
    cloudhadoop-vpc-troubleshoot-ambariconfig01
  3. Version 2(正常動作設定)と Version 3(誤動作設定)の比較画面を確認します。
    cloudhadoop-vpc-troubleshoot-ambariconfig02.png
  4. 変更するバージョンである Version 2をクリックします。
  5. 以前の設定値にロールバックするには、 [MAKE CURRENT] ボタンをクリックします。
    cloudhadoop-vpc-troubleshoot-ambariconfig03.png
  6. 新規 Versionでナンバーリングされたか確認した後、 [RESTART] ボタンをクリックします。
    cloudhadoop-vpc-troubleshoot-ambariconfig04.png

Ambariアクセスアカウントのパスワード紛失

Ambariアクセスアカウントのパスワードを忘れてしまいました。

原因

クラスタ作成時にユーザーが入力したクラスタ管理者アカウントおよびパスワード情報を忘れた場合です。

解決方法

クラスタ管理者パスワードの初期化を参照して、パスワードを初期化してください。

Zeppelin Notebookアクセスエラー

Sparkクラスタを利用中ですが、Zeppelin Notebookにアクセスできません。

原因

  • Zeppelin Notebookは動作していない場合の現象です。
  • SSHトンネリングが正しく設定されていない場合の現象です。

解決方法

  • Ambari Web UIにアクセスし、Zeppelin Notebookが正常に動作しているかご確認ください。
  • Zeppelin Notebookが正常に動作しているにもかかわらずアクセスできない場合は、トンネリング設定をご確認ください。

セキュリティ脆弱性報告

security.datanode.protocol.aclの設定が*に設定されていたため、セキュリティ脆弱性として報告されました。

原因

security.datanode.protocol.aclは、データノードにアクセスできるユーザーおよびグループを指定するプロパティキー値です。デフォルトでは「*」が設定されており、すべてのユーザーのアクセスを許可していますが、権限を直接変更することができます。

解決方法

Cloud Hadoop 2.3バージョンから、security.datanode.protocol.acl設定を hdfs hadoopとして提供します。

Cloud Hadoopの下位バージョンを作成、または *で運用中のクラスタは、データノードにアクセスできるユーザーおよびグループの設定ルールを以下のように変更できます。

  • ユーザーとグループはスペース( )で区切る
  • ユーザーリスト、グループリストはコンマ(,)で区切る

例)
aliceと bobユーザーを許可し、usersと wheelグループを許可する設定ルールは次の通りです。
alice,bob users,wheel

Cloud Hadoopで自動的に作成される各コンポーネントのユーザーは hadoopグループに含まれているため、以下のように設定できます。
security.datanode.protocol.acl=hdfs,custom_user1,custom_user2 hadoop,custom_group1,custom_group2

コンテンツ一覧

NAVERクラウドプラットフォームでは顧客を支援するために様々な方法で情報を提供します。Cloud Hadoopサービスの利用時に活用できる有用なコンテンツをご案内します。

参考

本ガイドで必要な情報が見つからない場合やさらに必要な情報がある場合は、いつでも以下のフィードバックアイコンをクリックして、ご意見をお寄せください。いただいたご意見を参照して、より有益な情報を提供できるよう努力してまいります。