Monitoring コンソールを使用する

VPC環境で利用できます。

Monitoringサービスでは2種類のダッシュボードをサポートしており、の、Cloud Hadoopのパフォーマンスと履歴に関する様々なモニタリング情報を確認できます。Monitoringは NAVERクラウドプラットフォームの Cloud Hadoopに含まれているサービスであるため、別途追加費用なしで使用できます。

Monitoringで提供するダッシュボードの種類は、次の通りです。

HADOOP Dashboard: 運用中の Cloud Hadoop関連モニタリング情報
OS Dashboard: 運用中の Cloud Hadoop各サーバのハードウェア、ネットワーク情報

2種類のダッシュボードを通じて、直近2か月以内の Cloud Hadoop関連情報と各サーバのハードウェア、ネットワーク指標を確認できます。各ダッシュボードはグラフや図表で構成されおり、特定のグラフチャートを出力したり、様々な拡張子のファイルで PCにダウンロードしたりすることで、業務効率を高めることができます。

参考

モニタリングの結果、特定の指標がしきい値を超えたり、特定の条件を満たす場合はイベントとして認識し、ユーザーにアラームで知らせるように設定できます。イベントおよびアラーム設定の詳細な使用方法については、Cloud Insightでの Cloud Hadoopモニタリングガイドをご参照ください。

Monitoringを開始する

NAVERクラウドプラットフォームコンソールの VPC環境で、Menu > Services > Big Data & Analytics > Cloud Hadoopメニューを順にクリックします。
[クラスタを作成] ボタンをクリックし、Cloud Hadoopクラスタを作成します。
- クラスタ作成に関する詳細は、Cloud Hadoop を開始するガイドをご参照ください。
左側の Cloud Hadoop > Monitoringメニューをクリックします。
Cloud Hadoopクラスタリストからモニタリングするクラスタをクリックします。

Monitoring画面

Monitoring利用のための基本的な説明は、次の通りです。

chadoop-vpc-monitoring1_ko

左側の領域で、現在実行中の Cloud Hadoopクラスタとクラスタ別サーバを選択できます。
クラスタ名をクリックすると右側の領域に HADOOP Dashboardが表示され、クラスタ名下部のサーバをクリックすると OS Dashboardが表示されます。

Monitoringダッシュボードの確認

Monitoringで提供しているダッシュボードは、複数のグラフチャートで構成されています。ユーザーは、クラスタ別に確認したいダッシュボードで必要な情報のみ表示させ、直観的に確認できます。ダッシュボードを使用する方法は、次の通りです。

HADOOP Dashboard

chadoop-vpc-monitoring2_ko

左側の Cloud Hadoopクラスタリストから確認したいクラスタをクリックすると、右側のように HADOOP Dashboardが表示されます。
- HADOOP Dashboardでデータは毎分収集されます。
- モニタリング情報は平均値を基準とし、選択した期間のタイプに応じて収集周期は異なります。
各グループ別に確認できる指標は、次の通りです。

グループ	指標名	単位	説明
Apps	apps_completed	num	number of applications submitted to YARN that have completed
	apps_failed	num	number of applications submitted to YARN that have failed to complete
	apps_killed	num	number of applications submitted to YARN that have been killed
	apps_pending	num	number of applications submitted to YARN that are in a pending state
	apps_running	num	number of applications submitted to YARN that are running
	apps_submitted	num	number of applications submitted to YARN
Blocks	corrupt_blocks	num	number of blocks that HDFS reports as corrupted
	missing_blocks	num	number of blocks in which HDFS has no replicas
	pending_deletion_blocks	num	number of blocks marked for deletion
	pending_replication_blocks	num	status of block replication: blocks being replicated, age of replication requests, and unsuccessful replication requests
	under_replicated_blocks	num	number of blocks that need to be replicated one or more times
Containers	allocated_container	num	number of resource containers allocated by the ResourceManager
	pending_containers	num	number of containers in the queue that have not yet been allocated
	reserved_containers	num	number of containers reserved
HDFS capacity(GB)	capacity_remaining_gb	GB	amount of remaining HDFS disk capacity
HDFS read/write(bytes)	hdfs_bytes_read	bytes	number of bytes read from HDFS
HDFS read/write(bytes)	hdfs_bytes_written	bytes	number of bytes written to HDFS
HDFS utilization(%)	hdfs_utilization	%	percentage of HDFS storage currently used
Memory(MB)	allocated_mb	MB	amount of memory allocated to the cluster
	available_mb	MB	amount of memory available to be allocated
	reserved_mb	MB	amount of memory reserved
	total_mb	MB	total amount of memory in the cluster
Nodes	num_live_data_nodes	num	number of data nodes that are receiving work from Hadoop
	unhealthy_nodes	num	number of nodes available to MapReduce jobs marked in an UNHEALTHY state
	active_nodes	num	number of nodes presently running MapReduce tasks or jobs
	decommissioned_nodes	num	number of nodes allocated to MapReduce applications that have been marked in a DECOMMISSIONED state
	lost_nodes	num	number of nodes allocated to MapReduce that have been marked in a LOST state
	rebooted_nodes	num	number of nodes available to MapReduce that have been rebooted and marked in a REBOOTED state
	total_nodes	num	number of nodes presently available to MapReduce jobs
V_cores	allocated_v_cores	num	number of core nodes working
V_cores	pending_v_cores	num	number of core nodes waiting to be assigned
Data transfers	total_load	num	total number of concurrent data transfers
YARN memory(%)	yarn_memory_available_percentage	%	percentage of remaining memory available to YARN (= available_mb / total_mb)

リアルタイムでクラスタの指標変化をモニタリングできます。
- クラスタのデータノード数を減らしたときに指標が変わる様子です。
ユーザーは以下のようにグラフに直接マウスオーバーしてグラフをズームイン、ズームアウトできます。また、照会する期間を設定するとダッシュボードで必要な期間の指標を確認できます。
以下のようにをクリックするとチャートを出力でき、様々な拡張子ファイルでグラフをダウンロードできます。ご希望のフォーマットを選択してデータをダウンロードしてください。

OS Dashboard

chadoop-vpc-monitoring6_ko

モニタリングページで、クラスタ名ではなくクラスタ下位のサーバを選択してください。OS Dashboardが表示されます。
- OS Dashboardでデータは毎分収集されます。
- モニタリング情報は平均値を基準とし、選択した期間のタイプに応じて収集周期は異なります。
Cloud Hadoopクラスタを構成しているマスターノード、エッジノード、データノードを確認したり、それぞれの CPU Usage、LoadAverage、Memory、Disk I/O、Disk usage、Network I/O指標を確認できます。