Cloud Insight FAQ
    • PDF

    Cloud Insight FAQ

    • PDF

    Article Summary

    Classic/VPC 환경에서 이용 가능합니다.

    Cloud Insight FAQ에서 자주 하는 질문에 대한 답변을 제공합니다.

    다음의 자주 하는 질문에서 원하는 답을 얻지 못한 경우, 사용 가이드에서 원하는 내용을 찾아서 확인해 주십시오.

    Q. Cloud Insight를 통해 성능 지표를 확인할 수 있는 서비스는 무엇이 있나요?

    A. Cloud Insight를 통해 성능 지표를 확인할 수 있는 서비스는 성능 지표 제공 서비스를 참고해 주십시오.

    Q. Metric과 Dimension이 의미하는 것은 무엇인가요?

    A. Metric은 사용자가 취급하려는 값을 의미하며, Dimension은 Metric의 속성을 의미합니다. Dimension으로 해당 Metric이 어떤 서버에 속하는지, 어떤 곳에 위치하는지, 무엇의 값인지 등을 정의할 수 있습니다.

    Q. 데이터의 수집 주기와 집계 주기가 어떻게 되나요?

    • Metric 데이터의 수집 주기는 1분입니다. 수집 주기는 집계 주기와 별개로 대상 리소스에서 Cloud Insight로 데이터를 보내주는 주기를 의미합니다.
      • 데이터는 수집된 그대로 Cloud Insight에 저장되며, 집계 주기(Interval)마다 여러 가지 집계 함수(Aggregation Method)를 이용하여 연산됩니다.
    • 집계 주기는 1분(Min1), 5분(Min5), 30분(Min30), 2시간(Hour2), 1일(Day1) 간격으로 실행됩니다.
      • 현재 집계 기간 내 AVG(평균값), MIN(최솟값), MAX(최댓값), COUNT(수집 횟수), SUM(합계) 등의 집계 함수가 지원됩니다.

      • <예시> 00시 01분부터 00시 05분까지 다음과 같은 데이터가 수집되었다고 가정하였을 때, 집계 기간 1분(Min1)과 5분(Min5)에 대한 기댓값은 표와 같습니다.

        00:01:00 - 1
        00:02:00 - 2
        00:03:00 - 3
        00:04:00 - 4
        00:05:00 - 5
        

        집계 주기(Interval): 1분(Min1)

        시간AVG(평균값)MIN(최솟값)MAX(최댓값)COUNT(수집 횟수)SUM(합계)
        00:0111111
        00:0222212
        00:0333313
        00:0444414
        00:0555515

        집계 주기(Interval): 5분(Min5)

        시간AVG(평균값)MIN(최솟값)MAX(최댓값)COUNT(수집 횟수)SUM(합계)
        00:01315515

    Q. Custom Schema를 생성하고 이용하려면 어떻게 해야 하나요?

    A. Cloud Insight에서는 다양한 Metric Type과 지표를 지원하지만 사용자가 원하는 Metric을 지원하지 않을 수 있습니다. 이 경우 Custom Schema와 SendData API를 이용하여 사용자가 원하는 메트릭을 자유롭게 집계하여 수집하고 이를 Cloud Insight에서 활용할 수 있습니다.

    참고

    Custom Schema와 SendData API에 대한 자세한 사용 방법은 다음 가이드를 참조해 주십시오.

    Custom Schema와 Send Data API를 사용하는 자세한 시나리오는 다음과 같습니다.

    1. Custom Schema 생성

    Custom Schema 사용자 가이드를 참고하여 Custom Schema를 생성합니다.
    Custom Schema 생성 이후 [데이터 전송 예시] 버튼을 클릭하여 [전송할 Sample Data 형식] 을 확인합니다.

    다음은 Filesystem의 사용량을 수집하는 Custom Schema의 예시입니다. (Cloud Insight는 Filesystem 타입 메트릭을 제공하므로 단순 예시를 위한것임을 참고해주세요.)

    Custom Schema 생성시 입력 값 예시

    Product Type : CustomFilesystem
      수집 대상 설정 :
        ID Dimension : instanceName
        Data Type : String
      Metrics :
      - Metric : totalSize
        Data Type : Integer
        AggregationCycle : Min1, Min5, Min30
        Aggregation : AVG
        Unit : MB
      - Metric : usedSize
        Data Type : Integer
        AggregationCycle : Min1, Min5, Min30
        Aggregation : AVG
        Unit : MB
      - Metric : availSize
        Data Type : Integer
        AggregationCycle : Min1, Min5, Min30
        Aggregation : AVG
        Unit : MB
      Dimensions :
      - Dimension : mountPoint
        Data Type : String
    

    Custom Schema 생성 후 Sample Data 형식 예시

    {
    	"cw_key": "801142312146182144",
    	"data": {
    		"instanceName": "fe79g8ahkab",
    		"totalSize": 893,
    		"availSize": 260,
    		"usedSize": 405,
    		"mountPoint": "gh1apxl4it9"
    	}
    }
    

    2. 원하는 메트릭을 집계

    Custom Schema 데이터형식에 맞는 메트릭 값을 직접 집계합니다. 대상 서버에 접속하여 원하시는 값을 도출해 낼 수 있도록 스크립트를 작성합니다.

    다음은 위의 예시에 이어지는 스크립트 작성 예시입니다.

    #!/bin/bash
    
    MOUNTPOINT="/userDevice"
    
    USAGES=$(df -m | grep " $MOUNTPOINT$")
    
    totalSize=$(echo $USAGES | awk '{print $2}')
    usedSize=$(echo $USAGES | awk '{print $3}')
    availSize=$(echo $USAGES | awk '{print $4}')
    

    3. SendData API를 통해 Custom Metric Data 전송

    직접 집계한 메트릭 값들을 Custom Schema의 데이터 전송 형식에 맞추어 정리하고, SendData API를 이용하여 Cloud Insight로 전송합니다.

    다음은 위의 예시에 이어지는 Custom Schema 데이터 전송 형식 예시입니다.

    {
    	"cw_key": "801142312146182144",
    	"data": {
    		"instanceName": "myServer",
    		"totalSize": 1180,
    		"availSize": 1150,
    		"usedSize": 30,
    		"mountPoint": "/userDevice"
    	}
    }
    

    4. Cloud Insight에서 수집된 데이터 확인

    이렇게 Cloud Insight로 전송된 Custom Metric 데이터는 Cloud Insight 콘솔에서 Dashboard의 Widget을 생성하거나, Event Rule 혹은 Template을 생성할때 확인하실 수 있습니다.

    5. 매 1분마다 반복

    정상적으로 Cloud Insight에서 Custom Product Type, ID Dimension, Dimensions, Metric 을 확인하셨다면 위의 2~3번의 절차를 1분마다 반복수행(Crontab 등 적절한 수단 이용)하여 Cloud Insight로 메트릭 값을 수집하시면 됩니다.

    Q. agent_status 메트릭이 뭔가요?

    A. agent_status 메트릭은 Cloud Insight Agent의 상태를 모니터링할 수 있는 메트릭입니다.
    agent_status 메트릭의 조건은 다음과 같습니다.

    • 0 : agent가 정상인 경우
    • 1 : 3분 동안 데이터가 수집되지 않으나, ping 체크는 성공할 경우
    • 2 : 3분 동안 데이터가 수집되지 않고 동시에 ping 체크 실패할 경우

    agent_status 값은 연속적이지 않고 분기로 처리됩니다. 만약 agent가 정상일 때 서버가 정지되는 경우, agent_status 값이 0에서 1 을 거쳐 2로 변경되는 것이 아니라 0에서 2가 됩니다.
    참고로, ping 체크는 별도 관리서버(ping check 모니터링 서버)에서 고객님 서버를 대상으로 진행합니다. ping 체크 실패가 서버 fail과 동일한 의미는 아니므로, agent_status 값이 2인 경우, Agent 및 서버 상태 뿐만 아니라 Network 부분에 대한 점검도 필요합니다.

    Q. Server(VPC)의 Process와 Plugin Process 데이터의 차이는 무엇인가요?

    A. Process는 해당 서버의 TOP 10 프로세스에 대한 데이터이며, Plugin Process는 사용자가 설정한 특정 프로세스에 대한 데이터입니다. 따라서 특정 프로세스를 모니터링하기 위해서는 Plugin Process 기능을 사용해 주십시오.

    Q. Server(VPC)의 Plugin(File/Process/Port) 기능을 사용하려면 어떻게 해야 하나요?

    A. Plugin 기능을 사용하려면 먼저 API를 통해 특정 File/Process/Port에 대한 모니터링 설정을 해야 합니다.

    Plugin 설정 및 조회 API는 다음을 확인해 주십시오.

    Plugin(File/Process/Port) Metric은 Extended로 해당 서버의 상세 모니터링 설정이 필요합니다.

    자세한 사용 예시는 다음과 같습니다.

    (여기서는 Plugin Process를 기준으로 설명합니다. Plugin File, Plugin Port에 대해서도 유사하게 적용됩니다)

    1. 서버에 상세모니터링이 Enable되었는지 확인합니다.

    2. AddProcessPlugin API를 통해 모니터링 하기 원하시는 프로세스를 Cloud Insight에 등록합니다.
      Payload의 configList에 대해서는 Linux의 경우 ps -ef를, Windows의 경우 tasklist를 참고합니다.

      Payload 예시

      payload = {
        "configList": [ "*httpd*", "*java*" ],
        "instnaceNo": "1234567",
        "type": "VPCServer"
      }
      
      참고

      asterisk(*)는 Plugin Process 설정 시에만 사용할 수 있습니다. asterisk(*)가 포함된 문자열로 process name 설정 시 일치하는 모든 프로세스의 PID 목록이 대상이 됩니다.

      참고

      AddPluginProcess API 호출 시 한번에 하나의 instanceNo만 등록이 가능합니다. 만약 여러 instanceNo를 대상으로 할 경우, API를 여러 번 호출합니다.

    3. GetAllProcessPlugin을 통해 Cloud Insight에 정상적으로 Plugin Process configList가 등록되었는지 확인합니다.

    4. 정상적으로 Plugin Process configList가 등록되었다면 약 2~3분 뒤에 Cloud Insight Console에서 동록된 process name을 확인할 수 있습니다. Dashboard의 Widget 설정 시, Plugin Process를 설정한 Target InstanceName에 대해 process name이 Dimension으로 노출됩니다.

    5. Plugin Process를 변경하거나 삭제해야할 경우 UpdateProcessPlugin 혹은 RemoveProcessPlugin을 사용합니다.

    참고

    Plugin Process를 삭제하면 바로 Dimension에서 사라지지 않습니다. 자세한 내용은 Cloud Insight 문제 해결을 참조해 주십시오.

    Q. Metric Dimension을 선택하지 않은 경우, 기본값은 어떻게 되나요?

    • Metric에 따라 Dimension 선택 여부가 달라집니다.
      <예시> Metric이 Server인 경우: Dimension이 하나만 존재하기 때문에 선택 가능한 Dimension이 존재하지 않음, Metric이 CPU인 경우: CPU 개수에 따라 cpu_idx: 0~N의 Dimension 선택 가능

    • 선택 가능한 Dimension이 있으나 선택하지 않은 경우, 선택 가능한 모든 Dimension을 대상으로 Aggregation 설정에 대응되는 값이 출력됩니다.
      <예시> 다음과 같은 조건에서 Dimension을 선택하지 않은 경우

      Metric : CPU/used_rto
      Dimension : cpu_idx: 0, cpu_idx: 1
      Aggregation : AVG
      

      Aggregation의 설정에 맞게 cpu_idx: 0cpu_idx: 1의 used_rto의 평균값으로 설정됩니다.

    Q. CPU 사용률이 이벤트 룰 조건보다 낮은데 이벤트가 발생하였습니다. 이벤트가 왜 발생한 건가요?

    A. CPU/used_rto 메트릭은 CPU 개수에 따라 cpu_idx:0~N 의 디멘션이 존재합니다.
    디멘션을 선택하지 않고 이벤트 룰을 생성한 경우 모든 디멘션의 메트릭이 대상이 되며, 각 디멘션에 따른 메트릭 중 하나라도 조건에 해당하면 이벤트가 발생합니다.
    <예시> 서버의 cpu 개수가 2개이고 이벤트 룰 및 메트릭 값이 아래와 같을 때 CPU/used_rto 값이 45이지만, 디멘션 cpu_idx: 0 에 해당하는 값이 60으로 조건을 만족하기 때문에 이벤트가 발생합니다.

    • 감시 항목 및 조건:
    메트릭: CPU/used_rto
    디멘션: 선택안함
    조건: >= 50
    집약 방법: AVG
    지속시간: 1 minute
    
    • 일정 시점 Min1 데이터:
    시간CPU/used_rto (cpu_idx: 0)CPU/used_rto (cpu_idx: 1)CPU/used_rto
    00:01603045

    따라서 서버의 평균 CPU 사용률에 대해 이벤트 설정이 필요한 경우에는 SERVER/avg_cpu_used_rto 메트릭을 이용해 주시기 바랍니다.

    Q. Event Rule의 감시 항목 및 조건을 여러 Metric의 Condition으로 설정한 경우, Event가 발생하려면 모든 조건에 만족해야 하나요?

    A. Event Rule에 Metric의 Condition을 여러 개로 설정한 경우, 각 Condition은 OR 조건으로 동작합니다. 즉, Event Rule의 감시 항목 및 조건으로 추가된 개별 Metric의 Condition을 만족한다면 Event가 발생합니다.

    Cloud Insight에서는 Event Rule 설정 시 감시 항목 및 조건으로 여러 개의 Metric을 선택한 경우, 실제로는 선택한 Target*Metric 수에 해당하는 Event Rule이 생성됩니다. Event Rule 생성 시 또는 Event Rule 목록에서 생성된 Event Rule을 선택한 후 [Rules 전체 보기] 버튼을 클릭하면 실제 생성된 모든 Event Rule을 확인할 수 있습니다.

    <예시> VM 1대에 대한 Event Rule에 2개의 Condition을 설정하고, 액션으로 Auto Scaling 정책을 설정한 경우, 실제로는 다음과 같은 2개의 Event Rule이 생성됩니다.

    • VM의 avg_cpu_used_rto > 50%인 경우 Auto Scaling 정책 수행
    • VM의 mem_usert > 50%인 경우 Auto Scaling 정책 수행

    따라서 avg_cpu_used_rto > 50%인 경우 또는(OR) mem_usert > 50%인 경우, Event가 발생하여 Auto Scaling 정책이 실행됩니다.

    Q. Server(VPC)의 mem_usert는 어떻게 수집되나요?

    A. mem_usert 값은 전체 메모리 대비 사용된 메모리 비율이며, 계산식은 다음과 같습니다.

    used_mem_mb = total_mem_mb - free_mem_mb - buffuer_mb - cache_mb - slab_reclaimable_mb
    mem_usert = used_mem_mb / total_mem_mb * 100
    

    Q. Filesystem Type의 메트릭은 어떻게 수집되나요?

    A. Filesystem Type의 메트릭들은 다음과 같은 기준에 부합될 때 Mountpoint Name이 Dimension으로 등록되고 수집이 가능합니다.

    • ext3, ext4, xfs 중 하나의 파일 시스템으로 포맷된 별도의 파티션 또는 디바이스 (UUID 기반)

      > blkid
      /dev/xvda1: UUID="f95bed0a-11af-4b2c-bfcc-4afb91a68fc1" TYPE="xfs"
      /dev/xvda2: UUID="0692fdb8-bb3c-4094-83f0-fe95a339b8c1" TYPE="xfs"
      
    • 실제로 Mount 되어있음

      > df -h
      /dev/xvda2       49G  3.6G   46G   8% /
      /dev/xvda1     1014M  183M  832M  18% /boot
      
    참고

    만약 Filesystem이 ext3, ext4, xfs 중 하나로 포맷되지 않은 경우 /etc/fstab에 등록하고, Mount 해주시면 수집이 가능합니다.

    > cat /etc/fstab
    /dev/xvdb    /mnt/vol     vfat      defaults     0   0
    

    /etc/fstab에 기록된 mountpoint는 실제 df -h 명령의 결과로 나오는 mountpoint와 정확히 일치해야합니다.

    <예시>
    /logs/ != /logs

    Q. Agent를 설치하려면 어떻게 해야 하나요?

    A. VPC 서버에 접속한 후 운영 체제에 따라 방법을 확인해 주십시오.

    참고

    설치 도메인은 VPC 서버에서만 접속할 수 있습니다. 인터넷 환경에서 접속하려면 네이버 클라우드 플랫폼 오픈 소스 사이트를 이용해 주십시오.

    • Linux

      • 설치 패키지 다운로드: https://nsight.ncloud.com/agent_controller_linux_ncp.tar.gz
      • /home1/nbpmon/에서 압축 해제: tar -zxvf agent_controller_linux_ncp.tar.gz
      • root 권한으로 Agent 실행: /home1/nbpmon/agent_controller_linux/install_agent.sh pub
    • Linux Bare Metal

      • 설치 패키지 다운로드: https://nsight.ncloud.com/agent_controller_linux_pub_bm.tar.gz
      • /home1/nbpmon/에서 압축 해제: tar -zxvf agent_controller_linux_pub_bm.tar.gz
      • root 권한으로 Agent 실행: /home1/nbpmon/agent_controller_linux/bm_install_agent.sh
    • Window

      • 설치 패키지 다운로드: https://nsight.ncloud.com/agent_controller_windows_ncp.zip
      • 압축 해제: unzip agent_controller_windows_ncp.zip
      • Agent 실행: agent_controller_windows/install_agent.bat pub
      주의

      다운로드 및 압축 해제 후 설치 폴더는 NBP 폴더 하위에 있어야 합니다.
      아래는 잘못된 설치 경로 예입니다.
      C:\Program Files (x86)\NBP\agent_controller_windows_ncp\agent_controller_windows

      정상적인 설치 경로는 아래와 같습니다.
      C:\Program Files (x86)\NBP\agent_controller_windows

    Q. Linux용 Agent script 파일은 어디에서 다운로드할 수 있나요?

    A. to_stop_start_uninstall_agent.zip을 클릭하여 다운로드할 수 있습니다. 다운로드한 파일의 압축을 풀고 script 파일들을 Agent 디렉터리(/home1/nbpmon/agent_controller_linux/)에 위치시켜 주십시오. 해당 script를 통해 Agent를 시작/중단/설치/삭제할 수 있습니다.

    Q. Server(VPC) 데이터를 모니터링하려면 Agent를 반드시 설치해야 하나요?

    A. Server(VPC)의 경우 성능 지표를 수집하려면 Agent가 필요하나, 서버 생성 시 기본 탑재되기 때문에 사용자가 별도로 Agent를 설치할 필요는 없습니다. 다만 Agent가 삭제되거나 사용자 설정에 의해 실행되지 않을 경우, Cloud Insight를 통한 데이터 수집이 불가능하므로 유의해 주십시오.

    Q. Agent가 작동 중인지 확인하려면 어떻게 해야 하나요?

    A. 운영 체제에 따라 방법을 확인해 주십시오.

    • Linux
      ps -ef | grep agent를 통해 Agent 프로세스가 살아있는지 확인해 주십시오. agent_updater.py와 agent.py 프로세스가 실행 중이라면 Agent는 정상 작동 중입니다.
    • Window
      nsight2_agent 서비스의 상태를 확인해 주십시오. 해당 서비스가 시작되었다면 Agent는 정상 작동 중입니다.

    Q. Agent를 중단하거나 시작하려면 어떻게 해야 하나요?

    A. 운영 체제에 따라 Agent 중단/시작 방법을 확인해 주십시오.

    • Linux

      • Agent 중단: /home1/nbpmon/agent_controller_linux/stop_agent.sh를 실행해 주십시오.
      • Agent 시작: /home1/nbpmon/agent_controller_linux/start_agent.sh를 실행해 주십시오.
      • Agent 재시작: /home1/nbpmon/agent_controller_linux/restart_agent.sh를 실행해 주십시오.
    • Window

      • Agent 중단: C:\Program Files(x86)\NBP\agent_controller_windows\agent.bat stop을 실행해 주십시오.
      • Agent 시작: C:\Program Files(x86)\NBP\agent_controller_windows\agent.bat start를 실행해 주십시오.

    Q. Agent를 삭제하려면 어떻게 해야 하나요?

    A. 운영 체제에 따라 Agent 삭제 방법을 확인해 주십시오.

    Q. Agent를 재설치하려면 어떻게 해야 하나요?

    A. 설치가 정상적으로 이뤄지지 않은 경우, 아래와 같은 방법으로 Agent를 정상적으로 재설치할 수 있습니다.

    • Linux

      1. Agent 중지
        /home1/nbpmon/agent_controller_linux/stop_agent.sh를 실행해 주십시오.

      2. Agent 삭제
        /home1/nbpmon/agent_controller_linux/uninstall_agent.sh를 실행해 주십시오.

      3. Agent 설치 경로 삭제
        /home1/nbpmon/agent_controller_linux를 삭제해 주십시오. 필요한 파일이 있다면 백업해주시기 바랍니다.

      4. Agent 설치
        Agent 설치 방법은 Q. Agent를 설치하려면 어떻게 해야 하나요?를 참고해주시기 바랍니다.

    • Window

      1. Agent 중지
        아래 명령을 실행해 주십시오.
      C:\Program Files(x86)\NBP\agent_controller_windows\agent_controller_windows\agent.bat stop
      
      1. Agent 삭제
        아래 명령을 실행해 주십시오.
      C:\Program Files (x86)\NBP\agent_controller_windows\agent_controller_windows\agent.bat uninstall
      
      1. Agent 설치 경로 삭제
        C:\Program Files (x86)\NBP\agent_controller_windows를 삭제해 주십시오. 필요한 파일이 있다면 백업해주시기 바랍니다.

      2. Agent 설치
        Agent 설치 방법은 Q. Agent를 설치하려면 어떻게 해야 하나요?를 참고해주시기 바랍니다.

    Q. Agent의 로그를 확인하려면 어떻게 해야 하나요?

    A. 운영 체제에 따라 다음과 같이 로그 파일을 확인할 수 있습니다.

    • Linux
      /home1/nbpmon/agent_controller_linux/logs에서 로그 파일을 확인할 수 있습니다.

    • Window
      C:\Program Files (x86)\NBP\agent_controller_windows\logs에서 로그 파일을 확인할 수 있습니다.

    Q. Agent의 로그 사이즈와 백업 개수를 조정하려면 어떻게 해야하나요?

    A. 다음과 같이 로그 사이즈와 백업 개수를 조정할 수 있습니다.

    1. 운영 체제에 따라 logger.py 파일을 확인합니다.

      • Linux
        /home1/nbpmon/agent_controller_linux/logger.py
      • Window
        C:\Program Files (x86)\NBP\agent_controller_windows\logger.py
    2. logger.py 파일 내용 중 LOG_SIZE_IN_BYTESLOG_BACKUP_COUNT를 수정합니다.

      ...
      def get_logger(name, logfile=DEFAULT_LOG, max_bytes=LOG_SIZE_IN_BYTES, backup_count=LOG_BACKUP_COUNT):
          logger = logging.getLogger(name)
          setup_logger(logger, logfile, max_bytes, backup_count)
          return logger
      
    3. logger.py 파일 수정 후 Agent를 재기동 합니다.

    Q. User Created 정책을 통해 액션 단위로 권한을 정의하려면 액션 간 연관 관계를 숙지하고 있어야 하나요?

    A. 메인 계정이 서브 계정에게 부여할 세부 액션을 선택할 때 연관된 액션들도 자동적으로 선택되는 기능을 제공하고 있습니다.

    Q. Event 정보를 SMS로 수신할 경우, SMS에는 어떤 내용이 포함되어 있나요?

    A. Cloud Insight는 Event 발생, Event가 해소되지 않은 상태로 유지될 경우, Event가 종료될 경우에 대한 SMS 알람 기능을 제공합니다.
    각 상황 별 Message 형식은 아래와 같습니다.

    발송 상황SMS Format
    Event 발생[Ncloud] ${RuleName} ${Level} ${InstanceName} ${Condition}
    Event 리마인드[Ncloud][Remind] ${RuleName} ${Level} ${InstanceName} ${Condition}
    Event 종료[Ncloud][Resolve] ${RuleName} ${InstanceName} ${Condition}

    SMS는 메시지 특성에 따른 메시지 용량 제한으로 인해 최소한의 정보만을 포함하여 발송하고 있습니다.
    보다 자세한 정보가 필요하실 경우 Integration의 사용을 권장 드립니다.

    Q. Cloud DB 계열 상품을 사용중입니다. 이벤트가 발생해 자동으로 전송되는 SMS의 내용을 어떻게 해석해야 하나요?

    A. 각 Cloud DB 종류별로 제공하는 메트릭이 다르기 때문에 자세한 내용은 콘솔 화면을 확인해주시기 바랍니다. 주로 사용하는 메트릭의 내용은 아래와 같습니다.

    ProductMetricSMS SampleDescription
    Cloud DB for MySQL(VPC)mysql_active[Ncloud] DB Down:0, Threshold:== 0, Duration:1min WARNING test mysql_active=0test DB 서버가 다운됨
    Cloud DB for MySQL(VPC)mysql_slavedelay[Ncloud] DB Down:0, Threshold:== 0, Duration:1min WARNING test mysql_slavedelayMaster에서 Slave로 최신 데이터 복제가 지연됨(1분 전 데이터까지 반영된 상태)
    Cloud DB for MySQL(VPC)mysql_slaverun[Ncloud] DB Down:0, Threshold:== 0, Duration:1min WARNING test mysql_slaverun=0test DB의 Slave 서버가 동기화되지 않음

    Q. Widget 생성 시 메트릭 리스트에 수집되지 않는 메트릭이 포함되어있는 것 같습니다. 표시되는 메트릭의 기준이 무엇인가요?

    A. Widget 생성 시에는 선택한 상품에서 제공하는 모든 메트릭 리스트가 표시됩니다. 현재 수집되지 않는 메트릭을 Widget에 추가하더라도 추후 수집된다면 Widget에 메트릭이 표시됩니다. 단, 메트릭 수집을 위해 추가 설정이 필요한 경우(상세모니터링, Plugin 설정 등), 대상 리소스에 대해 지원하지 않는 메트릭일 경우(Server(Classic), Server(VPC) 상품의 경우 OS별로 제공되지 않는 메트릭이 노출될 수 있습니다. OS 별로 제공하는 메트릭은 메트릭의 설명을 참고하시기 바랍니다.

    Q. 이벤트 발생 내용과 Event 페이지에서 확인한 데이터가 다릅니다. 왜 그런가요?

    A. 콘솔 Event 페이지에서 발생한 이벤트 조회 시 표시되는 그래프는 이벤트 시작 일시와 종료 일시에 따라 조회되는 데이터의 집계 주기(예: Min5)가 다릅니다.
    실제 이벤트 룰을 발생시킨 데이터를 확인하려면 집계 주기가 Min1인 데이터를 확인해야 합니다.
    따라서 별도로 Dashboard를 구성하거나, Event Rule 페이지에서 해당 이벤트 룰을 조회하여 상세 보기를 통해 조회 기간을 1시간 이내로 설정하여 조회하면 Min1 데이터를 확인할 수 있습니다.

    Q. ProcessPlugin을 수집하는 프로세스명 기준은 어떻게 되나요?

    A. ProcessPlugin의 경우, /proc/{pid}/stat 또는 /proc/{pid}/cmdline 기준으로 일치하는 프로세스명의 정보를 수집하고 있습니다.

    Q. 특정 시간대에 이벤트 룰 액션을 정지할 수 있는 방법이 있나요?

    A. Planned Maintenance 기능을 활용하면 Event 발생에 따른 액션을 중지할 수 있습니다.
    비활성화하고자 하는 event rule과 관련된 상품별 디멘션을 설정해주시기 바랍니다.

    Q. Service Dashboard에서 위젯 데이터 TOP 10으로 조회 시 CPU 사용률이 높은 서버 데이터가 CPU 사용률 위젯에 표시되지 않습니다. 왜 그런가요?

    A. Service Dashboard Top10 목록을 선정하는 기준은 아래와 같습니다.

    • 최근 10분의 Min1 metric 값을 조회하여 정렬한 후 상위 10개를 선정
    • 최근 10분의 Min1 데이터가 없다면 임의로 10개를 선정

    위젯 데이터가 TOP 10일 경우, 노출될 서버 목록을 선정해야 하기 때문에 이때 선정을 위해 사용하는 데이터는 (endTime - 10분, endTime) 기간에 조회된 데이터입니다. 해당 데이터는 실제로 대시보드 상에 표기하지 않고, 내부적으로만 사용하는 데이터입니다.
    CPU 사용률이 높은 서버가 TOP 10에서 조회되지 않았다면, 위 기준에 따라 해당 서버의 (endTime - 10분, endTime) 기간의 CPU 사용률 Min1 metric 값이 상위 10개에 포함되지 않은 것일 수 있습니다.
    이처럼, Top10은 설정한 조회 기간의 종료시점(endTime)을 기준으로 10분 전 데이터로 비교하기 때문에 실제 조회하는 전체 기간에서의 기대하는 목록으로 노출되지 않을 수 있습니다.

    Q. 이벤트 발생 후, 조건을 변경하였습니다. 변경한 조건을 만족하지 않지만, 이벤트 발생하였습니다. 이벤트가 왜 발생한건가요?

    A. 기존에 발생한 이벤트가 있을 때, 해당 이벤트의 조건을 변경하게 되면 기존 이벤트가 종료되면서 당시 설정된 조건으로 종료 이벤트 알림을 보내게 됩니다.
    따라서, 조건을 변경해서 발생된 종료 이벤트의 당시 설정한 실제 조건을 확인하려면, 콘솔 Event 페이지에서 조회하여 확인해야 합니다.

    아래 예시는 duration 등을 고려하지 않은 참고를 위한 단순한 예시인 점 참고 부탁드립니다.

    시간process_count조건이벤트 발생 및 내용
    00:000process_count = 1이벤트 미발생
    00:011process_count = 1process_count = 1 내용의 이벤트 알람 발생
    00:021process_count = 0process_count = 0 내용의 종료(Resolve) 이벤트 알람 발생
    00:030process_count = 0process_count = 0 내용의 이벤트 알람 발생

    이 문서가 도움이 되었습니까?

    Changing your password will log you out immediately. Use the new password to log back in.
    First name must have atleast 2 characters. Numbers and special characters are not allowed.
    Last name must have atleast 1 characters. Numbers and special characters are not allowed.
    Enter a valid email
    Enter a valid password
    Your profile has been successfully updated.