Lightsail에서 지표 알람 수신 - Amazon Lightsail

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Lightsail에서 지표 알람 수신

Amazon Lightsail에서 인스턴스, 데이터베이스, 로드 밸런서 및 콘텐츠 전송 네트워크(CDN) 배포에 대한 단일 지표를 감시하는 경보를 만들 수 있습니다. 지정한 임계값에 상대적인 지표 값을 기준으로 경보 알림을 구성할 수 있습니다. 알림은 Lightsail 콘솔에 표시되는 배너, 이메일 주소로 전송되는 이메일, 휴대폰 번호로 전송되는 SMS 문자 메시지 형태로 사용할 수 있습니다. 이 안내서에서는 구성할 수 있는 경보 조건 및 설정을 설명합니다.

목차

경보 구성

Lightsail 콘솔에서 경보를 추가하려면 인스턴스, 데이터베이스, 로드 밸런서 또는 CDN 배포의 지표(Metrics) 탭으로 이동합니다. 그런 다음 모니터링할 지표를 선택하고 Add alarm(경보 추가)을 선택합니다. 지표당 두 개의 경보를 추가할 수 있습니다. 지표에 대한 자세한 내용은 리소스 지표를 참조하세요.

경보를 구성하려면 먼저 임계값을 지정합니다. 임계값은 경보의 상태가 변경되는(예: OK 상태에서 ALARM 상태로 또는 그 반대로 변경) 지점의 지표 값입니다. 자세한 내용은 경보 상태를 참조하십시오. 지표를 임계값과 비교하는 데 사용할 비교 연산자를 선택합니다. 사용 가능한 연산자는 greater than or equal to(크거나 같음), greater than(보다 큼), less than(보다 작음)less than or equal to(작거나 같음)입니다.

그런 다음 임곗값을 초과해야 하는 횟수와 경보 상태가 변경될 때 지표가 평가되는 기간을 지정합니다. Lightsail는 경보 여부를 판단하고자 5분마다 데이터 포인트를 평가하며, 각 데이터 포인트는 5분간 집계된 데이터를 나타냅니다. 예를 들어 임계값을 2회 초과하면 경보가 트리거되도록 지정한 경우 평가 기간은 지난 10분 이상(최대 24시간)이어야 합니다. 임계값을 10회 초과하면 경보가 트리거되도록 지정한 경우 평가 기간은 지난 50분 이상(최대 24시간)이어야 합니다.

경보 조건을 구성한 후 알림을 받는 방법을 구성할 수 있습니다. 경보가 OK 상태에서 ALARM 상태로 바뀌면 항상 Lightsail 콘솔에 알림 배너가 표시됩니다. 이메일 및 SMS 문자 메시지로 알림을 받도록 선택할 수도 있지만 알림 연락처를 구성해야 합니다. 자세한 내용은 지표 알림을 참조하세요. 이메일 및/또는 SMS 문자 메시지로 알림을 받기로 선택한 경우 경보 상태가 ALARM 상태에서 OK 상태로 변경될 때에도 알림을 받도록 설정할 수 있습니다. 이 알림은 모두 지우기 알림입니다.

경보에 대한 고급 설정에서 Lightsail이 누락된 지표 데이터를 처리하는 방법을 선택할 수 있습니다. 자세한 내용은 경보가 누락 데이터를 처리하는 방법 구성을 참조하세요.

경보 상태

경보는 항상 다음 상태 중 하나입니다.

  • ALARM - 지표가 정의된 임곗값을 벗어났습니다.

    예를 들어, greater than(보다 큼) 비교 연산자를 선택하면 지표가 지정된 임계값보다 클 때 경보가 ALARM 상태가 됩니다. less than(보다 작음) 비교 연산자를 선택하면 지표가 지정된 임계값보다 작을 때 경보가 ALARM 상태가 됩니다.

  • OK - 측정치가 정의된 임곗값 내에 있습니다.

    예를 들어, greater than(보다 큼) 비교 연산자를 선택하면 지표가 지정된 임계값보다 작을 때 경보가 OK 상태가 됩니다. less than(보다 작음) 비교 연산자를 선택하면 지표가 지정된 임계값보다 클 때 경보가 OK 상태가 됩니다.

  • INSUFFICIENT_DATA - 경보가 방금 시작되었거나, 지표를 사용할 수 없거나, 지표를 통해 경보 상태를 결정하는 데 사용할 충분한 데이터가 없습니다.

경보는 상태가 변경되는 경우에만 트리거되며, 경보는 단순히 특정 상태이기 때문에 트리거되는 것이 아니며, 상태가 변경되어야만 트리거됩니다. 경보가 트리거되면 Lightsail 콘솔에 배너가 표시됩니다. 이메일 및 SMS 문자 메시지로 알림을 받도록 경보를 구성할 수도 있습니다.

경보 예

앞에서 설명한 경보 조건을 염두에 두고 인스턴스의 CPU 사용률이 5분 동안 1회 5% 이상일 때 ALARM 상태가 되는 경보를 구성할 수 있습니다. 다음 예에서는 Lightsail 콘솔에서 이 경보를 설정하는 것을 보여 줍니다.


        CPU 사용률 경보의 예.

이 예에서 인스턴스의 CPU 사용률 지표가 단 하나의 데이터 포인트에서 5% 이상의 사용률로 보고되면 경보가 OK 상태에서 ALARM 상태로 변경됩니다. 사용률이 5% 이상으로 보고된 이후의 각 데이터 포인트에서는 경보가 ALARM 상태로 유지됩니다. 인스턴스의 CPU 사용률 지표가 단 하나의 데이터 포인트에서 4.9% 이하의 사용률로 보고되면 경보가 ALARM 상태에서 OK 상태로 변경됩니다.

다음 그래프는 이 경보를 더 자세히 보여줍니다. 빨간색 점선은 5% CPU 사용률 임계값을 나타내고 파란색 점은 지표 데이터 포인트를 나타냅니다. 첫 번째 데이터 포인트에서는 경보가 OK 상태입니다. 두 번째 데이터 포인트에서는 데이터 포인트가 임계값보다 크기 때문에 경보가 ALARM 상태로 변경됩니다. 세 번째 및 네 번째 데이터 포인트에서는 계속 데이터 포인트가 임계값보다 크기 때문에 ALARM 상태가 유지됩니다. 다섯 번째 데이터 포인트에서는 데이터 포인트가 임계값보다 작기 때문에 경보가 OK 상태로 변경됩니다.


        경고 지표의 예.

경보가 누락 데이터를 처리하는 방법 구성

종종 특정 지표에 대한 경보 데이터 포인트 가운데 일부가 보고되지 않는 경우도 있습니다. 예를 들어 연결이 끊어지거나 서버가 중단되면 이러한 문제가 발생할 수 있습니다.

Lightsail에서는 경보를 구성할 때 누락 데이터 포인트를 처리하는 방법을 지정할 수 있습니다. 이렇게 하면 모니터링 중인 데이터 유형에 적합한 ALARM 상태로 경보를 구성할 수 있습니다. 누락된 데이터에 문제가 없는 경우의 거짓 긍정을 피할 수 있습니다.

각 경보가 항상 세 가지 상태 중 하나인 것과 마찬가지로, 보고된 각각의 특정 데이터 포인트는 세 가지 범주 중 하나에 속합니다.

  • 위반하지 않음 - 데이터 포인트가 임곗값 내에 있습니다.

    예를 들어, greater than(보다 큼) 비교 연산자를 선택하면 데이터 포인트가 지정된 임계값보다 작을 때 Not breaching 범주가 됩니다. less than(보다 작음) 비교 연산자를 선택하면 데이터 포인트가 지정된 임계값보다 클 때 Not breaching 범주가 됩니다.

  • 위반 - 데이터 포인트가 임곗값을 벗어났습니다.

    예를 들어, greater than(보다 큼) 비교 연산자를 선택하면 데이터 포인트가 지정된 임계값보다 클 때 Breaching 범주가 됩니다. less than(보다 작음) 비교 연산자를 선택하면 데이터 포인트가 지정된 임계값보다 작을 때 Breaching 범주가 됩니다.

  • 누락 - 데이터 포인트 누락에 대한 동작은 treat missing data 파라미터로 지정됩니다.

각 경보에 대해 다음 중 하나로 누락된 데이터 포인트가 처리되도록 Lightsail를 지정할 수 있습니다.

  • 위반하지 않음 - 누락 데이터 포인트를 '양호'하고 임곗값 내에 있는 것으로 처리합니다.

  • 위반 - 누락 데이터 포인트를 '불량'하고 임곗값을 위반한 것으로 처리합니다.

  • 무시 - 현재 경보 상태를 유지합니다.

  • 누락 - 경보가 상태 변경 여부를 평가할 때 누락 데이터 포인트를 고려하지 않습니다. 이는 경보의 기본 동작입니다.

최고의 옵션은 지표 유형에 따라 다릅니다. 인스턴스의 CPU 사용률과 같은 지표의 경우 누락 데이터 포인트를 위반으로 처리하는 것이 좋을 수 있습니다. 누락 데이터 포인트가 문제를 나타낼 수 있기 때문입니다. 그러나 로드 밸런서의 HTTP 500 서버 오류 수와 같이 오류가 발생한 경우에만 데이터 포인트를 생성하는 지표의 경우 누락 데이터를 위반하지 않음으로 처리하는 것이 좋을 수 있습니다.

경보에 대한 최상의 옵션을 선택하면 불필요하고 오해의 소지가 있는 경보 조건 변경을 막을 수 있으며, 시스템 상태를 보다 정확하게 나타낼 수 있습니다.

데이터가 누락되었을 때 경보 상태 평가 방법

Lightsail은 경보 상태 변경 여부를 평가할 때 누락 데이터를 처리하는 방법에 대해 설정한 값에 상관없이 Evaluation Periods(평가 기간)에서 지정한 것보다 더 큰 데이터 포인트 수를 검색하려 시도합니다. 검색하려고 시도하는 데이터 포인트 수는 경보 기간의 길이에 따라 다릅니다. 검색을 시도하는 데이터 포인트의 기간이 평가 범위입니다.

Lightsail이 이런 데이터 포인트를 검색한 후에는 다음이 진행됩니다.

  • 평가 범위 동안 누락된 데이터 포인트가 없는 경우 Lightsail는 가장 최근 수집한 데이터 포인트에 따라 경보를 평가합니다.

  • 평가 범위 동안 일부 데이터 포인트가 누락되었지만 수집한 기존 데이터 포인트의 수가 경보 Evaluation Periods(평가 기간) 수보다 많거나 같은 경우, Lightsail은 성공적으로 수집한 가장 최근의 기존 데이터 포인트에 따라 경보 상태를 평가합니다. 이 경우 누락 데이터 처리 방법에 대한 값이 필요 없으며, 이를 무시합니다.

  • 평가 범위 동안 일부 데이터 포인트가 누락되었으며 수집한 기존 데이터 포인트의 수가 경보 Evaluation Periods(평가 기간) 수보다 적은 경우, Lightsail은 사용자가 누락 데이터 처리 방법에 대해 지정한 값으로 누락 데이터 포인트를 채운 다음 경보를 평가합니다. 하지만 보고 시기에 상관없이 평가 범위 동안의 실제 데이터 포인트는 모두 평가에 포함시킵니다. Lightsail는 가능한 몇 회만 누락 데이터 포인트를 사용합니다.

이 모든 상황에서 평가된 데이터 포인트의 수는 Evaluation periods(평가 기간)의 값과 동일합니다. Datapoints to alarm(경보에 대한 데이터 포인트)의 값보다 작은 값만 위반된 경우 경보 상태는 OK로 설정됩니다. 나머지 경우는 경보로 설정됩니다.

참고

이 동작은 특별한 경우 지표 흐름이 멈춘 후에도 Lightsail 경보 기능이 일정 시간 동안 최종 데이터 포인트 세트를 계속해서 다시 평가할 수 있습니다. 이 재평가를 통해 지표 스트림 중지 직전에 상태가 변한 경우 경보가 상태를 변경하고 작업을 다시 실행할 수 있습니다. 이 동작을 완화하려면 더 짧은 기간을 사용하십시오.

그래프 예의 누락 데이터

이 단원의 다음 그래프는 경보 평가 동작의 예를 보여 줍니다. 그래프 A, B, C, D 및 E에서 경보에 대한 위반 데이터 포인트 수와 평가 기간은 모두 3입니다. 빨간색 점선은 임계값을 나타내고, 파란색 점은 유효한 데이터 포인트를 나타내며, 파선은 누락 데이터를 나타냅니다. 임계값 선 위의 데이터 포인트는 위반이고 임계값 아래 데이터 포인트는 위반이 아닙니다. 가장 최근의 세 데이터 포인트 중 일부가 누락된 경우 Lightsail은 유효한 추가 데이터 포인트를 검색하려고 시도합니다.

참고

경보를 생성한 직후에 데이터 포인트가 누락되었으며 경보를 생성하기 전에 Lightsail에 지표가 보고된 경우, Lightsail는 경보가 생성되기 전 가장 최근의 데이터 포인트를 검색해 경보를 평가합니다.

그래프 A


          그래프 A의 누락 데이터.

앞의 그래프로 표시된 지표에서 데이터 포인트 1은 임계값 내에 있고, 데이터 포인트 2는 누락되었고, 데이터 포인트 3은 위반이고, 데이터 포인트 4는 누락되었고, 데이터 포인트 5는 위반입니다. 평가 범위에 유효한 데이터 포인트가 3개 있으므로 이 지표에는 누락 데이터 포인트가 없습니다. 누락 데이터 포인트를 다음과 같이 처리하도록 경보를 구성한 경우:

  • 위반하지 않음 - 경보가 OK 상태입니다.

  • 위반 - 경보가 OK 상태입니다.

  • 무시 - 경보가 OK 상태입니다.

  • 누락 - 경보가 OK 상태입니다.

그래프 B


          그래프 B의 누락 데이터.

앞의 그래프로 표시된 지표에서 데이터 포인트 1은 임계값 내에 있고 데이터 포인트 2~5는 누락되었습니다. 평가 범위에 데이터 포인트가 하나만 있으므로 이 지표에는 누락 데이터 포인트가 두 개 있습니다. 누락 데이터 포인트를 다음과 같이 처리하도록 경보를 구성한 경우:

  • 위반하지 않음 - 경보가 OK 상태입니다.

  • 위반 - 경보가 OK 상태입니다.

  • 무시 - 경보가 OK 상태입니다.

  • 누락 - 경보가 OK 상태입니다.

이 시나리오에서는 누락 데이터가 위반으로 처리되더라도 경보가 OK 상태로 유지됩니다. 이는 하나의 기존 데이터 포인트가 위반되지 않고 위반으로 처리되는 두 개의 누락 데이터 포인트와 함께 평가되기 때문입니다. 다음에 이 경보를 평가할 때 데이터가 여전히 누락된 경우 ALARM 상태로 변경됩니다. 이는 검색된 최근 데이터 포인트 5개에 위반하지 않는 데이터 포인트가 더 이상 없기 때문입니다.

그래프 C


          그래프 C의 누락 데이터.

앞의 그래프로 표시된 지표에서 모든 데이터 포인트가 누락되었습니다. 평가 범위에서 모든 데이터 포인트가 누락되었으므로 이 지표에는 누락 데이터 포인트가 3개 있습니다. 누락 데이터 포인트를 다음과 같이 처리하도록 경보를 구성한 경우:

  • 위반하지 않음 - 경보가 OK 상태입니다.

  • 위반 - 경보가 ALARM 상태입니다.

  • 무시 - 경보가 현재 상태를 유지합니다.

  • 누락 - 경보가 INSUFFICIENT_DATA 상태입니다.

그래프 D


          그래프 D의 누락 데이터.

앞의 그래프로 표시된 지표에서 데이터 포인트 1은 임계값 내에 있고, 데이터 포인트 2는 위반이고, 데이터 포인트 3은 위반이고, 데이터 포인트 4는 누락되었고, 데이터 포인트 5는 위반입니다. 평가 범위에 유효한 데이터 포인트가 4개 있으므로 이 지표에는 누락 데이터 포인트가 없습니다. 누락 데이터 포인트를 다음과 같이 처리하도록 경보를 구성한 경우:

  • 위반하지 않음 - 경보가 ALARM 상태입니다.

  • 위반 - 경보가 ALARM 상태입니다.

  • 무시 - 경보가 ALARM 상태입니다.

  • 누락 - 경보가 ALARM 상태입니다.

이 시나리오에서는 경보가 모든 경우에 ALARM 상태가 됩니다. 실제 데이터 포인트가 충분해 누락 데이터 처리 방법에 대한 설정이 필요 없어 무시되기 때문입니다.

그래프 E


          그래프 E의 누락 데이터.

앞의 그래프로 표시된 지표에서 데이터 포인트 1과 2는 누락되었고, 데이터 포인트 3은 위반이고, 데이터 포인트 4와 5는 누락되었습니다. 평가 범위에 데이터 포인트가 하나만 있으므로 이 지표에는 누락 데이터 포인트가 두 개 있습니다. 누락 데이터 포인트를 다음과 같이 처리하도록 경보를 구성한 경우:

  • 위반하지 않음 - 경보가 OK 상태입니다.

  • 위반 - 경보가 ALARM 상태입니다.

  • 무시 - 경보가 현재 상태를 유지합니다.

  • 누락 - 경보가 ALARM 상태입니다.

그래프 F, G, H, I 및 J에서 Datapoints to alarm(경보에 대한 데이터 포인트)는 2이고 Evaluation periods(평가 기간)는 3입니다. 3중 2이며, N 경보 중 M입니다. 5는 경보의 평가 범위입니다.

그래프 F


          그래프 F의 누락 데이터.

앞의 그래프로 표시된 지표에서 데이터 포인트 1은 임계값 내에 있고, 데이터 포인트 2는 누락되었고, 데이터 포인트 3은 위반이고, 데이터 포인트 4는 누락되었고, 데이터 포인트 5는 위반입니다. 평가 범위에 데이터 포인트가 3개 있으므로 이 지표에는 누락 데이터 포인트가 없습니다. 누락 데이터 포인트를 다음과 같이 처리하도록 경보를 구성한 경우:

  • 위반하지 않음 - 경보가 ALARM 상태입니다.

  • 위반 - 경보가 ALARM 상태입니다.

  • 무시 - 경보가 ALARM 상태입니다.

  • 누락 - 경보가 ALARM 상태입니다.

그래프 G


          그래프 G의 누락 데이터.

앞의 그래프로 표시된 지표에서 데이터 포인트 1과 2는 임계값 내에 있고, 데이터 포인트 3은 위반이고, 데이터 포인트 4는 임계값 내에 있고, 데이터 포인트 5는 위반입니다. 평가 범위에 데이터 포인트가 5개 있으므로 이 지표에는 누락 데이터 포인트가 없습니다. 누락 데이터 포인트를 다음과 같이 처리하도록 경보를 구성한 경우:

  • 위반하지 않음 - 경보가 ALARM 상태입니다.

  • 위반 - 경보가 ALARM 상태입니다.

  • 무시 - 경보가 ALARM 상태입니다.

  • 누락 - 경보가 ALARM 상태입니다.

그래프 H


          그래프 H의 누락 데이터.

앞의 그래프로 표시된 지표에서 데이터 포인트 1은 임계값 내에 있고, 데이터 포인트 2는 누락되었고, 데이터 포인트 3은 위반이고, 데이터 포인트 4와 5는 누락되었습니다. 평가 범위에 데이터 포인트가 2개 있으므로 이 지표에는 누락 데이터 포인트가 하나 있습니다. 누락 데이터 포인트를 다음과 같이 처리하도록 경보를 구성한 경우:

  • 위반하지 않음 - 경보가 OK 상태입니다.

  • 위반 - 경보가 ALARM 상태입니다.

  • 무시 - 경보가 OK 상태입니다.

  • 누락 - 경보가 OK 상태입니다.

그래프 I


          그래프 I의 누락 데이터.

앞의 그래프로 표시된 지표에서 데이터 포인트 1~4는 누락되었고 데이터 포인트 5는 임계값 내에 있습니다. 평가 범위에 데이터 포인트가 하나 있으므로 이 지표에는 누락 데이터 포인트가 두 개 있습니다. 누락 데이터 포인트를 다음과 같이 처리하도록 경보를 구성한 경우:

  • 위반하지 않음 - 경보가 OK 상태입니다.

  • 위반 - 경보가 ALARM 상태입니다.

  • 무시 - 경보가 OK 상태입니다.

  • 누락 - 경보가 OK 상태입니다.

그래프 J


          그래프 J의 누락 데이터.

앞의 그래프로 표시된 지표에서 데이터 포인트 1과 2는 누락되었고, 데이터 포인트 3은 위반이고, 데이터 포인트 4와 5는 누락되었습니다. 평가 범위에 데이터 포인트가 하나 있으므로 이 지표에는 누락 데이터 포인트가 두 개 있습니다. 누락 데이터 포인트를 다음과 같이 처리하도록 경보를 구성한 경우:

  • 위반하지 않음 - 경보가 OK 상태입니다.

  • 위반 - 경보가 ALARM 상태입니다.

  • 무시 - 경보가 현재 상태를 유지합니다.

  • 누락 - 경보가 ALARM 상태입니다.

경보에 대한 자세한 정보

다음은 Lightsail에서 경보를 관리하는 데 도움을 주는 몇 가지 항목입니다.