Amazon Lightsail 리소스 모니터링 - Amazon Lightsail

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon Lightsail 리소스 모니터링

지표 데이터를 확인하고 수집하여 Amazon Lightsail에서 인스턴스, 데이터베이스, 배포, 로드 밸런서, 컨테이너 서비스 및 버킷의 성능을 모니터링할 수 있습니다. 시간 경과에 따른 기준을 설정하여 경보를 구성하면 리소스 성능과 관련된 이상 및 문제를 보다 쉽게 탐지할 수 있습니다.

Amazon Lightsail에서는 인스턴스, 데이터베이스, 콘텐츠 전송 네트워크(CDN) 배포, 로드 밸런서, 컨테이너 서비스 및 버킷에 대한 지표 데이터를 보고합니다. Lightsail 콘솔에서 이 데이터를 보고 모니터링할 수 있습니다. 모니터링은 리소스의 안정성, 가용성 및 성능을 유지하는 데 중요한 부분입니다. 리소스에서 지표 데이터를 정기적으로 모니터링하고 수집하면 다중 지점 오류가 발생할 경우 보다 쉽게 디버깅할 수 있습니다.

목차

효과적으로 리소스 모니터링

사용자 환경에서 정상적인 리소스 성능에 대한 기준을 설정해야 합니다. 다양한 시간과 다양한 부하 조건에서 성능을 측정합니다. 리소스를 모니터링할 때 시간 경과에 따른 리소스 성능 기록을 작성해 두어야 합니다. 리소스의 현재 성능을 수집한 기록 데이터와 비교합니다. 이를 통해 정상적인 성능 패턴과 성능 이상을 식별하고 해결 방법을 고안할 수 있습니다.

예를 들어 인스턴스에 대해 CPU 사용률, 네트워크 사용률 및 상태 확인을 모니터링할 수 있습니다. 설정한 기준 이하로 성능이 떨어지면 인스턴스를 재구성하거나 최적화하여 CPU 사용률을 줄이거나 네트워크 트래픽을 줄일 수 있습니다. 인스턴스가 지속적으로 CPU 사용률 임계값을 초과하여 작동하는 경우 인스턴스 플랜을 더 큰 플랜으로 전환하는 것이 좋을 수 있습니다(예: 3.50 USD/월 플랜 대신 5 USD/월 플랜 사용). 인스턴스의 새 스냅샷을 생성한 다음 더 큰 플랜을 사용해 스냅샷에서 새 인스턴스를 생성하여 더 큰 플랜으로 전환할 수 있습니다.

기준을 설정한 후에는 리소스가 지정된 임계값을 벗어날 때 알림을 받도록 Lightsail 콘솔에서 경보를 구성할 수 있습니다. 자세한 내용은 알림경보를 참조하세요.

지표 개념 및 용어

다음 용어와 개념은 Lightsail에서 지표의 사용을 보다 정확하게 이해하는 데 도움이 됩니다.

지표

지표는 시간 순서별 데이터 포인트 집합을 나타냅니다. 지표를 모니터링할 변수로 생각하면 데이터 포인트는 시간에 따른 변수의 값을 나타냅니다. 지표는 이름으로 고유하게 정의됩니다. 예를 들어 Lightsail에서 제공하는 일부 인스턴스 지표에는 CPU 사용률(CPUUtilization), 수신 네트워크 트래픽(NetworkIn) 및 송신 네트워크 트래픽(NetworkOut)이 포함됩니다. Lightsail에서 사용 가능한 모든 리소스 지표에 대한 자세한 내용은 Lightsail에서 사용할 수 있는 지표를 참조하십시오.

지표 보존 기간

기간이 60초(1분 분해능)로 설정된 데이터 포인트는 15일 동안 사용이 가능합니다. 기간이 300초(5분 분해능)로 설정된 데이터 포인트는 63일 동안 사용이 가능합니다. 기간이 3,600초(1시간 분해능)로 설정된 데이터 포인트는 455일(15개월) 동안 사용이 가능합니다.

원래 더 짧은 기간 동안 사용 가능한 데이터 포인트는 장기 보관을 위해 집계됩니다. 예를 들어 세부 수준이 1분인 데이터 포인트는 1분 분해능으로 15일 동안 사용할 수 있습니다. 15일 이후에는 이 데이터를 계속 사용할 수 있지만 데이터가 5분 분해능으로 집계됩니다. 63일 이후에는 이 데이터가 추가로 집계되어 1시간 분해능으로 제공됩니다. 이 기간보다 더 오랫동안 지표를 유지해야 하는 경우 Lightsail API, AWS Command Line Interface(AWS CLI) 및 SDK를 사용하여 데이터 포인트를 오프라인 또는 다른 스토리지에서 검색할 수 있습니다.

자세한 내용은 Lightsail API 참조GetInstanceMetricData, GetBucketMetricData, GetLoadBalancerMetricData, GetDistributionMetricData, GetRelationalDatabaseMetricData를 참조하세요.

통계

지표 통계는 일정 기간에 걸쳐 데이터를 집계하는 데 사용됩니다. 통계의 예로는 Average, SumMaximum이 있습니다. 예를 들어, Average 통계를 사용하여 인스턴스 CPU 사용률 지표 데이터의 평균을 구할 수 있고, Sum 통계를 사용하여 데이터베이스 연결을 추가할 수 있으며, Maximum 통계를 사용하여 최대 로드 밸런서 응답 시간을 검색할 수 있습니다.

사용 가능한 지표 통계 목록은 Lightsail API 참조GetInstanceMetricData 통계, GetBucketMetricData 통계, GetLoadBalancerMetricData 통계, GetDistributionMetricData 통계, GetRelationalDatabaseMetricData 통계를 참조하세요.

단위

각각의 통계는 측정 단위를 가지고 있습니다. 단위로는 Bytes, Seconds, CountPercent가 있습니다. 전체 단위 목록을 알아보려면 Lightsail API 참조GetInstanceMetricData의 단위, GetLoadBalancerMetricData의 단위, GetDistributionMetricData의 단위GetRelationalDatabaseMetricData의 단위를 참조하세요.

기간

기간은 특정 데이터 포인트와 관련된 시간의 길이로, 반환된 데이터 포인트의 세밀도 수준을 나타냅니다. 각 데이터 포인트는 지정한 기간에 걸쳐 수집된 지표 데이터의 집계를 나타냅니다. 기간은 초 단위로 정의되며 기간의 유효한 값은 60초(1분) 및 300초(5분)의 배수입니다.

Lightsail API를 사용하여 데이터 포인트를 검색하는 경우 기간, 시작 시간 및 종료 시간을 지정할 수 있습니다. 이들 파라미터는 데이터 포인트와 연관된 전체 기간을 결정합니다. Lightsail는 지표 데이터를 1분 또는 5분 단위로 보고합니다. 따라서 기간을 60초와 300초의 배수로 지정해야 합니다. 시작 시간과 종료 시간에 값을 지정하여 Lightsail에서 값이 반환되는 기간의 수를 결정할 수 있습니다. 10분 단위로 집계된 통계를 선호할 경우에는 기간을 600으로 지정합니다. 전체 시간 동안 통계를 집계하고 싶은 경우에는 기간을 3,600 등으로 지정합니다.

기간은 Lightsail 경보에도 중요합니다. Lightsail는 경보 여부를 판단하고자 5분마다 데이터 포인트를 평가하며, 경보에 대한 각 데이터 포인트는 5분간 집계된 데이터를 나타냅니다. 특정 지표를 모니터링하도록 경보를 생성하면 Lightsail이 해당 지표를 지정된 임계값과 비교하게 됩니다. Lightsail에서 비교하는 방식을 광범위하게 제어할 수 있습니다. 비교 작업이 수행되는 기간을 지정할 수 있을 뿐 아니라, 결론에 도달하기까지 사용되는 평가 기간의 수를 지정할 수 있습니다. 자세한 내용은 경보 단원을 참조하십시오.

경보

경보는 지정된 기간 동안 단일 지표를 감시하고 지표가 지정한 임계값을 초과할 때 사용자에게 알립니다. 알림은 Lightsail 콘솔에 표시되는 배너, 지정한 이메일 주소로 전송되는 이메일 및 지정한 휴대폰 번호로 전송되는 SMS 문자 메시지 형태로 사용할 수 있습니다. 자세한 내용은 경보 단원을 참조하십시오.

Lightsail에서 사용할 수 있는 지표

인스턴스 지표

다음과 같은 인스턴스 지표를 사용할 수 있습니다. 자세한 내용은 Amazon Lightsail의 인스턴스 지표 보기를 참조하십시오.

  • CPU 사용률(CPUUtilization) - 인스턴스에서 현재 사용 중인 할당된 컴퓨팅 유닛의 비율(%)입니다. 이 지표는 인스턴스에서 애플리케이션을 실행하는 처리 능력을 식별합니다. 인스턴스에 전체 프로세스 코어가 할당되지 않았을 때 운영 체제의 도구에서 비율이 Lightsail보다 낮게 표시할 수 있습니다.

    Lightsail 콘솔에서 인스턴스의 CPU 사용률 지표 그래프를 보면 지속 가능 영역과 버스트 가능 영역이 있습니다. 이러한 영역의 의미에 대한 자세한 내용은 CPU 사용률 지속 가능 및 버스트 가능 영역을 참조하십시오.

  • 버스트 용량(분)(BurstCapacityTime) 및 백분율(BurstCapacityPercentage) - 버스트 용량(분)은 인스턴스가 100% CPU 사용률로 버스트할 수 있는 시간을 나타냅니다. 버스트 용량 백분율은 인스턴스에 사용할 수 있는 CPU 성능의 백분율입니다. 인스턴스는 지속적으로 버스트 용량을 소비하고 누적합니다. 버스트 용량(분)은 인스턴스가 100% CPU 사용률로 작동하는 경우에만 전체 비율로 소비됩니다. 인스턴스 버스트 용량에 대한 자세한 내용은 Amazon Lightsail에서 인스턴스 버스트 용량 보기를 참조하십시오.

  • 수신 네트워크 트래픽(NetworkIn) - 인스턴스가 모든 네트워크 인터페이스에서 수신한 바이트 수입니다. 이 지표는 단일 인스턴스로 들어오는 네트워크 트래픽의 볼륨을 식별합니다. 보고된 숫자는 해당 기간에 수신된 바이트 수입니다. 이 지표는 5분 간격으로 보고되므로 보고된 숫자를 300으로 나누어 초당 바이트 수를 구합니다.

  • 송신 네트워크 트래픽(NetworkOut) - 인스턴스가 모든 네트워크 인터페이스에서 보낸 바이트 수입니다. 이 지표는 단일 인스턴스에서 나가는 네트워크 트래픽의 볼륨을 식별합니다. 보고된 숫자는 해당 기간에 전송된 바이트 수입니다. 이 지표는 5분 간격으로 보고되므로 보고된 숫자를 300으로 나누어 초당 바이트 수를 구합니다.

  • 상태 확인 실패(StatusCheckFailed) - 인스턴스가 인스턴스 상태 확인 및 시스템 상태 확인을 통과했는지 여부를 보고합니다. 이 지표는 0(통과) 또는 1(실패)이 될 수 있습니다. 이 지표는 1분 간격으로 제공됩니다.

  • 인스턴스 상태 확인 실패(StatusCheckFailed_Instance) - 인스턴스가 인스턴스 상태 확인을 통과했는지 여부를 보고합니다. 이 지표는 0(통과) 또는 1(실패)이 될 수 있습니다. 이 지표는 1분 간격으로 제공됩니다.

  • 시스템 상태 확인 실패(StatusCheckFailed_System) - 인스턴스가 시스템 상태 확인을 통과했는지 여부를 보고합니다. 이 지표는 0(통과) 또는 1(실패)이 될 수 있습니다. 이 지표는 1분 간격으로 제공됩니다.

  • 토큰 메타데이터 요청 없음(MetadataNoToken) - 토큰 없이 인스턴스 메타데이터 서비스에 성공적으로 액세스한 횟수입니다. 이 메트릭은 토큰을 사용하지 않는 인스턴스 메타데이터 서비스 버전 1을 사용하여 인스턴스 메타데이터에 액세스하는 프로세스가 있는지 확인합니다. 모든 요청이 인스턴스 메타데이터 서비스 버전 2와 같은 토큰 지원 세션을 사용하는 경우 값은 0입니다. 자세한 내용은 Amazon Lightsail의 인스턴스 메타데이터 및 사용자 데이터를 참조하세요.

데이터베이스 지표

다음과 같은 데이터베이스 지표를 사용할 수 있습니다. 자세한 내용은 Amazon Lightsail의 데이터베이스 지표 보기를 참조하십시오.

  • CPU 사용률(CPUUtilization) - 데이터베이스에서 현재 사용 중인 CPU 사용률입니다.

  • 데이터베이스 연결(DatabaseConnections) - 사용 중인 데이터베이스 연결 수입니다.

  • 디스크 대기열 깊이(DiskQueueDepth) - 디스크에 액세스하기 위해 대기 중인 IO(읽기/쓰기 요청) 수입니다.

  • 여유 스토리지 공간(FreeStorageSpace) - 사용 가능한 스토리지 공간 크기입니다.

  • 네트워크 수신 처리량(NetworkReceiveThroughput) - 모니터링 및 복제에 사용되는 고객 데이터베이스 트래픽과 AWS 트래픽을 모두 포함하여 데이터베이스에 수신되는 네트워크 트래픽입니다.

  • 네트워크 송신 처리량(NetworkTransmitThroughput) - 모니터링 및 복제에 사용되는 고객 데이터베이스 트래픽과 AWS 트래픽을 모두 포함하여 데이터베이스에서 송신되는 네트워크 트래픽입니다.

배포 지표

사용할 수 있는 배포 지표는 아래와 같습니다. 자세한 내용은 Amazon Lightsail에서 배포 지표 확인을 참조하세요.

  • 요청(Requests) - 모든 HTTP 메소드 및 HTTP와 HTTPS 요청 모두에 대해 배포가 받은 총 뷰어 요청 수입니다.

  • 업로드한 바이트(BytesUploaded) - POST 및 PUT 요청을 사용하여 배포가 오리진으로 업로드한 바이트 수입니다.

  • 다운로드한 바이트(BytesDownloaded) - GET, HEAD 및 OPTIONS 요청에 대해 뷰어가 다운로드한 바이트 수입니다.

  • 총 오류율(TotalErrorRate) - 응답의 HTTP 상태 코드가 4xx 또는 5xx인 모든 뷰어 요청의 백분율입니다.

  • HTTP 4xx 오류율(4xxErrorRate) - 응답의 HTTP 상태 코드가 4xx인 모든 뷰어 요청의 백분율입니다. 이러한 경우 클라이언트 또는 클라이언트 뷰어가 오류를 일으켰을 수 있습니다. 예를 들어, 404 상태 코드(찾을 수 없음)는 클라이언트가 찾을 수 없는 객체를 요청했음을 의미합니다.

  • HTTP 5xx 오류율(5xxErrorRate) - 응답의 HTTP 상태 코드가 5xx인 모든 뷰어 요청의 백분율입니다. 이러한 경우 원본 서버가 요청을 충족하지 못한 것입니다. 예를 들어, 503 상태 코드(서비스를 사용할 수 없음)는 원본 서버를 현재 사용할 수 없음을 의미합니다.

로드 밸런서 지표

다음과 같은 로드 밸런서 지표를 사용할 수 있습니다. 자세한 내용은 Amazon Lightsail의 로드 밸런서 지표 보기를 참조하십시오.

  • 정상 호스트 수(HealthyHostCount) - 정상으로 간주되는 대상 인스턴스 수입니다.

  • 비정상 호스트 수(UnhealthyHostCount) - 비정상으로 간주되는 대상 인스턴스 수입니다.

  • 로드 밸런서 HTTP 4XX(HTTPCode_LB_4XX_Count) - 로드 밸런서에서 생성된 HTTP 4XX 클라이언트 오류 코드 수입니다. 클라이언트 오류는 요청 형식이 잘못되었거나 불완전할 때 생성됩니다. 이러한 요청은 대상 인스턴스에서 수신되지 않습니다. 대상 인스턴스에서 생성된 응답 코드는 이 숫자에 포함되지 않습니다.

  • 로드 밸런서 HTTP 5XX(HTTPCode_LB_5XX_Count) - 로드 밸런서에서 생성된 HTTP 5XX 서버 오류 코드 수입니다. 대상 인스턴스에서 생성된 응답 코드는 여기에 포함되지 않습니다. 이 지표는 로드 밸런서에 정상 인스턴스가 연결되어 있지 않거나 요청 속도가 인스턴스 용량을 초과하거나(스필오버) 또는 로드 밸런서 용량을 초과하는 경우에 보고됩니다.

  • 인스턴스 HTTP 2XX(HTTPCode_Instance_2XX_Count) - 대상 인스턴스에서 생성된 HTTP 2XX 응답 코드 수입니다. 단, 로드 밸런서에서 생성된 응답 코드 수는 여기에 포함되지 않습니다.

  • 인스턴스 HTTP 3XX(HTTPCode_Instance_3XX_Count) - 대상 인스턴스에서 생성된 HTTP 3XX 응답 코드 수입니다. 단, 로드 밸런서에서 생성된 응답 코드 수는 여기에 포함되지 않습니다.

  • 인스턴스HTTP 4XX(HTTPCode_Instance_4XX_Count) - 대상 인스턴스에서 생성된 HTTP 4XX 응답 코드 수입니다. 단, 로드 밸런서에서 생성된 응답 코드 수는 여기에 포함되지 않습니다.

  • 인스턴스 HTTP 5XX(HTTPCode_Instance_5XX_Count) - 대상 인스턴스에서 생성된 HTTP 5XX 응답 코드 수입니다. 단, 로드 밸런서에서 생성된 응답 코드 수는 여기에 포함되지 않습니다.

  • 인스턴스 응답 시간(InstanceResponseTime) - 로드 밸런서에서 요청을 보낸 후 대상 인스턴스로부터 응답 신호를 받을 때까지의 경과 시간(초)입니다.

  • 클라이언트 TLS 협상 오류 수(ClientTLSNegotiationErrorCount) - 로드 밸런서에서 생성된 TLS 오류로 인해 로드 밸런서에서 세션을 설정하지 않은 클라이언트에서 시작된 TLS 연결 수입니다. 가능한 원인으로는 암호 또는 프로토콜 불일치가 있습니다.

  • 요청 수(RequestCount) - IPv4를 통해 처리된 요청 수입니다. 로드 밸런서의 대상 인스턴스에서 응답을 생성한 요청만 이 개수에 포함됩니다.

  • 거부된 연결 수(RejectedConnectionCount) - 로드 밸런서가 최대 연결 수에 도달하여 거부된 연결 수입니다.

컨테이너 서비스 지표

사용할 수 있는 컨테이너 서비스 지표는 다음과 같습니다. 자세한 내용은 컨테이너 서비스 지표 확인을 참조하세요.

  • CPU 사용률(CPUUtilization) - 컨테이너 서비스의 모든 노드에서 현재 사용 중인 컴퓨팅 유닛의 평균 백분율입니다. 이 지표는 컨테이너 서비스에서 컨테이너를 실행하는 데 필요한 처리 능력을 나타냅니다.

  • 메모리 사용률(MemoryUtilization) - 컨테이너 서비스의 모든 노드에서 현재 사용 중인 메모리의 평균 백분율입니다. 이 지표는 컨테이너 서비스에서 컨테이너를 실행하는 데 필요한 메모리를 나타냅니다.

버킷 지표

사용할 수 있는 버킷 지표는 아래와 같습니다. 자세한 내용은 Amazon Lightsail에서 버킷 지표 확인을 참조하세요.

  • 버킷 크기(BucketSizeBytes) - 버킷에 저장된 데이터의 양입니다. 이 값은 버킷에 대한 모든 불완전 멀티파트 업로드의 모든 파트 크기를 포함하여 버킷(현재 객체 및 현재가 아닌 객체 모두)의 모든 객체 크기를 합산하여 계산됩니다.

  • 객체 수(NumberOfObjects) - 버킷에 저장된 총 객체 수입니다. 이 값은 버킷(현재 객체 및 현재가 아닌 객체 모두)의 모든 객체 수와 버킷에 대한 모든 불완전 멀티파트 업로드의 총 파트 수를 합산하여 계산됩니다.

참고

버킷이 비어 있으면 버킷 지표 데이터가 보고되지 않습니다.