We need to be able to detect when Prometheus is not meeting the expected availability. Prometheus is oftenly inaccessible for large cluster (e.g. anteater / deu01) which is a sign of degraded service, ...
O objetivo principal deste projeto é implementar um sistema de monitoramento robusto e eficiente para a infraestrutura da EC2. A solução deve permitir a coleta de métricas em tempo real e a ...