Nagios — Overvågning der har fanget problemer siden 1999
Nagios er overvågningssystemet som de fleste moderne værktøjer er bygget ovenpå. Det holder øje med servere, services, netværksenheder og SSL-certifikater — og alarmerer før dine kunder mærker at noget er galt. Vi har kørt Nagios i årevis ved siden af nyere værktøjer, og det fanger stadig ting andre misser.
Sådan bruger vi det
Vores Nagios-instans overvåger alle servere og services vi administrerer — HTTP-endpoints, diskplads, CPU-belastning, hukommelse, SSL-udløb, databaseforbindelser, mailkøer. Alarmer går til Zammad så intet går tabt.
Vi skriver tilpassede check-plugins til applikationsspecifik overvågning. Hvis en baggrundsjobkø hober sig op eller en replikeringsforsinkelse vokser, fanger Nagios det og opretter en ticket før nogen klager.
Nagios kører også vores SLA-rapportering. Uptime-tal kommer fra faktiske overvågningsdata, ikke løfter på en præsentation.
Hvad vi har lært af at køre det
Alarmtræthed dræber overvågning. En standard Nagios-installation sender for mange notifikationer for ting der ikke betyder noget. Vi tuner tærskler, sætter ordentlige eskaleringsveje og konfigurerer afhængigheder så du kun får alarm når handling faktisk er nødvendig.
NRPE (den fjerntjekagent) har brug for omhyggelige firewall-regler og TLS-konfiguration. En fejlkonfigureret agent er et sikkerhedshul. Vi låser det ordentligt ned — tilladte hosts, krypteret transport, ingen unødvendig eksponering.
Hvad du får
En fuldt konfigureret Nagios-instans der overvåger din infrastruktur. Tilpassede checks til dine specifikke services. Alarmrouting til email, Slack eller dit ticketsystem. SLA-dashboards. Ordentlige tærskler så du får signal, ikke støj. Vi håndterer opdateringer og tilføjer nye checks efterhånden som din infrastruktur vokser.
Klar til overvågning der faktisk fortæller dig hvad der er galt?
Vi deployer og vedligeholder Nagios på jeres infrastruktur. Overvåg ubegrænsede hosts og tjenester. Ingen per-host-prissætning, ingen cloud-afhængighed.