====== Monitoring i Alerting ====== **Prioritet 2** – Kritično za produkcijski rad \\ **Ciljna skupina:** DevOps, SRE, IT-Operations Nadzor PKI infrastrukture s fokusom na istek certifikata, dostupnost i usklađenost. ---- ===== Pregled ===== flowchart TB subgraph COLLECT["📊 PRIKUPLJANJE PODATAKA"] C1[Prometheus Exporter] C2[cert-checker] C3[API Polling] end subgraph STORE["💾 POHRANA"] S1[Prometheus] S2[InfluxDB] S3[Elasticsearch] end subgraph VISUALIZE["📈 VIZUALIZACIJA"] V1[Grafana] V2[Kibana] end subgraph ALERT["🚨 ALERTING"] A1[Alertmanager] A2[PagerDuty] A3[MS Teams] A4[E-Mail] end C1 --> S1 --> V1 C2 --> S1 --> A1 C3 --> S3 --> V2 A1 --> A2 & A3 & A4 style A1 fill:#ffebee style V1 fill:#e8f5e9 ---- ===== Scenariji ===== ^ Scenarij ^ Opis ^ Alati ^ | [[.:ablauf-monitoring|Monitoring isteka]] | Nadzor isteka certifikata | Prometheus, Grafana | | [[.:revocation-check|Provjera opoziva]] | Provjera dostupnosti CRL/OCSP | curl, OpenSSL | | [[.:audit-logging|Audit Logging]] | Protokoliranje usklađeno s propisima | Syslog, ELK | | [[.:alerting-setup|Alerting Setup]] | Postavljanje obavijesti | Alertmanager, PagerDuty | ---- ===== Pregled metrika ===== | Metrika | Opis | Pragovi | |---------|------|---------| | ''cert_expiry_days'' | Dani do isteka | Warn: 30, Crit: 7 | | ''crl_next_update_days'' | Dani do CRL ažuriranja | Warn: 3, Crit: 1 | | ''ocsp_response_time_ms'' | Vrijeme odziva OCSP | Warn: 500, Crit: 2000 | | ''ca_availability'' | CA dostupan (0/1) | Crit: 0 | | ''signing_ops_per_hour'' | Operacije potpisivanja | Info | ---- ===== Brzi početak ===== **Minimalno postavljanje (5 minuta):** # 1. Instalacija cert-exportera wget https://github.com/enix/cert-exporter/releases/download/v2.0.0/cert-exporter_2.0.0_linux_amd64.tar.gz tar xzf cert-exporter_*.tar.gz ./cert-exporter --kubeconfig="" --files /etc/ssl/certs/*.pem & # 2. Provjera certifikata koji ističu curl -s localhost:9793/metrics | grep cert_expires_in_seconds ---- ===== Preporuke stacka ===== | Okruženje | Stack | Opis | |-----------|-------|------| | Malo (<100 certifikata) | Skripta + E-Mail | Cron-Job s E-Mail alertima | | Srednje (100-1000) | Prometheus + Grafana | Standardni monitoring | | Veliko (>1000) | ELK + Grafana + PagerDuty | Enterprise Stack | | Kubernetes | cert-manager + Prometheus | Nativna integracija | ---- ===== Povezana dokumentacija ===== * [[..:tagesgeschaeft:health-check|Health Check]] – Dnevna provjera * [[..:automatisierung:start|Automatizacija]] – Auto-Renewal * [[hr:int:pqcrypt:administrator:betrieb|Rad sustava]] – Održavanje sustava ---- << [[..:start|← Operator scenariji]] | [[.:ablauf-monitoring|→ Monitoring isteka]] >> ---- //Wolfgang van der Stille @ EMSR DATA d.o.o. - Post-Quantum Cryptography Professional// {{tag>operator monitoring alerting prometheus grafana}}