====== Monitoring e alerting ====== **Priorità 2** – Critico per l'esercizio in produzione \\ **Destinatari:** DevOps, SRE, IT-Operations Sorveglianza dell'infrastruttura PKI con focus su scadenza certificati, disponibilità e conformità. ---- ===== Panoramica ===== flowchart TB subgraph COLLECT["📊 RACCOLTA DATI"] C1[Prometheus Exporter] C2[cert-checker] C3[API Polling] end subgraph STORE["💾 ARCHIVIAZIONE"] S1[Prometheus] S2[InfluxDB] S3[Elasticsearch] end subgraph VISUALIZE["📈 VISUALIZZAZIONE"] V1[Grafana] V2[Kibana] end subgraph ALERT["🚨 ALERTING"] A1[Alertmanager] A2[PagerDuty] A3[MS Teams] A4[E-Mail] end C1 --> S1 --> V1 C2 --> S1 --> A1 C3 --> S3 --> V2 A1 --> A2 & A3 & A4 style A1 fill:#ffebee style V1 fill:#e8f5e9 ---- ===== Scenari ===== ^ Scenario ^ Descrizione ^ Strumenti ^ | [[.:ablauf-monitoring|Monitoraggio scadenze]] | Sorvegliare scadenza certificati | Prometheus, Grafana | | [[.:revocation-check|Verifica revoca]] | Verificare disponibilità CRL/OCSP | curl, OpenSSL | | [[.:audit-logging|Audit logging]] | Registrazione conforme alla compliance | Syslog, ELK | | [[.:alerting-setup|Configurazione alerting]] | Configurare notifiche | Alertmanager, PagerDuty | ---- ===== Panoramica metriche ===== | Metrica | Descrizione | Soglie | |---------|-------------|--------| | ''cert_expiry_days'' | Giorni alla scadenza | Warn: 30, Crit: 7 | | ''crl_next_update_days'' | Giorni al prossimo aggiornamento CRL | Warn: 3, Crit: 1 | | ''ocsp_response_time_ms'' | Tempo risposta OCSP | Warn: 500, Crit: 2000 | | ''ca_availability'' | CA raggiungibile (0/1) | Crit: 0 | | ''signing_ops_per_hour'' | Operazioni di firma | Info | ---- ===== Quick Start ===== **Setup minimo (5 minuti):** # 1. Installare cert-exporter wget https://github.com/enix/cert-exporter/releases/download/v2.0.0/cert-exporter_2.0.0_linux_amd64.tar.gz tar xzf cert-exporter_*.tar.gz ./cert-exporter --kubeconfig="" --files /etc/ssl/certs/*.pem & # 2. Verificare certificati in scadenza curl -s localhost:9793/metrics | grep cert_expires_in_seconds ---- ===== Raccomandazioni stack ===== | Ambiente | Stack | Descrizione | |----------|-------|-------------| | Piccolo (<100 Cert) | Script + E-Mail | Cron-Job con alert via e-mail | | Medio (100-1000) | Prometheus + Grafana | Monitoring standard | | Grande (>1000) | ELK + Grafana + PagerDuty | Stack enterprise | | Kubernetes | cert-manager + Prometheus | Integrazione nativa | ---- ===== Documentazione correlata ===== * [[..:tagesgeschaeft:health-check|Health Check]] – Verifica giornaliera * [[..:automatisierung:start|Automazione]] – Auto-Renewal * [[it:int:pqcrypt:administrator:betrieb|Esercizio]] – Manutenzione sistema ---- << [[..:start|← Scenari per operatori]] | [[.:ablauf-monitoring|→ Monitoraggio scadenze]] >> ---- //Wolfgang van der Stille @ EMSR DATA d.o.o. - Post-Quantum Cryptography Professional// {{tag>operator monitoring alerting prometheus grafana}}