====== Monitoring e alerting ======
**Priorità 2** – Critico per l'esercizio in produzione \\
**Destinatari:** DevOps, SRE, IT-Operations
Sorveglianza dell'infrastruttura PKI con focus su scadenza certificati, disponibilità e conformità.
----
===== Panoramica =====
flowchart TB
subgraph COLLECT["📊 RACCOLTA DATI"]
C1[Prometheus Exporter]
C2[cert-checker]
C3[API Polling]
end
subgraph STORE["💾 ARCHIVIAZIONE"]
S1[Prometheus]
S2[InfluxDB]
S3[Elasticsearch]
end
subgraph VISUALIZE["📈 VISUALIZZAZIONE"]
V1[Grafana]
V2[Kibana]
end
subgraph ALERT["🚨 ALERTING"]
A1[Alertmanager]
A2[PagerDuty]
A3[MS Teams]
A4[E-Mail]
end
C1 --> S1 --> V1
C2 --> S1 --> A1
C3 --> S3 --> V2
A1 --> A2 & A3 & A4
style A1 fill:#ffebee
style V1 fill:#e8f5e9
----
===== Scenari =====
^ Scenario ^ Descrizione ^ Strumenti ^
| [[.:ablauf-monitoring|Monitoraggio scadenze]] | Sorvegliare scadenza certificati | Prometheus, Grafana |
| [[.:revocation-check|Verifica revoca]] | Verificare disponibilità CRL/OCSP | curl, OpenSSL |
| [[.:audit-logging|Audit logging]] | Registrazione conforme alla compliance | Syslog, ELK |
| [[.:alerting-setup|Configurazione alerting]] | Configurare notifiche | Alertmanager, PagerDuty |
----
===== Panoramica metriche =====
| Metrica | Descrizione | Soglie |
|---------|-------------|--------|
| ''cert_expiry_days'' | Giorni alla scadenza | Warn: 30, Crit: 7 |
| ''crl_next_update_days'' | Giorni al prossimo aggiornamento CRL | Warn: 3, Crit: 1 |
| ''ocsp_response_time_ms'' | Tempo risposta OCSP | Warn: 500, Crit: 2000 |
| ''ca_availability'' | CA raggiungibile (0/1) | Crit: 0 |
| ''signing_ops_per_hour'' | Operazioni di firma | Info |
----
===== Quick Start =====
**Setup minimo (5 minuti):**
# 1. Installare cert-exporter
wget https://github.com/enix/cert-exporter/releases/download/v2.0.0/cert-exporter_2.0.0_linux_amd64.tar.gz
tar xzf cert-exporter_*.tar.gz
./cert-exporter --kubeconfig="" --files /etc/ssl/certs/*.pem &
# 2. Verificare certificati in scadenza
curl -s localhost:9793/metrics | grep cert_expires_in_seconds
----
===== Raccomandazioni stack =====
| Ambiente | Stack | Descrizione |
|----------|-------|-------------|
| Piccolo (<100 Cert) | Script + E-Mail | Cron-Job con alert via e-mail |
| Medio (100-1000) | Prometheus + Grafana | Monitoring standard |
| Grande (>1000) | ELK + Grafana + PagerDuty | Stack enterprise |
| Kubernetes | cert-manager + Prometheus | Integrazione nativa |
----
===== Documentazione correlata =====
* [[..:tagesgeschaeft:health-check|Health Check]] – Verifica giornaliera
* [[..:automatisierung:start|Automazione]] – Auto-Renewal
* [[it:int:pqcrypt:administrator:betrieb|Esercizio]] – Manutenzione sistema
----
<< [[..:start|← Scenari per operatori]] | [[.:ablauf-monitoring|→ Monitoraggio scadenze]] >>
----
//Wolfgang van der Stille @ EMSR DATA d.o.o. - Post-Quantum Cryptography Professional//
{{tag>operator monitoring alerting prometheus grafana}}