Zielgruppe: DevOps, SRE
Inhalt: Metriken, Dashboards, Alerting
Tools: Prometheus, Grafana, Alertmanager
Überwachung des Data Gateway für proaktive Fehlererkennung.
| Runbook | Beschreibung | Dauer |
|---|---|---|
| Prometheus | Metriken sammeln, Scrape-Config | ~15 Min |
| Grafana Dashboard | Visualisierung, vorgefertigte Dashboards | ~20 Min |
| Alerting | Schwellwerte, Benachrichtigungen | ~15 Min |
| Metrik | Beschreibung | Schwellwert |
| ——– | ————– | ————- |
http_requests_total | Anzahl HTTP-Anfragen | - |
http_request_duration_seconds | Response-Zeit | < 1s |
http_requests_in_progress | Aktive Anfragen | < 100 |
dotnet_gc_memory_total_available_bytes | Verfügbarer Speicher | > 100MB |
process_cpu_seconds_total | CPU-Nutzung | < 80% |
# Health Check curl http://localhost:5000/health # Metrics (wenn aktiviert) curl http://localhost:5000/metrics
« ← Operator-Handbuch | → Prometheus »
Wolfgang van der Stille @ EMSR DATA d.o.o. - Data Gateway Professional