Incident Management
Incident Management ist der ITIL-Prozess um Störungen schnell zu beheben und den normalen Service wiederherzustellen - wie die Feuerwehr die Brände löscht.
Ziel ist nicht die Ursache zu finden, sondern möglichst schnell wieder normale Arbeitsweise herzustellen.
Definition
Incident Management ist der Prozess zur Wiederherstellung des normalen Service-Betriebs so schnell wie möglich mit minimaler Auswirkung auf das Geschäft.
Ein Incident ist:
Eine ungeplante Unterbrechung oder Qualitätsminderung eines IT-Service.
Beispiele:
Ziele
Hauptziel
So schnell wie möglich normalen Service wiederherstellen.
Incident Management sucht NICHT nach der Ursache - das macht Problem Management. Incident Management will nur schnell wieder funktionierenden Service!
Weitere Ziele
- Minimale Auswirkung auf Geschäftsprozesse
- Hohe User-Zufriedenheit
- Incidents priorisieren nach Business-Impact
- Transparenz über Incident-Status
Prozess-Schritte
1. Incident-Identifikation
Störung wird bekannt.
Wie entdeckt:
- User meldet Problem
- Monitoring-System schlägt Alarm
- Second-Level-Support entdeckt es
2. Incident-Registrierung
Problem wird im Ticketsystem erfasst.
Was dokumentiert wird:
- Wer hat gemeldet?
- Was ist das Problem?
- Welche Systeme betroffen?
- Wann ist es aufgetreten?
3. Kategorisierung
Problem wird eingeordnet.
Kategorien:
- Hardware / Software / Netzwerk
- Service betroffen
- Fehlertyp
4. Priorisierung
Wie dringend muss es gelöst werden?
| Dringlichkeit | Auswirkung | Priorität | Reaktionszeit |
|---|---|---|---|
| Hoch | Hoch | Kritisch | 15 Min |
| Hoch | Mittel | Hoch | 1 Std |
| Mittel | Mittel | Mittel | 4 Std |
| Niedrig | Niedrig | Niedrig | 1 Tag |
5. Diagnose und Eskalation
Ursache finden oder weiterleiten.
Möglichkeiten:
- First-Level-Support löst direkt
- Eskalation an Second-Level-Support
- Eskalation an Third-Level-Support
- Funktionale oder hierarchische Eskalation
6. Lösungsfindung
Problem beheben.
Arten von Lösungen:
- Permanente Lösung - Problem dauerhaft weg
- Workaround - Temporäre Umgehung
- Service-Wiederherstellung - Neustart reicht
7. Lösung anwenden
Fix implementieren.
Aktivitäten:
- Änderung durchführen
- Mit User testen
- Funktionalität bestätigen
8. Incident schließen
Fall abschließen.
Abschluss-Kriterien:
- Problem ist gelöst
- User ist zufrieden
- Dokumentation vollständig
- Kategorisierung korrekt
9. Incident-Review
Bei größeren Incidents: Nachbesprechung.
Was besprochen wird:
- Was lief gut?
- Was kann verbessert werden?
- Sollte Problem Management einbezogen werden?
Major Incident
Ein Major Incident ist ein Incident mit sehr hohem Business-Impact der besondere Behandlung braucht.
Charakteristika:
- Viele User betroffen
- Geschäftskritische Systeme
- Hoher finanzieller Schaden
- Öffentliche Aufmerksamkeit
Besondere Behandlung:
- Sofortige Management-Information
- Dediziertes Team
- Separate Kommunikation
- Post-Incident-Review Pflicht
Beispiele:
Unterschied zu Problem Management
| Aspekt | Incident Management | Problem Management |
|---|---|---|
| Ziel | Schnell beheben | Ursache finden |
| Fokus | Symptome | Root Cause |
| Zeitrahmen | Sofort | Langfristig |
| Beispiel | Server neu starten | Warum crasht Server? |
Zusammenspiel:
Incident Management löscht das Feuer, Problem Management verhindert dass es wieder brennt.
KPIs
| Metric | Beschreibung | Ziel |
|---|---|---|
| MTTR | Mean Time To Repair | Niedrig |
| First-Call-Resolution | % beim ersten Kontakt gelöst | >70% |
| Reopened Incidents | % die wiedereröffnet werden | <5% |
| SLA Compliance | % im SLA-Zeitfenster gelöst | >95% |
Prüfungsrelevanz LF06
- Ziel: Schnelle Service-Wiederherstellung, nicht Ursachenforschung
- Priorisierung nach Impact und Dringlichkeit
- Unterschied zu Problem Management
- Major Incidents als Spezialfall
- Teil von ITIL Service Operation
Verwandte Konzepte
- Problem Management - Findet Ursachen
- Change Management - Wenn Änderungen nötig
- Service Desk - Nimmt Incidents entgegen
- ITIL - Rahmenwerk
- SLA - Definiert Reaktionszeiten
Zusammenfassung
Incident Management stellt normalen IT-Service so schnell wie möglich wieder her - löscht Feuer, sucht aber nicht nach Brandstiftern.
Merksatz:
"Incident Mgmt = Feuerwehr der IT - schnell löschen, Ursache ist erstmal egal!"