Problem Management

Problem Management findet die eigentlichen Ursachen von Störungen und verhindert dass sie wiederkommen - wie ein Detektiv der Brandstifter sucht, nicht nur Feuer löscht.

Während Incident Management schnell Symptome bekämpft, geht Problem Management in die Tiefe und beseitigt Root Causes.

Definition

Problem Management ist der ITIL-Prozess zur Identifikation und Analyse der Ursachen von Incidents und zur Verhinderung zukünftiger Incidents.

Ein Problem ist:

Die unbekannte Ursache von einem oder mehreren Incidents.

Unterschied:

Ziele

Hauptziele

  1. Root Causes finden - Warum passiert das?
  2. Incidents verhindern - Dass es nicht nochmal passiert
  3. Workarounds bereitstellen - Wenn keine schnelle Lösung möglich
  4. Wissensdatenbank pflegen - Known Errors dokumentieren

Prozess-Schritte

1. Problem-Identifikation

Wann wird aus Incidents ein Problem?

Trigger:

2. Problem-Registrierung

Problem dokumentieren.

Dokumentiert wird:

3. Problem-Kategorisierung

Problem einordnen.

Kategorien:

4. Problem-Investigation

Detektivarbeit - Ursache finden.

Methoden:

Beispiel 5-Why:

  1. Warum ist Server down? → Überhitzung
  2. Warum Überhitzung? → Lüfter funktioniert nicht
  3. Warum Lüfter kaputt? → Verstaubt
  4. Warum verstaubt? → Keine regelmäßige Reinigung
  5. Warum keine Reinigung? → Kein Wartungsplan

Root Cause: Fehlender Wartungsplan!

5. Known Error erstellen

Sobald Root Cause bekannt ist, wird Known Error registriert.

Known Error enthält:

In Knowledge Base:

Known Errors werden dokumentiert damit Incident Management schneller reagieren kann.

6. Lösung entwickeln

Permanente Lösung finden.

Lösungsarten:

7. Lösung implementieren

Fix in Produktion bringen.

Via Change Management:

8. Problem schließen

Nach erfolgreicher Lösung.

Voraussetzungen:

Proaktives Problem Management

Proaktiv statt reaktiv

Nicht warten bis Incidents passieren - potenzielle Probleme vorher finden!

Aktivitäten:

Beispiel:

Monitoring zeigt: Server-CPU steigt kontinuierlich. Proaktiv handeln bevor Server crasht!

Unterschied zu Incident Management

Aspekt Incident Management Problem Management
Ziel Service wiederherstellen Root Cause finden
Fokus Symptom Ursache
Zeit Sofort Langfristig
Beispiel Server neustarten Warum crasht Server?
Mindset "Feuer löschen" "Brandstifter finden"
Zusammenspiel

Incident Management ist die Feuerwehr, Problem Management ist die Brandermittlung und Prävention.

KPIs

Metric Beschreibung Ziel
Problem Backlog Offene Probleme Niedrig
Problem Resolution Time Zeit bis Problem gelöst Variabel
Prevented Incidents Incidents durch PM verhindert Hoch
Known Errors Anzahl dokumentierter Known Errors Wachsend

Prüfungsrelevanz LF06

Für LF06 wichtig

  • Ziel: Root Cause finden, nicht schnell beheben
  • Unterschied zu Incident Management (reaktiv vs. proaktiv)
  • Known Error Konzept
  • 5-Why-Methode kennen
  • Proaktives vs. reaktives Problem Management

Typische Prüfungsfrage:

"Erklären Sie den Unterschied zwischen Incident Management und Problem Management anhand eines Beispiels."

Verwandte Konzepte

Zusammenfassung

Kern-Aussage

Problem Management findet die Root Causes von Störungen und verhindert dass Incidents wiederkommen - Detektivarbeit statt Feuerwehr.

Merksatz:

"Problem Mgmt = Detektiv + Präventivmedizin - Ursachen finden und verhindern!"