ITSM

Problem management ITSM —
jak wyeliminować powtarzające się incydenty?

Incident vs Problem, 4-fazowy proces problem management, metody RCA (5 Why, fishbone diagram), analiza trendów. Jak wdrożyć w ManageEngine SDP i zwiększyć CSAT o 35%.

← Wróć do Bloga
ITSM
Jakub Roszkiewicz · Maj 2026 · 12 min czytania

40% incydentów w polskich firmach to powtórzenia tego samego problemu. Technik spędza ból głowy nad tym samym błędem w bazie danych, złym skonfigurowanym routerze lub lęką w procedurze user onboardingu — czasem nawet trzy razy w tygodniu. To nie jest wina technika, to brak problem management. Problem management ITSM to proces, który znajduje pierwotną przyczynę (root cause), likwiduje ją, i zapewnia, że incydent nigdy więcej się nie powtórzy. W tym artykule rozkładam wszystko: różnicę między incydentem a problemem, 4-fazowy proces, trzy sprawdzone metody RCA, jak to wygląda w ManageEngine ServiceDesk Plus i konkretny ROI.

35–40%
incydentów to powtórzenia — dane Rotech Group
30–50%
redukcja MTTR przy problem management
250%
ROI problem management w roku 1

Incident vs Problem — czemu to nie to samo, i dlaczego wszyscy to mylą

Zacznijmy od definicji, bo tu się wszystko zmienia.

Incydent (Incident Management w ITIL) — to nieplanowane przerwanie w świadczeniu usługi IT lub degradacja jego jakości. Incydent jest reaktywny — ktoś zgłasza, że sieć pada, zalogowanie do systemu nie działa, drukarka wymaga papieru. Celem incident management jest jak najszybsze przywrócenie usługi do normalnego stanu — niezależnie od tego, co powodowało problem. MTTR (Mean Time To Recovery) dla incydentu to minut, maksymalnie godzin.

Problem (Problem Management w ITIL) — to przyczyna pierwotna (root cause) jednego lub więcej incydentów. Problem jest proaktywny — to głębokie badanie: „Dlaczego sieć pada co 3 tygodnie?" lub „Dlaczego zawsze przy wdrażaniu M365 logowanie pali siąść?" Celem problem management jest wyeliminować przyczynę na stałe, aby incydent nigdy więcej się nie powtórzył. Problem może być „rozwiązywany" przez miesiące.

Analogia: Incydent to gaszenie pożaru, problem management to usunięcie przyczyny pożarów (zła instalacja elektryczna). Technik ITSM robi obie rzeczy — ale zbyt wielu rób tylko gaszenie, i dziwią się, że pożary ciągle wracają.

Konsekwencje zaniedbania problem management:

4-fazowy proces problem management w ITIL — jak to działa w praktyce

ITIL v4 definiuje problem management jako proces z czterema głównymi fazami. Oto jak wygląda w realnym scenariuszu.

1. Detect & Analyze (detektuj i analizuj)

Identyfikujesz wzorce powtórzonych incydentów. Źródła:

  • Tickety o tej samej kategorii/symptomie co tydzień
  • Wiele incydentów dla tego samego komponentu IT (router, serwer, aplikacja)
  • Trend: wzrost średniego MTTR dla tej kategorii

Narzędzie: Dashboard incydentów w SDP, filtr po kategorii, sortuj po częstości.

2. Root Cause Analysis (RCA)

Głębokie badanie — dlaczego to się dzieje. Używasz jednej z trzech metod:

  • 5 Why (pięciokrotne pytanie „dlaczego")
  • Fishbone Diagram (diagram przyczyn Ishikawy)
  • Timeline Analysis (chronologia zdarzeń)

Wynik: dokument RCA z jednoznaczną pierwotną przyczyną.

3. Fix & Verify (naprawiaj i weryfikuj)

Planujesz zmianę (Change Management), wdrażasz poprawkę, testujesz. Rozwiązanie powinno być:

  • Zgodne z Change Advisory Board (CAB)
  • Testowane w środowisku testowym (NIE na produkcji!)
  • Udokumentowane w problem record

Wynik: incydent powinien być zlikwidowany.

4. Monitor & Close (monitoruj i zamykaj)

Przez 2–4 tygodnie monitorujesz czy problem wrócił:

  • Zero nowych incydentów tej kategorii?
  • Metryka (np. ping czasu odpowiedzi serwera) w normie?
  • Użytkownicy nie mają już tego błędu?

Wynik: zamykasz problem record i przechowujesz wiedzę w Knowledge Base.

Trzy metody Root Cause Analysis — która dla Ciebie

RCA to serce problem management. Oto trzy najpopularniejsze metody, od najprostszej do najbardziej zaawansowanej.

Metoda 1: 5 Why (pięciokrotne pytanie „dlaczego")

Kiedy: proste problemy, 1–2 osobowe zespoły. Brakuje serwera, żaden pracownik nie dostaje maili.

Jak: Zaczynasz od objawu i pięciokrotnie pytasz „dlaczego?":

  1. Dlaczego pracownicy nie dostają maili? → Serwer mailowy nie odpowiada.
  2. Dlaczego serwer mailowy nie odpowiada? → Dysk jest 99% zapełniony.
  3. Dlaczego dysk jest 99% zapełniony? → Logi nie były rotowane od 6 miesięcy.
  4. Dlaczego logi nie były rotowane? → Logrotate script się nie uruchamiał.
  5. Dlaczego się nie uruchamiał? → Żaden admin nie skonfigurował go — to się zrobiło „na szybko" 6 miesięcy temu.

Pierwotna przyczyna: brak procedury konfiguracji logrotate i niski priorytet dla maintenance tasków.

Czasochłonność: 30 minut do 1 godzina.

Metoda 2: Fishbone Diagram (diagram Ishikawy)

Kiedy: bardziej złożone problemy, wiele możliwych przyczyn. Hardware + software + procedury grają razem.

Jak: Rysjesz kość ryby i kategorizujesz możliwe przyczyny na „kości" — najczęściej 5 kategorii: People, Process, Technology, Tools, Environment.

Przykład: Problem: wyłączanie się drukarek sieciowych co godzinę.

Pierwotna przyczyna (najczęściej okazuje się być kombinacja kilku): starszy driver + przegrzanie + brak monitoringu + wifi interference.

Czasochłonność: 1–2 godzin, wymaga zespołu.

Metoda 3: Timeline Analysis (analiza chronologiczna zdarzeń)

Kiedy: bardzo złożone problemy, wiele systemów zaangażowanych, trudno oddzielić przyczynę od skutku.

Jak: Budujesz dokładną ścieżkę czasową zdarzeń — każdy log, każdy alert, każda zmiana konfiguracji.

Przykład: Problem: serwer SQL przestał odpowiadać o 2:35 w nocy.

Pierwotna przyczyna: backup strategy jest zaplanowany w godzinach szczytu biznesowego (2:30 jest zaraz po nocnym ETL) — powoduje resource contention.

Czasochłonność: 2–4 godziny, wymaga dostępu do logów, alertów, monitoringu.

Analiza trendów — jak znaleźć powtarzające się problemy w morzu incydentów

Problem management zaczyna się od pytania: „Które incydenty się powtarzają?" Oto jak to znaleźć.

Krok 1: Zdefiniuj „powtórzenie" — ten sam symptom (np. błąd login, połączenie timeout) tej samej kategorii IT (np. Active Directory) co najmniej 3 razy w miesiąc, z MTTR wyższym niż średnia.

Krok 2: Zbuduj raport trendów — w ManageEngine SDP używasz Analytics lub ręcznego raportu:

  1. Eksportujesz ostatnie 3 miesiące ticketów
  2. Grupujesz po kategorii / componentzie IT
  3. Liczysz ilość per kategoria, średni MTTR
  4. Szukasz kategorii z wysoką ilością + wysokim MTTR

Krok 3: Priorytetuj top 5 problemów — które przyniosą największy ROI jeśli je rozwiążesz.

Typowy wynik takiej analizy: