Passa al contenuto principale
Una cattiva gestione degli incidenti gravi potrebbe mettere a rischio la sicurezza della tua organizzazione
Condividi sui social

Una cattiva gestione degli incidenti gravi potrebbe mettere a rischio la sicurezza della tua organizzazione

Rich Blunt
Rich Blunt
16 febbraio 2024
9 min di lettura
Gestione degli incidenti gravi con ITSM
Rich Blunt
Rich Blunt
16 febbraio 2024
9 min di lettura
Un grave problema informatico può avere un impatto importante sulla tua attività. Pertanto, gestire con successo questi eventi è fondamentale per la continuità aziendale. Ciò è noto come gestione degli incidenti gravi (MIM, Major Incident Management).
In questo blog analizziamo più da vicino cosa si intende con MIM. Spiegheremo perché il MIM è così importante per evitare e ridurre al minimo l’impatto delle minacce alla sicurezza, i costi che gli incidenti gravi possono comportare per organizzazioni come la tua, le sfide che il MIM pone alle aziende e le best practice che devi seguire per superarle.

Cosa si intende per incidente grave?

La definizione di incidente grave varia tra le diverse organizzazioni. Ma, in poche parole, si tratta di problemi urgenti e di grande impatto, come un blackout o una perdita di servizio per i clienti. Un incidente informatico che non interferisce con le attività essenziali probabilmente non è un incidente grave.
Gli incidenti gravi in genere richiedono una risposta immediata da parte dei team di gestione competenti. Se i clienti non possono accedere ai servizi o i dipendenti non sono in grado di portare a termine il loro lavoro in tempo, è probabile che l’azienda subisca un contraccolpo finanziario (tra le altre conseguenze).

Gestione degli incidenti e Gestione degli incidenti gravi a confronto

Sebbene non sia possibile prevenire completamente gli incidenti gravi, le modalità di gestione possono fare la differenza per quanto riguarda i costi sostenuti dalla tua organizzazione.
Ma in che modo il tuo processo MIM differisce dal modo in cui gestisci gli altri incidenti IT? Le interruzioni di servizi IT non sono rare e la gestione degli incidenti è il processo che consente di gestirle assicurandosi che i servizi funzionino senza intoppi, in linea con gli SLA. Gli utenti in genere segnalano un problema al service desk e un membro del team IT lo risolve.
Gli incidenti gravi, invece, verranno segnalati da più fonti. Richiedono un team speciale di esperti per gestirli e risolverli. Solitamente, ciò include le seguenti quattro fasi:
  • Identificazione: viene dichiarato l’incidente grave e le parti interessate sono informate.
  • Contenimento: viene creata una squadra che si riunisce per risolvere il problema.
  • Risoluzione: viene implementato il piano di risoluzione, documentato come cambiamento.
  • Manutenzione: si esamina l’incidente per verificare che sia stato risolto, si documenta il processo e si adottano metriche per misurare l’efficacia del service desk.
È anche importante capire che gli incidenti gravi segnalati a un service desk spesso vengono inoltrati ai team tecnici, come gli sviluppatori, il settore operativo, ecc. affinché possano lavorare insieme per risolvere il problema nel modo più rapido ed efficace possibile. Diamo un’occhiata a come dovrebbe essere un team MIM.

Il costo delle minacce alla sicurezza di Facebook

Gli incidenti gravi comportano tempi di inattività e i tempi di inattività non sono economici. Secondo i sondaggi Gartner, il loro costo medio è stato stimato in 5.600 USD al minuto o da 100.000 a 540.000 USD all’ora.
Per alcune organizzazioni ad alto rischio in settori quali finanza, governo, sanità, media e comunicazioni, il costo è ancora più alto e supera i 5 milioni di dollari all’ora. Ad esempio, nel 2019, Facebook si trovò ad affrontare un tempo di inattività di 14 ore che costò all’organizzazione quasi 90 milioni di dollari.
Naturalmente, la perdita di entrate non è l’unico “costo” che le organizzazioni si trovano a dover sostenere per i tempi di inattività. Le interruzioni dell’attività, come danni alla reputazione e abbandono dei clienti, possono comportare costi ancora superiori rispetto alla perdita di entrate. Si potrebbero aggiungere sanzioni finanziarie in base allo SLA, multe governative e il costo delle azioni legali associate all’incidente. Senza dimenticare l’effetto a catena su qualsiasi prodotto o attrezzatura fisica.
Altri costi di inattività includono la produttività dell’utente finale e la produttività interna (per i team IT e le persone interessate dall’incidente). Quest’ultima può avere conseguenze anche sulla felicità dei dipendenti e sulla fidelizzazione del personale, un altro effetto meno evidente dei tempi di inattività.

Sfide comuni collegate alla gestione degli incidenti gravi e come superarle

Con il MIT in atto, è importante non commettere i passi falsi in cui le organizzazioni solitamente cadono con il MIM. Di seguito diamo un’occhiata ai più comuni e spieghiamo cosa puoi fare per evitarli.
1. Processi manuali
Quando si tratta di MIM, la velocità e l’efficienza sono fondamentali e i processi manuali e ripetitivi frenano i tecnici, rallentando i tempi di risoluzione.
Come risolvere il problema – L’automazione dei processi del service desk, come la notifica alle parti interessate, consente ai tecnici di risparmiare tempo in modo da potersi concentrare sulla soluzione del problema.
2. Comunicazione incoerente
Tenere i manager e le principali parti interessate al corrente è fondamentale affinché tutti siano a conoscenza dello stato dell’incidente e di cosa si sta facendo per risolverlo. La comunicazione manuale può essere incoerente e problematica.
Come risolvere il problema – Anche in questo caso, l’automazione svolge un ruolo chiave, garantendo una comunicazione strutturata e coerente e che tutti siano informati su ciò che sta accadendo durante l’intero ciclo di vita della richiesta di assistenza. La comunicazione tempestiva consente di tenere informati anche gli utenti finali in modo che possano prepararsi per i tempi di inattività.
3. Mancanza di visibilità
Solitamente, i team coinvolti in un incidente grave non hanno la visibilità del problema originale e dei progressi compiuti, due aspetti fondamentali per l’approccio alla risoluzione dell’incidente.
Come risolvere il problema – Determinare le parti interessate che saranno coinvolte nell’incidente, definire il processo che garantisce la notifica ai soggetti pertinenti e decidere quali strumenti sono disponibili per supportare il MIM.
4. Perdita di tempo
Se le attività del MIM non vengono chiaramente delegate e gli incarichi sono comunicati a chicchessia, possono verificarsi sforzi duplicati che rallentano la risoluzione dell’incidente.
Come risolvere il problema – Le soluzioni per la gestione degli incidenti, come Jira Service Management, possono aiutarti in ogni fase del processo di risposta, incluso avvisare i team delle attività assegnate in modo che tutti possano essere sulla stessa lunghezza d’onda.
5. Documentazione scadente
Se non si documentano tutti gli incidenti gravi, ogni volta che se ne verifica uno si torna al punto di partenza. Ciò si traduce in tempi di inattività più lunghi per i clienti mentre decidi come risolvere la situazione.
Come risolvere il problema – Il responsabile della gestione dovrebbe registrare tutti i passaggi intrapresi per risolvere l’incidente, nonché altre informazioni chiave, come l’impatto che questo ha avuto. Ciò ti fornirà una mappa che ti aiuterà ad accelerare la risoluzione in futuro.

E adesso?

Con una migliore comprensione del MIM e delle sfide più comuni che le organizzazioni devono affrontare, vale la pena prendere in considerazione una soluzione all-in-one che possa aiutarti a uscirne a testa alta. Abbiamo già menzionato Jira Service Management (JSM), che può fare una grande differenza nel modo in cui gli incidenti gravi vengono identificati e risolti.
È importante sapere che JSM si integra con Jira Software: in questo modo, i problemi critici possono essere indirizzati automaticamente ai team di sviluppo in base ai criteri impostati consentendo loro di dare priorità al lavoro in base alla gravità. Supporta inoltre il lavoro collaborativo, grazie alle funzionalità di chiamata in conferenza e chat sugli incidenti, e alla gestione dei problemi la visualizzazione delle indagini sugli incidenti. Tutte soluzioni ideali per ridurre il tempo medio di risoluzione in caso di incidenti gravi.
Vuoi saperne di più su come Jira Software e JSM collaborano per ridurre i tempi di inattività e migliorare la fornitura del servizio?
Scritto da
Rich Blunt
Rich Blunt
Consulente tecnico
Cloud