Blog

Gestión de incidentes frente a gestión de problemas: por qué es fundamental que comprenda la diferencia

Publicado por de junio 10, 2019

asset_blog_tn_incident_managet_vs_problem_management

¿Por qué es importante saber la diferencia entre problemas e incidentes? 

En la superficie, puede parecer que un "incidente" y un "problema" son la misma cosa. Cualquiera de las dos palabras se puede utilizar en términos sencillos para describir una situación que está teniendo un impacto negativo en el negocio. Pero en TI, los dos términos son diferentes y deben abordarse y administrarse en consecuencia con diferentes objetivos en mente.

En su definición más básica, un incidente es un evento singular e independiente. Los incidentes son a menudo algo por lo que los usuarios presentarían un ticket de la mesa de ayuda de TI y esperan que se resuelva rápidamente. Un problema es la causa raíz de los incidentes y la Gestión de problemas intenta evitar que se produzcan incidentes. Los problemas a menudo pueden dar lugar a muchos incidentes.

Piense en un gerente que maneja una flota de vehículos. Un vehículo puede experimentar un pinchazo que debe cambiarse rápidamente para que el camión vuelva a la carretera. Este evento es un incidente porque está aislado y solo afecta a ese camión. En este caso se utiliza la gestión de incidentes: se cambia el neumático para que el camión vuelva a funcionar lo antes posible.

Las llantas pinchadas pueden pasar de ser un incidente a requerir un Manejo de problemas si se repiten repetidamente o más de lo que razonablemente deberían. En este caso, la compañía de camiones investigaría más a fondo en un intento de identificar la causa raíz del exceso de neumáticos pinchados. Es posible que esas llantas en particular estén retiradas del mercado o que el programa de mantenimiento de las llantas no se siga correctamente, lo que ocasiona incidentes a menudo. Al identificar esta causa subyacente, la compañía puede implementar acciones para prevenir futuros incidentes relacionados.

TI utiliza estos principios básicos para abordar y resolver adecuadamente los incidentes y problemas.

Es importante que los propietarios y gerentes de negocios fuera de TI comprendan la diferencia entre un incidente y un problema. Si bien los términos pueden parecer intercambiables, comunicarse claramente utilizando el lenguaje técnico del soporte de TI ayudará a reducir la confusión y la frustración. Si le dice al soporte de TI que tiene un incidente cuando en realidad es un problema de mayor alcance, la causa raíz subyacente podría dejarse sin resolver, causando futuros dolores de cabeza. Comprender la diferencia puede ayudar a la organización a alcanzar la resolución adecuada más rápidamente.

Este artículo profundiza en Gestión de incidentes de TI y Gestión de problemas de TI, que son ambos Procesos ITIL comúnmente utilizado en organizaciones de todas las industrias.

¿Qué es la gestión de incidentes?

Primero, echemos un vistazo a la gestión de incidentes de TI. Su objetivo es restaurar las operaciones del servicio lo más rápido posible y minimizar el impacto de una interrupción o degradación del servicio. Es la mesa de soporte de TI centrada en la resolución de problemas de tickets individuales, a veces con una solución alternativa en lugar de una verdadera solución. Las actividades asociadas con la gestión de incidentes se ocupan principalmente de registrar los detalles del incidente, clasificar el incidente, investigar el incidente y, en última instancia, resolver el incidente.

El pensamiento y el proceso detrás de la gestión eficaz de incidentes aparecen en muchos lugares fuera de TI. Recientemente tuve un ataque de dolor de espalda. Si bien es frustrante, mi experiencia ayuda a ilustrar cómo la gestión de incidentes, cuando se realiza bien, funciona más como un consultorio médico bien administrado en lugar de un enfoque de "tome dos de estos y llámeme por la mañana". En mi primera visita al ortopedista, se me pidió que llenara formularios para proporcionar un contexto de mi salud en general y describir de manera articulada mis síntomas. Mi médico usó esa información, además de una radiografía, para diagnosticar y prescribir un plan de tratamiento. El incidente (en este caso mi dolor de espalda) se documentó, investigó y se puso en marcha un plan eficaz para resolver el problema de forma rápida y eficaz.

Dentro de los entornos empresariales, muchos incidentes están relacionados con TI y deben ser abordados por las partes correspondientes. Ya sea que una organización de TI se alinee con ITIL o no, casi siempre hay un rol o función responsable de la gestión de incidentes, ya sea un grupo de dos o un grupo de 200. Los objetivos e indicadores clave de rendimiento (KPI) para la gestión de incidentes son relativamente sencillo:

  • Resolver el incidente lo más rápido posible.

  • Sea consciente de la prioridad del incidente.

  • Sea consciente del costo de la resolución.

  • Evaluar el nivel de satisfacción de los usuarios durante todo el proceso.

  • Mida los resultados con métricas discretas, como la resolución del primer contacto, el costo por contacto y la satisfacción del cliente

(Para obtener una guía más completa, consulte nuestra guía para Gestión de incidentes de ITIL.)

Si un incidente no parece estar aislado, los equipos de TI pueden necesitar pasar a la Gestión de problemas.

¿Qué es la gestión de problemas?

El objetivo de la Gestión de problemas es minimizar el impacto adverso de incidentes y problemas causados ​​por errores en la infraestructura, y prevenir la recurrencia de incidentes relacionados con esos errores. Las actividades asociadas con la Gestión de problemas tratan principalmente de identificar por qué ocurrió el incidente en primer lugar, e identificar y documentar errores conocidos.

A diferencia de la gestión de incidentes, casi nunca existe un rol o función responsable de la gestión de problemas (esto va más allá de Escritorio de soporte de TI, que se centra en la gestión de incidentes). Tampoco existe una comprensión sólida de los objetivos e indicadores clave de desempeño. Las empresas deben dar un paso adicional consciente para implementar la Gestión de problemas, asignar recursos a la tarea y definir los resultados esperados y los KPI que mejor se adapten a su organización.

(Obtenga más orientación sobre ITIL Gestión de problemas.)

Volvamos a mi número anterior para entender cómo la Gestión de Problemas, cuando se realiza bien, funciona como un tratamiento integral. Si bien mi médico brindó un alivio inmediato (es decir, al abordar el incidente), mencionó que si el plan de tratamiento no funcionaba y yo seguía experimentando dolor, podríamos estar lidiando con algo más significativo que una resonancia magnética y un análisis más detallado. para determinar.

Tenga en cuenta que esto no niega el trabajo inicial del médico. No pudo proporcionar una resolución inmediata, sino una solución alternativa (medicación y ejercicio, mientras limitaba los viajes) que había identificado y documentado previamente habiendo visto quejas como la mía en el pasado. No recomendó la cirugía en mi primera visita, porque entendió que esa opción no solo no es rentable, sino que tampoco es apropiada hasta que se determine la causa raíz.

Comprender la diferencia entre la gestión de incidentes y problemas es simplemente el primer paso. La analogía del consultorio del médico es una de muchas para ayudarlo a comprender que la Gestión de incidentes se ocupa de un incidente individual lo más rápido posible y que la Gestión de problemas se ocupa de por qué ocurrió el incidente (o varios incidentes similares) y busca eliminar la causa raíz. o cree una solución alternativa eficaz y fácil de implementar.

Lo que se debe y no se debe hacer en la gestión de incidentes

Debido a que la línea entre la gestión de incidentes y la gestión de problemas puede ser gris (especialmente con otras demandas y procesos también en la mente del soporte), puede ser difícil para algunos equipos aislar exactamente lo que se debe hacer al abordar la gestión de incidentes. Anthony Orr, autor y examinador de ITIL, describe algunas de las acciones clave para la gestión de incidentes para ayudar a los equipos de soporte de TI a centrarse en los verdaderos objetivos y lograr una gestión eficaz de incidentes.

Lo que se debe y no se debe hacer en la gestión de problemas 

Siguiendo el video de Orr sobre lo que se debe y no se debe hacer en la gestión de incidentes, es posible que se pregunte qué deben hacer los equipos al abordar la gestión de problemas, especialmente si se tiene en cuenta que muchas organizaciones no practican adecuadamente este proceso. En este video, Orr utiliza su conocimiento de ITIL para explicar los dos tipos de Gestión de Problemas (proactiva y reactiva) y por qué es importante para las empresas. Luego revisa cuatro cosas que se deben y cuatro que no se deben hacer para una gestión eficaz del problema.

 ¿Qué requiere la reparación de un incidente?

Como se indicó anteriormente, cada organización debe tener al menos unas pocas personas o un equipo dedicado a la Gestión y resolución de incidentes (muy probablemente un departamento de soporte de TI o el equipo que maneja los tickets de soporte de TI). Sin propietarios dedicados, los incidentes no pueden resolverse de manera rápida, efectiva o consistente. Más allá de contar con un equipo, existen algunos factores clave para una gestión exitosa de incidentes, particularmente cuando se trata de incidentes relacionados con TI y operaciones. Para que la gestión de incidentes sea efectiva, es importante tener los siguientes requisitos:

  • Desarrollo continuo de problemas y control de errores.

  • Una estructura de soporte escalonada, donde el equipo comprende las escaladas de Nivel 1 y 2

  • Una mejora continua del servicio programa que mide la eficiencia y la efectividad a través de KPI alineados con las metas y objetivos de la organización

  • Roles y responsabilidades claras y documentadas dentro de TI en términos de resultados deseados

Además, TI debe tener robustas Software de gestión de incidentes a su disposición que incluye:

  • Integración de la Software de servicio de TI y el repositorio de gestión de activos de TI. Esto proporciona soporte de TI con contexto con respecto a los activos y servicios que el usuario aprovecha, negando la necesidad de completar formularios.

  • Una base de conocimiento dentro de la herramienta ITSM que ayuda a difundir, escalar y estandarizar la sintomatología. Esto permite que el soporte de TI trabaje más rápidamente y mantenga la consistencia en todo el equipo.

  • La vista de un mapa de servicios de TI proporcionada por la solución ITSM base de datos de gestión de configuración (CMDB). Esto ayuda a TI a comprender lo que está sucediendo a nivel de servicio y a aislar mejor los elementos de configuración problemáticos que afectan la disponibilidad y el rendimiento.

Estas herramientas y procesos facilitarán que TI o la mesa de servicio recopilen la información necesaria con el contexto apropiado para comprender completamente el incidente y su impacto. Eso nos lleva a la segunda fase de arreglar un incidente: categorización y priorización. No todos los incidentes tendrán el mismo impacto en una organización y los que causan las interrupciones más o más influyentes deben abordarse primero (es decir, una impresora interna que no funciona en comparación con un portal del cliente que se vincula a los SLA de la empresa que son inaccesibles). Comprender el incidente y su impacto ayudará a los equipos de TI a asignar los recursos adecuados y la prioridad.

Una vez que TI cree que el incidente se ha resuelto o que brindan una solución alternativa, deben consultar con los usuarios finales para asegurarse de que la solución esté funcionando según lo previsto y que no persistan más problemas de los usuarios.

¿Qué requiere arreglar un problema?

La integración del cambio, los activos y el conocimiento agrega valor al proceso de gestión de incidentes y, por lo tanto, a la organización. Entonces, ¿por qué vemos una caída tan importante en lo que respecta al proceso de gestión de problemas? En el Prácticas de IDH e informe salarial 2015, solo el 44 por ciento de las organizaciones de TI han adoptado el proceso de gestión de problemas, y solo el 22 por ciento de esas organizaciones tenían un administrador de problemas dedicado.

Creo que la baja tasa de adopción de la Gestión de problemas se puede atribuir con mayor frecuencia a la falta de comprensión de por qué la Gestión de problemas es importante para la organización, lo que afecta la alineación de roles y responsabilidades asociadas con el proceso. También tiende a haber una dependencia excesiva de la tecnología, que crea registros de problemas y asigna la propiedad, pero no puede por sí misma alentar a las personas a determinar la causa raíz, identificar soluciones alternativas y recomendar enfoques de resolución.

Y ahí radica el problema con la gestión de problemas.

Para construir procesos exitosos de Gestión de Problemas, TI debe primero determinar por qué el proceso es importante para ellos (reducir incidentes futuros, minimizar el tiempo de inactividad, mejorar la infraestructura, etc.) y asignar los roles y recursos en consecuencia. Como mínimo, los líderes de TI deben aplicar el mismo rigor que con la gestión de incidentes.

Un líder de gestión de problemas debe asegurarse de que:

  • Los problemas y errores se clasifican e identifican regularmente (y correctamente)

  • Las soluciones provisionales se documentan y comunican a la función de gestión de incidentes.

  • El proceso de gestión de problemas tiene KPI bien definidos y relevantes (según lo determine la organización y sus objetivos para la gestión de problemas)

  • Roles y responsabilidades claras y documentadas en términos de resultados deseados

TI también debe asegurarse de que tiene la habilitación adecuada Solución ITSM (o un software de gestión de problemas más específico) que realiza las siguientes funciones:

  • Haga una referencia cruzada de los detalles del incidente con la base de conocimiento y la base de datos de errores conocidos, lo que facilita la vinculación de los registros de incidentes con los registros de problemas.

  • Facilite asignar la propiedad de los registros de problemas a individuos o grupos funcionales

  • Facilite la promoción rápida de problemas en la Solicitud de cambio (RFC), completa con todo el contexto y la documentación necesarios

  • Proporcione un panel completo y rico que organice intuitivamente las métricas de gestión de problemas críticos en un solo panel

Como señaló Orr, la gestión de problemas no solo debería ser reaccionaria. Si bien la identificación de la causa raíz de los incidentes más recientes y urgentes puede tener la máxima prioridad, los equipos de gestión de problemas también deben estar atentos a la búsqueda de problemas o debilidades de la infraestructura que aún no hayan causado incidentes (pero es probable que eventualmente lo hagan). Este proceso puede ser más manual, pero es un componente importante de la verdadera gestión de problemas.

Los problemas se “arreglan” cuando tienen una solución implementada o una solución alternativa bien documentada y comunicada y, posteriormente, ya no causan incidentes.

Por qué es importante saber la diferencia entre los dos  

Si bien la gestión de incidentes y la gestión de problemas son similares (tan similares de hecho que muchas personas nuevas en ITIL tienen dificultades para separar los dos), la principal diferencia radica en el objetivo final. Es importante recordar que el objetivo de la gestión de incidentes es resolver un incidente de forma rápida y eficaz mientras se minimiza el impacto negativo. A partir de ahí, los equipos de soporte pueden pasar a Gestión de problemas, con el objetivo de evitar que se repitan incidentes similares abordando la causa raíz subyacente.

Para los propietarios y gerentes de negocios, comprender la diferencia entre un incidente y un problema de TI puede ayudarlos a comunicarse efectivamente con el soporte de TI y establecer expectativas realistas con respecto a los resultados.

Implementar una gestión eficaz de incidentes y gestión de problemas puede ser complicado, especialmente si su organización es nueva en ITIL. La clave es concentrarse en los resultados deseados y encontrar los procesos que funcionen mejor para su empresa y equipo.

Para obtener más información, vea nuestro seminario web a pedido, Nuevo en ITIL, ISTM y Lean, que profundiza en cómo aplicar ITIL para abordar los puntos débiles de su organización y mejorar el rendimiento de TI. 

Vea el Webinar

Ivanti adquiere Cherwell para ofrecer experiencias personalizadas a los empleados en cualquier lugar de trabajo

Obtenga los consejos, la orientación y los casos prácticos líderes en la industria de Cherwell para una mejor gestión del servicio que ayude a su empresa a cumplir, directamente en su bandeja de entrada.

* Por favor complete el campo de correo electrónico