Guía esencial

La guía esencial para la gestión de incidentes de ITIL

asset_eg_tn_incident_management_514x268

Adelante y fondo

Comprender su nivel de madurez organizacional al implementar ITIL

La gestión de incidentes suele ser la primera biblioteca de infraestructura de TI (ITIL®) proceso dirigido a la implementación o mejora entre organizaciones que buscan adoptar las mejores prácticas de ITIL. Las razones para esto son simples: Consumición mejorada y realización del valor del servicio. La gestión de incidentes es el proceso cotidiano utilizado por la organización a través del compromiso con el servicio técnico o la tecnología de autoayuda para la restauración rápida del servicio.

El alto rendimiento de este proceso es crítico para la organización y para los usuarios de los servicios afectados. Sin ella, se experimenta un comportamiento caótico que afecta el desempeño del usuario, el desempeño organizacional y el valor económico general tanto para el cliente como para el proveedor del servicio. La gestión de incidentes en sí misma debe respaldar la estrategia comercial, y la estrategia comercial debe permitir los medios por los cuales se realiza la gestión de incidentes para obtener valor.

Anthony Orr: lo que se debe y no se debe hacer al implementar la gestión de incidentes de TI
En este breve video, el autor y examinador de ITIL, Anthony Orr, comparte las mejores prácticas y los errores comunes relacionados con la implementación de la gestión de incidentes de TI dentro de la empresa.

Una historia que cuento a menudo para ayudar a las organizaciones y a las personas a comprender su madurez con respecto a este proceso es la siguiente: fui el discurso principal de una conferencia, y uno de los asistentes se me acercó después y me dijo: “Hola Anthony, tengo que contarte nuestro éxito. De hecho, estamos celebrando en la oficina con pastel porque hemos gestionado nuestro incidente número un millón ". La mayoría de las personas a las que les cuento esta historia inmediatamente sonríen o se ríen un poco porque no pueden creer que esto sea algo para celebrar. ¡Pero es! Este es un indicador del nivel de madurez de la empresa con la Gestión de Incidentes. Para entender esto mejor, el estado "antes" era simplemente esto: no había mesa de servicio, y cuando se necesitaba ayuda en la organización, el usuario tenía que buscar ayuda por su cuenta. Hay muchas organizaciones a nivel mundial que aún no cuentan con un servicio de asistencia técnica. Y es importante comprender su nivel de madurez.

Comprender su estado actual ayuda a obtener el estado deseado. Los indicadores de desempeño y los factores críticos de éxito relacionados con los objetivos ayudan a mantener el estado de madurez actual y a iniciar proyectos que conducen a un estado de madurez deseado mejorado. En la historia anterior, dependiendo de las necesidades del negocio, el objetivo puede ser mejorar la resolución de primera llamada, implementar capacidades de autoayuda o cualquier otra cantidad de cosas. Es importante que las organizaciones se centren en lo esencial para ganar rápidamente. Al más alto nivel de madurez para este proceso, los usuarios no experimentarán incidentes relacionados con los servicios prestados.

A medida que lea el contenido de esta publicación, tenga en cuenta el valor para el negocio de hacer lo que es esencial para su organización, y hacerlo bien aprovechando a las personas, los procesos, la tecnología y los proveedores para cumplir sus objetivos. La excelencia en el servicio es un viaje que nunca termina y debe practicarse. ¡Celebra tus éxitos!

¿Qué es la Biblioteca de Infraestructura de Tecnología de la Información (ITIL)?

ITIL es un marco de mejores prácticas de renombre mundial, adoptado por individuos y organizaciones tanto del sector público como privado como un marco para alinear los servicios de TI con las necesidades del negocio. Su versión más reciente, ITIL 2011, consta de cinco publicaciones principales, que incluyen Estrategia de servicio, Diseño de servicio, Transición de servicio, Operación de servicio y Mejora continua de servicio. Esta guía proporciona una explicación completa de la gestión de incidentes, un proceso crítico dentro del libro de operaciones de servicio.

La Operación del Servicio es un elemento esencial del ciclo de vida de los procedimientos, ya que brinda servicio y valor a la empresa, los clientes y los usuarios. Asegura que se alcancen o superen los niveles y la calidad de servicio acordados, proporcionando una introducción y pautas para las actividades que contribuyen a la excelencia operativa de TI.

Los procesos de operación del servicio ITIL incluyen:

  • Gestión de Incidentes
  • Gestión de problemas
  • Solicitud de cumplimiento
  • Gestión de eventos
  • Gestión de Acceso

Historia de ITIL

ITIL surgió como un concepto cuando el gobierno británico determinó que la calidad del servicio de TI que se les brindaba era inadecuada. La Agencia Central de Computación y Telecomunicaciones, que se fusionó con la Oficina de Comercio del Gobierno en 2000, lanzó la primera versión de ITIL, llamada "Administración de Infraestructura de Tecnología de la Información del Gobierno", a principios de los años ochenta. El marco se extendió por Europa en la década de 1980.

La versión 2 de ITIL se lanzó en 2001, y rápidamente se convirtió en el marco de mejores prácticas de gestión de servicios de TI más popular en todo el mundo. El siguiente cambio importante de versión se produjo en 2007 con ITIL V3, que enfatiza la alineación de TI y de negocios.

La actualización más actual de ITIL ocurrió en 2011 con lo que se llama ITIL 2011, una puesta a punto de ITIL V3.

¿Qué es la gestión de incidentes?

La gestión de incidentes es un proceso de gestión de servicios de TI destinado a restaurar el funcionamiento "normal" del servicio lo más rápido posible, minimizando cualquier impacto adverso en las operaciones comerciales o en el usuario. El éxito se logra al tratar de manera rápida y efectiva todos los Incidentes reportados por los usuarios, descubiertos por el personal técnico o detectados automáticamente por una solución de monitoreo. La Biblioteca de infraestructura de TI (ITIL) define un Incidente como "una interrupción no planificada que causa, puede causar o reducir la calidad de un Servicio de TI".

Ejemplos de incidentes comunes

Aunque existen infinitas razones por las cuales los usuarios se ponen en contacto con la mesa de servicio para obtener ayuda, ciertos incidentes son comunes en todas las organizaciones:

  • Restablecimiento de contraseña de Active Directory
  • Eliminar cuenta de Active Directory
  • Mensaje de error al intentar iniciar o acceder a una aplicación
  • La impresora no imprime
  • Hardware: impresora, fax, escáner, tableta no funciona
  • Monitor de parpadeo

El propósito y la importancia de la gestión de incidentes

Cada etapa de todo el ciclo de vida del servicio de ITIL proporciona valor a la empresa de una forma u otra. Service Operation ofrece mejoras continuas tanto a largo plazo como a corto plazo. El objetivo principal del proceso de gestión de incidentes es restaurar la operación normal del servicio lo más rápido posible. Cuando se implementa con éxito, la gestión de incidentes ofrece los siguientes tipos de beneficios:

  • Reducir los costos no planificados del personal de servicios de TI al reducir la cantidad de tickets de incidentes
  • Disminución del tiempo de inactividad del negocio y del usuario con una detección y resolución de incidentes más rápidos
  • Aumento de la productividad en toda la organización mediante la restauración rápida del funcionamiento normal.
  • Identificar oportunidades de capacitación y posibles mejoras en el servicio.
  • Mejorando la satisfacción del usuario
  • Demostrar el valor de TI para el negocio alineando las actividades de TI con las prioridades del negocio.
  • Reducción del impacto en el negocio y el usuario con un monitoreo mejorado
  • Reducción de incidentes perdidos
libro electronico

7 pecados capitales de las implementaciones de ITIL

Cómo moverse a velocidad digital mientras defiende los principios de ITIL

7 pecados capitales de las implementaciones de ITIL

El proceso de gestión de incidentes (también conocido como el ciclo de vida de gestión de incidentes)

Flujo del proceso de gestión de incidentes¿Cómo funciona la gestión de incidentes? ITIL proporciona un marco, no un conjunto rígido de instrucciones, para la entrega efectiva de servicios de TI, adaptable por las organizaciones para satisfacer sus necesidades de entrega de servicios de TI. El proceso de gestión de incidentes se puede estructurar para gestionar los incidentes notificados automáticamente por una herramienta de gestión de eventos, por los usuarios o técnicos de la mesa de servicio a través de un portal de autoservicio, por teléfono, correo electrónico o en persona. El ciclo de vida de gestión de incidentes incluye:

1) Identificación del incidente

Idealmente, los incidentes se identifican en una etapa muy temprana a través del monitoreo de eventos automatizado, incluso antes de que afecten al usuario. Sin embargo, este no es siempre el caso. A veces, los incidentes son identificados por el usuario afectado que los informa a la mesa de servicio.

2) Registro de incidentes

Para mantener un registro histórico completo, todos los incidentes, independientemente del método utilizado para identificarlos e informarlos a la mesa de servicio, deben registrarse con todos los detalles relevantes, incluida la fecha / hora, información del usuario, descripción, elemento de configuración relacionado del CMDB, problema asociado, detalles de resolución e información de cierre.

  • Clasificación de incidentes: una vez registrados, se deben seleccionar todas las categorías apropiadas para asignar, escalar y monitorear adecuadamente las frecuencias y las tendencias de los incidentes.
  • Priorización de incidentes: asignar prioridad es fundamental para determinar cómo, cuándo y por quién se manejará el incidente. La prioridad se basa en el nivel de urgencia, por ejemplo, el número de usuarios afectados o su impacto en el negocio, y determina la rapidez con la que se requiere una resolución.

3) Investigación y diagnóstico de incidentes.

Este paso tiene lugar inmediatamente para determinar el mejor curso para la corrección. El técnico puede confiar en la base de conocimientos, las preguntas frecuentes o los errores conocidos para el diagnóstico y / o la resolución.

4) Asignación de incidentes o escalada

Inicialmente, el técnico de la mesa de servicio intenta resolver el Incidente. Sin embargo, si la mesa de servicio no puede proporcionar una resolución, el Incidente se escala al nivel de soporte apropiado, posiblemente involucrando personal de soporte técnico de segundo o tercer nivel que posee las habilidades para resolver el Incidente.

5) Resolución de incidentes

Una vez resuelta, la solución se puede implementar y probar para confirmar la recuperación del servicio.

6) cierre del incidente

Después de la confirmación de que el Incidente se ha resuelto, y el usuario final está satisfecho y de acuerdo, el Incidente puede cerrarse. El técnico de la mesa de servicio debe asegurarse de que los detalles de la clasificación inicial sean precisos para futuras referencias e informes.

7) Encuesta de satisfacción del usuario

Se puede utilizar una encuesta de satisfacción del usuario para determinar la satisfacción general con la prestación de sus servicios. Esta es una de las formas más efectivas de construir y mantener una relación positiva con sus clientes y usuarios, especialmente si presta mucha atención e implementa mejoras basadas en sus comentarios. Existen varios métodos para recopilar comentarios, incluidas las encuestas posteriores a la llamada, las encuestas telefónicas personales y, más comúnmente, la encuesta en línea.

Hay una serie de mejores prácticas que uno idealmente sigue al desarrollar una encuesta de satisfacción del usuario:

  • Explicar el propósito de la encuesta.
  • Distribuya la encuesta al azar para obtener los resultados más precisos.
  • Mantenlo corto, pero completo
  • Indique claramente sus preguntas
  • Mantenga las preguntas abiertas al mínimo
  • Comparta los resultados de la encuesta y las mejoras que haya realizado.

*** Incidentes importantes: en ocasiones, se producirá un incidente importante que provocará una interrupción grave de los servicios comerciales importantes. Estos incidentes de alto impacto y alta urgencia generalmente afectan a un gran número de usuarios y privan a la empresa de uno o más servicios críticos. En el caso de un Incidente importante, se unirá un equipo, dando la máxima prioridad a restaurar el funcionamiento normal.

Cada organización desarrollará sus propios criterios para identificar un incidente importante, pero las características incluyen:

  • Impacta a una gran cantidad de clientes
  • El costo del tiempo de inactividad es sustancial para los clientes y / o el negocio
  • El tiempo y el esfuerzo necesarios para restablecer el funcionamiento normal son más largos que los niveles de servicio acordados.

Procesos ITIL interrelacionados

ITIL procesa la interfaz entre sí durante todo el ciclo de vida del servicio. Como se mencionó anteriormente, un Incidente es una interrupción o reducción no planificada en la calidad de un servicio de TI. Estrechamente relacionados están los Problemas, que son la causa desconocida de uno o más Incidentes. La gestión de problemas está diseñada para prevenir o minimizar el impacto de los incidentes mediante el análisis de la causa raíz.

Ocasionalmente, ambos términos se usan indistintamente. Un tercer término, Issue, también puede ser sustituido, lo que aumenta aún más la confusión en torno a la metodología ITIL.

Información para recordar:

  • Un incidente puede generar un problema: si se informa un incidente y es probable que vuelva a suceder, se puede generar un problema para identificar y resolver la causa raíz subyacente mediante el proceso de gestión de cambios.
  • Un problema puede causar un incidente: si surge un problema y no se resuelve, es posible que se informe un incidente o varios incidentes relacionados.

El papel de la gestión del conocimiento

Aunque el proceso de Gestión del conocimiento está asociado con la etapa del ciclo de vida de Transición del servicio, es uno que se ejecuta en todo el ciclo de vida, especialmente durante la Operación del servicio. La gestión del conocimiento puede tener un impacto muy fuerte durante el proceso de gestión de incidentes. La función de Gestión del conocimiento suele ser una característica dentro de una solución de tecnología de gestión de servicios de TI más grande. Su objetivo es recopilar y compartir conocimientos en toda la organización. Esto es especialmente importante cuando el personal de la mesa de servicio busca resolver rápidamente los incidentes reportados. Las soluciones dentro de la base de conocimiento aprovechan el conocimiento existente para ahorrar tiempo y reducir el costo de la prestación del servicio.

Otras relaciones clave del proceso ITIL

  • Configuration Management
  • Gestión del cambio
  • Gestión del nivel de servicio
  • Gestión de disponibilidad
  • Gestión de capacidad
  • Gestión de eventos

Roles y responsabilidades de gestión de incidentes

Las funciones y responsabilidades bien definidas son críticas para la ejecución efectiva del proceso de gestión de incidentes. El equipo de gestión de incidentes está compuesto por lo siguiente:

Incident Manager

El administrador de incidentes tiene la responsabilidad principal de conducir y mejorar continuamente el proceso de gestión de incidentes. En organizaciones pequeñas y medianas, este rol se asigna comúnmente al Administrador de la mesa de servicio; en organizaciones más grandes, este puede ser un rol definido por separado. Las responsabilidades clave incluyen: liderazgo del equipo, informar los indicadores clave de rendimiento (KPI) a la administración, administración directa del soporte de primera y segunda línea, administrar el sistema de gestión de incidentes y hacer cumplir el flujo de trabajo del proceso de gestión de incidentes.

Soporte de primera línea

Los técnicos de la mesa de servicio de primera línea son el único punto de contacto para los usuarios finales que buscan información e informan sobre interrupciones del servicio. Son los principales responsables del soporte inicial y la clasificación de los incidentes y del intento inmediato de restaurar un servicio fallido lo más rápido posible. Si no pueden resolver el Incidente, el Técnico de la Mesa de Servicio de Primera Línea dirigirá el Incidente al personal de soporte apropiado, supervisará la actividad y mantendrá a los usuarios actualizados sobre el estado de su Incidente.

Soporte de nivel dos

Los técnicos de soporte de segunda línea generalmente tienen un conocimiento más avanzado que los técnicos de la mesa de servicio de primera línea. Pueden hacerse responsables de los Incidentes que First Line Support no puede resolver. Estos técnicos pueden interactuar con expertos de terceros de proveedores de software o hardware para ayudar a restaurar el servicio normal lo más rápido posible.

libro electronico

7 pecados capitales de las implementaciones de ITIL

Cómo moverse a velocidad digital mientras defiende los principios de ITIL

7 pecados capitales de las implementaciones de ITIL

Indicadores clave de rendimiento (KPI) de gestión de incidentes

Las mediciones son importantes en todas las etapas del ciclo de vida de ITIL. Cada proceso tiene métricas que deben ser monitoreadas y reportadas para evaluar efectivamente el desempeño general. La mejora continua del servicio requiere que se mida el rendimiento de cada proceso para identificar las áreas que necesitan mejoras.

Las métricas típicas de gestión de incidentes incluyen:

  • Total de incidentes reportados (por categoría, prioridad, persona, unidad organizativa, etc.)
  • Estado de incidentes
  • Tiempo entre la creación y resolución del incidente
  • Incidentes y SLA (alcanzados, violados)
  • Costo promedio por incidente
  • Tasa de reapertura
  • Incidentes manejados sin escalamiento
  • Resolución de la primera llamada
  • Elementos de configuración que experimentan incidentes recurrentes
  • Incidentes por hora del día

Los KPI deben estar relacionados con los factores críticos de éxito (CSF) y los CSF deben estar relacionados con los objetivos. Esta relación ayuda con el apoyo a la decisión para mantener el estado actual y mejorar el estado deseado. Aunque cada organización es diferente, los informes relevantes para los usuarios, el personal y la administración ayudarán a respaldar decisiones importantes que se pueden utilizar para mejorar tanto los procesos como el negocio en general.

Mejores prácticas para implementar la gestión de incidentes

La adopción del marco ITIL dentro de una empresa puede ser una tarea abrumadora. Como ocurre con cualquier proceso de ITIL, la implementación de la gestión de incidentes requiere el apoyo de la empresa. Es de particular importancia obtener la aceptación de los ejecutivos y la alta dirección. Antes de comenzar el proceso de adopción, es importante tener al menos una persona dedicada a la gestión general del proyecto y la orquestación del cumplimiento de las mejores prácticas para la gestión de incidentes. También es extremadamente útil tener una herramienta de gestión de servicios de TI (ITSM) que respaldará sus procesos de estado actual y los procesos de estado futuros deseados, así como un Service Desk que actúe como interfaz principal con el departamento de TI.

1) Comprender el proceso actual de gestión de incidentes

Ocasionalmente, una organización no tiene un proceso consistente para manejar incidentes, o tiene uno menos sofisticado. De cualquier manera, es importante mapear el proceso existente lo mejor posible en un esfuerzo por comprender lo que ofrece el proceso existente de Service Desk.

2) Identificar la visión del proceso de gestión de incidentes a largo plazo

También es importante comprender qué espera la organización del proceso de gestión de incidentes. La expectativa puede basarse en plantillas genéricas de gestión de incidentes incluidas con la herramienta ITSM o en un proceso más personalizado basado en las necesidades específicas de la organización.

3) Realizar un análisis de brechas

A continuación, identifique lo que debe ajustarse entre el proceso actual de gestión de incidentes de la organización y su visión a largo plazo para la gestión de incidentes. Esto le proporcionará información valiosa sobre el esfuerzo, el tiempo, el dinero y los recursos necesarios para lograr sus objetivos de gestión de incidentes y sus objetivos generales de servicio.

4) Crear una hoja de ruta de implementación

La adopción de cualquier proceso ITIL llevará tiempo para desarrollarse, y necesitará una hoja de ruta para ayudar a establecer las expectativas para la administración. Use esa hoja de ruta para describir las actividades, el calendario y los esfuerzos necesarios para cumplir. Esta hoja de ruta debe incluir ganancias rápidas, implementación de herramientas, cambios de procesos, habilitación de personas y organizaciones, planes de comunicación y cambios generales de gobierno.

5) Comience la implementación del proyecto

Es hora de que comience la implementación. Cree un plan de proyecto que defina las acciones o tareas, las responsabilidades y el cronograma para completar todas las tareas. Comunique los éxitos a lo largo del camino a medida que logra cada hito, demostrando su progreso hacia su objetivo de implementación final.

Lista de verificación de funciones para el software de gestión de incidentes

Para organizaciones de TI que evalúan Software de gestión de incidentes y / o suites de gestión de servicios de TI que ofrecen capacidades de gestión de incidentes, es importante comprender los tipos de características necesarias para admitir procesos clave. Como mínimo, el software de gestión de incidentes debe proporcionar las siguientes capacidades:

  • Crear, modificar, resolver y cerrar registros de incidentes.
  • Genere números de registro únicos asociados con cada registro de incidente
  • Vincular incidentes con registros de problemas, artículos de conocimiento, soluciones conocidas y solicitudes de cambio
  • Enlace los datos de gestión de configuración al registro de incidentes
  • Notificar a los propietarios de incidentes cuando se resuelva el problema asociado
  • Registro automático de datos históricos en un registro de auditoría.
  • Categorización de incidentes configurable
  • Búsqueda de incidentes y capacidades de informes
  • Enrute los incidentes en función de la disponibilidad de recursos, zonas horarias, sitios, etc.
  • Priorizar, asignar y escalar incidentes basados ​​en la categorización; escalar en función de la prioridad u otra categorización
  • Integre con soluciones de monitoreo de eventos con la capacidad de crear, actualizar y cerrar incidentes automáticamente
  • Configuraciones de campo flexibles que incluyen texto libre, menú desplegable, fecha / hora, archivos adjuntos, capturas de pantalla
  • Vincular incidentes a datos del cliente
  • Utilice scripts / soluciones de base de conocimiento para diagnóstico y resolución.
  • Asigne incidentes o tareas asociadas a proveedores de servicios externos.
  • Asignar incidentes a múltiples asignados
  • Crear un problema o solicitud de cambio desde un registro de incidentes
  • Alertas automáticas de incidentes (al personal de TI y / o al usuario final) en función de plazos, SLA, cierre y otras actividades
  • Vincular registros de incidentes a SLA
  • Recopile comentarios de los usuarios finales a través de una encuesta de satisfacción del cliente
  • Iniciar un incidente en nombre de otra persona.
  • Detenga la funcionalidad del reloj SLA para poner un incidente en espera
  • Diferenciar entre un incidente y una solicitud de servicio
  • Reactivar incidente resuelto
  • Priorizar automáticamente determinado por impacto y urgencia
  • Integre con el sistema de telefonía / ACD para rellenar previamente la información del cliente en función del identificador de llamadas
Anthony Orr

Anthony Orr

Autor y examinador de ITIL

Durante más de treinta años, Anthony Orr ha trabajado en diversos puestos de estrategia de TI, gerenciales, consultoría, asesoramiento, marketing y técnicos. Anthony es autor de las publicaciones ITIL v3 2011 y del libro de exámenes ITIL MALC, así como un examinador sénior para los exámenes de certificación ITIL v2, v3 y Cyber-Resilience. Ha publicado numerosos podcasts, videos, folletos, libros blancos y artículos, y recientemente ha publicado un libro blanco, Sinergias entre ITIL y DevOps, con AXELOS. Habiendo dado conferencias en universidades de todo el mundo, Anthony también es un orador frecuente en eventos de la industria como itSMF, HDI y Pink Elephant.

Informe de analista

Compare los proveedores de ITSM en el Cuadrante Mágico 2018 de Gartner

Compare los proveedores de ITSM en el Cuadrante Mágico 2018 de Gartner

El Cuadrante Mágico de Gartner 2020 ya está disponible

Obtenga los consejos, la orientación y los estudios de casos líderes en la industria de Cherwell para una mejor administración del servicio y ayudar a su empresa a cumplir, directamente en su bandeja de entrada.

* Por favor complete el campo de correo electrónico