Guía esencial

La guía esencial para la gestión de problemas de ITIL

asset_eg_tn_essential_guide_to_problem_management

Adelante y fondo

Comprender su nivel de madurez organizacional al implementar ITIL

Como profesionales de la mesa de servicio de TI, queremos ofrecer y respaldar una experiencia de servicio para nuestros usuarios que no sea más que extraordinaria. Podemos gestionar incidentes y restaurar el servicio lo más rápido posible utilizando el proceso de gestión de incidentes, pero el objetivo final es no tener incidentes. Por lo tanto, le doy Gestión de problemas para ayudarlo a usted y a su organización a lograr estos resultados.

El objetivo principal de la Gestión de problemas es evitar que se produzcan incidentes y, si se producen, evitar que vuelvan a ocurrir. ¿Te imaginas un proveedor de servicios que simplemente reacciona a incidentes que se repiten continuamente y nunca se resuelven realmente? ¿Te imaginas un escenario como este, y se convierte en "lo de siempre" resolver los mismos incidentes una y otra vez? Con el tiempo, la cantidad de incidentes aumentará, el costo de gestionar los incidentes aumentará, la satisfacción del cliente y del usuario caerá en picado, la reputación de la mesa de servicio se verá afectada, las iniciativas de TI sombra se convertirán en la norma y el resultado colectivo tendrá un impacto perjudicial en el capacidad de hacer negocios.

Muchas organizaciones sufren innecesariamente porque no tienen un proceso eficaz de gestión de problemas. A menudo, esto se debe a que los equipos de TI confunden la gestión de problemas con la gestión de incidentes y no comprenden a fondo su relación con la gestión de cambios. Si bien estos procesos funcionan de la mano, el objetivo de la gestión de problemas es respaldar la gestión de incidentes evitando que ocurran incidentes en primer lugar, ¡mediante el uso del proceso de gestión de cambios!

A medida que lea el contenido de esta guía, tenga en cuenta el valor para el negocio de hacer lo que es esencial para su organización, y hacerlo bien aprovechando a las personas, los procesos, la tecnología y los proveedores para cumplir sus objetivos. La excelencia en el servicio es un viaje que nunca termina y debe practicarse continuamente. Y, sobre todo, cuando comience a ver una mejora en la prestación general de sus servicios, ¡celebre sus éxitos!

Anthony Orr: lo que se debe y no se debe hacer al implementar la gestión de problemas de TI

En este breve video, el autor y examinador de ITIL, Anthony Orr, comparte las mejores prácticas y los errores comunes relacionados con la implementación de la gestión de problemas de TI dentro de la empresa.

¿Qué es la gestión de problemas de ITIL?

La gestión de problemas es un proceso de gestión de servicios de TI encargado de gestionar el ciclo de vida de los "problemas" subyacentes. El éxito se logra al detectar rápidamente y proporcionar soluciones o soluciones a los problemas para minimizar el impacto en la organización y evitar la recurrencia. La gestión de problemas también intenta encontrar el error en la infraestructura de TI que está causando el problema y contribuyendo a los incidentes que puedan tener los usuarios. La Biblioteca de infraestructura de TI (ITIL) proporciona las siguientes definiciones para su uso dentro de este proceso:

  • Problema: “La causa de uno o más Incidentes. Por lo general, no se conoce la causa en el momento en que se crea un registro de problema "
  • Error: "Un defecto de diseño o un mal funcionamiento que provoca una falla en uno o más servicios de TI u otros elementos de configuración"
  • Error conocido: "Un problema que tiene una causa raíz documentada y una solución alternativa"
  • Causa raíz: "La causa subyacente u original de un incidente o problema".

Gestión de problemas proactiva versus reactiva

La gestión de problemas puede ser reactiva o proactiva.

  • La gestión reactiva de problemas es la reacción de resolución de problemas que ocurre cuando surgen uno o más incidentes.
  • La gestión proactiva de problemas trata de identificar y resolver problemas antes de que ocurra cualquier incidente. Esta actividad está asociada con la mejora continua del servicio (CSI).

El papel de la gestión de problemas en el marco de ITIL

La Biblioteca de Infraestructura de TI (ITIL), lanzada en 2000, es el marco de mejores prácticas de Gestión de Servicios de TI (TSM) más popular en todo el mundo. Ha sido adoptado por individuos y organizaciones en organizaciones públicas y privadas como un protocolo para alinear los servicios de TI con las necesidades de la empresa.

ITIL 2011, la versión más actual, consta de cinco publicaciones principales:

  • Estrategia de servicio
  • Diseño de servicio
  • Transición de servicio
  • Operación de servicio
  • servicio de Mejoramiento contínuo

Relación con la operación del servicio ITIL

La gestión de problemas es uno de los cinco procesos que comprende la publicación "Operación del servicio". La Operación del Servicio ITIL es un elemento esencial del ciclo de vida del procedimiento, enfocándose en la entrega y soporte del servicio, y el valor para el negocio, los clientes y los usuarios. Asegura que se alcancen o superen los niveles y la calidad de servicio acordados, proporcionando una introducción y pautas para las actividades que contribuyen a la excelencia operativa de TI.

Los procesos de operación del servicio ITIL incluyen:

  • Gestión de problemas
  • Gestión de Incidentes
  • Solicitud de cumplimiento
  • Gestión de eventos
  • Gestión de Acceso

Certificación ISO / IEC 20000

La implementación de la gestión de problemas de ITIL junto con otros procesos de ITIL puede ayudar a una organización a lograr ISO / IEC 20000 Certificación. Para obtener la certificación ISO / IEC 20000, una empresa debe demostrar que ha implementado capacidades clave de TI y procesos de gestión de servicios. ISO / IEC 20000 se alinea bien con ITIL porque si bien ISO / IEC 20000 describe un conjunto de requisitos para un Sistema de gestión de servicios de TI, ITIL proporciona un marco para adoptar las mejores prácticas que se alinean con esos requisitos.

libro electronico

7 pecados capitales de las implementaciones de ITIL

Cómo moverse a velocidad digital mientras defiende los principios de ITIL

7 pecados capitales de las implementaciones de ITIL

El valor de la gestión de problemas para el negocio

El proceso de Gestión de problemas funciona en conjunto con la Gestión de incidentes y cambios para proporcionar valor a la empresa de varias maneras. El objetivo principal de la gestión de problemas es minimizar el impacto de los problemas en el negocio y prevenir la recurrencia. Cuando tiene éxito, se reducen el tiempo de inactividad y las interrupciones. Los beneficios adicionales incluyen:

  • Mayor disponibilidad de servicio
  • Calidad de servicio mejorada
  • Disminución del tiempo de resolución del problema
  • Reducción del número de incidentes.
  • Productividad incrementada
  • Costos reducidos
  • Satisfacción del cliente mejorada

Adoptar e implementar procesos y tecnología ITIL minimizará el caos que las organizaciones de TI pueden enfrentar en medio del panorama tecnológico que cambia rápidamente. Aunque la gestión de problemas es su propio proceso, depende de un proceso eficaz de gestión de incidentes y de las herramientas adecuadas; herramientas que incluyen una interfaz común, acceso al conocimiento disponible, información de gestión de configuración e interacción con otros procesos relacionados con ITIL. Esto garantiza que los problemas se identifiquen, contengan detalles relevantes y se trabajen lo más rápido posible. ITIL no proporciona a las organizaciones un método exacto para adoptar la Gestión de problemas, sino un marco estructurado que requiere ajustes para adaptarse a las necesidades y limitaciones comerciales individuales. Los ajustes regulares a estos procesos internos de ITIL en última instancia respaldarán la agilidad, demostrarán el valor comercial y ayudarán a las organizaciones a competir en su espacio de mercado.

Flujo del proceso de gestión de problemas

Flujo del proceso de gestión de problemas¿Cómo funciona la gestión de problemas? La gestión de problemas de ITIL es algo más que resolver incidentes; tiene en cuenta todo el ciclo de vida de un problema. El flujo del proceso del ciclo de vida de Gestión de problemas se puede estructurar para gestionar los problemas que los usuarios o los técnicos de la mesa de servicio notifican inicialmente como incidentes a través de un portal de autoservicio, por teléfono, correo electrónico, en persona o problemas potenciales que son detectados automáticamente por ITSM personal o tecnología antes de que ocurra cualquier incidente. El alcance del flujo del proceso de Gestión de problemas incluye:

1) Detección de problemas

Los problemas se pueden detectar de diversas formas, incluso como resultado de un informe de Incidente, análisis continuo de Incidentes y detección automatizada mediante una herramienta de gestión de eventos o notificación al proveedor. Un problema se detecta comúnmente cuando se desconoce la causa de uno o más incidentes notificados al servicio de asistencia técnica. Es posible que la mesa de servicio haya resuelto el Incidente y que vuelva a ocurrir, pero no está seguro de la causa raíz subyacente y, por lo tanto, crea un registro de Problema. En otros casos, la mesa de servicio puede tener claro que un Incidente informado está asociado a un Problema. Es posible que este problema ya se haya registrado (problema conocido) y el incidente se puede vincular al registro de problema existente. Si el problema no se ha registrado, se debe crear inmediatamente un registro de problema para ayudar a garantizar el rendimiento del servicio.

2) Registro de problemas

Para mantener un registro histórico completo, todos los problemas, independientemente del método utilizado para identificar e informar a la mesa de servicio, deben registrarse con todos los detalles relevantes, incluyendo fecha / hora, información del usuario, descripción, elemento de configuración relacionado de la CMDB, Incidentes asociados, detalles de resolución e información de cierre.

  • Categorización: una vez registrado, se deben seleccionar todas las categorías apropiadas para asignar, escalar y monitorear adecuadamente las frecuencias y las tendencias del problema
  • Priorización: asignar prioridad es fundamental para determinar cómo y cuándo el personal manejará el problema. Está determinado por el impacto: número de incidentes asociados que pueden proporcionar información sobre el número de usuarios afectados o su impacto en el negocio. Además, la urgencia del problema: la rapidez con la que se requiere resolución se tiene en cuenta para definir la prioridad

3) Investigación y diagnóstico

Se llevará a cabo una investigación sobre la causa raíz del problema en función del impacto, la gravedad y la urgencia del problema en cuestión. Las técnicas de investigación comunes incluyen la revisión de la Base de datos de errores conocidos (KEDB) en un esfuerzo por encontrar problemas y resoluciones que coincidan y / o recrear la falla para determinar la causa

4) solución

En algunas situaciones, es posible proporcionar una solución temporal o una solución alternativa al usuario que experimenta el Incidente relacionado con el Problema. Sin embargo, es importante buscar una resolución de cambio permanente para el error subyacente detectado por la Gestión de problemas.

5) Crear registro de error conocido

Una vez que se completan la investigación y el diagnóstico, es importante crear un registro de errores conocidos. Si surgen incidentes o problemas en el futuro, el técnico de la mesa de servicio que investiga identificará y proporcionará una resolución más rápidamente utilizando la base de datos de errores conocidos (KEDB) y las soluciones alternativas asociadas

6) resolución

Una vez resuelta, la solución puede implementarse utilizando el procedimiento de cambio estándar y probarse para confirmar la recuperación del servicio. Sin embargo, si se requería un cambio normal, una Solicitud de cambio (RFC) asociada se generará y aprobará antes de que se aplique una resolución al Problema

7) cierre

Después de la confirmación de que el error se ha resuelto, el problema y los incidentes asociados se pueden cerrar. El técnico de la mesa de servicio debe asegurarse de que los detalles de la clasificación inicial sean precisos para futuras referencias e informes.

*** Revisión de problemas principales: los problemas principales se definen mediante el análisis de impacto empresarial (BIA) y la evaluación de riesgos (RA) de una organización para determinar la respuesta y la prioridad (impacto, urgencia y gravedad del problema). El objetivo de una revisión de problemas importante es mejorar continuamente el proceso de Gestión de problemas para responder a los problemas comerciales más importantes. Un proceso de revisión puede identificar lo que se hizo correctamente, lo que se hizo de manera incorrecta, lo que se puede mejorar, los riesgos adicionales, cómo evitar que se repita y la naturaleza de la responsabilidad de cualquier tercero. Esta revisión no debería vivir en un silo; debe compartirse con los miembros del equipo como parte de las sesiones de capacitación y sensibilización.

*** Control de problemas y control de errores: en algunas situaciones, los términos Control de problemas y Control de errores pueden utilizarse durante el ciclo de vida de la Gestión de problemas. El control de problemas se puede incorporar a la fase de investigación con el objetivo de encontrar la causa raíz del problema y convertirlo en un error conocido. Esto ayuda al técnico de la mesa de servicio a proporcionar soluciones temporales al usuario. El control de errores, por otro lado, es parte de la fase de resolución con el objetivo de convertir los errores conocidos en soluciones y eliminarlos de la base de datos de errores conocidos (KEDB) cuando sea necesario.

Procesos ITIL interrelacionados: gestión de incidentes y cambios

ITIL procesa la interfaz entre sí durante todo el ciclo de vida de la entrega del servicio. La gestión de problemas y la gestión de incidentes están estrechamente relacionadas con la gestión de problemas, pero no son lo mismo. Si bien estos dos procesos son realizados por el departamento de TI, cada uno tiene objetivos diferentes. La gestión de problemas se centra en prevenir o minimizar el impacto de uno o más incidentes mediante la búsqueda de la causa raíz. La gestión de incidentes busca resolver rápidamente un incidente y restaurar el servicio a los usuarios de manera oportuna. La restauración del servicio en la gestión de incidentes no significa necesariamente que el incidente no volverá a ocurrir. La mayoría de los problemas se desencadenarán como reacción a uno o más incidentes, pero en algunas situaciones los problemas se crean cuando los probadores están probando una versión, como cuando utilizan el proceso de Validación y prueba del servicio o los proveedores encuentran fallas en sus productos o servicios.

Aunque Service Operation se esfuerza por lograr la estabilidad, hay casos en los que es necesario un cambio. Por esta razón, la Gestión del cambio también está estrechamente relacionada con la Gestión de problemas. Los cambios pueden ser aprobados previamente o requerir aprobación; en cualquier caso, se crea un RFC para documentar el cambio necesario. Una solicitud de cambio (RFC) a menudo se activa durante el ciclo de vida de Gestión de problemas si se requiere hardware, software, procesos o infraestructura nuevos, mejorados o actualizados para resolver un problema.

Otras relaciones clave del proceso ITIL:

  • Configuration Management
  • Gestión del nivel de servicio
  • Gestión de disponibilidad
  • Gestión de capacidad
  • Gestión de eventos
  • Servicio de Validación y Pruebas
libro electronico

7 pecados capitales de las implementaciones de ITIL

Cómo moverse a velocidad digital mientras defiende los principios de ITIL

7 pecados capitales de las implementaciones de ITIL

Roles de gestión de problemas y responsabilidades

Las funciones y responsabilidades bien definidas son críticas para la ejecución efectiva de un proceso exitoso de gestión de problemas. El equipo de Gestión de problemas está formado por lo siguiente:

1) Administrador de problemas

Un administrador de problemas es una persona designada que puede o no ser responsable de otros roles organizacionales. Este propietario del proceso de Gestión de problemas es responsable de todos los aspectos de su coordinación, incluidos:

  • Actuar como enlace con el personal responsable de la resolución del problema.
  • Asegurar que los problemas se resuelvan dentro de su SLA
  • Propiedad y gestión de la base de datos de errores conocidos (KEDB)
  • Cierre de problemas
  • Coordinar la revisión del problema mayor

Nota: El Administrador de problemas y el Administrador de incidentes no deben ser la misma persona debido a posibles conflictos en el enfoque de ejecución.

2) Equipo de resolución de problemas

La solución de problemas puede ser manejada por miembros internos del equipo de soporte técnico o proveedores o vendedores externos. En situaciones en las que ocurre un problema grave o grave, el administrador de problemas puede formular un equipo dedicado de gestión de problemas que esté formado por recursos con experiencia específica.

Indicadores clave de rendimiento (KPI) de gestión de problemas

Las mediciones son importantes en todas las etapas del estilo de vida de ITIL para cuantificar el éxito general. Para determinar la efectividad de la gestión de problemas, las empresas deben identificar los objetivos, los indicadores clave de rendimiento (KPI) y los factores críticos de éxito (CSF). Estos pueden ser diferentes para cada empresa. Un buen punto de partida para determinar los CSF y los KPI de gestión de problemas es identificar los objetivos de mejora actuales y futuros de la gestión de problemas. Los objetivos deben apoyar los objetivos, la misión y la visión de la organización para la eficacia operativa. Los objetivos, los CSF y los KPI varían según la madurez del proceso. Las medidas típicas de gestión de problemas a considerar incluyen:

  • Problemas reportados por (categoría, unidad organizativa, persona, etc.)
  • Problemas resueltos dentro de los objetivos de SLA
  • Porcentaje de problemas que exceden los objetivos de SLA
  • Tendencias asociadas con la acumulación de problemas
  • Costo promedio de gestionar un problema
  • Informe de análisis de causa raíz (RCA)

Aunque cada organización es diferente, los informes relevantes para los usuarios, el personal y la administración ayudarán a respaldar decisiones importantes que se pueden utilizar para mejorar continuamente tanto los procesos como el negocio en general.

Lista de verificación de funciones para el software de gestión de problemas

Para las organizaciones de TI que evalúan el software de gestión de problemas y / o las suites de gestión de servicios de TI que ofrecen capacidades de gestión de problemas, las siguientes características son importantes, si no críticas, para soportar procesos clave de manera efectiva.

Como mínimo, el software de gestión de problemas debería permitir a los administradores:

  • Configurar procesos problemáticos
  • Configurar la categorización de incidentes
  • Crear, modificar, resolver y cerrar registros de problemas.
  • Implemente ITIL u otros marcos de mejores prácticas de la industria.
  • Actualice automáticamente el estado o cierre todos los incidentes relacionados con la actualización / cierre del problema
  • Integración con gestión de incidentes, cambios, configuración y conocimiento.
  • Automatice la creación de problemas según las reglas comerciales y los SLA
  • Documente y administre artefactos de conocimiento asociados con problemas y errores conocidos.
  • Ver los CI afectados desde un registro de problemas
  • Seguir el tiempo de trabajo
  • Vincular problemas a CI, incidentes y solicitudes de cambio
  • Asignar impacto y urgencia a un problema
  • Diferenciar entre problemas y errores conocidos.
  • Automatizar o asignar tareas manualmente a individuos o equipos.
  • Automatizar el registro de datos históricos en un registro de auditoría.
  • Enlace con base de conocimiento de terceros
  • Utilice configuraciones de campo flexibles que incluyen texto libre, menú desplegable, fecha / hora, archivos adjuntos, capturas de pantalla
  • Crear plantillas para problemas recurrentes.
  • Busque soluciones, soluciones alternativas y errores conocidos.
  • Documentar el análisis de la causa raíz
  • Genere números de registro únicos asociados con cada registro de problema
  • Búsqueda de problemas y capacidades de informes
Anthony Orr

Anthony Orr

Autor y examinador de ITIL

Durante más de treinta años, Anthony Orr ha trabajado en diversos puestos de estrategia de TI, gerenciales, consultoría, asesoramiento, marketing y técnicos. Anthony es autor de las publicaciones ITIL v3 2011 y del libro de exámenes ITIL MALC, así como un examinador sénior para los exámenes de certificación ITIL v2, v3 y Cyber-Resilience. Ha publicado numerosos podcasts, videos, folletos, libros blancos y artículos, y recientemente ha publicado un libro blanco, Sinergias entre ITIL y DevOps, con AXELOS. Habiendo dado conferencias en universidades de todo el mundo, Anthony también es un orador frecuente en eventos de la industria como itSMF, HDI y Pink Elephant.

libro electronico

7 pecados capitales de las implementaciones de ITIL

Cómo moverse a velocidad digital mientras defiende los principios de ITIL

7 pecados capitales de las implementaciones de ITIL

El Cuadrante Mágico de Gartner 2020 ya está disponible

Obtenga los consejos, la orientación y los estudios de casos líderes en la industria de Cherwell para una mejor administración del servicio y ayudar a su empresa a cumplir, directamente en su bandeja de entrada.

* Por favor complete el campo de correo electrónico