Aníbal Serna G.
Ingeniero Metalúrgico, M.Sc., Ph.D I.Q.
Mail: anibalsernag@gmail.com; jose.serna@odl.com.co
1. GENERALIDADES
El Análisis de Causa Raíz de Falla – RCA, se concibió como una metodología eficiente de
toma de decisiones para solución de problemas causados por fallas, generalmente en
equipos y componentes críticos. Es un proceso estructurado, consciente, enfocado y
analítico que permite identificar las causas responsables de las fallas. Es un método pro-
activo, capaz de prevenir la ocurrencia de fallas y podría considerarse como una
herramienta de mejora continua[2].
1
Aunque es muy diversa la aplicabilidad del RCA, existen principios generales compatibles
para definir un proceso estructurado, considerado universal, para la toma de decisiones y
solución del problema.
Evaluación interdisciplinaria de todas las partes que intervienen en un proceso. Todas las
partes están interconectadas, cada acción sobre alguna de las partes afecta las demás. Los
sistemas complejos se pueden subdividir en componentes simples y para el resultado, se
unen los análisis y las síntesis de cada uno.
2
Reducción de fallas crónicas, repetitivas.
Fallas esporádicas que ocurren un vez pero con alto coto (consecuencia)
Reducción de costos de mantenimiento
Eliminación de cuellos de botella operacionales
Mejora de la calidad de los productos
Reducción del consumo de energía, etc…
Todo análisis de causa raíz de falla se enfoca en 4 fases operativas, descritas en la Fig. 1,
donde se describen las actividades a realizar y los resultados o entregables de cada fase.
Adicionalmente, se debe incluir una fase administrativa, que consiste en la elaboración de
planes de acción, seguimiento y verificación de resultaos en campo.
RCA
GENERALIDADES DEL PROCESO: “SOLUCIÓN DEL PROBLEMA”
FASES DESCRIPCIÓN PASOS
3. IDENTIFICACIÓN DE
2. ANÁLSIS DE - DIVIDIR SITUACIÓN COMPLEJA EN
PROBLEMAS
PROBLEMAS PARTES MANEJABLES
4. DEFINICIÓN DE
- R/ CUÁL ES EL PROBLEMA?
PROBLEMAS
3
2.1 FASE I. REGISTRO DE INCIDENTES
Todo incidente debe ser reportado. En las empresas, el reporte inicial está a cargo del área
de HSE, quienes utilizan formatos específicos para detallar lo ocurrido, con los datos que
lo describen (Qué pasó?, Cómo?, Cuándo?, Dónde?, Por qué?) y la matriz de riesgo para
valorar el impacto del mismo.
Para la valoración del riesgo materializado se utiliza una matriz similar a la mostrada en la
Fig. 2., donde se describe la frecuencia de falla y la consecuencia. Dependiendo de la
consecuencia, se define el equipo investigador que conducirá el taller de RCA y el nivel de
investigación.
REFINERÍA
REFINERÍA
Figura 2. Matriz de Análisis de Riesgo – RAM, elaborada para una refinería de petróleo.
4
2.1.2.1 Conformación del Equipo de Trabajo
La integración de un equipo de trabajo interdisciplinario es fundamental para el éxito de
un Taller de RCA. El nombramiento de los integrantes debe obedecer a una directriz
gerencial, con respaldo administrativo y representatividad de los intereses corporativos. El
equipo básico de trabajo estaría conformado por:
Tabla 1. Roles, perfil y responsabilidades del equipo básico para un taller de RCA
5
de proyectos de la ingeniería
Corporación Comparar la información de las
- Especificaciones de normas y estándares con las de
materiales y equipos construcción
- Mejores prácticas de diseño Verificar especificaciones técnicas
e ingeniería
6
Supervisor / - Procedimientos de Conocer las especificaciones de
Operador de operación del equipo o diseño relacionadas con parámetros
Tablero componente objeto del operacionales
análisis Conocer las ventanas operativas
- Normas y estándares Conocer los procedimientos de
relacionados operación en emergencias y fuera
- Certificación de operadores de control
de tablero Conocer la seguridad operacional,
alarmas y sistemas de seguridad
Conocer los sistemas de control y
manejo de consolas operacionales
Conocer los protocolos de
comunicaciones, pare y arranque de
planta y equipos
7
En la Fig. 3, se muestran las principales fuentes de información para la recolección de
datos: Sistemas de cómputo de los cuartos de control y del análisis operacional,
comunicaciones escritas, entrevistas personales, actas de reuniones y toma de decisiones
para el manejo del cambio, análisis de tendencias de parámetros operacionales y
comportamiento de sistemas.
RECOLECCIÓN DE DATOS
a) Históricos
- Históricos de diseño, procura, construcción, montaje. Esta información debe estar
contenida en el Dossier de construcción – precomisionamiento – comisionamiento
y puesta en operación del producto del proyecto.
- Histórico de operación. Incluye la información operacional desde la puesta en
marcha.
- Históricos de inspección – mantenimiento. Incluye los resultados de inspecciones,
reparaciones, cambios, alteraciones y modificaciones.
- Históricos de paradas y arrancadas, incluidas las paradas programadas, de
emergencia y temporales por falta de carga.
- Reportes de incidentes, requerimientos de seguridad operacional, indicadores de
desempeño de equipos, resultados de auditorías técnicas, ambientales y de
seguridad operacional.
b) Histogramas de falla
Los histogramas de falla, tal como el mostrado en la Fig. 4, facilitan la ubicación de
equipos y componentes críticos. Los equipos y componentes con mayor frecuencia de
daño, se denominan malos actores “Bad Actors”. Uno de los objetivos del RCA es
eliminarlos. Se debe considerar la necesidad de soporte especializado de laboratorios,
análisis de falla y ensayos no destructivos
HISTOGRAMAS DE FALLA
9
2.2.1 Identificación del problema
Los tres primeros están asociados a la realización de una tarea; los dos siguientes se
asocian con el aseguramiento de la calidad; los dos siguientes con la gestión de recursos
humanos y los dos últimos, están fuera del control directo. En consecuencia, la causa raíz
de un problema puede estar relacionada con una tarea, aunque la causa directa del
problema sea de carácter administrativo, dependiendo de la naturaleza del incidente.
Para definir el problema se hace una lista de hechos, ya sea eventos de fallas de
mantenimiento, de operación, etc. Esta lista es la base del análisis, ya que todas las causas
10
de falla se deben poder verificar con los hechos listados en cada etapa. Se plantean
hipótesis adheridas a los hechos, circunscritas a unas fronteras físicas determinadas, con
puntos de vista de diferentes disciplinas.
MODELOS DE CAMBIO
EVENTO 2
EVENTO 1 COMPORTAMIENTO
REAL
VENTANA OPERACIONAL
EVENTO 3
TIEMPO
11
2.2.3.3 Asociación de eventos
En el taller de RCA, los diferentes eventos se asocian con un elemento, tal como se
muestra en la Fig. 7. Es una herramienta básica para poder definir y describir el problema.
Cuando se tiene claramente descrito y definido el problema, se dice que ya existe mucha
parte de la solución.
ASOCIACIÓN DE EVENTOS
MANTENIMIENTO OPERACIÓN
PROCESO
POLÍTICAS FUERA DE
SOBRECARGA
PLANEACIÓN CONTROL
PLANTEAR EL
PROBLEMA
IMPACTO
En esta fase, se identifican todas las causas posibles (acciones o condiciones) anteriores
que pudieron generar el problema, se plantean las hipótesis y se construyen los
diagramas causa – efecto. Existen hipótesis que pueden ser probadas y que están
relacionadas con el hecho, se convierten en posible causa raíz. En las comprobaciones,
surgen nuevos hechos o hipótesis que requieren ser probadas con apoyo de análisis
especializado, se convierten en causas probables y también, se dan hipótesis que no
pueden ser probadas y que no están relacionadas con el problema, estas no son causa del
problema y se descartan.
Existen diferentes métodos para el análisis de causa raíz: Análisis Programático, Análisis
de Barreras, Análisis del Cambio, Árbol de Lógica – CRT (Current Reality Tree), Análisis del
Árbol de Falla, Resolución de Problemas, Análisis Estadístico o Deducción Bayesiana,
Análisis MORT, Evaluación de Desempeño Humano, Espina de Pescado, Análisis de Causa-
12
Efecto, Modo de Falla y Análisis de Efectos – FMEA, 5 Porqués?, Análisis de Problemas
Kepner-Tregoe, Diagrama de Ishikawa y Análisis del Pareto.
Identificar las razones por las cuales una acción o condición existe, cuál es el fenómeno
que genera la causa y cuál es el efecto. Si se elimina la causa con una acción correctiva
apropiada y se eliminan o mitigan los efectos recurrentes, la hipótesis es demostrable y
válida y se convierte en una causa posible.
Resumir los hallazgos, listar las causas probadas y las acciones correctivas, clasificadas
por categorías o elementos principales, ayuda a seleccionar la causa más directa o la
Causa Raíz, aquella cuya acción preventiva elimina el efecto y la recurrencia. La selección
de la causa raíz debe ser enfocada y sistemática, debe explicar el Cómo? y el Porqué? de la
ocurrencia de la falla. Es importante describir la acción correctiva seleccionada para
prevenir la recurrencia, incluyendo las razones por las cuales fue seleccionada y como ella
puede prevenir la falla.
13
Las causas raíz de falla, listadas en la Fase 3, se agrupan de acuerdo con la interacción
entre ellas y se plantean soluciones para cada causa y grupo de causas. El objetivo es
asegurar que se está analizando el problema de forma amplia, se busca enfocar
soluciones desde otros puntos de vista. Ejemplo, mejoramiento del equipo existente o
selección de equipo de nueva tecnología.
Cada solución debe ser redactada de tal forma que contenga al menos un sujeto, una
acción y un objetivo.
PLAN DE PREVENCION
Prevenir problemas futuros que pueden resultar de la
implementación de la solución.
– Qué puede ir mal?
– Qué problemas nuevos puede esto causar?
– Debo estar preocupado?
Probabilidad
ALTA
Seguro de implementar?
MEDIA
Si, con ó sin mitigación
BAJA
OK, con mitigación
Consecuencia
Figura 8. Plan de prevención para implementar las soluciones resultantes del RCA
14
2.5 ETAPA 5. PLANES DE ACCIÓN CORRECTIVA Y SEGUIMIENTO – VERIFICACIÓN DE
RESULTADOS EN CAMPO.
Se ha estandarizado una estructura para la elaboración del informe final, el cual debe
contener como mínimo la siguiente información:
- Introducción
- Documentos relacionados
- Participantes
- Análisis de la Causa Raíz
- Conclusiones
- Acciones correctivas – Recomendaciones
- Anexos. Se debe anexar la metodología utilizada, los diagramas causa-efecto,
documentos, tablas y gráficas que soporten los hechos.
15
2.6.2 Entrega del Informe
Se debe socializar el resultado del taller de RCA con los profesionales de proyectos,
operaciones y mantenimiento, especialmente con los involucrados en la gestión de
integridad mecánica y confiabilidad operacional. El informe final en copia dura y
magnética, debe ser entregado al Centro de Documentación Técnica, para que sea
colocado en la intranet institucional.
Los métodos y las herramientas de Análisis de Causa Raíz son aplicables a casos
específicos, se seleccionan dependiendo del alcance y de la consecuencia del incidente o
falla. Las herramientas tienen un uso limitado, los métodos involucran varias etapas y son
de uso más generalizado. Para comparar los métodos y las herramientas, se deben tener
en cuenta los siguientes criterios[6]:
Es un método simple de pregunta – respuesta, usado para explorar la relación entre causa
– efecto, para encontrar la causa raíz y solucionar problemas, Fig. 9. El método fue
desarrollado por Sakichi Toyoda y fue utilizado por la Toyota Motor Corporation durante la
evolución de su proceso de manufactura, como parte de la inducción de sus trabajadores
y como elemento en la solución de problemas en el sistema de producción de vehículos[5].
Actualmente se utiliza en programas de Mejoramiento Continuo, Mantenimiento
Productivo y Seis Sigma.
PROBLEMA PORQUÉ 1?
PORQUÉ 2?
PORQUÉ 3?
PORQUÉ 4?
PORQUÉ 5?
CAUSA ?
Ejemplo: Viajando del trabajo a casa, el vehículo se detuvo en medio de la vía y no volvió a
arrancar.
16
1. Porqué 1? – El tanque de gasolina está vacío
2. Porqué 2? – El medidor de combustible está desajustado
3. Porqúe3? – Nunca lo he calibrado
4. Porqué 4? – No conozco un taller, en la ruta, que realice esta labor
5. Porqué 5? – Realmente no le he hecho el mantenimiento recomendado por el
concesionario.
El quinto Porqué, se considera una causa raíz del problema. El objetivo es que el analista
del problema evite hacer suposiciones y deducciones y mejor se enfoque en el
encadenamiento de hechos y datos y en la causa – efecto, hasta encontrar la causa raíz
que generó el problema.
Causa nivel
Causa Causa 2
Causa nivel
principal 2
principal
Causa nivel 1
Causa nivel 1
Problema a
resolver - Efecto
Causa nivel 1
Causa nivel 1
Causa nivel
Causa 2
principal Causa Causa nivel
principal 2
Figura 10. Diagrama de Ishikawa o espina de pescado para el análisis de causa – efecto en
la solución de problemas
El diagrama “espina de pescado”, fue propuesto por Kaoru Ishikawa en los años 1960´s,
para solución de problemas en la construcción de buques Kawasaki y como fundamento
de la administración moderna[7].
17
En los talleres de RCA, durante la tormenta de ideas, las causas se van agrupando por
afinidad. Las causas principales están relacionadas con las 4 M´s. Las causas de primer
nivel están relacionadas con los servicios y comportamientos y las de segundo nivel, se
asocian con elementos externos.
Causa Principal
- Machine (Equipos - Activos)
- Method (Procesos – Procedimientos – Inspecciones)
- Material (Materias primas – Consumibles – Suministros)
- Man Power (Personas – Recurso humano)
Causas de Nivel 1
- Competencias
- Procesos
- Políticas
- Procedimientos
- Precios
- Productos
- Información – documentación – publicidad
Causas de Nivel 2
- Entorno
- Proveedores
- Sistemas – software – hardware
- Disponibilidad
El método de Causa – Efecto es uno de los más comunes con diferentes variaciones y
nombres comerciales. El más conocido es el “Diagrama de Ishikawa”, “Espina de pescado”,
“Management Oversight and Risk Tree Analysis – MORT”, “Human Performance Evaluations
System – HPES”. Todos los métodos mencionados utilizan la misma categorización lógica
básica.
Después de revisar cada categoría, se define cual causa está más relacionada con el
problema. Si la solución planteada elimina la recurrencia del problema, se convierte en
una causa raíz. En la industria se han desarrollado “Sistemas Expertos”, para apoyar el
análisis y la solución de problemas complejos.
Es un método cuantitativo del diagrama causa – efecto utilizado para identificar fallas en
un sistema, a partir del análisis de subsistemas. Su uso es generalizado en proyectos de
ingeniería, biología y diseño, requiere de datos específicos como “velocidad de daño”,
“frecuencia de fallas”, “Tiempo Medio entre Fallas”. La relación de causa – efecto, está
relacionada con la interacción de las variables. La Fig. 11 muestra un árbol de falla simple.
18
El árbol de análisis de falla está compuesto de diagramas lógicos que muestran el estado
de un sistema, se construye utilizando técnicas de diseño gráfico. Involucra eventos
externos, falla de materiales, mal funcionamiento y combinación de todas las
interconexiones del sistema. El FTA, se desarrolló en los 1960´s por la Bell Telephone
Laboratories para el análisis de proyectos donde el error no es una opción.
Posteriormente, la Boeing Company y la industria nuclear lo han utilizado extensivamente
en sus plantas de construcción y generación de energía, respectivamente.
Falla de Equipo
En el método FTA, un efecto indeseado se coloca como evento superior, luego en la parte
inferior con uniones lógicas se colocan las causas que genera el efecto. Cuando se han
completado todas las posibles causas, se recurre a programas de cómputo especializados
para determinar la probabilidad de falla.
Programas de cómputo de uso frecuente son: el CAFTA del Electric Power Research
Institute, utilizado en las plantas de generación de energía nuclear y por los fabricantes de
equipos aeroespaciales en USA; el SAPHIRE del Idaho National Laboratory, utilizado para
evaluar la seguridad y la confiabilidad de reactores nucleares, de los transbordadores
espaciales, de la Estación Espacial Internacional. Fuera de Estados Unidos, para el análisis
de riesgo en plantas nucleares, se utiliza el RiskSpectrum
El Árbol de Falla es muy útil para el análisis de eventos simples, uno, y generalmente
cumple cinco pasos:
19
d) Evaluar el árbol de falla, desde el punto de vista del riesgo y mejorarlo.
e) Controlar los riesgos identificados, con el objeto de disminuir o eliminar la
probabilidad de ocurrencia de la falla.
El proceso de análisis trata múltiples problemas y síntomas comunes que conllevan a las
mismas causas raíz. Se describe en forma simple y en un diagrama visual los principales
síntomas apreciables y síntomas asociados a un problema que terminan en una causa raíz.
La ventaja de su uso radica en la identificación de conexiones entre los síntomas y los
problemas con sus causas. El enfoque de solución se centra en la causa que genera el
mayor cambio.
En la Fig. 12 se muestra un ejemplo típico de Árbol Real Actual de Falla. Se inicia con una
lista de problemas, conocidos como efectos indeseables. Los síntomas se asume que
tienen una causa común:
Uniendo todos los síntomas, se llega a una causa raíz: La batería del vehículo falló, no
genera energía y en consecuencia, el vehículo no arranca, ni las luces encienden ni el
equipo suena.
La relación entre causa – efecto se relacionan con conectores lógicos: Si, y, entonces (IF,
AND, THEN)
20
Efecto 1 Efecto 2 Efecto 3
El motor del Las luces no El equipo de sonido
vehículo no arranca encienden no funciona
Método desarrollado en 1958 por el Dr. Charles Kepner y el Dr. Benjamín Tregoe, Kepner-
Tregoe Inc., organización dedicada a la consultoría sobre solución de problemas, toma de
decisiones y metodología de ejecución de proyectos [8], denominado también como
“Proceso KT”. Es un sistema estructurado para maximizar el pensamiento crítico de los
involucrados en un problema específico, con el objeto de tomar una decisión o encontrar
una oportunidad, consta de:
21
El método Bayesiano utiliza además, simulación y modelamiento numérico para
estimación del grado de confiabilidad de una hipótesis y lo compara con la evidencia
observada. Es un método inductivo que requiere de analistas con formación matemática
avanzada.
ANÁLISIS DE CAMBIO
QUÉ QUÉ
QUÉ
PASÓ PASÓ
CAMBIÓ
AHORA ANTES
Al graficar el Pareto de causas y frecuencia de falla, nos quedaría una curva similar a la
mostrada en la Fig. 14. En una planta de la industria del petróleo, el número de equipos
críticos es del orden del 20% del total. Esta información es muy importante para definir los
planes de acción de inspección y mantenimiento. Se dedicará el 80% de los recursos a la
evaluación detallada del 20% de los equipos críticos
22
EVALUACIÓN DE CRITICIDAD TÍPICA EN PLANTAS
PORCENTAJE
EQUIPOS CRÍTICOS POR PLANTA
DEL RIESGO
TOTAL
PORCENTAJE DE EQUIPOS
Figura 14. Graficación del diagrama de Pareto para la criticidad de equipos en una planta
de tratamiento de gas.
4. REFERENCIAS
1. Oliver, M. A Guide to the Fact Based Problem Solving Process, Shell Global Solutions,
2000, The Hague OGF/3
2. Duran, José, Análisis de Causa Raiz, Wood House Partnership ltd., 2000, UK
3. Yonke, C., Araujo, F., Koehler K., Strawn T., Developing and Implementinga Failure-
Analysis Process to Optimize Well-Servicing Operations SPE Production & Facilities,
May 1997.
23
6. Dean L. Gano. From the Book: Apolo Root Cause Analysis – A New Way Thinking, Third
Edition, 2007.
7. Acharya, Sarbes; et al. Severe Accidents Risks: An Assessment for Five U.S. Nuclear
Power Plants. Washington D.C., U.S. Nuclear Regulatory Commission, NUREG-1150,
1990 (Desclasificado 2010-01-17)
9. Kepner, Ch. Tregoe B.B., “El nuevo directivo racional”, Mc Graw Hill
11. Hubbard, D. “How to Measure Anything: Finding the Value of Intangibles in Business”,
John Wiley & Sons, New York, 2007.
13. Karatsu, H., Ikeda T., Mastering the Tools of Quality Control”, PHP Institute, Inc, 1985,
Tokyo.
24