Está en la página 1de 62

ANÁLISIS CAUSA RAIZ DE

LA FALLA
Análisis causa raíz de la falla

1. Introducción ......................................................................................................... 2
2. Objetivos ............................................................................................................. 2
2.1. Objetivos generales.................................................................................. 2
2.2. Objetivos específicos ............................................................................... 2
3. Contenido ............................................................................................................ 3
3.1. Introducción al análisis causa raíz de la falla ....................................................... 3
3.1.1. Propósito del análisis causa raíz de la falla .............................................. 3
3.1.2. Uso efectivo del análisis ........................................................................... 3
3.1.3. Requerimientos de personal ..................................................................... 4
3.1.4. Cuándo usar el método ............................................................................ 4
3.2 Técnicas generales de análisis ............................................................................ 5
3.2.1. Análisis de efectos y modo de falla (FMEA) ............................................. 5
3.2.2. Análisis del árbol de fallas ........................................................................ 6
3.2.3. Análisis de la causa y efecto .................................................................... 8
3.2.4. Análisis de la secuencia de eventos ......................................................... 9
3.3. Metodología del análisis causa raíz de la falla ................................................... 13
3.3.1. Reporte de un incidente o problema ....................................................... 13
3.3.2. Clasificación de incidente ....................................................................... 16
3.3.3. Acopio de la data.................................................................................... 20
3.3.4. Observaciones y mediciones .................................................................. 37
3.4. Determinación de la causa de la raíz ................................................................. 41
3.4.1. Mala aplicación ...................................................................................... 43
3.4.2. Prácticas y procedimientos de operación pobres.................................... 44
3.4.3. Supervisión ............................................................................................ 47
3.4.4. Comunicaciones ..................................................................................... 49
3.4.5. Ingeniería humana ................................................................................. 50
3.4.6. Sistema de administración ..................................................................... 51
3.4.7. Control de calidad .................................................................................. 52
3.5. Evaluación de acciones de correctivas potenciales ........................................... 52
3.6. Reportes y recomendaciones ............................................................................ 53
3.7. Verificación de acciones correctivas .................................................................. 58
4. Mapa conceptual ............................................................................................... 59
5. Referencia bibliográfica ..................................................................................... 60
5. Glosario de términos.......................................................................................... 61

1
Análisis causa raíz de la falla

ANÁLISIS CAUSA RAÍZ DE LA FALLA

1. INTRODUCCIÓN

La ingeniería de confiabilidad y el mantenimiento predictivo tienen dos objetivos


principales: prevenir las fallas catastróficas en los sistemas críticos de una
planta de producción y evitar las desviaciones del rendimiento de su nivel
aceptable que resulten en prejuicios a las personas, impacto medioambiental,
pérdida de la capacidad o baja calidad de los productos. Desafortunadamente,
estos eventos ocurrirán sin importar cuan efectivo sea el programa de
confiabilidad. De allí que, un programa viable también debe incluir un proceso
de total entendimiento y corrección de las causas raíces de los eventos que
generan un impacto en el rendimiento de la planta.

Este capítulo introduce el concepto del Análisis Causa Raíz de la Falla para
evaluar su aplicación en la gestión del mantenimiento de una planta industrial.

2. OBJETIVOS

2.1. OBJETIVO GENERAL

Evaluar la metodología del Análisis Causa Raíz de la Falla (RCFA)


para implementarlo en la gestión del mantenimiento.

2.2. OBJETIVOS ESPECÍFICOS

• Identificar las ventajas de implementar el RCFA en una


empresa.
• Justificar la implementación del Análisis Causa Raíz para la
solución de fallas crónicas.

2
Análisis causa raíz de la falla

3. CONTENIDO

3.1. Introducción al análisis causa raíz dela falla

Por Análisis Causa-Raíz de la Falla (RCFA) se entiende cualquier método o técnica


analítica utilizada para identificar las causas básicas y las condiciones (factores)
que contribuyen a la ocurrencia de un evento indeseado (accidentes, incidentes,
problemas de "performance", etc.) o tendencias adversas, y las contramedidas
asociadas. Se evalúa el funcionamiento de sistemas y procesos y no meramente el
desempeño individual. Es una tarea interdisciplinaria que involucra, además de
profesionales entrenados en las herramientas analíticas, al personal más cercano al
proceso o sistema bajo estudio.

3.1.1. Propósito del análisis causa raíz de la falla

El propósito del RCFA es resolver los problemas que afectan el rendimiento


de la planta. No debe entenderse como un intento para culpar por los
incidentes. Esto debe ser claramente comprendido por el equipo de
investigadores y por quienes estén involucrados en el proceso.

Comprender que la investigación no es un intento para buscar culpables es


importante por dos razones:

• Primero, el equipo de investigaciones debe comprender que el real


beneficio de este método analítico es mejorar la planta.

• Segundo, los involucrados en el proceso generalmente adoptan una


actitud de auto-conservación y asumen que la investigación es un intento
para encontrar y castigar a la persona o personas responsables de los
incidentes. De allí que es importante para los investigadores aliviar ese
temor y reemplazarlo por un esfuerzo positivo de equipo requerido para
resolver problemas.

3.1.2. Uso efectivo del análisis

El uso efectivo del RCFA requiere disciplina y consistencia. Cada


investigación debe ser minuciosa y debe seguirse cada paso definido en
este manual.

Tal vez la parte más difícil del análisis es separar la realidad de la ficción. La
naturaleza humana dictamina que cada persona involucrada en un evento o
incidente que requiere un RCFA está condicionada por su experiencia. La
tendencia natural de los involucrados es filtrar la base de datos de entrada
en esta condición. Esto incluye al investigador. Sin embargo a menudo tales
ideas y percepciones preconcebidas destruyen la efectividad del RCFA.

Es importante para el investigador y el equipo de investigaciones hacer a un


lado sus percepciones, basar el análisis en puros hechos y no asumir nada.

3
Análisis causa raíz de la falla

Cualquier suposición que entre al proceso de análisis a través de entrevistas


u otro proceso de acopio de datos debe ser claramente respaldada.
Suposiciones que no pueden ser confirmadas o probadas deben ser
desechadas.

3.1.3. Requerimientos de personal

El personal requerido para evaluar apropiadamente un evento usando RCFA


puede ser completamente materialista. Por ello, este análisis debería estar
limitado a los casos que verdaderamente justifican el gasto. Muchos de los
costos de ejecutar una investigación y actuar según sus recomendaciones
están ocultos pero no obstante son reales. Aún un simple análisis requiere
asignar un investigador al proyecto hasta que sea resuelto. Adicionalmente,
el análisis requiere involucrar a todo el personal de la planta directa o
indirectamente relacionado con el incidente. El investigador debe conducir
numerosas entrevistas. En adición, muchos documentos deben ser
acopiados y revisados para extraer información relevante.

En investigaciones más complejas se requiere de un equipo de


investigadores. Así como el alcance y la complejidad se incrementan
también lo hace el costo.

Como resultado a un elevado requerimiento de personal, el uso general de


esta técnica debería evitarse. Y debería limitarse a aquellos incidentes o
eventos que tienen un considerable impacto negativo en el rendimiento de la
planta, seguridad de las personas, o acatamiento de las normas.

3.1.4. Cuando usar el método

El uso del RCFA debería ser cuidadosamente analizado antes de lanzarse a


una completa investigación a causa de los altos costos asociados con la
ejecución así como en el análisis profundo. El método considera una
investigación inicial para clasificar y definir el problema. Una vez que esto
terminó, debería considerarse un análisis completo solo si el evento puede
ser completamente clasificado y definido, y parece que puede encontrarse
una solución al costo – efectivo.

Generalmente el análisis no es efectuado en problemas que son clasificados


como aleatorios, o eventos no repetitivos. Los problemas que a menudo
justifican el uso del método incluyen equipamiento, maquinaria, o fallas de
sistemas; desviaciones del rendimiento operacional; cuestiones de
rendimiento económico; seguridad; y asuntos de acatamiento de normas.

4
Análisis causa raíz de la falla

3.2. Técnicas generales de análisis

Un buen número de técnicas generales es utilizado para resolver problemas. Hay


muchas metodologías que son utilizadas comúnmente y tienen coincidencias con
estas técnicas pero también existen diferencias. A continuación veremos un breve
repaso a los métodos más comunes utilizados para realizar un RCFA.

3.2.1. Análisis de efectos y modo de falla (fmea)

Un análisis de efecto y modo de falla (FMEA) es un diseño – procedimiento


de evaluación usado para identificar modos de falla potencial y determinar
su efecto sobre el rendimiento de un sistema. Este procedimiento
formalmente documenta prácticas estándares, genera un registro histórico, y
sirve como base para futuras mejoras.
El procedimiento RCFA es una secuencia lógica de pasos, comenzando con
el análisis de subsistemas de muy bajo nivel o componentes. La figura 1
ilustra un típico árbol lógico que resulta con un FMEA.

Disciplinas de Disciplinas de
confiabilidad confiabilidad
primariamente primariamente
cualitativas cuantitativas

Eliminar efectos
de falla

Identificar modos Predecir efectos


de falla de la falla
Compensaciones
Reducir efectos
y acciones
de falla
decisivas
Determinar
Aislar causas de
acciones
la falla
correctivas

Aceptar efectos
de falla

Otras técnicas/
disciplinas
gerenciales

Fig. 1: Diagrama de flujo de un FMEA

El análisis adopta un punto de vista de la falla e identifica grandes modos


potenciales de falla con sus mecanismos de falla. El efecto de cada modo de
falla luego es rastreado al siguiente nivel del sistema. A cada modo de falla y
su efecto resultante es asignado un rango crítico, basado en la probabilidad
de ocurrencia, su severidad y su delectability. Para reducir las fallas con

5
Análisis causa raíz de la falla

alto impacto en el rango crítico, se recomienda realizar cambios en el


diseño.

Por consiguiente este procedimiento provee un diseño más confiable.

Además del correcto uso del proceso FMEA resultan dos mejoras
principales:

a) Mejora de la confiabilidad anticipándose a los problemas e instituyendo


correcciones previas a producir productos y

b) Mejora de la validez del método analítico, que resulta de una estricta


documentación de cada paso en el proceso de toma de decisiones.

Dos limitaciones importantes restringen el uso del FMEA:

a) Los árboles lógicos usados para este tipo de análisis son basados en la
probabilidad de falla en los niveles del componente.

b) Su aplicación es muy cara.

Los árboles lógicos se fundamentan en la probabilidad de falla, esto es un


problema debido a que los datos disponibles sobre probabilidad de
componentes corresponden a condiciones estándar y las técnicas de
extrapolación no pueden ser usadas para modificar los datos en
aplicaciones particulares.

3.2.2. Análisis del árbol de fallas

El análisis del árbol de fallas es un método para analizar la confiabilidad y la


seguridad de un sistema. Esto provee una base objetiva para analizar el
diseño de sistemas, justificar cambios en los sistemas, realizar estudios
trade_off, analizar modos de fallas comunes y demostrar conformidad con
los requerimientos medio ambientales y de seguridad. Esto es diferente a un
FMEA que está restringido a identificar elementos y eventos de un sistema
que generan un evento indeseable en particular.

La figura 2 muestra las etapas involucradas al realizar un análisis del árbol


de fallas.

6
Análisis causa raíz de la falla

Definición de eventos cumbres

Establecemiento de bondades

Comprensión del sistema

Construcción del árbol


de fallas

Analizar el árbol

Toma de acciones correctivas

Fig. 2: Proceso típico del árbol de fallas

Muchas técnicas de confiabilidad son inductivas y su objetivo primario es


asegurar que los equipos lleven a cabo su función prevista. El análisis del
árbol de fallas es un detallado análisis deductivo que usualmente requiere
considerable información acerca del sistema. Esto asegura que todos los
aspectos críticos de un sistema sean identificados y controlados. Este
método representa gráficamente la lógica Booleana asociado con un
particular sistema de fallas, llamado el evento cumbre, y las fallas básicas o
causas, llamadas eventos primarios. Los eventos cumbres pueden ser
amplios, abarcando todos los sistemas de fallas o la falla de componentes
específicos. El análisis provee una visión interior del comportamiento del
sistema

Un modelo del árbol de fallas presenta lógica y gráficamente las diferentes


combinaciones de los posibles eventos que ocurran en un sistema que
generaran un evento cumbre. El término evento denota un cambio dinámico
de estado que ocurre en un elemento del sistema, el cual incluye equipo,
software, personas, y factores medioambientales.
Un evento falla es un estado anormal del sistema. Un evento normal se
espera que ocurra.

7
Análisis causa raíz de la falla

La estructura del árbol de fallas se muestra en la figura 3. El evento


indeseable aparece como el evento cumbre y está conectado a más eventos
de falla básicos por eventos declaratorios y compuertas lógicas.

Motor
sobrecalentado

OR
Falla primaria Excesiva corriente
del motor del motor

OR
Falla del relé
Excesiva corriente
térmico por
en el circuito
no abrirse
OR

Falla primaria del Falla primaria del Falla primaria del relé
cableado suministro de potencia (cerrado o
( muy delgado) (oscilante) sobredimensionado)

Fig. 3: Ejemplo de un árbol lógico del árbol de fallas

3.2.3. Análisis de la causa y el efecto

El análisis de Causa y Efecto es una técnica gráfica para analizar fallas.


Este también es conocido como el Diagrama de Espina de Pescado (o
fishbone), derivado de la forma del espinazo del pescado, utilizado para
graficar la relación entre varios factores que contribuyen a un evento
específico. Típicamente, el análisis de espina de pescado gráfica las cinco
mejores clasificaciones de causas potenciales (es decir: humana, máquina,
material, metodología y medio ambiente) pero puede incluir una
combinación de categorías. La figura 4 ilustra un simple análisis.

Es uno de los métodos de análisis de fallas que más gusta, esta técnica
hace uso de una evaluación lógica de acciones o cambios que generan un
evento específico, tal como la falla de una máquina. La única diferencia
entre esta y otros métodos es el uso de la espina de pescado para describir
las relaciones de causa y efecto entre acciones específicas, o cambios, y el
evento o resultado final.

8
Análisis causa raíz de la falla

Esta técnica tiene una seria limitación. El esquema de espina de pescado no


proporciona una secuencia clara de los eventos que derivan en una falla. En
cambio, muestra todas las posibles causas que pueden contribuir a que
suceda un determinado evento. Mientras es utilizado, no aísla los factores
específicos que causan un evento. Otras técnicas proveen los fundamentos
para aislar los cambios específicos, omisiones o acciones que causan la
falla, una soltura, un accidente u otro evento que está siendo investigado.

Humano Máquina
No hay entrenamiento
Mala aplicación

Error humano Edad


Mantenimiento pobre
No hay supervisión

No hay procedimientos EFECTO

Temperatura
muy baja Malos materiales
Supervisión pobre
Mala aplicación

Ninguna exigencia Muy accidentado


Error del vendedor

Métodos Medio Materiales


Ambiente

Fig. 4: Diagrama típico de espina de pescado mostrando sus cinco categorías de


causas

3.2.4. Análisis de la secuencia de eventos

Algunos programas informáticos (como Visio de Microsoft) pueden utilizarse


para generar los diagramas de secuencias de eventos. Como parte del
programa RCFA, se debe: seleccionar un apropiado software, desarrollar un
formato estándar (vea figura 5), y asegurar que se incluya en el diagrama
cada evento que es investigado.

Utilizando tal diagrama desde el inicio de la investigación ayudará al


investigador a organizar la información acopiada, a identificar la pérdida o el
conflicto de la mencionada información, mejora su entendimiento al mostrar
las relaciones entre eventos e incidentes y hace brillar las causas
potenciales de los incidentes.

9
Análisis causa raíz de la falla

EVENTOS:
Los eventos son mostrados como cajas
rectangulares, que están conectadas por flechas Evento Evento
que direccionan el flujo que provee una adecuada 08/97 13:52 08/97 13:56
secuencia de eventos.
Cada caja debería contener solo un evento, así
como la fecha y tiempo en que ocurrió.
Use palabras precisas, que exprese la realidad sin
CALIFICADORES:
Cada evento debe ser clarificado usando bloques Calificador
ovales de datos que provee la data pertinente para
calificar ese evento. Calificador

Cada bloque oval debería contener solo un


calificador que provea clarificación, una única Evento

restricción, u otra condición que pueda influenciar al 08/97 13:52


evento.
Cada calificador oval debe estar conectado a la caja
de eventos apropiada usando la flecha direccional
FUNCIONES DE FUERZA:
Funciones
Los factores que podrían haber contribuido con el de Fuerza
evento deberían ser mostrados en una caja de
datos hexagonal.
Cada hexágono debe contener una concisa función Evento

de fuerza definida. 08/97 13:52


Las funciones de fuerza deben estar conectadas a
un evento específico usando una flecha direccional
INCIDENTES: Evento
La caja de incidente contiene una breve declaración 08/97 13:52

de la razón de la investigación.
La caja de incidente debe estar insertada en el Incidente
punto apropiado en la secuencia de eventos y Evento

conectada a la caja de eventos usando flechas 08/97 13:52

direccionales.
SUPOSICIONES:
Factores de contribución o condiciones sin Supocisiones, preguntas sin
confirmar pueden estar incluidas en el diagrama de responder u otros datos que esten
relacionados con el evento.
flujo pero usando anotaciones. Este Evento

métoINCIDENTES: 08/97 13:52

La caja de incidente contiene una breve declaración


de la razón de la investigación.

Fig. 5: Símbolos usados en el diagrama de secuencia de eventos

10
Análisis causa raíz de la falla

El diagrama de secuencia de eventos debería ser un documento dinámico


generado inmediatamente después que el problema es reportado y
continuamente modificado hasta que el evento sea totalmente resuelto. La
fig. 6 es un ejemplo de tal programa.

Operador A de CA notifica Operador A de CA notifica


Operador A en Preparación Operador A en Preparación El manómetro de nivel
08/03/97 06:55 a.m. 08/03/97 06:55 a.m. tiene un historial con
problemas.
El control de nivel es
Operador A en el área de Operador A en el área de
cuestionable.
Preparación confirma inicio de Preparación confirma inicio de
la transferencia la transferencia

Operador A en
Operador A en Operador A en Continúa la
Inicio de la transferencia Preparación inspecciona
Preparación selecciona Preparación abre transferencia de
de escamas el indicador de nivel del
el silo # 3 válvula hacia el silo # 3 escamas
08/03/97 07:30 silo # 3
08/03/97 07:25 08/03/97 07:29 08/03/97 07:30 08:00
08/03/97 08:01

Silo # 3 se asumió vacío


Problemas en el
Fluidificador A
08/03/97
08:10

El equipo A inspecciona Instrumentista A inspecciona


Operador A de CA Operador A de CA Problemas en el Operador A de CA
el transportador el manómetro de nivel en el
resetea el interruptor restaura la transferencia fluidificador A detiene la transferencia
neumático silo # 3
08/03/97 08:20 08/03/97 08:21 08/03/97 08:23 08/03/97 08:30
08/03/97 10:00 08/03/97 12:00

La carga Sección A - 935 Lentes del transmisor


presenta alto completamente bloqueada cubiertas con escamas
amperaje con escamas

Inundación del silo # 3 Sección A - 935


con escamas completamente bloqueadas
con escamas

Silo # 3 completamente lleno


y con escamas compactadas

Fig. 6: Diagrama típico de secuencia de evento

El apropiado uso de esta herramienta gráfica mejorará grandemente la


efectividad del equipo que solución de problemas y la precisión de la
evaluación. Alcanzando el máximo beneficio de esta técnica, siendo
consistente y minucioso cuando se desarrolla el diagrama. La siguiente guía
debería considerarse cuando se genera un diagrama de secuencia de
eventos: Use un orden lógico, describa los eventos en términos activos más
que en pasivos, sea preciso, y defina o califique cada evento o función de
fuerza.

En el ejemplo de la figura 6, se ilustran los repetidos tropiezos del


fluidificador usado para transferir escamas desde el departamento de
Acetato Celulosa al área de preparación lo cual desató una investigación. El
diagrama muestra cada evento que describe el intento inicial y secundario
del fluidificador. El evento final, el silo de inspección, indicó que la causa raíz
del problema fue la falla del sistema de monitoreo de nivel. A consecuencia

11
Análisis causa raíz de la falla

de esta falla, el Operador A sobrellenó el silo. Cuando esto sucedió, las


escamas compactadas en el silo y almacenadas en el sistema de transporte
neumático, taponearon la sección de entrada de la tubería del transportador,
lo cual resultó en una extensa merma en la producción mientras se removía
el tapón.

Orden Lógico

Se debe mostrar los eventos en un orden lógico desde el comienzo hasta el


final de la secuencia. Inicialmente el diagrama de secuencia de eventos
debería incluir todos los eventos pertinentes, incluyendo esos que no
pueden ser confirmados. Conforme la investigación progresa, esto debe
refinarse y mostrar solo los eventos confirmados y relevantes para el
incidente.

Descripciones Activas

Las cajas de eventos en un diagrama de secuencia de eventos deberían


contener las etapas de acciones antes que descripciones pasivas del
problema. Por ejemplo, el evento debería leerse: “El Operador A presiona el
botón de encendido de la bomba” y no “Se encendió la bomba equivocada”.
Como regla general, solo un sujeto y un verbo se deben usar en cada caja
de eventos. En vez de decir: “El Operador A presionó el botón de parada de
la bomba y verificó la válvula alineada”, se pueden usar dos cajas de
eventos. La primera caja debería decir: “El Operador A presionó el botón de
parada” y la segunda debería decir: “El Operador A verificó la válvula
alineada”.

No utilice nombre de personas en el diagrama. En cambio utilice funciones


de trabajo o asigne un código de identificación para cada persona
involucrada en el evento o incidente. Por ejemplo, tres operadores deberían
designarse como Operador A, Operador B y Operador C.

Precisión

Describa precisa y concisamente cada evento, función de fuerza y


calificador. Si no es posible una descripción concisa y se deben realizar
suposiciones para clarificar, estas deben ser incluidas como anotaciones.
Esto es descrito en la figura 5 e ilustrado en la figura 6. Conforme progresen
las investigaciones, cada suposición y contribución no confirmadas del
evento deben ser confirmadas o descontadas. Como resultado se tendrá
que cada evento, función o calificador serán reducidos a más descripciones
concisas.

Definición de Eventos y Funciones de Fuerza

Los calificadores que proporcionan toda la experiencia confirmada o la data


de soporte necesaria para definir con precisión los eventos o funciones de
fuerza deberían incluirse en un diagrama de secuencia de eventos.

Por ejemplo, cada evento debería incluir calificadores de fecha y tiempo que
fijan la estructura de tiempos del evento.

12
Análisis causa raíz de la falla

Cuando los calificadores confirmados no están disponibles, se supone que


pueden ser usados para definir factores no confirmados o percibidos que
puedan haber contribuido a los eventos o la función. Sin embargo, el mayor
esfuerzo debe hacerse durante la investigación para eliminar las
suposiciones asociadas con la secuencia del diagrama de eventos y
reemplazarlos con factores conocidos.

3.3. Metodología del análisis de la causa raíz de la falla

El RCFA es una secuencia lógica de pasos que conducen al investigador a través


de un proceso de aislamiento de los factores alrededor de un evento o falla.

Una vez que el problema ha sido completamente definido, el análisis sistemático


determina el mejor curso de acción que resolverán los eventos y aseguraran que
estos no se repitan. Debido al costo asociado con el rendimiento de tal análisis,
debería tenerse cuidado antes que la investigación sea emprendida.

El primer paso en este proceso es obtener una clara definición del potencial del
problema o evento. El árbol lógico ilustrado en la figura 7 se debería seguir para la
fase inicial de la evaluación.

3.3.1. Reporte de un incidente o problema

El investigador raramente está presente cuando ocurre un incidente o


problema. De allí que el primer paso es la notificación inicial que un
incidente o problema ha tenido lugar. Típicamente, este reporte será verbal,
una breve nota escrita o anotación en el libro maestro de producción. En
muchos casos, la comunicación no contendrá una completa descripción del
problema. Más bien, será una breve descripción de los síntomas percibidos
observados por las personas que reportan el problema.

3.3.1.1. Síntomas y características

La manera más efectiva de definir un problema o evento es


determinar sus reales síntomas y establecer los límites que
caracterizan el evento.
En esta etapa de la investigación, las tareas pueden ser
acompañadas por entrevistas al personal que observó primero el
problema.

13
Análisis causa raíz de la falla

Notificación

Notificar al originador Clarificar el


del reporte problema

Llenar el reporte para ¿Se requiere un


Implementar acciones futuras referencias No análisis de la causa
correctivas raíz?

Yes
Yes

¿Se aprobaron las Recoger la data que


recomendaciones? clarifique el
problema o evento

Recomendaciones ¿Es este Siga las


sometidas a aprobación un equipo o sugerencias
No
sistema alternativas de
problemático? RCFA

Yes

Yes

Efectuar la
¿Es posible una revisión del
No solución al costo diseño
efectivo?
Archivar para
futuras
referencias
¿Se
puede
Desarrollar una lista de solucionar
Preparar un análisis del
acciones correctivas Yes el problema
costo beneficio
potenciales basándose en la
revisión del
diseño?

No
Yes
Evalúe la
aplicación
Continue la
secuencia RCFA

¿Pueden resolverse
¿Son los
los problemas
Dinámica de procesos parámetros actuales
No basándose en la No
de prueba consistentes con el
evaluación de la
diseño?
aplicación?

Yes

Fig. 7: Árbol lógico inicial del análisis de la causa raíz

14
Análisis causa raíz de la falla

3.3.1.2. Percepción de las causas de un problema

En este punto, cada persona entrevistada tendrá una opinión definida


acerca del incidente, y tendrá su descripción del evento y una lógica
total por lo acontecido. En muchos casos, estas percepciones son
totalmente equivocadas, pero no deben ser descartadas. Aun cuando
muchas opiniones expresadas por la gente involucrada con el evento
o que lo reportan pueden ser no válidas, no se deben descartar sin
investigar. Cada opinión debe ser registrada y usada como parte de
la investigación. En muchos casos, una o más de las opiniones
tendrán la llave de resolución del evento. Los siguientes son
ejemplos en donde la percepción inicial fue correcta.

• Un ejemplo de este fenómeno es el del problema reportado


en la cámara de bolsas del colector de polvo. El reporte inicial
declaró que aire cargado de polvo estuvo siendo emitido de la
cámara de bolsas de forma aleatoria pero repetida, básicamente. Las
personas que reportaron el problema estaban convencidas que la
causa fue sin duda la falla crónica de la válvula pilotada actuada por
un solenoide que controla el purgador de la cámara de bolsas. Sin
embargo, con una rápida revisión del diseño se determinó que la
válvula controlada por solenoide esta normalmente cerrada. Este tipo
de válvula solenoide no puede fallar en posición abierta, de allí que
no puede ser el origen del evento reportado.

Al conversar con el ingeniero de procesos se identificó el diafragma


utilizado para sellar el tubo de purga como una fuente potencial de
problemas. Esta observación junto a la de una inadecuada planta de
aire, cambio a ser la causa raíz del problema.

• Otro ejemplo que ilustra opiniones preconcebidas es la falla


catastrófica de una cadena transportadora Hefler. En este ejemplo,
todas las barras del lado izquierdo de la cadena fueron severamente
curvadas antes que el sistema pudiera ser paralizado. Aun cuando
ningún objeto extraño tal como un perno fue encontrado, se asumió
que esto fue la causa de la falla. De la evidencia, quedó claro que
alguna obstrucción causó el daño al transportador, pero la más
importante interrogante fue, ¿por qué sucedió esto?

Los transportadores Hefler son diseñados con un punto intencional


de falla que debería haber previsto daños mayores ocasionados por
este evento. El diseño del piñón de accionamiento principal incluye
un pin de cizallamiento (de sacrificio) que generalmente previene
este tipo de daños catastróficos. ¿Por qué falló el transportador? El
motivo ha sido la remoción de los pines de cizallamiento y su
reemplazo por pernos grado 5.

15
Análisis causa raíz de la falla

3.3.1.3. Formato de reporte de eventos

Uno de los factores que limita seriamente la efectividad del RCFA es


la ausencia de un formato formal de reporte de eventos. El uso de un
formato que describa completamente el potencial del problema o
evento, reduce grandemente el nivel de esfuerzo requerido para
completar un análisis. Un formato similar al mostrado en la figura 8
provee un nivel mínimo de datos necesarios para determinar el
esfuerzo requerido para solucionar problemas.

3.3.2. Clasificación del incidente

Una vez que el incidente ha sido reportado, el próximo paso es identificar y


clasificar el tipo de problema. Clasificaciones comunes de problemas son
equipos dañados o con fallas, rendimiento de la operación, rendimiento
económico, seguridad y conformidad con las normas.

Clasificar los eventos como un tipo particular de problema permite al analista


determinar el mejor método para resolver problemas. Cada clasificación
mayor requiere de una técnica RCFA ligeramente diferente, como se
muestra en la figura 9.

Note, sin embargo, que la clasificación inicial del evento o problema es


típicamente la parte más difícil de un RCFA. Además muchas plantas
carecen de una vía formal y un sistema de reportes que detecte con
precisión y defina las desviaciones respecto de las condiciones de operación
óptima.

3.3.2.1. Falla o equipo dañado

Una mejor clasificación de los problemas que a menudo justifican un


RCFA son los eventos asociados con la falla del equipo crítico de
producción, la maquinaria o los sistemas.

16
Análisis causa raíz de la falla

FORMATO DE REPORTE DEL INCIDENTE

Fecha:

Reportado por:

Descripción del incidente:

Localización específica y Equipo/ Sistema afectado:

¿Cuándo ocurrió el incidente? :

¿Quién estuvo involucrado? :

¿Cuál es la probable causa? :

¿Qué acción correctiva tomó? :

¿Hubo personas lesionadas? : Sí No

¿Fue reportada alguna emanación? : Sí No

Clasificación del incidente: Falla del equipo Desacato de normas

Accidente/ lesión Desviación del rendimiento

Firma

Fig. 8: Formato típico de reporte de incidente

EJERCICIO:

Llene el formato de reporte de incidente reportando un caso que Ud. tenga


conocimiento.

17
Análisis causa raíz de la falla

Típicamente, cualquier incidente que resulte en una falla


parcial o total de la máquina o sistema de procesos, justifica
un RCFA.

Este tipo de incidente puede tener un severo, impacto


negativo en el rendimiento de la planta. De allí, esto a
menudo justifica el esfuerzo necesario para evaluar
completamente el evento y determinar la causa raíz.

Los eventos que resultan en daños físicos al equipo de la


planta o los sistemas son los más fáciles de clasificar. Una
inspección visual del componente fallado del sistema o
máquina usualmente provee una clara evidencia de su modo
de falla. Mientras la inspección no resolverá la razón de la
falla, los síntomas o resultados visibles serán evidentes.

Los eventos que también afecten otros aspectos (por ejemplo;


seguridad, normatividad, o impacto financiero) deberían ser
investigados automáticamente para determinar el impacto
potencial o real del rendimiento de la planta, incluyendo la
confiabilidad del equipo.

¿Están la falla o el evento significativo


basados en la tasa de fallas y las
consecuencias de la falla?

Yes

¿Es causa de Aclarar problemas


No
eventos evidentes? adicionales

Yes

¿Afecta esto la
¿Afecta esto el capacidad de ¿Afecta esto la
¿Afecta esto la ¿Resultó esto en
equilibrio producción o la capacidad o los
seguridad? fallas del equipo?
medioambiental? calidad del costos?
producto?

Yes Yes Yes Yes Yes

Siga el árbol de Siga el árbol de Siga el árbol de Siga el árbol de Siga el árbol de
decisión de decisión sobre decisión de decisión sobre decisión de fallas
seguridad medioambiente operaciones economía de equipos

Fig. 9: Clasificación inicial de eventos

18
Análisis causa raíz de la falla

En la mayoría de los casos, la máquina fallada debe ser


reemplazada inmediatamente para minimizar su impacto en la
producción. Si este es el caso, puede ser beneficioso evaluar
el sistema circundante al incidente.

3.3.2.2. Rendimiento operacional

Las desviaciones del rendimiento operacional pueden ocurrir


sin la falla física del sistema o equipo crítico de producción.

Las desviaciones crónicas pueden justificar el uso del RCFA


como un medio para resolver problemas recurrentes.

Generalmente, problemas crónicos relativos a la calidad o


capacidad de los productos requieren un completo RCFA. Sin
embargo, se debe tener mucho cuidado para asegurar que
estos problemas son recurrentes y tienen un impacto
significativo en el rendimiento de la planta antes de utilizar
esta técnica de solución de problemas.

Calidad de la Producción

Las desviaciones que por primera vez atraviesan la calidad de


los productos son candidatos principales para un RCFA, el
cual puede ser usado para resolver muchos problemas
relativos a la calidad. Sin embargo, el análisis no debe ser
utilizado para todos los problemas de calidad. Las
desviaciones no recurrentes o aquellas que no tienen un
impacto significativo en la capacidad o los costos no son
aplicaciones efectivas del costo.

3.3.2.3. Rendimiento económico

Las desviaciones del rendimiento económico, tal como una


alta producción o elevados costos de mantenimiento, con
frecuencia justifican el uso del RCFA. El árbol de decisión y
las etapas específicas requeridas para resolver estos
problemas varían dependiendo del tipo de problema y su
causa o función de fuerza.

3.3.2.4. Seguridad

Cualquier evento que tenga potencial para causar perjuicios a


las personas debería investigarse inmediatamente. Mientras
los eventos en esta clasificación justifican un completo RCFA,
ellos deben resolverse tan pronto como sea posible.

Aislar la causa raíz de los eventos o accidentes que causan


lesiones generalmente es más difícil que para las fallas de los
equipos y requiere una técnica diferente de solución de
problemas. La primera razón para este incremento en la
dificultad es que la causa es a menudo subjetiva.

19
Análisis causa raíz de la falla

3.3.2.5. Acuerdo regulatorio

Cualquier evento de acuerdo regulatorio puede tener un


potencial impacto en la seguridad de los trabajadores, el
medio ambiente, así como en la continuidad de la operación
de la planta. De allí, que cualquier evento que resulta en una
violación de las concesiones medioambientales u otras guías
de acuerdos medioambientales (por ejemplo, Seguridad
Ocupacional y Administración de la Salud OSHA, Agencia de
Protección Medioambiental, y regulaciones estatales) debería
ser investigado y resuelto tan pronto como sea posible.

3.3.3. Acopio de la data

La etapa de acopio de la data debe clarificar el problema o evento reportado.


Esta fase de evaluación incluye entrevista con el personal apropiado, reunir
evidencia física, y conducir otras investigaciones, así como ejecutar una
secuencia de análisis de los eventos, lo cual es necesario para proveer un
claro entendimiento del problema. Note que esta sección enfoca
primeramente los incidentes de falla o los daños en los equipos.

3.3.3.1. Entrevistas

El proceso de entrevistas es el método primario utilizado para


establecer las condiciones extremas reales de un incidente y
es parte de la clave de una investigación. Es crucial para el
investigador ser un buen oyente con buenas habilidades de
entrevistador y diplomacia.

Para incidentes significativos, todo el personal clave debe ser


entrevistado y así conseguir un panorama completo del
evento. En adición a los directamente involucrados en el
evento o incidente, se deben entrevistar a aquellos individuos
que tengan conocimiento directo o indirecto de algo que
pueda clarificarlo. La siguiente es una lista parcial de
entrevistas:

• Todo el personal directamente involucrado en el incidente


(asegure la revisión de cualquier declaración escrita de un
testigo).

• Supervisores y gerentes involucrados en el incidente


(incluir al gerente de contratos).

• Personal que no está directamente involucrado en el


incidente pero que tiene un conocimiento o experiencia
similar.

• Expertos en aplicaciones técnicas, personal entrenado, y


vendedores de equipo, suministradores, o fabricantes.

20
Análisis causa raíz de la falla

Note que esto es extremadamente importante para el


investigador transmitir el mensaje del propósito de una
entrevista es “buscar hechos no buscar faltas”. El trabajo de
un investigador es simplemente determinar lo que realmente
está sucediendo y por qué está sucediendo. Es importante
para el entrevistador exponer al entrevistado claramente la
razón de la evaluación, durante el inicio de la entrevista. El
personal de planta debe entender y creer que la razón de la
evaluación es encontrar el problema. Si ellos creen que el
proceso intenta buscar culpables, se tendrán pocos
beneficios.

También es necesario verificar la información derivada del


proceso de entrevistas. Un medio de verificación es la
observación visual de las prácticas reales utilizadas por los
equipos de producción y mantenimiento asignados al área
que está siendo investigada.

Preguntas Efectuadas

Para escuchar más efectivamente el entrevistador debe


prepararse para la entrevista, y preparar las ayudas evitando
pérdidas de tiempo.

La preparación de las interrogantes o una lista de tópicos por


discutir ayuda a mantener la entrevista encaminada y
previene que el entrevistador olvide realizar preguntas de
temas claves.

La figura 10 es una hoja de flujo resumida del proceso de


entrevista.

Cada entrevista debería ser conducida para obtener


respuestas claras de las siguientes interrogantes:

• ¿Qué sucedió?
• ¿Dónde sucedió?
• ¿Cuándo sucedió?
• ¿Qué cambió?
• ¿Quién estuvo involucrado?
• ¿Por qué pasó?
• ¿Cuál es el impacto?
• ¿Pasará de nuevo?
• ¿Cómo puede prevenirse la repetición?

¿Qué sucedió?

Clarificar lo que realmente pasó es un requisito esencial de


RCFA. Como se discutió antes, la tendencia natural es dar las
percepciones en lugar de definir cuidadosamente el evento
real.

21
Análisis causa raíz de la falla

Es importante incluir con mucho detalle tanto los hechos y


Los datos disponibles.

Entreviste a todo el personal directa


e indirectamente involucrado en el
Defina claramente los eventos
evento.
Clarificar el evento específicos, fallas o incidentes.
Recoja la evidencia física que
confirmará el modo de falla.

Identifique la máquina, sistema o


Preserve toda la evidencia física y ¿Qué sucedió? área específica donde ocurrió el
complete los documentos de la evento. ¿También ocurrió esto en
escena de los eventos. Figuras, unidades similares o es específico
dibujos y videos son herramientas de esta localización?.
útiles.
¿Dónde sucedió esto?
Defina claramente la estructura
de tiempos y la secuencia de los
La habilidad para fijar una referencia eventos
absoluta del momento de ocurrencia
de los eventos mejorará ¿Cuándo sucedió?
grandemente el análisis. Enliste todos los cambios en el
producto, las prácticas, los
procedimientos, el entorno, etc.
Que puedan contribuir con el
¿Qué cambió? evento.
Coleccione todos los datos que
definan el medio ambiente antes,
durante y después del evento. La
data debería incluir todas las Difina a todo el personal directa o
operaciones, mantenimientos, y ¿Quién estuvo involucrado? indirectamente involucrado en el
variables medioambientales. evento. Incluída la gerencia y la
supervisión del área afectada.

¿Cuál es el impacto?
Cuantifique en términos de
lesiones, confiabilidad o finanzas,
el impacto del evento.
¿Sucederá otra vez?

Determine la probabilidad de
recurrencia del evento o eventos
¿Puede prevenirse la similares.
recurrencia?
Determine como evitar la
recurrencia del evento o eventos
similares.

Fig. 10. El proceso de entrevista.

22
Análisis causa raíz de la falla

¿Dónde Sucedió?

Una descripción clara de la localización exacta de los eventos


ayudará a aislar y resolver los problemas. Además de la
localización, se debe determinar si el evento también ocurrió
en un lugar o sistema similar. Si se eliminan las aplicaciones o
máquinas similares, el evento puede a veces aislar una (o una
serie) función(o funciones) de fuerza totalmente única(s) de
localizar.

Por ejemplo, si la bomba A falló y las bombeas B, C, y D del


mismo sistema no lo hicieron, esto indica que la causa de la
falla está probable y únicamente en la Bomba A. Si las
bombas B, C, y D exhiben síntomas similares, entonces, es
muy probable que la causa sea sistémica y común a todas las
bombas.

¿Cuándo Sucedió?

Aislar el momento específico en que un evento ocurrió mejora


grandemente la posibilidad del investigador de determinar su
fuente. Cuando se conoce la estructura real de tiempo de un
evento, es muy más fácil de cuantificar los procesos, las
operaciones, y otras variables que pueden guarden relación
con el evento.

Sin embargo, en algunos casos (por ejemplo, desviaciones de


producto-calidad), es difícil de precisar el inicio y la duración
del evento. Muchos de las acciones destinadas a monitorear y
rastrear los registros no proporcionan el nivel de detalle
exigido para determinar el tiempo de este tipo de incidentes.

En estos casos, el investigador debe evaluar la historia de


operación del área del proceso afectado para determinar si es
posible encontrar un patrón que fije apropiadamente la
estructura de tiempos del evento. Este tipo de investigación,
en la mayoría de los casos, aislará el cronometrado de los
eventos como sigue:

• La producción de un producto específico.


• El programa de trabajo de un equipo de operación
específico.
• Los cambios en el medio ambiente.

¿Qué Cambió?

Las fallas de los equipos y las grandes desviaciones respecto


de los niveles de rendimiento aceptables no necesariamente
suceden. En cada caso, las variables específicas, simples o
en combinación, causaron que el evento ocurra. Por
consiguiente, es esencial que todos los cambios que
ocurrieron en conjunción al evento sean definidos.

23
Análisis causa raíz de la falla

No importa cuál evento fue (es decir, falla de equipo, derrame


al medio ambiente, un accidente, etc.), la evaluación debe
cuantificar todas las variables asociadas con el evento. Estos
datos deben incluir parámetros de la operación; las variables
de la producción, como la viscosidad, la densidad, la razón de
flujo, y así sucesivamente; y el medio ambiente. Si es posible,
los datos también deben incluir información del mantenimiento
predictivo asociado con el evento.

¿Quién Estuvo Involucrado?

La investigación debe identificar a todo el personal


involucrado, directamente o indirectamente, en el evento. Las
fallas y los eventos a menudo son el resultado del error
humano o de habilidades inadecuadas. Sin embargo,
recuerde que el propósito de la investigación es resolver el
problema, no buscar culpables.

Todos los comentarios o declaraciones derivadas de esta


parte de la investigación debe ser impersonal y totalmente
objetiva. A todas las referencias sobre el personal
directamente involucrado en el incidente se les debe asignar
un código u otro identificador, como por ejemplo Operador A o
Técnico de mantenimiento B.

Esta técnica le ayudará a reducir el miedo al castigo de todos


aquéllos directamente involucrados en el incidente. Además,
reduce el prejuicio u opinión preconcebida sobre los
individuos dentro de la organización.

¿Por qué Sucedió?

Si las preguntas precedentes fueron debidamente


contestadas, entonces puede ser posible resolver el incidente
sin una investigación adicional. Sin embargo, asegúrese que
el real problema se ha identificado. Es demasiado fácil mal
interpretar los síntomas o percepciones sin un completo
análisis.

A estas alturas, genere una lista de lo que puede haber


contribuido al problema reportado. La lista debe incluir todos
los factores, reales y supuestos.

Esta etapa es crítica en el proceso. En muchos casos, varios


factores, muchos de ellos triviales, se combinan para causar
un serio problema.

Todas las suposiciones incluidas en esta lista de posibles


causas deben ser claramente anotadas, como deben serlo
todas las causas comprobadas. Un análisis de la sucesión de
eventos proporciona un medio para separar los hechos de la
ficción durante el proceso del análisis.

24
Análisis causa raíz de la falla

¿Cuál es el Impacto?

La evaluación debe cuantificar el impacto del evento antes de


embarcarse en un completo proceso RCFA. Dicho de otra
forma, no todos los eventos, incluso los que son repetitivos,
justifican un análisis completo. Esta parte del proceso de
investigación debe ser tan verdadera como sea posible.
Aunque a estas alturas no todos los detalles están
disponibles, se intenta evaluar el impacto real o potencial del
evento.

¿Pasará De nuevo?

Si las entrevistas preliminares determinan que el evento es no


recurrente, el proceso puede discontinuarse en este punto.
Sin embargo, antes de tomar esta decisión debe efectuarse
una revisión minuciosa de los archivos históricos asociados
con la máquina o el sistema involucrado en el incidente.
Asegúrese que el evento es no recurrente antes de
discontinuar la evaluación.

Todos los eventos reportados deberían ser registrados y los


respectivos archivos guardados para futuras referencias. Para
los incidentes calificados como no recurrentes debe
establecerse un archivo que retenga todos los datos e
informaciones desarrollados en las etapas precedentes. De
ocurrir nuevamente el evento o uno similar, estos archivos
son una herramienta inestimable de investigación.

Debe conducirse una completa investigación en todos los


eventos que tienen una historia de repetición periódica, o una
probabilidad alta de repetición, y un impacto significativo en
los términos de lesión, confiabilidad, o economía. En
particular, deben investigarse todos los incidentes que tienen
un alto potencial en cuanto a lesión del personal o violación
de las normas.

¿Cómo puede Prevenirse la Repetición?

Aunque ésta es la próxima interrogante lógica por hacer,


generalmente no puede contestarse hasta que se haya
completado enteramente el RCFA. Note, sin embargo, que si
este análisis determina que no es económicamente factible
corregir el problema, el personal de la planta tiene
simplemente que aprender a minimizar su impacto.

25
Análisis causa raíz de la falla

3.3.3.2. Los tipos de entrevistas

Una de las preguntas por contestar al prepararse para una


entrevista es: ¿Qué tipo de entrevista se necesita para esta
investigación? Las entrevistas pueden agruparse en tres tipos
básicos: Uno-a-uno, dos-en-uno, y reunión de grupo.

Uno-a-uno:

La entrevista es muy simple por dirigir, y es dónde el


investigador entrevista a cada persona en lo necesario para
clarificar el evento. Este tipo de entrevista debe sostenerse en
un lugar privado sin ninguna distracción. En los casos dónde
se requiere una reconstrucción detallada de los hechos, la
entrevista puede sostenerse en el lugar de trabajo.

Dos-en-uno:

Cuando se están investigando incidentes polémicos o


complejos, puede ser aconsejable tener dos entrevistadores
presentes al reunirse con uno de los individuos. Con dos
investigadores; uno puede hacer las preguntas mientras el
otro registra la información. Los entrevistadores deben
coordinar su interrogatorio y deben evitar agobiar o intimidar
al entrevistado.

Al final de la entrevista, los entrevistadores deben comparar


sus impresiones de la entrevista y deben alcanzar un acuerdo
general de sus puntos de vista. La ventaja de la entrevista
dos-en-uno es que debe eliminarse las percepciones
personales de un solo entrevistador del proceso de la
investigación.

La Reunión de Grupo:

Una entrevista de grupo es ventajosa en algunos casos. Este


tipo de reunión, o ejercicio grupal de resolución de problemas,
es útil para obtener un intercambio de ideas de varias
disciplinas (es decir, mantenimiento, producción, ingeniería,
etc.). Tal intercambio puede ayudar en la resolución de un
evento o problema.

Esta técnica también puede usarse cuando el investigador ha


completado su evaluación y quiere revisar los resultados con
aquéllos involucrados en el incidente. El investigador podría
considerar las entrevistas como un punto clave que da
testimonio y que permite verificar la sucesión de eventos y las
conclusiones antes de presentarlos en la reunión de grupo.

El investigador debe actuar como el facilitador en este


proceso resolución de problemas y debe usar la secuencia del
diagrama de eventos como la herramienta de trabajo para la
reunión.

26
Análisis causa raíz de la falla

No pueden realizarse las entrevistas de grupo en un ambiente


hostil. Si el problema o el evento son polémicos o políticos,
este tipo de proceso de entrevistas no es beneficioso.
Generalmente las agendas personales de los participantes
evitan resultados positivos.

3.3.3.3. Colección de evidencia física

La primera prioridad cuando se investiga un evento que


involucra la falla o el daño de un equipo es conservar la
evidencia física. La figura 11 es un diagrama de flujo que
ilustra los pasos involucrados en la investigación del equipo
que falló. Este esfuerzo debe incluir todas las tareas y
actividades requeridas para evaluar completamente los
modos de fallas y determinar las limitaciones específicas que
condicionaron la ocurrencia de la falla.

Si fuera posible, se debe aislar del servicio la máquina y su


sistema instalado hasta que pueda dirigirse una completa
investigación. Al levantarla del servicio, la máquina y todos
sus componentes deben guardarse en un área segura hasta
que puedan inspeccionarse totalmente y se formulen pruebas
apropiadas.

Si esta sugerencia no se puede realizar, entonces se debe


documentar por completo el escenario de la falla antes que la
máquina sea removida de su actual ubicación. Deben
documentarse fotografías, bocetos, e instrumentación y
control para asegurar que todos los datos sean conservados
para el equipo que investiga. Los reportes automáticos, así
como aquéllos generados por el sistema de control
computarizado, deben obtenerse y conservarse.

Los acápites exigidos para coleccionar información y la


evidencia física para la investigación pueden ser bastante
extensos.

La siguiente es una lista parcial de la información que debe


recogerse:
• Procedimientos de mantenimiento (SMP) y estándares de
operación (SOP) normalmente acordados para la máquina o
el área donde ocurrió el evento.
• Políticas de la compañía que orientan las actividades
realizadas durante el evento.
• Datos de operación y los procesos (por ejemplo, cartas de
despiece, salida de la computadora, y datos – información del
registrador).
• Registros apropiados de mantenimiento de la maquinaria o
área involucrada en el evento.
• Copias del libro maestro, paquetes de trabajo, órdenes de
trabajo, permisos de trabajo, y archivos de mantenimiento; los

27
Análisis causa raíz de la falla

resultados de pruebas al equipo, los informes de control de


calidad; resultados de análisis de lubricación y aceites; temas
de vibración; y otros archivos.
• Diagramas, esquemas, dibujos, manuales del vendedor, y
especificaciones técnicas, incluyendo información
correspondiente al diseño del sistema o área involucrada en
el incidente.
• Registros de entrenamientos, copias de los cursos de
entrenamiento, y otra información que muestre los niveles de
desarrollo del personal incluido en el evento.
• Fotografías, vídeos, o diagramas de la escena del
incidente.
• Componentes malogrados (por ejemplo, las
empaquetaduras rotas, soldadura quemada, fusibles
soplados, los rodamientos fallados).
• Condiciones medioambientales cuando el evento ocurrió.
Estos datos deben estar tan completos y exactos como sea
posible.
• Copias de los informes de anteriores incidentes en eventos
similares e historia o información de la tendencia del área
involucrada en el actual incidente.

3.3.3.4. Secuencia de análisis de los eventos

Realizar un análisis de la secuencia de eventos y trazar


gráficamente las acciones que conllevan y siguen a un
evento, accidente, o falla ayudará a visualizar lo que pasó. Es
importante usar tal esquema de acciones desde el comienzo
de la investigación. Esto no sólo ayudará con la organización
de la información sino también a identificar los datos faltantes
o contradictorios, a mostrar las relaciones entre los eventos, y
a resaltar las causas potenciales del incidente.

28
Análisis causa raíz de la falla

EQUIPO O
COMPONENTE QUE
FALLADO

Notificación de la falla

Definir acciones
Preservar la correctivas
Aclarar el evento evidencia física potenciales

Recolectar la Evaluar los Preparar análisis


documentación de componentes costo beneficio
apoyo fallados

Entrevistar a todo el Dinámicas de


personal involucrado pruebas del sistema ¿Hay una Archivar
solución documentos
No
efectiva al para uso
Diagrama de costo? futuro
desarrollo de la
secuencia de eventos ¿Es evidente Verificar la causa por
Yes
la causa raíz? testeo Yes

Preparar reportes y
recomendaciones
No

¿Confirmó la Someter
Revisión del diseño No
recomendaciones
causa raíz?
para aprobación

Evaluar la instalación

Evaluar las prácticas Archivar


¿Fue aprobado lo documentos
de operación No
recomendado? para uso
futuro
Evaluar las prácticas
de mantenimiento
Yes

Desarrollo potencial
de la causa raíz Implementar
acciones correctivas
Verificar la causa por
testeo
Pruebas para verificar
la corrección

Demande asistencia
¿Confirmó la
del grupo de ingeniería No Yes
causa raíz?
en confiabilidad

Fig. 11: Diagrama de flujo de la investigación de la falla del equipo

3.3.3.5. La revisión del diseño

Es esencial entender claramente los parámetros de diseño y


las especificaciones de los sistemas asociadas con un evento
o falla del equipo. A menos que el investigador comprenda
con precisión lo que la máquina o sistema de producción fue
diseñado para hacer y sus limitaciones inherentes, es
imposible aislar la causa raíz del problema o evento. La
información obtenida al revisar el diseño proporciona una

29
Análisis causa raíz de la falla

línea base o referencia que se necesita para investigar y


resolver los problemas de la planta.

El objetivo de la revisión del diseño es establecer las


características de operación específicas de la máquina o
sistema de la producción involucrados en el incidente. La
evaluación debe definir claramente la función o funciones
específicas para las que cada máquina y sistema fueron
diseñados. Además, la revisión debe establecer el límite o
rango de operación aceptable que la máquina o sistema
puede tolerar sin una desviación considerable del rendimiento
de diseño.

La lógica usada para una revisión comprensiva es similar a la


del análisis de efectos y modos de fallas y al análisis del árbol
de fallas con los que se piensa identificar las variables de
contribución. A diferencia de otras técnicas diferentes que
usan complejas tablas de probabilidad y desglosan cada
máquina al nivel de componentes, el RCFA toma un
acercamiento más práctico. La técnica está basada en los
datos prontamente disponibles, y aplicaciones específicas
para determinar las variables que pueden causar o contribuir
a un incidente.

Mientras que el nivel de detalle requerido para una revisión


del diseño varíe dependiendo del tipo de evento, esta etapa
no se puede omitir de ninguna investigación. En algunos
casos, el proceso puede limitarse a una revisión superficial
del manual de ventas de operación y mantenimiento (O&M) y
a características del rendimiento. En otros casos, una
evaluación completa incluirá todo lo obtenido, datos operación
y diseño que puedan conseguirse.

3.3.3.6. Datos mínimos de diseño

En muchos casos, la información requerida puede obtenerse


de cuatro fuentes: de las placas de los equipos, de las
especificaciones durante la obtención, especificaciones del
vendedor, y de los manuales de O&M proporcionados por los
vendedores.

Si el investigador tiene una comprensión razonable de la


dinámica de la máquina, puede lograrse una revisión
minuciosa del diseño para sistemas de producción
relativamente simples (por ejemplo, sistema de bombeo) con
los datos proporcionados por solo estos cuatro documentos.

Debe prestarse especial atención a la guía de solución de


problemas del vendedor. Estas sugerencias proporcionarán el
entendimiento de las causas más comunes de
comportamiento anormal y modos de fallas.

30
Análisis causa raíz de la falla

3.3.3.7. Datos de placa del equipo

La mayoría de la maquinaria, los equipos, y los sistemas


usados en las plantas de procesos tienen una placa de datos
permanentemente pegada que define sus parámetros
nominales de operación. Por ejemplo, la placa de datos de
una bomba centrífuga incluye su razón de flujo, presión total
de descarga, gravedad específica, diámetro del impulsor, y
otros datos que definen su diseño. Estos datos pueden usarse
para determinar si el equipo es apropiado para la aplicación y
si está operando dentro su rango de diseño.

3.3.3.8. Especificaciones de obtención

Normalmente las especificaciones de obtención del equipo


son preparadas para todo equipo importante como parte del
proceso adquisitivo. Estos documentos definen las
características específicas y los rangos de operación
solicitados por el equipo de ingeniería de la planta.

Las especificaciones proporcionan información útil para


evaluar el equipo o sistema durante la investigación.

Cuando las especificaciones de obtención no están


disponibles, los registros de compra deberían describir el
equipo y proporcionar las características del sistema. Aunque
si bien la data puede estar limitada a un tipo o modelo
específico de máquina, en general es útil esta información.

3.3.3.9. Especificaciones de venta

En la mayoría de equipos que forman parte de un proyecto


importante, se debe disponer de un juego detallado de
especificaciones de venta. Generalmente, estas
características técnicas se incluyen en la propuesta del
vendedor y son entregadas como parte de lo necesario para
el proyecto. Normalmente, estos registros están en un archivo
en dos departamentos diferentes: compras e ingeniería.

Como parte de la revisión del diseño, las especificaciones de


obtención y de venta se deben comparar cuidadosamente.
Muchos de los problemas crónicos que plagan las plantas son
el resultado directo de desviaciones de las especificaciones
de venta respecto de las de obtención. Mediante una
comparación cuidadosa de estos dos documentos se pueden
descubrir las causas raíces de problemas crónicos.

3.3.3.10. Manuales de operación y mantenimiento

Los manuales de O&M son unas de las mejores fuentes de


información. En la mayoría de los casos, estos documentos
proporcionan recomendaciones específicas sobre el
apropiado funcionamiento y mantenimiento de la máquina,

31
Análisis causa raíz de la falla

equipo, o sistema. Además, muchos de estos manuales


proporcionan guías para la solución de problemas específicos
que puedan ocurrir. Una revisión completa de estos
documentos es esencial antes de empezar el RCFA. La
información proporcionada en estos manuales es esencial
para solucionar eficazmente los problemas de la planta.

3.3.3.11. Revisión del diseño

El objetivo de la revisión del diseño es determinar las


limitaciones del diseño, el entorno de operación aceptable, los
modos probables de falla, y los índices específicos que
cuantifican la condición de operación real de la máquina,
equipo, o sistema del proceso que se investiga. Como
mínimo, la evaluación debe determinar la función de diseño y
específicamente para que se diseñó la máquina o sistema. La
revisión debe definir claramente las funciones específicas del
sistema y sus componentes.

Para definir completamente las funciones de la maquinaria, el


equipo, o sistema, se debería incluir una descripción de las
especificaciones de entrada y salida del producto, del trabajo
que llevará a cabo y del entorno operacional aceptable. Por
ejemplo, una bomba centrífuga puede diseñarse para
entregar 1 000 galones por minuto de agua que tiene una
temperatura de 100°F y una presión en la descarga d e 100
libras por pulgada al cuadrado.

Especificaciones del producto de entrada.

Las funciones de la máquina y del sistema dependen del


producto entrante a ser manejado. Por consiguiente, la
revisión del diseño debe establecer las limitaciones del
producto entrante usado en el proceso de diseño. En muchos
de los casos, estos límites incluyen rango de temperatura,
densidad o gravedad específica, volumen, presión y otros
parámetros medibles. Estos límites determinan la cantidad de
trabajo que la máquina o el sistema debe proveer.

En algunos casos, las condiciones de límite son absolutas. En


otros, hay un rango aceptable para cada una de las variables.
La revisión debe definir claramente los límites aceptables
utilizados en el diseño del sistema.

Especificaciones del Producto de salida.

Asumiendo que las condiciones de límite del producto


entrante son reales, la investigación debe determinar qué
rendimiento el sistema fue diseñado a entregar. Como con el
producto entrante, el rendimiento de la máquina o sistema
puede estar limitado por parámetros específicos,
mensurables. El flujo, la presión, la densidad, y la temperatura
son sin embargo las mediciones comunes del producto de

32
Análisis causa raíz de la falla

salida. Sin embargo, dependiendo del proceso, puede haber


muchos otros.

Trabajo a ser Realizado.

Esta parte de la revisión del diseño debe determinar el trabajo


mensurable a ser realizado por la máquina o sistema. La
eficiencia, la potencia utilizada, la pérdida de producto, y otros
parámetros similares son utilizados para definir esta parte de
la revisión. Los parámetros reales variarán, dependiendo de la
máquina o sistema. En la mayoría de los casos, las
especificaciones originales del diseño proveerán los
parámetros apropiados del sistema bajo investigación.

Condiciones de Operación Aceptable.

La parte final de la revisión del diseño es definir las


características de operación aceptable de la máquina o
sistema. Cada máquina o sistema se diseña para operar
dentro de un rango específico, o condiciones de operación.
Estas condiciones incluyen la variación máxima del producto
entrante, velocidades de encendido acelerado y parada
brusca, medio ambiente y una variedad de otros parámetros.

3.3.3.12. Revisión de la aplicación y el mantenimiento

El próximo paso en el RCFA es revisar la aplicación y


asegurar que la máquina o sistema está usándose en la
aplicación apropiada. Los datos recogidos durante la revisión
del diseño deberían usarse para verificar la aplicación. El
registro de mantenimiento también debería ser revisado.

En plantas donde múltiples productos son producidos por la


máquina o sistema del proceso que se investiga, es esencial
que el rango de aplicación total se evalúe. La evaluación debe
incluir todas las variaciones de las características de
operación sobre el rango total de productos que se producen.
La razón de que esto sea tan importante es que muchos de
los problemas que serán investigados se relacionan
directamente a uno o más procesos que son únicos de ese
producto. A menos que el rango total de operación sea
evaluado, hay un potencial de que la causa raíz del problema
permanezca oculta.

Los factores a evaluar en una revisión de la aplicación y del


mantenimiento incluyen la instalación, las condiciones de
operación, las prácticas y los procedimientos que operación
(es decir, procedimientos estándares contra las prácticas
reales), historiales, así como procedimientos y prácticas de
mantenimiento.

33
Análisis causa raíz de la falla

La Instalación.

Cada máquina y sistema tiene criterios específicos de


instalación que deben ser seguidos antes de alcanzar y
sostener niveles aceptables de confiabilidad. Estos criterios
varían con el tipo de máquina o sistema y deberían ser
verificados como parte del RCFA.

Usando la información desarrollada como parte de la revisión


del diseño, el investigador u otros individuos calificados deben
evaluar la instalación real de la máquina o sistema que se
investigan. Como mínimo, una inspección visual minuciosa de
la máquina y su sistema deberían conducir a la determinación
de sí la instalación impropia está contribuyendo al problema.
Los requisitos de la instalación variarán, dependiendo del tipo
de máquina o sistema.

Deben prepararse fotografías, bocetos, o dibujos de la


instalación real como parte de la evaluación. Ellos deben
apuntar cualquier desviación de las prácticas de instalación
aceptables o recomendadas definidas en los documentos de
referencia y las buenas prácticas de ingeniería. Estos datos
pueden usarse después en el RCFA cuando se consideran
las acciones correctivas potenciales.

Condiciones de Operación.

Evaluar la condición real de operación del sistema de


producción asociado con el evento investigado es muy difícil.
La mejor técnica es determinar todas las variables y límites
usados en una producción normal. Por ejemplo, defina el
rango completo de velocidades en que opera, la razón de
flujo, las variaciones del producto de entrada, y lo que al
parecer este asociado con el sistema. En aplicaciones con
velocidad variable, determine las oscilaciones mínimas y
máximas usadas por los operadores.

Prácticas y Procedimientos de operación.

Esta parte la revisión de la aplicación/mantenimiento consiste


en evaluar los procedimientos de operación estándares así
como también las prácticas de operación reales. La mayoría
de las áreas de producción mantienen algunos datos
históricos que describen su rendimiento y sus prácticas. Estos
registros pueden consistir en el libro maestro, informes, o
datos en la computadora. Estos datos deben revisarse para
determinar las prácticas reales de producción que son
utilizadas para operar la máquina o el sistema que se
investiga.

Los sistemas que usan un sistema de control y monitoreo por


ordenador tendrán la mejor base de datos para esta parte de
evaluación. Muchos de estos sistemas automáticamente

34
Análisis causa raíz de la falla

almacenan y, en algunos casos, imprimen reportes a cierta


frecuencia que definen la evolución del proceso real para
cada tipo de producto producidos por el sistema. Esta fuente
inestimable de información debe evaluarse cuidadosamente.

Procedimientos Estándares de Operación (


Standard Operating Procedures: SOP )

Evalúe los procedimientos estándares de operación del área o


sistema afectados para determinar si ellos son consistentes y
adecuados para la aplicación. Dos fuentes de referencia, el
reporte de revisión del diseño y los manuales de O&M del
vendedor, son necesarias para completar esta tarea.

Además, evalúe los SOPs para determinar si ellos son


utilizables por operadores. Revise la organización, el
contenido y la sintaxis para determinar si el procedimiento es
correcto y entendible.

Procedimientos de Puesta a punto.

Debe prestarse una especial atención a los procedimientos de


puesta a punto para cada producto producido por una
máquina o sistema del proceso.

La puesta a punto impropia o incoherente de un sistema es


causa principal de una baja calidad del producto, de
restricciones en la capacidad, y de equipo no confiable. Los
procedimientos deben proporcionar un claro, y fácil
entendimiento de las instrucciones que aseguran una exacto,
y repetible puesta a punto para cada tipo de producto. Si no
es así, las desviaciones deben anotarse para una evaluación
adicional.

Procedimientos Transitorios.

Los procedimientos transitorios, como el encendido, el cambio


de velocidad, y la paralización total, también deben evaluarse
cuidadosamente. Éstos son, los predominantemente
transitorios, los que causan las desviaciones en la calidad y
capacidad y tienen un impacto directo en la confiabilidad de
equipo. Los procedimientos deben evaluarse para asegurar
que ellos no violen las condiciones de operación o las
recomendaciones del vendedor. Deben definirse todas las
desviaciones con claridad para una evaluación adicional.

Prácticas de Operación.

Esta parte de la evaluación debe determinar si los SOPs


fueron entendidos y seguidos antes y durante el incidente o
evento. La tendencia normal de los operadores es evadir los
procedimientos, lo cual es una razón para muchos problemas.

35
Análisis causa raíz de la falla

Además, los procedimientos inciertos llevan a mal


entendimiento y un empleo perjudicial.

Por consiguiente, la investigación debe evaluar


completamente las prácticas reales que el equipo de
producción utiliza para operar la máquina o el sistema. La
mejor manera para determinar la conformidad con los SOPs
es tener la lista de pasos del operador utilizada para accionar
la máquina investigada. Esta tarea debe realizarse sin
referirse al manual del SOP. El investigador debe conducir las
prácticas del operador (es) a través del proceso y utilizar sus
datos de entrada para desarrollar un diagrama de secuencias.

Después que el diagrama esté completo, compárelo con el


SOP. Si las prácticas reales del operador no son las mismas
que las descritas en el SOP, los procedimientos pueden
necesitar ser actualizados o los operadores pueden necesitar
ser re adiestrados.

Historial de Mantenimiento.

Una revisión minuciosa del historial de mantenimiento


asociado con la máquina o el sistema es esencial en el
proceso del RCFA. Una pregunta que debería ser contestada
es: "¿Sucederá esto otra vez?". Una revisión del historial de
mantenimiento puede ayudar a responder esta pregunta. El
nivel de exactitud de la data de mantenimiento disponible
variará grandemente de una planta a otra. Esto puede
dificultar la evaluación, pero es necesario como sea posible
desarrollar un claro panorama de la historia de mantenimiento
del sistema.

Una historia completa del mantenimiento real y programado,


incluyendo inspecciones y lubricación, debe desarrollarse
para la máquina, sistema o área afectados. Los detalles
primarios que se necesitan incluyen la frecuencia y los tipos
de reparación, frecuencia y tipos de mantenimiento
preventivo, historia de fallas, y cualquier otro hecho que
ayude en la investigación.

Las Prácticas y Procedimientos de mantenimiento.

Debe conducirse una evaluación completa de los


procedimientos estándares de mantenimiento y de sus
prácticas reales. Los procedimientos deben compararse con
el mantenimiento necesario definido por la revisión del diseño
y por los manuales de O&M del vendedor. Las prácticas de
mantenimiento reales pueden ser determinadas de la misma
forma como se describió anteriormente o por observación
visual de reparaciones similares. Esta tarea debe determinar
si los SMPs son seguidos de forma consistente por todo el
personal de mantenimiento asignado a o involucrado con el

36
Análisis causa raíz de la falla

área que se investiga. Debe prestarse una especial atención a


las tareas rutinarias, como la lubricación, los ajustes, y otras
tareas preventivas. Determine si los procedimientos están
siendo ejecutados de una manera oportuna y si están
usándose las técnicas apropiadas.

3.3.4. Observaciones y mediciones

Si la revisión de las aplicaciones y del mantenimiento no es concluyente,


pueden ser necesarias una evaluación y pruebas adicionales. Las técnicas
discutidas en esta sección proporcionan maneras de cuantificar las
desviaciones de las prácticas de operación y de mantenimiento aceptables.
Usando estas técnicas, el equipo de investigaciones puede establecer con
exactitud las desviaciones que contribuyen con el problema.

Después de establecer las desviaciones potenciales de las condiciones de


operación u otras variantes que contribuyen con el evento, el próximo paso
es verificar estos factores fueron contribuyentes reales. El mejor método de
confirmación es medir físicamente la dinámica operación de la máquina o
sistema de producción asociada con el evento.

Evaluar cualquier evento o incidente que resulte en una falla parcial o


completa de una máquina, de la pieza de un equipo, o de un sistema, debe
incluir un análisis completo de las partes componentes fallados. Los
métodos reales usados variarán dependiendo del modo de falla y tipo de
falla de la máquina o componente fallido.

En la mayoría de los casos, deben reemplazarse inmediatamente los


componentes fallados para minimizar el impacto en la producción. Si este es
el caso, puede ser beneficiosa una evaluación del sistema que rodeó al
incidente. Si esta comprobación se puede conducir poco después que la
máquina a fallado, puede haber evidencia residual que ayudará en la
investigación. Esto es especialmente cierto en los casos dónde las
variaciones en los parámetros de operación, como las variaciones del
producto y las prácticas de operación, contribuyeron a la falla.

Muchos tipos de mediciones pueden tomarse y así como efectuar


observaciones, pero las más efectivas incluyen el análisis de vibracional, la
cuantificación de parámetros del proceso, y la inspección visual.

El análisis de vibración, complementado con el registrador directo de


variables del proceso, provee el más efectivo medio para determinar sus
efectos. Un análisis completo multicanal de la máquina de reemplazo y su
sistema instalado proporciona los datos necesarios para evaluar la
contribución potencial de sistema a la falla.

37
Análisis causa raíz de la falla

3.3.4.1. El análisis vibracional

El análisis de vibración es quizás el mejor método para medir


el real comportamiento operacional de los sistemas
mecánicos. Esta técnica proporciona los medios para
cuantificar una variedad de factores que pueden contribuir con
el evento - incluso cuando la falla del equipo no ha ocurrido.

Si se cree que las variaciones en el producto entrante, las


prácticas de operación y mantenimiento, el medio ambiente u
otras variables son un factor de contribución con la falla, las
pruebas de vibración pueden medir el efecto real de cada
variable.

Es necesario desarrollar una sucesión de pruebas que aíslen


y comparen directamente cada variable sospechosa. Por
ejemplo, una serie de pruebas de vibración pueden conducir a
medir el cambio real de la respuesta de una máquina o
sistema de procesos, para cambios discretos en los
parámetros del producto entrante, tal como la viscosidad o la
temperatura. Otra sucesión de pruebas puede dirigirse para
medir los efectos de las variaciones en las prácticas de
operación o el medio ambiente.

Todas las pruebas de vibración deben ser basadas en un plan


de pruebas bien pensado que defina su propósito y los
métodos que serán usados. La documentación detallada es
esencial. Cada prueba de la sucesión debe ser
completamente detallada para definir con claridad los
parámetros exactos a usar durante la adquisición de los
datos. Esta documentación es esencial para el análisis
apropiado y la comparación de la data.

En la mayoría de los casos, los datos del proceso o del medio


ambiente deben adquirirse conjuntamente con los datos de
vibración. Desde que estas pruebas se diseñaron para
cuantificar los efectos de los cambios en las variables, es
necesario verificar el cambio real causado por cada uno.

Pueden usarse los datos en tiempo real para cuantificar con


exactitud la relación de causa y efecto entre las variables
sospechosas y el comportamiento operacional de la máquina
o sistema.
Las técnicas de adquisición multicanal de datos proporcionan
los medios mejores medios para adquirir este tipo de datos.
La técnica multicanal registra todas las variables al mismo
tiempo, eliminando la posibilidad que algo en tránsito pueda
ser perdido como con un método de adquisición de datos de
canal simple.

38
Análisis causa raíz de la falla

3.3.4.2. Parámetros del proceso

Las variaciones en la evaluación de parámetros del proceso,


como la presión, la razón de flujo, y la temperatura, es un
medio efectivo de confirmación de sus impactos en el sistema
de producción. En algunos casos, el sistema de supervisión
por computadora del Nivel I usada para operar el sistema de
procesos proporciona muchos de los datos necesarios. Los
sistemas de supervisión normalmente adquieren, informan, y
almacenan variables claves del proceso a lo largo del proceso
de producción normal. Esta información es útil para el análisis
inicial y las pruebas de confirmación.

Las pruebas deben desarrollarse para medir el impacto de los


cambios de los parámetros del proceso en el sistema para
determinar si las desviaciones específicas contribuyeron al
evento que está investigándose. En la mayoría de los casos,
deben usarse las pruebas en conjunto con el análisis de
vibraciones para medir las relaciones de causa y efecto entre
los procesos específicos instalados y el comportamiento
operacional del sistema.

3.3.4.3. Inspección visual

La inspección visual es una herramienta que siempre debe


usarse. Tales inspecciones deben realizarse en dispositivos
de medición, como en manómetros y los componentes con
falla de la máquina.

3.3.4.4. Los dispositivos de medición

La mayoría de las máquinas y sistemas incluyen dispositivos


de medida que proporcionan una indicación clara de la
condición de operación. Una inspección visual de estos
dispositivos confirma muchos de los modos de falla que
causan desviaciones del proceso y las fallas catastróficas.

Por ejemplo, los manómetros de presión son una herramienta


primaria para evaluar el comportamiento operacional. Una
lectura estable de la presión es una buena indicación que el
equipo (por ej., bomba, ventilador, compresor) está operando
normalmente y dentro de sus condiciones de operación de
diseño. Un manómetro fluctuando es una indicación de que
algo anda mal. Un flujo turbulento, cíclico o una variación en
la carga o la demanda, y una variedad de otras desviaciones
del proceso produce una fluctuación radical de la lectura del
manómetro de presión.

39
Análisis causa raíz de la falla

3.3.4.5. Los componentes fallados de la máquina

La inspección visual de los componentes fallados de la


máquina puede ser una efectiva herramienta de diagnóstico.
Por ejemplo, la inspección visual de un rodamiento fallado
puede determinar la zona recargada, el patrón de desgaste, y
en muchos casos la causa probable de la falla. Lo mismo
sucede en engranes, fajas en V, y una variedad de otros
componentes de comunes de máquinas.

En muchos casos, la inspección visual proporciona pistas


positivas que orientan al investigador hacia el probable modo
de falla o causa de la raíz. Por ejemplo, el patrón de desgaste
de un rodamiento de rodillos o de un conjunto de engranes
proporciona indicaciones visuales de un comportamiento o
carga anormal.

Varios libros de referencia discuten e ilustran los modos de


falla comunes de los componentes de una máquina que
pueden descubrirse usando la observación visual así como
las herramientas de diagnóstico primario. La mayoría de estos
libros utilizan fotografías para mostrar claramente la imagen
visual de varios modos de falla.

3.3.4.6. Partículas de desgaste

El análisis de las partículas de desgaste es una técnica de


diagnóstico que usa el análisis visual ayudado por un
microscopio electrónico para evaluar el patrón de desgaste de
los sólidos metálicos contenidos en el sistema de lubricación
de una máquina.

Usando esta técnica, un analista especializado puede


determinar el tipo de desgaste y su causa más probable.

En la mayoría de los casos, este análisis requiere el uso de


un laboratorio externo, con costos que van desde
aproximadamente $25 a $50 por muestra. Sin embargo, el
conocimiento ganado con esta prueba es sumamente valioso
para el proceso del RCFA.

Otras técnicas de comprobación de la condición (por ej.,


megado, ultrasonido, emisiones acústicas) puede usarse para
medir la relación de causa y efecto entre las variables. Cada
técnica es apropiada para aplicaciones específicas y
proporciona un medio de cuantificar o mostrar cuales
funciones de fuerza específicas contribuyeron al evento o
incidente que se investiga.

Hay también que a una variedad de pruebas que pueden


efectuarse para evaluar las propiedades metalúrgicas del
componente que falló.

40
Análisis causa raíz de la falla

Éstos incluyen el esfuerzo de tensión, la tensión residual, y


otras propiedades del componente así como el mecanismo de
falla real (es decir, ruptura por tensión, fractura de
compresión, etc.).

A menos que la planta tenga un laboratorio metalúrgico


totalmente funcional, las pruebas pueden requerir el uso de
un laboratorio externo. El costo de las evaluaciones variará,
dependiendo del tipo de componente y la magnitud del
análisis. Usado selectivamente, el análisis metalúrgico es una
herramienta eficaz y puede ser parte útil de un RCFA.

3.4. Determinación de la causa de la raíz

A estas alturas de la investigación, los pasos precedentes, los diagramas secuencia


de eventos, y los árboles lógicos deben de haber identificado las funciones de
fuerza que pueden haber contribuido al problema. Estos datos deben haber
proporcionado suficiente visión de la falla para que el investigador desarrolle una
lista de razones potenciales o probables para la falla.

Las guías para tipos específicos de máquinas así como las guías para la solución
de problemas que se dan más adelante deberían ser utilizadas como parte de esta
actividad. Un buen número de modos de falla comunes de maquinaria se definen
más adelante, estos proporciona síntomas obvios asociados con un problema o
falla de la máquina y sus causas comunes. Acoplados con los datos encontrados
durante la investigación, estas tablas deberían ayudar a reducir el número de
causas potenciales a no más de dos o tres.

Un método que puede usarse para evaluar factores potenciales que pueden haber
causado o contribuido con el evento es el análisis de causa y efecto. La
representación gráfica de las variables o los factores identificados por la
investigación usa un diagrama de la espina de pescado que proporciona un medio
para evaluar las causas raíces potenciales.

La ventaja del diagrama de espina de pescado es que esto obliga al investigador a


agrupar lógicamente a cada uno de los factores identificados durante la
investigación. Este proceso puede eliminar algunos factores automáticamente y
puede descubrir otros problemas que deben ser manejados. Una vez que todos los
factores identificados han sido gráficamente mostrados, el investigador o el equipo
de investigaciones pueden evaluar cada uno sistemáticamente.

Es esencial analizar una lista corta de causas raíces potenciales para verificar cada
una de las causas sospechosas. En casi todos los casos, una serie de pruebas
relativamente simples y baratas pueden efectuarse para confirmar o eliminar la
causa que se sospecha causó la falla del equipo. Como un ejemplo, el azul de
prusia puede usarse para verificar el alineamiento y el juego del conjunto de
engranes. Este simple y barato test requiere muy poco esfuerzo y confirmará el
patrón de desgaste y el embonado del conjunto de engranes. Si el alineamiento o el
excesivo contragolpe están presente, esta prueba lo confirmará.

41
Análisis causa raíz de la falla

Cuando se sospecha si existe cavitación en una bomba centrífuga, verifique al


menos un factor, tales como goteras en la succión o una baja altura neta de succión
positiva (NPSH), presentes en el sistema. Si no se verifican, la cavitación no puede
ser la causa de la falla.

La mayoría de las causas que contribuyen con los problemas que adversamente
afectan el rendimiento de la planta pueden agruparse en una de varias categorías.
La mayoría de los problemas del equipo pueden remontarse a la mala aplicación de
las prácticas y los procedimientos de operación y mantenimiento o simplemente a la
edad.

Algunas de las otras causas que se discuten incluyen entrenamiento, supervisión,


comunicaciones, ingeniería humana, sistemas de gerencia, y control de calidad.
Estas causas son las razones más comunes para un pobre rendimiento de la
planta, accidentes, y el no acatamiento de las normas reguladoras. Sin embargo, el
error humano puede contribuir a, o ser la sola razón del problema.

La figura 12 ilustra las causas más comunes de eventos que afectan la seguridad
de la planta, complacencia medioambiental, rendimiento del proceso, y confiabilidad
del equipo.

FALLA DEL EQUIPO

Prácticas de
Mala aplicación Prácticas de Operación Edad
Mantenimiento

Condiciones de
Procedimientos Procedimiento
operación de diseño Desgaste normal
inadecuados inadecuado
fuera de lugar

Prácticas pobres Ninguna adherencia Procedimientos no


de diseño al procedimiento Vida útil terminada
concuerdan

Prácticas pobres de Entrenamiento Frecuencia inadecuada Desgaste acelerado


adquisición inadecuado

Incumplimiento Carencia de habilidades

Fig. 12: Causas comunes de fallas del equipo

42
Análisis causa raíz de la falla

3.4.1. Mala aplicación

La mala aplicación del equipo crítico del proceso es una de las causas más
comunes de problemas relacionados con el equipo. En algunos casos, la
razón para la mala aplicación es un diseño pobre, pero más a menudo es el
resultado de modificaciones incontroladas o cambios en los requisitos de
operación de máquina.

Prácticas Pobres de Diseño.

Algunos problemas del equipo son el resultado de aplicar en planta


inadecuadas prácticas de ingeniería. Una tendencia creciente en la industria
americana, a menudo disminuye o elimina el diseño interno y las
capacidades de ingeniería de la planta. Sin embargo, esto puede resultar en
pobres prácticas de diseño, lo cual tienen un impacto serio en la
confiabilidad del equipo. Incluso en esos medios dónde la capacidad de
diseño interno no se elimina, la calidad de los procedimientos y las prácticas
pueden verse mermadas tal que afectan el diseño del proceso y contribuyen
con los problemas.

Durante la fase de revisión del diseño de una investigación, el equipo


investigador debe de haber evaluado el diseño del proceso para determinar
si es adecuado para la aplicación en particular. Si no, la acción correctiva
obvia es modificar los procedimientos y las prácticas que se usan para la
función de diseño.

Prácticas de Obtención.

Los métodos por obtener equipo nuevo y de reemplazo contribuyen a


menudo con los problemas relativos al equipo. Los factores principales que
contribuyen con las deficiencias son las especificaciones técnicas
inadecuadas, substitución de vendedores o máquinas, omisión de las
evaluaciones del costo del ciclo de vida, y no obtener las evaluaciones del
vendedor.

Especificaciones Inadecuadas.

Un gran contribuyente en esta categoría es la ausencia de adecuadas


especificaciones de obtención. Generalmente, las especificaciones técnicas
no incluyen suficiente detalle para asegurar que se está comprando la parte
o máquina correcta. Muy a menudo, las especificaciones se limitan a
número de modelo o de parte. Sin embargo, este tipo de especificación no
define la aplicación específica o rango de operación que la máquina debe
proporcionar.

Substituciones.

El papel definido para el proceso de compra es limitar el costo de las partes


y máquinas nuevas y de reemplazo. Como resultado, el personal de
adquisiciones a menudo substituye partes o máquinas que reciben por ser
externamente iguales. Desgraciadamente, las substituciones no siempre son
exactamente las mismas. Los mismos vendedores también contribuyen con

43
Análisis causa raíz de la falla

este tipo de problema. Ellos ofrecerán los equivalentes a las


especificaciones requeridas sin pensar en la aplicación que se intenta darle.
En algunos casos, les basta con dar una mirada. En otros, hay un esfuerzo
intencional en obtener la orden, sin tener en cuenta el impacto en el
rendimiento de la planta.

Baja Oferta versus el Costo del Ciclo de Vida.

Obtener equipo nuevo o de reemplazo basados estrictamente en la baja


oferta en lugar de observar el costo del ciclo de vida es otra importante
contribución a los problemas de confiabilidad del equipo. En un esfuerzo por
reducir los costos, muchas plantas han abandonado el proceso de selección
del vendedor basado en el costo del ciclo de vida total del equipo. Este error
continúa bajando la confiabilidad del equipo y puede ser la causa raíz de
muchos problemas.

Evaluaciones del Vendedor.

La calidad del equipo nuevo y reconstruido tiende a declinar sustancialmente


sobre los diez años. Al mismo tiempo, muchas compañías han abandonado
la práctica de inspecciones regulares y certificación del vendedor. El declive
resultante en la calidad es otra contribución al mal funcionamiento o falla del
equipo.

3.4.2. Prácticas y procedimientos de operación pobres

Las prácticas y procedimientos de operación pobres juegan un papel


importante en los problemas de confiabilidad del equipo. La figura 13 ilustra
las fuentes más comunes de problemas causadas por los procedimientos.
Los problemas generalmente resultan porque no se usan los
procedimientos, son inadecuados, o se siguen incorrectamente. Cualquiera
de estas categorías puede ser la causa raíz, pero normalmente ocurre junto
con una o más de otras causas discutidas en esta sección. Por ejemplo, no
hacer cumplir es un problema de supervisión y la verdadera causa de la raíz
debe incluir una evaluación. La llave a evaluar el potencial de la causa raíz
es determinar si el problema es un procedimiento inadecuado o la falla
ocurre al seguir procedimientos válidos.

Muchos de los SOPs utilizados para operar sistemas críticos en plantas de


producción están fuera de fecha o son inadecuados. A menudo esto hace
una importante contribución a los problemas relacionados con los equipos y
su confiabilidad.

Si lo anterior es evaluado como un potencial contribuyente al problema


específico que se investiga, refiérase a la figura 13 para la sub clasificación
que ayudará a identificar las causas raíces y las acciones correctivas
apropiadas. Los problemas de procedimiento tienen un impacto más
universal en la confiabilidad y el rendimiento en donde hay una probabilidad
sumamente alta que la falla o problema se repita.

44
Análisis causa raíz de la falla

PROCEDIMIENTOS

Incorrectamente
No usados Inadecuados
seguidos

Hechos o métodos
No hay procedimiento Formato confuso
equivocados

Dificultad para su uso Organización pobre Excesivas referencias

Se hizo inadecuada
No hay disponible Demasiado técnico
revisión

Situación no
No se ejecuta
considerada

Fig. 13: Causas raíces comunes de los problemas relacionados con el procedimiento

La carencia de vigor para hacer cumplir, es una de las razones que los
procedimientos no se siguen de forma consistente. La real causa de esto
puede ser muchos factores. Falta de entrenamiento o un inadecuado empleo
de habilidades normalmente contribuyen a problemas que afectan el
rendimiento de la planta y la confiabilidad del equipo. Los mayores
contribuyentes a los problemas relativos al entrenamiento incluyen no
entrenar, inadecuado entrenamiento y falla al aprender.

Las razones implícitas a inadecuadas habilidades varían dependiendo de la


cultura de la planta, la mano de obra y una variedad de otros problemas.

La figura 14 provee las razones más comunes para un pobre nivel de


habilidades que son causadas por problemas de entrenamiento. Además de
las subcategorías incluidas en la figura, revise las secciones en Prácticas y
Procedimientos de Operación Pobres y Supervisión para problemas donde
un inadecuado nivel de habilidades es un potencial contribuyente.

45
Análisis causa raíz de la falla

ENTRENAMIENTO

Ningún Entrenamiento Inadecuado No Aprendido

Aprender no es
Tarea no analizada Carencia de retención
un objetivo

No se decidió ningún
Ningún plan Demasiado técnico
entrenamiento

Aprender no es
Instrucción pobre No asistió al curso
un objetivo

El entrenamiento La aplicación Conocimiento


no se ejecuta no es práctica no verificado

Fig. 14: Causas Comunes de problemas relativos al entrenamiento.

Ningún Entrenamiento.

Muchas plantas carecen de un programa de entrenamiento formal que


proporcione las habilidades mínimas que requieren los empleados para
ejecutar las tareas de obtención, operación, y mantenimiento exigidas para
mantener un nivel aceptable de rendimiento de la planta.

En otros casos, los programas de entrenamiento de la planta son los


limitados a cursos como (por ej., OSHA, EPA, u otros cursos reguladores)
eso tiene poco que hacer con las habilidades prácticas exigidas para cubrir
los requisitos del trabajo.

El Entrenamiento Inadecuado.

Hay una variedad de razones por las que los programas de entrenamiento
fallan al no lograr un mínimo nivel de habilidades en los empleados. La
mayoría se relaciona a los procedimientos y los métodos utilizados para
desarrollar y presentar los cursos de entrenamiento. Algunos tipos
comprueban la mejora del nivel de habilidades después que el
entrenamiento ha sido completado, siendo esta la mejor manera de
determinar la efectividad del programa de entrenamiento.

Fracaso al Aprender.

Los empleados no retienen la instrucción proporcionada en los programas


por dos razones: la instrucción es pobre y algunos fracasos del empleado.
La instrucción pobre es una falla por la que el empleador proporciona la
información requerida para que el empleado realice un particular trabajo en
un formato fácilmente entendible y a un paso que le permita absorber el
material. El fracaso por el empleado para aprender puede ser el resultado de
su nivel de educación, fatiga, falta de deseo, o falta de incentivo.

No todos los empleados tienen la educación y las habilidades de


comprensión necesarias para entender, dominar, y retener el entrenamiento

46
Análisis causa raíz de la falla

para mejorar sus habilidades de operación y de mantenimiento. En algunos


casos, el empleado no puede tener la habilidad para leer y escribir a un nivel
que permite un mínimo entendimiento de incluso el más simple programa de
entrenamiento.

Los empleados que cayeron dentro de esta clasificación presentan un serio


problema que es muy difícil corregir. La única solución real es proporcionar
cursos de entrenamiento que remedien esto enfocando la lectura y escritura
básicas, y las habilidades de comprensión.

La fatiga es otro factor que directamente afecta el entrenamiento. Muchos


cursos se enseñan fuera de horas de trabajo normales y se espera que los
empleados asistan al entrenamiento después de en un día lleno de labores.
Desgraciadamente, esto afecta a los estudiantes, y su habilidad para
comprender y retener las instrucciones.

La falta de motivación puede ser un problema de actitud del empleado, pero


en muchos casos la real causa raíz es una falla en la supervisión y las
políticas de la planta. Si se sospecha una falta de motivación, evalúe las
causas potenciales incluidas en las secciones siguientes en Supervisión,
Comunicaciones, y Sistemas de Dirección antes de tomar una decisión final
en cuanto a la causa raíz del problema.

3.4.3 SUPERVISIÓN

La supervisión incluye todas las causas potenciales que puedan estar


asociadas con las prácticas y los procedimientos de dirección. Mientras la
mayoría de las causas apuntan a supervisores de primera línea, también
pueden apuntar a todos los niveles de dirección. La figura 15 proporciona los
factores comunes de problemas relativos a la supervisión.

Preparación.

La falta de preparación es un factor común a que contribuye a, o es la sola


razón para, los problemas de rendimiento de la planta. En algunos casos, es
un problema del empleado con uno o más supervisores o gerentes, pero más
a menudo es un fracaso en la filosofía de dirección global de la planta.
Muchas plantas confían en sus supervisores de primera línea que también
tienen otras responsabilidades directas o indirectas.

47
Análisis causa raíz de la falla

SUPERVISIÓN

Selección de Supervisión durante


Preparación
trabajadores el trabajo

Pobre trabajo
Ninguna preparación No calificados
en equipo

Demasiadas
Ningún paquete
Fatigados responsabilidades
de trabajo
anexas
Carencia de Problemas de
entrenamiento previo trastorno / personal
al trabajo

Inadecuada
Abuso de sustancias
programación

Mala selección
del equipo

Fig. 5: Factores comunes de causas relacionadas con la supervisión

Como resultado, el supervisor tiene poco tiempo para preparar el paquete de


trabajos, proporcionar entrenamiento práctico, o realizar muchas de las otras
tareas esenciales para el rendimiento consistente de la planta (y el
trabajador). Si éste es el caso, citar una supervisión pobre como la causa
raíz de un problema es impropio e incorrecto.

Otra razón común para el fracaso en esta categoría es la falta de


entrenamiento del supervisor. Pocos supervisores de primera línea han
seguido un entrenamiento básico de habilidades que ellos necesitan para su
posición. Los materiales presentados previamente como Prácticas y
Procedimientos de Operación Pobres deberían ser incluidos en cualquier
evaluación donde una pobre supervisión es una fuente potencial de
problemas.

Selección de los Trabajadores.

La selección de trabajadores asignados a tareas o trabajos específicos es


una contribución común a los problemas. Generalmente, los trabajadores
son asignados a tareas según la percepción que el supervisor tenga de sus
habilidades. En parte, esta es la razón por la que los niveles de habilidades
no son universales en la mayoría de plantas y los supervisores intentan
colocar sus mejores hombres en trabajos sensibles o críticos. El problema
con este enfoque es que algunos miembros de la fuerza de trabajo llegan a
estar sobrecargados, lo cual causa un desvanecimiento de las habilidades
personales lo cual los inhabilita a acceder a trabajos calificados. Cuando se
evalúan causas raíces potenciales que pueden caer dentro de esta
categoría, refiérase a las secciones previas en problemas de entrenamiento.

48
Análisis causa raíz de la falla

Trabajo Durante la Supervisión.

Muchos de los problemas debidos a esta causa resultan en una función dual
que los supervisores deben realizar. Debido a otras responsabilidades, ellos
no están disponibles para supervisar directamente los trabajos que se están
ejecutando. Una segunda causa potencial de este problema es la carencia
de habilidades o entrenamiento del supervisor. Al chequear cualquier
problema potencial que pueda ser atribuido a esta categoría asegure una
adecuada identificación de la causa raíz.

La falta de preparación o entrenamiento del supervisor. El cruce de


información de cualquiera de los problemas potenciales que pueden ser
atribuidos a esta categoría para asegurar la identificación apropiada de la
causa raíz.

3.4.4. Comunicaciones

La falla en la comunicación es otra gran categoría que contribuye a los


problemas en la planta. La figura 16 muestra las causas típicas de los
problemas relacionados con la comunicación

COMUNICACIONES

Ninguna comunicación Reorganización Malos entendidos

Ningún método Ningún proceso No hay términos


disponible está estandararizado estándar

No es usual ningún
proceso de No es usual
Comunicaciones tardías
reorganización volver a repetir

Carencia de formato Inadecuado proceso


Mensajes muy largos
de reportes de reorganización

Medioambiente ruidoso

Fig. 16: Causas comunes de problemas en las comunicaciones

Cualquier problema que pueda ser atribuido a una o más de estas


categorías debería ser información que se debe cruzar con las secciones:
Procedimientos y Prácticas de Operación Pobres y Sistemas de
Administración, para asegurar si la causa correcta está identificada.

49
Análisis causa raíz de la falla

3.4.5. Ingeniería humana

Las deficiencias en esta categoría no son tan visibles como las de otras,
pero contribuyen a muchos problemas en la planta. Estas causas, que se
muestran en la figura 17, son en primer lugar el resultado del mal diseño del
área de trabajo y errores en el flujo de trabajo.

INGENIERÍA HUMANA

Interfase
Entorno del trabajo Sistemas complejos
trabajador -máquina

Decisiones requeridas
Arreglo / empleo Limpieza general basadas en el
conocimiento

Excesivos estiramientos Demasiados parámetros


Medio ambiente
e inclinaciones para monitoreaer

Herramientas / Retroalimentación
Espacios angostos
instrumentos inadecuada

Controles / displays

Fig. 17: Causas comunes de problemas en ingeniería humana

Interface del Trabajador - Máquina

Los planos de diseño de los paneles de instrumentos, controles, estaciones


de trabajo y otros equipos tienen un impacto directo en el funcionamiento de
la planta. Por ejemplo cuando el diseño del área de trabajo demanda del
operador giros constantes, inclinarse o doblarse; el riesgo de daño, error
debido a fatiga o la perdida de la calidad final del producto aumenta
sustancialmente. Un adecuado diseño del área de trabajo puede ayudar a
eliminar problemas potenciales.

Ambiente de Trabajo

El ambiente de trabajo tiene impacto directo en la fuerza de trabajo y la


confiabilidad del equipo. Una iluminación inadecuada, falta de control de
temperatura y una limpieza deficiente son las formas más dominantes dentro
de esta clasificación. En algunos casos un ambiente inadecuado es un
síntoma más que una causa raíz. Por ejemplo, los procedimientos de
supervisión o los problemas en los sistemas de administración pueden ser
las causas reales. Asegúrese que la evaluación sea lo suficientemente
detallada para aislar la causa raíz verdadera.

50
Análisis causa raíz de la falla

Sistemas Complejos

Los sistemas de producción se están volviendo más y más complejos. Como


consecuencia los niveles de preparación de los operadores y el personal de
mantenimiento también deberían mejorar para lograr y mantener niveles de
confiabilidad aceptables. Mientras las categorías incluidas en esta sección
pueden ser percibidas como una causa raíz viable de una investigación
específica, la mayoría son una combinación de la complejidad de los
sistemas y otros ítems tales como entrenamiento, motivación del empleado y
otros.

3.4.6. Sistema de administración

La figura 18 ilustra las causas raíces más comunes de los problemas en los
sistemas de administración: las políticas y procedimientos, estándares no
usados y relaciones entre empleados.

La mayoría de estas potenciales causas raíces concuerdan con la cultura de


la planta y la filosofía de manejo. Mientras más difíciles sean aislarlas, las
categorías que caigan dentro de este grupo de causas contribuyen a
muchos de los problemas que serán investigados.

SISTEMAS DE
GERENCIA

Políticas y
No se usan estándares Relaciones empleadas
procedimientos

Ni auditorías /
Ningún estándar No hay comunicación
ni evaluaciones

No son lo bastante Recientemente Carencia de una


estrictos cambiados auditaría profunda

Ninguna comunicación
Confusos o incompletos Ninguna exigencia
empleada

Ninguna
Ningún camino para
Errores técnicos retroalimentación
implementar
empleada

Ningún esquema o
Ninguna contabilidad
impresión

Fig. 18: Causas comunes de problemas en los sistemas de administración

51
Análisis causa raíz de la falla

3.4.7. Control de calidad

El Control de calidad es una causa raíz primaria potencial en problemas de


desviación del proceso.

Mientras que estos problemas pueden contribuir a la falla de los equipos u


otro tipo de problemas, sus roles predominantes están en las
investigaciones relativas a la calidad y la capacidad. La figura 19 nombra las
causas de control de calidad más comunes creadas por ninguna o una
inspección inadecuada.

CONTROL DE CALIDAD

Inadecuado control de
Ninguna inspección
calidad

No se requieren
Instrucciones pobres
inspecciones

No sostienen puntos Técnicas pobres

Sostienen puntos Inadecuadas técnicas /


ignorados habilidades

Fig. 19: Causas relativas al control de calidad

3.5. Evaluación de acciones de correctivas potenciales

El proceso RCFA define una o más acciones correctivas que deberían resolver el
incidente o evento bajo investigación. El siguiente paso en este análisis es
determinar cual, si hubiera, de estas acciones correctivas debería ser
implementada. La figura 20 ilustra un árbol de decisión simplificado que define
múltiples acciones correctivas potenciales. Estas acciones incluyen un amplio rango
de posibilidades desde no hacer nada hasta reemplazar la máquina o sistema.

¿Qué acciones correctivas deberían ser tomadas? No todas las acciones son
financieramente justificables. En algunos casos, el impacto del incidente o evento
es menor que el costo de la acción correctiva.
En estos casos, el RCFA debería documentar el incidente para una referencia
futura, pero recomendando cual acción correctiva no se llevará a cabo.

52
Análisis causa raíz de la falla

El conocimiento básico de la máquina y la guía de detección de fallas dan los


lineamientos básicos necesarios para seleccionar las acciones correctivas
potenciales requeridas para resolver la falla y prevenir que vuelva a ocurrir.

El objetivo de esta tarea es definir una lista corta de acciones correctivas que
resolverán la causa raíz de la falla. En este punto, el costo no es factor y la lista
debería incluir las mejores soluciones para la causa identificada. Por ejemplo la falla
de una bomba causada por cavitación puede ser corregida eliminando la entrada de
aire o gas, incrementando la altura de succión neta positiva real (NPSHA), bajando
la temperatura de succión de líquido o aumentando la presión de succión.
Dependiendo del tipo de cavitación, una o cualquier combinación de estas acciones
correctivas eliminará el problema.

Sin embargo una vez que ha sido generada esta pequeña lista, debe ser
considerado el costo. Cada acción correctiva potencial debería ser cuidadosamente
analizada para determinar si realmente corregirá el problema. Esto es importante
porque la tendencia normal en menos evaluaciones formales es para arreglar los
síntomas de problemas antes la verdadera causa raíz. Además en esta fase de la
evaluación debería evaluar cada acción correctiva potencial para asegurar que
elimine el problema real.

Sin embargo, en algunas ocasiones, corregir los síntomas o implementar una


solución temporal es la única forma financieramente justificable. En aquellos casos
las recomendaciones deberían definir claramente la técnica que debería ser
tomada. Esta debería manifestar lo racional de la decisión y describir las
limitaciones o restricciones que la corrección parcial tendrá en el funcionamiento de
la planta, la confiabilidad del equipo y otros factores de la operación y el
mantenimiento de la planta.

A pesar de que el número de reparaciones temporales debería ser limitado tanto


como sea posible, frecuentemente son inevitables. Cada esfuerzo debe hacerse
para implementar acciones correctivas permanentes, y la meta es eliminar todos los
factores negativos asociados con el evento o incidente. Mientras haya
generalmente una acción correctiva que logre las metas, el reto es encontrar la
acción más aceptable que también sea efectiva en costos.

3.6. Reportes y recomendaciones

La siguiente prueba requerida en el RCFA es un reporte que incluya una


descripción completa del incidente o evento, la identificación de las causas
específicas y recomendaciones para su corrección. El reporte debería incluir la
siguiente información:

• Resumen del incidente.


• Condición inicial de la planta.
• Evento de inicialización.
• Descripción del incidente.
• Acciones correctivas inmediatas.
• Reportes externos archivados.
• Lecciones aprendidas.
• Referencias y anexos.

53
Análisis causa raíz de la falla

• Descripción del investigador o equipo de investigación.


• Descripción del equipo de revisión y aprobación.
• Lista de distribución.

54
Análisis causa raíz de la falla

55
Fig.20: Árbol simplificado de decisión definiendo múltiples acciones potenciales correctivas
Análisis causa raíz de la falla

a. Resumen de incidentes

El resumen del incidente debe ser una corta y concisa descripción del incidente o
evento. No se deben resumir los hechos que tienen una contribución directa con el
incidente.

B. Condición inicial de la planta

Esta sección debe incluir una breve descripción que defina el estatus de la planta al
inicio del incidente. Debe incluir cualquier condición anormal que contribuya al
incidente. Esta sección no debe intentar proveer un análisis cuantitativo del mismo
pero debería estar limitado a una clara descripción de las condiciones límites que
existieron en el momento del incidente.

C. Inicio de la investigación del evento

De una breve descripción de la falla inicial o la acción que ocasionó el incidente o


que dirigió a su descubrimiento y la investigación resultante. No use en esta sección
del reporte títulos o nombres de empleados específicos. En su lugar use códigos y
descriptores que identifiquen funciones dentro del área afectada.

D. Descripción del incidente

Esta sección debería incluir una detallada cronología del incidente. La cronología
debería ser referida al diagrama de secuencia de eventos desarrollada como parte
del análisis. Este diagrama debería estar incluido como apéndice en el reporte.

Esta sección debería incluir una descripción de cómo el incidente fue descubierto,
los hechos que rodearon el incidente, la identificación por número de componente y
el nombre de cada equipo fallado, el desempeño del sistema de seguridad, las
acciones del sistema de control, las acciones e intervenciones significativas del
operador, y los datos transitorios de los parámetros importantes de la planta.

También debería incluirse consideraciones especiales observadas en el incidente,


tales como comportamientos inexplicados e inesperados del equipo o las personas,
inadecuados o degradados desempeños del equipo, significativos malos entendidos
del personal de operaciones o de mantenimiento, modos de falla comunes,
progresión de los eventos respecto de las condiciones de operación de diseño,
violación de las especificaciones técnicas o límites de diseño, o fallas de acciones
correctivas previamente recomendadas.

E. ACCIONES CORRECTIVAS INMEDIATAS

Muchas de las fallas o eventos tienen un impacto directo en la producción y


requieren inmediatas acciones correctivas que minimicen el tiempo muerto. Como
resultado, a menudo son requeridas acciones temporales que permitan una
reanudación de la producción. Esta sección debe describir que acciones
intermedias y rápidas fueron tomadas que permitieron reanudar la producción.

56
Análisis causa raíz de la falla

Causas y Acciones Correctivas de Largo Plazo

Esta sección del reporte debería describir claramente la causa o causas raíces que
ocasionaron el incidente. Esto debería detallar recomendaciones específicas para
acciones correctivas de largo plazo.

Causa raíz

La descripción de la causa o causas raíces debería estar completa además de


proveer suficiente detalle y data de soporte que el lector pueda entender
completamente y aceptar el uso racional para aislar la causa o causas raíces. Esta
sección debería incluir todos los factores de contribución, tales como el
entrenamiento y la supervisión que contribuyeron con el incidente.

Acciones Correctivas de Largo Plazo Recomendadas

Esta sección debería proveer una clara y completa descripción de las acciones
correctivas requeridas para prevenir la recurrencia del incidente o evento. Esto
debería incorporar conclusiones derivadas del análisis costo beneficio desarrollado
previamente. El análisis completo debería estar incluido como parte del paquete de
condiciones expedidas al gerente para su aprobación.

F. Llamadas telefónicas externas efectuadas y reportes archivados

Esta sección debería documentar cualquier llamada telefónica externa efectuada


así como los reportes escritos y archivados.

Si el incidente involucra cuestiones de disconformidad con las normas, las llamadas


telefónicas pueden haber sido efectuadas y los reportes archivados por políticas
locales y por el equipo que responde la emergencia, el Centro de Respuesta
Nacional de Guardacostas, La Comisión de Respuestas de Emergencias del
Estado, el Comité de Planeamiento de Emergencias Locales, la oficina regional de
la Agencia de Protección Medioambiental de los EE.UU., el Departamento
norteamericano de Transporte, o la Agencia de Control de la Polución del Agua del
estado.

G. Lección aprendida

Esta lección debería describir las lecciones aprendidas por las que debe haber
pasado el personal apropiado. Esta información debería ser diseminada a través de
un entrenamiento formal o algún otro medio, tal como la retroalimentación individual
o lectura requerida. Esta sección debería designar a la persona (por nombre)
responsable de asegurar que las lecciones aprendidas sean comunicadas, la fecha
de conclusión para la comunicación, y la lista específica del personal de planta que
deberían recibir las comunicaciones.

H. Referencias y anexos

Es la lista de todas las referencias y los anexos usados como parte de la


investigación. Se deben incluir como apéndices: las copias o extractos de
procedimientos apropiados, originales, impresiones de computadora, planos y
declaraciones del personal involucrado.

57
Análisis causa raíz de la falla

I. Descripción del equipo investigador o investigado

Esta sección debe incluir una lista y las descripciones del personal involucrado en la
investigación.

J. Descripción del equipo que revisa y aprueba

Los reportes de RCFA deberían siempre ser revisados y aprobados antes de ser
distribuidos al personal de planta. La cadena de aprobación variará de una planta a
otra pero debería ser establecida antes de implementar un RCFA. El proceso de
revisión es importante por reducir el potencial de errores o mal interpretación que es
parte inherente de un proceso de investigación.

K. Distribución

Incluir una lista del personal de planta, incluyendo contratistas apropiados, que
deberían recibir una lista del reporte final.

3.7. Verificación de la acción correctiva

Una vez que la acción correctiva ha sido aprobada e implementada, la tarea final
requerida para un minucioso RCFA es verificar que la acción correctiva detuvo el
problema. Después que las acciones correctivas han sido implementadas, una serie
de pruebas de confirmación deben conducir a asegurar una operación confiable de
la máquina o aplicación corregida.

Para la mayoría de maquinaria común de planta, un bien planificado análisis de


vibración en tiempo real multicanal debería confirmar la acción correctiva. Una serie
de mediciones de la vibración pueden ser desarrolladas e implementadas para
medir las dinámicas de operación de la instalación nueva o modificada. La serie
debería incluir las condiciones totales de operación del sistema, incluyendo
cualquier cambio en las prácticas de operación que fueron parte de la
recomendación. Los resultados de estas series de pruebas confirmaran la validez
de las correcciones y proveerán la garantía que el sistema modificado opera
confiablemente.

EJERCICIO:

Elabore el análisis causa raíz para una falla crónica que se puede presentar en las
siguientes máquinas:

• Bomba centrífuga accionada por un motor trifásico asíncrono de rotor en


cortocircuito.
• Molino de bolas accionado por un motor trifásico asíncrono de rotor en
cortocircuito.
• Cable subterráneo de media tensión.

58
Análisis causa raíz de la falla

4. Mapa conceptual
ANÁLISIS CAUSA RAÍZ DE LA
FALLA (RCFA)

PROPÓSITO DEL ANÁLISIS CAUSA RAÍZ DE


LA FALLA

USO EFECTIVO DEL ANÁLISIS


INTRODUCCIÓN AL
ANÁLISIS CAUSA
RAÍZ DE LA FALLA
REQUERIMIENTOS DE PERSONAL

CUÁNDO USAR EL MÉTODO

ANÁLISIS DE EFECTO Y MODO DE FALLA

ANÁLISIS DEL ÁRBOL DE FALLAS


TÉCNICAS
GENERALES DE
ANÁLISIS
ANÁLISIS DE LA CAUSA Y EFECTO

ANÁLISIS DE LA SECUECIA DE EVENTOS

REPORTE DE UN INCIDENTE O PROBLEMA

CLASIFICACIÓN DE INCIDENTE
METODOLOGÍA DEL
ANÁLISIS CAUSA
RAÍZ DE LA FALLA
ACOPIO DE LA DATA

OBSERVACIONES Y MEDICIONES

MALA APLICACIÓN

PRÁCTICAS Y PROCEDIMIENTOS DE
OPERACIÓN POBRE

SUPERVISIÓN

DETERMINACIÓN DE
LA CAUSA DE LA COMUNICACIÓNES
RAÍZ

INGENIERÍA HUMANA

SISTEMA DE ADMINISTRACIÓN

CONTROL DE CALIDAD

EVALUACIÓN DE
ACCIONES DE
CORRECTIVAS
POTENCIALES

REPORTES Y
RECOMENDACIONES

VERIFICACIÓN DE
ACCIONES CORRECTIVAS

59
Análisis causa raíz de la falla

5. Referencias bibliográficas

• Francisco J. Gonzales Fernandez (2009). Teoría y Práctica del


Mantenimiento Industrial Avanzado. FC EDITORIAL. (658.202/G71).
• Santiago García Garrido (2008). Organización y Gestión Integral del
Mantenimiento. DIAZ DE SANTOS. (658.202/G23).
• Alberto Mora Gutierrez (2009). Mantenimiento. Planeación, Ejecución y
Control. (658.202/M86)

Se puede complementar el estudio de la presente unidad visitando las siguientes


páginas Web:

• http://campuscurico.utalca.cl/~fespinos/ANALISIS%20CAUSA%20RAIZ
%20%20(RCA).pdf
• http://www.calidad.uady.mx/resources/nosotros/presentaciones/T%C3%
A9cnicas%20para%20identificar%20la%20Causa-Ra%C3%ADz.pdf
• http://www.mantenimientomundial.com/sites/mm/notas/causaraizaltmann
.pdf
• http://aprendizajevirtual.pemex.com/nuevo/guias_pdf/Guia_SCO_Analisi
s_Causa_Raiz.pdf
• http://www.iie.org.mx/boletin042012/art-inv.pdf

60
Análisis causa raíz de la falla

6. Glosario de términos

• Acápites: Texto breve, posterior al título, que aclara el contenido del


artículo que encabeza.
• Acopio: Acción y efecto de juntar, reunir en cantidad algo.
• Aleatorios: Dependiente de algún suceso fortuito.
• Analíticas: Perteneciente o relativo al análisis.
• Analizar: Hacer análisis de algo.
• Confiabilidad: Probabilidad de buen funcionamiento de algo
• Crónicos: Que viene de tiempo atrás.
• Data: Almacenamiento de datos.
• Diagnóstico: Arte o acto de conocer la naturaleza de una avería
mediante la observación de sus síntomas y signos.
• Disciplina: Arte, facultad o ciencia.
• Efectividad: Capacidad de lograr el efecto que se desea o se espera.
• Estándares: Que sirve como tipo, modelo, norma, patrón o referencia
• Eventos: Eventualidad, hecho imprevisto, o que puede acaecer.
• Evidencia: Prueba determinante en un proceso.
• Fluidificador: Que hace fluido algo.
• Hostil: Contrario o enemigo.
• Ingeniería: Estudio y aplicación, por especialistas, de las diversas ramas
de la tecnología.
• Interdisciplinaria: Que se realiza con la cooperación de varias
disciplinas.
• Interface: Separación entre dos fases.
• Investigado: Hacer diligencias para descubrir algo.
• Investigación: Que tiene por fin ampliar el conocimiento científico, sin
perseguir, en principio, ninguna aplicación práctica.
• Lesión: Daño o detrimento corporal causado por una herida, un golpe o
una enfermedad.
• Lógicos: Dicho de unos sucesos: Cuyos antecedentes justifican lo
sucedido.
• Método: Modo de decir o hacer con orden.
• Mensurable: Que se puede medir.
• Metodología: Conjunto de métodos que se siguen en una investigación
científica.
• Precisión: Determinación, exactitud, puntualidad, concisión.
• Sistemático: Que sigue o se ajusta a un sistema.

61

También podría gustarte