Está en la página 1de 62

ANLISIS CAUSA RAIZ DE

LA FALLA

Anlisis causa raz de la falla

1.
2.

3.
3.1.

3.2

3.3.

3.4.

3.5.
3.6.
3.7.
4.
5.
5.

Introduccin ......................................................................................................... 2
Objetivos ............................................................................................................. 2
2.1.
Objetivos generales.................................................................................. 2
2.2.
Objetivos especficos ............................................................................... 2
Contenido ............................................................................................................ 3
Introduccin al anlisis causa raz de la falla ....................................................... 3
3.1.1. Propsito del anlisis causa raz de la falla .............................................. 3
3.1.2. Uso efectivo del anlisis ........................................................................... 3
3.1.3. Requerimientos de personal ..................................................................... 4
3.1.4. Cundo usar el mtodo ............................................................................ 4
Tcnicas generales de anlisis ............................................................................ 5
3.2.1. Anlisis de efectos y modo de falla (FMEA) ............................................. 5
3.2.2. Anlisis del rbol de fallas ........................................................................ 6
3.2.3. Anlisis de la causa y efecto .................................................................... 8
3.2.4. Anlisis de la secuencia de eventos ......................................................... 9
Metodologa del anlisis causa raz de la falla ................................................... 13
3.3.1. Reporte de un incidente o problema ....................................................... 13
3.3.2. Clasificacin de incidente ....................................................................... 16
3.3.3. Acopio de la data.................................................................................... 20
3.3.4. Observaciones y mediciones .................................................................. 37
Determinacin de la causa de la raz ................................................................. 41
3.4.1. Mala aplicacin ...................................................................................... 43
3.4.2. Prcticas y procedimientos de operacin pobres.................................... 44
3.4.3. Supervisin ............................................................................................ 47
3.4.4. Comunicaciones ..................................................................................... 49
3.4.5. Ingeniera humana ................................................................................. 50
3.4.6. Sistema de administracin ..................................................................... 51
3.4.7. Control de calidad .................................................................................. 52
Evaluacin de acciones de correctivas potenciales ........................................... 52
Reportes y recomendaciones ............................................................................ 53
Verificacin de acciones correctivas .................................................................. 58
Mapa conceptual ............................................................................................... 59
Referencia bibliogrfica ..................................................................................... 60
Glosario de trminos.......................................................................................... 61

Anlisis causa raz de la falla

ANLISIS CAUSA RAZ DE LA FALLA

1.

INTRODUCCIN
La ingeniera de confiabilidad y el mantenimiento predictivo tienen dos objetivos
principales: prevenir las fallas catastrficas en los sistemas crticos de una
planta de produccin y evitar las desviaciones del rendimiento de su nivel
aceptable que resulten en prejuicios a las personas, impacto medioambiental,
prdida de la capacidad o baja calidad de los productos. Desafortunadamente,
estos eventos ocurrirn sin importar cuan efectivo sea el programa de
confiabilidad. De all que, un programa viable tambin debe incluir un proceso
de total entendimiento y correccin de las causas races de los eventos que
generan un impacto en el rendimiento de la planta.
Este captulo introduce el concepto del Anlisis Causa Raz de la Falla para
evaluar su aplicacin en la gestin del mantenimiento de una planta industrial.

2.

OBJETIVOS
2.1. OBJETIVO GENERAL
Evaluar la metodologa del Anlisis Causa Raz de la Falla (RCFA)
para implementarlo en la gestin del mantenimiento.
2.2. OBJETIVOS ESPECFICOS

Identificar las ventajas de implementar el RCFA en una


empresa.
Justificar la implementacin del Anlisis Causa Raz para la
solucin de fallas crnicas.

Anlisis causa raz de la falla

3. CONTENIDO

3.1.

Introduccin al anlisis causa raz dela falla

Por Anlisis Causa-Raz de la Falla (RCFA) se entiende cualquier mtodo o tcnica


analtica utilizada para identificar las causas bsicas y las condiciones (factores)
que contribuyen a la ocurrencia de un evento indeseado (accidentes, incidentes,
problemas de "performance", etc.) o tendencias adversas, y las contramedidas
asociadas. Se evala el funcionamiento de sistemas y procesos y no meramente el
desempeo individual. Es una tarea interdisciplinaria que involucra, adems de
profesionales entrenados en las herramientas analticas, al personal ms cercano al
proceso o sistema bajo estudio.
3.1.1. Propsito del anlisis causa raz de la falla
El propsito del RCFA es resolver los problemas que afectan el rendimiento
de la planta. No debe entenderse como un intento para culpar por los
incidentes. Esto debe ser claramente comprendido por el equipo de
investigadores y por quienes estn involucrados en el proceso.
Comprender que la investigacin no es un intento para buscar culpables es
importante por dos razones:
Primero, el equipo de investigaciones debe comprender que el real
beneficio de este mtodo analtico es mejorar la planta.
Segundo, los involucrados en el proceso generalmente adoptan una
actitud de auto-conservacin y asumen que la investigacin es un intento
para encontrar y castigar a la persona o personas responsables de los
incidentes. De all que es importante para los investigadores aliviar ese
temor y reemplazarlo por un esfuerzo positivo de equipo requerido para
resolver problemas.

3.1.2. Uso efectivo del anlisis


El uso efectivo del RCFA requiere disciplina y consistencia. Cada
investigacin debe ser minuciosa y debe seguirse cada paso definido en
este manual.
Tal vez la parte ms difcil del anlisis es separar la realidad de la ficcin. La
naturaleza humana dictamina que cada persona involucrada en un evento o
incidente que requiere un RCFA est condicionada por su experiencia. La
tendencia natural de los involucrados es filtrar la base de datos de entrada
en esta condicin. Esto incluye al investigador. Sin embargo a menudo tales
ideas y percepciones preconcebidas destruyen la efectividad del RCFA.
Es importante para el investigador y el equipo de investigaciones hacer a un
lado sus percepciones, basar el anlisis en puros hechos y no asumir nada.

Anlisis causa raz de la falla

Cualquier suposicin que entre al proceso de anlisis a travs de entrevistas


u otro proceso de acopio de datos debe ser claramente respaldada.
Suposiciones que no pueden ser confirmadas o probadas deben ser
desechadas.

3.1.3. Requerimientos de personal


El personal requerido para evaluar apropiadamente un evento usando RCFA
puede ser completamente materialista. Por ello, este anlisis debera estar
limitado a los casos que verdaderamente justifican el gasto. Muchos de los
costos de ejecutar una investigacin y actuar segn sus recomendaciones
estn ocultos pero no obstante son reales. An un simple anlisis requiere
asignar un investigador al proyecto hasta que sea resuelto. Adicionalmente,
el anlisis requiere involucrar a todo el personal de la planta directa o
indirectamente relacionado con el incidente. El investigador debe conducir
numerosas entrevistas. En adicin, muchos documentos deben ser
acopiados y revisados para extraer informacin relevante.
En investigaciones ms complejas se requiere de un equipo de
investigadores. As como el alcance y la complejidad se incrementan
tambin lo hace el costo.
Como resultado a un elevado requerimiento de personal, el uso general de
esta tcnica debera evitarse. Y debera limitarse a aquellos incidentes o
eventos que tienen un considerable impacto negativo en el rendimiento de la
planta, seguridad de las personas, o acatamiento de las normas.
3.1.4. Cuando usar el mtodo
El uso del RCFA debera ser cuidadosamente analizado antes de lanzarse a
una completa investigacin a causa de los altos costos asociados con la
ejecucin as como en el anlisis profundo. El mtodo considera una
investigacin inicial para clasificar y definir el problema. Una vez que esto
termin, debera considerarse un anlisis completo solo si el evento puede
ser completamente clasificado y definido, y parece que puede encontrarse
una solucin al costo efectivo.
Generalmente el anlisis no es efectuado en problemas que son clasificados
como aleatorios, o eventos no repetitivos. Los problemas que a menudo
justifican el uso del mtodo incluyen equipamiento, maquinaria, o fallas de
sistemas; desviaciones del rendimiento operacional; cuestiones de
rendimiento econmico; seguridad; y asuntos de acatamiento de normas.

Anlisis causa raz de la falla

3.2.

Tcnicas generales de anlisis

Un buen nmero de tcnicas generales es utilizado para resolver problemas. Hay


muchas metodologas que son utilizadas comnmente y tienen coincidencias con
estas tcnicas pero tambin existen diferencias. A continuacin veremos un breve
repaso a los mtodos ms comunes utilizados para realizar un RCFA.
3.2.1. Anlisis de efectos y modo de falla (fmea)
Un anlisis de efecto y modo de falla (FMEA) es un diseo procedimiento
de evaluacin usado para identificar modos de falla potencial y determinar
su efecto sobre el rendimiento de un sistema. Este procedimiento
formalmente documenta prcticas estndares, genera un registro histrico, y
sirve como base para futuras mejoras.
El procedimiento RCFA es una secuencia lgica de pasos, comenzando con
el anlisis de subsistemas de muy bajo nivel o componentes. La figura 1
ilustra un tpico rbol lgico que resulta con un FMEA.

Disciplinas de
confiabilidad
primariamente
cualitativas

Disciplinas de
confiabilidad
primariamente
cuantitativas
Eliminar efectos
de falla

Identificar modos
de falla

Predecir efectos
de la falla
Compensaciones
y acciones
decisivas

Aislar causas de
la falla

Reducir efectos
de falla

Determinar
acciones
correctivas
Aceptar efectos
de falla
Otras tcnicas/
disciplinas
gerenciales

Fig. 1: Diagrama de flujo de un FMEA

El anlisis adopta un punto de vista de la falla e identifica grandes modos


potenciales de falla con sus mecanismos de falla. El efecto de cada modo de
falla luego es rastreado al siguiente nivel del sistema. A cada modo de falla y
su efecto resultante es asignado un rango crtico, basado en la probabilidad
de ocurrencia, su severidad y su delectability. Para reducir las fallas con

Anlisis causa raz de la falla

alto impacto en el rango crtico, se recomienda realizar cambios en el


diseo.
Por consiguiente este procedimiento provee un diseo ms confiable.
Adems del correcto uso del proceso FMEA resultan dos mejoras
principales:
a) Mejora de la confiabilidad anticipndose a los problemas e instituyendo
correcciones previas a producir productos y
b) Mejora de la validez del mtodo analtico, que resulta de una estricta
documentacin de cada paso en el proceso de toma de decisiones.
Dos limitaciones importantes restringen el uso del FMEA:
a) Los rboles lgicos usados para este tipo de anlisis son basados en la
probabilidad de falla en los niveles del componente.
b) Su aplicacin es muy cara.
Los rboles lgicos se fundamentan en la probabilidad de falla, esto es
problema debido a que los datos disponibles sobre probabilidad
componentes corresponden a condiciones estndar y las tcnicas
extrapolacin no pueden ser usadas para modificar los datos
aplicaciones particulares.

un
de
de
en

3.2.2. Anlisis del rbol de fallas


El anlisis del rbol de fallas es un mtodo para analizar la confiabilidad y la
seguridad de un sistema. Esto provee una base objetiva para analizar el
diseo de sistemas, justificar cambios en los sistemas, realizar estudios
trade_off, analizar modos de fallas comunes y demostrar conformidad con
los requerimientos medio ambientales y de seguridad. Esto es diferente a un
FMEA que est restringido a identificar elementos y eventos de un sistema
que generan un evento indeseable en particular.
La figura 2 muestra las etapas involucradas al realizar un anlisis del rbol
de fallas.

Anlisis causa raz de la falla

Definicin de eventos cumbres

Establecemiento de bondades

Comprensin del sistema

Construccin del rbol


de fallas

Analizar el rbol

Toma de acciones correctivas

Fig. 2: Proceso tpico del rbol de fallas

Muchas tcnicas de confiabilidad son inductivas y su objetivo primario es


asegurar que los equipos lleven a cabo su funcin prevista. El anlisis del
rbol de fallas es un detallado anlisis deductivo que usualmente requiere
considerable informacin acerca del sistema. Esto asegura que todos los
aspectos crticos de un sistema sean identificados y controlados. Este
mtodo representa grficamente la lgica Booleana asociado con un
particular sistema de fallas, llamado el evento cumbre, y las fallas bsicas o
causas, llamadas eventos primarios. Los eventos cumbres pueden ser
amplios, abarcando todos los sistemas de fallas o la falla de componentes
especficos. El anlisis provee una visin interior del comportamiento del
sistema
Un modelo del rbol de fallas presenta lgica y grficamente las diferentes
combinaciones de los posibles eventos que ocurran en un sistema que
generaran un evento cumbre. El trmino evento denota un cambio dinmico
de estado que ocurre en un elemento del sistema, el cual incluye equipo,
software, personas, y factores medioambientales.
Un evento falla es un estado anormal del sistema. Un evento normal se
espera que ocurra.

Anlisis causa raz de la falla

La estructura del rbol de fallas se muestra en la figura 3. El evento


indeseable aparece como el evento cumbre y est conectado a ms eventos
de falla bsicos por eventos declaratorios y compuertas lgicas.

OR

Motor
sobrecalentado

Excesiva corriente
del motor

OR

Falla primaria
del motor

Falla del rel


trmico por
no abrirse

OR

Excesiva corriente
en el circuito

Falla primaria del


cableado
( muy delgado)

Falla primaria del


suministro de potencia
(oscilante)

Falla primaria del rel


(cerrado o
sobredimensionado)

Fig. 3: Ejemplo de un rbol lgico del rbol de fallas

3.2.3. Anlisis de la causa y el efecto


El anlisis de Causa y Efecto es una tcnica grfica para analizar fallas.
Este tambin es conocido como el Diagrama de Espina de Pescado (o
fishbone), derivado de la forma del espinazo del pescado, utilizado para
graficar la relacin entre varios factores que contribuyen a un evento
especfico. Tpicamente, el anlisis de espina de pescado grfica las cinco
mejores clasificaciones de causas potenciales (es decir: humana, mquina,
material, metodologa y medio ambiente) pero puede incluir una
combinacin de categoras. La figura 4 ilustra un simple anlisis.
Es uno de los mtodos de anlisis de fallas que ms gusta, esta tcnica
hace uso de una evaluacin lgica de acciones o cambios que generan un
evento especfico, tal como la falla de una mquina. La nica diferencia
entre esta y otros mtodos es el uso de la espina de pescado para describir
las relaciones de causa y efecto entre acciones especficas, o cambios, y el
evento o resultado final.

Anlisis causa raz de la falla

Esta tcnica tiene una seria limitacin. El esquema de espina de pescado no


proporciona una secuencia clara de los eventos que derivan en una falla. En
cambio, muestra todas las posibles causas que pueden contribuir a que
suceda un determinado evento. Mientras es utilizado, no asla los factores
especficos que causan un evento. Otras tcnicas proveen los fundamentos
para aislar los cambios especficos, omisiones o acciones que causan la
falla, una soltura, un accidente u otro evento que est siendo investigado.

Mquina

Humano
No hay entrenamiento

Mala aplicacin
Edad

Error humano

Mantenimiento pobre

No hay supervisin

EFECTO

No hay procedimientos
Temperatura
muy baja

Supervisin pobre

Malos materiales
Mala aplicacin

Muy accidentado

Ninguna exigencia

Error del vendedor

Mtodos

Medio
Ambiente

Materiales

Fig. 4: Diagrama tpico de espina de pescado mostrando sus cinco categoras de


causas

3.2.4. Anlisis de la secuencia de eventos


Algunos programas informticos (como Visio de Microsoft) pueden utilizarse
para generar los diagramas de secuencias de eventos. Como parte del
programa RCFA, se debe: seleccionar un apropiado software, desarrollar un
formato estndar (vea figura 5), y asegurar que se incluya en el diagrama
cada evento que es investigado.
Utilizando tal diagrama desde el inicio de la investigacin ayudar al
investigador a organizar la informacin acopiada, a identificar la prdida o el
conflicto de la mencionada informacin, mejora su entendimiento al mostrar
las relaciones entre eventos e incidentes y hace brillar las causas
potenciales de los incidentes.

Anlisis causa raz de la falla

EVENTOS:
Los eventos son mostrados como cajas
rectangulares, que estn conectadas por flechas
que direccionan el flujo que provee una adecuada
secuencia de eventos.
Cada caja debera contener solo un evento, as
como la fecha y tiempo en que ocurri.
Use palabras precisas, que exprese la realidad sin
CALIFICADORES:
Cada evento debe ser clarificado usando bloques
ovales de datos que provee la data pertinente para
calificar ese evento.
Cada bloque oval debera contener solo un
calificador que provea clarificacin, una nica
restriccin, u otra condicin que pueda influenciar al
evento.
Cada calificador oval debe estar conectado a la caja
de eventos apropiada usando la flecha direccional
FUNCIONES DE FUERZA:
Los factores que podran haber contribuido con el
evento deberan ser mostrados en una caja de
datos hexagonal.
Cada hexgono debe contener una concisa funcin
de fuerza definida.
Las funciones de fuerza deben estar conectadas a
un evento especfico usando una flecha direccional
INCIDENTES:
La caja de incidente contiene una breve declaracin
de la razn de la investigacin.
La caja de incidente debe estar insertada en el
punto apropiado en la secuencia de eventos y
conectada a la caja de eventos usando flechas
direccionales.
SUPOSICIONES:
Factores de contribucin o condiciones sin
confirmar pueden estar incluidas en el diagrama de
flujo
pero
usando
anotaciones.
Este
mtoINCIDENTES:
La caja de incidente contiene una breve declaracin
de la razn de la investigacin.

Evento

Evento

08/97 13:52

08/97 13:56

Calificador
Calificador

Evento
08/97 13:52

Funciones
de Fuerza

Evento
08/97 13:52

Evento
08/97 13:52

Incidente
Evento
08/97 13:52

Supocisiones, preguntas sin


responder u otros datos que esten
relacionados con el evento.
Evento
08/97 13:52

Fig. 5: Smbolos usados en el diagrama de secuencia de eventos

10

Anlisis causa raz de la falla

El diagrama de secuencia de eventos debera ser un documento dinmico


generado inmediatamente despus que el problema es reportado y
continuamente modificado hasta que el evento sea totalmente resuelto. La
fig. 6 es un ejemplo de tal programa.

Operador A de CA notifica
Operador A en Preparacin
08/03/97 06:55 a.m.

Operador A de CA notifica
Operador A en Preparacin
08/03/97 06:55 a.m.

Operador A en el rea de
Preparacin confirma inicio de
la transferencia

Operador A en el rea de
Preparacin confirma inicio de
la transferencia

Operador A en
Preparacin selecciona
el silo # 3
08/03/97 07:25

Operador A en
Preparacin abre
vlvula hacia el silo # 3
08/03/97 07:29

Inicio de la transferencia
de escamas
08/03/97 07:30

Contina la
transferencia de
escamas
08/03/97 07:30 08:00

El manmetro de nivel
tiene un historial con
problemas.
El control de nivel es
cuestionable.

Operador A en
Preparacin inspecciona
el indicador de nivel del
silo # 3
08/03/97 08:01

Silo # 3 se asumi vaco


Problemas en el
Fluidificador A
08/03/97
08:10

Operador A de CA
resetea el interruptor
08/03/97 08:20

Operador A de CA
restaura la transferencia
08/03/97 08:21

La carga
presenta alto
amperaje

Problemas en el
fluidificador A
08/03/97 08:23

Operador A de CA
detiene la transferencia
08/03/97 08:30

El equipo A inspecciona
el transportador
neumtico
08/03/97 10:00

Instrumentista A inspecciona
el manmetro de nivel en el
silo # 3
08/03/97 12:00

Seccin A - 935
completamente bloqueada
con escamas

Lentes del transmisor


cubiertas con escamas

Inundacin del silo # 3


con escamas

Seccin A - 935
completamente bloqueadas
con escamas

Silo # 3 completamente lleno


y con escamas compactadas

Fig. 6: Diagrama tpico de secuencia de evento

El apropiado uso de esta herramienta grfica mejorar grandemente la


efectividad del equipo que solucin de problemas y la precisin de la
evaluacin. Alcanzando el mximo beneficio de esta tcnica, siendo
consistente y minucioso cuando se desarrolla el diagrama. La siguiente gua
debera considerarse cuando se genera un diagrama de secuencia de
eventos: Use un orden lgico, describa los eventos en trminos activos ms
que en pasivos, sea preciso, y defina o califique cada evento o funcin de
fuerza.
En el ejemplo de la figura 6, se ilustran los repetidos tropiezos del
fluidificador usado para transferir escamas desde el departamento de
Acetato Celulosa al rea de preparacin lo cual desat una investigacin. El
diagrama muestra cada evento que describe el intento inicial y secundario
del fluidificador. El evento final, el silo de inspeccin, indic que la causa raz
del problema fue la falla del sistema de monitoreo de nivel. A consecuencia

11

Anlisis causa raz de la falla

de esta falla, el Operador A sobrellen el silo. Cuando esto sucedi, las


escamas compactadas en el silo y almacenadas en el sistema de transporte
neumtico, taponearon la seccin de entrada de la tubera del transportador,
lo cual result en una extensa merma en la produccin mientras se remova
el tapn.
Orden Lgico
Se debe mostrar los eventos en un orden lgico desde el comienzo hasta el
final de la secuencia. Inicialmente el diagrama de secuencia de eventos
debera incluir todos los eventos pertinentes, incluyendo esos que no
pueden ser confirmados. Conforme la investigacin progresa, esto debe
refinarse y mostrar solo los eventos confirmados y relevantes para el
incidente.
Descripciones Activas
Las cajas de eventos en un diagrama de secuencia de eventos deberan
contener las etapas de acciones antes que descripciones pasivas del
problema. Por ejemplo, el evento debera leerse: El Operador A presiona el
botn de encendido de la bomba y no Se encendi la bomba equivocada.
Como regla general, solo un sujeto y un verbo se deben usar en cada caja
de eventos. En vez de decir: El Operador A presion el botn de parada de
la bomba y verific la vlvula alineada, se pueden usar dos cajas de
eventos. La primera caja debera decir: El Operador A presion el botn de
parada y la segunda debera decir: El Operador A verific la vlvula
alineada.
No utilice nombre de personas en el diagrama. En cambio utilice funciones
de trabajo o asigne un cdigo de identificacin para cada persona
involucrada en el evento o incidente. Por ejemplo, tres operadores deberan
designarse como Operador A, Operador B y Operador C.
Precisin
Describa precisa y concisamente cada evento, funcin de fuerza y
calificador. Si no es posible una descripcin concisa y se deben realizar
suposiciones para clarificar, estas deben ser incluidas como anotaciones.
Esto es descrito en la figura 5 e ilustrado en la figura 6. Conforme progresen
las investigaciones, cada suposicin y contribucin no confirmadas del
evento deben ser confirmadas o descontadas. Como resultado se tendr
que cada evento, funcin o calificador sern reducidos a ms descripciones
concisas.
Definicin de Eventos y Funciones de Fuerza
Los calificadores que proporcionan toda la experiencia confirmada o la data
de soporte necesaria para definir con precisin los eventos o funciones de
fuerza deberan incluirse en un diagrama de secuencia de eventos.
Por ejemplo, cada evento debera incluir calificadores de fecha y tiempo que
fijan la estructura de tiempos del evento.

12

Anlisis causa raz de la falla

Cuando los calificadores confirmados no estn disponibles, se supone que


pueden ser usados para definir factores no confirmados o percibidos que
puedan haber contribuido a los eventos o la funcin. Sin embargo, el mayor
esfuerzo debe hacerse durante la investigacin para eliminar las
suposiciones asociadas con la secuencia del diagrama de eventos y
reemplazarlos con factores conocidos.

3.3.

Metodologa del anlisis de la causa raz de la falla

El RCFA es una secuencia lgica de pasos que conducen al investigador a travs


de un proceso de aislamiento de los factores alrededor de un evento o falla.
Una vez que el problema ha sido completamente definido, el anlisis sistemtico
determina el mejor curso de accin que resolvern los eventos y aseguraran que
estos no se repitan. Debido al costo asociado con el rendimiento de tal anlisis,
debera tenerse cuidado antes que la investigacin sea emprendida.
El primer paso en este proceso es obtener una clara definicin del potencial del
problema o evento. El rbol lgico ilustrado en la figura 7 se debera seguir para la
fase inicial de la evaluacin.
3.3.1. Reporte de un incidente o problema
El investigador raramente est presente cuando ocurre un incidente o
problema. De all que el primer paso es la notificacin inicial que un
incidente o problema ha tenido lugar. Tpicamente, este reporte ser verbal,
una breve nota escrita o anotacin en el libro maestro de produccin. En
muchos casos, la comunicacin no contendr una completa descripcin del
problema. Ms bien, ser una breve descripcin de los sntomas percibidos
observados por las personas que reportan el problema.
3.3.1.1. Sntomas y caractersticas
La manera ms efectiva de definir un problema o evento es
determinar sus reales sntomas y establecer los lmites que
caracterizan el evento.
En esta etapa de la investigacin, las tareas pueden ser
acompaadas por entrevistas al personal que observ primero el
problema.

13

Anlisis causa raz de la falla

Notificacin

Notificar al originador
del reporte

Llenar el reporte para


futuras referencias

Implementar acciones
correctivas

Clarificar el
problema

No

Se requiere un
anlisis de la causa
raz?

Yes
Yes

Se aprobaron las
recomendaciones?

Recoger la data que


clarifique el
problema o evento

Recomendaciones
sometidas a aprobacin

Es este
un equipo o
sistema
problemtico?

Yes
Yes

No

Efectuar la
revisin del
diseo

Es posible una
solucin al costo
efectivo?

Archivar para
futuras
referencias

Preparar un anlisis del


costo beneficio

Desarrollar una lista de


acciones correctivas
potenciales

Yes

Se
puede
solucionar
el problema
basndose en la
revisin del
diseo?
No

Yes

Evale la
aplicacin
Continue la
secuencia RCFA

Dinmica de procesos
de prueba

No

Pueden resolverse
los problemas
basndose en la
evaluacin de la
aplicacin?

No

Son los
parmetros actuales
consistentes con el
diseo?

Yes

Fig. 7: rbol lgico inicial del anlisis de la causa raz

14

No

Siga las
sugerencias
alternativas de
RCFA

Anlisis causa raz de la falla

3.3.1.2. Percepcin de las causas de un problema


En este punto, cada persona entrevistada tendr una opinin definida
acerca del incidente, y tendr su descripcin del evento y una lgica
total por lo acontecido. En muchos casos, estas percepciones son
totalmente equivocadas, pero no deben ser descartadas. Aun cuando
muchas opiniones expresadas por la gente involucrada con el evento
o que lo reportan pueden ser no vlidas, no se deben descartar sin
investigar. Cada opinin debe ser registrada y usada como parte de
la investigacin. En muchos casos, una o ms de las opiniones
tendrn la llave de resolucin del evento. Los siguientes son
ejemplos en donde la percepcin inicial fue correcta.

Un ejemplo de este fenmeno es el del problema reportado


en la cmara de bolsas del colector de polvo. El reporte inicial
declar que aire cargado de polvo estuvo siendo emitido de la
cmara de bolsas de forma aleatoria pero repetida, bsicamente. Las
personas que reportaron el problema estaban convencidas que la
causa fue sin duda la falla crnica de la vlvula pilotada actuada por
un solenoide que controla el purgador de la cmara de bolsas. Sin
embargo, con una rpida revisin del diseo se determin que la
vlvula controlada por solenoide esta normalmente cerrada. Este tipo
de vlvula solenoide no puede fallar en posicin abierta, de all que
no puede ser el origen del evento reportado.
Al conversar con el ingeniero de procesos se identific el diafragma
utilizado para sellar el tubo de purga como una fuente potencial de
problemas. Esta observacin junto a la de una inadecuada planta de
aire, cambio a ser la causa raz del problema.

Otro ejemplo que ilustra opiniones preconcebidas es la falla


catastrfica de una cadena transportadora Hefler. En este ejemplo,
todas las barras del lado izquierdo de la cadena fueron severamente
curvadas antes que el sistema pudiera ser paralizado. Aun cuando
ningn objeto extrao tal como un perno fue encontrado, se asumi
que esto fue la causa de la falla. De la evidencia, qued claro que
alguna obstruccin caus el dao al transportador, pero la ms
importante interrogante fue, por qu sucedi esto?
Los transportadores Hefler son diseados con un punto intencional
de falla que debera haber previsto daos mayores ocasionados por
este evento. El diseo del pin de accionamiento principal incluye
un pin de cizallamiento (de sacrificio) que generalmente previene
este tipo de daos catastrficos. Por qu fall el transportador? El
motivo ha sido la remocin de los pines de cizallamiento y su
reemplazo por pernos grado 5.

15

Anlisis causa raz de la falla

3.3.1.3. Formato de reporte de eventos


Uno de los factores que limita seriamente la efectividad del RCFA es
la ausencia de un formato formal de reporte de eventos. El uso de un
formato que describa completamente el potencial del problema o
evento, reduce grandemente el nivel de esfuerzo requerido para
completar un anlisis. Un formato similar al mostrado en la figura 8
provee un nivel mnimo de datos necesarios para determinar el
esfuerzo requerido para solucionar problemas.

3.3.2. Clasificacin del incidente


Una vez que el incidente ha sido reportado, el prximo paso es identificar y
clasificar el tipo de problema. Clasificaciones comunes de problemas son
equipos daados o con fallas, rendimiento de la operacin, rendimiento
econmico, seguridad y conformidad con las normas.
Clasificar los eventos como un tipo particular de problema permite al analista
determinar el mejor mtodo para resolver problemas. Cada clasificacin
mayor requiere de una tcnica RCFA ligeramente diferente, como se
muestra en la figura 9.
Note, sin embargo, que la clasificacin inicial del evento o problema es
tpicamente la parte ms difcil de un RCFA. Adems muchas plantas
carecen de una va formal y un sistema de reportes que detecte con
precisin y defina las desviaciones respecto de las condiciones de operacin
ptima.
3.3.2.1.

Falla o equipo daado

Una mejor clasificacin de los problemas que a menudo justifican un


RCFA son los eventos asociados con la falla del equipo crtico de
produccin, la maquinaria o los sistemas.

16

Anlisis causa raz de la falla

FORMATO DE REPORTE DEL INCIDENTE

Fecha:
Reportado por:
Descripcin del incidente:

Localizacin especfica y Equipo/ Sistema afectado:


Cundo ocurri el incidente? :
Quin estuvo involucrado? :
Cul es la probable causa? :

Qu accin correctiva tom? :

Hubo personas lesionadas? :

No

Fue reportada alguna emanacin? :

No

Clasificacin del incidente:

Falla del equipo

Desacato de normas

Accidente/ lesin

Desviacin del rendimiento

Firma
Fig. 8: Formato tpico de reporte de incidente

EJERCICIO:
Llene el formato de reporte de incidente reportando un caso que Ud. tenga
conocimiento.

17

Anlisis causa raz de la falla

Tpicamente, cualquier incidente que resulte en una falla


parcial o total de la mquina o sistema de procesos, justifica
un RCFA.
Este tipo de incidente puede tener un severo, impacto
negativo en el rendimiento de la planta. De all, esto a
menudo justifica el esfuerzo necesario para evaluar
completamente el evento y determinar la causa raz.
Los eventos que resultan en daos fsicos al equipo de la
planta o los sistemas son los ms fciles de clasificar. Una
inspeccin visual del componente fallado del sistema o
mquina usualmente provee una clara evidencia de su modo
de falla. Mientras la inspeccin no resolver la razn de la
falla, los sntomas o resultados visibles sern evidentes.
Los eventos que tambin afecten otros aspectos (por ejemplo;
seguridad, normatividad, o impacto financiero) deberan ser
investigados automticamente para determinar el impacto
potencial o real del rendimiento de la planta, incluyendo la
confiabilidad del equipo.

Estn la falla o el evento significativo


basados en la tasa de fallas y las
consecuencias de la falla?
Yes

Es causa de
eventos evidentes?

Aclarar problemas
adicionales

No

Yes

Afecta esto la
seguridad?

Afecta esto el
equilibrio
medioambiental?

Afecta esto la
capacidad de
produccin o la
calidad del
producto?

Afecta esto la
capacidad o los
costos?

Result esto en
fallas del equipo?

Yes

Yes

Yes

Yes

Yes

Siga el rbol de
decisin de
seguridad

Siga el rbol de
decisin sobre
medioambiente

Siga el rbol de
decisin de
operaciones

Siga el rbol de
decisin sobre
economa

Siga el rbol de
decisin de fallas
de equipos

Fig. 9: Clasificacin inicial de eventos

18

Anlisis causa raz de la falla

En la mayora de los casos, la mquina fallada debe ser


reemplazada inmediatamente para minimizar su impacto en la
produccin. Si este es el caso, puede ser beneficioso evaluar
el sistema circundante al incidente.
3.3.2.2. Rendimiento operacional
Las desviaciones del rendimiento operacional pueden ocurrir
sin la falla fsica del sistema o equipo crtico de produccin.
Las desviaciones crnicas pueden justificar el uso del RCFA
como un medio para resolver problemas recurrentes.
Generalmente, problemas crnicos relativos a la calidad o
capacidad de los productos requieren un completo RCFA. Sin
embargo, se debe tener mucho cuidado para asegurar que
estos problemas son recurrentes y tienen un impacto
significativo en el rendimiento de la planta antes de utilizar
esta tcnica de solucin de problemas.
Calidad de la Produccin
Las desviaciones que por primera vez atraviesan la calidad de
los productos son candidatos principales para un RCFA, el
cual puede ser usado para resolver muchos problemas
relativos a la calidad. Sin embargo, el anlisis no debe ser
utilizado para todos los problemas de calidad. Las
desviaciones no recurrentes o aquellas que no tienen un
impacto significativo en la capacidad o los costos no son
aplicaciones efectivas del costo.
3.3.2.3. Rendimiento econmico
Las desviaciones del rendimiento econmico, tal como una
alta produccin o elevados costos de mantenimiento, con
frecuencia justifican el uso del RCFA. El rbol de decisin y
las etapas especficas requeridas para resolver estos
problemas varan dependiendo del tipo de problema y su
causa o funcin de fuerza.
3.3.2.4. Seguridad
Cualquier evento que tenga potencial para causar perjuicios a
las personas debera investigarse inmediatamente. Mientras
los eventos en esta clasificacin justifican un completo RCFA,
ellos deben resolverse tan pronto como sea posible.
Aislar la causa raz de los eventos o accidentes que causan
lesiones generalmente es ms difcil que para las fallas de los
equipos y requiere una tcnica diferente de solucin de
problemas. La primera razn para este incremento en la
dificultad es que la causa es a menudo subjetiva.

19

Anlisis causa raz de la falla

3.3.2.5. Acuerdo regulatorio


Cualquier evento de acuerdo regulatorio puede tener un
potencial impacto en la seguridad de los trabajadores, el
medio ambiente, as como en la continuidad de la operacin
de la planta. De all, que cualquier evento que resulta en una
violacin de las concesiones medioambientales u otras guas
de acuerdos medioambientales (por ejemplo, Seguridad
Ocupacional y Administracin de la Salud OSHA, Agencia de
Proteccin Medioambiental, y regulaciones estatales) debera
ser investigado y resuelto tan pronto como sea posible.

3.3.3. Acopio de la data


La etapa de acopio de la data debe clarificar el problema o evento reportado.
Esta fase de evaluacin incluye entrevista con el personal apropiado, reunir
evidencia fsica, y conducir otras investigaciones, as como ejecutar una
secuencia de anlisis de los eventos, lo cual es necesario para proveer un
claro entendimiento del problema. Note que esta seccin enfoca
primeramente los incidentes de falla o los daos en los equipos.
3.3.3.1. Entrevistas
El proceso de entrevistas es el mtodo primario utilizado para
establecer las condiciones extremas reales de un incidente y
es parte de la clave de una investigacin. Es crucial para el
investigador ser un buen oyente con buenas habilidades de
entrevistador y diplomacia.
Para incidentes significativos, todo el personal clave debe ser
entrevistado y as conseguir un panorama completo del
evento. En adicin a los directamente involucrados en el
evento o incidente, se deben entrevistar a aquellos individuos
que tengan conocimiento directo o indirecto de algo que
pueda clarificarlo. La siguiente es una lista parcial de
entrevistas:
Todo el personal directamente involucrado en el incidente
(asegure la revisin de cualquier declaracin escrita de un
testigo).
Supervisores y gerentes involucrados en el incidente
(incluir al gerente de contratos).
Personal que no est directamente involucrado en el
incidente pero que tiene un conocimiento o experiencia
similar.
Expertos en aplicaciones tcnicas, personal entrenado, y
vendedores de equipo, suministradores, o fabricantes.

20

Anlisis causa raz de la falla

Note que esto es extremadamente importante para el


investigador transmitir el mensaje del propsito de una
entrevista es buscar hechos no buscar faltas. El trabajo de
un investigador es simplemente determinar lo que realmente
est sucediendo y por qu est sucediendo. Es importante
para el entrevistador exponer al entrevistado claramente la
razn de la evaluacin, durante el inicio de la entrevista. El
personal de planta debe entender y creer que la razn de la
evaluacin es encontrar el problema. Si ellos creen que el
proceso intenta buscar culpables, se tendrn pocos
beneficios.
Tambin es necesario verificar la informacin derivada del
proceso de entrevistas. Un medio de verificacin es la
observacin visual de las prcticas reales utilizadas por los
equipos de produccin y mantenimiento asignados al rea
que est siendo investigada.
Preguntas Efectuadas
Para escuchar ms efectivamente el entrevistador debe
prepararse para la entrevista, y preparar las ayudas evitando
prdidas de tiempo.
La preparacin de las interrogantes o una lista de tpicos por
discutir ayuda a mantener la entrevista encaminada y
previene que el entrevistador olvide realizar preguntas de
temas claves.
La figura 10 es una hoja de flujo resumida del proceso de
entrevista.
Cada entrevista debera ser conducida para
respuestas claras de las siguientes interrogantes:

obtener

Qu sucedi?
Dnde sucedi?
Cundo sucedi?
Qu cambi?
Quin estuvo involucrado?
Por qu pas?
Cul es el impacto?
Pasar de nuevo?
Cmo puede prevenirse la repeticin?

Qu sucedi?
Clarificar lo que realmente pas es un requisito esencial de
RCFA. Como se discuti antes, la tendencia natural es dar las
percepciones en lugar de definir cuidadosamente el evento
real.

21

Anlisis causa raz de la falla

Es importante incluir con mucho detalle tanto los hechos y


Los datos disponibles.

Entreviste a todo el personal directa


e indirectamente involucrado en el
evento.
Recoja la evidencia fsica que
confirmar el modo de falla.

Preserve toda la evidencia fsica y


complete los documentos de la
escena de los eventos. Figuras,
dibujos y videos son herramientas
tiles.

Clarificar el evento

Qu sucedi?

Defina claramente los eventos


especficos, fallas o incidentes.

Identifique la mquina, sistema o


rea especfica donde ocurri el
evento. Tambin ocurri esto en
unidades similares o es especfico
de esta localizacin?.

Dnde sucedi esto?


La habilidad para fijar una referencia
absoluta del momento de ocurrencia
de
los
eventos
mejorar
grandemente el anlisis.

Coleccione todos los datos que


definan el medio ambiente antes,
durante y despus del evento. La
data debera incluir todas las
operaciones, mantenimientos, y
variables medioambientales.

Defina claramente la estructura


de tiempos y la secuencia de los
eventos
Cundo sucedi?

Qu cambi?

Quin estuvo involucrado?

Enliste todos los cambios en el


producto, las prcticas, los
procedimientos, el entorno, etc.
Que puedan contribuir con el
evento.

Difina a todo el personal directa o


indirectamente involucrado en el
evento. Includa la gerencia y la
supervisin del rea afectada.

Cul es el impacto?
Cuantifique en trminos de
lesiones, confiabilidad o finanzas,
el impacto del evento.
Suceder otra vez?

Puede prevenirse la
recurrencia?

Determine la probabilidad de
recurrencia del evento o eventos
similares.
Determine
como
evitar
la
recurrencia del evento o eventos
similares.

Fig. 10. El proceso de entrevista.

22

Anlisis causa raz de la falla

Dnde Sucedi?
Una descripcin clara de la localizacin exacta de los eventos
ayudar a aislar y resolver los problemas. Adems de la
localizacin, se debe determinar si el evento tambin ocurri
en un lugar o sistema similar. Si se eliminan las aplicaciones o
mquinas similares, el evento puede a veces aislar una (o una
serie) funcin(o funciones) de fuerza totalmente nica(s) de
localizar.
Por ejemplo, si la bomba A fall y las bombeas B, C, y D del
mismo sistema no lo hicieron, esto indica que la causa de la
falla est probable y nicamente en la Bomba A. Si las
bombas B, C, y D exhiben sntomas similares, entonces, es
muy probable que la causa sea sistmica y comn a todas las
bombas.
Cundo Sucedi?
Aislar el momento especfico en que un evento ocurri mejora
grandemente la posibilidad del investigador de determinar su
fuente. Cuando se conoce la estructura real de tiempo de un
evento, es muy ms fcil de cuantificar los procesos, las
operaciones, y otras variables que pueden guarden relacin
con el evento.
Sin embargo, en algunos casos (por ejemplo, desviaciones de
producto-calidad), es difcil de precisar el inicio y la duracin
del evento. Muchos de las acciones destinadas a monitorear y
rastrear los registros no proporcionan el nivel de detalle
exigido para determinar el tiempo de este tipo de incidentes.
En estos casos, el investigador debe evaluar la historia de
operacin del rea del proceso afectado para determinar si es
posible encontrar un patrn que fije apropiadamente la
estructura de tiempos del evento. Este tipo de investigacin,
en la mayora de los casos, aislar el cronometrado de los
eventos como sigue:

La produccin de un producto especfico.

El programa de trabajo de un equipo de operacin


especfico.

Los cambios en el medio ambiente.


Qu Cambi?
Las fallas de los equipos y las grandes desviaciones respecto
de los niveles de rendimiento aceptables no necesariamente
suceden. En cada caso, las variables especficas, simples o
en combinacin, causaron que el evento ocurra. Por
consiguiente, es esencial que todos los cambios que
ocurrieron en conjuncin al evento sean definidos.

23

Anlisis causa raz de la falla

No importa cul evento fue (es decir, falla de equipo, derrame


al medio ambiente, un accidente, etc.), la evaluacin debe
cuantificar todas las variables asociadas con el evento. Estos
datos deben incluir parmetros de la operacin; las variables
de la produccin, como la viscosidad, la densidad, la razn de
flujo, y as sucesivamente; y el medio ambiente. Si es posible,
los datos tambin deben incluir informacin del mantenimiento
predictivo asociado con el evento.
Quin Estuvo Involucrado?
La investigacin debe identificar a todo el personal
involucrado, directamente o indirectamente, en el evento. Las
fallas y los eventos a menudo son el resultado del error
humano o de habilidades inadecuadas. Sin embargo,
recuerde que el propsito de la investigacin es resolver el
problema, no buscar culpables.
Todos los comentarios o declaraciones derivadas de esta
parte de la investigacin debe ser impersonal y totalmente
objetiva. A todas las referencias sobre el personal
directamente involucrado en el incidente se les debe asignar
un cdigo u otro identificador, como por ejemplo Operador A o
Tcnico de mantenimiento B.
Esta tcnica le ayudar a reducir el miedo al castigo de todos
aqullos directamente involucrados en el incidente. Adems,
reduce el prejuicio u opinin preconcebida sobre los
individuos dentro de la organizacin.
Por qu Sucedi?
Si las preguntas precedentes fueron debidamente
contestadas, entonces puede ser posible resolver el incidente
sin una investigacin adicional. Sin embargo, asegrese que
el real problema se ha identificado. Es demasiado fcil mal
interpretar los sntomas o percepciones sin un completo
anlisis.
A estas alturas, genere una lista de lo que puede haber
contribuido al problema reportado. La lista debe incluir todos
los factores, reales y supuestos.
Esta etapa es crtica en el proceso. En muchos casos, varios
factores, muchos de ellos triviales, se combinan para causar
un serio problema.
Todas las suposiciones incluidas en esta lista de posibles
causas deben ser claramente anotadas, como deben serlo
todas las causas comprobadas. Un anlisis de la sucesin de
eventos proporciona un medio para separar los hechos de la
ficcin durante el proceso del anlisis.

24

Anlisis causa raz de la falla

Cul es el Impacto?
La evaluacin debe cuantificar el impacto del evento antes de
embarcarse en un completo proceso RCFA. Dicho de otra
forma, no todos los eventos, incluso los que son repetitivos,
justifican un anlisis completo. Esta parte del proceso de
investigacin debe ser tan verdadera como sea posible.
Aunque a estas alturas no todos los detalles estn
disponibles, se intenta evaluar el impacto real o potencial del
evento.
Pasar De nuevo?
Si las entrevistas preliminares determinan que el evento es no
recurrente, el proceso puede discontinuarse en este punto.
Sin embargo, antes de tomar esta decisin debe efectuarse
una revisin minuciosa de los archivos histricos asociados
con la mquina o el sistema involucrado en el incidente.
Asegrese que el evento es no recurrente antes de
discontinuar la evaluacin.
Todos los eventos reportados deberan ser registrados y los
respectivos archivos guardados para futuras referencias. Para
los incidentes calificados como no recurrentes debe
establecerse un archivo que retenga todos los datos e
informaciones desarrollados en las etapas precedentes. De
ocurrir nuevamente el evento o uno similar, estos archivos
son una herramienta inestimable de investigacin.
Debe conducirse una completa investigacin en todos los
eventos que tienen una historia de repeticin peridica, o una
probabilidad alta de repeticin, y un impacto significativo en
los trminos de lesin, confiabilidad, o economa. En
particular, deben investigarse todos los incidentes que tienen
un alto potencial en cuanto a lesin del personal o violacin
de las normas.
Cmo puede Prevenirse la Repeticin?
Aunque sta es la prxima interrogante lgica por hacer,
generalmente no puede contestarse hasta que se haya
completado enteramente el RCFA. Note, sin embargo, que si
este anlisis determina que no es econmicamente factible
corregir el problema, el personal de la planta tiene
simplemente que aprender a minimizar su impacto.

25

Anlisis causa raz de la falla

3.3.3.2.

Los tipos de entrevistas

Una de las preguntas por contestar al prepararse para una


entrevista es: Qu tipo de entrevista se necesita para esta
investigacin? Las entrevistas pueden agruparse en tres tipos
bsicos: Uno-a-uno, dos-en-uno, y reunin de grupo.
Uno-a-uno:
La entrevista es muy simple por dirigir, y es dnde el
investigador entrevista a cada persona en lo necesario para
clarificar el evento. Este tipo de entrevista debe sostenerse en
un lugar privado sin ninguna distraccin. En los casos dnde
se requiere una reconstruccin detallada de los hechos, la
entrevista puede sostenerse en el lugar de trabajo.
Dos-en-uno:
Cuando se estn investigando incidentes polmicos o
complejos, puede ser aconsejable tener dos entrevistadores
presentes al reunirse con uno de los individuos. Con dos
investigadores; uno puede hacer las preguntas mientras el
otro registra la informacin. Los entrevistadores deben
coordinar su interrogatorio y deben evitar agobiar o intimidar
al entrevistado.
Al final de la entrevista, los entrevistadores deben comparar
sus impresiones de la entrevista y deben alcanzar un acuerdo
general de sus puntos de vista. La ventaja de la entrevista
dos-en-uno es que debe eliminarse las percepciones
personales de un solo entrevistador del proceso de la
investigacin.
La Reunin de Grupo:
Una entrevista de grupo es ventajosa en algunos casos. Este
tipo de reunin, o ejercicio grupal de resolucin de problemas,
es til para obtener un intercambio de ideas de varias
disciplinas (es decir, mantenimiento, produccin, ingeniera,
etc.). Tal intercambio puede ayudar en la resolucin de un
evento o problema.
Esta tcnica tambin puede usarse cuando el investigador ha
completado su evaluacin y quiere revisar los resultados con
aqullos involucrados en el incidente. El investigador podra
considerar las entrevistas como un punto clave que da
testimonio y que permite verificar la sucesin de eventos y las
conclusiones antes de presentarlos en la reunin de grupo.
El investigador debe actuar como el facilitador en este
proceso resolucin de problemas y debe usar la secuencia del
diagrama de eventos como la herramienta de trabajo para la
reunin.

26

Anlisis causa raz de la falla

No pueden realizarse las entrevistas de grupo en un ambiente


hostil. Si el problema o el evento son polmicos o polticos,
este tipo de proceso de entrevistas no es beneficioso.
Generalmente las agendas personales de los participantes
evitan resultados positivos.
3.3.3.3. Coleccin de evidencia fsica
La primera prioridad cuando se investiga un evento que
involucra la falla o el dao de un equipo es conservar la
evidencia fsica. La figura 11 es un diagrama de flujo que
ilustra los pasos involucrados en la investigacin del equipo
que fall. Este esfuerzo debe incluir todas las tareas y
actividades requeridas para evaluar completamente los
modos de fallas y determinar las limitaciones especficas que
condicionaron la ocurrencia de la falla.
Si fuera posible, se debe aislar del servicio la mquina y su
sistema instalado hasta que pueda dirigirse una completa
investigacin. Al levantarla del servicio, la mquina y todos
sus componentes deben guardarse en un rea segura hasta
que puedan inspeccionarse totalmente y se formulen pruebas
apropiadas.
Si esta sugerencia no se puede realizar, entonces se debe
documentar por completo el escenario de la falla antes que la
mquina sea removida de su actual ubicacin. Deben
documentarse fotografas, bocetos, e instrumentacin y
control para asegurar que todos los datos sean conservados
para el equipo que investiga. Los reportes automticos, as
como aqullos generados por el sistema de control
computarizado, deben obtenerse y conservarse.
Los acpites exigidos para coleccionar informacin y la
evidencia fsica para la investigacin pueden ser bastante
extensos.
La siguiente es una lista parcial de la informacin que debe
recogerse:
Procedimientos de mantenimiento (SMP) y estndares de
operacin (SOP) normalmente acordados para la mquina o
el rea donde ocurri el evento.
Polticas de la compaa que orientan las actividades
realizadas durante el evento.
Datos de operacin y los procesos (por ejemplo, cartas de
despiece, salida de la computadora, y datos informacin del
registrador).
Registros apropiados de mantenimiento de la maquinaria o
rea involucrada en el evento.
Copias del libro maestro, paquetes de trabajo, rdenes de
trabajo, permisos de trabajo, y archivos de mantenimiento; los

27

Anlisis causa raz de la falla

resultados de pruebas al equipo, los informes de control de


calidad; resultados de anlisis de lubricacin y aceites; temas
de vibracin; y otros archivos.
Diagramas, esquemas, dibujos, manuales del vendedor, y
especificaciones
tcnicas,
incluyendo
informacin
correspondiente al diseo del sistema o rea involucrada en
el incidente.
Registros de entrenamientos, copias de los cursos de
entrenamiento, y otra informacin que muestre los niveles de
desarrollo del personal incluido en el evento.
Fotografas, vdeos, o diagramas de la escena del
incidente.
Componentes
malogrados
(por
ejemplo,
las
empaquetaduras rotas, soldadura quemada, fusibles
soplados, los rodamientos fallados).
Condiciones medioambientales cuando el evento ocurri.
Estos datos deben estar tan completos y exactos como sea
posible.
Copias de los informes de anteriores incidentes en eventos
similares e historia o informacin de la tendencia del rea
involucrada en el actual incidente.

3.3.3.4. Secuencia de anlisis de los eventos


Realizar un anlisis de la secuencia de eventos y trazar
grficamente las acciones que conllevan y siguen a un
evento, accidente, o falla ayudar a visualizar lo que pas. Es
importante usar tal esquema de acciones desde el comienzo
de la investigacin. Esto no slo ayudar con la organizacin
de la informacin sino tambin a identificar los datos faltantes
o contradictorios, a mostrar las relaciones entre los eventos, y
a resaltar las causas potenciales del incidente.

28

Anlisis causa raz de la falla

EQUIPO O
COMPONENTE QUE
FALLADO
Notificacin de la falla

Aclarar el evento

Preservar la
evidencia fsica

Definir acciones
correctivas
potenciales

Recolectar la
documentacin de
apoyo

Evaluar los
componentes
fallados

Preparar anlisis
costo beneficio

Entrevistar a todo el
personal involucrado

Dinmicas de
pruebas del sistema

Diagrama de
desarrollo de la
secuencia de eventos

Es evidente
la causa raz?

Hay una
solucin
efectiva al
costo?
Yes

Verificar la causa por


testeo

No

Archivar
documentos
para uso
futuro

No

Archivar
documentos
para uso
futuro

Yes

Preparar reportes y
recomendaciones
No

Revisin del diseo

No

Confirm la
causa raz?

Someter
recomendaciones
para aprobacin

Evaluar la instalacin

Evaluar las prcticas


de operacin

Fue aprobado lo
recomendado?

Evaluar las prcticas


de mantenimiento
Yes

Desarrollo potencial
de la causa raz

Implementar
acciones correctivas

Verificar la causa por


testeo
Pruebas para verificar
la correccin
Demande asistencia
del grupo de ingeniera
en confiabilidad

No

Confirm la
causa raz?

Yes

Fig. 11: Diagrama de flujo de la investigacin de la falla del equipo

3.3.3.5. La revisin del diseo


Es esencial entender claramente los parmetros de diseo y
las especificaciones de los sistemas asociadas con un evento
o falla del equipo. A menos que el investigador comprenda
con precisin lo que la mquina o sistema de produccin fue
diseado para hacer y sus limitaciones inherentes, es
imposible aislar la causa raz del problema o evento. La
informacin obtenida al revisar el diseo proporciona una

29

Anlisis causa raz de la falla

lnea base o referencia que se necesita para investigar y


resolver los problemas de la planta.
El objetivo de la revisin del diseo es establecer las
caractersticas de operacin especficas de la mquina o
sistema de la produccin involucrados en el incidente. La
evaluacin debe definir claramente la funcin o funciones
especficas para las que cada mquina y sistema fueron
diseados. Adems, la revisin debe establecer el lmite o
rango de operacin aceptable que la mquina o sistema
puede tolerar sin una desviacin considerable del rendimiento
de diseo.
La lgica usada para una revisin comprensiva es similar a la
del anlisis de efectos y modos de fallas y al anlisis del rbol
de fallas con los que se piensa identificar las variables de
contribucin. A diferencia de otras tcnicas diferentes que
usan complejas tablas de probabilidad y desglosan cada
mquina al nivel de componentes, el RCFA toma un
acercamiento ms prctico. La tcnica est basada en los
datos prontamente disponibles, y aplicaciones especficas
para determinar las variables que pueden causar o contribuir
a un incidente.
Mientras que el nivel de detalle requerido para una revisin
del diseo vare dependiendo del tipo de evento, esta etapa
no se puede omitir de ninguna investigacin. En algunos
casos, el proceso puede limitarse a una revisin superficial
del manual de ventas de operacin y mantenimiento (O&M) y
a caractersticas del rendimiento. En otros casos, una
evaluacin completa incluir todo lo obtenido, datos operacin
y diseo que puedan conseguirse.
3.3.3.6. Datos mnimos de diseo
En muchos casos, la informacin requerida puede obtenerse
de cuatro fuentes: de las placas de los equipos, de las
especificaciones durante la obtencin, especificaciones del
vendedor, y de los manuales de O&M proporcionados por los
vendedores.
Si el investigador tiene una comprensin razonable de la
dinmica de la mquina, puede lograrse una revisin
minuciosa del diseo para sistemas de produccin
relativamente simples (por ejemplo, sistema de bombeo) con
los datos proporcionados por solo estos cuatro documentos.
Debe prestarse especial atencin a la gua de solucin de
problemas del vendedor. Estas sugerencias proporcionarn el
entendimiento de las causas ms comunes de
comportamiento anormal y modos de fallas.

30

Anlisis causa raz de la falla

3.3.3.7. Datos de placa del equipo


La mayora de la maquinaria, los equipos, y los sistemas
usados en las plantas de procesos tienen una placa de datos
permanentemente pegada que define sus parmetros
nominales de operacin. Por ejemplo, la placa de datos de
una bomba centrfuga incluye su razn de flujo, presin total
de descarga, gravedad especfica, dimetro del impulsor, y
otros datos que definen su diseo. Estos datos pueden usarse
para determinar si el equipo es apropiado para la aplicacin y
si est operando dentro su rango de diseo.
3.3.3.8. Especificaciones de obtencin
Normalmente las especificaciones de obtencin del equipo
son preparadas para todo equipo importante como parte del
proceso adquisitivo. Estos documentos definen las
caractersticas especficas y los rangos de operacin
solicitados por el equipo de ingeniera de la planta.
Las especificaciones proporcionan informacin til para
evaluar el equipo o sistema durante la investigacin.
Cuando las especificaciones de obtencin no estn
disponibles, los registros de compra deberan describir el
equipo y proporcionar las caractersticas del sistema. Aunque
si bien la data puede estar limitada a un tipo o modelo
especfico de mquina, en general es til esta informacin.
3.3.3.9. Especificaciones de venta
En la mayora de equipos que forman parte de un proyecto
importante, se debe disponer de un juego detallado de
especificaciones
de
venta.
Generalmente,
estas
caractersticas tcnicas se incluyen en la propuesta del
vendedor y son entregadas como parte de lo necesario para
el proyecto. Normalmente, estos registros estn en un archivo
en dos departamentos diferentes: compras e ingeniera.
Como parte de la revisin del diseo, las especificaciones de
obtencin y de venta se deben comparar cuidadosamente.
Muchos de los problemas crnicos que plagan las plantas son
el resultado directo de desviaciones de las especificaciones
de venta respecto de las de obtencin. Mediante una
comparacin cuidadosa de estos dos documentos se pueden
descubrir las causas races de problemas crnicos.
3.3.3.10. Manuales de operacin y mantenimiento
Los manuales de O&M son unas de las mejores fuentes de
informacin. En la mayora de los casos, estos documentos
proporcionan recomendaciones especficas sobre el
apropiado funcionamiento y mantenimiento de la mquina,

31

Anlisis causa raz de la falla

equipo, o sistema. Adems, muchos de estos manuales


proporcionan guas para la solucin de problemas especficos
que puedan ocurrir. Una revisin completa de estos
documentos es esencial antes de empezar el RCFA. La
informacin proporcionada en estos manuales es esencial
para solucionar eficazmente los problemas de la planta.
3.3.3.11. Revisin del diseo
El objetivo de la revisin del diseo es determinar las
limitaciones del diseo, el entorno de operacin aceptable, los
modos probables de falla, y los ndices especficos que
cuantifican la condicin de operacin real de la mquina,
equipo, o sistema del proceso que se investiga. Como
mnimo, la evaluacin debe determinar la funcin de diseo y
especficamente para que se dise la mquina o sistema. La
revisin debe definir claramente las funciones especficas del
sistema y sus componentes.
Para definir completamente las funciones de la maquinaria, el
equipo, o sistema, se debera incluir una descripcin de las
especificaciones de entrada y salida del producto, del trabajo
que llevar a cabo y del entorno operacional aceptable. Por
ejemplo, una bomba centrfuga puede disearse para
entregar 1 000 galones por minuto de agua que tiene una
temperatura de 100F y una presin en la descarga d e 100
libras por pulgada al cuadrado.
Especificaciones del producto de entrada.
Las funciones de la mquina y del sistema dependen del
producto entrante a ser manejado. Por consiguiente, la
revisin del diseo debe establecer las limitaciones del
producto entrante usado en el proceso de diseo. En muchos
de los casos, estos lmites incluyen rango de temperatura,
densidad o gravedad especfica, volumen, presin y otros
parmetros medibles. Estos lmites determinan la cantidad de
trabajo que la mquina o el sistema debe proveer.
En algunos casos, las condiciones de lmite son absolutas. En
otros, hay un rango aceptable para cada una de las variables.
La revisin debe definir claramente los lmites aceptables
utilizados en el diseo del sistema.
Especificaciones del Producto de salida.
Asumiendo que las condiciones de lmite del producto
entrante son reales, la investigacin debe determinar qu
rendimiento el sistema fue diseado a entregar. Como con el
producto entrante, el rendimiento de la mquina o sistema
puede estar limitado por parmetros especficos,
mensurables. El flujo, la presin, la densidad, y la temperatura
son sin embargo las mediciones comunes del producto de

32

Anlisis causa raz de la falla

salida. Sin embargo, dependiendo del proceso, puede haber


muchos otros.
Trabajo a ser Realizado.
Esta parte de la revisin del diseo debe determinar el trabajo
mensurable a ser realizado por la mquina o sistema. La
eficiencia, la potencia utilizada, la prdida de producto, y otros
parmetros similares son utilizados para definir esta parte de
la revisin. Los parmetros reales variarn, dependiendo de la
mquina o sistema. En la mayora de los casos, las
especificaciones originales del diseo proveern los
parmetros apropiados del sistema bajo investigacin.
Condiciones de Operacin Aceptable.
La parte final de la revisin del diseo es definir las
caractersticas de operacin aceptable de la mquina o
sistema. Cada mquina o sistema se disea para operar
dentro de un rango especfico, o condiciones de operacin.
Estas condiciones incluyen la variacin mxima del producto
entrante, velocidades de encendido acelerado y parada
brusca, medio ambiente y una variedad de otros parmetros.
3.3.3.12. Revisin de la aplicacin y el mantenimiento
El prximo paso en el RCFA es revisar la aplicacin y
asegurar que la mquina o sistema est usndose en la
aplicacin apropiada. Los datos recogidos durante la revisin
del diseo deberan usarse para verificar la aplicacin. El
registro de mantenimiento tambin debera ser revisado.
En plantas donde mltiples productos son producidos por la
mquina o sistema del proceso que se investiga, es esencial
que el rango de aplicacin total se evale. La evaluacin debe
incluir todas las variaciones de las caractersticas de
operacin sobre el rango total de productos que se producen.
La razn de que esto sea tan importante es que muchos de
los problemas que sern investigados se relacionan
directamente a uno o ms procesos que son nicos de ese
producto. A menos que el rango total de operacin sea
evaluado, hay un potencial de que la causa raz del problema
permanezca oculta.
Los factores a evaluar en una revisin de la aplicacin y del
mantenimiento incluyen la instalacin, las condiciones de
operacin, las prcticas y los procedimientos que operacin
(es decir, procedimientos estndares contra las prcticas
reales), historiales, as como procedimientos y prcticas de
mantenimiento.

33

Anlisis causa raz de la falla

La Instalacin.
Cada mquina y sistema tiene criterios especficos de
instalacin que deben ser seguidos antes de alcanzar y
sostener niveles aceptables de confiabilidad. Estos criterios
varan con el tipo de mquina o sistema y deberan ser
verificados como parte del RCFA.
Usando la informacin desarrollada como parte de la revisin
del diseo, el investigador u otros individuos calificados deben
evaluar la instalacin real de la mquina o sistema que se
investigan. Como mnimo, una inspeccin visual minuciosa de
la mquina y su sistema deberan conducir a la determinacin
de s la instalacin impropia est contribuyendo al problema.
Los requisitos de la instalacin variarn, dependiendo del tipo
de mquina o sistema.
Deben prepararse fotografas, bocetos, o dibujos de la
instalacin real como parte de la evaluacin. Ellos deben
apuntar cualquier desviacin de las prcticas de instalacin
aceptables o recomendadas definidas en los documentos de
referencia y las buenas prcticas de ingeniera. Estos datos
pueden usarse despus en el RCFA cuando se consideran
las acciones correctivas potenciales.
Condiciones de Operacin.
Evaluar la condicin real de operacin del sistema de
produccin asociado con el evento investigado es muy difcil.
La mejor tcnica es determinar todas las variables y lmites
usados en una produccin normal. Por ejemplo, defina el
rango completo de velocidades en que opera, la razn de
flujo, las variaciones del producto de entrada, y lo que al
parecer este asociado con el sistema. En aplicaciones con
velocidad variable, determine las oscilaciones mnimas y
mximas usadas por los operadores.
Prcticas y Procedimientos de operacin.
Esta parte la revisin de la aplicacin/mantenimiento consiste
en evaluar los procedimientos de operacin estndares as
como tambin las prcticas de operacin reales. La mayora
de las reas de produccin mantienen algunos datos
histricos que describen su rendimiento y sus prcticas. Estos
registros pueden consistir en el libro maestro, informes, o
datos en la computadora. Estos datos deben revisarse para
determinar las prcticas reales de produccin que son
utilizadas para operar la mquina o el sistema que se
investiga.
Los sistemas que usan un sistema de control y monitoreo por
ordenador tendrn la mejor base de datos para esta parte de
evaluacin. Muchos de estos sistemas automticamente

34

Anlisis causa raz de la falla

almacenan y, en algunos casos, imprimen reportes a cierta


frecuencia que definen la evolucin del proceso real para
cada tipo de producto producidos por el sistema. Esta fuente
inestimable de informacin debe evaluarse cuidadosamente.
Procedimientos Estndares de Operacin
Standard Operating Procedures: SOP )

Evale los procedimientos estndares de operacin del rea o


sistema afectados para determinar si ellos son consistentes y
adecuados para la aplicacin. Dos fuentes de referencia, el
reporte de revisin del diseo y los manuales de O&M del
vendedor, son necesarias para completar esta tarea.
Adems, evale los SOPs para determinar si ellos son
utilizables por operadores. Revise la organizacin, el
contenido y la sintaxis para determinar si el procedimiento es
correcto y entendible.
Procedimientos de Puesta a punto.
Debe prestarse una especial atencin a los procedimientos de
puesta a punto para cada producto producido por una
mquina o sistema del proceso.
La puesta a punto impropia o incoherente de un sistema es
causa principal de una baja calidad del producto, de
restricciones en la capacidad, y de equipo no confiable. Los
procedimientos deben proporcionar un claro, y fcil
entendimiento de las instrucciones que aseguran una exacto,
y repetible puesta a punto para cada tipo de producto. Si no
es as, las desviaciones deben anotarse para una evaluacin
adicional.
Procedimientos Transitorios.
Los procedimientos transitorios, como el encendido, el cambio
de velocidad, y la paralizacin total, tambin deben evaluarse
cuidadosamente. stos son, los predominantemente
transitorios, los que causan las desviaciones en la calidad y
capacidad y tienen un impacto directo en la confiabilidad de
equipo. Los procedimientos deben evaluarse para asegurar
que ellos no violen las condiciones de operacin o las
recomendaciones del vendedor. Deben definirse todas las
desviaciones con claridad para una evaluacin adicional.
Prcticas de Operacin.
Esta parte de la evaluacin debe determinar si los SOPs
fueron entendidos y seguidos antes y durante el incidente o
evento. La tendencia normal de los operadores es evadir los
procedimientos, lo cual es una razn para muchos problemas.

35

Anlisis causa raz de la falla

Adems, los procedimientos inciertos


entendimiento y un empleo perjudicial.

llevan

mal

Por
consiguiente,
la
investigacin
debe
evaluar
completamente las prcticas reales que el equipo de
produccin utiliza para operar la mquina o el sistema. La
mejor manera para determinar la conformidad con los SOPs
es tener la lista de pasos del operador utilizada para accionar
la mquina investigada. Esta tarea debe realizarse sin
referirse al manual del SOP. El investigador debe conducir las
prcticas del operador (es) a travs del proceso y utilizar sus
datos de entrada para desarrollar un diagrama de secuencias.
Despus que el diagrama est completo, comprelo con el
SOP. Si las prcticas reales del operador no son las mismas
que las descritas en el SOP, los procedimientos pueden
necesitar ser actualizados o los operadores pueden necesitar
ser re adiestrados.
Historial de Mantenimiento.
Una revisin minuciosa del historial de mantenimiento
asociado con la mquina o el sistema es esencial en el
proceso del RCFA. Una pregunta que debera ser contestada
es: "Suceder esto otra vez?". Una revisin del historial de
mantenimiento puede ayudar a responder esta pregunta. El
nivel de exactitud de la data de mantenimiento disponible
variar grandemente de una planta a otra. Esto puede
dificultar la evaluacin, pero es necesario como sea posible
desarrollar un claro panorama de la historia de mantenimiento
del sistema.
Una historia completa del mantenimiento real y programado,
incluyendo inspecciones y lubricacin, debe desarrollarse
para la mquina, sistema o rea afectados. Los detalles
primarios que se necesitan incluyen la frecuencia y los tipos
de reparacin, frecuencia y tipos de mantenimiento
preventivo, historia de fallas, y cualquier otro hecho que
ayude en la investigacin.
Las Prcticas y Procedimientos de mantenimiento.
Debe conducirse una evaluacin completa de los
procedimientos estndares de mantenimiento y de sus
prcticas reales. Los procedimientos deben compararse con
el mantenimiento necesario definido por la revisin del diseo
y por los manuales de O&M del vendedor. Las prcticas de
mantenimiento reales pueden ser determinadas de la misma
forma como se describi anteriormente o por observacin
visual de reparaciones similares. Esta tarea debe determinar
si los SMPs son seguidos de forma consistente por todo el
personal de mantenimiento asignado a o involucrado con el

36

Anlisis causa raz de la falla

rea que se investiga. Debe prestarse una especial atencin a


las tareas rutinarias, como la lubricacin, los ajustes, y otras
tareas preventivas. Determine si los procedimientos estn
siendo ejecutados de una manera oportuna y si estn
usndose las tcnicas apropiadas.
3.3.4. Observaciones y mediciones
Si la revisin de las aplicaciones y del mantenimiento no es concluyente,
pueden ser necesarias una evaluacin y pruebas adicionales. Las tcnicas
discutidas en esta seccin proporcionan maneras de cuantificar las
desviaciones de las prcticas de operacin y de mantenimiento aceptables.
Usando estas tcnicas, el equipo de investigaciones puede establecer con
exactitud las desviaciones que contribuyen con el problema.
Despus de establecer las desviaciones potenciales de las condiciones de
operacin u otras variantes que contribuyen con el evento, el prximo paso
es verificar estos factores fueron contribuyentes reales. El mejor mtodo de
confirmacin es medir fsicamente la dinmica operacin de la mquina o
sistema de produccin asociada con el evento.
Evaluar cualquier evento o incidente que resulte en una falla parcial o
completa de una mquina, de la pieza de un equipo, o de un sistema, debe
incluir un anlisis completo de las partes componentes fallados. Los
mtodos reales usados variarn dependiendo del modo de falla y tipo de
falla de la mquina o componente fallido.
En la mayora de los casos, deben reemplazarse inmediatamente los
componentes fallados para minimizar el impacto en la produccin. Si este es
el caso, puede ser beneficiosa una evaluacin del sistema que rode al
incidente. Si esta comprobacin se puede conducir poco despus que la
mquina a fallado, puede haber evidencia residual que ayudar en la
investigacin. Esto es especialmente cierto en los casos dnde las
variaciones en los parmetros de operacin, como las variaciones del
producto y las prcticas de operacin, contribuyeron a la falla.
Muchos tipos de mediciones pueden tomarse y as como efectuar
observaciones, pero las ms efectivas incluyen el anlisis de vibracional, la
cuantificacin de parmetros del proceso, y la inspeccin visual.
El anlisis de vibracin, complementado con el registrador directo de
variables del proceso, provee el ms efectivo medio para determinar sus
efectos. Un anlisis completo multicanal de la mquina de reemplazo y su
sistema instalado proporciona los datos necesarios para evaluar la
contribucin
potencial
de
sistema
a
la
falla.

37

Anlisis causa raz de la falla

3.3.4.1. El anlisis vibracional


El anlisis de vibracin es quizs el mejor mtodo para medir
el real comportamiento operacional de los sistemas
mecnicos. Esta tcnica proporciona los medios para
cuantificar una variedad de factores que pueden contribuir con
el evento - incluso cuando la falla del equipo no ha ocurrido.
Si se cree que las variaciones en el producto entrante, las
prcticas de operacin y mantenimiento, el medio ambiente u
otras variables son un factor de contribucin con la falla, las
pruebas de vibracin pueden medir el efecto real de cada
variable.
Es necesario desarrollar una sucesin de pruebas que aslen
y comparen directamente cada variable sospechosa. Por
ejemplo, una serie de pruebas de vibracin pueden conducir a
medir el cambio real de la respuesta de una mquina o
sistema de procesos, para cambios discretos en los
parmetros del producto entrante, tal como la viscosidad o la
temperatura. Otra sucesin de pruebas puede dirigirse para
medir los efectos de las variaciones en las prcticas de
operacin o el medio ambiente.
Todas las pruebas de vibracin deben ser basadas en un plan
de pruebas bien pensado que defina su propsito y los
mtodos que sern usados. La documentacin detallada es
esencial. Cada prueba de la sucesin debe ser
completamente detallada para definir con claridad los
parmetros exactos a usar durante la adquisicin de los
datos. Esta documentacin es esencial para el anlisis
apropiado y la comparacin de la data.
En la mayora de los casos, los datos del proceso o del medio
ambiente deben adquirirse conjuntamente con los datos de
vibracin. Desde que estas pruebas se disearon para
cuantificar los efectos de los cambios en las variables, es
necesario verificar el cambio real causado por cada uno.
Pueden usarse los datos en tiempo real para cuantificar con
exactitud la relacin de causa y efecto entre las variables
sospechosas y el comportamiento operacional de la mquina
o sistema.
Las tcnicas de adquisicin multicanal de datos proporcionan
los medios mejores medios para adquirir este tipo de datos.
La tcnica multicanal registra todas las variables al mismo
tiempo, eliminando la posibilidad que algo en trnsito pueda
ser perdido como con un mtodo de adquisicin de datos de
canal simple.

38

Anlisis causa raz de la falla

3.3.4.2. Parmetros del proceso


Las variaciones en la evaluacin de parmetros del proceso,
como la presin, la razn de flujo, y la temperatura, es un
medio efectivo de confirmacin de sus impactos en el sistema
de produccin. En algunos casos, el sistema de supervisin
por computadora del Nivel I usada para operar el sistema de
procesos proporciona muchos de los datos necesarios. Los
sistemas de supervisin normalmente adquieren, informan, y
almacenan variables claves del proceso a lo largo del proceso
de produccin normal. Esta informacin es til para el anlisis
inicial y las pruebas de confirmacin.
Las pruebas deben desarrollarse para medir el impacto de los
cambios de los parmetros del proceso en el sistema para
determinar si las desviaciones especficas contribuyeron al
evento que est investigndose. En la mayora de los casos,
deben usarse las pruebas en conjunto con el anlisis de
vibraciones para medir las relaciones de causa y efecto entre
los procesos especficos instalados y el comportamiento
operacional del sistema.
3.3.4.3. Inspeccin visual
La inspeccin visual es una herramienta que siempre debe
usarse. Tales inspecciones deben realizarse en dispositivos
de medicin, como en manmetros y los componentes con
falla de la mquina.

3.3.4.4. Los dispositivos de medicin


La mayora de las mquinas y sistemas incluyen dispositivos
de medida que proporcionan una indicacin clara de la
condicin de operacin. Una inspeccin visual de estos
dispositivos confirma muchos de los modos de falla que
causan desviaciones del proceso y las fallas catastrficas.
Por ejemplo, los manmetros de presin son una herramienta
primaria para evaluar el comportamiento operacional. Una
lectura estable de la presin es una buena indicacin que el
equipo (por ej., bomba, ventilador, compresor) est operando
normalmente y dentro de sus condiciones de operacin de
diseo. Un manmetro fluctuando es una indicacin de que
algo anda mal. Un flujo turbulento, cclico o una variacin en
la carga o la demanda, y una variedad de otras desviaciones
del proceso produce una fluctuacin radical de la lectura del
manmetro de presin.

39

Anlisis causa raz de la falla

3.3.4.5. Los componentes fallados de la mquina


La inspeccin visual de los componentes fallados de la
mquina puede ser una efectiva herramienta de diagnstico.
Por ejemplo, la inspeccin visual de un rodamiento fallado
puede determinar la zona recargada, el patrn de desgaste, y
en muchos casos la causa probable de la falla. Lo mismo
sucede en engranes, fajas en V, y una variedad de otros
componentes de comunes de mquinas.
En muchos casos, la inspeccin visual proporciona pistas
positivas que orientan al investigador hacia el probable modo
de falla o causa de la raz. Por ejemplo, el patrn de desgaste
de un rodamiento de rodillos o de un conjunto de engranes
proporciona indicaciones visuales de un comportamiento o
carga anormal.
Varios libros de referencia discuten e ilustran los modos de
falla comunes de los componentes de una mquina que
pueden descubrirse usando la observacin visual as como
las herramientas de diagnstico primario. La mayora de estos
libros utilizan fotografas para mostrar claramente la imagen
visual de varios modos de falla.
3.3.4.6. Partculas de desgaste
El anlisis de las partculas de desgaste es una tcnica de
diagnstico que usa el anlisis visual ayudado por un
microscopio electrnico para evaluar el patrn de desgaste de
los slidos metlicos contenidos en el sistema de lubricacin
de una mquina.
Usando esta tcnica, un analista especializado puede
determinar el tipo de desgaste y su causa ms probable.
En la mayora de los casos, este anlisis requiere el uso de
un laboratorio externo, con costos que van desde
aproximadamente $25 a $50 por muestra. Sin embargo, el
conocimiento ganado con esta prueba es sumamente valioso
para el proceso del RCFA.
Otras tcnicas de comprobacin de la condicin (por ej.,
megado, ultrasonido, emisiones acsticas) puede usarse para
medir la relacin de causa y efecto entre las variables. Cada
tcnica es apropiada para aplicaciones especficas y
proporciona un medio de cuantificar o mostrar cuales
funciones de fuerza especficas contribuyeron al evento o
incidente que se investiga.
Hay tambin que a una variedad de pruebas que pueden
efectuarse para evaluar las propiedades metalrgicas del
componente que fall.

40

Anlisis causa raz de la falla

stos incluyen el esfuerzo de tensin, la tensin residual, y


otras propiedades del componente as como el mecanismo de
falla real (es decir, ruptura por tensin, fractura de
compresin, etc.).
A menos que la planta tenga un laboratorio metalrgico
totalmente funcional, las pruebas pueden requerir el uso de
un laboratorio externo. El costo de las evaluaciones variar,
dependiendo del tipo de componente y la magnitud del
anlisis. Usado selectivamente, el anlisis metalrgico es una
herramienta eficaz y puede ser parte til de un RCFA.

3.4.

Determinacin de la causa de la raz

A estas alturas de la investigacin, los pasos precedentes, los diagramas secuencia


de eventos, y los rboles lgicos deben de haber identificado las funciones de
fuerza que pueden haber contribuido al problema. Estos datos deben haber
proporcionado suficiente visin de la falla para que el investigador desarrolle una
lista de razones potenciales o probables para la falla.
Las guas para tipos especficos de mquinas as como las guas para la solucin
de problemas que se dan ms adelante deberan ser utilizadas como parte de esta
actividad. Un buen nmero de modos de falla comunes de maquinaria se definen
ms adelante, estos proporciona sntomas obvios asociados con un problema o
falla de la mquina y sus causas comunes. Acoplados con los datos encontrados
durante la investigacin, estas tablas deberan ayudar a reducir el nmero de
causas potenciales a no ms de dos o tres.
Un mtodo que puede usarse para evaluar factores potenciales que pueden haber
causado o contribuido con el evento es el anlisis de causa y efecto. La
representacin grfica de las variables o los factores identificados por la
investigacin usa un diagrama de la espina de pescado que proporciona un medio
para evaluar las causas races potenciales.
La ventaja del diagrama de espina de pescado es que esto obliga al investigador a
agrupar lgicamente a cada uno de los factores identificados durante la
investigacin. Este proceso puede eliminar algunos factores automticamente y
puede descubrir otros problemas que deben ser manejados. Una vez que todos los
factores identificados han sido grficamente mostrados, el investigador o el equipo
de investigaciones pueden evaluar cada uno sistemticamente.
Es esencial analizar una lista corta de causas races potenciales para verificar cada
una de las causas sospechosas. En casi todos los casos, una serie de pruebas
relativamente simples y baratas pueden efectuarse para confirmar o eliminar la
causa que se sospecha caus la falla del equipo. Como un ejemplo, el azul de
prusia puede usarse para verificar el alineamiento y el juego del conjunto de
engranes. Este simple y barato test requiere muy poco esfuerzo y confirmar el
patrn de desgaste y el embonado del conjunto de engranes. Si el alineamiento o el
excesivo contragolpe estn presente, esta prueba lo confirmar.

41

Anlisis causa raz de la falla

Cuando se sospecha si existe cavitacin en una bomba centrfuga, verifique al


menos un factor, tales como goteras en la succin o una baja altura neta de succin
positiva (NPSH), presentes en el sistema. Si no se verifican, la cavitacin no puede
ser la causa de la falla.
La mayora de las causas que contribuyen con los problemas que adversamente
afectan el rendimiento de la planta pueden agruparse en una de varias categoras.
La mayora de los problemas del equipo pueden remontarse a la mala aplicacin de
las prcticas y los procedimientos de operacin y mantenimiento o simplemente a la
edad.
Algunas de las otras causas que se discuten incluyen entrenamiento, supervisin,
comunicaciones, ingeniera humana, sistemas de gerencia, y control de calidad.
Estas causas son las razones ms comunes para un pobre rendimiento de la
planta, accidentes, y el no acatamiento de las normas reguladoras. Sin embargo, el
error humano puede contribuir a, o ser la sola razn del problema.
La figura 12 ilustra las causas ms comunes de eventos que afectan la seguridad
de la planta, complacencia medioambiental, rendimiento del proceso, y confiabilidad
del equipo.

FALLA DEL EQUIPO

Mala aplicacin

Prcticas de Operacin

Prcticas de
Mantenimiento

Edad

Condiciones de
operacin de diseo
fuera de lugar

Procedimientos
inadecuados

Procedimiento
inadecuado

Desgaste normal

Prcticas pobres
de diseo

Ninguna adherencia
al procedimiento

Procedimientos no
concuerdan

Vida til terminada

Prcticas pobres de
adquisicin

Entrenamiento
inadecuado

Frecuencia inadecuada

Desgaste acelerado

Incumplimiento

Carencia de habilidades

Fig. 12: Causas comunes de fallas del equipo

42

Anlisis causa raz de la falla

3.4.1. Mala aplicacin


La mala aplicacin del equipo crtico del proceso es una de las causas ms
comunes de problemas relacionados con el equipo. En algunos casos, la
razn para la mala aplicacin es un diseo pobre, pero ms a menudo es el
resultado de modificaciones incontroladas o cambios en los requisitos de
operacin de mquina.
Prcticas Pobres de Diseo.
Algunos problemas del equipo son el resultado de aplicar en planta
inadecuadas prcticas de ingeniera. Una tendencia creciente en la industria
americana, a menudo disminuye o elimina el diseo interno y las
capacidades de ingeniera de la planta. Sin embargo, esto puede resultar en
pobres prcticas de diseo, lo cual tienen un impacto serio en la
confiabilidad del equipo. Incluso en esos medios dnde la capacidad de
diseo interno no se elimina, la calidad de los procedimientos y las prcticas
pueden verse mermadas tal que afectan el diseo del proceso y contribuyen
con los problemas.
Durante la fase de revisin del diseo de una investigacin, el equipo
investigador debe de haber evaluado el diseo del proceso para determinar
si es adecuado para la aplicacin en particular. Si no, la accin correctiva
obvia es modificar los procedimientos y las prcticas que se usan para la
funcin de diseo.
Prcticas de Obtencin.
Los mtodos por obtener equipo nuevo y de reemplazo contribuyen a
menudo con los problemas relativos al equipo. Los factores principales que
contribuyen con las deficiencias son las especificaciones tcnicas
inadecuadas, substitucin de vendedores o mquinas, omisin de las
evaluaciones del costo del ciclo de vida, y no obtener las evaluaciones del
vendedor.
Especificaciones Inadecuadas.
Un gran contribuyente en esta categora es la ausencia de adecuadas
especificaciones de obtencin. Generalmente, las especificaciones tcnicas
no incluyen suficiente detalle para asegurar que se est comprando la parte
o mquina correcta. Muy a menudo, las especificaciones se limitan a
nmero de modelo o de parte. Sin embargo, este tipo de especificacin no
define la aplicacin especfica o rango de operacin que la mquina debe
proporcionar.
Substituciones.
El papel definido para el proceso de compra es limitar el costo de las partes
y mquinas nuevas y de reemplazo. Como resultado, el personal de
adquisiciones a menudo substituye partes o mquinas que reciben por ser
externamente iguales. Desgraciadamente, las substituciones no siempre son
exactamente las mismas. Los mismos vendedores tambin contribuyen con

43

Anlisis causa raz de la falla

este tipo de problema. Ellos ofrecern los equivalentes a las


especificaciones requeridas sin pensar en la aplicacin que se intenta darle.
En algunos casos, les basta con dar una mirada. En otros, hay un esfuerzo
intencional en obtener la orden, sin tener en cuenta el impacto en el
rendimiento de la planta.
Baja Oferta versus el Costo del Ciclo de Vida.
Obtener equipo nuevo o de reemplazo basados estrictamente en la baja
oferta en lugar de observar el costo del ciclo de vida es otra importante
contribucin a los problemas de confiabilidad del equipo. En un esfuerzo por
reducir los costos, muchas plantas han abandonado el proceso de seleccin
del vendedor basado en el costo del ciclo de vida total del equipo. Este error
contina bajando la confiabilidad del equipo y puede ser la causa raz de
muchos problemas.
Evaluaciones del Vendedor.
La calidad del equipo nuevo y reconstruido tiende a declinar sustancialmente
sobre los diez aos. Al mismo tiempo, muchas compaas han abandonado
la prctica de inspecciones regulares y certificacin del vendedor. El declive
resultante en la calidad es otra contribucin al mal funcionamiento o falla del
equipo.
3.4.2. Prcticas y procedimientos de operacin pobres
Las prcticas y procedimientos de operacin pobres juegan un papel
importante en los problemas de confiabilidad del equipo. La figura 13 ilustra
las fuentes ms comunes de problemas causadas por los procedimientos.
Los problemas generalmente resultan porque no se usan los
procedimientos, son inadecuados, o se siguen incorrectamente. Cualquiera
de estas categoras puede ser la causa raz, pero normalmente ocurre junto
con una o ms de otras causas discutidas en esta seccin. Por ejemplo, no
hacer cumplir es un problema de supervisin y la verdadera causa de la raz
debe incluir una evaluacin. La llave a evaluar el potencial de la causa raz
es determinar si el problema es un procedimiento inadecuado o la falla
ocurre al seguir procedimientos vlidos.
Muchos de los SOPs utilizados para operar sistemas crticos en plantas de
produccin estn fuera de fecha o son inadecuados. A menudo esto hace
una importante contribucin a los problemas relacionados con los equipos y
su confiabilidad.
Si lo anterior es evaluado como un potencial contribuyente al problema
especfico que se investiga, refirase a la figura 13 para la sub clasificacin
que ayudar a identificar las causas races y las acciones correctivas
apropiadas. Los problemas de procedimiento tienen un impacto ms
universal en la confiabilidad y el rendimiento en donde hay una probabilidad
sumamente alta que la falla o problema se repita.

44

Anlisis causa raz de la falla

PROCEDIMIENTOS

No usados

Inadecuados

Incorrectamente
seguidos

No hay procedimiento

Hechos o mtodos
equivocados

Formato confuso

Dificultad para su uso

Organizacin pobre

Excesivas referencias

No hay disponible

Se hizo inadecuada
revisin

Demasiado tcnico

No se ejecuta

Situacin no
considerada

Fig. 13: Causas races comunes de los problemas relacionados con el procedimiento

La carencia de vigor para hacer cumplir, es una de las razones que los
procedimientos no se siguen de forma consistente. La real causa de esto
puede ser muchos factores. Falta de entrenamiento o un inadecuado empleo
de habilidades normalmente contribuyen a problemas que afectan el
rendimiento de la planta y la confiabilidad del equipo. Los mayores
contribuyentes a los problemas relativos al entrenamiento incluyen no
entrenar, inadecuado entrenamiento y falla al aprender.
Las razones implcitas a inadecuadas habilidades varan dependiendo de la
cultura de la planta, la mano de obra y una variedad de otros problemas.
La figura 14 provee las razones ms comunes para un pobre nivel de
habilidades que son causadas por problemas de entrenamiento. Adems de
las subcategoras incluidas en la figura, revise las secciones en Prcticas y
Procedimientos de Operacin Pobres y Supervisin para problemas donde
un inadecuado nivel de habilidades es un potencial contribuyente.

45

Anlisis causa raz de la falla

ENTRENAMIENTO

Ningn Entrenamiento

Inadecuado

No Aprendido

Tarea no analizada

Aprender no es
un objetivo

Carencia de retencin

No se decidi ningn
entrenamiento

Ningn plan

Demasiado tcnico

Aprender no es
un objetivo

Instruccin pobre

No asisti al curso

El entrenamiento
no se ejecuta

La aplicacin
no es prctica

Conocimiento
no verificado

Fig. 14: Causas Comunes de problemas relativos al entrenamiento.

Ningn Entrenamiento.
Muchas plantas carecen de un programa de entrenamiento formal que
proporcione las habilidades mnimas que requieren los empleados para
ejecutar las tareas de obtencin, operacin, y mantenimiento exigidas para
mantener un nivel aceptable de rendimiento de la planta.
En otros casos, los programas de entrenamiento de la planta son los
limitados a cursos como (por ej., OSHA, EPA, u otros cursos reguladores)
eso tiene poco que hacer con las habilidades prcticas exigidas para cubrir
los requisitos del trabajo.
El Entrenamiento Inadecuado.
Hay una variedad de razones por las que los programas de entrenamiento
fallan al no lograr un mnimo nivel de habilidades en los empleados. La
mayora se relaciona a los procedimientos y los mtodos utilizados para
desarrollar y presentar los cursos de entrenamiento. Algunos tipos
comprueban la mejora del nivel de habilidades despus que el
entrenamiento ha sido completado, siendo esta la mejor manera de
determinar la efectividad del programa de entrenamiento.
Fracaso al Aprender.
Los empleados no retienen la instruccin proporcionada en los programas
por dos razones: la instruccin es pobre y algunos fracasos del empleado.
La instruccin pobre es una falla por la que el empleador proporciona la
informacin requerida para que el empleado realice un particular trabajo en
un formato fcilmente entendible y a un paso que le permita absorber el
material. El fracaso por el empleado para aprender puede ser el resultado de
su nivel de educacin, fatiga, falta de deseo, o falta de incentivo.
No todos los empleados tienen la educacin y las habilidades de
comprensin necesarias para entender, dominar, y retener el entrenamiento

46

Anlisis causa raz de la falla

para mejorar sus habilidades de operacin y de mantenimiento. En algunos


casos, el empleado no puede tener la habilidad para leer y escribir a un nivel
que permite un mnimo entendimiento de incluso el ms simple programa de
entrenamiento.
Los empleados que cayeron dentro de esta clasificacin presentan un serio
problema que es muy difcil corregir. La nica solucin real es proporcionar
cursos de entrenamiento que remedien esto enfocando la lectura y escritura
bsicas, y las habilidades de comprensin.
La fatiga es otro factor que directamente afecta el entrenamiento. Muchos
cursos se ensean fuera de horas de trabajo normales y se espera que los
empleados asistan al entrenamiento despus de en un da lleno de labores.
Desgraciadamente, esto afecta a los estudiantes, y su habilidad para
comprender y retener las instrucciones.
La falta de motivacin puede ser un problema de actitud del empleado, pero
en muchos casos la real causa raz es una falla en la supervisin y las
polticas de la planta. Si se sospecha una falta de motivacin, evale las
causas potenciales incluidas en las secciones siguientes en Supervisin,
Comunicaciones, y Sistemas de Direccin antes de tomar una decisin final
en cuanto a la causa raz del problema.
3.4.3 SUPERVISIN
La supervisin incluye todas las causas potenciales que puedan estar
asociadas con las prcticas y los procedimientos de direccin. Mientras la
mayora de las causas apuntan a supervisores de primera lnea, tambin
pueden apuntar a todos los niveles de direccin. La figura 15 proporciona los
factores comunes de problemas relativos a la supervisin.
Preparacin.
La falta de preparacin es un factor comn a que contribuye a, o es la sola
razn para, los problemas de rendimiento de la planta. En algunos casos, es
un problema del empleado con uno o ms supervisores o gerentes, pero ms
a menudo es un fracaso en la filosofa de direccin global de la planta.
Muchas plantas confan en sus supervisores de primera lnea que tambin
tienen otras responsabilidades directas o indirectas.

47

Anlisis causa raz de la falla

SUPERVISIN

Preparacin

Seleccin de
trabajadores

Supervisin durante
el trabajo

Ninguna preparacin

No calificados

Pobre trabajo
en equipo

Ningn paquete
de trabajo

Fatigados

Demasiadas
responsabilidades
anexas

Carencia de
entrenamiento previo
al trabajo

Problemas de
trastorno / personal

Inadecuada
programacin

Abuso de sustancias

Mala seleccin
del equipo

Fig. 5: Factores comunes de causas relacionadas con la supervisin

Como resultado, el supervisor tiene poco tiempo para preparar el paquete de


trabajos, proporcionar entrenamiento prctico, o realizar muchas de las otras
tareas esenciales para el rendimiento consistente de la planta (y el
trabajador). Si ste es el caso, citar una supervisin pobre como la causa
raz de un problema es impropio e incorrecto.
Otra razn comn para el fracaso en esta categora es la falta de
entrenamiento del supervisor. Pocos supervisores de primera lnea han
seguido un entrenamiento bsico de habilidades que ellos necesitan para su
posicin. Los materiales presentados previamente como Prcticas y
Procedimientos de Operacin Pobres deberan ser incluidos en cualquier
evaluacin donde una pobre supervisin es una fuente potencial de
problemas.
Seleccin de los Trabajadores.
La seleccin de trabajadores asignados a tareas o trabajos especficos es
una contribucin comn a los problemas. Generalmente, los trabajadores
son asignados a tareas segn la percepcin que el supervisor tenga de sus
habilidades. En parte, esta es la razn por la que los niveles de habilidades
no son universales en la mayora de plantas y los supervisores intentan
colocar sus mejores hombres en trabajos sensibles o crticos. El problema
con este enfoque es que algunos miembros de la fuerza de trabajo llegan a
estar sobrecargados, lo cual causa un desvanecimiento de las habilidades
personales lo cual los inhabilita a acceder a trabajos calificados. Cuando se
evalan causas races potenciales que pueden caer dentro de esta
categora, refirase a las secciones previas en problemas de entrenamiento.

48

Anlisis causa raz de la falla

Trabajo Durante la Supervisin.


Muchos de los problemas debidos a esta causa resultan en una funcin dual
que los supervisores deben realizar. Debido a otras responsabilidades, ellos
no estn disponibles para supervisar directamente los trabajos que se estn
ejecutando. Una segunda causa potencial de este problema es la carencia
de habilidades o entrenamiento del supervisor. Al chequear cualquier
problema potencial que pueda ser atribuido a esta categora asegure una
adecuada identificacin de la causa raz.
La falta de preparacin o entrenamiento del supervisor. El cruce de
informacin de cualquiera de los problemas potenciales que pueden ser
atribuidos a esta categora para asegurar la identificacin apropiada de la
causa raz.

3.4.4. Comunicaciones
La falla en la comunicacin es otra gran categora que contribuye a los
problemas en la planta. La figura 16 muestra las causas tpicas de los
problemas relacionados con la comunicacin

COMUNICACIONES

Ninguna comunicacin

Reorganizacin

Malos entendidos

Ningn mtodo
disponible

Ningn proceso
est estandararizado

No hay trminos
estndar

Comunicaciones tardas

No es usual ningn
proceso de
reorganizacin

No es usual
volver a repetir

Carencia de formato
de reportes

Inadecuado proceso
de reorganizacin

Mensajes muy largos

Medioambiente ruidoso

Fig. 16: Causas comunes de problemas en las comunicaciones

Cualquier problema que pueda ser atribuido a una o ms de estas


categoras debera ser informacin que se debe cruzar con las secciones:
Procedimientos y Prcticas de Operacin Pobres y Sistemas de
Administracin, para asegurar si la causa correcta est identificada.

49

Anlisis causa raz de la falla

3.4.5. Ingeniera humana


Las deficiencias en esta categora no son tan visibles como las de otras,
pero contribuyen a muchos problemas en la planta. Estas causas, que se
muestran en la figura 17, son en primer lugar el resultado del mal diseo del
rea de trabajo y errores en el flujo de trabajo.
INGENIERA HUMANA

Interfase
trabajador -mquina

Entorno del trabajo

Sistemas complejos

Arreglo / empleo

Limpieza general

Decisiones requeridas
basadas en el
conocimiento

Excesivos estiramientos
e inclinaciones

Medio ambiente

Demasiados parmetros
para monitoreaer

Herramientas /
instrumentos

Espacios angostos

Retroalimentacin
inadecuada

Controles / displays

Fig. 17: Causas comunes de problemas en ingeniera humana

Interface del Trabajador - Mquina


Los planos de diseo de los paneles de instrumentos, controles, estaciones
de trabajo y otros equipos tienen un impacto directo en el funcionamiento de
la planta. Por ejemplo cuando el diseo del rea de trabajo demanda del
operador giros constantes, inclinarse o doblarse; el riesgo de dao, error
debido a fatiga o la perdida de la calidad final del producto aumenta
sustancialmente. Un adecuado diseo del rea de trabajo puede ayudar a
eliminar problemas potenciales.
Ambiente de Trabajo
El ambiente de trabajo tiene impacto directo en la fuerza de trabajo y la
confiabilidad del equipo. Una iluminacin inadecuada, falta de control de
temperatura y una limpieza deficiente son las formas ms dominantes dentro
de esta clasificacin. En algunos casos un ambiente inadecuado es un
sntoma ms que una causa raz. Por ejemplo, los procedimientos de
supervisin o los problemas en los sistemas de administracin pueden ser
las causas reales. Asegrese que la evaluacin sea lo suficientemente
detallada para aislar la causa raz verdadera.

50

Anlisis causa raz de la falla

Sistemas Complejos
Los sistemas de produccin se estn volviendo ms y ms complejos. Como
consecuencia los niveles de preparacin de los operadores y el personal de
mantenimiento tambin deberan mejorar para lograr y mantener niveles de
confiabilidad aceptables. Mientras las categoras incluidas en esta seccin
pueden ser percibidas como una causa raz viable de una investigacin
especfica, la mayora son una combinacin de la complejidad de los
sistemas y otros tems tales como entrenamiento, motivacin del empleado y
otros.

3.4.6. Sistema de administracin


La figura 18 ilustra las causas races ms comunes de los problemas en los
sistemas de administracin: las polticas y procedimientos, estndares no
usados y relaciones entre empleados.
La mayora de estas potenciales causas races concuerdan con la cultura de
la planta y la filosofa de manejo. Mientras ms difciles sean aislarlas, las
categoras que caigan dentro de este grupo de causas contribuyen a
muchos de los problemas que sern investigados.

SISTEMAS DE
GERENCIA

Polticas y
procedimientos

No se usan estndares

Relaciones empleadas

Ningn estndar

No hay comunicacin

Ni auditoras /
ni evaluaciones

No son lo bastante
estrictos

Recientemente
cambiados

Carencia de una
auditara profunda

Confusos o incompletos

Ninguna exigencia

Ninguna comunicacin
empleada

Errores tcnicos

Ningn camino para


implementar

Ninguna
retroalimentacin
empleada

Ningn esquema o
impresin

Ninguna contabilidad

Fig. 18: Causas comunes de problemas en los sistemas de administracin

51

Anlisis causa raz de la falla

3.4.7. Control de calidad


El Control de calidad es una causa raz primaria potencial en problemas de
desviacin del proceso.
Mientras que estos problemas pueden contribuir a la falla de los equipos u
otro tipo de problemas, sus roles predominantes estn en las
investigaciones relativas a la calidad y la capacidad. La figura 19 nombra las
causas de control de calidad ms comunes creadas por ninguna o una
inspeccin inadecuada.

CONTROL DE CALIDAD

Ninguna inspeccin

Inadecuado control de
calidad

No se requieren
inspecciones

Instrucciones pobres

No sostienen puntos

Tcnicas pobres

Sostienen puntos
ignorados

Inadecuadas tcnicas /
habilidades

Fig. 19: Causas relativas al control de calidad

3.5.

Evaluacin de acciones de correctivas potenciales

El proceso RCFA define una o ms acciones correctivas que deberan resolver el


incidente o evento bajo investigacin. El siguiente paso en este anlisis es
determinar cual, si hubiera, de estas acciones correctivas debera ser
implementada. La figura 20 ilustra un rbol de decisin simplificado que define
mltiples acciones correctivas potenciales. Estas acciones incluyen un amplio rango
de posibilidades desde no hacer nada hasta reemplazar la mquina o sistema.
Qu acciones correctivas deberan ser tomadas? No todas las acciones son
financieramente justificables. En algunos casos, el impacto del incidente o evento
es menor que el costo de la accin correctiva.
En estos casos, el RCFA debera documentar el incidente para una referencia
futura, pero recomendando cual accin correctiva no se llevar a cabo.

52

Anlisis causa raz de la falla

El conocimiento bsico de la mquina y la gua de deteccin de fallas dan los


lineamientos bsicos necesarios para seleccionar las acciones correctivas
potenciales requeridas para resolver la falla y prevenir que vuelva a ocurrir.
El objetivo de esta tarea es definir una lista corta de acciones correctivas que
resolvern la causa raz de la falla. En este punto, el costo no es factor y la lista
debera incluir las mejores soluciones para la causa identificada. Por ejemplo la falla
de una bomba causada por cavitacin puede ser corregida eliminando la entrada de
aire o gas, incrementando la altura de succin neta positiva real (NPSHA), bajando
la temperatura de succin de lquido o aumentando la presin de succin.
Dependiendo del tipo de cavitacin, una o cualquier combinacin de estas acciones
correctivas eliminar el problema.
Sin embargo una vez que ha sido generada esta pequea lista, debe ser
considerado el costo. Cada accin correctiva potencial debera ser cuidadosamente
analizada para determinar si realmente corregir el problema. Esto es importante
porque la tendencia normal en menos evaluaciones formales es para arreglar los
sntomas de problemas antes la verdadera causa raz. Adems en esta fase de la
evaluacin debera evaluar cada accin correctiva potencial para asegurar que
elimine el problema real.
Sin embargo, en algunas ocasiones, corregir los sntomas o implementar una
solucin temporal es la nica forma financieramente justificable. En aquellos casos
las recomendaciones deberan definir claramente la tcnica que debera ser
tomada. Esta debera manifestar lo racional de la decisin y describir las
limitaciones o restricciones que la correccin parcial tendr en el funcionamiento de
la planta, la confiabilidad del equipo y otros factores de la operacin y el
mantenimiento de la planta.
A pesar de que el nmero de reparaciones temporales debera ser limitado tanto
como sea posible, frecuentemente son inevitables. Cada esfuerzo debe hacerse
para implementar acciones correctivas permanentes, y la meta es eliminar todos los
factores negativos asociados con el evento o incidente. Mientras haya
generalmente una accin correctiva que logre las metas, el reto es encontrar la
accin ms aceptable que tambin sea efectiva en costos.

3.6.

Reportes y recomendaciones

La siguiente prueba requerida en el RCFA es un reporte que incluya una


descripcin completa del incidente o evento, la identificacin de las causas
especficas y recomendaciones para su correccin. El reporte debera incluir la
siguiente informacin:

Resumen del incidente.


Condicin inicial de la planta.
Evento de inicializacin.
Descripcin del incidente.
Acciones correctivas inmediatas.
Reportes externos archivados.
Lecciones aprendidas.
Referencias y anexos.

53

Anlisis causa raz de la falla

54

Descripcin del investigador o equipo de investigacin.


Descripcin del equipo de revisin y aprobacin.
Lista de distribucin.

Fig.20: rbol simplificado de decisin definiendo mltiples acciones potenciales correctivas

Anlisis causa raz de la falla

55

Anlisis causa raz de la falla

a.

Resumen de incidentes

El resumen del incidente debe ser una corta y concisa descripcin del incidente o
evento. No se deben resumir los hechos que tienen una contribucin directa con el
incidente.
B.

Condicin inicial de la planta

Esta seccin debe incluir una breve descripcin que defina el estatus de la planta al
inicio del incidente. Debe incluir cualquier condicin anormal que contribuya al
incidente. Esta seccin no debe intentar proveer un anlisis cuantitativo del mismo
pero debera estar limitado a una clara descripcin de las condiciones lmites que
existieron en el momento del incidente.
C.

Inicio de la investigacin del evento

De una breve descripcin de la falla inicial o la accin que ocasion el incidente o


que dirigi a su descubrimiento y la investigacin resultante. No use en esta seccin
del reporte ttulos o nombres de empleados especficos. En su lugar use cdigos y
descriptores que identifiquen funciones dentro del rea afectada.
D.

Descripcin del incidente

Esta seccin debera incluir una detallada cronologa del incidente. La cronologa
debera ser referida al diagrama de secuencia de eventos desarrollada como parte
del anlisis. Este diagrama debera estar incluido como apndice en el reporte.
Esta seccin debera incluir una descripcin de cmo el incidente fue descubierto,
los hechos que rodearon el incidente, la identificacin por nmero de componente y
el nombre de cada equipo fallado, el desempeo del sistema de seguridad, las
acciones del sistema de control, las acciones e intervenciones significativas del
operador, y los datos transitorios de los parmetros importantes de la planta.
Tambin debera incluirse consideraciones especiales observadas en el incidente,
tales como comportamientos inexplicados e inesperados del equipo o las personas,
inadecuados o degradados desempeos del equipo, significativos malos entendidos
del personal de operaciones o de mantenimiento, modos de falla comunes,
progresin de los eventos respecto de las condiciones de operacin de diseo,
violacin de las especificaciones tcnicas o lmites de diseo, o fallas de acciones
correctivas previamente recomendadas.
E.

ACCIONES CORRECTIVAS INMEDIATAS

Muchas de las fallas o eventos tienen un impacto directo en la produccin y


requieren inmediatas acciones correctivas que minimicen el tiempo muerto. Como
resultado, a menudo son requeridas acciones temporales que permitan una
reanudacin de la produccin. Esta seccin debe describir que acciones
intermedias y rpidas fueron tomadas que permitieron reanudar la produccin.

56

Anlisis causa raz de la falla

Causas y Acciones Correctivas de Largo Plazo


Esta seccin del reporte debera describir claramente la causa o causas races que
ocasionaron el incidente. Esto debera detallar recomendaciones especficas para
acciones correctivas de largo plazo.
Causa raz
La descripcin de la causa o causas races debera estar completa adems de
proveer suficiente detalle y data de soporte que el lector pueda entender
completamente y aceptar el uso racional para aislar la causa o causas races. Esta
seccin debera incluir todos los factores de contribucin, tales como el
entrenamiento y la supervisin que contribuyeron con el incidente.
Acciones Correctivas de Largo Plazo Recomendadas
Esta seccin debera proveer una clara y completa descripcin de las acciones
correctivas requeridas para prevenir la recurrencia del incidente o evento. Esto
debera incorporar conclusiones derivadas del anlisis costo beneficio desarrollado
previamente. El anlisis completo debera estar incluido como parte del paquete de
condiciones expedidas al gerente para su aprobacin.
F.

Llamadas telefnicas externas efectuadas y reportes archivados

Esta seccin debera documentar cualquier llamada telefnica externa efectuada


as como los reportes escritos y archivados.
Si el incidente involucra cuestiones de disconformidad con las normas, las llamadas
telefnicas pueden haber sido efectuadas y los reportes archivados por polticas
locales y por el equipo que responde la emergencia, el Centro de Respuesta
Nacional de Guardacostas, La Comisin de Respuestas de Emergencias del
Estado, el Comit de Planeamiento de Emergencias Locales, la oficina regional de
la Agencia de Proteccin Medioambiental de los EE.UU., el Departamento
norteamericano de Transporte, o la Agencia de Control de la Polucin del Agua del
estado.
G.

Leccin aprendida

Esta leccin debera describir las lecciones aprendidas por las que debe haber
pasado el personal apropiado. Esta informacin debera ser diseminada a travs de
un entrenamiento formal o algn otro medio, tal como la retroalimentacin individual
o lectura requerida. Esta seccin debera designar a la persona (por nombre)
responsable de asegurar que las lecciones aprendidas sean comunicadas, la fecha
de conclusin para la comunicacin, y la lista especfica del personal de planta que
deberan recibir las comunicaciones.
H.

Referencias y anexos

Es la lista de todas las referencias y los anexos usados como parte de la


investigacin. Se deben incluir como apndices: las copias o extractos de
procedimientos apropiados, originales, impresiones de computadora, planos y
declaraciones del personal involucrado.

57

Anlisis causa raz de la falla

I.

Descripcin del equipo investigador o investigado

Esta seccin debe incluir una lista y las descripciones del personal involucrado en la
investigacin.
J.

Descripcin del equipo que revisa y aprueba

Los reportes de RCFA deberan siempre ser revisados y aprobados antes de ser
distribuidos al personal de planta. La cadena de aprobacin variar de una planta a
otra pero debera ser establecida antes de implementar un RCFA. El proceso de
revisin es importante por reducir el potencial de errores o mal interpretacin que es
parte inherente de un proceso de investigacin.
K.

Distribucin

Incluir una lista del personal de planta, incluyendo contratistas apropiados, que
deberan recibir una lista del reporte final.

3.7.

Verificacin de la accin correctiva

Una vez que la accin correctiva ha sido aprobada e implementada, la tarea final
requerida para un minucioso RCFA es verificar que la accin correctiva detuvo el
problema. Despus que las acciones correctivas han sido implementadas, una serie
de pruebas de confirmacin deben conducir a asegurar una operacin confiable de
la mquina o aplicacin corregida.
Para la mayora de maquinaria comn de planta, un bien planificado anlisis de
vibracin en tiempo real multicanal debera confirmar la accin correctiva. Una serie
de mediciones de la vibracin pueden ser desarrolladas e implementadas para
medir las dinmicas de operacin de la instalacin nueva o modificada. La serie
debera incluir las condiciones totales de operacin del sistema, incluyendo
cualquier cambio en las prcticas de operacin que fueron parte de la
recomendacin. Los resultados de estas series de pruebas confirmaran la validez
de las correcciones y proveern la garanta que el sistema modificado opera
confiablemente.
EJERCICIO:
Elabore el anlisis causa raz para una falla crnica que se puede presentar en las
siguientes mquinas:
Bomba centrfuga accionada por un motor trifsico asncrono de rotor en
cortocircuito.
Molino de bolas accionado por un motor trifsico asncrono de rotor en
cortocircuito.
Cable subterrneo de media tensin.

58

Anlisis causa raz de la falla

4.

Mapa conceptual

ANLISIS CAUSA RAZ DE LA


FALLA (RCFA)

PROPSITO DEL ANLISIS CAUSA RAZ DE


LA FALLA

USO EFECTIVO DEL ANLISIS


INTRODUCCIN AL
ANLISIS CAUSA
RAZ DE LA FALLA
REQUERIMIENTOS DE PERSONAL

CUNDO USAR EL MTODO

ANLISIS DE EFECTO Y MODO DE FALLA

ANLISIS DEL RBOL DE FALLAS


TCNICAS
GENERALES DE
ANLISIS
ANLISIS DE LA CAUSA Y EFECTO

ANLISIS DE LA SECUECIA DE EVENTOS

REPORTE DE UN INCIDENTE O PROBLEMA

CLASIFICACIN DE INCIDENTE
METODOLOGA DEL
ANLISIS CAUSA
RAZ DE LA FALLA
ACOPIO DE LA DATA

OBSERVACIONES Y MEDICIONES

MALA APLICACIN

PRCTICAS Y PROCEDIMIENTOS DE
OPERACIN POBRE

SUPERVISIN

DETERMINACIN DE
LA CAUSA DE LA
RAZ

COMUNICACINES

INGENIERA HUMANA

SISTEMA DE ADMINISTRACIN

CONTROL DE CALIDAD

EVALUACIN DE
ACCIONES DE
CORRECTIVAS
POTENCIALES

REPORTES Y
RECOMENDACIONES

VERIFICACIN DE
ACCIONES CORRECTIVAS

59

Anlisis causa raz de la falla

5.

Referencias bibliogrficas

Francisco J. Gonzales Fernandez (2009). Teora y Prctica del


Mantenimiento Industrial Avanzado. FC EDITORIAL. (658.202/G71).

Santiago Garca Garrido (2008). Organizacin y Gestin Integral del


Mantenimiento. DIAZ DE SANTOS. (658.202/G23).

Alberto Mora Gutierrez (2009). Mantenimiento. Planeacin, Ejecucin y


Control. (658.202/M86)

Se puede complementar el estudio de la presente unidad visitando las siguientes


pginas Web:

60

http://campuscurico.utalca.cl/~fespinos/ANALISIS%20CAUSA%20RAIZ
%20%20(RCA).pdf
http://www.calidad.uady.mx/resources/nosotros/presentaciones/T%C3%
A9cnicas%20para%20identificar%20la%20Causa-Ra%C3%ADz.pdf
http://www.mantenimientomundial.com/sites/mm/notas/causaraizaltmann
.pdf
http://aprendizajevirtual.pemex.com/nuevo/guias_pdf/Guia_SCO_Analisi
s_Causa_Raiz.pdf
http://www.iie.org.mx/boletin042012/art-inv.pdf

Anlisis causa raz de la falla

6.

Glosario de trminos
Acpites: Texto breve, posterior al ttulo, que aclara el contenido del
artculo que encabeza.
Acopio: Accin y efecto de juntar, reunir en cantidad algo.
Aleatorios: Dependiente de algn suceso fortuito.
Analticas: Perteneciente o relativo al anlisis.
Analizar: Hacer anlisis de algo.
Confiabilidad: Probabilidad de buen funcionamiento de algo
Crnicos: Que viene de tiempo atrs.
Data: Almacenamiento de datos.
Diagnstico: Arte o acto de conocer la naturaleza de una avera
mediante la observacin de sus sntomas y signos.
Disciplina: Arte, facultad o ciencia.
Efectividad: Capacidad de lograr el efecto que se desea o se espera.
Estndares: Que sirve como tipo, modelo, norma, patrn o referencia
Eventos: Eventualidad, hecho imprevisto, o que puede acaecer.
Evidencia: Prueba determinante en un proceso.
Fluidificador: Que hace fluido algo.
Hostil: Contrario o enemigo.
Ingeniera: Estudio y aplicacin, por especialistas, de las diversas ramas
de la tecnologa.
Interdisciplinaria: Que se realiza con la cooperacin de varias
disciplinas.
Interface: Separacin entre dos fases.
Investigado: Hacer diligencias para descubrir algo.
Investigacin: Que tiene por fin ampliar el conocimiento cientfico, sin
perseguir, en principio, ninguna aplicacin prctica.
Lesin: Dao o detrimento corporal causado por una herida, un golpe o
una enfermedad.
Lgicos: Dicho de unos sucesos: Cuyos antecedentes justifican lo
sucedido.
Mtodo: Modo de decir o hacer con orden.
Mensurable: Que se puede medir.
Metodologa: Conjunto de mtodos que se siguen en una investigacin
cientfica.
Precisin: Determinacin, exactitud, puntualidad, concisin.
Sistemtico: Que sigue o se ajusta a un sistema.

61

También podría gustarte