Está en la página 1de 5

Universidad San Francisco de Quito

Procesos Estocsticos

Mean Time Between Failures (MTBF) Nota Explicativa preparada


por Ren Jtiva Espinoza
Definiciones:
Es importante notar que la definicin del Tiempo medio entre fallas (MTBF del ingls
Mean Time Between Failures) se torna en muchos casos ambiguo si no se ha definido
previamente la nocin de falla. A continuacin citamos dos definiciones de falla:
1) La terminacin de la habilidad de un producto entendido como un todo, para
desarrollar la funcin que se le requiere.
2) La terminacin de la habilidad de cualquier componente individual para desarrollar su
funcin pero no la terminacin de la habilidad de operacin del producto entendido como
un todo.
Se entiende entonces que el MTBF impacta tanto a la confiabilidad como a la
disponibilidad, as que citamos las definiciones de estos trminos:
La Confiabilidad es la habilidad de un sistema o componente para desarrollar sus
funciones bajo condiciones pre-establecidas durante un perodo de tiempo especificado
[IEEE 90].
En otras palabras, es la probabilidad de que los sistemas o componentes tengan xito
durante el tiempo de la misin identificada, sin fallas. Una misin area es el perfecto
ejemplo para ilustrar este concepto. Cuando una aeronave despega para su misin, hay
un objetivo en mente: completar el vuelo, como se ha programado, con seguridad (sin
fallas catastrficas).
La Disponibilidad, por otro lado, es el grado al cual un sistema o componente es
operacional y accesible cuando se requiere su uso [IEEE 90].
La disponibilidad puede verse como la probabilidad de que el sistema o componente se
encuentre en estado de desarrollar su funcin requerida bajo ciertas condiciones en un
instante dado. La disponibilidad se determina por la confiabilidad del sistema, as como
tambin por el tiempo de recuperacin cuando una falla se produce. Cuando los sistemas
tienen tiempos de operacin continua muy largo, las fallas son inevitables y entonces lo
importante es recuperar la operacin del sistema lo ms pronto posible.
El valor del MTBF es una medida bsica de la confiabilidad del sistema. Se la representa
tpicamente en horas. Mientras ms alto es el valor del MTBF, mayor es la confiabilidad
del producto. La siguiente expresin ilustra esta relacin:

Confiabilidad = e

tiempo
MTBF

(1.1)

Universidad San Francisco de Quito

Procesos Estocsticos

Un malentendido comn respecto del MTBF es que es equivalente al nmero esperado de


horas de operacin antes de que el sistema falle, es decir a la vida de servicio.
Pongamos el siguiente ejemplo:
En la muestra de nuestra poblacin disponemos de 500.000 personas de 25 aos de edad.
En el trascurso de un ao, se recoge informacin sobre fallas (muertes) de los miembros
de esta poblacin. La vida operacional de la poblacin es de 500.00 x 1 ao= 500.000
aos. Puesto que en el ao 625 personas fallaron (murieron), la tasa de fallas es de
625/500.000 aos= 0,125%/ao. El MTBF es el inverso de la tasa de fallas, es decir
1/0,00125=800 aos. Esto significa que aunque las personas de 25 aos tienen valores
altos de MTBF, su expectativa de vida (vida de servicio) es mucho ms baja y no se
correlacionan. Si lo que pretendemos es que el MTBF y la vida de servicio se relacionen,
deberamos esperar a que toda la poblacin falle (muera) y entonces tendramos un valor
de MTBF de entre 75 y 80 aos. Ambos valores son correctos, pero difieren en las
asunciones realizadas. Lo cierto es que en general, se pretende disponer de un valor que
sirva hoy, y no uno que se obtenga cuando el producto en cuestin haya sido ya superado
tecnolgicamente por otro.
Por otra parte el Tiempo Medio de Recuperacin o MTTR (siglas en ingls de Mean
Time to Recover), es el tiempo esperado para recuperar un sistema de una falla y se
representa tambin en horas. Como lo muestra la siguiente ecuacin, MTTR impacta
sobre la disponibilidad y no sobre la confiabilidad. As tambin el MTBF afecta tambin
a la disponibilidad. Mientras mayor es el MTBF mejor es la disponibilidad, y mientras
mayor es el MTTR, peor es la disponibilidad del sistema.
MTBF
(1.2)
Disponibilidad =
MTBF + MTTR
Las expresiones anteriores son vlidas bajo el supuesto que el sistema exhibe una tasa de
fallas constante. Esto es cierto en componentes electrnicos nicamente en lo que se
conoce como el perodo de operacin normal o el perodo de vida til del sistema en
cuestin, como se observa de la figura 1.

Universidad San Francisco de Quito

Procesos Estocsticos

Mtodos para predecir y estimar el MTBF


En ocasiones los trminos prediccin y estimacin aparecen como sinnimos, pero en
realidad tienen significados diversos. Los mtodos que predicen el MTBF calculan un
valor en base al diseo del sistema, usualmente realizado en una etapa temprana dentro
del ciclo de vida del producto. Los mtodos de estimacin por otro lado se consiguen de
mediciones de fallas, y se calculan de la observacin de muestras de sistemas similares,
usualmente despus de que una gran poblacin ha sido implementada en el campo. Su
uso por tanto es el ms recomendado y el ms difundido en la industria.
Mtodos de Prediccin de la Confiabilidad:

MIL-HDBK 217.- Bajo este estndar, hay dos formas de predecir la


confiabilidad: Prediccin por cuenta de Partes y Prediccin por Anlisis de
Esfuerzos en Partes.

La Prediccin por cuenta de Partes implica que la tasa de fallas se calcula


literalmente contando los componentes similares de un producto y agruparlos en
varios tipos de componentes. El nmero de componentes en cada grupo se multiplica
entonces por una tasa de fallas genrica, encontrndose as el factor de calidad.
Finalmente, las tasas de falla de todos los diferentes grupos de partes se suman para
conseguir la tasa de fallas final.
La Prediccin por Anlisis de Esfuerzos en Partes se utiliza mucho ms tarde en el
ciclo de desarrollo del producto, cuando el diseo de los circuitos actuales y el
hardware estn cerca de la produccin. La tasa de falla para cada componente se
calcula individualmente en base a los niveles de esfuerzo especficos a los cuales se
sujeta al componente (por ejemplo humedad, temperatura, vibracin, voltaje). Esta
metodologa generalmente conduce a una tasa de fallas menor que la anterior, y
debido al nivel de anlisis requerido, este mtodo consume mucho ms tiempo en
comparacin con otros.

Telcordia.- Este mtodo originalmente basado en MIL 217, aadi


posteriormente informacin de campo para posibilitar la estimacin de la
confiabilidad de equipos de telecomunicaciones.
Ha sufrido varias
actualizaciones. Su ltima revisin corresponde a SR-332 Publicacin 1, lanzada
en mayo de 2001. Esta metodologa contina aplicndose comu una herramienta
de diseo de producto dentro de esta industria.

HRD5 (Handbook for Reliability Data for Electronic Components).Desarrollada por British Telecom y usada exclusivamente en el Reino Unido, es
similar a 217.

Universidad San Francisco de Quito

Procesos Estocsticos

RBD (Reliability Block Diagram).- Es un dibujo representativo y una


herramienta de clculo que se usa para modelar la disponibilidad y confiabilidad
de un sistema. La estructura del diagrama de bloques define la interaccin lgica
de las fallas dentro de un sistema y no necesariamente sus conexiones lgicas o
fsicas en conjunto. Puede modelar un sistema, un subsistema o un componente.
Muestra el funcionamiento de un sistema y como la falla en un componente puede
afectar la operacin de un sistema visto como un todo.

Modelos de Markov.- Proveen la habilidad para analizar los sistemas complejos


tales como arquitecturas elctricas. Se conocen tambin como diagramas de
espacio de estados o grafos de estado. El espacio de estados se define como un
conjunto de todos los estados en los cuales el sistema puede estar. A diferencia de
los diagramas de bloques, los grafos de estado proveen una representacin ms
exacta de un sistema. El uso de grafos de estado el til para mostrar dependencias
de fallas a componentes, y varios estados que el diagrama de bloques no puede
representar. Adems del MTBF, los modelos de Markov proveen varias medidas
de un sistema que incluyen la disponibilidad, el MTTR, la probabilidad de estar
en un estado dado en un tiempo especificado, etc.

FMEA/FMECA.- El FMEA (Failure Mode and Effect Analysis) es un proceso


usado en el anlisis de los modos de falla de un producto. El anlisis puede ir un
paso hacia delante asignando un nivel de severidad a cada un de los modos de
falla, en cuyo caso toma el nombre de FMECA (Failure Mode, Effects and
Criticality Analysis). FMEA usa una aproximacin de abajo hacia arriba, es decir
desde los componentes hasta el sistema completo. Adems de usarse como una
herramienta de diseo de producto, puede usarse para calcular la confiabilidad del
sistema completo. Requiere de informacin de probabilidad que puede ser difcil
de obtener para ciertas partes del equipamiento.

rbol de Fallas.- Es una tcnica que puede ayudar a detallar el trayecto de los
eventos, tanto relacionados al funcionamiento normal como a eventos de falla, los
cuales conducen hacia las fallas a nivel de componentes o hacia los eventos
indeseados que se investigan (aproximacin de arriba hacia abajo). La
confiabilidad se calcula convirtiendo un rbol de fallas completo en un sistema de
ecuaciones equivalente, usando el lgebra de Boole. La informacin de
probabilidad requerida por esta metodologa puede ser difcil de obtener.

HALT (Highly Accelerated Life Testing).- Se usa para establecer cunto tiempo
lleva alcanzar el punto de ruptura de un producto, sujetndolo a esfuerzos
cuidadosamente medidos y controlados, tales como temperatura y vibracin.
Utiliza un modelo matemtico para estimar el tiempo que habra tomado para que
el producto fallara en el campo. Aunque HALT puede estimar el MTBF, su
funcin principal es mejorar la confiabilidad del diseo del producto.

Universidad San Francisco de Quito

Procesos Estocsticos

Mtodos de Prediccin de la Confiabilidad:

Mtodo de Prediccin de Artculos Similares.- Se basa en estimar la


confiabilidad a partir de registros histricos de artculos similares. Su efectividad
depende de cun similar es el nuevo equipamiento con respecto al existente y
cuya informacin se encuentra disponible. La similitud debe entenderse en
trminos de procesos de manufactura, funciones del producto y diseos. Las
diferencias deben estudiarse cuidadosamente para la prediccin final.

Mtodo de Medicin de Informacin en Campo.- Es posiblemente el mtodo ms


utilizado por los fabricantes, y consiste en hacer seguimiento de una muestra de la
poblacin de nuevos productos. Una vez que se recoge la informacin, se
calculan la tasa de fallas y el MTBF. La tasa de fallas es el porcentaje de la
poblacin de unidades que se espera que fallen en un ao calendario.
Adicionalmente al uso de esta informacin para el control de calidad, se provee
tambin a los clientes y socios con informacin al respecto de la confiabilidad de
sus productos y procesos de calidad. Dado que este mtodo es tan ampliamente
utilizado por los fabricantes, provee una referencia comn para comparar valores
del MTBF. Esta informacin puede ser utilizada por los usuarios para valorar
diferencias de calidad en el equipamiento ofrecido por los diversos fabricantes y
tomar decisiones en consecuencia. Para efectuar dichas comparaciones, las
variables crticas consideradas deben ser las mismas para asegurar que el proceso
de decisin sea el correcto.

Conclusiones:
La palabra MTBF se utiliza comnmente en la industria como una alarma. Los
nmeros se lanzan sin un entendimiento de lo que verdaderamente representan. Mientras
el MTBF es una indicacin de la confiabilidad, no representa la vida media de servicio
del producto. En ltimo trmino, un valor de MTBF no tiene significado si la falla es
indefinida y las asunciones son confusas o no son realistas.

Referencias:
Las ideas de este artculo se han extrado de:
Mean Time Between Failure: Explanation and Standards; Wendy Torrel, Victor
Abelar; White Paper #78; American Power Conversio, 2004; www.apc.com.

También podría gustarte