Está en la página 1de 7

FIABILIDAD (VIII): ANLISIS PROBIT (XITO / FRACASO)

RELACIN CON OTROS MATH-BLOCS__________________________________


Este math-block forma parte de una serie de 8 documentos relacionados todos ellos con la Fiabilidad de componentes desde un punto de vista estadstico: Conceptos Bsicos (I). Identificacin y descripcin grfica de los datos (II). Anlisis paramtrico de los tiempos de fallo (III). Anlisis no paramtrico de los tiempos de fallo (IV). Comparacin no paramtrica de muestras (V). Tests de vida acelerada (VI). Modelos de regresin para observaciones censuradas (VII). Anlisis Probit (xito / fracaso) (VIII).

Fiabilidad (VII): Anlisis Probit (xito/fracaso)

.M

El modelo probit y la funcin de distribucin

at

em
Ejemplo anlisis probit (Minitab)

at

ic

a1

.c

om

ESQUEMA DE CONTENIDOS___________________________________________

INTRODUCCIN______________________________________________
Dado un conjunto de dispositivos, realizar con ellos un anlisis probit consiste en: 1) someterlos a condiciones extremas (condiciones de estrs), y 2) estudiar la proporcin de dispositivos que fallan en tales condiciones.

Observar que, a diferencia de un test de vida acelerada (donde lo que se busca es el tiempo de fallo de una determinada proporcin de dispositivos), aqu lo que se pretende es determinar si cada uno de los dispositivos sometidos al anlisis ha fallado o no, i.e., se trabajar con variables binarias (xito o fracaso) en lugar de con tiempos de fallo. Las aplicaciones de este tipo de anlisis son mltiples e interdisciplinares. Dos ejemplos: 1) Supongamos que se pretende analizar el comportamiento del casco de un submarino sometido a distintos niveles de presin. Para realizar dicho anlisis, podran someterse varias planchas metlicas del casco a niveles de presin de distinta magnitud, anotando en cada caso el nmero de piezas que sobreviven (no se resquebrajan) a cada nivel. 2) Un estudio similar se podra aplicar para determinar qu niveles de una variable de estrs causaran la muerte a una determinada proporcin de organismos vivos. As, por ejemplo, podra resultar interesante el averiguar qu nivel de contaminacin ambiental causara la muerte al 30% de los peces de un ro. A la hora de registrar los datos (es decir, de contabilizar el nmero de xitos y fracasos), suele usarse alguno de los dos formatos equivalentes que se muestran a continuacin: Formato xitos/Pruebas. En este formato se usan tres columnas, la primera de las cuales contendr los distintos valores de la variable de estrs. La segunda y tercera columnas contendrn, respectivamente, el nmero de xitos (fallos) contabilizados y el nmero de pruebas asociados a cada valor de la variable de estrs: Temp. 80 120 140 160

.M

at

em

xitos 2 4 7 9

at

ic

a1

.c

om

Pruebas 10 10 10 10

Formato Respuesta/Frecuencia. En este formato tambin se usan tres columnas: la primera de ellas contendr los distintos valores de la variable de estrs, la segunda contendr valores 1 (xito) y 0 (fracaso), mientras que la tercera contendr la frecuencia con que aparece cada 1 cada 0 para el valor de estrs asociado: Temp. 80 80 120 120 140 140 160 160 respuesta 1 0 1 0 1 0 1 0 frec. 2 8 4 6 7 3 9 1

En ocasiones puede resultar conveniente usar una variable factor que permita agrupar los dispositivos analizados en diferentes clases o niveles. As, en el ejemplo anterior de la contaminacin, se podran clasificar los peces en tres niveles segn sean jvenes, adultos, o viejos. De esta forma, el

investigador sabr si el ndice de contaminacin afecta de forma especial a alguno de estos niveles o si afecta a todos por igual.

EL MODELO PROBIT Y LA FUNCIN DE DISTRIBUCIN____________________

El modelo probit presupone que se conoce la distribucin de la v.a. X que determina el nivel de estrs (temperatura, voltaje, presin, etc.). Ms concretamente, lo que el modelo presupone es que el analista ser capaz de ajustar, mediante una distribucin terica, la distribucin que sigue la v.a. Y, la cual es una transformacin lineal de X. Habitualmente, dicha variable Y seguir una distribucin normal, logstica, o de valores extremos. En ocasiones, sin embargo, ser mejor ajustar la distribucin de Z = log(Y) mediante una log-normal, una log-logstica, o una Weibull. La distribucin que se elija depender, obviamente, de los valores observados para la variable de estrs X, siendo necesario realizar un test de bondad de ajuste para comprobar que el modelo es vlido. El objetivo del anlisis ser estudiar el efecto causado por los cambios en la variable de estrs X sobre la probabilidad de xito (es decir, sobre la probabilidad de que el dispositivo falle). La expresin genrica de estos modelos, suponiendo que no hay variables factores, sera la siguiente: donde:
= c + (1 - c) F( 0 + X ) = probabilidad de xito (i.e., probabilidad de que el dispositivo falle), F(Y) = funcin de distribucin de la v.a. Y = 0 + X, 0 = trmino constante, X = variable de estrs, = coeficiente (desconocido) asociado a la variable de estrs, c = tasa de fallo natural (proporcin de dispositivos que fallan por causas naturales).

.M

at

em

at

ic

a1

.c

om

EJEMPLO DE ANLISIS PROBIT CON MINITAB___________________________

Ejemplo (anlisis probit): Supongamos el caso de una empresa dedicada a la produccin de dos clases de tubos fluorescentes, A y B. El objetivo ser determinar qu proporcin de cada clase de tubos logra superar las 800 horas de funcionamiento si se encuentran sometidos a un voltaje que vara entre 105 y 129 voltios. Para resolver este problema, se ha llevado a cabo el experimento siguiente: para cada combinacin voltaje - tipo de tubo posible, se han realizado 50 pruebas, contabilizndose el nmero de veces que el tubo ha fallado antes de 800 horas (variable xitos). Los voltajes usados han sido los siguientes: 108, 114, 120, 126, y 132 voltios. Los datos se encuentran en el archivo Tubos.mtw :

Factor

Le pediremos tambin al programa que estime la probabilidad de supervivencia (o proporcin de dispositivos supervivientes) bajo unas condiciones de 117 voltios:

.M

Entrada de datos (input): se configura la ventana inicial segn se indica en la imagen. Se ha supuesto que los datos (en este caso Z = log(Y)) siguen una distribucin Weibull. Adems, tambin se ha solicitado un grfico de probabilidad:

at

em

at

ic

Variable de estrs

a1

.c

om

Fallos antes de las 800 horas

Salida de datos (output): El programa proporciona la siguiente informacin:

Probit Analysis: Exitos; Pruebas versus Voltaje; TipoTubo Distribution: Response Variable Exitos Pruebas Factor TipoTubo Weibull Count 192 308 500
La tasa de fallo natural es la probabilidad de que una unidad falle por causa natural (no por culpa de la variable independiente). Si su valor fuese mayor que 0, deberamos pensar que no todos los dispositivos fallan por culpa de la variable independiente.

Information Value Success Failure Total Levels Values

at

em

at

Factor Information 2 A B

ic

a1

.c

om

Regression Table Variable Constant Voltaje TipoTubo B Natural Response Coef -97,019 20,019 0,1794 0,000 Chi-Square = 0,2585; Standard Error 7,673 1,587 0,1598 Z P -12,64 0,000 12,61 0,000 1,12 0,262

Estimation Method:

Maximum Likelihood

Estos son los p-valores resultantes de los test cuya hiptesis nula es: el coeficiente asociado a la variable es cero (i.e., H0 propone que la variable NO influye sobre la probabilidad de que el dispositivo falle).

.M

P-valor del test con H0: las pendientes asociadas a cada nivel del factor NO son significativamente diferentes

Test for equal slopes:

DF = 1;

P-Value = 0,611

Log-Likelihood = -214,213 Goodness-of-Fit Tests Method Pearson Deviance Chi-Square 2,516 2,492 DF 7 7 P 0,926 0,928
P-valores asociados a dos tests para contrastar la bondad del ajuste de la distribucin escogida (Weibull en este caso). La hiptesis nula es: el ajuste es correcto.

TipoTubo = A Tolerance Distribution Parameter Estimates Parameter Shape Scale Estimate 20,019 127,269

Parmetros estimados de la distribucin elegida que mejor ajustan a las observaciones del factor (tipo de tubo) A. Standard Error 1,587 0,737 Standard Error 1,8424 1,6355 ... 1,1177 0,8986 0,7901 0,7358 0,7179 0,7285 0,7650 0,8304 0,9434 ... 1,1616 1,2383 95,0% Normal CI Lower Upper 17,138 23,384 125,832 128,722 95,0% Fiducial CI Lower Upper 96,9868 104,3407 101,0429 107,5731 ... ... 111,2458 115,7062 116,1208 119,7003 119,2012 122,3424 121,5505 124,4720 123,5231 126,3718 125,2994 128,1912 127,0098 130,0499 128,8022 132,1080 130,9889 134,7539 ... ... 134,2068 138,8567 135,1984 140,1594

Table of Percentiles Percent Percentile 1 101,1409 2 104,7307 ... ... 10 113,7373 20 118,0817 30 120,8808 40 123,0693 50 124,9600 60 126,7143 70 128,4545 80 130,3305 90 132,6831 ... ... 98 136,2429 99 137,3576

A 118 voltios, el 20% de los tubos tipo A se estropearn antes de las 800 horas

A 117 voltios, la probabilidad de que un tubo de tipo A pase de 800 horas es de 0,8306

Table of Survival Probabilities 95,0% Fiducial CI Stress Probability Lower Upper 117,0000 0,8306 0,7807 0,8785 TipoTubo = B

Parmetros estimados de la distribucin elegida que mejor ajustan a las observaciones del factor (tipo de tubo) B.

Table of Percentiles Percent Percentile 1 100,2388 2 103,7965 ... ... 10 112,7228 20 117,0285 30 119,8026 40 121,9716 50 123,8454 60 125,5841 70 127,3087 80 129,1680 90 131,4996 91 131,7938 ... ... 98 135,0277 99 136,1324

Standard Error 1,8617 1,6562 ... 1,1371 0,9108 0,7929 0,7280 0,6989 0,6988 0,7252 0,7814 0,8857 0,9010 ... 1,0945 1,1690

.M

at

Parameter Shape Scale

Estimate 20,019 126,134

Standard Error 1,587 0,704

95,0% Normal CI Lower Upper 17,138 23,384 124,761 127,522

95,0% Fiducial CI Lower Upper 96,0399 103,4706 100,0595 106,6728 ... ... 110,1805 114,7197 115,0289 118,6590 118,1018 121,2561 120,4520 123,3436 122,4294 125,2031 124,2111 126,9841 125,9254 128,8060 127,7187 130,8279 129,9012 133,4336 130,1723 133,7670 ... ... 133,1042 137,4840 134,0898 138,7716

em

at

ic

Tolerance Distribution Parameter Estimates

a1

.c

om

A 122 voltios, el 40% de los tubos tipo B se estropean antes de las 800 horas

A 117 voltios, la probabilidad de que un tubo de tipo B pase de 800 horas es de 0,8009

Table of Survival Probabilities 95,0% Fiducial CI Stress Probability Lower Upper 117,0000 0,8009 0,7460 0,8546 Table of Relative Potency Factor: TipoTubo Relative Comparison Potency A VS B 0,9911 95,0% Fiducial CI Lower Upper 0,9754 1,0068

Nos dice que un tubo de tipo A que soporte 117 voltios fallar en el mismo instante que otro de tipo B que soporte 115,96 voltios (117 x 0,9911)

Probability Plot for Exitos


Weibull Distribution - ML Estimates Probit Data
A 99 95 90 80 70 60 50 40 30 20 10 5 3 2 1 B Shape 4,8463 4,8373 Scale 0,04995 0,04995

Percent

100

110

120

130

Voltaje

La Tabla de Probabilidades de Supervivencia muestra que, a 117 voltios, el 83% de los tubos de tipo A y el 80% de los del tipo B durarn ms de 800 horas. Finalmente, la Tabla de Percentiles informa de que, a 124,96 voltios, el 50% de los tubos tipo A no sobrepasarn las 800 horas; para los tubos de tipo B, este 50% de tubos que no logran superar la cifra anterior se alcanzar ya a 123,85 voltios.

BIBLIOGRAFA______________________________________________________
[1]. [2]. [3]. [4]. [5]. [6]. [7]. [8]. [9]. [10]. [11]. Brodsky B., Dharkovsky B. Nonparametric methods in change-point problems. Kluwer Academic. 1993. Conover, W. J. Practical nonparametric statistics. 2nd edition. USA. Wiley & Sons. 1980. Daniel, W. Applied Nonparametric Statistics. 2nd edition. USA. PWS Kent. 1990. Gibbons, J. Nonparametric Statistical Inference. 2nd edition. USA. Dekker. 1985. Hajek, J. A course in nonparametric statistics. USA. Holden Day. 1969. Hollander, M., D. Wolfe. Nonparametric Statistical Methods. USA. John Wiley & Sons. Randles R., D. Wolfe. Introduction to the Theory of Nonparametric Statistics. USA. John Wiley & Sons, 1991. Agresti, A. Analysis of ordinal categorical data. USA. John Wiley & Sons. 1984. Finney, D. J. Probit Analysis. 3rd edition. USA. Cambridge University Press. 1971. Fraser, D. A. S. Inference and Linear Models. USA. McGraw Hill, 1979. MaCullagh, P. y J. A. Nelder. Generalized Linear Models. USA. Chapman and Hall.

Adems, dado que el test sobre igual pendiente de ambos factores no es significativo (p-valor = 0,611), la comparacin entre ambos tipos de tubos no depender del voltaje al que estn sometidos. En este caso, los tubos de tipo A no son significativamente diferentes de los del tipo B ya que el coeficiente asociado a este segundo tipo no es significativamente distinto de 0 (p-valor = 0.262).

.M

at

em

at

ic

Analizando los resultados, se comprueba que tanto los dos tests de bondad de ajuste (con p-valores 0,926 y 0,928) como el grfico de probabilidad sugieren que la distribucin de Weibull se ajusta de forma correcta a los datos.

a1

.c

om