Está en la página 1de 12

Lectura No.

8
Estimación del Intervalo de Confianza para el Parámetro
Probabilidad de Fracaso (p) de la Distribución Binomial
apoyados en la Herramienta RARE
Estimación del Intervalo de Confianza del Parámetro Probabilidad de
Fracaso (p) de la Distribución Binomial, apoyados en la Herramienta
RARE.xls

Este documento presenta a través de un ejemplo el procedimiento para determinar el intervalo de


valores posibles a tomar por el parámetro Probabilidad de Fracaso (p) de la Distribución Binomial,
apoyados en la herramienta matemática desarrollada y conocida como RARE.

1.- Introducción:

En su forma más general el proceso para ajustar un tipo de distribución o modelo matemático al
comportamiento de una “muestra representativa” de una población, se resume en la siguiente
figura y es conocido como Caracterización Probabilística de Variables:

f 7

F 1( X ,θ1 ,θ 2 ) Fm ( X , γ 1 , γ 2 ) F 2( X ,α1 ,α 2 )
6

Muestra F
0
x
F(x)
1
2
0.8

X1 0.6 1
0.4

X2
0.2
8
0
0 .0 64 -0 .0 86 0 .0 8 6-0 .10 8 0 .10 8 -0.13 0 .13-0 .152 0.152 -0.174 0 .174-0 .196 0 .196 -0.2 18 0.218 -0 .2 4
x
6
X3
4

X4 Establecer Distribución de
2

Probabilidad “Hipótesis”
. 0
0.064-0.086 0.086-0.108 0.108-0.13 0.13-0.152 0.152-0.174 0.174-0.196 0.196-0.218 0.218-0.24 X
.
Test de Bondad de Ajuste
. f1 ( x,θ1 ,θ 2 )
Hipótesis 1
Xn F1 ( x,θ1 ,θ 2 )
n= número de f2 ( x,α1 ,α 2 )
datos de la Hipótesis 2 F 2( X ,α1 ,α 2 )
muestra o F2 ( x,α1 ,α 2 )
“tamaño de
muestra” fm ( x, γ 1 , γ 2 ) Es el mejor ajuste para los
Hipótesis m Fm ( x, γ 1 , γ 2 ) Datos de la Muestra

Figura 1. Modelo General Caracterización Probabilística de Variables – Test de Bondad de Ajuste

Como puede observarse en la figura 1, para caracterizar el comportamiento de una muestra de


tamaño “n”, de la variable aleatoría “X”, se plantean diversas hipótesis de modelos probabilísticos y
se selecciona el modelo de distribución paramétrica que mejor ajusta a esta muestra, utilizando
para esta selección un Test de Bondad de Ajuste (Chi Cuadrado, Kolmogorov-Smirnov o
Anderson-Darling). El modelo seleccionado es función de la variable aleatoria “X” y de los
parámetros θ1 y θ2 que se denota en la figura como F2(X,θ1,θ2).

Es importante recordar que los parámetros θ1 y θ2 se calculan desde los datos de la muestra y que
para que la distribución seleccionada como mejor ajuste (F2(X,θ1,θ2)) realmente represente el
comportamiento de la población, la muestra debe ser “REPRESENTATIVA”; pero ¿qué es una
muestra representativa?
Una muestra representativa debe poseer dos características fundamentales:
• Los elementos de la muestra deben ser suficientemente heterogéneos como para
representar la heterogeneidad de la población, en términos de la característica que se
evalúa. Es decir, no deben tomarse muestras sesgadas.

• El tamaño de la muestra utilizada debe ser suficientemente grande como para que la
inferencia que se hace sobre el comportamiento de la población sea representativa y se
ajuste a la realidad.

Ambas características dependen de los datos de la muestra y en consecuencia afectan el cálculo


de los parámetros θ1 y θ2. El efecto de la heterogeneidad y del tamaño de la muestra se reflejan en
la distribución F2(X,θ1,θ2) a través del cálculo θ1 y θ2 .

Para entender un poco mejor lo antes descrito, se analizará el siguiente ejemplo:

Supongamos que se tienen dos historias de perforaciones de pozos en yacimientos similares al


yacimiento que estamos perforando:

• Una muestra 1 tomada en el yacimiento R2M, en el que se han perforado 10


localizaciones, con un solo fracaso y 9 éxitos.

• Una muestra 2 tomada en el yacimiento RZM, en el que se han perforado 30


localizaciones, con tres fracasos y 27 éxitos.

Se sabe que los procesos de “éxitos – fracasos” pueden caracterizarse con la distribución
BINOMIAL, que depende de 2 parámetros, el parámetro “p=probabilidad de fracaso por intento” y
“n=número de intentos”.

• Si se calcula la probabilidad de fracaso por intento (“Trials”) para la muestra 1, se obtiene:

fracasos : k = 1
trials : n = 10
1
p = prob.fracaso = = 0.1
10

• Si se calcula la probabilidad de fracaso por intento (“Trials”) para la muestra 2, se obtiene:

fracasos : k = 3
trials : n = 30
3
p = prob.fracaso = = 0 .1
30

Con ambas muestras se obtiene el mismo estimado para la probabilidad de fracaso “p=0.1”; sin
embargo, a pesar de obtener el mismo resultado, la intuición hace que la estimación de la
probabilidad hecha con la muestra 2 genere “mayor confianza” porque la muestra es más grande.

¿Cómo puede calcularse este “grado de confianza” asociado a la estimación anterior para
caracterizar la influencia del tamaño de la muestra?.
Esta pregunta es contestada por un área de la estadística que aborda el tema de “Intervalos de
Confianza en el cálculo de Parámetros”. En esta área se plantea que un parámetro “θ” no es
una cantidad determinística, sino que es una variable dispersa, cuya dispersión varía en un rango:

θ LOW ≤ θ ≤ θ HIGHT

La formulación matemática de esta área está ampliamente documentada en las referencias [1],[2],[3] y
[4]
. En dichas referencias se desarrollan métodos y fórmulas para la estimación de θLOW, θ y θHIGHT
para los distintos tipos de distribuciones conocidas.

Para el caso particular de la distribución BINOMIAL, que caracteriza los procesos de “éxito y
fracaso”, la referencia [2] propone varios métodos para el cálculo del intervalo, de los cuales el más
confiable se resume en las siguientes ecuaciones:

1 k 1
≤p= ≤
pLOW ≤ p ≤ pHIGHT ⇒ 1+
n − k +1
k (F2 k ,2 ( n −k +1),1−α )
n 1+ n−k
k + 1(F2 ( k +1),2 ( n −k ),α )
2 2

En otras palabras, para el caso del parámetro “p=probabilidad de fracaso”, se plantean las
siguientes ecuaciones:

Estimado “Optimista” Estimado “Mas Probable” Estimado “Pesimista”


1 1
pLOW = k pHIGT =
1+
n − k +1 p= 1+
n−k
k (F2 k ,2 ( n − k +1 ),1−α ) n k + 1(F2 ( k +1 ),2 ( n −k ),α )
2 2

A continuación se plantea un ejemplo que permitirá visualizar a través de los resultados que el
“ancho o incertidumbre” de este rango depende del tamaño de la muestra analizada y del
grado de confianza que se le dará a la estimación. El ejemplo mencionado se desarrollará con
el apoyo de la herramienta computacional RARE.xls que contiene los métodos matemáticos
previamente mencionados y en consecuencia facilita los cálculos.

Herramienta RARE:

La herramienta computacional RARE.xls es una herramienta libre, desarrollada en la Escuela de


Ingeniería de Confiabilidad de la Universidad de Maryland (Reliability Análisis and Risk Evaluator-
RARE). RARE.xls es un programa amigable, diseñado en Visual Basic, compatible con MS Excel.

Recursos Físicos requeridos para el uso de RARE.xls:

• 1.5 MB de Espacio en disco duro.


• Windows 3.1 en adelante.
• MS Excel 5.0 u otro más actualizado. Excel debe tener activo en “Complementos” o “Add-In”
los módulos de Análisis Toolpak, Análisis Toolpak-VBA, Solver Add-In.
2.- Ejemplo – Estimación del intervalo de confianzas asociados al parámetro “Probabilidad
de Fracaso”.

A continuación se suministran 2 set de datos de pozos perforados y su éxito o fracaso asociado.


Ambas muestran han sido tomadas de pozos pertenecientes al Campo R2M. Para el primer set de
datos sólo se logró reunir un total de 10 pozos, sin embargo, un equipo de ingenieros se dedicó a
compilar información que no estaba reportada en los sistemas formales de información y lograron
enriquecer el primer set con 20 pozos adicionales, obteniendo se el set de datos No. 2.

Tabla No. 2: Muestra No. 2 de Pozos Campo R2M


Muestra 2: Pozos Campo R2M
Perforación Localización Éxito Fracaso
1 KPTZ X
2 CRAL X
3 HAVM X
Tabla No. 1: Muestra No. 1 de Pozos Campo R2M 4 GTHS X
Muestra 1: Pozos Campo R2M 5 RVHT X
Perforación Localización Éxito Fracaso 6 BCUB X
1 KPTZ X 7 MTSC X
2 GTHS X 8 JDLD X
3 RVHT X 9 PKTF X
4 HAVM X 10 JEIV X
5 JEIV X 11 HYSE X
6 HYSE X 12 HERR X
7 PLIA X 13 PLIA X
8 NBSE X 14 NBSE X
9 OKYB X 15 OKYB X
10 MNTD X 16 MNTD X
17 TBNM X
18 YTED X
19 SHG X
20 POWE X
21 NLAW X
22 QPLA X
23 OYEB X
24 NESR X
25 IUER X
26 AZVU X
27 OKEA X
28 BJCE X
29 UHA X
30 ERTF X
Para las muestras observadas en las tablas anexas, y utilizando la herramienta RARE.xls, estimar
los intervalos y el valor más probable para la “probabilidad de fracaso (p)” de la actividad de
perforación de un pozo nuevo en el Campo R2M para los niveles de confianza de 80, 90 y 99%.

Solución:

Paso No. 1: Para cada una de las muestras de datos suministradas, calcular la probabilidad de
fracaso con base a los eventos de fracaso presentados y el tamaño de la muestra, según la
ecuación:

k
p=
n

Obteniéndose los siguientes valores:

Probabilidad de
Fracasos Intentos
Fracaso
k n
"p"
MUESTRA # 1: 1 10 0,1
MUESTRA # 2: 3 30 0,1

Paso No. 2: Crear en su disco duro una carpeta denominada “RARE”.

Paso No. 3: Ejecutar el archivo copiado. Podrá observar cómo son creados un grupo de archivos
utilizados por el RARE. Ejecutar el programa haciendo doble click sobre el archivo denominado
RARE.xls el cual permite acceder directamente a la aplicación, tal como se indica en la figura
anexa.
Paso No. 4: Una vez ejecutado el archivo RARE.xls, se desplegará una pantalla tal como se
muestra en la siguiente figura. Hacer Click sobre el botón “Aceptar”.
Paso No. 5: A continuación se presentará en su pantalla una ventana que despliega todas las
aplicaciones desarrolladas en la herramienta RARE.

Paso No. 6: Seleccionar la aplicación “Interval Estimation” y hacer Click en el Botón “Start Selected
Program”.
Paso No. 7: A continuación se desplegará la ventana mostrada en la figura anexa. Nótese que la
aplicación está desarrollada para 6 Distribuciones Tipo (Binomial, Normal, Lognormal, etc).

Adicionalmente, dependiendo de la distribución seleccionada se despliega a la derecha de la


ventana la información necesaria para estimar los parámetros de la distribución correspondiente, y
por último, en la parte inferior de la ventana la herramienta mostrará los valores optimistas,
pesimistas y más probables del parámetro que se esté analizando acorde con el Nivel de
Confianza seleccionado.

Paso No. 8: Para efectos del ejercicio bajo análisis seleccionar la Distribución Binomial e iniciar el
proceso de estimación del rango del parámetro “Probabilidad de Fracaso (p)” tantas veces como
niveles de confianza se deseen comparar. Nótese que el procedimiento debe efectuarse para cada
muestra por separado.

No. de Intentos
No. de Fallas
Distribución

Nivel de
Confianza
Paso No. 9: Una vez seleccionada la Distribución Binomial, e incluir los números de intentos y
eventos de fracaso para cada muestra, se procede a hacer click sobre el botón “Compute” y anotar
los valores suministrados para el parámetro “p” (probabilidad de fracaso):

Point Estimate: Valor Más Probable


Two-Sided Bounds:
Lower: Valor Optimista
Upper: Valor Pesimista

Ejemplo: Para n=10 (número de intentos) y k=1 (número de fracasos) correspondiente a la


MUESTRA NO. 1 del ejercicio y un Nivel de Confianza de 99%, los valores del parámetro “p” son
los siguientes:

Point Estimate: Valor Más Probable = 0,1000


Two-Sided Bounds:
Lower: Valor Optimista = 0,0005
Upper: Valor Pesimista = 0,5440
Paso No. 10: Una vez realizado el cálculo para las MUESTRAS No. 1 y No. 2 del ejercicio bajo
análisis, hacer click sobre el botón “Quit” y se desplegará la ventana que se muestra en la siguiente
figura. Hacer click sobre el botón “NO”.

Paso No. 11: Una vez indicado lo anteriormente expuesto, se cerrará la aplicación RARE, y se
debe proceder organizar los resultados tal como se indica en la tabla siguiente y continuar con el
análisis de la incidencia del tamaño de la muestra sobre la incertidumbre en la variable de salida.

Muestra 1 Muestra 2
Número de Número de
k 1 k 3
Fracasos Fracasos
Número de Número de
n 10 n 30
Intentos Intentos
Estimado Estimado Estimado Estimado Estimado Estimado
Grado de
"Optimista" "Mas Probable" "Pesimista" "Optimista" "Mas Probable" "Pesimista"
Confianza
p LOW p p HIGHT p LOW p p HIGHT

80% 0.0105 0.1000 0.3370 0.0373 0.1000 0.2090

90% 0.0051 0.1000 0.3940 0.0279 0.1000 0.2390

99% 0.0005 0.1000 0.5440 0.0011 0.1000 0.3200


REFERENCIAS

1. Modarres, Mohammad; Kaminsky, Mark; Kritsov, Vasily. “Reliability Engineering And Risk
Analysis”. Marcel Dekker, New York,1999.
2. Correa M, Juan; Sierra L, Esperanza; “Intervalos de confianza para el parámetro de la
distribución Binomial” - Revista Colombiana de Estadística - Volumen 24 (2001) No 1, páginas
59 a 72.

3. NASA, “Probabilistic Risk Assessment for NASA Managers and Practitioners”, Versión 1.1,
Agosto 2002
4. Reliability and Risk Management S.A – Confiabilidad Integral “Un Enfoque Práctico” – TOMO I
– www.reliarisk.com – Enero 2008

También podría gustarte