Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Lectura No 8. - Estimación Intervalos Parámetros Binomial - RARE
Lectura No 8. - Estimación Intervalos Parámetros Binomial - RARE
8
Estimación del Intervalo de Confianza para el Parámetro
Probabilidad de Fracaso (p) de la Distribución Binomial
apoyados en la Herramienta RARE
Estimación del Intervalo de Confianza del Parámetro Probabilidad de
Fracaso (p) de la Distribución Binomial, apoyados en la Herramienta
RARE.xls
1.- Introducción:
En su forma más general el proceso para ajustar un tipo de distribución o modelo matemático al
comportamiento de una “muestra representativa” de una población, se resume en la siguiente
figura y es conocido como Caracterización Probabilística de Variables:
f 7
F 1( X ,θ1 ,θ 2 ) Fm ( X , γ 1 , γ 2 ) F 2( X ,α1 ,α 2 )
6
Muestra F
0
x
F(x)
1
2
0.8
X1 0.6 1
0.4
X2
0.2
8
0
0 .0 64 -0 .0 86 0 .0 8 6-0 .10 8 0 .10 8 -0.13 0 .13-0 .152 0.152 -0.174 0 .174-0 .196 0 .196 -0.2 18 0.218 -0 .2 4
x
6
X3
4
X4 Establecer Distribución de
2
Probabilidad “Hipótesis”
. 0
0.064-0.086 0.086-0.108 0.108-0.13 0.13-0.152 0.152-0.174 0.174-0.196 0.196-0.218 0.218-0.24 X
.
Test de Bondad de Ajuste
. f1 ( x,θ1 ,θ 2 )
Hipótesis 1
Xn F1 ( x,θ1 ,θ 2 )
n= número de f2 ( x,α1 ,α 2 )
datos de la Hipótesis 2 F 2( X ,α1 ,α 2 )
muestra o F2 ( x,α1 ,α 2 )
“tamaño de
muestra” fm ( x, γ 1 , γ 2 ) Es el mejor ajuste para los
Hipótesis m Fm ( x, γ 1 , γ 2 ) Datos de la Muestra
Es importante recordar que los parámetros θ1 y θ2 se calculan desde los datos de la muestra y que
para que la distribución seleccionada como mejor ajuste (F2(X,θ1,θ2)) realmente represente el
comportamiento de la población, la muestra debe ser “REPRESENTATIVA”; pero ¿qué es una
muestra representativa?
Una muestra representativa debe poseer dos características fundamentales:
• Los elementos de la muestra deben ser suficientemente heterogéneos como para
representar la heterogeneidad de la población, en términos de la característica que se
evalúa. Es decir, no deben tomarse muestras sesgadas.
• El tamaño de la muestra utilizada debe ser suficientemente grande como para que la
inferencia que se hace sobre el comportamiento de la población sea representativa y se
ajuste a la realidad.
Se sabe que los procesos de “éxitos – fracasos” pueden caracterizarse con la distribución
BINOMIAL, que depende de 2 parámetros, el parámetro “p=probabilidad de fracaso por intento” y
“n=número de intentos”.
fracasos : k = 1
trials : n = 10
1
p = prob.fracaso = = 0.1
10
fracasos : k = 3
trials : n = 30
3
p = prob.fracaso = = 0 .1
30
Con ambas muestras se obtiene el mismo estimado para la probabilidad de fracaso “p=0.1”; sin
embargo, a pesar de obtener el mismo resultado, la intuición hace que la estimación de la
probabilidad hecha con la muestra 2 genere “mayor confianza” porque la muestra es más grande.
¿Cómo puede calcularse este “grado de confianza” asociado a la estimación anterior para
caracterizar la influencia del tamaño de la muestra?.
Esta pregunta es contestada por un área de la estadística que aborda el tema de “Intervalos de
Confianza en el cálculo de Parámetros”. En esta área se plantea que un parámetro “θ” no es
una cantidad determinística, sino que es una variable dispersa, cuya dispersión varía en un rango:
θ LOW ≤ θ ≤ θ HIGHT
La formulación matemática de esta área está ampliamente documentada en las referencias [1],[2],[3] y
[4]
. En dichas referencias se desarrollan métodos y fórmulas para la estimación de θLOW, θ y θHIGHT
para los distintos tipos de distribuciones conocidas.
Para el caso particular de la distribución BINOMIAL, que caracteriza los procesos de “éxito y
fracaso”, la referencia [2] propone varios métodos para el cálculo del intervalo, de los cuales el más
confiable se resume en las siguientes ecuaciones:
1 k 1
≤p= ≤
pLOW ≤ p ≤ pHIGHT ⇒ 1+
n − k +1
k (F2 k ,2 ( n −k +1),1−α )
n 1+ n−k
k + 1(F2 ( k +1),2 ( n −k ),α )
2 2
En otras palabras, para el caso del parámetro “p=probabilidad de fracaso”, se plantean las
siguientes ecuaciones:
A continuación se plantea un ejemplo que permitirá visualizar a través de los resultados que el
“ancho o incertidumbre” de este rango depende del tamaño de la muestra analizada y del
grado de confianza que se le dará a la estimación. El ejemplo mencionado se desarrollará con
el apoyo de la herramienta computacional RARE.xls que contiene los métodos matemáticos
previamente mencionados y en consecuencia facilita los cálculos.
Herramienta RARE:
Solución:
Paso No. 1: Para cada una de las muestras de datos suministradas, calcular la probabilidad de
fracaso con base a los eventos de fracaso presentados y el tamaño de la muestra, según la
ecuación:
k
p=
n
Probabilidad de
Fracasos Intentos
Fracaso
k n
"p"
MUESTRA # 1: 1 10 0,1
MUESTRA # 2: 3 30 0,1
Paso No. 3: Ejecutar el archivo copiado. Podrá observar cómo son creados un grupo de archivos
utilizados por el RARE. Ejecutar el programa haciendo doble click sobre el archivo denominado
RARE.xls el cual permite acceder directamente a la aplicación, tal como se indica en la figura
anexa.
Paso No. 4: Una vez ejecutado el archivo RARE.xls, se desplegará una pantalla tal como se
muestra en la siguiente figura. Hacer Click sobre el botón “Aceptar”.
Paso No. 5: A continuación se presentará en su pantalla una ventana que despliega todas las
aplicaciones desarrolladas en la herramienta RARE.
Paso No. 6: Seleccionar la aplicación “Interval Estimation” y hacer Click en el Botón “Start Selected
Program”.
Paso No. 7: A continuación se desplegará la ventana mostrada en la figura anexa. Nótese que la
aplicación está desarrollada para 6 Distribuciones Tipo (Binomial, Normal, Lognormal, etc).
Paso No. 8: Para efectos del ejercicio bajo análisis seleccionar la Distribución Binomial e iniciar el
proceso de estimación del rango del parámetro “Probabilidad de Fracaso (p)” tantas veces como
niveles de confianza se deseen comparar. Nótese que el procedimiento debe efectuarse para cada
muestra por separado.
No. de Intentos
No. de Fallas
Distribución
Nivel de
Confianza
Paso No. 9: Una vez seleccionada la Distribución Binomial, e incluir los números de intentos y
eventos de fracaso para cada muestra, se procede a hacer click sobre el botón “Compute” y anotar
los valores suministrados para el parámetro “p” (probabilidad de fracaso):
Paso No. 11: Una vez indicado lo anteriormente expuesto, se cerrará la aplicación RARE, y se
debe proceder organizar los resultados tal como se indica en la tabla siguiente y continuar con el
análisis de la incidencia del tamaño de la muestra sobre la incertidumbre en la variable de salida.
Muestra 1 Muestra 2
Número de Número de
k 1 k 3
Fracasos Fracasos
Número de Número de
n 10 n 30
Intentos Intentos
Estimado Estimado Estimado Estimado Estimado Estimado
Grado de
"Optimista" "Mas Probable" "Pesimista" "Optimista" "Mas Probable" "Pesimista"
Confianza
p LOW p p HIGHT p LOW p p HIGHT
1. Modarres, Mohammad; Kaminsky, Mark; Kritsov, Vasily. “Reliability Engineering And Risk
Analysis”. Marcel Dekker, New York,1999.
2. Correa M, Juan; Sierra L, Esperanza; “Intervalos de confianza para el parámetro de la
distribución Binomial” - Revista Colombiana de Estadística - Volumen 24 (2001) No 1, páginas
59 a 72.
3. NASA, “Probabilistic Risk Assessment for NASA Managers and Practitioners”, Versión 1.1,
Agosto 2002
4. Reliability and Risk Management S.A – Confiabilidad Integral “Un Enfoque Práctico” – TOMO I
– www.reliarisk.com – Enero 2008