Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Prueba de Bondad de Ajuste
Prueba de Bondad de Ajuste
Método
1) Debe conocerse la distribución que se desea probar, aunque no necesariamente
el valor de sus parámetros. (Ejemplo: podemos suponer una distribución Poisson,
aunque no necesariamente saber qué valor proponer para el parámetro µ ).
5) Calcular para cada fila de la tabla la probabilidad de que una variable aleatoria
distribuida según la distribución que se desea probar asuma el valor o los valores
agrupados en dicha fila.
6) Calcular el estadístico:
k (n p − x )2
Χ =∑
2 i i
i =1 n pi
donde:
• k es la cantidad de filas de la tabla
• xi es la frecuencia de la fila
• p i es la probabilidad de la fila
• n es el tamaño de la muestra
Χ 2 > χ 12− α ; k − c
7) Rechazar H 0 si
donde:
• α es el nivel de confianza
• k es la cantidad de filas de la tabla
• c es 1 + la cantidad de parámetros que fueron estimados en base a la
muestra para poder proponer la distribución.
Problemas típicos
Además de los dos ejemplos ya resueltos, deben considerarse problemas típicos
aquellos en los cuales hay que estimar el valor de los parámetros antes de poder
hacer la prueba. A continuación, un ejemplo de ello:
Resolución
Vamos a probar si las precipitaciones siguen una distribución normal. Para hacer
una prueba de bondad de ajuste necesitamos probar una distribución concreta, por
lo cual para poder proponer una distribución hay que proponerla completa junto
con sus parámetros. Si no sabemos qué valores de los parámetros tendrá la
distribución que vamos a proponer, primero debemos estimarlos.
La distribución normal tiene dos parámetros: µ y σ. Usaremos los estimadores
habituales de dichos parámetros. Obtenemos:
∑x ∑ (X − X )
n n
2
i i
µ≅X= i =1 = 7.7256 σ≅S= i =1 = 3.1243
n n −1
Entonces vamos a proponer que las precipitaciones son X:N(7.7256 ; 3.1243). Las
hipótesis nos quedan:
H0: Los datos recogidos provienen de una distribución normal con parámetros µ =
7.7256, σ = 3.1243
HA: Los datos recogidos no provienen de tal distribución.
Elegimos intervalos 0-0.99, 1-1.99, 2-2.99, etc. y la tabla queda:
Precipitaciones Frecuencia Precipitaciones Frecuencia
0≤X<1 1 9 ≤ X < 10 6
1≤X<2 2 10 ≤ X < 11 6
2≤X<3 1 11 ≤ X < 12 2
3≤X<4 1 12 ≤ X < 13 1
4≤X<5 1 13 ≤ X < 14 0
5≤X<6 3 14 ≤ X < 15 1
6≤X<7 7 15 ≤ X < 16 0
7≤X<8 6 16 ≤ X < 17 0
8≤X<9 2 ... 0
Agrupamos algunos intervalos para que no quede ninguno con frecuencia,
controlamos que ninguno quede con frecuencia extremadamente pequeña, y
calculamos las probabilidades de cada intervalo (para lo cual debemos estandarizar
y usar la tabla de la normal estándar). La tabla queda:
Precipitaciones Frecuencia Probabilidad
X<1 1 0.01567
1≤X<2 2 0.01776
2≤X<3 1 0.03177
3≤X<4 1 0.05134
4≤X<5 1 0.07496
5≤X<6 3 0.09887
6≤X<7 7 0.11781
7≤X<8 6 0.12682
8≤X<9 2 0.12333
9 ≤ X < 10 6 0.10836
10 ≤ X < 11 6 0.08601
11 ≤ X < 12 2 0.06167
12 ≤ X < 13 1 0.03995
13 ≤ X 1 0.04569
k (n p − x )2
Χ2 = ∑ i i = 10,979
i =1 n p i
Calculamos:
α = 0,05; k = 14; c = 1 + 2 = 3, porque se estimaron 2 parámetros.
χ 02 , 9 5 ;1 1 = 19 , 6 7 5
Buscamos en la tabla:
Χ 2 < χ 12− α ; k − c
Como , no rechazamos H 0, y por lo tanto con un nivel de
significación del 5% decimos que los datos recogidos efectivamente provienen de
una distribución normal.
Este material se encuentra en etapa de corrección y no deberá ser
considerado una versión final.
Para hacer comentarios y sugerencias, o reportar errores, enviar mail
a Alejandro D. Zylberberg <alejandro@probabilidad.com.ar>
Versión Actualizada al: 12 de julio de 2004