Está en la página 1de 4

281

10.13 PRUEBAS DE BONDAD DE AJUSTE


Estas pruebas permiten verificar que la población de la cual proviene una muestra tiene una
distribución especificada o supuesta.

Sean X: Variable aleatoria poblacional


f0(x): Distribución (o densidad) de probabilidad especificada o supuesta para X

Se desea probar la hipótesis: Ho: f(x) = f0(x)

En contraste con la hipótesis alterna: Ha:  H0 (negación de Ho)

10.13.1 PRUEBA JI-CUADRADO


Esta prueba es aplicable para variables aleatorias discretas o continuas

Sea una muestra aleatoria de tamaño n tomada de una población con una distribución
especificada f0(x) que es de interés verificar.

Suponer que las observaciones de la muestra están agrupadas en k clases, siendo ni la


cantidad de observaciones en cada clase i = 1, 2, ..., k

Con el modelo especificado f0(x) se puede calcular la probabilidad pi que un dato cualquiera
pertenezca a una clase i.

Con este valor de probabilidad se puede encontrar la frecuencia esperada ei para la clase i, es
decir, la cantidad de datos que según el modelo propuesto deberían estar incluidos en la clase i:

ei = pi n, i = 1, 2, ..., k

Tenemos entonces dos valores de frecuencia para cada clase i


ni: frecuencia observada (corresponde a los datos de la muestra)
ei: frecuencia esperada (corresponde al modelo propuesto)

La teoría estadística demuestra que la siguiente variable es apropiada para realizar una prueba
de bondad de ajuste:

Definición: Estadístico para la Prueba de Bondad de Ajuste Ji-Cuadrado

k (ni − e i ) 2
χ = ∑
2
, distribución Ji-cuadrado con ν = k–1 grados de libertad
i=1 ei
Una condición necesaria para aplicar esta prueba es que: ∀i(ei ≥ 5)

2
Dado el nivel de significancia α se define el valor crítico χ α para el rechazo de la hipótesis
propuesta Ho: f(x) = f0(x).

Si las frecuencias observadas no difieren significativamente de las frecuencias esperadas


calculadas con el modelo propuesto, entonces el valor de estadístico de prueba χ2 será cercano
a cero. Pero si estas diferencias son significativas, entonces el valor del estadístico χ2 estará en
la región de rechazo de Ho:
χ2 > χ 2α
282

k (n − e ) 2
χ2 = ∑ i i
i=1 ei

Región de rechazo de Ho

Ejemplo.
Se ha tomado una muestra aleatoria de 40 baterías y se ha registrado su duración en años.
Estos resultados se los ha agrupado en 7 clases, como se muestra en el siguiente cuadro
i Clase (duración) Frecuencia observada (ni)
1 1.45 – 1.95 2
2 1.95 – 2.45 1
3 2.45 – 2.95 4
4 2.95 – 3.45 15
5 3.45 – 3.95 10
6 3.95 – 4.45 5
7 4.45 – 4.95 3
Verificar con 5% de significancia que la duración en años de las baterías producidas por este
fabricante tiene duración distribuida normalmente con media 3.5 y desviación estándar 0.7

Solución
Sea X: duración en años (variable aleatoria contínua)

1) Ho: f(x) = N(3.5, 0.7) (Distribución normal, µ = 3.5, σ = 0.7)


2) Ha:  H0
3) α = 0.05
Cálculo de la probabilidad correspondiente a cada intervalo con el modelo propuesto

f(x)=N(3.5, 0.7)
283

1.95 − 3.5
p1 = P(X ≤ 1.95) = P(Z ≤ ) = 0.0136
0.7
1.95 − 3.5 2.45 − 3.5
p2 = P(1.95 ≤ X ≤ 2.45) = P( ≤Z≤ ) = 0.0532
0.7 0.7
2.45 − 3.5 2.95 − 3.5
p3 = P(2.45 ≤ X ≤ 2.95) = P( ≤Z≤ ) = 0.135
0.7 0.7
... (etc)

Cálculo de las frecuencias esperadas


e1 = p1 n = 0.0136 (40) ≈ 0.5
e2 = p2 n = 0.0532 (40) ≈ 2.1
e3 = p3 n = 0.135 (40) ≈ 5.4
... (etc)

Resumen de resultados
Duración (años) Frecuencia observada (ni) Frecuencia esperada (ei)
1.45 – 1.95 2 0.5
1.95 – 2.45 1 2.1
2.45 – 2.95 4 5.4
2.95 – 3.45 15 10.3
3.45 – 3.95 10 10.7
3.95 – 4.45 5 7
4.45 – 4.95 3 3.5

Es necesario que se cumpla la condición ∀i(ei ≥ 5) por lo que se deben agrupar clases
adyacentes. Como resultado se tienen cuatro clases: k = 4
Duración (años) Frecuencia observada (ni) Frecuencia esperada (ei)
1.45 – 2.95 7 8.5
2.95 – 3.45 15 10.3
3.45 – 3.95 10 10.7
3.95 – 4.95 8 10.5
Ahora se puede definir la región de rechazo de Ho

α = 0.05, ν = k – 1 = 3, ⇒ χ20.05 = 7.815 (Tabla χ2)


Rechazar Ho si χ2 > 7.815

5) Cálculo del estadístico de prueba

(ni − e i ) 2  (7 − 8.5) (15 − 10.3)2 (10 − 10.7)2 (8 − 10.5)2 


k 2
χ2 = ∑ =  + + +  = 3.05
i=1 ei  8.5 10.3 10.7 10.5 

6) Decisión
Como 3.05 no es mayor a 7.815, se dice que no hay evidencia suficiente para rechazar
el modelo propuesto para la población.

NOTA IMPORTANTE: En general, si no se especifican los parámetros para el modelo


propuesto, pueden estimarse con los datos de la muestra.
284

10.13.2 EJERCICIOS

1) El siguiente cuadro muestra el registro del tiempo en horas que duran encendidos hasta que
fallan una muestra de 200 focos de cierta marca

Tiempo Cantidad
en horas de focos
0 – 250 82
250 – 500 45
500 – 750 34
750 – 1000 15
1000 – 1250 10
1250 – 1500 6
1500 – 1750 4
1750 – 2000 3
2000 – 2250 1

Con 10% de significancia verifique la hipótesis que el tiempo de duración de los focos tiene
distribución exponencial.

Debido a que no se especifica el parámetro del modelo propuesto, debe estimarlo a partir de los
datos de la muestra (calcule la media muestral con la fórmula para datos agrupados)

También podría gustarte