Está en la página 1de 7

La prueba de bondad de ajuste

Es considerada como una prueba no paramétrica que mide la discrepancia entre una distribución
observada y otra teórica, indicando en qué medida las diferencias existentes entre ambas, de haberlas,
se deben al azar.

La fórmula que da el estadístico es la siguiente:

k [f − f ei ] 2


oi
χ2 =
i =1 f ei

Oi = Valor observado en la i-ésimo dato.


Ei = Valor esperado en la i-ésimo dato.
K = Categorías o celdas.
m = Parámetros estimados sobre la base de los datos de la muestra

Los grados de libertad vienen dados por : gl= K-m-1.

Criterio de decisión es el siguiente:

Se rechaza H0 cuando χ ≥ χt ; K −m −1 . En caso contrario se acepta.


2 2

Donde t representa el valor proporcionado por las tablas, según el nivel de significación elegido.

Cuanto más se aproxima a cero el valor de chi-cuadrado, más ajustadas están ambas distribuciones.

Ejemplo:

Si un ingeniero de control de calidad toma una muestra de 10 neumáticos que salen de una línea de
ensamblaje y él desea verificar sobre la base de los datos que siguen, los números de llantas con
defectos observadas en 200 días, si es cierto que el 5% de todos los neumáticos tienen defecto; es decir,
si el muestrea una población binomial con n = 10 y p = 0.05
Número de unidades con defecto Número de muestras
0 138
1 53
2 ó más 9

Establecer la hipótesis

Ho: La población es binomial


Ha: La población no es binomial

Establecer la estadística de prueba

k [f − f ei ] 2


oi
χ =
2

i =1 f ei

Oi = Valor observado en la i-ésimo dato.


Ei = Valor esperado en la i-ésimo dato.
K = Categorías o celdas.
m= Parámetros

1. 3. Definir el nivel de significancia y la zona de rechazo

g,l = k- m – 1 = (3 – 0- 1) =2
5.99

Nivel de significancia = 0.05


Zona de rechazo = { χ / χ ≥ 5.99)
2 2

m = 0 porque no se necesito estimar ningún parámetro


Calculamos el estadístico de prueba

χ =∑
2
k [
f oi − f ei
2
]
i =1 f ei
Para poder calcular las frecuencias esperadas tenemos que calcular las probabilidades
utilizaremos la formula de la binomial
n  x n −x
f ( x ) = P ( x) = 
x 
 p (1 − p )
 

donde n = 10 p = 0.05

f ( 0) = ( )0.05
10
0
0
(1 − 0.05)10 −0 = 0.599

f (1) = ( )0.05
10
1
1
( 1 − 0.05)10 −1 = 0 .315

y la probabilidad de 2 ó más = 1.0 -0.599 -0 .315 = 0.086

Ahora ya podemos encontrar las frecuencias esperadas:


200 (0.599) = 119.8 200(0.315) = 63 200 (0.086) = 17.2

Número de unidades con defecto Número de muestras Valor


Observadas Esperado
0 138 119,8
1 53 63
2 ó más 9 17,2
Total 200 200
Al aplicar la
formula se tiene:

(138 − 119.8) 2 (53 − 63.0) 2 (9 − 17.2) 2


χ2 = + +
119.8 63 17.2 = 8.26

Como 8.26 es mayor que 5.99, se rechaza la hipótesis nula con un nivel de significancia de 0.05.

Conclusión
Se concluye que el porcentaje verdadero de neumáticos con defecto no es el 5%.
Ejemplo. Si el número de errores que comete una secretaria al transcribir un documento es una
variable aleatoria que tiene una distribución de Poisson. Se reviso 440 transcripciones hechas por ella y
arrojo los siguientes resultados:

Variable = números de errores

Número de errores Frecuencia


0 18
1 53
2 103
3 107
4 82
5 46
6 18
7 10
8 2
9 1

Probar si los datos de los errores se ajustan a una distribución de Poisson. Use α = 0.05.

H0: La población se comporta como una distribución de Poisson


Ha: La población no se comporta como una distribución de Poisson.

El estadístico de prueba que usaremos es:

( f Oi − f Ei ) 2
χ =∑
2

f Ei

Nivel de significación α = 0,05

gl. = 9-1-1=7

χ02, 05 ; 7 =14 ,067

Región de rechazo = { χ 2 | χ 2 ≥ 14,067 }

Para poder calcular las frecuencias esperadas tenemos que calcular las probabilidades utilizaremos la
formula de la distribución de Poisson:

λx e −λ
p ( x; λ) =
x!
Como no se conoce la media de la distribución de Poisson la estimamos con la media de los datos, que
es 3,04 luego, λ = 3,04

errores Frecuencia Prob. Frecuencia esperada


observada
0 18 0,047 21,032
8
1 53 0,145 63,976
4
2 103 0,221 97,240
0
3 107 0,223 98,516
9
4 82 0,170 74,888
2
5 46 0,103 45,496
4
6 18 0,052 23,056
4
7 ó mas 13 0,035 15,796
9
Total 440 1 440

Aplicamos los datos al estadístico de prueba


(18 − 21,032 ) 2 (53 − 63 ,976 ) 2 (13 −15 ,796 ) 2
χ2 = + +.... + = 5,6766
21,032 63 ,976 15 ,796

Como 6,7566 es menor 14,076 no se rechaza la hipótesis nula.

Conclusión: La población se comporta como una distribución de Poisson con media 3,04

Ejemplo 3.

El Departamento de Psicología, basándose en informaciones anteriores, al final del semestre


antepasado, el 80% de los alumnos aprobaron todas las materias inscritas, un 10% aprobó la mitad, un
6% reprobó todas las materias y un 4% se retiro. Al final del semestre pasado el departamento
selecciono a 400 alumnos, resultado 287 aprobaron todas las asignaturas, 49 aprobaron la mitad, 30
reprobaron todas las asignaturas y 34 se retiraron.¿Podemos concluir, a raíz de los resultados, que la
información del semestre antepasado se ha vuelto a repetir el semestre pasado?

Hipótesis nula: de que los porcentajes del semestre pasado son los mismos que en el semestre
antepasado.
Atributos Datos observados Probabilidad Datos esperados
Aprobó todo 287 0,80 320
Aprobó la mitad 49 0,10 40
Reprobó todo 30 0,06 24
Se retiró 34 0,04 16
Total 400 1 400

χ 2 = 27,178

Como tenemos 4 categorías y ningún parámetro estimado los grados de libertad serán: 4-0-1= 3

χ02, 05 ;3 =12 ,84

Como 27,178 es mayor que 12,84 se rechaza la hipótesis nula.

Conclusión: Los porcentajes no se repitieron el semestre pasado

Problema 4.-

Problema 5.-

También podría gustarte