Está en la página 1de 28

Prueba de bondad de

ajuste
Las pruebas de bondad de ajuste son pruebas de hipótesis para
verificar si los datos observados en una muestra aleatoria se
ajustan con algún nivel de significancia a determinada distribución
de probabilidad (uniforme, exponencial, normal, poisson, u otra
cualquiera).
• La hipótesis nula Ho indica la distribución propuesta, mientras que la
hipótesis alternativa H1 , nos indica que la variable en estudio tiene una
distribución que no se ajusta a la distribución propuesta.

Ho : f(x)=fo (x)
H1 : f(x)≠fo (x)
Para realizar la prueba, se clasifican los datos observados en k clases o
categorías, y se contabiliza el número de observaciones en cada clase, para
posteriormente comparar la frecuencia observada en cada clase con la
frecuencia que se esperaría obtener en esa clase si la hipótesis nula es correcta.

k = No. de clases, k>2


oi = Frecuencia observada en la clase i
ei = Frecuencia esperada en la clase i, si Ho es correcta.
Las pruebas de bondad de ajuste comparan la frecuencia observada
con la frecuencia esperada en cada clase
LA PRUEBA JI-
CUADRADA
• Existen varios procedimientos para probar
la bondad de ajuste de una distribución a
los datos observados en una muestra, uno
de ellos es la prueba Ji-cuadrada, que se
basa en el estadístico de prueba:
El cual tiene distribución Ji-cuadrada con k-r-1 grados de libertad. Si las
diferencias oi -ei son pequeñas, el valor del estadístico es pequeño, por el
contrario si esas diferencias son grandes (lo observado no se ajusta a lo
propuesto), el valor del estadístico es grande, por lo tanto, la región de rechazo
de la hipótesis nula se ubica en la cola superior de la distribución Ji-cuadrada al
nivel de significancia a.
EJEMPLO

• Suponga que el dado se lanza 120 veces y fo 20 22 17 18 19 24


que se registra cada resultado.
Teóricamente, si el dado está balanceado, fe 20 20 20 20 20 20
esperaríamos que cada cara ocurriera 20
veces. Los resultados se presentan en la
tabla, con un nivel de significancia del 5%
Ho: La distribucion es uniforme discrete
H1: La distribución no es uniforme discreta
fo fe (fo-fe)2/fe
20 20 0
22 20 0.2
17 20 0.45
18 20 0.2
19 20 0.05
24 20 0.8
𝑋𝑡2 = 11.07
𝑋𝑐2 = 1.7
Criterios:
Si 𝑋𝑐2 es menor que 𝑋𝑡2 se acepta Ho
Si 𝑋𝑐2 es mayor que 𝑋𝑡2 se acepta H1

Por lo tanto
1.7<11.07 se acepta Ho no hay evidencia suficiente para decir
que le dado está desvalanceado
Prueba de independencia

• Permite determinar si existe una relación entre dos variables categóricas. Es


necesario resaltar que esta prueba indica si existe o no una relación entre las
variables, pero no indica el grado o el tipo de relación; es decir, no indica el
porcentaje de influencia de una variable sobre la otra o la variable que causa
la influencia.
• Una prueba de independencia usa la pregunta de si la ocurrencia del evento X
es independiente a la ocurrencia del evento Y, por lo que el planteamiento de
las hipótesis para esta prueba de independencia es:

H0; La ocurrencia del evento X es independiente del evento Y.


H1; La ocurrencia del evento X no es independiente del evento Y.
• En las pruebas de independencia se utiliza el formato de la tabla de
contingencia, y por esa razón a veces se le llama prueba de tabla de
contingencia, o prueba con tabla de contingencia
“Una tabla que clasifica datos de acuerdo a dos o más categorías,
relacionados con cada una de las variables cualitativas, que pueden ser
o no estadísticamente independientes, se llama tabla de contingencias.
Dicha tabla muestra todas las posibles combinaciones de categorías, o
contingencias, que explican su nombre.
A la suma de todas las razones que se puedan construir al tomar la diferencia
entre cada frecuencia observada y esperada, en una tabla de contingencia,
elevándola al cuadrado, y luego dividiendo esta desviación cuadrada entre la
frecuencia esperada, se le llama estadístico ji cuadrada.
Procedimiento para elaborar una prueba de
independencia
• 1. Obtener la frecuencia observada (F.O), proveniente de una
encuesta, estudio ó experimento.
• 2. Resumir los datos obtenidos, es decir, la frecuencia observada, en
un cuadro de contingencia.
• 3. Calcular la frecuencia esperada (F.E), y se calcula con la siguiente
formula:

• Determinar el nivel de significancía (α), y los grados de libertad, con la


siguiente formula:
• Plantear las hipótesis

• Construir las áreas de aceptación y rechazo.


• Calcular ji-Cuadrada χ 2

• Tomar una decisión y emitir una conclusión en términos del


problema.
Ejemplo
• Una agencia de publicidad desea saber si el género de los
consumidores es independiente de sus preferencias de cuatro marcas
de café. La respuesta determinará si se deben diseñar diferentes
anuncios dirigidos a los hombres y otros diferentes para las mujeres.
Realice la prueba con un nivel de significancía del 5%.
• 1.- Datos obtenidos
marca hombres mujeres
A 18 32
B 25 15
C 15 10
D 12 12
• Elaboración de la tabla de contingencia
marca
A B C D
sexo
18 25 15 12 70
hombres
25.18 20.14 12.59 12.09
32 15 10 12 69
mujeres
24.82 19.86 12.41 11.91
50 40 25 24 139
• Calcular la frecuencia esperada
• Calcular los grados de libertad
• α=0.05
• gl=(4-1)(2-1)=3
• 𝑥 2 = 7.185

• Plantear las hipótesis


• H0: La marca de café que se consume es independiente del sexo de una
persona.
• H1: La marca de café que se consume depende del sexo de una persona.
• Construcción de las áreas de aceptación y rechazo.
• Calculando ji-cuadrada
Tomar una decisión y concluir.

Aceptar Ho:

Con un nivel de confianza del 5% se encontró que la marca de


café es independiente del sexo de la persona. Por lo que se
recomienda elaborar un sólo tipo de anuncio.

También podría gustarte