Está en la página 1de 20

ESTADÍSTICA

INFERENCIAL

Distribución Chi-Cuadrado
Prueba de Bondad de Ajuste
SESIÓN 22

Estadística Inferencial
SUMARIO

1. Distribución Chi-Cuadrado

2. Prueba de Bondad de Ajuste


LOGRO

Al finalizar la clase los alumnos aplican la prueba chi-cuadrado


en las pruebas de bondad de ajuste para determinar si los datos
de una muestra se ajustan a una distribución específica.
APLICACIÓN CHI-CUADRADO

Prueba Chi Cuadrado

Una Variable Dos Variables

Prueba de Independencia
Prueba de Bondad
de ajuste
Prueba de Homogeneidad
BONDAD DE AJUSTE
En diversas situaciones se requiere conocer si la data muestral proviene
o no de una determinada distribución probabilística.
¿Cómo proceder?

La prueba de bondad de ajuste Chi-cuadrado es una prueba estadística


que permite determinar si una data muestral proviene o no de una
hipotética distribución.
¿Los datos de la muestra son coherentes con una distribución supuesta?
BONDAD DE AJUSTE
Prueba de bondad de ajuste
Paso1: Plantear Hipótesis:

Ho: Los datos se ajustan a una distribución específica (Uniforme, Poisson, Binomial, Normal)
H1: Los datos no se ajustan a una distribución específica (Uniforme, Poisson, Binomial, Normal)

Paso2: Establecer el nivel de significación: 𝛼 = 1%, 5%, 10%, 𝑒𝑡𝑐 …

Paso3: Estadístico de Prueba:


Donde:
2
𝑂𝑖 − 𝐸𝑖
𝑋𝐶 2 = O: frecuencia observada  Generalmente dato del problema
𝐸𝑖 E: frecuencia esperada  Se tiene que estimar y depende del tipo
de la distribución
BONDAD DE AJUSTE
La frecuencia esperada depende de la distribución que se quiere probar:
Distribución de Poisson Distribución Binomial

𝒆−𝝀 𝝀𝑿 𝒏 𝑿 𝒏−𝑿
𝒇 𝑿, 𝝀 = 𝑷 𝒙 = 𝒑 𝒒
𝒙
𝑿!
Paso4: Region Crítica:

Dónde:
𝑵𝑹𝒉𝟎 𝑹𝒉𝟎 𝑔𝑙 = 𝐾 − 𝑚 − 1
1-𝛼
𝛼 K: Número de categorías o clases
m: número de parámetros estimados

𝑋2 1−𝛼;𝑔𝑙

Paso 5: Decisión Estadística y conclusiones


BONDAD DE AJUSTE
Ejercicios 1:
La intención de los estudiantes es saber a qué distribución teórica se puede ajustar los daros
encontrados. Se realizó un estudio en un supermercado muy conocido que consistió en
evaluar 600 bolsas de peras, cada una de las bolsas contiene 3 peras de las cuales algunas se
encuentran en buen estado y otras en mal estado. Los resultados al evaluar 600 bolsas son
los siguientes:
Número de peras en mal estado por bolsa 0 1 2 3
Frecuencia (Número de bolsas) 300 150 100 50

Use nivel de significación del 5%


• X = Nº de peras en mal estado
Solución: • n = 3 peras analizadas por bolsa que pueden estar en mal o buen estado
• P = ? Se tiene que estimar(calcular)
• N=600 bolsas
BONDAD DE AJUSTE
Paso1: Plantear Hipótesis:

𝐻0 : 𝐸𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑒𝑟𝑎𝑠 𝑒𝑛 𝑚𝑎𝑙 𝑒𝑠𝑡𝑎𝑑𝑜 𝑝𝑜𝑟 𝑏𝑜𝑙𝑠𝑎 𝑠𝑖𝑔𝑢𝑒𝑛 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙
𝐻1 : 𝐸𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑒𝑟𝑎𝑠 𝑒𝑛 𝑚𝑎𝑙 𝑒𝑠𝑡𝑎𝑑𝑜 𝑝𝑜𝑟 𝑏𝑜𝑙𝑠𝑎 𝑛𝑜 𝑠𝑖𝑔𝑢𝑒𝑛 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙

Paso2: Establecer el nivel de significación: 𝛼 = 0.05

Paso3: Estadístico de Prueba:

Donde:
𝑂𝑖 − 𝐸𝑖 2
2
𝑋𝐶 = O: frecuencia observada Dato del problema
𝐸𝑖 E: frecuencia esperada  Se tiene que estimar
𝒏 𝑿 𝒏−𝑿
𝑷 𝒙 = 𝒑 𝒒
𝒙
BONDAD DE AJUSTE
𝑂𝑖 − 𝐸𝑖 2
CONSTRUYAMOS LOS ESPERADOS
𝑋𝐶 2 =
PASO1: Calculamos el parámetro de la distribución 𝐸𝑖 𝐸𝒊 = 𝑁𝒑𝒊
sabemos 𝑋𝑖 𝑂𝑖 clase(𝑿𝒊 ) 𝑶𝒊 𝑷𝒊 𝑬𝒊 𝑿𝑪 𝟐
𝐸 𝑋 = 𝑛𝑝 → = 𝑛𝑝 0 300 0.38 228 22.74
𝑁
𝑋𝑖 𝑓𝑖 𝑂 300 + 1 150 + 2 100 + 3(50) 1 150 0.43 258 45.21
= 𝑛𝑝 → = 3𝑃 2 100 0.17 102 0.04
𝑁 600
𝑃 = 0.278
3 50 0.02 12 120.33
Total 600 1 600 188.32
PASO2: Calculamos la probabilidad para cada X
3
𝑃 𝑋=0 = (0.278)0 (0.722)3 = 0.38 Nota: Se observa que varios esperados (𝑬𝒊 ) son muy
0 distantes de sus respectivas frecuencias observadas (𝑶𝒊 ),
3
𝑃 𝑋=1 = (0.278)1 (0.722)2 = 0.43 por lo que es previsible que el número de peras en mal estado no
1 siga una distribución binomial… Comprobemos!!
3
𝑃 𝑋=2 = (0.278)2 (0.722)1 = 0.17
2
3 Tener cuidado con los 𝑬𝒊 <5
𝑃 𝑋=3 = (0.278)3 (0.722)0 = 0.02
3 En la separata hay un ejercicio con este caso!
BONDAD DE AJUSTE
Paso4: Region Crítica:
Rechaza Ho Dónde:
𝛼 = 0.05 𝑔𝑙 = 𝐾 − 𝑚 − 1
188.32
𝑔𝑙 = 4 − 1 − 1 = 2
𝑵𝑹𝒉𝟎 𝑹𝒉𝟎
1-𝛼
𝛼 𝑚 = 1,
debido a que se ha estimado
el parámetro de la
𝑋2 1−𝛼;𝑔𝑙 = 𝑋2 0.95;2 = 5.99
distribución binomial

Paso 5: Decisión Estadística y conclusiones

Con un nivel de significancia del 5% se ha encontrado evidencia estadística suficiente para


rechazar la Hipótesis Nula. El número de peras en mal estado no siguen una Distribución
Binomial.
BONDAD DE AJUSTE
Ejercicios 2:
•Para analizar el número de artículos defectuosos en una fábrica en la
ciudad de Medellín, tomamos una muestra aleatoria de n=60 artículos y se
observó el número de defectuosos y se obtuvieron los siguientes resultados:

Número de artículos Frecuencia


defectuosos(Xi) observada(Oi)
0 32
1 15
2 9
3 a mas 4
total 60

Se propuso una distribución de poissón, Use un nivel de significación del 5% para comprobar el supuesto
BONDAD DE AJUSTE
Solución:
Paso1: Plantear Hipótesis:

𝐻0 : 𝐸𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎𝑟𝑡í𝑐𝑢𝑙𝑜𝑠 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜𝑠 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 𝑃𝑜𝑖𝑠𝑠𝑜𝑛


𝐻1 : 𝐸𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎𝑟𝑡í𝑐𝑢𝑙𝑜𝑠 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜𝑠 𝑛𝑜 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 𝑃𝑜𝑖𝑠𝑠𝑜𝑛

Paso2: Establecer el nivel de significación: 𝛼 = 0.05

Paso3: Estadístico de Prueba:

Donde:
𝑂𝑖 − 𝐸𝑖 2
2 O: frecuencia observada Dato del problema
𝑋𝐶 = E: frecuencia esperada  Se tiene que estimar
𝐸𝑖
BONDAD DE AJUSTE
𝑂𝑖 − 𝐸𝑖 2
CONSTRUYAMOS LAS FRECUENCIAS ESPERADAS
𝑋𝐶 2 =
PASO1: Calculamos el parámetro media de la distribución 𝐸𝑖 𝐸𝒊 = 𝑁𝒑𝒊
𝑋𝑖 𝑂𝑖
Sabemos que: ʎ = clase(𝑿𝒊 ) 𝑶𝒊 𝑷𝒊 𝑬𝒊
𝑁
0 32 0.472 28.32
𝑋𝑖 𝑓𝑖 𝑂 32 + 1 15 + 2 9 + 3(4) ʎ = 0.75
= 1 15 0.354 21.24
𝑁 60
2 9 0.133 7.98
𝒆−𝝀 𝝀𝑿
PASO2: Calculamos la probabilidad para cada X: P 𝑿 = 3 o más 4 0.041 2.46
𝑿!
𝒆−0.75 𝟎. 𝟕𝟓0 Total 60 1 60
𝑃 𝑋=0 = = 0.472
0!
−0.75 Tener cuidado con
𝒆 𝟎. 𝟕𝟓1
𝑃 𝑋=1 = = 0.354 los 𝑬𝒊 <5
1!
𝒆−0.75 𝟎. 𝟕𝟓2 Como la frecuencia esperada en la última celda es menor que
𝑃 𝑋=2 = = 0.133 cinco se combinan las dos últimas celdas
2!
𝑃 𝑋 ≥3 =1−𝑝 𝑥 =0 +
𝑝 𝑥 = 1 + 𝑝(= 2) = 0.041
BONDAD DE AJUSTE
Entonces tenemos:

clase(𝑿𝒊 ) 𝑶𝒊 𝑷𝒊 𝑬𝒊 𝑿𝑪 𝟐
0 32 0.472 28.32 0.48
1 15 0.354 21.24 1.83
2 o más 13 0.174 10.44 0.63
Total 60 1 60 2.94
BONDAD DE AJUSTE
Paso4: Region Crítica:
Rechaza Ho Dónde:
𝛼 = 0.05 2.94
𝑔𝑙 = 𝐾 − 𝑚 − 1
𝑔𝑙 = 3 − 1 − 1 = 1
𝑵𝑹𝒉𝟎 𝑹𝒉𝟎
1-𝛼
𝛼 𝑚 = 1,
debido a que se ha estimado
el parámetro media de la
𝑋2 1−𝛼;𝑔𝑙 = 𝑋2 0.95;1 = 3.84
distribución Poisson

Paso 5: Decisión Estadística y conclusiones

Con un nivel de significancia del 5% no se ha encontrado evidencia estadística suficiente para


rechazar la Hipótesis Nula. El número de artículos defectuosos tiene una distribución de
Poisson.
EJERCICIO ADICIONAL
•Cierta máquina de última tecnología de empresa embotelladora produce muchos artículos,
se ha contabilizado la cantidad de artículos en función a los defectos producidos como se
puede ver en el siguiente cuadro. Un ingeniero Industrial sospecha que los defectos
producidos por la máquina se ajustan a una distribución binomial con parámetro 0.8, Para
verificar ello se muestrea a 2 artículos.

Número de Marca Frecuencia Observada


0 5
1 82
2 251
Total 338
Establecer la Hipótesis Correspondiente para probar la sospecha del Ingeniero:
CIERRE
¿QUÉ HEMOS APRENDIDO?

1. ¿Por qué es importante las pruebas


de chi-cuadrado?

2. ¿Qué significa realizar una prueba de


hipótesis de bondad de ajuste?

También podría gustarte