Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Contenido
3. Bondad de Ajuste
3.1. Prueba Ji-Cuadrada
3.2. Prueba Kolmogorov-Smirnov
Objetivo
Aplicar bondad de ajuste para probar los supuestos acerca
de la distribución de la población de la que se extrae una
muestra
Prueba Ji-cuadrado de INDEPENDENCIA
Estamos interesados en investigar si dos variables categóricas (factores) están
relacionadas o asociadas (dependientes); de esta manera asumimos que NO LO
SON hasta que se tenga evidencia de que son dependientes.
Donde:
𝑛 = 𝑛11 + 𝑛12 + 𝑛13 + 𝑛21 + 𝑛22 + 𝑛23
Prueba Ji-cuadrado de INDEPENDENCIA (3)
A partir de los datos mencionados podemos estimar la probabilidad 𝑝𝑖𝑗 de que una
persona se encuentre en el 𝑛𝑖𝑣𝑒𝑙 𝑖 y al mismo tiempo en el 𝑛𝑖𝑣𝑒𝑙 𝑗, de manera que:
𝑛𝑖𝑗
𝑝𝑖𝑗 =
𝑛
Factor B Marginal del
Factor A A favor Indiferente Opuesto Factor A
Izquierda 𝑝11 𝑝12 𝑝13 𝑝11 + 𝑝12 + 𝑝13
Derecha 𝑝21 𝑝22 𝑝23 𝑝21 + 𝑝22 + 𝑝23
Marginal del
Factor B 𝑝11 + 𝑝21 𝑝12 + 𝑝22 𝑝13 + 𝑝23 1
Estimación de la Distribución conjunta y marginales de dos factores
Prueba Ji-cuadrado de INDEPENDENCIA (4)
Supongamos que A toma r valores (r niveles) y que B toma c valores (c niveles); en esta
clasificación “cruzada” podemos construir la tabla de contingencia en el que se detalle cada
una de las 𝑟 𝑥 𝑐 celdas y dentro de ellas el valor de 𝑛𝑖𝑗 , 𝑖 = 1; 2; … ; 𝑟 𝑗 = 1; 2; … ; 𝑐 Así como
las sumas de los valores en las celdas dadas por 𝑛𝑖. y 𝑛.𝑗
Factor B 𝑛𝑖.
Factor A 1 2 … c 𝑐 𝑟
…
𝑛.. = 𝑛𝑖𝑗 = 𝑛
r 𝑛𝑟1 𝑛𝑟2 … 𝑛𝑟𝑐 𝑛𝑟. 𝑖=1 𝑗=1
𝑛.𝑗 𝑛.1 𝑛.2 … 𝑛.𝑐 𝑛
De esta manera se espera leer 𝑬𝒊𝒋 bajo 𝐻0 verdadera; sin embargo lo que se observa
está dado por 𝒏𝒊𝒋 , valor que de cumplirse el supuesto de independencia de los
factores A y B debe ser cercano a 𝐸𝑖𝑗
Prueba Ji-cuadrado de INDEPENDENCIA (7)
Basados en que:
𝑋𝑖 − 𝑛𝑖 𝑝𝑖
𝑍𝑖 = ; 𝑖 = 1,2, … , 𝑘
𝑛𝑖 𝑝𝑖 (1 − 𝑝𝑖 )
Converge en Distribución a una normal estándar. Por lo que, el tamaño de la muestra debe
ser grande y 𝑍𝑖2 es Ji-Cuadrado con 1 grado de libertad. Bajo estas condiciones el estadístico:
𝑟 𝑐
(𝑛𝑖𝑗 − 𝐸𝑖𝑗 )2
𝜒2 =
𝐸𝑖𝑗
𝑖=1 𝑗=1
Puede ser aproximado a una variable aleatoria Ji-cuadrado con (r-1)(c-1) grados de libertad.
Prueba Ji-cuadrado de INDEPENDENCIA (8)
Finalmente la 𝐻0 debe ser rechazada en favor de 𝐻1 si el estadístico de prueba 𝝌𝟐
es mayor que el percentil 1 − 𝛼 100% de la distribución 𝜒 2 que tiene (r-1)(c-1)
2
grados de libertad y que está denotado por 𝜒(𝛼,(𝑟−1)(𝑐−1))
RECHAZO 𝐻0 , si:
2
𝝌𝟐 ≥ 𝜒(𝛼,(𝑟−1)(𝑐−1))
2
𝜒(𝛼,(𝑟−1)(𝑐−1))
𝑟 𝑐 2 3
2
(𝑛𝑖𝑗 − 𝐸𝑖𝑗 )2 (𝑛𝑖𝑗 − 𝐸𝑖𝑗 )2
𝜒 = =
𝐸𝑖𝑗 𝐸𝑖𝑗
𝑖=1 𝑗=1 𝑖=1 𝑗=1
RECHAZO 𝐻0 , si:
2
𝝌𝟐 ≥ 𝜒(𝛼,(𝑟−1)(𝑐−1))
𝟐𝟐, 𝟏𝟓 > 5,991
2
𝜒(0.05, 2) = 5,991 Calculando el p-valor:
2 2
𝜒(𝛼,(𝑟−1)(𝑐−1)) = 𝜒(0.05,(2−1)(3−1)) 𝑃 = 𝑃 χ2 > 22.15 ≈ 0,00
Donde:
𝑛: 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑘: 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑔𝑖𝑜𝑛𝑒𝑠 𝑒𝑛 𝑙𝑜𝑠 𝑞𝑢𝑒 𝑠𝑒 𝑝𝑎𝑟𝑡𝑖𝑐𝑖𝑜𝑛𝑎 𝑒𝑙 𝑠𝑜𝑝𝑜𝑟𝑡𝑒 𝑆 𝑑𝑒 𝑋
𝑝: 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 𝑞𝑢𝑒 𝑠𝑒 𝑒𝑠𝑡é𝑛 𝑒𝑠𝑡𝑖𝑚𝑎𝑛𝑑𝑜 𝑏𝑎𝑗𝑜 𝑒𝑙 𝑚𝑜𝑑𝑒𝑙𝑜 𝑑𝑎𝑑𝑜
Método Ji-cuadrado de Pearson para BONDAD DE
AJUSTE (3)
Ejemplo 1: Accidentes de tránsito
A continuación se presenta la cantidad de accidentes de tráfico que involucran a niños,
dentro de un perímetro de 2 km de las escuelas.
Dadas las observaciones 𝑋1 ,…, 𝑋𝑛 , la función de distribución empírica nos indica la proporción
de datos que se encuentra por debajo de 𝑥
𝑫𝒏 = 𝐦𝐚𝐱 𝑭 𝒙 − 𝑭 𝒙
𝒙
Con (1-α)100% de confianza, la hipótesis nula del contraste debe ser rechazada si:
𝑚𝑎𝑥 𝐹 𝑥 − 𝐹 𝑥 > 𝐷𝑛,𝛼
𝑥
Método Kolmogorov-Smirnov para BONDAD DE
AJUSTE (4)
Ejemplo:
Suponga que se le han entregado estos 100 datos, y debe probar si éstos vienen
de una distribución N(0,1)…
Método Kolmogorov-Smirnov para BONDAD DE
AJUSTE (5)
Ejemplo:
1.- Ordenamos los datos
Método Kolmogorov-Smirnov para BONDAD DE
AJUSTE (6)
Ejemplo:
2.- Calculamos la función de distribución empírica (lo OBSERVADO):
1
𝑭 −𝟑, 𝟔𝟖 =
100
2
𝑭 −𝟐, 𝟐𝟖 =
100
3
𝑭 −𝟏, 𝟗𝟕 =
100
𝑖
𝑭 𝒙𝒊 =
100
Método Kolmogorov-Smirnov para BONDAD DE
AJUSTE (7)
Ejemplo:
3.- Calculamos la función de distribución acumulada bajo Ho (lo ESPERADO):
𝑫𝒏 = 𝐦𝐚𝐱 𝑭 𝒙 − 𝑭 𝒙
𝒙
Método Kolmogorov-Smirnov para BONDAD DE
AJUSTE (9)
Ejemplo:
5.- Contrastamos el estadístico de prueba y el valor crítico/teórico
Recurrimos a la Tabla K-S, en el que para muestras mayores a 50 y un nivel de significación α = 0,05,
obtenemos el valor crítico mediante:
1,36 1,36
𝐷𝑛,𝛼 = = = 0,136
𝑛 100
Con (1 - 0,05)100% de confianza, la hipótesis nula del contraste debe ser rechazada si:
𝑚𝑎𝑥 𝐹 𝑥 − 𝐹 𝑥 > 𝐷𝑛,𝛼
𝑥 No rechazamos Ho, por
0,092 < 0,136 tanto, los datos provienen
de una N(0,1)
Método Kolmogorov-Smirnov para BONDAD DE
AJUSTE (10)
Ejemplo: La información actual que
tiene como media 66,51 y
desviación estándar 18,26
Estadísticos:
W-S test
P-P Plots - Frecuencia acumulada
Shapiro-Wilks test
Kolmogorov-Smirnov test
Método Kolmogorov-Smirnov para BONDAD DE
AJUSTE (12)
A continuación se presenta el Q-Q Plot de los valores observados vs. Datos
distribuidos normalmente (representados por la línea)…
Método Kolmogorov-Smirnov para BONDAD DE
AJUSTE (13)
Los métodos gráficos no son usualmente confiables cuando trabajamos con
una muestra pequeño. Este gráfico no parecería normal pero…