Documentos de Académico
Documentos de Profesional
Documentos de Cultura
X2X2
X
4.7
DISTRIBUCION CHI
CUADRADO
P r o b a b i l i d a d y E s t a d í s ti c a
M.C. María Isabel Piña Villanueva
Integrantes
G e r a r d o To r r e s J a i m e 19051219
Bryan Enrique Palacios Padilla 19051174
García Maltos Alejandro 19051134
Jordi Alejandro Mauricio de León 19052194
CARL PEARSON
01 PEARSON.
AA
A
Sirve para poner a prueba las hipótesis relacionadas con las distribuciones
de frecuencias. En general, esta prueba tiene la capacidad de contrastar la
observación de frecuencias con las frecuencias esperadas según la
hipótesis nula.
03
MÉTODO DE SOLUCIÓN
-JI- CUADRADO PUEDE USARSE COMO PRUEBA DE ASOCIACIÓN
Supongamos que un investigador está interesado en evaluar la asociación entre uso de cinturón de seguridad en
vehículos particulares y el nivel socioeconómico del conductor del vehículo. Con este objeto se toma una muestra de
conductores a quienes se clasifica en una tabla de asociación, encontrando los siguientes resultados:
¿Permiten estos datos afirmar que el uso del cinturón de seguridad depende del nivel socioeconómico?
Usaremos un nivel de significación alfa=0,05.
Los pasos del análisis estadístico son los siguientes:
SS
1. EN PRIMER LUGAR SE DEBEN PLANTEAR LAS HIPÓTESIS QUE SE PONDRÁN A PRUEBA S
H0: “El uso de cinturón de seguridad es independiente del nivel socioeconómico”.
H1: “El uso de cinturón de seguridad depende del nivel socioeconómico”.
En esta prueba estadística siempre la hipótesis nula plantea que las variables analizadas son independientes.
04
2. EN SEGUNDO LUGAR, OBTENER (CALCULAR) LAS FRECUENCIAS
ESPERADAS
SS
Estas son las frecuencias que debieran darse si las variables fueran independientes, es decir, si fuera cierta la hipótesis
nula. S
Las frecuencias esperadas se obtendrán de la distribución de frecuencias del total de los casos, 51 personas de un total
de 94 usan el cinturón y 43 de 94 no lo usan. Esa misma proporción se debería dar al interior de los tres grupos de nivel
socioeconómico, de manera que el cálculo responde al siguiente razonamiento:
SS
S
Donde “oi” representa a cada frecuencia observada y “ei” representa a cada
frecuencia esperada.
De este modo el valor del estadístico de prueba para este problema será:
Según esto, debemos aceptar la hipótesis nula que plantea que las variables “uso
07
de cinturón de seguridad” y “nivel socioeconómico” son independientes.
EJEMPLO
Un investigador recolecta información sobre los patrones de actividad física (AF) de los niños de
quinto grado de primaria de una escuela pública. Define tres categorías de AF (1, Baja; 2. Media;
3. Alta). También indaga sobre consumo regular de bebidas azucaradas en la escuela y define dos EE
categorías (1. Si consume; 0. No consume). Su interés es evaluar si existe una asociación entre
los patrones de AF y el consumo de bebidas azucaradas
E
en los niños de esta institución escolar con un nivel de significancia del 5%.
Los resultados se muestran en el siguiente tabla:
08
Paso 1: Defina la hipótesis de trabajo:
Ho: No hay asociación entre la práctica de actividad física y el consumo de bebidas
azucaradas en este grupo de escolares EE
H1: Si hay asociación entre la práctica de actividad física y el consumo de bebidas E
azucaradas en este grupo de escolares
Paso 2: Defina el nivel de significancia para la prueba Estadística
∝ = 0,05
Paso 3: Calcule los grados de libertad (gl) para la prueba
(r= # filas, c= # columnas) 09
gl= (r-1) (c-1)
gl= (3-1) (2-1)
gl= (2) (1)
gl= 2
Paso 4: Establezca el valor de critico (rechazo) de la H o para la distribución X2
Con los valores calculados de alfa y grados de libertad, se consulta en una tabla de
distribución de probabilidad X2 su valor crítico. Para nuestro ejemplo (consultar
una tabla de distribución de probabilidad X2 con los valores gl= 3 y alfa= 0,05 este EE
valor es igual a 7,815) E
Paso 5: Calcule el valor para el estadístico de contraste (X2 para los datos del
ejemplo: 10
Ya cuenta con los datos de los valores observados en el cuadro uno. Los valores
esperados en cada celda se calculan como el producto aritmético entre sus
valores marginales (color gris) dividido por el total de observaciones así:
EE
E
11
Paso 6. Valide el supuesto de que menos del 20% de las celdas en la tabla tiene valores esperados
≤5. En este caso se cumple el supuesto y no es necesario acudir a una prueba exacta como el test
exacto de Fisher.
EE
Paso 7. Calcule el valor de X2 para el ejemplo usando la formula descrita inicialmente
12
Paso 8. Regla de decisión
Como el valor calculado de X2 para el ejemplo es 10,7 y previamente establecimos que el punto
crítico para la distribución X2 con un alfa de 0,05 y 3 gl es igual a 7,8 podemos afirmar que nuestro
valor del estadísticoRevista Médica Sanitas 95 PRUEBA CHI-CUADRADO DE INDEPENDENCIA
APLICADA A TABLAS 2 xN de prueba está dentro de la zona de rechazo de Ho formulada a priori.
Paso 9. Interpretación
Con los datos de nuestro estudio, tenemos suficiente evidencia para rechazar la Ho
de que No hay asociación entre la práctica de actividad física y el consumo de
bebidas azucaradas en este grupo de escolares. Cuidado; un error frecuente es EE
afirmar que en consecuencia, se acepta la H1. Es necesario recordar que el análisis E
de pruebas estadísticas y su interpretación se hacen siempre sobre la Ho.
CONCLUSIÓN
La prueba X2 es muy usada en el análisis de datos de investigación biomédica, su
13
aplicación es relativamente sencilla al igual que su interpretación. Múltiples estudios
en ciencias sociales e investigación clínica hacen uso de esta prueba en tablas de
2x2 (nxn); sin embargo, esta puede ser aplicada en tablas relativamente más
complejas (nxN) siempre y cuando se cumplan los supuestos necesarios para su
aplicación.
EJERCICIOS
EJ
1.- Un jugador quiere probar que es legal el dado con el que juega. Tiro el dado 120 veces y obtuvo la siguiente EJ
distribución de frecuencias de las caras resultantes. EJ
Resultado 1 2 3 4 5 6
Frecuencia 15 25 33 17 16 14
2.- El gerente de ventas de una compañía P&C afirma que todos sus vendedores realizan el mismo número de visitas
durante el mismo período de tiempo. Una muestra aleatoria de 5 registros de los vendedores en una semana dad reveló
el siguiente número de visitas.
Vendedor A B C D E
Número de visitas 23 29 25 23 30
Con el nivel de significado de 0.05, ¿es razonable aceptar la afirmación del gerente?
14
15 TOMEN AGUA