Está en la página 1de 16

2

X2X2
X
4.7
DISTRIBUCION CHI
CUADRADO
P r o b a b i l i d a d y E s t a d í s ti c a
M.C. María Isabel Piña Villanueva

Integrantes

G e r a r d o To r r e s J a i m e 19051219
Bryan Enrique Palacios Padilla 19051174
García Maltos Alejandro 19051134
Jordi Alejandro Mauricio de León 19052194

Hora clase: 8:00-9:00 am Fecha de entrega: 19/11/2020


X2
DISTRIBUCION
CHI CUADRADA
AA
A
La prueba Chi-cuadrado (x2) o Ji-cuadrado, también
conocida como la distribución de Pearson fue sugerida por
Carl o Karl Pearson, siendo desarrollada en el año 1900.
Es una prueba, utilizada para analizar variables
QUE ES?

nominales o cualitativas, es decir, para determinar la


existencia o no de independencia entre dos variables.
DATO:
Que dos variables sean independientes significa que no
tienen relación, y que por lo tanto una no depende de la
otra, ni viceversa.

CARL PEARSON
01 PEARSON.
AA
A
Sirve para poner a prueba las hipótesis relacionadas con las distribuciones
de frecuencias. En general, esta prueba tiene la capacidad de contrastar la
observación de frecuencias con las frecuencias esperadas según la
hipótesis nula.

El uso de este estadístico puede probar la asociación entre dos variables


al usar una situación hipotética y los datos simulados. También se utiliza
para evaluar que tan bueno es el resultado para una distribución teórica,
al pretender representar la distribución real de los datos de una
determinada muestra.

Esto se llama evaluar la bondad de un ajuste y para probarla es necesario


ver la medida de cómo se ajustan los datos que se observan dentro de una
distribución teórica o esperada.
02
Propiedades de las

DISTRIBUCIONES CHI CUADRADAS AA


A
FORMULA:

03
MÉTODO DE SOLUCIÓN
-JI- CUADRADO PUEDE USARSE COMO PRUEBA DE ASOCIACIÓN

Supongamos que un investigador está interesado en evaluar la asociación entre uso de cinturón de seguridad en
vehículos particulares y el nivel socioeconómico del conductor del vehículo. Con este objeto se toma una muestra de
conductores a quienes se clasifica en una tabla de asociación, encontrando los siguientes resultados:

-El nivel de significancia, también denotado como alfa o α, es la


probabilidad de rechazar la hipótesis nula cuando es verdadera. Por
ejemplo, un nivel de significancia de 0.05 indica un riesgo de 5% de concluir
que existe una diferencia cuando en realidad no hay ninguna diferencia.

¿Permiten estos datos afirmar que el uso del cinturón de seguridad depende del nivel socioeconómico?
Usaremos un nivel de significación alfa=0,05.
Los pasos del análisis estadístico son los siguientes:
SS
1. EN PRIMER LUGAR SE DEBEN PLANTEAR LAS HIPÓTESIS QUE SE PONDRÁN A PRUEBA S
H0: “El uso de cinturón de seguridad es independiente del nivel socioeconómico”.
H1: “El uso de cinturón de seguridad depende del nivel socioeconómico”.
En esta prueba estadística siempre la hipótesis nula plantea que las variables analizadas son independientes.
04
2. EN SEGUNDO LUGAR, OBTENER (CALCULAR) LAS FRECUENCIAS
ESPERADAS
SS
Estas son las frecuencias que debieran darse si las variables fueran independientes, es decir, si fuera cierta la hipótesis
nula. S
Las frecuencias esperadas se obtendrán de la distribución de frecuencias del total de los casos, 51 personas de un total
de 94 usan el cinturón y 43 de 94 no lo usan. Esa misma proporción se debería dar al interior de los tres grupos de nivel
socioeconómico, de manera que el cálculo responde al siguiente razonamiento:

si de 94 personas 51 usan cinturón; de 21 personas, ¿cuántas debieran usarlo?


La respuesta a esta pregunta se obtiene aplicando la “regla de tres” y es 11,4. Este procedimiento debe repetirse con todas las frecuencias
del interior de la tabla.

El detalle de los cálculos es el siguiente:

Nivel bajo: (21x51/94)=11,4-(21x43/94)=9,6


Nivel medio: (31x51/94)=16,8-(31x43/94)=14,2
Nivel alto: (42x51/94)=22,8-(42x43/94)=19,2
Estas son las frecuencias que debieran presentarse si la hipótesis nula fuera verdadera y, por consiguiente, las variables
fueran independientes.
Estos valores los anotamos en una tabla con las mismas celdas que la anterior; así tendremos una tabla con los valores
05
observados y una tabla con los valores esperados.
3. EN TERCER LUGAR SE DEBE CALCULAR EL ESTADÍSTICO
DE PRUEBA
 Eneste caso, el estadístico de prueba es Ji-cuadrado que, como dijimos al comienzo,
compara las frecuencias que entregan los datos de la muestra (frecuencias
observadas) con las frecuencias esperadas, y tiene la siguiente fórmula cálculo:

SS
S
Donde “oi” representa a cada frecuencia observada y “ei” representa a cada
frecuencia esperada.

De este modo el valor del estadístico de prueba para este problema será:

Entonces () = 5,23 este es el valor de nuestro estadístico de prueba que ahora,


debemos comparar con un valor de la tabla de probabilidades para ji-cuadrado ().
Esta tabla tiene sólo valores positivos, que muestra la forma de la curva, con valores
desde 0 hasta infinito. 06
USO DE TABLA JI-CUADRADO
La tabla de ji-cuadrado tiene en la primera columna los grados de libertad y en la primera fila la probabilidad asociada a valores
mayores a un determinado valor del estadístico.
Los grados de libertad dependen del número de celdas que tiene la tabla de asociación donde están los datos del problema y su
SS
S
fórmula de cálculo es muy sencilla:
Grados de libertad (gl)=(nº de filas–1)x(nº de columnas–1)
Basándonos en el ejemplo, hay 2 filas y 3 columnas, los grados de libertad serán:
gl=(2-1)x(3-1)=2
Nota: no se consideran la fila ni la columna de los totales.

Al inicio se eligió un nivel de significación alfa=0,05.


Entonces un valor de tabla para x2 asociado a 2 grados de
libertad y alfa 0,05 es 5,99.

Por lo tanto, como en la tabla podemos apreciar que 5,23 se encuentra a la


izquierda de 5,99, la probabilidad asociada a valores superiores a 5,23 es mayor
que alfa (0,05).
Por lo tanto, vemos que 5,23 se encuentra a la izquierda de 5,99, la probabilidad
asociada a valores superiores a 5,23 es mayor que alfa (0,05).

Según esto, debemos aceptar la hipótesis nula que plantea que las variables “uso
07
de cinturón de seguridad” y “nivel socioeconómico” son independientes.
EJEMPLO

Un investigador recolecta información sobre los patrones de actividad física (AF) de los niños de
quinto grado de primaria de una escuela pública. Define tres categorías de AF (1, Baja; 2. Media;
3. Alta). También indaga sobre consumo regular de bebidas azucaradas en la escuela y define dos EE
categorías (1. Si consume; 0. No consume). Su interés es evaluar si existe una asociación entre
los patrones de AF y el consumo de bebidas azucaradas
E
en los niños de esta institución escolar con un nivel de significancia del 5%.
Los resultados se muestran en el siguiente tabla:

08
Paso 1: Defina la hipótesis de trabajo:
Ho: No hay asociación entre la práctica de actividad física y el consumo de bebidas
azucaradas en este grupo de escolares EE
H1: Si hay asociación entre la práctica de actividad física y el consumo de bebidas E
azucaradas en este grupo de escolares
Paso 2: Defina el nivel de significancia para la prueba Estadística
∝ = 0,05
Paso 3: Calcule los grados de libertad (gl) para la prueba
(r= # filas, c= # columnas) 09
gl= (r-1) (c-1)
gl= (3-1) (2-1)
gl= (2) (1)
gl= 2
Paso 4: Establezca el valor de critico (rechazo) de la H o para la distribución X2
Con los valores calculados de alfa y grados de libertad, se consulta en una tabla de
distribución de probabilidad X2 su valor crítico. Para nuestro ejemplo (consultar
una tabla de distribución de probabilidad X2 con los valores gl= 3 y alfa= 0,05 este EE
valor es igual a 7,815) E

Paso 5: Calcule el valor para el estadístico de contraste (X2 para los datos del
ejemplo: 10
Ya cuenta con los datos de los valores observados en el cuadro uno. Los valores
esperados en cada celda se calculan como el producto aritmético entre sus
valores marginales (color gris) dividido por el total de observaciones así:
EE
E

11
Paso 6. Valide el supuesto de que menos del 20% de las celdas en la tabla tiene valores esperados
≤5. En este caso se cumple el supuesto y no es necesario acudir a una prueba exacta como el test
exacto de Fisher.

EE
Paso 7. Calcule el valor de X2 para el ejemplo usando la formula descrita inicialmente

12
Paso 8. Regla de decisión
Como el valor calculado de X2 para el ejemplo es 10,7 y previamente establecimos que el punto
crítico para la distribución X2 con un alfa de 0,05 y 3 gl es igual a 7,8 podemos afirmar que nuestro
valor del estadísticoRevista Médica Sanitas 95 PRUEBA CHI-CUADRADO DE INDEPENDENCIA
APLICADA A TABLAS 2 xN de prueba está dentro de la zona de rechazo de Ho formulada a priori.
Paso 9. Interpretación
Con los datos de nuestro estudio, tenemos suficiente evidencia para rechazar la Ho
de que No hay asociación entre la práctica de actividad física y el consumo de
bebidas azucaradas en este grupo de escolares. Cuidado; un error frecuente es EE
afirmar que en consecuencia, se acepta la H1. Es necesario recordar que el análisis E
de pruebas estadísticas y su interpretación se hacen siempre sobre la Ho.

CONCLUSIÓN
La prueba X2 es muy usada en el análisis de datos de investigación biomédica, su
13
aplicación es relativamente sencilla al igual que su interpretación. Múltiples estudios
en ciencias sociales e investigación clínica hacen uso de esta prueba en tablas de
2x2 (nxn); sin embargo, esta puede ser aplicada en tablas relativamente más
complejas (nxN) siempre y cuando se cumplan los supuestos necesarios para su
aplicación.
EJERCICIOS

EJ
1.- Un jugador quiere probar que es legal el dado con el que juega. Tiro el dado 120 veces y obtuvo la siguiente EJ
distribución de frecuencias de las caras resultantes. EJ
Resultado 1 2 3 4 5 6
Frecuencia 15 25 33 17 16 14

a) Enuncie las hipótesis de la prueba y determine las frecuencias.

2.- El gerente de ventas de una compañía P&C afirma que todos sus vendedores realizan el mismo número de visitas
durante el mismo período de tiempo. Una muestra aleatoria de 5 registros de los vendedores en una semana dad reveló
el siguiente número de visitas.

Vendedor A B C D E
Número de visitas 23 29 25 23 30

Con el nivel de significado de 0.05, ¿es razonable aceptar la afirmación del gerente?

14
15 TOMEN AGUA

También podría gustarte