Está en la página 1de 28

PRUEBA CHI-CUADRADO

(variables cualitativas)

• Prueba estadística que evalúa una hipótesis acerca de la


relación entre dos variables : x , y
• Prueba si la ocurrencia o no de uno de los atributos
condiciona (o no) la ocurrencia del otro.
• Se simboliza por χ2
• Hipótesis a probar : Correlacionales
( H0 : no hay asociación y Ha :hay asociación)
Ho: El atributo X es Independiente del atributo Y
H1: El atributo X no es Independiente del atributo Y
• Variables involucradas: Dos
• Nivel de medición de las variables: nominal u ordinal

r k
Oij  Eij  2

Sean: i

j
2
exp
Eij

r=la cantidad de estratos mutuamente excluyentes en que se divide la
V.A. X
k=la cantidad de estratos mutuamente excluyentes en que se divide la
V.A. Y
Oij=las frecuencias observadas. Es el número de casos observados
clasificados en la fila i de la columna j.
Eij = las frecuencias esperadas o teóricas. Es el número de casos
esperados correspondientes a cada fila y columna. Se puede definir
como aquella frecuencia que se observaría si ambas variables fuesen
independientes.

Estrato.-Conjunto de elementos que comparten ciertos caracteres comunes y que se integra con otros conjuntos para la
formación de una entidad.
Son variables cualitativas que indican categorías o son
etiquetadas numéricamente o con nombres. Pueden ser nominal
u ordinal.

Sean X e Y dos variables categóricas. X con r categorías e Y con c


categorías.
Ejemplo:
Sea X ( edad de una persona adulta ) con dos categorías (r=2).
Categoría 1: personas adultas de 18 a 30 años
Categoría 2: personas adultas mayores a 30 años
Sea Y ( clase social) con tres categorías (c=3).
Categoría 1: clase social alta
Categoría 2: clase social media
Categoría 3: clase social baja

Podemos plantear la siguiente Ho e Ha:

H0 : No hay asociación entre la edad de una persona adulta y la


clase social
Ha : Hay asociación entre la edad de una persona adulta y la clase
social
Las tablas de contingencia se utilizan para analizar la
relación entre dos variables categóricas o bien explorar
la distribución que posee una variable categórica entre
diferentes muestras.
La prueba de independencia chi-cuadrado, contrasta la
hipótesis de que las variables son independientes,
frente a la hipótesis alternativa de que una variable se
distribuye de modo diferente para diversos niveles de
la otra.

http://www.bioestadistica.uma.es/baron/apuntes/ficheros/cap07.pdf
EJEMPLO :

En un estudio con escolares de 10 a 12 años se les preguntó a


qué daban más prioridad entre 3 posibilidades: tener buenas
notas, destacar en los deportes o ser popular entre los
compañeros.
EJEMPLO :

Se observa que ambos sexos valoran aproximadamente igual las


notas. Donde más diferencia se observa es en la preferencia que
muestran muchos chicos por los deportes y muchas chicas por la
popularidad. Observemos la tabla en porcentajes:
Para obtener un valor crítico (valor que deja un determinado
porcentaje de área en la cola) a partir de una tabla de ji cuadrado,
se debe seleccionar un nivel de significación y determinar los
grados de libertad para el problema que se esté resolviendo. Los
grados de libertad de la columna son el número de filas
(categorías) menos 1, o bien, r - 1.Los grados de libertad de cada
fila es igual al número de columnas (muestras) menos 1, o bien, k
- 1 . En resumen es igual a (r – 1)(k – 1). Para nuestro ejemplo (3-
1)(2-1)=2.
Si el número que nosotros obtenemos mediante el cálculo de χ2
es igual o mayor al que figura en la tabla, rechazamos la hipótesis
nula (Ho) y validamos, en consecuencia, nuestra hipótesis de
trabajo (Ha). Si, por el contrario, es inferior, debemos aceptar la
hipótesis nula (Ho), quedando inválida nuestra hipótesis de
trabajo (Ha).
EJEMPLO :

El 10 de abril de 1912, el Titanic zarpaba del puerto de


Southampton hacia la ciudad de Nueva York con 1313 pasajeros
a bordo, ante la admiración de una muchedumbre de curiosos
que contemplaban atónitos como aquella mole de acero se
alejaba majestuosamente del puerto. Cinco días después los
medios de comunicación de todo el mundo se hicieron eco de la
increíble noticia: el barco más grande jamás construido estaba
casi cuatro mil metros de profundidad.
• Tabla 3.1. Distribución de pasajeros en el Titanic según supervivencia
(X) y clase (Y).

Sobrevive No sobrevive
Primera clase 194 128
Segunda clase 119 161
Tercera clase 138 573
Sobrevive No sobrevive
Primera clase 194 128
Segunda clase 119 161
Tercera clase 138 573
• Los grados de libertad son:
(3-1)x(2-1)=2=k
siendo “k” los grados de libertad
Sobrevive No sobrevive Total
Primera clase 194 128 322
Segunda clase 119 161 280
Tercera clase 138 573 711
451 862 1313
Calculamos la frecuencia esperada de la fila 1 y la columna 1 = e1,1

f f 322  451 Interpretación de e1,1: La frecuencia esperada


e1,1  1. .1   110,6 correspondiente a los sobrevivientes de la
n 1313 primera clase es 110.6. Es menor que la
frecuencia observada que es 194.

Interpretación de e1,2: La frecuencia esperada


f1.  f .2 322  862 correspondiente a los no sobrevivientes de la
e1, 2    211.4 primera clase es 211.4 Es mayor que la
n 1313 frecuencia observada que es 128.
f f 322  451 f1.  f .2 322  862
e1,1  1. .1   110,6 e1, 2    211.4
n 1313 n 1313

Tabla: Frecuencias esperadas en el Titanic según supervivencia y clase social

Sobrevive No sobrevive Total


Primera clase 110.6 211.4
Segunda clase
Tercera clase
Completamos la tabla aplicando la
misma formula estadística.

Sobrevive No sobrevive Total


Primera clase 110.6 211.4 322
Segunda clase 96.2 183.8 280
Tercera clase 244.2 466.8 711
451 862 1313
A continuación llevamos a cabo los cálculos del estadístico Chi-
cuadrado.

Sobrevive No sobrevive

Primera (194  110 ,6) 2 (128  211,4) 2


 62 ,9  32 ,9
clase 110 ,6 211,4

Segunda
clase
Tercera
clase
A continuación llevamos a cabo los cálculos del estadístico Chi- cuadrado

Sobrevive No sobrevive

Primera (194  110 ,6) 2


 62 ,9 (128  211,4) 2
clase  32 ,9
110 ,6 211,4

(119  96 ,2) 2 (161  183,8) 2


Segunda  5,4  2,8
96 ,2 183,8
clase
(138  244 ,2) 2 (573  466 ,8) 2
Tercera  46,2  24 ,2
244 ,2 466 ,8
clase
Chi cuadrado
( f ij  eij ) 2 = 62.9+32.9+5.4+2.8+46.2+24.2= 174.4
 exp
2
 
i j eij
En el caso del Titanic identificamos dos variables:
X: estado de supervivencia
Y: clase
Ho: No hay asociación entre X e Y
H1: Hay asociación entre X e Y
A través de la Chi cuadrado vamos a determinar ( Ho )
si la variable estado de supervivencia ( sobreviviente,
no sobreviviente) es independiente de la variable clase.
En la figura se observa la forma de la curva de la distribución Chi Cuadrado.
Observamos que para k=2 grados de libertad los valores mayores que 10
apenas aparece, es decir, la probabilidad de un valor mayor que 10.6 es solo 0.005

Deducimos que la supervivencia si tiene relación con la clase social.


Probabilidad de un valor superior - Alfa (α)
Grados de
libertad
0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75

Se observa en la tabla Chi Cuadrado que para k=2 grados de libertad y para
un valor de alfa= 0.005 el Valor crítico de χ2 es 10.60.

Rechace H 0 si  
2 2
exp
obs c Valor crítico
de Tabla
Deducimos que la supervivencia si tiene relación con la clase social.
EJEMPLO :

Un Administrador quiere estudiar si hay asociación entre la


práctica deportiva y la sensación de bienestar. Extrae una muestra
aleatoria de 100 sujetos. Los datos aparecen a continuación:

Sensación
de Practica deportiva Total
bienestar
SI NO
SI 20 25 45
NO 10 45 55
30 70 100

Contraste la hipótesis de independencia entre la práctica deportiva


y la sensación de bienestar. Considerar alfa=0.01
Primero calculamos las frecuencias esperadas en caso de fi . f . j
eij 
independencia: n
Tabla : Frecuencias esperadas
Sensación de
Practica deportiva
bienestar
SI NO
SI 13.5 31.5
NO 16.5 38.5

Posteriormente calculamos el estadístico Chi-cuadrado:


( f ij  eij ) 2
 exp
2
  = 3,1296 + 2,5606 + 1,3413 + 1,0974 = 8,13
i j eij

Rechace H 0 si  exp  
2 2

obs c Valor crítico


de Tabla
Tabla : Frecuencias esperadas
Sensación de
Practica deportiva
bienestar ( f ij  eij ) 2
SI NO  exp
2
  = 8,13
SI 13.5 31.5 i j eij
NO 16.5 38.5

Los grados de libertad son: (n-1) x (m-1) = 1 x 1 = 1; Mirando en la tabla Chi-cuadrado


Obtenemos que la probabilidad de obtener un valor 8,13 o mayor con 1 grado de libertad
es p = 0,004. Por tanto el valor es estadísticamente significativo, pues es menor que 0,01.
Probabilidad de un valor superior - Alfa (α)
Grados de
libertad
0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75

Decisión: rechazar la hipótesis de independencia entre práctica deportiva y el bienestar.


EJEMPLO :

La siguiente tabla de contingencia muestra la tabulación cruzada


de la variable Grado de aprendizaje y la dependencia del colegio
(dividida en tres categorías, Particular, Parroquial y Estatal).

Tablas de Contingencia y Medidas de Asociación


DEPENDENCIA
GRADO DE
APRENDIZAJ PARTICULAR PARROQUIAL ESTATAL Total
E

ALTO 45 95 62
MEDIO 65 80 100
BAJO 90 62 89
Total
Contraste la hipótesis de independencia entre Tipo de
colegio y grado de aprendizaje. Considerar alfa=0.05

DEPENDENCIA

GRADO DE PARTICULAR PARROQUIAL ESTATAL Total


APRENDIZAJE

ALTO 45 95 62 202

MEDIO 65 80 100 245

BAJO 90 62 89 241
Total 200 237 251 688
Tablas de Contingencia y Medidas de
Asociación

• En nuestro ejemplo hay (3-1)*(3-1) = 4 grados de libertad.


Realizando todos los cálculos con la tabla del ejemplo, el
estadístico da 27,389.
• Se debe comparar este número con el valor crítico de la
distribución Chi-cuadrado con 4 grados de libertad a un nivel de
significación estadística del 5%

Probabilidad de un valor superior - Alfa (α)


Grados de
libertad
0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
• El valor crítico de la distribución Chi-cuadrado con 4 grados de
libertad a un nivel de significación estadística del 5% el valor
crítico correspondiente es 9,48.

Rechace H 0 si  exp  
2 2

obs c Valor crítico


de Tabla

Aceptar H 0 si  exp  
2 2

obs c

Como 27,389 > 9,48 se rechaza la hipótesis nula. Es decir, las


variables no son independientes.

También podría gustarte