Está en la página 1de 8

Curso virtual: Estadística básica aplicada con SPSS

Estadística ba sica con SPSS


Unidad 5:
Pruebas de Chi-cuadrado

Contenido

1. Prueba de independencia de Chi-cuadrado .................................................................................2


1.1 Hipótesis de prueba de independencia ................................................................................2
2. Prueba de frecuencias observadas y esperadas de Chi-cuadrado .................................................5
2.1 Hipótesis frecuencias observadas y esperadas .....................................................................5

1
Curso virtual: Estadística básica aplicada con SPSS

1. Prueba de independencia de Chi-cuadrado


También conocidas tablas de contingencia, o tablas cruzadas. La prueba de independencia se las
emplea para determinar la relación entre dos variables categóricas. Siendo un análisis bivariable.

La relación de las dos variables categóricas, se la determina en función la dependencia o


independencia de las dos variables, es decir la distribución o comportamiento de una de las variables
es igual o diferente sea uno de los niveles de la otra variable. Esto se lo representa en una tabla de
doble entrada o tabla de contingencia, en el que las frecuencias de las categorías de una de las
variables se las ubica en las filas, y las categorías de la otra variable se ubican en las columnas, de
forma tal que uno puede observar si son o no similares. Lo recomendable es que la variable que tiene
menos categorías se las ubique en las columnas.

1.1 Hipótesis de prueba de independencia

A diferencia de la prueba de T-Student, la hipótesis que se llega a formular con la prueba de


independencia de Chi-cuadrado, no trata de una prueba de diferencia sino más bien de relación o
dependencia o independencia entre dos variables categóricas, por lo que no puede haber hipótesis
alterna de diferencia, mayor o menor. Siendo las hipótesis a plantear:

 Hipótesis Nula (H0). Expresa la independencia o no relación entre las categorías de dos variables
cualitativas, por ejemplo la variable Sexo (sus categorías Niño y Niña) y la variable Prioridad (sus
categorías Deportes, Estudio y Popular), la hipótesis nula seria:

H0: La prioridad por el deporte, estudio o popularidad es independiente del sexo.

O también:

H0: La prioridad por el deporte, estudio o popularidad no están relacionada con el sexo.

 Hipótesis Alterna (H1). En este caso la hipótesis alterna nos expresa la dependencia o relación
que se tienen entre dos variables categóricas, continuando con el ejemplo anterior, la hipótesis
alterna seria:

H1: La prioridad por el deporte, estudio o popularidad es dependiente del sexo.

O también:

H1: La prioridad por el deporte, estudio o popularidad están relacionadas con el sexo.

Debido a que en la hipótesis que se plantea en la prueba de independencia no es de diferencia, las


palabras significativo, no significativo, o se tiene significancia, quedan relegadas de la interpretación
de esta prueba, o en su caso se las emplea pero aclarando la hipótesis nula o alterna planteadas para
esta prueba.

Recordar que la hipótesis que se plantea en una prueba de independencia no es de diferencia, sino
de relación o independencia.

El valor de Chi-cuadrado está dado por.

2
Curso virtual: Estadística básica aplicada con SPSS

2
2
(𝑜𝑗 − 𝑒𝑗 )
𝜒 =∑
𝑒𝑗
𝑗

Dónde:

𝑒1 = Frecuencia esperada
𝑜1 = Frecuencia observada

Ejemplo. Se tienen los datos de la medición de tensión y si estos fuman o no, siendo los mismos los
siguientes:
Tabla 1
Datos de hipertensión de personas que fuman y no fuman

Hipertensión Normal Total


No Fuma 6 177 183
Si Fuma 79 198 277
Total 85 375 460
a. Objetivo:

Determinar la dependencia o no de la hipertensión con relación a si la persona fuma o no.

b. Hipótesis:

H0: La hipertensión es independiente de si la persona fuma o no.


H1: La hipertensión es dependiente de que la persona fume o no.

c. Calculo de los valores esperados:

 Calculo de los valores esperados del total (regla de tres):

460 – 100% 460 – 100%


183 – X 277 – X
X = 39,78% X = 60,22%

 Calculando los valores esperados para hipertensión:

85 – 100% 85 – 100%
X – 39,78% X – 60,22%
X = 33,813 X = 51,187

 Calculando los valores esperados para hipertensión:

375 – 100% 375 – 100%


X – 39,78% X – 60,22%
X = 149,175 X = 225,825

d. Organizando los valores tenemos:

 Los valores observados:

3
Curso virtual: Estadística básica aplicada con SPSS

Tabla 2
Valores observados de hipertensión de personas que fuman y no fuman

Hipertensión Normal Total


No Fuma 6 177 183
Si Fuma 79 198 277
Total 85 375 460
 Los valores esperados:
Tabla 3
Valores esperados de hipertensión de personas que fuman y no fuman

Hipertensión Normal Total


No Fuma 33,813 149,175 182,988
Si Fuma 51,187 225,825 277,012
Total 85 375 460
e. Calculando el valor de 𝜒𝑐2 :
(6 − 33,813)2 (79 − 51,187)2 (177 − 149,175)2 (198 − 225,825)2
𝜒𝑐2 = + + + = 46,608
33,813 51,187 149,175 225,825
El Chi-cuadrado calculado nos da un valor de 46,608

f. Para la determinación del valor 𝜒𝑡2 , calculamos los grados de libertad:

𝐺𝐿 = (ℎ − 1)(𝑘 − 1)
Dónde:

h = Número de categorías de la variable H (columna)


k = Número de categorías de la variable K (fila)

 Reemplazando los valores, considerando que la variable H (columnas) tiene dos categorías:
Hipertensión y Normal. La variable K (filas) tiene dos categorías: No fuma y Fuma.

𝐺𝐿 = (ℎ − 1)(𝑘 − 1)
𝐺𝐿 = (2 − 1)(2 − 1) = 1

 Buscamos en la tabla de 𝜒2 , para 1 GL y α = 0.05 (1 – 0.05 = 0.95), el valor que tenemos es 3,84

Figura 1. Determinación del Chi-cuadrado tabular

g. Regla de decisión:

4
Curso virtual: Estadística básica aplicada con SPSS

𝑋𝑐2 > 𝑋𝑡2 → 𝐻1 : (𝑁𝑜 𝑠𝑜𝑛 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠)


𝑋𝑐2 < 𝑋𝑡2 → 𝐻0 : (𝑆𝑜𝑛 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠)

Zona de Aceptación de
Zona de Rechazo de H0
H0

0.05

0
3,84 46,608

Figura 2. Ubicación de los valores calculado y teórico de Chi-cuadrado

h. Conclusión:

Como el valor de 𝜒𝑡2 cae en la zona de rechazo de la hipótesis nula. Podemos afirmar que la
hipertensión está relacionada o es dependiente de que la persona fume o no. Dicho de otra
forma el que una persona tenga hipertensión es dependiente de que fume.

2. Prueba de frecuencias observadas y esperadas de Chi-


cuadrado
La prueba de frecuencias observadas y esperadas, se la emplea cuando el objetivo del trabajo es
contrastar las frecuencias que se tienen producto del relevamiento de información y se desea
contrastar con valores teóricos también denominados frecuencias esperadas.

En caso de que no conozca las frecuencias esperadas o teóricas, se asume que los valores esperados
están distribuidos en la misma proporción, por ejemplo:

 Si se tienen tres categorías alto, medio y bajo, y no se conoce los valores teóricos o esperados, la
frecuencia teórica o esperada será: alto 33.33%, medio 33.33% y bajo 33.33%.
 Si no se conoce la proporción de varones y mujeres, la frecuencia teórica y esperada será
varones 50% y mujeres 50%.

2.1 Hipótesis frecuencias observadas y esperadas

A diferencia de la prueba de independencia de Chi-cuadrado, la hipótesis que se llega a formular con


la prueba de frecuencias observadas y esperadas de Chi-cuadrado, se trata de una prueba de
diferencia entre los valores observados y los valores esperados. Siendo las hipótesis a plantear:

 Hipótesis Nula (H0). Expresa la igualdad entre la frecuencia observada y la frecuencia esperada.
Por ejemplo: La proporción observada de varones y mujeres es igual a la frecuencia teórica:

H0: Los valores observados de varones y mujeres son similares a los valores teóricos.
5
Curso virtual: Estadística básica aplicada con SPSS

 Hipótesis Alterna (H1). En este caso la hipótesis alterna nos expresa la diferencia entre la
frecuencia observada y la frecuencia esperada, la hipótesis alterna seria:

H1: Los valores observados de varones y mujeres son iguales a los valores teóricos.

A diferencia de la prueba de independencia la hipótesis que se plantea en la prueba de frecuencias


observadas y esperadas es de diferencia, por lo que se pueden emplear la palabra significativa, no
significativa, o se tiene significancia, o se tienen diferencias.

El valor de Chi-cuadrado está dado por:


𝑘 2
2
(𝑜1 − 𝑒1 )2 (𝑜2 − 𝑒2 )2 (𝑜𝑘 − 𝑒𝑘 )2 (𝑜𝑗 − 𝑒𝑗 )
𝜒 = + + ⋯+ =∑
𝑒1 𝑒2 𝑒𝑘 𝑒𝑗
𝑗=1

Dónde:

𝑒1 = Frecuencia esperada
𝑜1 = Frecuencia observada

Ejemplo. Una caja contiene fichas de diferentes colores (rojo, naranja, amarillo y verde), se saca una
muestra de 54 fichas la que da como resultado 14 rojas, 20 naranjas, 12 amarillas y 8 verdes.
Contrastar la hipótesis de que la caja contiene una relación de 2 rojas, 3 naranjas, 6 amarillas y 1
verde.
Tabla 4
Valores observados y esperados de la extracción de fichas

Observado Esperado
Rojas 14 2
Naranjas 20 3
Amarillas 12 6
Verdes 8 1
N 54 12
a. Objetivo:
Comparar los valores observados de las fichas extractadas y los valores esperados de las
fichas.

b. Hipótesis:
H0: Los valores observados de las fichas son similares a los valores esperados.
H1: Los valores observados de las fichas son diferentes a los valores esperados.

a. Convirtiendo los valores en teóricos en términos de probabilidad (la suma total nos debe dar
uno):
2
𝑅𝑜𝑗𝑎𝑠 = = 0.167
12
3
𝑁𝑎𝑟𝑎𝑛𝑗𝑎𝑠 = = 0.25
12
6
𝐴𝑚𝑎𝑟𝑖𝑙𝑙𝑎𝑠 = = 0.50
12

6
Curso virtual: Estadística básica aplicada con SPSS

1
𝑉𝑒𝑟𝑑𝑒𝑠 = = 0.083
12
b. Calculando los valores teóricos en función de la cantidad de frecuencias observadas (N=54):

𝑅𝑜𝑗𝑎𝑠 = 0.167 × 54 = 9.018


𝑁𝑎𝑟𝑎𝑛𝑗𝑎𝑠 = 0.25 × 54 = 13.5

𝐴𝑚𝑎𝑟𝑖𝑙𝑙𝑎𝑠 = 0.50 × 54 = 27

𝑉𝑒𝑟𝑑𝑒𝑠 = 0.083 × 54 = 4.482

c. Calculando el valor de 𝜒2 :
(𝑜1 − 𝑒1 )2 (𝑜2 − 𝑒2 )2 (𝑜3 − 𝑒3 )2 (𝑜3 − 𝑒3 )2
𝜒2 = + + +
𝑒1 𝑒2 𝑒3 𝑒3
(14 − 9.018)2 (20 − 13.5)2 (12 − 27)2 (8 − 4.482)2
𝜒2 = + + +
9.018 13.5 27 4.482
𝜒2 = 16.976
d. Calculo de los grados de libertad (GL= Número de categorías - 1):

𝐺𝐿 = 𝑛 − 1
𝐺𝐿 = 4 − 1 = 3
e. Como el valor de la hipótesis alterna señala diferencia, es una prueba de diferencia (1 – 0.05 =
0.95). 𝜒2 (3 GL, α = 0.95) = 7.81.

f. Regla de decisión:

𝜒𝑐2 > 𝑋𝑡2 → 𝐻1 : (>)


𝜒𝑐2 < 𝑋𝑡2 → 𝐻0 : (=)

Figura 3. Determinación del Chi-cuadrado tabular

7
Curso virtual: Estadística básica aplicada con SPSS

Zona de Aceptación de
Zona de Rechazo de H0
H0

0.05

0
7.81 16.976

Figura 4. Ubicación de los valores calculado y teórico de Chi-cuadrado

g. Conclusión:

Como el valor de 𝜒𝑐2 cae en la zona de rechazo de la hipótesis nula. Podemos afirmar que realizada la
prueba de hipótesis de Chi-cuadrado de frecuencia observadas y frecuencias teóricas con α=0.05, se
afirma que las frecuencias observadas de las fichas son diferentes a las frecuencias esperadas o
teóricas.

-fin-

Curso Virtual: Estadística básica aplicada con SPSS


2da versión, 2019
Ofertado por la EIP y el IAB (www.gap-network.com)
Docentes y desarrollo de contenidos: M.Sc. Ramiro Ochoa Torrez y Ph.D. Juan Carlos Torrico
Facilitadores y desarrollo plataforma EIP: M.Sc. Isabel Mallea
Adaptación y desarrollo material educativo audiovisual: Carlos Andrés Torrico

También podría gustarte