Está en la página 1de 7

EL CHI CUADRADO

Sirve para someter a prueba hipótesis referidas a distribuciones de frecuencias.


En términos generales, esta prueba contrasta frecuencias observadas con las frecuencias
esperadas de acuerdo con la hipótesis nula. En este artículo se describe el uso del
estadístico chi-cuadrado para probar la asociación entre dos variables utilizando una
situación hipotética y datos simulados.

Luego se describe su uso para evaluar cuán buena puede resultar una distribución teórica,
cuando pretende representar la distribución real de los datos de una muestra determinada.
A esto se le llama evaluar la bondad de un ajuste. Probar la bondad de un ajuste es ver en
qué medida se ajustan los datos observados a una distribución teórica o esperada. Para
esto, se utiliza una segunda situación hipotética y datos simulados. (Baró, 2000)

La prueba de Chi
cuadrado utiliza una
aproximación a la
distribución Chi
cuadrado, para evaluar la
probabilidad de una
discrepancia igual o
mayor.

Esta prueba solamente


La prueba de chi o Ji
puede aplicarse a
cuadrado (Χ2), es sin
estudios basados en
duda la más conocida
muestras
CHI CUADRADO y probablemente la
independientes, y
más utilizada para el
cuando todos los valores
análisis de variables
esperados son mayores
cualitativas.
de 5.

La prueba de chi cuadrado de


independencia entre dos
variables cualitativas fué
desarrollada ya en 1900 por
Pearson, y su utilidad es
precisamente evaluar la
independencia entre dos
variables nominales u ordinales
La exactitud de esta evaluación depende de que los valores esperados no sean muy
pequeños, y en menor medida de que el contraste entre ellos no sea muy elevado.

PRUEBAS CHI-CUADRADO DE AJUSTE E INDEPENDENCIA


Las pruebas chi-cuadrado son un grupo de contrastes de hipótesis que sirven para
comprobar afirmaciones acerca de las funciones de probabilidad (o densidad) de una o
dos variables aleatorias.
Estas pruebas no pertenecen propiamente a la estadística paramétrica pues no establecen
suposiciones restrictivas en cuanto al tipo de variables que admiten, ni en lo que refiere a
su distribución de probabilidad ni en los valores y/o el conocimiento de sus parámetros.
Se aplican en dos situaciones básicas:
- Cuando queremos comprobar si una variable, cuya descripción parece adecuada,
tiene una determinada función de probabilidad. La prueba correspondiente se
llama chi-cuadrado de ajuste.

- Cuando queremos averiguar si dos variables (o dos vías de clasificación) son


independientes estadísticamente. En este caso la prueba que aplicaremos ser la
chi-cuadrado de independencia o chi-cuadrado de contingencia.

PRUEBAS CHI-CUADRADA Y ESTADISTICA NO PARAMÉTRICA

Como ya se ha visto varias veces, los resultados obtenidos de muestras no siempre


concuerdan exactamente con los resultados teóricos esperados, según las reglas de
probabilidad. Por ejemplo, aunque consideraciones teóricas conduzcan a esperar 50 caras
y 50 cruces cuando se lanza 100 veces una moneda bien hecha, es raro que se obtengan
exactamente estos resultados.

Supóngase que en una determinada muestra se observan una serie de posibles sucesos E1,
E2, E3, . . . , EK, que ocurren con frecuencias o1, o2, o3, . . ., oK, llamadas frecuencias
observadas y que, según las reglas de probabilidad, se espera que ocurran con frecuencias
e1, e2, e3, . . . ,eK llamadas frecuencias teóricas o esperadas.

A menudo se desea saber si las frecuencias observadas difieren significativamente de las


frecuencias esperadas. Para el caso en que solamente son posibles dos sucesos E1 y
E2 como, por ejemplo, caras o cruces, defectuoso, etc., el problema queda resuelto
satisfactoriamente con los métodos de las unidades anteriores. En esta unidad se considera
el problema general.
Definición de X2

Una medida de la discrepancia existente entre las frecuencias observadas y esperadas es


suministrada por el estadístico X2, dado por:

Donde si el total de frecuencias es N:

Si X2 = 0, las frecuencias observadas y esperadas concuerdan exactamente, mientras que


si X2>0, no coinciden exactamente. A valores mayores de X2, mayores son las
discrepancias entre las frecuencias observadas y esperadas.

Si las frecuencias esperadas son al menos iguales a 5, la aproximación mejora para valores
superiores.

El número de grados de libertad está dado por:

=k–1–m

En donde:

K = número de clasificaciones en el problema.

m = número de parámetros estimados a partir de los datos muéstrales para obtener los
valores esperados.
EJEMPLO DE CHI CUADRADO EXPRESADO EN LAS LEYES
MENDELIANAS

La Prueba de Chi-Cuadrado

Una pregunta importante que necesita responderse en cualquier experimento genético es


cómo podemos decidir si nuestros datos están de acuerdo con las proporciones
Mendelianas que hemos expuesto. Una prueba estadística que resulta muy útil es la
prueba de hipótesis de Chi-cuadrado.

Fórmula de Chi-cuadrado:

(VALOROBSERVADO−VALOREXPRESADO)2
𝑋2= ∑ VALOR EXPRESADO

Grados de libertad (gl): n-1 donde n es el número de clases.

Probemos si los siguientes datos se ajustan a la proporción 9:3:3:1

Valores Observados Valores Esperados


315 semillas redondas y amarillas (9/16)(556) = 312.75 redondas y amarillas
108 semillas redondas y verdes (3/16)(556) = 104.25 redondas y verdes
101 semillas arrugadas y amarillas (3/16)(556) = 104.25 arrugadas y amarillas
32 semillas arrugadas y verdes (1/16)(556) = 34.75 arrugadas y verdes
556 Total de semillas 556.00 Total de semillas

Aplicando la ecuación:

X2 = 0,47

Número de clases: 4
Gl (grados de libertad): n-1= 4-1= 3
Valor de Chi-cuadrado: 0.47

Si se entra en la Tabla de Chi-cuadrado por tres grados de libertad, se observa que el valor
de Chi-cuadrado encontrado se encuentra con una probabilidad mayor de 0,90. Quiere
decir que la probabilidad de encontrar un valor de Chi-cuadrado como el calculado para
nuestro experimento es mayor del 90%, que es lo mismo que decir que las diferencias
entre los valores observados y calculados se deben al azar con una probabilidad mayor al
90%.

Por convención estadística se utiliza el valor de 0.05 de probabilidad como el valor límite
o crítico. Si el valor de Chi-cuadrado calculado para un experimento es mayor que el
correspondiente al de la probabilidad del 5% se rechaza la hipótesis. En el caso del
Ejemplo anterior el valor calculado es menor que el valor encontrado en la tabla de Chi-
cuadrado por lo que se acepta la hipótesis de que los datos se ajustan a una distribución
9:3:3:1.

Tabla de Chi-cuadrado

probabilidad
Grados de Libertad 0.9 0.5 0.1 0.05 0.01
1 0.02 0.46 2.71 3.84 6.64
2 0.21 1.39 4.61 5.99 9.21
3 0.58 2.37 6.25 7.82 11.35

EJERCICIO 2.

Un investigador quiere estudiar si hay asociación entre la práctica deportiva y la sensación


de bienestar. Extrae una muestra aleatoria de 100 sujetos. Los datos aparecen a
continuación

Sensación de Práctica deportiva Total


Bienestar
Sí no
Sí 20 25 45
No 10 45 55
Total 30 70 100

Contraste la hipótesis de independencia entre bienestar y práctica de deporte (alfa = 0,01).

f i. f. j
eij 
Calculemos las frecuencias esperadas: n

Sensación de bienestar Práctica deportiva


Sí No
Sí (45x30)/100=13,5 (45x70)/100=31,5
No (55x30)/100=16,5 (55x70)/100=38,5

( f ij  eij ) 2
Calculemos chi-cuadrado:  2
exp  
i j eij
1. Hagamos otra tabla, donde restamos a las frecuencias absolutas las frecuencias
esperadas.
2. Este valor elevado al cuadrado
3. Dividido por las frecuencias esperadas

Sensación de Práctica deportiva


bienestar
Sí No
Sí 3,1296 1,3413
No 2,5606 1,0974

exp
2
 3,1296  1,3413  2,5606  1,0974  8,13

 exp
2
 8,13
Tenemos:

Ahora calculemos el valor de la tabla Chi-cuadrado

1. Grados de libertad son:

K = (número de fila-1)x(número de columnas-1)

= (2-1)x(2-1) = 1

2. El valor alfa 0,01


3. El valor que buscamos

 g2.l .;  12;0,01  6,63

 exp
2
 8,13
Tenemos:

 g2.l .;  12;0,01  6,63

exp
2
 12;0,01
Por lo tanto:

Las variables no son independientes

La práctica deportiva y la sensación de bienestar estás asociadas.


BIBLIOGRAFÍA

Baró, J. y Alemany, R. (2000): “Estadística II”. Ed. Fundación Universitat Oberta de


Catalunya. Barcelona.

Peña Sánchez de Rivera, D. (1987): “Estadística. Modelos y Métodos. Volumen 2”.


Alianza Editorial. Madrid. ISBN: 84-206-8110-5

R. Vélez y A. García: “Cálculo de Probabilidades y Estadística Matemática”. Ciencias


Matemáticas. UNED.

A. Martín Andrés y J. de D. Luna del Castillo: “ Bioestadística” Ediciones Norma.