Está en la página 1de 8

Chi cuadrado IB – 2020

¿Qué es la prueba (contraste) de chi cuadrado para determinar la bondad del ajuste?

La prueba (contraste) de chi cuadrado para determinar la bondad del ajuste se utiliza
cuando:

“Queremos averiguar hasta qué punto las frecuencias observadas difieren de las
esperadas”.
Podríamos estar interesados en averiguar si ciertos conjuntos de datos son
independientes. Supongamos que recopilamos datos acerca del color favorito de camiseta
para hombres y mujeres. Podríamos querer averiguar si el color y el sexo son
independientes o no.
Una forma de hacerlo es llevando a cabo una prueba de chi cuadrado para la
independencia.

Cuando obtenemos un conjunto de resultados experimentales y sabemos cuáles podrían


ser los resultados esperados, podemos calcular un valor al que se denomina “valor
calculado de chi cuadrado”.
¿Qué significa esto en la práctica?
Supongamos que lanzamos un dado 36 veces. Podemos esperar que cada cara aparezca
seis veces. Veamos que sucede si ocurriera así:

Pero, como es natural, el azar hace que la frecuencia observada de los lanzamientos del
dado no sea siempre la misma que la frecuencia esperada. Veamos que ocurre ahora:

La prueba de chi cuadrado para determinar la bondad del ajuste nos indica cuánto difiere
la frecuencia observada de la frecuencia esperada.
Entonces, ¿cómo calculamos este valor?
Hagamos el ejemplo nombrado anteriormente, del color favorito de las camisas entre
hombres y mujeres.

Para llevar a cabo una prueba de chi-cuadrado (χ2), hay cuatro pasos principales:

Paso 1: Escribir la hipótesis nula (H0) y la alternativa (H1)

H0 indica que los conjuntos son independientes.


H1 indica que los conjuntos son dependientes

Por ejemplo, las hipótesis para el color de la camiseta y el sexo podrían ser:
H0: el color de la camiseta es independiente del sexo.
H1: el color de la camiseta depende del sexo.

Paso 2: Calcular el estadístico chi-cuadrado

Primero, necesitaremos colocar los datos en una tabla de contingencia, que muestra las
frecuencias de dos variables. Los elementos en la tabla son los datos observados. Los
elementos deben ser frecuencias (no porcentajes). Estos datos, por ejemplo, pueden
obtenerse de encuestas previamente hechas a una muestra de participantes.

Entonces, la tabla de contingencia podría ser:


Si nos dan la tabla de contingencia, podríamos necesitar extenderla para incluir una fila y
una columna adicionales para los “totales”.

A partir de los datos observados, podemos calcular las frecuencias esperadas.

¿Cómo calcular las frecuencias esperadas?

Empecemos por ejemplo con el número esperado de hombres a los que les gustan las
camisetas negras

Sabemos que el total de nuestra muestra es de 300 (hombres y mujeres), con un total de
150 hombres y 83 camisetas negras.

Podemos usar la fórmula de probabilidad de sucesos independientes, o una relación


proporcional, de la siguiente manera:

300 personas en total 83 camisetas negras en total


150 hombres en total ¿camisetas negras esperadas para los hombres?

Entonces:

El número esperado de hombres a los que les gustan las camisetas blancas es:
Y así sucesivamente. La tabla de valores esperados sería entonces:

Fíjense que los totales son los mismos.

Ahora bien, para los cálculos hechos a mano, necesitamos las frecuencias esperadas, para
hallar el valor de χ2

En este caso tenemos:

 Tabla de frecuencias observadas:

 Tabla de frecuencias esperadas:

Entonces:
En los exámenes se espera que se utilice solo la calculadora para el cálculo de chi –
cuadrado, sin embargo, en el Internal, hay cálculos que tendrán que hacer a mano,
entonces es importante saberlo.

¿Cómo calculamos este valor con la calculadora?

Paso 3: Calcular el valor crítico

Primero hay que mencionar el nivel de significación. Este está dado en las preguntas de
los exámenes, pero en los proyectos hay que decidir qué nivel usar. Los niveles más
comunes son 1%, 5% y 10%.

Ahora debemos calcular el número de grados de libertad

Por lo tanto, en el ejemplo que estamos desarrollando, el número de grados de libertad


es: (2 − 1) × (4 − 1) = 3.

El nivel de significación y los grados de libertad se pueden usar para hallar el valor
crítico. Sin embargo, en los exámenes, el valor crítico siempre estará dado.

En nuestro ejemplo, a un nivel de significación del 1%, el valor crítico es 11,345. A un nivel
de significación del 5%, el valor crítico es 7,815. A un nivel de significación del 10%, el
valor crítico es 6,251.
Paso 4: Comparar el valor de chi cuadrado con el valor crítico

En nuestro ejemplo, a un nivel de significación del 5%, 33,8 > 7,815.

Por lo tanto, rechazamos la hipótesis nula que dice que el color de la camiseta es
independiente del sexo.

¿Y si usamos la calculadora?

Usamos el nivel de significación como un decimal, por lo tanto:


1% = 0,01, 5% = 0,05 y 10% = 0,1.

En nuestro ejemplo tenemos que valor p = 0,0000002

0,0000002 < 0,05; por lo tanto, rechazamos la hipótesis nula.


En resumen:

Otro ejemplo:

También podría gustarte