Está en la página 1de 19

Estadística II

Unidad III
UNIVERSIDAD DE GUADAJALARA
Centro Universitario de Ciencias Económico Administrativas

Mtro. Oscar H. Piña Bejarano


oscar.pina5192@academicos.udg.mx

9 de noviembre de 2020 1 / 19
Ji-Cuadrada
(χ2)

9 de noviembre de 2020 2 / 19
La técnica Ji o Chi cuadrada (χ2 ) es una prueba que permite analizar si
dos variables son independientes o dependientes una de otra. Asimismo,
cabe mencionar que las hipótesis son las siguientes:

H0 : Las características del estudio son independientes


H1 : Las características del estudio son dependientes

Un aspecto importante a considerar es que el tanto el valor crítico como


el estadístico de prueba son siempre positivos. No obstante, regla de
contraste sigue siendo igual que las pruebas de hipótesis anteriores.

9 de noviembre de 2020 3 / 19
Figura 1. Distribución bidireccionada

Área de NO Rechazo

[(alfa/2), gl] [(1-alfa/2), gl]

9 de noviembre de 2020 4 / 19
Figura 2. Distribución unidireccionada

Área de
NO Rechazo

[(alfa), gl]

Área de
NO Rechazo

[(1-alfa), gl]

9 de noviembre de 2020 5 / 19
Nótese en la figura 1 que la distribución Ji cuadrada es bidireccionada,
por tanto, el nivel de significancia (alfa) se dividide en dos.

Así, de lado derecho se realiza la operación 1 − α/2, posteriormente


el resultado se busca directamente en la tabla correspondiente con sus
respectivos grados de libertad. Mientras que de lado izquierdo solo se
ubica el nivel de significancia de manera directa.

Análogamente se realiza lo mismo cuando es prueba unidireccionada


(figura 2) pero sin necesidad de dividir el nivel de significancia (alfa).

9 de noviembre de 2020 6 / 19
Tabla 1. Distribución Ji-Cuadrada

9 de noviembre de 2020 7 / 19
Tabla 1.1. Distribución Ji-Cuadrada

9 de noviembre de 2020 8 / 19
Nótese en la tabla Ji-cuadrada la primer fila, gl son los grados de
libertad, mientras que la numeración es el nivel significancia (cuando
el sesgo es hacia la izquierda) y nivel de confianza (cuando el sesgo es
hacia la derecha) simultáneamente.

Por ejemplo, si se tienen los siguientes datos en una prueba bidireccio-


nada:
Grados de libertad (gl) igual a 14
Nivel de significancia (α) al 10 %

¿Cuál es el valor de Ji-cuadrada (χ2 )?

9 de noviembre de 2020 9 / 19
Respondiendo a la pregunta anterior, se observa que de acuerdo a la
figura 1 y la tabla 1 con los datos propuestos, los valores son:

El nivel alfa se divide en dos, quedando al 5 % y por lo tanto, para


el lado izquierdo se busca en la tabla la columna 0.050 y la fila
14, cuyo valor corresponde a 6.571

De lado izquierdo se realiza 1 − α/2 es decir, 1 − 0.05 = 0.95.


Por lo tanto, en la tabla se busca la columna 0.950 y la fila 14,
cuyo valor corresponde a 23.685

Así, los valores para Ji bidireccionada son χ2 = [6.571; 23.685] con 14


grados de libertad.

Pero, ¿Cómo se calculan los grados de libertad?

9 de noviembre de 2020 10 / 19
Tabla 2.

9 de noviembre de 2020 11 / 19
Para este caso se utilizarán solo los datos encerrados en el recuadro
rojo (ojo: el tamaño de la matriz de datos puede variar dependiendo
de los datos y estudio).

Para calcular dichos grados, se realiza la siguiente operación:


gl = (F ilas − 1) (Columnas − 1)

En este caso, de acuerdo a la tabla 2, el número de filas son 6 y el


número de columnas también son 6. Sustituyendo datos, se sabe que
los grados de libertad serían 25.

9 de noviembre de 2020 12 / 19
Para practicar

Considera los siguientes datos:

Calcula el valor de χ2 a un nivel significancia del 5 % en una


matriz de datos de 11 filas y 5 columnas bajo una prueba
bidireccionada.

Replica el ejercicio anterior pero con una prueba unidireccionada


a la derecha

¿y hacia la izquierda?

9 de noviembre de 2020 13 / 19
Ejemplo...
Un señor X se opone al seguro de salubridad nacional, porque mucha
gente abusa y permanece más tiempo del requerido en el hospital, ya
que tiene la creencia de que los días de hospitalilzación dependen del
seguro o tipo de contrato de las personas.

Se le pide a un estadístico verifique una muestra aleatoria de 660


hospitalizaciones con un α = 1 %. Obtenienddo los siguientes datos:
Tipo de Días de hospitalilzación
Cobertura 1-5 6-10 >10 TOTAL
< 25 40 75 65 180
25-30 30 45 75 150
> 50 40 100 190 330
TOTAL 110 220 330 660

9 de noviembre de 2020 14 / 19
En este caso las hipótesis son:

H0 : Los datos de hospitalización y tipo de cobertura son indepen-


dientes o no son dependientes.

H1 : Los datos de hospitalización y tipo de cobertura son depen-


dientes o no son independientes.

Basado en los datos del ejemplo, es decir, un nivel de significancia al


1 % y 4 grados de libertad (ver ejemplo de cálculo). Entonces, se puede
decir que el valor crítico χ2 = 13.277 (prueba con sesgo a la derecha).

9 de noviembre de 2020 15 / 19
Para calcular el estadístico de prueba se utiliza:

2
χ2 = Σni=1 (oi.−e
ei .
i)

Donde:
oi es la frecuencia observada
ei es la frecuencia esperada

Por lo tanto, χ2 es la sumatoria de dividir la diferencia cuadrática de


la frecuencia observada y esperada entre la esperada.

Para calcular el estadístico Ji-Cuadrada del ejemplo, se ordenan los


datos de la matriz en una sola columna; la columna 2 debajo de la 1
y la columna 3, debajo de la 2 (sin incluir los totales).

9 de noviembre de 2020 16 / 19
Tabla 3.

9 de noviembre de 2020 17 / 19
Para calcular la frecuencia esperada, dado que la matriz se hizo un
vector columna, colocando cada columna debajo de la otra, entonces,
para la frecuencia esperada se multiplicará el total de la columna 1
(110) por el total de la fila 1 (180) dividido entre 660. Posteriormente,
se repite el proceso de la columna 1 con la fila 2 y 3.

De nueva cuenta se hace el proceso pero con los totales de las columnas
2 (220) y 3 (330), es decir dichos totales se multiplicarán por los totales
de cada fila 1, 2 y 3 y serán divididos por el gran total 660, para
colocarlos en el orden correspondiente (checar tabla 3).

9 de noviembre de 2020 18 / 19
Nótese que el estadístico de prueba χ2calc = 24.31566, lo que implica
que al ser mayor al valor crítico (χ2tab = 13.277), cae en la zona de
rechazo. Por lo tanto, la hipótesis nula (H0 ) se rechaza, lo que significa
que los datos de hospitalización y tipo de cobertura no son
independientes o bien son dependientes.

Por lo tanto, se concluye que existe evidencia suficiente a un nivel de


significancia del 1 % con 4 grados de libertad, de que los datos están
asociados. Es decir, hay dependencia entre el tipo de cobertura y los
días de hospitalización.

9 de noviembre de 2020 19 / 19

También podría gustarte