Está en la página 1de 10

UNIVERSIDAD TÉCNICA DE MANABÍ

INSTITUTO DE CIENCIAS BÁSICAS


DEPARTAMENTO DE MATEMÁTICAS Y ESTADÍSTICA.

DEBER DE SUPLETORIO
DE CHI CUADRADO

DE:

• Pin Posligua Robinson Bladimir

DOCENTE:
Lcdo. Omar Cedeño
CURSO.
4TO “A”

PERÍODO ACADÉMICO:

Octubre 2017 – febrero 2018


1. Test de chi cuadrado
¿Qué se espera aprender con estos contenidos?
Presente trabajo tiene la finalidad de aprender acerca del Chi-cuadrado, su concepto y ejercicios
a desarrollar, para conocer lo fundamental que ayudara en nuestra carrera como profesionales en
el campo. Además, se reforzará los conocimientos y así como resolver ejercicios sobre Chi-
cuadrado aplicando la fórmula en ejercicios de nuestra carrera.

2. Definición de chi cuadrado

Chi- Cuadrado (X) es el nombre de una prueba de hipótesis que determina si dos variables
están relacionadas o no. Para calcular el valor de Chi- Cuadrado se realiza la siguiente
formula:

Fo: Frecuencia del valor observado

Fe: Frecuencia del valor esperado

3. Contrastes de hipótesis
Una hipótesis estadística es una asunción relativa a una o varias poblaciones, que pueden
ser ciertas o no. Las hipótesis estadísticas se pueden contrastar con la información
extraída de las muestras y tanto si se aceptan como si se rechazan se puede cometer un
error. La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se
representa por H0. Rechazar H0 implica aceptar una hipótesis alternativa (H1).

La situación se puede esquematizar:


4. Tabla de contingencia
Esta prueba puede utilizarse con datos medibles en una escala nominal.

Para realizar este contraste se disponen los datos en una tabla de contingencia. Para cada valor
o intervalo de valores se indica la frecuencia absoluta observada o empírica (Foij). A
continuación, y suponiendo que la hipótesis nula es cierta, se calculan para cada valor o intervalo
de valores la frecuencia absoluta que cabría esperar o frecuencia esperada (Eij).

La frecuencia esperada se calcula como:

(𝑡𝑜𝑡𝑎𝑙 𝑓𝑖𝑙𝑎 𝑖é𝑠𝑖𝑚𝑎)(𝑇𝑜𝑡𝑎𝑙 𝑐𝑜𝑙𝑢𝑚𝑛𝑎 𝑗é𝑠𝑖𝑚𝑎)


𝐸𝑖𝑗 =
𝑇𝑜𝑡𝑎𝑙 𝑔𝑙𝑜𝑏𝑎𝑙

El estadístico de prueba se basa en las diferencias entre la Foij y Feij y se define como:

2
(𝐹𝑜𝑖𝑗 − 𝐹𝑒𝑖𝑗 )2
𝑥 =∑
𝐹𝑒𝑖𝑗
𝑖𝑗

Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n es
suficientemente grande, es decir, si todas las frecuencias esperadas son mayores que 5. En la
práctica se tolera un máximo del 20% de frecuencias inferiores a 5.

Si las frecuencias observadas no difieren significativamente de las frecuencias


esperadas calculadas con el modelo propuesto, entonces el valor del estadístico de prueba X2 cera
cercano a cero, pero si estas diferencias son significativas, entonces el valor del estadístico X2
estará en la región de rechazo de la Hipótesis Nula (H0). Así pues, la región crítica estará situada
en el extremo superior de la distribución Chi-cuadrado con k-1 grados de libertad.
Rechazaremos H0 cuando x2 experimental>x2 crítico.

Resumiendo las ideas principales:


 Chi cuadrado es una prueba que permite estudiar la relación entre 2 variables cualitativas.
 Los datos se suelen representar en una tabla de doble entrada conocida como tabla de
contingencia. Chi cuadrado es de gran utilidad en el análisis de información en tablas de
contingencia.
 Los valores de Chi cuadrado nunca son negativos.
 Para calcular Chi cuadrado se usan algunas fórmulas estadísticas entre las que tenemos:

Fórmula frecuencia esperada:

(𝑡𝑜𝑡𝑎𝑙 𝑓𝑖𝑙𝑎 𝑖é𝑠𝑖𝑚𝑎)(𝑇𝑜𝑡𝑎𝑙 𝑐𝑜𝑙𝑢𝑚𝑛𝑎 𝑗é𝑠𝑖𝑚𝑎)


𝐸𝑖𝑗 =
𝑇𝑜𝑡𝑎𝑙 𝑔𝑙𝑜𝑏𝑎𝑙

Donde:
 𝑬𝒊𝒋 =Frecuencia esperada para una celdilla determinada
 𝑻𝒐𝒕𝒂𝒍 𝒇𝒊𝒍𝒂 𝒊é𝒔𝒊𝒎𝒂=total marginal de la fila de dicha celdilla
 𝑻𝒐𝒕𝒂𝒍 𝒄𝒐𝒍𝒖𝒎𝒏𝒂 𝒋é𝒔𝒊𝒎𝒂= total marginal de la columna de la misma celdilla
 𝑻𝒐𝒕𝒂𝒍 𝒈𝒍𝒐𝒃𝒂𝒍 =total de casos de toda la tabla.

Fórmula Chi cuadrado:

2
(𝐹𝑜𝑖𝑗 − 𝐹𝑒𝑖𝑗 )2
𝑥 =∑
𝐹𝑒𝑖𝑗
𝑖𝑗

Donde:

 𝒙𝟐 = Chi cuadrado
 𝑭𝒐𝒊𝒋 =Frecuencia observada
 𝑭𝒆𝒊𝒋= Frecuencia esperada
 ∑𝒊𝒋 = Sumatoria de las divisiones obtenidas.
 i = número de filas y j = número de columnas
Fórmula Grados de libertad:

𝒈𝒍 = (𝑰 − 𝟏)(𝑱 − 𝟏)

Donde:

 gl= grados de libertad.


 I= total de filas y J total de columnas.

5. Distribución de chi cuadrado


La distribución de chi-cuadrada es una distribución continua que se especifica por los
grados de libertad y el parámetro de no centralidad. La distribución es positivamente
asimétrica, pero la asimetría disminuye al aumentar los grados de libertad.

Minitab utiliza la distribución de chi-cuadrada (χ2) en pruebas de significancia estadística


para:

 Comprobar qué tan bien se ajusta una muestra a una distribución teórica.
Por ejemplo, puede utilizar una prueba de bondad de ajuste de chi-
cuadrada para determinar si los datos de la muestra se ajustan a una
distribución de Poisson.
 Comprobar la independencia de las variables categóricas. Por ejemplo, un
fabricante desea saber si la ocurrencia de cuatro tipos de defectos
(espárrago faltante, abrazadera rota, sujetador flojo y sello con fugas) está
relacionada con los turnos (diurno, vespertino, nocturno).

Cuando los grados de libertad son 30 o más, la distribución de chi-cuadrada puede


aproximarse razonablemente con una distribución normal, como se ilustra en las
siguientes gráficas:

Distribución de chi-cuadrada con 20 grados de libertad


Distribución de chi-cuadrada con 40 grados de libertad

6. Test de independencia de dos variables categóricas


• La prueba de independencia consideran (cuando menos) dos variables categóricas y lo
que se prueba es la Ho que las variables son estadísticamente independientes.

Ho : las variables son independientes (no existe relación)

Ha : las variables son dependientes.(existe relación)

7. Ejercicio
En un grupo de 191 personas queremos investigar si el sexo (hombre, mujer) influye en
la situación laboral (empleado, desempleado). Nivel de significación de 0,05

Tabla de datos observados:

Hombre Mujer Total


Empleado 40 55 95
Desempleado 70 26 96
TOTAL 90 71 191

Ho= no existe relación entre el sexo y la situación laboral.


Ha= si existe relación entre el sexo y la situación laboral.

El ejercicio nos da los siguientes datos:


 Frecuencias observadas:
Fo11=40, Fo 12=55
Fo 21=70, Fo 22=26

 Frecuencias marginales (fila/columna):


o Para las frecuencias marginales filas
F1=(40+55)=95
F2=(70+26)=96
o Para las frecuencias marginales columnas
C1=(40+70)=110
C2=(55+26)=81
 Total global (tamaño de la muestra): T=191

(𝑡𝑜𝑡𝑎𝑙 𝑓𝑖𝑙𝑎 𝑖é𝑠𝑖𝑚𝑎)(𝑇𝑜𝑡𝑎𝑙 𝑐𝑜𝑙𝑢𝑚𝑛𝑎 𝑗é𝑠𝑖𝑚𝑎)


Tabla de datos esperados: 𝐸𝑖𝑗 = 𝑇𝑜𝑡𝑎𝑙 𝑔𝑙𝑜𝑏𝑎𝑙

Hombre Mujer Total


90𝑋95 71𝑋95
Empleado 191
=44.76 191
=35,31 95
90𝑋96 71𝑋96
Desempleado 191
=45,23 191
=35,68 96

TOTAL 90 71 191

 Frecuencias esperadas:
Fe11=44.76, Fe12=35,31
Fe21=45.23, Fe22=35,68
comprobamos que la muestra es mayor de 50 (n=191), que las variables son cualitativas,
que las categorías son excluyentes y que no hay ningún valor esperado por debajo de 5,
por lo tanto podemos usar chi cuadrado, cuya fórmula es:

X² = ∑ (fo – fe)² / fe
X²= [(40 – 44.76)² / 44,76] + [(55 – 35.31)² / 35.31] + [(70 – 45.23)² / 45.23] + [(26 –
35.68)² / 35.68] = 27.67

grado de libertad:
gl=(I-1)x(J-1)
gl=(2-1)x(2-1) = 1x1=1

Buscamos en la tabla de distribución de chi cuadrado un nivel de significancia de 0,05


(5% de riesgo es lo que se suele tomar en la práctica) en la parte superior y un grado de
libertad de 1 por el lateral izquierdo, obteniendo el valor crítico de 3,84.
𝑥 2(0.05;1) = 3,84 (se lee como: el valor crítico con un nivel de riesgo del 5% y con unos
grados de libertad de 1 es igual a 3,84)
análisis de dicho valor nos valemos del siguiente enunciado: Rechazaremos H0 cuando
x2 experimental>x2 crítico.

Como 27,67 > 3,84 rechazamos la hipótesis nula (H0), es decir, sí existe relación entre
el sexo y la situación laboral.

Prueba chi cuadrado en el computador con el programa


R:
realizado la prueba chi cuadrado en el programa R.

tabla y guardar con el botón aceptar.


Como podemos observar, el p-valor es menor o igual de 0.05 (p valor=0.0000001259)1,
por lo que rechazamos la hipótesis nula de independencia de las variables. Por lo tanto,
sí existe relación entre el sexo y la situación laboral.
Pues bien, hemos detectado que ambos factores están relacionados. ¿Pero cómo están
relacionados? Para ello necesitamos el análisis de correspondencias obtenido mediante
el paquete CA de R, como a continuación se explica.
Análisis de correspondencias
Antes de realizar un análisis de correspondencias, es absolutamente necesario contrastar
si ambos factores son o no dependientes mediante un test de Chi-cuadrado. Sólo si ambos
son dependientes (correlacionados), tiene sentido hacer un análisis de correspondencias.

También podría gustarte