Está en la página 1de 45

 2

CHI CUADRADO -
TEST
Variables de datos cualitativos que pueden estar relacionadas

El objetivo de la
prueba es mostrar si
existen diferencias
estadísticamente
significativas entre
las distribuciones de
las frecuencias
Variables cualitativas/ Categoricas o de nivel nominal

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018


1
UN POCO DE HISTORIA…

Darwin Dalton

Karl Pearson: 1891-1896/1900


“….la misión de la
ciencia no es explicar
Correlación (r) sino describir, descubrir
una formula descriptiva
Chi Cuadrada ( )
2
con la que seremos
capaces de predecir la
naturaleza.”
PRUEBA DE
INDEPENDENCIA  2

SOLO INDICA SI HAY RELACIÓN O NO. No indica el grado o el tipo de relación

La prueba de independencia χ2 se usa para sugerir asociación,

La prueba se realiza suponiendo que las variables no están asociadas


en absoluto.

El objetivo es rechazar o aceptar esa conjetura o hipótesis.

3
Ho H1

HIPOTESI
El vinculo o no entre variables

HIPOTESI
S
S NULA
nominales o categóricas

ALTERNA

NO RELACIÓN SI RELACIÓN

4
Ejemplo No 1
Se recogen datos acerca del color favorito de camiseta
para hombres y mujeres y se desea averiguar si el
color y el género son independientes.

 ■ Paso 1: Escribir y
 : El color de la camiseta es independiente del género.
 : El color de la camiseta no es independiente del género

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 5


 Paso 2:Calcular el estadístico Chi cuadrado (

2a.Construir una tabla de contingencia con las


frecuencias observadas
fo Negro Blanco Rojo Azul Totales
Hombres 48 12 33 57 150
Mujeres 35 46 42 27 150
Totales 83 58 75 84 300

REQUISITOS: 1. Variables cualitativas


2. n > 30
3. No error de casilla (obs <5 )
6
 

2b. Construir una tabla de contingencia con las frecuencias


Cálculo de frecuencias teóricas o esperdas para cada celda

fe Negro Blanco Rojo Azul Totales

Hombres 150

Mujeres 150
Mujeres 150
Totales 83 58 75 84 300
Totales 83 58 75 84 300

De la misma manera se calculan las demás frecuencias esperadas


esperadas

7
Frecuencias observadas (también denominadas empíricas)

Son las que observamos y anotamos.


De las frecuencias…

Frecuencias teóricas (también denominadas esperadas)

Son las más probables en el caso de no relación o no


diferencia.

Al calcular las frecuencias


teóricas (o esperadas)
conviene dejar al menos
tres decimales.

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018


8
■  2c. Calcular el estadístico Chi Cuadrado. Para ello aplicamos

el modelo

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 9


3. GRADOS DE LIBERTAD
ES ALGO que no necesita ser entendido salvo en teoría
estadística.

Para este ejercicio:


GL

10
4. Paso 3: calcular el valor crítico.
Se escoge un nivel de significación y se asocial con los grados de
libertad en la siguiente tabla


  En los exámenes se
menciona el nivel de
significación

pero en los proyectos hay


que decidir qué nivel
utilizar. Los más comunes
son 1%,5% y 10%.
A estos niveles se les
denomina .
Para este caso

A este número se le
denomina valor
crítico

11
5. Decidir
Primera forma: Comparar los valores calculados con los valores críticos

Valor Crítico
7.815 Valor X2 Calculado
33.8
 Comparamos estos valores y tenemos que por lo cual si el
valor de Chi cuadrado es mayor que el valor crítico
entonces se rechaza la hipótesis nula y se acepta la hipótesis
alternativa .
Es decir que la elección del color de camiseta no es
independiente del género. 12
 Segunda forma: Comparar el valor de con el valor de la probabilidad p

El valor de p es 2.245x10-7

 Si p< rechazamos H0 y aceptamos H1

Como 2.245x10-7 < 0.05 rechazamos H0 y aceptamos H1

Es decir que la elección del color de camiseta no es


independiente del género.

13
  para realizar una prueba de Chi cuadrado (
Pasos
■  
1. Escribir la hipótesis nula () y ■  
3. Calcular el valor crítico: Chi
la hipótesis alternativa (). teórico
indica que los conjuntos son (te lo pueden dar o de lo contrario se
independientes. debe determinar a partir de una tabla en
la que se relacionan los grados de
indica que los conjuntos no son
libertad y el nivel de significancia.
independientes.
4. Comparar con el valor crítico
2.Calcular el estadístico Chi para determinar si hay o no
cuadrado ( independencia.
- Se realiza una tabla de contingencia -Si calc es menor que el valor crítico,
con las frecuencias observadas y entonces no se rechaza la hipótesis nula.
luego se calculan las frecuencias -Si calc es mayor que el valor crítico,
esperadas. entonces se rechaza la hipótesis nula y
se acepta la alternativa.

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 14


¿Qué nos dice CHI?
El χ2 lo que nos dice es si las frecuencias observadas están dentro de lo
probable en el caso de no asociación.

Un valor de χ2 pequeño
nos dice que nuestros resultados podemos equipararlos a la posibilidad
de que no haya asociación
Las frecuencias que observamos se parecen mucho a las teóricas o
esperadas, a las que tendríamos en caso de no asociación o no
diferencia.

Un valor de χ2 grande nos dice que nuestros


resultados podemos interpretarlos como la
posibilidad B (sí hay relación). Las frecuencias que
observamos se apartan mucho de las teóricas o
esperadas, las que tendríamos en caso de no
asociación o no diferencia.

15
 
Ejemplo 2

PRESENTAR LOS DATOS…


Se recogen datos acerca de lo que algunas personas creen que existe
después de la muerte y se desea averiguar si estas creencias y el género son
independientes.
Paso 1:
 Paso 2:Calcular el estadístico Chi FRECUNECI
cuadrado( AS
OBSERVAD
2a.Construir una tabla de contingencia con AS

las frecuencias observadas


Tabla de Contingencia
CIELO/PARAISO VIDA/RESURRECCI
ENCUENTRO
CON EL REENCARNACIÓN NO SE NADA
/INFIERNO ÓN
COSMOS Totales
HOMBR
E 14 31 7 11 20 22 105
MUJER 16 15 10 5 6 15 67
Totales 30 46 17 16 26 37 172

16
2b. Construir una tabla de contingencia con las frecuencias
observadas.
ENCUENTRO
CIELO/PARAISO VIDA/RESURRECCI
CON EL REENCARNACIÓN NO SE NADA
/INFIERNO ÓN
COSMOS Totales
HOMBR
E 18.3 28.1 10.4 9.8 15.9 22.6 105
MUJER 11.7 17.9 6.6 6.2 10.1 14.4 67
Totales 30 46 17 16 26 37 172

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 17


■  2c. Calcular el estadístico Chi Cuadrado. Para ello aplicamos

el modelo

18
■ Paso
  3: calcular el valor crítico.
 Se menciona el nivel de significación, se tomará el 5%
 Se calcula el número de grados de libertad con la fórmula

Para este ejercicio:

• De acuerdo con la tabla para valores críticos (Chi cuadrado


teórico), tenemos que si los grados de libertad son 5 y el nivel
de significancia es 5% el valor crítico será 6.251, 7.815 y
11.345 respectivamente

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 19


• Paso 4: Comparar calculado para el ejercicio con el
 

valor crítico (Chi cuadrado teórico) seleccionado según


los grados de libertad y el nivel de significancia.

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 20


OTRAS
CONSIDERACION
ES…

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 21


El ERROR de casilla
Cuando en una casilla la frecuencia es
menor a cinco se considera a este hecho
como un error de casilla. Esto es un
inconveniente, porque puede aumentar
sustancialmente la falta de fiabilidad de la
información que aporta la prueba.

Crear
categorías

SOLUCIONES Ajuste de
Yates

Otra Prueba

22
Algunos detalles de la tabla de Contingencia

Andando Trans Coches Bici Total


público
Chicas 18 13 14 3 48

Chicos 9 17 10 16 52

Total 27 30 24 19 100
Poblaciones Menores a 40
(N<40)

PROYECT
O

Error de casilla (irresoluto) –


La frecuencia teórica es menor a
5

Corrección de Yates
LA CRITICA AL AJUSTE:

La prueba de CHI se convierte en una prueba demasiado


conservadora (no se rechaza la Hipótesis Nula cuando se
podría rechazar legítimamente).

24
Aplicar la corrección de Yates
en tablas 2x2 cuando una
frecuencia teórica es inferior a
5.
PROYECT
O
NO utilizar el CHI cuadrado en
tablas mayores si más del 20%
de las frecuencias teóricas es
inferior a 5.

Corrección de Yates
SUGERENCIA:

En muestras menores a 20 datos usar la prueba de


FISHER.

25
Ajuste de Yates
Chi

 
2
n
 f oi  f ei  2

i 1 f ei
Yates

 
2
n f oi  f ei  0,5
2

i 1 f ei
Calcular para analizar…
0. Incluir datos en matrix.
2ND MATRIX (se programa la matrix)
Se meten los datos

1. Cálculos
STAT TEST 1: ALPHA C (TECLA PROG)
calcular

Nos da 1. calculado 2. teorico 3. gf

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018


27
VAMOS A
PRACTICAR…

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 28


s …
ic io For his Mathematical Studies Project a student gave his
classmates a questionnaire to fill out. The results for the

j e rc question on the gender of the student and specific subjects

E
taken by the student are given in the table below, which is a
2 × 3 contingency table of observed values.
History Biology French
Female 22 20 18 (60)
Male 20 11 9 (40)
(42) (31) (27)

The following is the table for the expected values.

History Biology French


Female p 18.6 16.2
Male q r 10.8

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 29


s …
ic io (a) Calculate the values of p, q and r.

j e rc The chi-squared test is used to determine if the


choice of subject is independent of gender, at the 5%
E level of significance.

(b)
(i) State a suitable null hypothesis H . 0

(ii) Show that the number of degrees of


freedom is two.
(iii) Write down the critical value of chi-
squared at the 5% level of significance.

(c) The calculated value of chi-squared is 1.78. Do you


accept H ? Explain your answer.
0

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 30


s …
i c io
je rc
E

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 31


s …
i c io
je rc
E

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 32


s …
i c io
je rc
E

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 33


s …
i c io
je rc
E

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 34


s …
i c io
je rc
E

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 35


Página sol de los casos

https://docs.google.com/file/d/0B3uP7fTkF9D
wWndQVExrWXZSbG1zdUlrUmlaZ0RnQQ/e
dit?sort=name&layout=list&pid=0B3uP7fTkF9
Dwb1YxUHh0WVJTaC1kdkVDUTRQbVlKd
w&cindex=2&pli=1

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 36


La prueba t Student

■ La prueba t es un método estadístico para comparar las medias


de dos grupos de datos. Hay algunos tipos diferentes de prueba t,
pero nos centraremos solo en la prueba t de dos muestras
agrupadas. Esta prueba es una comparación de las medias de dos
conjuntos independientes de datos que son muestras
seleccionadas de una población normalmente distribuida.

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 37


■ Suponga
■   que tiene dos conjuntos de datos que son independientes y provienen de
poblaciones normalmente distribuidas.
■ Si la media del primer conjunto es μ 1 y la media del segundo conjunto es μ 2, y desea
determinar si las medias son iguales o diferentes, entonces la hipótesis nula sería
H0: μ1 − μ2 = 0 y la H1: μ1 − μ2 0
Sin embargo, puede interesarle saber si la media μ 2 es mayor o menor que la media μ 1.
En este caso, la hipótesis nula sería
H0: μ1≤μ2 y H1: μ1 - μ2 >0
o
H0: μ1≥μ2 y H1: μ1 - μ2 < 0

Por esta razón, las hipótesis alternativas pueden variar según el contexto. Para pruebas
de dos colas:

38
Prueba de dos colas

■ La primera posibilidad se conoce como una prueba de dos colas,


porque prueba si la media del primer conjunto es
significativamente diferente de la media del segundo conjunto
en cada lado.

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 39


Prueba de una Cola

■ Las últimas dos posibilidades se conocen como pruebas de una


cola, porque prueban si la media del primer conjunto está en un
lado o en el otro de la media del segundo conjunto.

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 40


PRUEBA DE BONDAD DE 2
AJUSTE CHI 
La prueba chi-cuadrado Tambien permite comparer dos muestras:
Una teórica (o esperada) y otra observada.

Por ejemplo:
Estás tratando de predecir con qué frecuencia nevará en los 3 meses de
invierno. Como te acabas de mudar a una nueva parte del país, le preguntas
a uno de tus vecinos que ha vivido allí durante mucho tiempo cuánto esperas
que nieve. Él dice que nieva alrededor del 25% del tiempo el primer mes, el
40% del segundo mes y el 30% del tercer mes. Decides hacer un
seguimiento del clima de tu primer invierno viviendo allí y descubres que
nevó 10 de 30 días el primer mes, 15 de 31 días el segundo mes y 11 de 31
días el tercer mes. Tu objetivo es determinar si la distribución que te dio tu
vecino es correcta dentro de un nivel de confianza de 0.05.

41
LA SOLUCIÓN….
Para resolver este problema, podemos completar una prueba de hipótesis.

Paso 1: las hipótesis nula y alternativa

Primero, asumimos que tu vecino te dio información confiable.

H0: La distribución de días nevados que tu vecino te dio es correcta. Luego


declaramos lo contrario como nuestra hipótesis alternativa.

H1: La distribución de días nevados que su vecino le dio es incorrecta.

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 42


Paso 2:
Calcular el estadístico de prueba

Dado que la distribución que nuestro vecino nos dió fue en términos de
porcentajes, necesitamos convertir los valores esperados y nuestras
observaciones en la misma forma (en este caso, una proporción) para
hacer una tabla de contingencia.

Mes1 Mes2 Mes3


Esperados
Observados

Desafortunadamente, estos datos por sí mismos no funcionarán, por lo


que debemos multiplicar todos los valores por una potencia de 10 para
obtener enteros. Tenga en cuenta: esta prueba está diseñada para datos
nominales, que se contarían como enteros. Por lo tanto, debe ingresar
enteros en la calculadora.

43
Mes1 Mes2 Mes3
Esperados
Observados

Ahora podemos ingresar los datos en la calculadora y usar la función


χ2 GOF-Test.

Observe que, dado que hay 3 meses para cada distribución,


n = 3 y df = 3−1 = 2.

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 44


Paso 3:
Encuentra el valor p

Basado en el resultado de la calculadora, p = 9.91 × 10−13.

Paso 4:
Declara tu conclusión
Dado que p <0.05, rechazamos H0 y determinamos que la distribución del
vecino de los días nevados de invierno es inexacta.

Prof. Andrés Romero M.Ed. - PRUEBA DE CHI CUADRADO – Jan - 2018 45

También podría gustarte