Está en la página 1de 2

PONTIFICIA UNIVERSIDAD CATOLICA

DE CHILE

FACULTAD DE MATEMATICAS
/ DEPARTAMENTO DE ESTADISTICA

ELM2400

Metodos Estadsticos

Test Chi Cuadrado de Independencia


Profesor: Alexis Pena
Ayudante: Reinaldo Gonzalez S.
Supongamos que dos variables aleatorias han sido categorizadas en k y l niveles, respectivamente.
Podemos, a partir de una muestra de tamano n, observar los datos de la siguiente manera.
1
2
..
.
k

1
n11
n21
..
.

2
n12
n22
..
.

...

l
n1l
n2l
..
.

n1
n2

nk1
n1

nk2
n2

nkl
nl

nk
n = n

Donde:
ni =

l
X

nij y nj =

j=1

k
X

nij

i=1

La tabla anterior se conoce como Tabla de Contingencia. Construiremos una tabla de valores
esperados bajo la hipotesis H0 : Existe Independencia.
Sea eij : el valor esperado en la celda (i, j), Oij : el valor observado en la celda (i, j). Y por ultimo
pij : la probabilidad de pertenecer a la celda (i, j).
eij = n pij = n
Bajo H0

pij =

nij
n

nij
ni nj
=

n
n |{z}
n
|{z}
pi

Luego

pj

ni nj
eij =
n

En espanol, se lee:
eij =
Se Rechaza H0 si:
2c

Reinaldo Gonzalez S.

Total de Fila * Total de Columnas


Gran Total

l X
k
X
(Oij eij )2
> 21,(k1)(l1)
=
e
ij
j=1 i=1

Segundo Semestre 2004

Ejemplo: En una muestra aleatoria de 100 universitarios se clasifico cada uno de ellos segun si
habia consumido alguna vez droga o no y el promedio de notas. A partir de los datos tabulados en
la tabla Proporcionan estos datos evidencia suficiente como para concluir que hay una relacion
entre las dos variables? Use = 0,05.
Promedio de Notas
4,0
> 4,0
Total

Si Consume
10
20
30

No Consume
29
41
70

Total
39
61
100

Las hipotesis son:


H0 : Existe independencia entre el consumo de drogas y el promedio de notas
H1 : Existe asociacion entre el consumo de drogas y el promedio de notas
Para testear tales hipotesis, se ocupa el estadistico:
2c =
Donde eij =

l X
k
X
(Oij eij )2
eij
j=1 i=1

ni nj
. El cual rechaza H0 cuando 2c > 21,(I1)(J1) .
n

Luego, la tabla de Valores Esperados es:


Promedio de Notas
4,0
> 4,0
Total

Si Consume
11.7
18.3
30

No Consume
27.3
42.7
70

Total
39
61
100

Por lo tanto el estadistico calculado queda:


(10 11,7)2 (29 27,3)2 (20 18,3)2 (41 42,7)2
+
+
+
11,7
27,3
18,3
42,7
= 0,578

2c =

Como 2c = 0,578 < 3,841 = 20,95,1 , no se rechaza H0 , es decir, con un 95 % de confianza el


consumo de droga no influye en el promedio de notas de los estudiantes.

Reinaldo Gonzalez S.

Segundo Semestre 2004

También podría gustarte