Está en la página 1de 3

ESTADSTICA I

Unidad 8: Breve Resumen de Contenidos Tericos. Prueba Chi-Cuadrada1


D.E.A. Lanza Mariano 1. PRUEBA CHI CUADRADA Muchas veces los resultados obtenidos a partir de muestras no coinciden de manera exacta con los resultados tericos esperados. De esta forma, a menudo nos interesa saber si las frecuencias observadas difieren significativamente de las frecuencias esperadas. El estadstico proporciona una medida de la discrepancia existente entre la frecuencia observada y la frecuencia esperada y est dada por:
2

+ ... + e1 e2 oj = Valor observado del evento j. ej = Valor esperado del evento j.


2

2 2 ( ( o1 e1 ) o 2 e2 ) = +

(ok ek )2
ek

=
j =1

(o

ej ) ej

De esta forma, si las frecuencias observadas tienden a ser muy similares a las frecuencias esperadas, entonces la La aproximacin de la

2 tender a ser pequea. 2 se corresponde con (k-m-1) grados de libertad, donde:

k = la cantidad de frecuencias o intervalos m = la cantidad de parmetros poblacionales que deben estimarse para realizar la prueba. De esta forma, la prueba ji- cuadrada ( 2 ) se la utiliza principalmente para: Probar si dos atributos son independientes (test de tablas de contingencia). Probar si una variable sigue una distribucin de probabilidades particular (Prueba de Bondad de Ajuste).

Bibliografa consultada: Spiegel M. R y Stephens L. J. (2001): Estadstica. McGraw-Hill. Mxico. Lind D. A, Marachal W. G. y Mason R. D. (2004): Estadstica para Administracin y Economa. Ed. Alfaomega. Mxico. De la Horra Navarro J. (2003): Estadstica Aplicada. Ediciones Daz de Santos. Espaa. Moore D. S. ( 2000): Estadstica Aplicada Bsica. Antoni Bosch Editor S.A. Espaa. Navidi William (2006): Estadstica para Ingenieros y Cientficos. Ed. McGraw-Hil. Gabriela Kurincic (1997): Gua Terica de Estadstica General. FCE. UBA. 1

1.A Tablas de Contingencia con Chi Cuadrada


La prueba de tablas de contingencia es un test en el que se busca analizar si dos variables aleatorias son independientes (o no lo son). Es decir, se quiere probar si la ocurrencia o no de uno de los atributos condiciona (o no) la ocurrencia del otro. Caractersticas de los Atributos: Cada atributo que se somete a prueba se encuentra dividido en n estratos: Mutuamente excluyentes Completamente exhaustivos Hiptesis a Probar: Ho) El atributo X es Independiente del atributo Y H1) El atributo X no es Independiente del atributo Y Estadstico de Prueba: Sean: r= la cantidad de estratos mutuamente excluyentes en que se divide la V.A. X s= la cantidad de estratos mutuamente excluyentes en que se divide la V.A. Y Oi = frecuencias absolutas simples observadas en la muestra ei = frecuencias absolutas simples que cabra esperar si las variables aleatorias fueran independientes (se calculan mediante las probabilidades marginales).

2 [( r 1)*( s 1)]

k = ( r *s )

i =1

(oi ei )2
ei

Si

e2 < t2 NO SE RECHAZA H0

Pasos para realizar la tabla de contingencias 2 a) b) c) d) Plantear las hiptesis. Definir el alfa y establecer la regla de decisin. Calcular el valor crtico terico de la prueba t2 = (2 1 ) [(r 1) * ( s 1)] gl Calcular el valor emprico realizando las siguientes pasos: d.1 Construir una tabla que contenga los valores observados. d.2 Construir una tabla que contenga los valores esperados para el caso que los atributos sean independientes. d.3 Calcular el valor emprico de la prueba utilizando los datos de las tablas anteriores

ei e) Comparar el valor terico con el emprico y decidir sobre la hiptesis nula.


i =1

e2 =

n = ( r *s )

(oi ei )2

1.B Bondad de Ajuste con Chi Cuadrada


La prueba de bondad de ajuste intenta analizar si una variable aleatoria sigua una determinada distribucin. Es decir, se intenta determinar que tan bien las distribuciones tericas (como la distribucin Normal, Binomial o Poisson) se ajustan a las distribuciones empricas (aquellas obtenidas de datos de muestras). Hiptesis a Probar: Ho) La variable aleatoria X sigue determinada distribucin de probabilidad (Ejemplo: La altura de los estudiantes de la UNRN sigue una distribucin normal) H1) La variable aleatoria X no sigue la distribucin planteada en la H0. Estadstico de Prueba:

(2r k 1) =
i =1

(oi ei )2
ei

Sean: r = cantidad de estratos (intervalos) que se presentan los datos de la variable aleatoria X. k= cantidad de parmetros que se deben estimar para realizar la prueba. oi = frecuencias absolutas simples observadas en la muestra ei = frecuencias absolutas simples que cabra esperar si la variable aleatoria siguiese la distribucin planteada en la hiptesis nula. Si

e2 < t2 NO SE RECHAZA H0

Pasos para realizar la tabla de contingencias 2 f) g) h) i) Plantear las hiptesis. Definir el alfa y establecer la regla de decisin. Calcular el valor crtico (terico) de la prueba t2 = (2 1 ) ( r k 1) gl Calcular el valor emprico realizando los siguientes pasos: d.1 Construir una tabla que contenga los valores observados. d.2 Construir una tabla que contenga los valores esperados si la VA sigue la distribucin planteada. d.3 Calcular el valor emprico de la prueba utilizando los datos de las tablas anteriores

ei j) Comparar el valor terico con el emprico y decidir sobre la hiptesis nula.


i =1

=
2 e

(oi ei )2