Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 15
Contrastes de Normalidad:
Tablas de contingencia
Bibliografa bsica: Casas Snchez, J.M., y otros (1998): Problemas de estadstica. Descriptiva, probabilidad e inferencia. Editorial Pirmide. Newbold, P. (1997): Estadstica para los Negocios y la Economa. Prentice Hall. Novales, A. (1996): Estadstica y Econometra. McGraw-Hill.
1. Introduccin
Contrastes sobre la igualdad de los parmetros de centralizacin de dos distribuciones poblacionales Son alternativas no paramtricas a los contrastes analizados en el tema anterior Generalmente son vlidos cualquiera que sea la distribucin de la poblacin
Contrastes no paramtricos
Contrastes de bondad de ajuste Contrastes de ajuste de una distribucin muestral a una distribucin terica. En particular, contrastes de Normalidad Contrastes de asociacin entre distribuciones Contrasta la posible independencia de distintas caractersticas observadas en la muestra, con independencia del tipo de distribucin que siga cada una de ellas
El contraste chi-cuadrado
Idea bsica: Consiste en comparar las frecuencias observadas en la muestra para cada suceso relevante, con las que debera haberse obtenido en una poblacin que perteneciese a una distribucin de probabilidad especfica. Puede aplicarse tanto a distribuciones discretas como continuas. No obstante, previamente, debe establecerse una particin del espacio muestral en k sucesos mutuamente exclusivos.
H0: La muestra procede de una distribucin de probabilidad especfica H1: La muestra no procede de la poblacin especificada
El contraste chi-cuadrado
CASO A)
H0: La muestra procede de una distribucin de probabilidad especfica H1: La muestra no procede de la poblacin especificada
CATEGORA
Regin crtica
1 2 ... K TOTAL
O1 O2 Ok n
p1 p2 pk 1
E1 = n p1 E2 = n p2 Ek = n pk n
2 > k21,
1-
k21,
Regin de aceptacin
Regin crtica
El contraste chi-cuadrado
al final de invierno, el 80% de las facturas han sido cobradas, un 10% se cobrarn con pago aplazado a un mes, un 6% se cobrar a dos meses y un 4% se cobrar a ms de dos meses. Al final del invierno actual, la compaa selecciona una m.a. De 400 facturas, resultando 287 de estas facturas cobradas, 49 a cobrar en un mes, 30 a cobrar en dos meses y 34 a cobrar en un perodo superior a los dos meses. Podemos concluir, a raz de los resultados, que la experiencia de los aos anteriores se ha vuelto a repetir este invierno?
N de meses a cobrar
CASO A) Ejemplo: Una compaa de gas afirma, basndose en experiencias anteriores, que normalmente,
Oi
287 49 30 34 400
pi
0.80 0.10 0.06 0.04 1
Ei
320 40 24 16 400 0,995 0,005
32,0.005 = 12,84
Regin de aceptacin
Regin crtica
0 1 2 +2 TOTAL
Estadstico de prueba
=
2
(O E )
i i
i =1
Ei
( 287 320) 2
320
( 49 40) 2
40
( 30 24) 2
24
( 34 16) 2
16
= 27,178
El contraste chi-cuadrado
Al 5% de significacin, los datos de la muestra presentan evidencia suficiente para rechazar H0, con lo cual podemos concluir que la experiencia de los aos anteriores no se ha vuelto a repetir este invierno
El contraste chi-cuadrado
CASO B) Parmetros poblacionales desconocidos
H0: La muestra procede de una distribucin de probabilidad especfica H1: La muestra no procede de la poblacin especificada
Para calcular pi tenemos que estimar los parmetros poblacionales
CATEGORA FRECUENCIA OBSERVADA Oi PROBABILIDAD (BAJO H0) pi FRECUENCIA ESPERADA (BAJO H0) Ei
Estadstico de prueba 2 k Oi Ei 2 = k2 m1 Ei i =1
Regin crtica
2 > k2 m1,
m= n de parmetros estimados
1 2 ... K TOTAL
O1 O2 Ok n
p1 p2 pk 1
E1 = n p1 E2 = n p2 Ek = n pk n
1-
k2 m1,
Regin de aceptacin
Regin crtica
El contraste chi-cuadrado
CASO B) Ejemplo 1:
H0: La muestra procede de una distribucin de POISSON H1: La muestra no procede de una distribucin de Poisson
xi
0 1 2 3 o ms
Oi(=ni)
156 63 29 14
xini
0 63 58 42
x P( ) P( X = x ) = e
x!
x
TOTAL
n=262
163
$ = x =
xn
n
i i
El contraste chi-cuadrado
CASO B) Ejemplo 1
H0 : x P ( ) P ( X = x ) = e
xi
0 1 2 3 o ms TOTAL
x x!
Estadstico de prueba
=
2
Oi(=ni)
156 63 29 14 262
pi
Ei=n pi
(O E )
i i
i =1
0,537 140,641 1,677 0,334 87,498 6,859 0,104 27,218 0,117 0,025 6,644 8,144 1 262 16,797
Ei
= 16.797
0.622 0 P( X = 0) = e 0.622 = 0,537 0! (156 140.641) 2 = 1677 . 140.641 = 262 * 0641 140. .537
22,0.005 = 10.60
Regin de aceptacin
Regin crtica
El contraste chi-cuadrado
de la cadena de montaje sigue una distribucin de Poisson. Se elige una muestra aleatoria de horas de trabajo en la fbrica y se registra las llegadas por hora.
CASO B) Ejemplo 2: Una suposicin clave en un programa concreto es que la llegada de productos terminados que salen
H0: La muestra procede de una distribucin de POISSON H1: La muestra no procede de una distribucin de Poisson
Llegadas/hora
xi
0 1 2 3 4 5 6 7 o ms
Oi(=ni)
3 15 23 20 12 10 7 5
xini
0 15 46 60 48 50 42 35
x P( ) P( X = x ) = e
x!
x
$ = x =
xn
n
i i
296 = = 31 . 95
TOTAL
n=95
296
El contraste chi-cuadrado
CASO B) Ejemplo 2
H0 : x P ( ) P ( X = x ) = e
Llegadas /hora Oi Probabilidad de Poisson
x x!
Ei
$ = x = 31 .
0 1 2 3 4 5 6 7 o ms
TOTAL
3 15 23 20 12 10 7 5
n=95
95
El contraste chi-cuadrado
CASO B) Ejemplo 2
H0 : x P ( ) P ( X = x ) = e
Llegadas /hora Oi Probabilodad de Poisson Ei
x x!
Estadstico de prueba
=
2
(O E )
i i
i =1
Ei
= 2.633
0o1 2 3 4 5 6 o ms
TOTAL
18 23 20 12 10 12
95
95
2.633
Los datos de la muestra apoyan la suposicin de que la poblacin sigue una distribucin de Poisson
H0: La distribucin observada se ajusta a la distribucin terica H1: La distribucin observada no se ajusta a la distribucin terica.
Compara la funcin de distribucin acumulada observada de una variable con una distribucin terica determinada. El estadstico de prueba de este contraste se calcula a partir de la diferencia mayor (en valor absoluto) entre las funciones de distribucin acumuladas terica y observada. Es adecuado cuando los datos no estn agrupados y adems el tamao muestral es pequeo.
$ = x =
xi
n
= 1150 .
Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) a. La distribucin de contraste es exponencial. b. Se han calculado a partir de los datos.
No se rechaza H0 y, por tanto, con un 5% de significacin y con estos datos muestrales, no existiran motivos para rechazar que dicha variable sigue una distribucin Exponencial
Contrastes de Normalidad
Contrastes de Kolmogorov-Smirnov-Lilliefors
H0: x Normal
Similar al contraste K-S. Estima los parmetros utilizando toda la muestra y luego aplica la prueba a toda la muestra Contraste de Shapiro y Wilks Mide el ajuste de la muestra al dibujarla en papel probabilstico normal a una recta. Se rechaza si el ajuste es malo Valores pequeos del estadstico
Contrastes de Normalidad
Ejemplo:
H0: x Normal
(Problema 7.6 de Casas Snchez). Contraste si el consumo anual de agua caliente de esta comunidad se distribuye normalmente (=1%)
Contrastes de Normalidad
Pruebas de normalidad Kolmogorov-Smirnov Estadstico gl Sig. ,192 15 ,142
a
H0: x Normal
gasto
Sig. ,015
Tablas de contingencia
Se utiliza para estudiar la independencia entre dos variables discretas
H0: No existe asociacin entre los atributos. Son independientes
...
Tablas de contingencia
H0: No existe asociacin entre los atributos. Son independientes
E11 =
B1 A1 n11 E11 A2 n21 E21 ... Ar nr1 Er1 n*1 nr2 Er2 n*2 n22 E22 nrs Ers n*s n
n*1n1* n
B2
...
n12 E12
Regin crtica
3. Tablas de contingencia H0: No existe asociacin entre los atributos. Son independientes
Ejemplo: (Problema 7.8 Casas Snchez) Se podra afirmar que existe alguna relacin entre el centro de estudio y el tiempo que un estudiante tarda en terminar su carrera de Economa? (=10%) N de aos empleados para finalizar la licenciatura de economa Facultad A B C 4 o menos 300 110 325 Entre 5 y 6 150 125 350 7 o ms 50 90 100
3. Tablas de contingencia H0: No existe asociacin entre los atributos. Son independientes
Tabla de contingencia facultad * aos aos entre 5 y 6 150 195,3 125 127,0 350 302,7 625 625,0
E11 =
7 o ms 50 75,0 90 48,8 100 116,3 240 240,0 Total 500 500,0 325 325,0 775 775,0 1600 1600,0
facultad
A B C
Total
Recuento Frecuencia esperada Recuento Frecuencia esperada Recuento Frecuencia esperada Recuento Frecuencia esperada
Estadstico de prueba
2 exp
(300 299.7 )2 + (150 195.3)2 + (50 75)2 + (110 149.3)2 + (125 126.9)2 =
229.7 195.3 75 149.3 126.9 (90 48.75)2 + (325 356)2 + (350 302.7 )2 + (100 116.25)2 = 98.002 + 48.75 356 302.7 116.25
3. Tablas de contingencia H0: No existe asociacin entre los atributos. Son independientes
2 Regin crtica 2 > (231) ( 31), 0.10 4, 0.10
1-=0.90
=0.10
Regin crtica
Regin de aceptacin
Como el estadstico de prueba es superior al valor crtico, entonces rechazamos la hiptesis de independencia al 10% de significacin. Por tanto, existir alguna relacin entre las dos variables.
2 exp = 98.002
2 4, 0.10 = 7.78
3. Tablas de contingencia H0: No existe asociacin entre los atributos. Son independientes
Pruebas de chi-cuadrado Valor 98,000a 91,976 1600 gl 4 4 Sig. asinttica (bilateral) ,000 ,000
a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 48,75.