Está en la página 1de 25

ESTADSTICA E INTR.

A LA ECONOMETRA Curso 2007-2008

Tema 15

CONTRASTES DE HIPTESIS NO PARAMTRICOS


Notas y resmenes de clase
Prof. M Dolores Gonzlez Galn

Estructura del captulo


1. 2. Introduccin Contrastes de bondad de ajuste a. Contrastes basados en la distribucin de frecuencias muestral: b. 3. El contraste chi-cuadrado Contraste de Kolmogorov-Smirnov Contraste de Shapiro-Wilk Contraste de Kolmogorov-Smirnov-Lilliefors

Contrastes de Normalidad:

Tablas de contingencia

Bibliografa bsica: Casas Snchez, J.M., y otros (1998): Problemas de estadstica. Descriptiva, probabilidad e inferencia. Editorial Pirmide. Newbold, P. (1997): Estadstica para los Negocios y la Economa. Prentice Hall. Novales, A. (1996): Estadstica y Econometra. McGraw-Hill.

1. Introduccin
Contrastes sobre la igualdad de los parmetros de centralizacin de dos distribuciones poblacionales Son alternativas no paramtricas a los contrastes analizados en el tema anterior Generalmente son vlidos cualquiera que sea la distribucin de la poblacin

Contrastes no paramtricos

Contrastes de bondad de ajuste Contrastes de ajuste de una distribucin muestral a una distribucin terica. En particular, contrastes de Normalidad Contrastes de asociacin entre distribuciones Contrasta la posible independencia de distintas caractersticas observadas en la muestra, con independencia del tipo de distribucin que siga cada una de ellas

2. Contrastes de bondad de ajuste

El contraste chi-cuadrado
Idea bsica: Consiste en comparar las frecuencias observadas en la muestra para cada suceso relevante, con las que debera haberse obtenido en una poblacin que perteneciese a una distribucin de probabilidad especfica. Puede aplicarse tanto a distribuciones discretas como continuas. No obstante, previamente, debe establecerse una particin del espacio muestral en k sucesos mutuamente exclusivos.

H0: La muestra procede de una distribucin de probabilidad especfica H1: La muestra no procede de la poblacin especificada

2. Contrastes de bondad de ajuste

El contraste chi-cuadrado
CASO A)
H0: La muestra procede de una distribucin de probabilidad especfica H1: La muestra no procede de la poblacin especificada

Estadstico de prueba 2 k (Oi Ei ) 2 2 = k 1 Ei i =1


FRECUENCIA ESPERADA (BAJO H0) Ei

CATEGORA

FRECUENCIA OBSERVADA Oi (=ni)

PROBABILIDAD (BAJO H0) pi

Regin crtica

1 2 ... K TOTAL

O1 O2 Ok n

p1 p2 pk 1

E1 = n p1 E2 = n p2 Ek = n pk n

2 > k21,

1-
k21,
Regin de aceptacin

Regin crtica

2. Contrastes de bondad de ajuste

El contraste chi-cuadrado
al final de invierno, el 80% de las facturas han sido cobradas, un 10% se cobrarn con pago aplazado a un mes, un 6% se cobrar a dos meses y un 4% se cobrar a ms de dos meses. Al final del invierno actual, la compaa selecciona una m.a. De 400 facturas, resultando 287 de estas facturas cobradas, 49 a cobrar en un mes, 30 a cobrar en dos meses y 34 a cobrar en un perodo superior a los dos meses. Podemos concluir, a raz de los resultados, que la experiencia de los aos anteriores se ha vuelto a repetir este invierno?
N de meses a cobrar

CASO A) Ejemplo: Una compaa de gas afirma, basndose en experiencias anteriores, que normalmente,

Oi
287 49 30 34 400

pi
0.80 0.10 0.06 0.04 1

Ei
320 40 24 16 400 0,995 0,005
32,0.005 = 12,84
Regin de aceptacin
Regin crtica

0 1 2 +2 TOTAL

Estadstico de prueba
=
2

(O E )
i i

i =1

Ei

( 287 320) 2
320

( 49 40) 2
40

( 30 24) 2
24

( 34 16) 2
16

= 27,178

2. Contrastes de bondad de ajuste

El contraste chi-cuadrado

p=0,000 < =0,05 Se rechaza H0

Al 5% de significacin, los datos de la muestra presentan evidencia suficiente para rechazar H0, con lo cual podemos concluir que la experiencia de los aos anteriores no se ha vuelto a repetir este invierno

2. Contrastes de bondad de ajuste

El contraste chi-cuadrado
CASO B) Parmetros poblacionales desconocidos
H0: La muestra procede de una distribucin de probabilidad especfica H1: La muestra no procede de la poblacin especificada
Para calcular pi tenemos que estimar los parmetros poblacionales
CATEGORA FRECUENCIA OBSERVADA Oi PROBABILIDAD (BAJO H0) pi FRECUENCIA ESPERADA (BAJO H0) Ei

Estadstico de prueba 2 k Oi Ei 2 = k2 m1 Ei i =1

Regin crtica

2 > k2 m1,

m= n de parmetros estimados

1 2 ... K TOTAL

O1 O2 Ok n

p1 p2 pk 1

E1 = n p1 E2 = n p2 Ek = n pk n
1-
k2 m1,
Regin de aceptacin
Regin crtica

2. Contrastes de bondad de ajuste

El contraste chi-cuadrado
CASO B) Ejemplo 1:
H0: La muestra procede de una distribucin de POISSON H1: La muestra no procede de una distribucin de Poisson

xi
0 1 2 3 o ms

Oi(=ni)
156 63 29 14

xini
0 63 58 42

x P( ) P( X = x ) = e

x!
x

TOTAL

n=262

163

$ = x =

xn
n

i i

163 = = 0.622 262

2. Contrastes de bondad de ajuste

El contraste chi-cuadrado
CASO B) Ejemplo 1

H0 : x P ( ) P ( X = x ) = e
xi
0 1 2 3 o ms TOTAL

x x!

Estadstico de prueba
=
2

Oi(=ni)
156 63 29 14 262

pi

Ei=n pi

(O E )
i i

i =1

0,537 140,641 1,677 0,334 87,498 6,859 0,104 27,218 0,117 0,025 6,644 8,144 1 262 16,797

Ei

= 16.797

Regin crtica 2 > 22, 0,005 = 10,60


k=4, m=1
0.995 =0.005

0.622 0 P( X = 0) = e 0.622 = 0,537 0! (156 140.641) 2 = 1677 . 140.641 = 262 * 0641 140. .537

22,0.005 = 10.60
Regin de aceptacin
Regin crtica

Existe una fuerte evidencia en contra de la hiptesis nula

2. Contrastes de bondad de ajuste

El contraste chi-cuadrado
de la cadena de montaje sigue una distribucin de Poisson. Se elige una muestra aleatoria de horas de trabajo en la fbrica y se registra las llegadas por hora.

CASO B) Ejemplo 2: Una suposicin clave en un programa concreto es que la llegada de productos terminados que salen
H0: La muestra procede de una distribucin de POISSON H1: La muestra no procede de una distribucin de Poisson
Llegadas/hora

xi
0 1 2 3 4 5 6 7 o ms

Oi(=ni)
3 15 23 20 12 10 7 5

xini
0 15 46 60 48 50 42 35

x P( ) P( X = x ) = e

x!
x

$ = x =

xn
n

i i

296 = = 31 . 95

TOTAL

n=95

296

2. Contrastes de bondad de ajuste

El contraste chi-cuadrado
CASO B) Ejemplo 2

H0 : x P ( ) P ( X = x ) = e
Llegadas /hora Oi Probabilidad de Poisson

x x!
Ei

regla del cinco


Es necesario que n sea suficientemente grande, lo cual requiere que la frecuencia esperada para cada celda sea al menos 5 Si Ei < 5 las celdas deben combinarse hasta que resulten categoras con mayores Ei

$ = x = 31 .

0 1 2 3 4 5 6 7 o ms
TOTAL

3 15 23 20 12 10 7 5

0.0450 0.1397 0.2165 0.2237 0.1734 0.1075 0.0555 0.0387

4.275 13.272 20.568 21.525 16.473 10.213 5.273 3.677

n=95

95

2. Contrastes de bondad de ajuste

El contraste chi-cuadrado
CASO B) Ejemplo 2

H0 : x P ( ) P ( X = x ) = e
Llegadas /hora Oi Probabilodad de Poisson Ei

x x!

Estadstico de prueba
=
2

(O E )
i i

i =1

Ei

= 2.633

0o1 2 3 4 5 6 o ms
TOTAL

18 23 20 12 10 12

0.1847 0.2165 0.2237 0.1734 0.1075 0.0942

17.547 20.568 21.525 16.473 10.213 8.949

0.012 0.288 0.74 1.215 0.004 1.040

Regin crtica 2 > 42, 0,10 = 7.779


k=6, m=1
0.90 =0.10
42,0.10 = 7.779
Regin de aceptacin
Regin crtica

95

95

2.633

Los datos de la muestra apoyan la suposicin de que la poblacin sigue una distribucin de Poisson

2. Contrastes de bondad de ajuste

El contraste de Kolmogorov-Smirnov K-S


La prueba de K-S de una muestra es una prueba de bondad de ajuste. Se utiliza para contrastar si una variable se distribuye con una ley determinada (normal, exponencial)

H0: La distribucin observada se ajusta a la distribucin terica H1: La distribucin observada no se ajusta a la distribucin terica.
Compara la funcin de distribucin acumulada observada de una variable con una distribucin terica determinada. El estadstico de prueba de este contraste se calcula a partir de la diferencia mayor (en valor absoluto) entre las funciones de distribucin acumuladas terica y observada. Es adecuado cuando los datos no estn agrupados y adems el tamao muestral es pequeo.

2. Contrastes de bondad de ajuste

El contraste de Kolmogorov-Smirnov K-S


H0: x Exponencial
MUESTRA: 16, 8, 10, 12, 6, 10, 20, 7, 2, 24

2. Contrastes de bondad de ajuste

El contraste de Kolmogorov-Smirnov K-S


Prueba de Kolmogorov-Smirnov para una muestra x N Parmetro exponencial.a,b Diferencias ms extremas Media Absoluta Positiva Negativa 10 11,5000 ,307 ,124 -,307 ,969 ,304

$ = x =

xi
n

= 1150 .

Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) a. La distribucin de contraste es exponencial. b. Se han calculado a partir de los datos.

No se rechaza H0 y, por tanto, con un 5% de significacin y con estos datos muestrales, no existiran motivos para rechazar que dicha variable sigue una distribucin Exponencial

2. Contrastes de bondad de ajuste

Contrastes de Normalidad
Contrastes de Kolmogorov-Smirnov-Lilliefors

H0: x Normal

Similar al contraste K-S. Estima los parmetros utilizando toda la muestra y luego aplica la prueba a toda la muestra Contraste de Shapiro y Wilks Mide el ajuste de la muestra al dibujarla en papel probabilstico normal a una recta. Se rechaza si el ajuste es malo Valores pequeos del estadstico

2. Contrastes de bondad de ajuste

Contrastes de Normalidad
Ejemplo:

H0: x Normal

(Problema 7.6 de Casas Snchez). Contraste si el consumo anual de agua caliente de esta comunidad se distribuye normalmente (=1%)

2. Contrastes de bondad de ajuste

Contrastes de Normalidad
Pruebas de normalidad Kolmogorov-Smirnov Estadstico gl Sig. ,192 15 ,142
a

H0: x Normal

gasto

Shapiro-Wilk Estadstico gl ,845 15

Sig. ,015

a. Correccin de la significacin de Lilliefors

Al 1% de significacin, no se rechaza la hiptesis de normalidad del consumo anual de agua caliente.

3. Contrastes de asociacin entre distribuciones

Tablas de contingencia
Se utiliza para estudiar la independencia entre dos variables discretas
H0: No existe asociacin entre los atributos. Son independientes

B1 B2 A1 n11 A2 n21 ... Ar nr1 n*1 n12 n22 nr2 n*2

...

Bs n1s n2s nrs n*s n1* n2* nr* n

3. Contrastes de asociacin entre distribuciones

Tablas de contingencia
H0: No existe asociacin entre los atributos. Son independientes
E11 =
B1 A1 n11 E11 A2 n21 E21 ... Ar nr1 Er1 n*1 nr2 Er2 n*2 n22 E22 nrs Ers n*s n

n*1n1* n
B2
...

Bs n1s n1* E1s n2s E2s nr* n2*

n12 E12

Estadstico de prueba 2 nij E ij 2 = (2r 1)( s1) E ij i, j

Regin crtica

2 > (2r 1)( s1),


1-
(2r 1)( s1),
Regin de aceptacin
Regin crtica

3. Tablas de contingencia H0: No existe asociacin entre los atributos. Son independientes
Ejemplo: (Problema 7.8 Casas Snchez) Se podra afirmar que existe alguna relacin entre el centro de estudio y el tiempo que un estudiante tarda en terminar su carrera de Economa? (=10%) N de aos empleados para finalizar la licenciatura de economa Facultad A B C 4 o menos 300 110 325 Entre 5 y 6 150 125 350 7 o ms 50 90 100

3. Tablas de contingencia H0: No existe asociacin entre los atributos. Son independientes
Tabla de contingencia facultad * aos aos entre 5 y 6 150 195,3 125 127,0 350 302,7 625 625,0

E11 =
7 o ms 50 75,0 90 48,8 100 116,3 240 240,0 Total 500 500,0 325 325,0 775 775,0 1600 1600,0

500 735 = 229,688 1600

facultad

A B C

Total

Recuento Frecuencia esperada Recuento Frecuencia esperada Recuento Frecuencia esperada Recuento Frecuencia esperada

4 o menos 300 229,7 110 149,3 325 356,0 735 735,0

Estadstico de prueba
2 exp

(300 299.7 )2 + (150 195.3)2 + (50 75)2 + (110 149.3)2 + (125 126.9)2 =
229.7 195.3 75 149.3 126.9 (90 48.75)2 + (325 356)2 + (350 302.7 )2 + (100 116.25)2 = 98.002 + 48.75 356 302.7 116.25

3. Tablas de contingencia H0: No existe asociacin entre los atributos. Son independientes
2 Regin crtica 2 > (231) ( 31), 0.10 4, 0.10

1-=0.90

=0.10
Regin crtica

Regin de aceptacin

Como el estadstico de prueba es superior al valor crtico, entonces rechazamos la hiptesis de independencia al 10% de significacin. Por tanto, existir alguna relacin entre las dos variables.
2 exp = 98.002

2 4, 0.10 = 7.78

3. Tablas de contingencia H0: No existe asociacin entre los atributos. Son independientes
Pruebas de chi-cuadrado Valor 98,000a 91,976 1600 gl 4 4 Sig. asinttica (bilateral) ,000 ,000

Chi-cuadrado de Pearson Razn de verosimilitudes N de casos vlidos

a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 48,75.

Como p<,, rechazamos la hiptesis de independencia al 10% de significacin.

También podría gustarte