Está en la página 1de 36

31/03/2015

TALLER DE SIMULACION

Mg. Jos Rodrguez L.


Docente

UNIDAD IV
Test de bondad de ajuste

Mg. Jos Rodrguez l.


Docente

31/03/2015

Objetivo de la Unidad IV

Reconocer y aplicar Pruebas


de bondad de ajuste para
aceptar
o
rechazar
las
distribuciones
de
probabilidad sugeridas por
anlisis del histograma.

Reconocer y aplicar:
Tets Chi- Cuadrado.
Test Kolmogorov Smirnov.
Anderson Darling

UNIDAD IV
Chi-Cuadrado

Mg. Jos Rodrguez l.


Docente

31/03/2015

PRUEBAS
DE BONDAD DE AJUSTE
Cualquier aplicacin de test de bondad de
ajuste responde al mismo principio:
Si el valor Calculado > Valor Tabla (valor
crtico), entonces se rechaza la hiptesis.
Esto es equivalente a decir que el error
acumulado de los datos con respecto a la
distribucin terica supera lo permitido.

PRUEBAS
DE BONDAD DE AJUSTE
2 Calculado.

2 =
=1

( )2

Tabla (Crtico)

31/03/2015

PRUEBA JI-CUADRADO,X2
DE K. PEARSON
Sea X una variables aleatoria discreta con
valores x1,x2,xn. Se propone una hiptesis H0,
de que la distribucin donde proviene la
muestra se comporta segn un modelo
terico especifico.(Ej; Exponencial negativa).
FOi, representa el numero de veces que ocurre
el valor xi.

PRUEBA JI-CUADRADO,X2
DE K. PEARSON
FEi, frecuencia esperada proporcionada por el
modelo terico.
La prueba X2 hace uso de distribuciones del
mismo nombre para probar la bondad del
ajuste.

31/03/2015

PRUEBA JI-CUADRADO,X2
DE K. PEARSON
Usualmente ocurre que FEi (y tambin FOi)
son muy pequeas, entonces, se adopta el
criterio de agrupar los valores consecutivos
de k intervalos adyacentes de estas
frecuencias esperadas, hasta que su suma sea
de al menos 5 observaciones

PRUEBA JI-CUADRADO,X2
DE K. PEARSON
La medida de X2 es dada por:

02

=
=1

( )2

Para n, grande este estadstico de prueba tiene


una distribucin aproximada con grados de
libertad
= ( 1) ( )

31/03/2015

PRUEBA JI-CUADRADO,X2
DE K. PEARSON
La medida de X2 es dada por:
El valor de k lo determina la cantidad de
valores diferentes de la variable.
Supongamos que los parmetros estimados
son la media y la varianza, esto es, 2
parmetros estimados. Por lo tanto los grados
de libertad sern:
=(k-1)-2=(k-3) grados de libertad

PRUEBA JI-CUADRADO,X2
DE K. PEARSON
La medida de X2 es dada por:
Para calcular k, se emplea la Regla de Sturges.
k=1+3.322 log10(N)

31/03/2015

PRUEBA JI-CUADRADO,X2
EJEMPLO
Se dispone de 50 datos obtenidos de una
poblacin que registra la vida til (en
unidades de tiempo) de acumuladores
automotrices de catorce celdas.
Prubese que la hiptesis nula de que la
variable aleatoria vida til de los
acumuladores
sigue
una
distribucin
exponencial negativa, considrese un nivel
significativo de alfa igual al 5%:
:

PRUEBA JI-CUADRADO,X2
EJEMPLO
DATOS:

8.22
2.23
2.92
0.76
1.06
0.84
3.81
0.97
4.49
0.19

2.63
1.62
0.33
1.51
2.78
4.78
1.51
4.03
1.07
3.25

0.41
2.34
0.54
5.09
5.59
0.52
1.46
0.23
1.4
0.69

2.33
0.77
3.32
0.29
1.73
2.56
0.02
3.33
3.49
1.27

0.51
0.23
2.33
2.92
1.7
6.43
3.21
7.51
0.33
1.85

31/03/2015

PRUEBA JI-CUADRADO,X2
EJEMPLO
Clculos:

PRUEBA JI-CUADRADO,X2
EJEMPLO
Clculos:

31/03/2015

PRUEBA JI-CUADRADO,X2
EJEMPLO
Clculos:

Para calcular la frecuencia deben marcar toda la columna


y luego hacer un signo =

PRUEBA JI-CUADRADO,X2
EJEMPLO
Clculos:

31/03/2015

PRUEBA JI-CUADRADO,X2
EJEMPLO
Clculos:

Para que aparezca la frecuencia deben presionar las teclas


SHIF + CTRL y ENTER

PRUEBA JI-CUADRADO,X2
EJEMPLO
Clculos:

10

31/03/2015

PRUEBA JI-CUADRADO,X2
EJEMPLO
A continuacin se arreglan los valores de
forma ascendente y, se calculan las
frecuencias.
Promedio de la muestra = 2.3
k
1
2
3
4
5
6

Li
0.0
1.5
3.0
4.5
6.0
7.5

Ls
1.5
3.0
4.5
6.0
7.5
9.0

FO
21
15
8
3
1
2

FO relat.
0.42
0.3
0.16
0.06
0.02
0.04

PRUEBA JI-CUADRADO,X2
EJEMPLO
A continuacin se arreglan los valores de
forma ascendente y, se calculan las
frecuencias.
Promedio de la muestra = 2.3
k
1
2
3
4
5
6

Li
0.0
1.5
3.0
4.5
6.0
7.5

Ls
1.5
3.0
4.5
6.0
7.5
9.0

FO
21
15
8
3
1
2

FO relat.
0.42
0.3
0.16
0.06
0.02
0.04

11

31/03/2015

PRUEBA JI-CUADRADO,X2
EJEMPLO
Los ltimos tres intervalos de clase no
alcanzan a contener las muestras mnimas
requeridas (5), se debe corregir.
k
1
2
3
4

Li
0.0
1.5
3.0
4.5

Ls
1.5
3.0
4.5
9.0

FO
21
15
8
6

PRUEBA JI-CUADRADO,X2
EJEMPLO
Evaluando FE terica.
Se asume beta = 2
1.5

1
1 1
0.75
2 = [ 2 ]1.5
1) = 0.528
0 = (
2

12

31/03/2015

PRUEBA JI-CUADRADO,X2
EJEMPLO
Evaluando FE terica.
Se asume beta = 2
1.5

1
1 1
0.75
2 = [ 2 ]1.5
1) = 0.528
0 = (
2

PRUEBA JI-CUADRADO,X2
EJEMPLO
Evaluando.
k
1
2
3
4

Li
0.0
1.5
3.0
4.5

Ls
1.5
3.0
4.5
9.0

FO
21
15
8
6

FO relat.
0.42
0.3
0.16
0.12
1.000

FE . Terorica ((FO-FE)2)/FE
0.528
0.022
0.249
0.010
0.118
0.015
0.094
0.007
0.989
0.054

Valor de calculado es X2 es = 0.054

13

31/03/2015

PRUEBA JI-CUADRADO,X2
EJEMPLO
k=4
Grados de Libertad son = (4- 1) 1 = 2
Nmero parmetros estimados: 1 (beta =
media)

PRUEBA JI-CUADRADO,X2
EJEMPLO
Valor de X2 TABULADO= 5.99.
Como X2 calculado = 0.054 < X2 TABULADO =
5.99
Se concluye que no se puede rechazar la
hiptesis nula.
La muestra viene de una distribucin
exponencial negativa con media 2.

14

31/03/2015

PRUEBA JI-CUADRADO,X2
EJEMPLO

PRUEBAS DE BONDAD
DE AJUSTE
TEST
KOLMOGOROV SMIRNOV

Jos Rodrguez l.
Docente Simulacin

15

31/03/2015

TEST
KOLMOGOROV SMIRNOV
El test de Chi-Cuadrado puede considerarse como una
comparacin entre la forma del histograma y la funcin
acumulada de probabilidad (estimada). Pero este test
evidencia una dificultad para el caso de distribuciones
continuas debido a que se debe decidir cmo especificar los
intervalos.
El test de bondad de ajuste K-S, a diferencia del ChiCuadrado, compara una distribucin emprica con una
funcin estimador () de la distribucin subyacente.

TEST
KOLMOGOROV SMIRNOV
Se aplica a variables continuas y su rango de aplicacin
es ms limitado que el de Chi - Cuadrado.
Sea F(y) funcin de distribucin acumulada, de una
poblacin que se toma una muestra y1, y2,yn.
Supngase que Y es una variable aleatoria continua
que tiene una funcin de distribucin acumulada F(y).
Consideremos una muestra de n observaciones de Y:
y1, y2,yn

16

31/03/2015

TEST
KOLMOGOROV - SMIRNOV

TEST
KOLMOGOROV SMIRNOV
Reordenemos estos valores en forma ascendente, as,
y1 y2, yn
Definamos la funcin acumulada emprica Fn(y) =
fraccin de la muestra menor o igual a y .
Con ecuacin:

1)
(
,
() = (

1,
0

(1) () = 1, ,
()

17

31/03/2015

TEST
KOLMOGOROV SMIRNOV
La medida estadstica D de K-S se basa en la distancia
mxima entre F(y) y Fn(y):

= () ()
Como F(y) y Fn(y) no son decrecientes y Fn(y) es constante
entre observaciones de muestra.
La desviacin mxima se presentara ya sea en una de los
puntos de observaciones y1, y2, , yn , o inmediatamente a la
izquierda de uno de ellos.

TEST
KOLMOGOROV SMIRNOV
Para determinar el valor observado de D slo se necesita
determinar el valor de la siguiente manera:

+ = max

( ) ;

y tambin.
= max ()

1
;

Ya que:
= (D+, D)

18

31/03/2015

TEST
KOLMOGOROV SMIRNOV
Si H0 se supone de la forma F(y), pero se dejan sin especificar
algunos de los parmetros, entonces estos se deben estimar

a partir de los datos de la muestra antes de poder llevar


acabo la prueba.
Stephen en (1974) dio valores de corte de reas superiores
de 0.15, 0.10, 0.05, 0.025, 0.01 para una forma modificada
de la tabla K-S para D modificado, Dm

TEST
KOLMOGOROV SMIRNOV
Estos casos son para las hiptesis nulas de una F(y)
completamente especificada; Normal con promedio y
varianza desconocido y exponencial negativa con promedio
desconocido:
Para F(y) en general:

= (D)

0.12 +

0.11

19

31/03/2015

TEST
KOLMOGOROV SMIRNOV
Para F(y) Normal con media y varianza desconocida:

= (D)

0.01 +

0.85

Para F(y) exponencial con beta desconocido:

= (D

0.2
)
n

+ 0.26 +

0.5

TEST
KOLMOGOROV SMIRNOV
Forma modificada de D
(kolmogorov - Smirnov)

F(y)
Especificada

F(y) Normal
media,
Varianza
desconocidas
F(y)
Exponencial
beta
desconocidas

= (D)

= (D)

= (D

+ 0.12 +

0.11

0.01 +

0.2
)
n

0.85

0.9

1 - alfa
0.95

0.975

0.99

1.138 1.22 1.358 1.48 1.626

0.85

0.775 0.819 0.895 0.955 1.035

+ 0.26 +

0.5

0.926 0.99 1.094 1.19

1.3

20

31/03/2015

TEST
KOLMOGOROV SMIRNOV
Caso de una distribucin WEIBULL.
Supngase que la distribucin subyacente inferida es Weibull, con

parmetros de forma () y de escala () ambos desconocidos.


Queremos estimar sus parmetros por medio de la estimacin de
mxima verosimilitud (MLE - maximum likelihood estimation) de
sus parmetros con funcin de distribucin = 1
exp

0 y se calcula de la manera habitual.

TEST
KOLMOGOROV SMIRNOV
Entonces Ho se rechaza si el estadstico de ajuste K-S

es

mayor que el valor crtico tabulado 1 .


Note que los valores crticos estn disponibles slo para cierto
tamaa de muestra n, y que los valores crticos para = 50 y =
(muestra extremadamente grande), son afortunadamente muy
similares.

21

31/03/2015

TEST
KOLMOGOROV SMIRNOV
Valores modificados para test K-S, distribuciones WEIBULL
(Ref.: Law and Kelton 4 edicin)


n
10
20

0.900
0.760
0.779

0.950
0.819
0.843

0.975
0.880
0.907

0.990
0.944
0.973

50
infinito

0.790
0.803

0.856
0.874

0.922
0.939

0.988
1.007

TEST
KOLMOGOROV SMIRNOV
Caso de una distribucin Log-logstica.
Supngase que la distribucin subyacente inferida es Log-logstica,
con parmetros de forma () y de escala () ambos desconocidos.
Todos los , datos bsicos logartmicos, estimar los parmetros
de su respectiva mxima verosimilitud (MLE - maximum likelihood
estimation) basados en los , , tambin es tomada
de una distribucin logstica.
() = (1 +

, < <

22

31/03/2015

TEST
KOLMOGOROV SMIRNOV
Donde D se calcula de la misma forma,
Entonces Ho se rechaza si el estadstico de ajuste K-S

es

mayor que el valor crtico tabulado 1 .


Note que los valores crticos estn disponibles slo para cierto
tamaa de muestra n, y que los valores crticos para = 50 y =
(muestra extremadamente grande), son afortunadamente muy
similares.

TEST
KOLMOGOROV SMIRNOV
Valores modificados
para test K-S, distribuciones Log-Logstica
(Ref.: Law and Kelton 4 edicin)


n
10
20
50
infinito

0.900
0.679
0.698
0.708
0.715

0.950
0.730
0.755
0.770
0.780

0.975
0.774
0.800
0.817
0.827

0.990
0.823
0.854
0.873
0.886

23

31/03/2015

TEST
KOLMOGOROV SMIRNOV
EJEMPLO:
Las diez observaciones siguientes son muestras aleatoria de
una distribucin continua. Pruebe que la hiptesis que esos
datos provienen de una distribucin exponencial con media
2, en el nivel de significancia de 0.05

TEST
KOLMOGOROV - SMIRNOV
EJEMPLO:
0.023
0.406
0.538
1.267
2.343
2.563
3.334
3.491
5.088
5.587

( ) = 1 eyi /2

24

31/03/2015

TEST
KOLMOGOROV - SMIRNOV
i
1
2
3
4
5
6
7
8
9
10

y(i)
0.023
0.406
0.538
1.267
2.343
2.563
3.334
3.491
5.088
5.587

F(yi)
0.0114
0.1837
0.2359
0.4693
0.6901
0.7224
0.8112
0.8254
0.9214
0.9388

i/n Fn(y)= (i-1)/n D+ = i/n-F(yi) D- = F(yi)-(i-1)/n


0.1
0
0.0886
0.0114
0.2
0.1
0.0163
0.0837
0.3
0.2
0.0641
0.0359
0.4
0.3
-0.0693
0.1693
0.5
0.4
-0.1901
0.2901
0.6
0.5
-0.1224
0.2224
0.7
0.6
-0.1112
0.2112
0.8
0.7
-0.0254
0.1254
0.9
0.8
-0.0214
0.1214
1
0.9
0.0612
0.0388
Mximo valor

( ) = 1 eyi /2

TEST
KOLMOGOROV SMIRNOV
D+= 0.0886
D-= 0.2901
Solucin: Dm= Max (D-, D+) = 0.2901
= (0,2901)

10 0.12 +

0.11

= 0.9623
10
Para alfa = 0.05, el valor de D calculado = 0.9623 < D

modificado 1.358.
No se rechaza la hiptesis nula.

25

31/03/2015

TEST
KOLMOGOROV - SMIRNOV
F(yi)
1.0000
0.9000
0.8000
0.7000

Probabilidad

0.6000
0.5000
0.4000
0.3000
0.2000
0.1000
0.0000
F(yi)
Fn(y)= (i-1)/n

10

0.0114

0.1837

0.2359

0.4693

0.6901

0.7224

0.8112

0.8254

0.9214

0.9388

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

PRUEBAS DE BONDAD
DE AJUSTE
TEST
ANDERSON DARLING

Jos Rodrguez l.
Docente Simulacin

26

31/03/2015

TEST
ANDERSON DARLING
Un posible inconveniente del test K-S es que asignan una
misma importancia a la diferencia () para cada
valor de x, mientras varias distribuciones de inters difieren
principalmente en sus colas. El test de Anderson-Darling (AD), por otra parte, fue diseado para detectar discrepancias
en las colas y tiene mayor poder que el test de K-S contra
muchas distribuciones alternativas.

TEST
ANDERSON DARLING
El estadstico A-D, 2 es definido por:

2 =
donde

()

[1 ]}

es la funcin de pesos.

As, 2 es solo el promedio ponderado de la diferencia


2

cuadrada de () , y la ponderacin mayor para


esta cerca de 1, para colas derecha y, cerca del cero

para colas izquierdas.

27

31/03/2015

TEST
ANDERSON DARLING
Si hacemos = = 1,2, entonces se puede
demostrar:
2 = ({

=1

2 1 [ + ln(1 +1 )]/})

Lo que esta dentro de lo usual empleado para clculos


actuales.
Desde 2 es una distancia ponderada, la forma del test es
rechazar la hiptesis nula 0 si 2 excede valores crticos
,1 donde es el nivel del test.
Los valores crticos ,1 se tabulan y consideran, cinco
distribuciones continuas.

TEST
ANDERSON DARLING

28

31/03/2015

TEST
ANDERSON DARLING
Ejemplo.
Asumamos que debemos confirmar que la distribucin de
probabilidad

subyacente

de

datos

sigue

EXPONENCIAL dada por = 1

0.399

una

distribucin

, y que el nivel

considerado es 1 = 0.10, se encuentra que 2219 = 0.558


El clculo del estadstico de ajuste:
1+

0.6
219

2219 = 0.560

Como 0.560 es menor que el valor modificado 1.062 (valor ledo de


la tercera fila de la tabla, primera columna).
Por lo que no se rechaza la hiptesis nula 0

TEST
ANDERSON DARLING
Ejemplo.

Dado los siguientes datos:


Infiera la distribucin de probabilidades.
Con un 5% = 1-
Aplique Test A-D

Datos
35.620
33.828
28.335
37.058
35.891
36.606
38.969
37.410
30.726
38.014
33.317
34.270
33.155
32.650
35.319
36.636
35.078
32.798
33.106
33.569

29

31/03/2015

TEST
ANDERSON DARLING
Ejemplo.
Estadstica descriptiva.

Columna1
Media
Error tpico
Mediana
Moda
Desviacin estndar
Varianza de la muestra
Curtosis
Coeficiente de asimetra
Rango
Mnimo
Mximo
Suma
Cuenta
Nivel de confianza(95.0%)

34.618
0.574
34.674
#N/A
2.568
6.597
0.530
-0.530
10.634
28.335
38.969
692.356
20.000
1.202

TEST
ANDERSON DARLING
Ejemplo.

Histograma.

30

31/03/2015

TEST
ANDERSON DARLING
Ejemplo.

TEST
ANDERSON DARLING
Ejemplo.

31

31/03/2015

TEST
ANDERSON DARLING
Ejemplo.

TEST
ANDERSON DARLING
Ejemplo.

32

31/03/2015

TEST
ANDERSON DARLING
Ejemplo.

TEST
ANDERSON DARLING
Ejemplo.

Formula de A-D

33

31/03/2015

TEST
ANDERSON DARLING
Ejemplo.
Formula de A-D

TEST
ANDERSON DARLING
Ejemplo.

Formula de A-D

34

31/03/2015

TEST
ANDERSON DARLING
Ejemplo.
Formula de A-D

TEST
ANDERSON DARLING
Ejemplo.

Respuesta:
Como el valor de 2 = 0.24423726 <0.751 = Valor crtico A-D.
Se concluye que no existe evidencia estadstica para rechazar la
hiptesis nula que los valores del ejemplo tienen una distribucin
normal con parmetros:
Media

34.61778027

Desv Std.

2.568381159

35

31/03/2015

TEST
ANDERSON DARLING

FIN

Jos Rodrguez l.
Docente Simulacin

36