Está en la página 1de 22

Bondad de Ajuste

Esneyder González P

Universidad del Norte

2 de Mayo de 2018

Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 1 / 22


Introducción

Es muy común que un investigador desee conocer la distribución de


probabilidad que siguen los datos de una población. Para esto se debe
seleccionar una muestra aleatoria y analizar los datos grá…ca y
analiticamente.

Realizar un histograma ayudará al investigador a proponer distribuciones


hipotéticas. La hipótesis nula H0 indica la distribución hipotética que
siguen los datos, la hipótesis alternativa H1 indica que los datos no se
ajustan a la distribución hipotética

Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 2 / 22


Dos Casos

Se deben diferenciar 2 casos: El primero, cuando los parámetros de la


distribución hipotética son conocidos. Ejemplos:

H0 : Los datos siguen una dist. normal con = 3;5 y = 0;5


H1 : Los datos NO siguen una dist. normal con = 3;5 y = 0;5

H0 : Los datos siguen una dist. exponencial con = 2;5


H1 : Los datos NO siguen una dist. exponencial con = 2;5

Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 3 / 22


Dos Casos

El segundo, cuando los parámetros de la distribución hipotética son


desconocidos y deben ser estimados. Ejemplos:

H0 : Los datos siguen una dist. normal con estimado de 3;5 y


estimado de 0;5
H1 : Los datos NO siguen una dist. normal con estimado de 3;5 y
estimado de 0;5

H0 :Los datos siguen una dist. exponencial con estimado de 2;5


H1 :Los datos NO siguen una dist. exponencial con estimado de 2;5

Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 4 / 22


Procedimiento
1. De…nir la distribución de probabilidad que ajustaremos
2. Estimar los parámetros (si son desconocidos) que requiere la
distribución de probabilidad hipotética. El número de parámetros
estimados lo denominaremos S.
3. Plantear H0 y H1
4. Construir una tabla de frecuencias agrupadas. La tabla la construimos
utilizando la metodología vista en la unidad I. El número de clases lo
denominaremos K :El número de valores dentro de cada intervalo (las
frecuencias absolutas) serán los ni y los llamaremos frecuencias
observadas. Nota: En algunas ocasiones te entregan la tabla de
frecuencias agrupadas.
5. Calcular las frecuencias esperadas npi , donde n corresponde al
número de datos de la muestra y, pi a la probabilidad de que la
variable aleatoria que sigue la distribución hipotética esté entre las
fronteras de…nidas en el intervalo i:
Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 5 / 22
Procedimiento
Las probabilidades del primer y último intervalo se calculan diferente.
Primer intervalo: desde el menor valor que puede tomar mi variable
aleatoria hasta la frontera superior del primer intervalo.
Último intervalo: Desde la frontera inferior del último intervalo hasta el
máximo valor que puede tomar mi variable aleatoria
Es importante veri…car que todas las frecuencias esperadas (npi ) sean
mayores o iguales a 5, en caso contrario se deben combinar los intervalos
estratégicamente (con tal de no reducir en gran manera del número total
de intervalos).
Ejemplo de combinación de intervalos:

Fi Fs npi
0 3 4 Fi Fs npi
3 6 3 ! 0 6 7
6 9 7 6 12 10
9 12 3
Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 6 / 22
Procedimiento

6. Calculamos el estadístico de prueba 2o : Este estadístico de prueba


surge de comparar las frecuencias observadas (ni ) y las frecuencias
esperadas (npi ),de pertenecer a un determinado subconjunto del
espacio de valores de la variable en la distribución especi…cada por la
hipótesis nula.

K
X
2 (ni npi )2
o =
npi
i =1

El test sugiere rechazar H0 si:

2 2
o > ;K S 1

Donde, es el nivel de signi…cancia, K el número de clases o intervalos y


S; el número de parámetros estimados (si no hay parámetros estimados
S = 0)
Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 7 / 22
Ejemplo-Distribución Exponencial

Bombillas
Se prueban 300 Bombillas para analizar sus tiempos de vida t (en horas), y
los resultados aparecen en la parte inferior. Supongamos que para el
tiempo de vida t se postula que su distribución es exponencial con un
tiempo medio de vida de 200 horas. Probar esta hipótesis con un nivel de
signi…cancia de 0;05

Tiempo de vida t # Bombillas


t < 100 121
100 t < 200 78
200 t < 300 43
t 300 58
Total 300

Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 8 / 22


Ejemplo-Distribución Exponencial

De…nimos las hipótesis:


H0 : Los tiempos de vida de las bombillas se ajustan a una distribución
exponencial con = 1=200 = 0;005
H1 : Los tiempos de vida de las bombillas NO se ajustan a una
distribución exponencial con = 1=200 = 0;005

Nuestra variable aleatoria queda de…nida como: T : Tiempo de vida de la


bombilla T Exp( = 0;005)

Ahora, calculamos las probabilidades de que la variable aleatoria esté en


cada intervalo.

Recuerda que P(T < x0 ) = 1 e x0 y P(T > x0 ) = e x0

Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 9 / 22


Ejemplo-Distribución Exponencial

0;005 100
P(T < 100) = 1 e = 0;393 47

P(100 T < 200) = P(T > 100) P(T > 200)


0;005 100 0;005 200
=e e = 0;238 65

P(200 T < 300) = P(T > 200) P(T > 300)


0;005 200 0;005 300
=e e = 0;144 75

0;005 300
P(T 300) = e = 0;223 13

Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 10 / 22


Ejemplo-Distribución Exponencial

Completamos la tabla de frecuencias agrupadas. Recuerda n = 300

(ni npi )2
Fi Fs ni pi npi
npi
0 100 121 0;39347 118;041 0; 07417
100 200 78 0;23865 71: 595 0; 5730
200 300 43 0;14475 43: 425 0; 004159
300 1 58 0;2213 66: 39 1; 0603
Total 300 0; 99817 1; 7116
Todos los npi son mayores o iguales a 5, por esto no fue necesario
combinar intervalos. Entonces 2o = 1;7116; K = 4, S = 0. = 0;05:
gl = 4 1 = 3

Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 11 / 22


Ejemplo-Distribución Exponencial

Buscamos en la tabla chi-cuadrado 20;05;3 = 7;81: Luego 2o = 1;7116 no


es mayor que 7;81: Entonces no se rechaza la hipótesis nula. Concluimos:
No existe su…ciente evidencia estadística para rechazar la hipótesis de que
los tiempos de vida de las bombillas se ajustan a una distribución
exponencial con = 0;005.

Entonces consideremos que los tiempos de vida se ajustan a una


distribución exponencial con = 0;005:

Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 12 / 22


Ejemplo-Distribución Geométrica
Se lanza una moneda hasta que sale un sello y se registra el número de
lanzamientos X . Después de repetir el experimento 256 veces, obtenemos
los siguientes resultados:
# Lanzamientos Frecuencia Obtenida
1 136
2 60
3 34
4 12
5 9
6 1
7 3
8 1
Con un nivel de signi…cancia de 0;05; prueba la hipótesis de que la
distribución observada de X se puede ajustar por una distribución
geométrica con p = 0;5
Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 13 / 22
Ejemplo-Distribución Geométrica
Planteamos las hiupótesis:
H0 : El número de lanzamientos hasta obtener sello sigue una distribución
geométrica con p = 0;5
H1 : El número de lanzamientos hasta obtener sello NO sigue una
distribución geométrica con p = 0;5

Variable aleatoria. X : # de lanzamientos de la moneda necesarios hasta


obtener sello. X Geom(P = 0;5)

Calculamos las probabilidades

P(X = 1) = 0;5 0;50 = 0;5


P(X = 2) = 0;5 0;51 = 0;25
P(X = 3) = 0;5 0;52 = 0;125
P(X = 4) = 0;5 0;53 = 0;062 5
P(X = 5) = 0;5 0;54 = 0;031 25
Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 14 / 22
Ejemplo-Distribución Geométrica

Calculamos las probabilidades-Continuación

P(X = 6) = 0;5 0;55 = 1: 562 5 10 2


P(X = 7) = 0;5 0;56 = 7: 812 5 10 3
P(X = 8) = 0;5 0;57 = 3: 906 3 10 3
P(X > 8) = 1 P(X <= 8) = 1 0;99609375 = 3: 906 3 10 3

Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 15 / 22


Ejemplo-Distribución Geométrica

# Lanzamientos ni pi npi
1 136 0;5 128
2 60 0;25 64
3 34 0;125 32
4 12 0;0625 16
5 9 0;03125 8
6 1 1: 562 5 10 2 4
7 3 7: 812 5 10 3 2
8 1 3: 906 3 10 3 1
mayor a 8 0 3: 906 3 10 3 1

Note que no todos los npi son mayores o iguales a 5: Entonces


combinamos los intervalos 6; 7; 8 y 9:

Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 16 / 22


Ejemplo-Distribución Geométrica

(ni npi )2
# Lanzamientos ni pi npi
npi
1 136 0;5 128 0;5
2 60 0;25 64 0;25
3 34 0;125 32 0;125
4 12 0;0625 16 1
5 9 0;03125 8 0;125
mayor a 5 5 0;03125 8 1;125
Total 3;125

Entonces 2o = 3;125 K = 6, S = 0. = 0;05: gl = 6 1 = 5:


2
0;05;5 = 11;0705: Entonces 3;125 no es mayor que 11;075. No se rechaza
H0 : Los datos siguen distribución geométrica con p = 0;5

Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 17 / 22


Ejemplo-Distribución de Poisson

Llegadas
Se analizaron durante 200 periodos de 1 minuto las llegadas de vehículos
al parquedero de la Universidad del Norte.

# Llegadas 0 1 2 3 4 5 6 7 8
Frecuencia 14 31 47 41 29 21 10 5 2

¿Las llegadas de los vehículos se ajustan a una distribución de


Poisson? Utilice un nivel de signi…cancia de 0;05

¿Cómo interpretar los datos de arriba? Por ejemplo: en 14 periodos de un


minuto del total de 200 no llegó ningún vehículo. En cada uno de los 31
periodos de 1 minuto llegó 1 vehículo.

Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 18 / 22


Ejemplo-Distribución de Poisson
De…nimos la variable aleatoria X :# de vehículos que llegan al parquedero
de la universidad en un intervalo de tiempo de 1 minuto.
X Poisson( =?)

Debemos estimar : Lambda será estimado calculando el promedio de los


datos, teniendo en cuenta la de…nición de media para datos con
frecuencias, así:
P
b= P xi fi 0 14 + 1 31 + 2 47 + ::: + 8 2 580
= = = 2;9
… 200 200
Calculamos las probabilidades utilizando distribución de poisson. Como el
periodo de estudio es 1 minuto, t = 1:

e 2;9 2;9 0
P(X = 0) = = 5: 502 3 10 2
0!
e 2;9 2;9 1
P(X = 1) = 0! = 0;159 57
Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 19 / 22
Ejemplo-Distribución de Poisson

e 2;9 2;9 2
P(X = 2) = 2! = 0;231 37
e 2;9 2;9 3
P(X = 3) = 3! = 0;223 66
e 2;9 2;9 4
P(X = 4) = 4! = 0;162 15
e 2;9 2;9 5
P(X = 5) = = 9: 404 9 10 2
5!
e 2;9 2;9 6
P(X = 6) = = 4: 545 7 10 2
6!
e 2;9 2;9 7
P(X = 7) = = 1: 883 2 10 2
7!
e 2;9 2;9 8
P(X = 8) = 8! = 6: 826 7 10 3
P(X > 8) = 1 P(X 8) = 1 0;9969422 = 0;0030578

Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 20 / 22


Ejemplo-Distribución de Poisson

Llegadas ni pi npi
0 14 5: 502 3 10 2 11;004
1 31 0;159 57 31;91
2 47 0;231 37 46;27
3 41 0;223 66 44;73
4 29 0;162 15 32;43
5 21 9: 404 9 10 2 18;809
6 10 4: 545 7 10 2 9;09
7 5 1: 883 2 10 2 3;766
8 2 6: 826 7 10 3 1;365
Mayor a 8 0 0;0030578 0;61156

Combinamos los últimos3 intervalos

Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 21 / 22


Ejemplo-Distribución de Poisson

(ni npi )2
Llegadas ni pi npi
npi
0 14 5: 502 3 10 2 11;004 0;8153
1 31 0;159 57 31;91 0;0261
2 47 0;231 37 46;27 0;0113
3 41 0;223 66 44;73 0;311
4 29 0;162 15 32;43 0;3629
5 21 9: 404 9 10 2 18;809 0;255
6 10 4: 545 7 10 2 9;09 0;0908
mayor a 6 7 0;0287 5;7433 0;2749
2;1479

Entonces 2o = 2;1479 K = 8, S = 1. = 0;05: gl = 8 1 1 = 6:


2
0;05;6 = 12;59: Entonces 2;1479 no es mayor que 12;59. No se rechaza
H0 : Los datos siguen distribución de Poisson con estimado de 2;9
Esneyder González P (Universidad del Norte) Bondad de Ajuste 2 de Mayo de 2018 22 / 22

También podría gustarte