Está en la página 1de 23

Pruebas de Bondad de Ajuste

16 51

9 54

22
3 27
10
8
43 43

12
Objetivos de la clase
• Determinar la fdp que puede representar a
un conjunto de datos
• Usar los criterios para seleccionar la fdp
adecuada.
• Prueba de bondad de ajuste Chi-
Cuadrado
• Prueba de bondad de ajuste K-S
1. Determinación de la función a usar

SIMULACIÓN DE SISTEMAS 3
Analizando los datos recolectados
1. Recolectar los datos.
2. Hallar los estadísticos máximo, mínimo y promedio.
3. Calcular la cantidad de intervalos de clase “K” y el “Ancho
de Clase”, usando la regla de STURGES.

Regla de STURGES:

K = 1 + 3.3 Log (n)

n: número de observaciones
K: número de intervalos

Ancho de clase =
(Max valor – Min valor) / k

SIMULACIÓN DE SISTEMAS 4
Creación de los intervalos de clase

• Se requiere K = 6 intervalos de clase y el ancho de


clase es igual a 8.5.
• Usaremos el ancho de clase para hallar cada intervalo,
cada intervalo de clase tiene un límite inferior y superior.
Límite Límite Frec.
Inferior Superior Obs.

1 1+8.5 = 9.5

9.5 9.5+8.5=18.0

18 18+8.5 =26.5

26.5 26.5 + 8.5 = 35.0

35.0 35.0 + 8.5 = 43.5

43.5 43.5 + 8.5 = 52.0

SIMULACIÓN DE SISTEMAS 5
Hallando la frecuencia observada
La frecuencia observada (FO) muestra cuántos datos se
encuentran dentro de cada intervalo.

Límite Límite Frecuenci


Inferior Superio a
r Observada
1 9.5 18

9.5 18.0 6

18 26.5 2

26.5 35.0 2

35.0 43.5 1

43.5 52.0 1

Total 30

SIMULACIÓN DE SISTEMAS 6
Graficando
El gráfico del histograma nos ayuda a analizar cómo se
distribuyen los datos y dónde están más concentrados.

Límite Límite Frecuenci 18

Inferior Superio a 16
r Observada 14
1 9.5 18 12

9.5 18.0 6 10
8
18 26.5 2
6
26.5 35.0 2 4

35.0 43.5 1 2
0
43.5 52.0 1 1 - 9.5 9.5 - 18 18 - 26.5 - 35 - 43.5 -
26.5 35 43.5 52
Total 30

SIMULACIÓN DE SISTEMAS
7
Hallando el histograma en Excel

Office 2007: Herramientas / análisis de datos / histograma


Puedes revisar la siguiente guía en youtube (Office 2007):

http://www.youtube.com/watch?v=hjfn68RehEM

Haz clic en “archivo de datos” para obtener el archivo Excel con


los datos y halla el histograma.

SIMULACIÓN DE SISTEMAS
8
Planteando la hipótesis
Analizando las funciones Uniforme, Exponencial y Normal,
notamos que la exponencial es la que se ajusta al
histograma.
18
Uniforme Exponencial Normal 18 18
16
16 16
14
14 14
12
12 12
10
10 10
8
8 8
6
6 6
4
4 4
2
2 2
0
1 - 9.5 9.5 - 18 18 - 26.5 - 35 - 43.5 - 0 0
1 - 9.5 9.5 - 18 18 - 26.5 - 35 - 43.5 - 1 - 9.5 9.5 - 18 18 - 26.5 - 35 - 43.5 -
26.5 35 43.5 52
26.5 35 43.5 52 26.5 35 43.5 52

Por lo tanto, la hipótesis es:


Ho: Los datos tienen un comportamiento exponencial (11.53)
H1: Los datos NO tienen un comportamiento exponencial (11.53)

SIMULACIÓN DE SISTEMAS
9
Recordando la función exponencial
Casi siempre la función exponencial representa los tiempos
requeridos para la ejecución de una actividad o la prestación
de un servicio.
Esta función requiere de un parámetro que es el promedio.

Función de distribución de Función de distribución de


probabilidades probabilidades ACUMULADA

1 x x
 
f ( x)  e F ( x)  1  e

Donde:
Promedio: 
(para los 30 datos  =11.53)
Varianza: 2

SIMULACIÓN DE SISTEMAS
10
2. Prueba de bondad Chi-Cuadrado

SIMULACIÓN DE SISTEMAS 11
Hallamos la probabilidad del intervalo

Límite Límite Frecuencia Frecuencia


P(Li <= X <= Ls)
Inferior Superior Observada (FO) Esperada (FE)
1 9.5 18 0.478 ( FOi  FEi ) 2
FEi
9.5 18.0 6 0.229
18 26.5 2 0.109 P(1  x  9.5)
26.5 35.0 2 0.052  P( x  9.5)  P( x  1)
35.0 43.5 1 0.025
 [1  e 9.5 /11.53 ]  [1  e 1/11.53 ]
43.5 52.0 1 0.012
 0.561  0.083
Total 30
 0.478

SIMULACIÓN DE SISTEMAS
12
Hallamos la frecuencia esperada

Límite Límite Frecuencia Frecuencia ( FOi  FEi ) 2


P(Li <= X <= Ls)
Inferior Superior Observada (FO) Esperada (FE) FEi
=
1 9.5 18 0.478 14.35
0.478x30
9.5 18.0 6 0.229 6.86
18 26.5 2 0.109 3.28 0.229x30
26.5 35.0 2 0.052 1.57
35.0 43.5 1 0.025 0.75
43.5 52.0 1 0.012 0.36
Total 30

SIMULACIÓN DE SISTEMAS
13
Hallamos el valor Chi-cuadrado calculado

Límite Límite Frecuencia Frecuencia ( FOi  FEi ) 2


P(Li <= X <= Ls)
Inferior Superior Observada (FO) Esperada (FE) FEi
1 9.5 18 0.478 14.35 0.93
9.5 18.0 6  14.35) 2
(180.229 6.86 0.11
18 26.5 2 14.35
0.109 3.28 0.50
26.5 35.0 2 0.052 1.57 0.12
35.0 43.5 1 0.025 0.75 0.08
43.5 52.0 1 0.012 0.36 1.14
La suma de esta columna es llamada
Total 30
“valor Chi-cuadrado calculado” 2.88

SIMULACIÓN DE SISTEMAS
14
Para un nivel de confianza del 90%

Nro. de intervalos
Nro. de parámetros estimados

• 2(teorico) = 2(90%, k - m- 1) = 2(90%, 6 - 1- 1 )

• 2(90%, 4) = 7.7794 Se tiene las siguientes hipótesis:


Ho: Los datos se ajustan a una fdp
Exponencial
• 2(calculado) < 2(teorico) Hi: Los datos NO se ajustan a una
fdp Exponencial
2.88 < 7.7794

˙
· · No se rechaza la hipotesis H0
Usando la tabla de distribución
Chi-cuadrado
Los grados de libertad = K – 1 – [cantidad parámetros de la función]
Los grados de libertad = 6 – 1 – 1 = 4
Supongamos un nivel alfa = 10%
Por lo tanto, el valor Chi-cuadrado = 7.7794

SIMULACIÓN DE SISTEMAS 16
Validación de la hipótesis
Recordemos que la hipótesis planteada es:
Ho: Los datos tienen un comportamiento exponencial (11.53)
H1: Los datos NO tienen un comportamiento exponencial (11.53)

Si el valor Chi-cuadrado (calculado) es menor que el Chi-cuadrado (de tabla)


No rechazamos la hipótesis Ho

El valor Chi-cuadrado (calculado) = 2.88


El valor Chi-cuadrado (de tabla) = 7.7794

Como 2.88 es menor que 7.7794, NO RECHAZAMOS la hipótesis Ho


Es decir los datos (los tiempos de la actividad) pueden ser representados por
una función EXPONENCIAL con promedio = 11.53

SIMULACIÓN DE SISTEMAS 17
Prueba Kolmogorov Smirnov
Se tiene las siguientes hipótesis:
Ho: Los datos se ajustan a una fdp Exponencial
Hi: Los datos NO se ajustan a una fdp Exponencial

Graficar y plantear las hipótesis

25

20

15

10

0
0-3 3-6 6-9 9-12 12-15 15-18 m ay-18
Prueba Kolmogorov Smirnov
Se tiene las siguientes hipótesis:
Ho: Los datos se ajustan a una fdp Exponencial
Hi: Los datos NO se ajustan a una fdp Exponencial

= 20 + 12
Hallar la Frecuencia Observada
= 20 + 12 + 7 Acumulada (FOA), sumando las
FO de cada intervalo
Prueba Kolmogorov Smirnov
Se tiene las siguientes hipótesis:
Ho: Los datos se ajustan a una fdp Exponencial
Hi: Los datos NO se ajustan a una fdp Exponencial

 Xi  6
n

= P(x <= 3) = 20 / 51 = 0.392

= P(x <= 6) = 32 / 51 = 0.627

Hallar la Probabilidad Observada


Acumulada (POA), dividiendo la
FOA entre el total de datos
Prueba Kolmogorov Smirnov
Se tiene las siguientes hipótesis:
Ho: Los datos se ajustan a una fdp Exponencial
Hi: Los datos NO se ajustan a una fdp Exponencial

F ( x)  1  e  x / 6  Xi  6
n

= P(x <= 3) = 1 – e –(3/6) = 0.392

= P(x <= 6) = 1 – e –(6/6) = 0.627

Hallar la Probabilidad Esperada


Acumulada (PEA), usando la
función planteada en el hipotesis.
Prueba Kolmogorov Smirnov
Se tiene las siguientes hipótesis:
Ho: Los datos se ajustan a una fdp Exponencial
Hi: Los datos NO se ajustan a una fdp Exponencial

Hallar la diferencia
en valor absoluto y
seleccionar el mayor

Como:
Máxima Diferencia < D(5%,51)
·˙· No se rechaza la hipótesis H0
Prueba Kolmogorov Smirnov

Grados de libertad = cant. de datos = 51


Alfa = 5%
Valor KS = 1.36/raiz(n) = 0.19

También podría gustarte