Está en la página 1de 27

Simulación de Sistemas

Modelado Estadístico
Prueba de Bondad de Ajuste
Objetivo de la Sesión
• Aprender a Crear una Distribución de
Probabilidad

• Determinar cual es la mejor distribución


que se ajusta a los datos

• Manejar pruebas de bondad de ajuste


Sistemas
Tabla de Contenido
• Creando una distribución de probabilidad
– Distribución de Probabilidad
– Variable Aleatoria
• Función de Distribución Exponencial
• Pruebas de Bondad de Ajuste
– Prueba Chi-Cuadrado (²)
– Prueba Kolmogorov – Smirnov (K-S)
Creando una Distribución de Probabilidad

Distribución de Probabilidad y Simulación


• Una distribución de probabilidad es un conjunto
de valores los cuales son contabilizados a partir
de una frecuencia relativa, en el cual, un evento
ocurre o es probable que ocurra.
• Los modelos de simulación estocástica utilizan
distribuciones de probabilidad para representar
una gran cantidad de eventos que ocurren
aleatoriamente.
Ajuste de Curvas

16 51

9 54

22
3 27
10
8
43 43

12
Variable Aleatoria

• Una variable aleatoria es una variable cuyos


resultados son determinados por los resultados
de un experimento.
• Ejemplo.
– Cantidad de tiempo entre arribos de paquetes que
llegan a u muelle

• P(X  x) indica que la probabilidad de la variable


aleatoria X será menor que o igual a un valor x.
Función de Densidad de Probabilidad

• Una fdp relaciona la probabilidad correspondiente a un


valor x individual asociado con una variable aleatoria X

• Un histograma de probabilidad asocia probabilidades


con grupos de valores de x

• Ellos pueden ser expresados gráficamente, describiendo


los pares de valores. Típicamente el eje horizontal
significa valor x y un eje vertical usualmente denota el
valor y.

• Usualmente denotado como y = f(x) (interpretado como


y es una función de x)
Creando una Distribución de Probabilidad

• Primer paso: Recolectar data empírica (data


bruta). La data empírica es información recuperada
(puede ser data histórica), esto es contado o
medido, recopilada en su forma original.

• Dado el siguiente ejemplo de data empírica.

– Consideremos que se han registrado 100


observaciones de tiempo entre arribos de ómnibus a
una terminal terrestre.
Tiempo entre arribos de ómnibus a una terminal terrestre (minutos)

N= 100 observaciones

18 13 3 40 9 29 10 3 8 10
1 17 29 2 22 1 22 1 4 32
20 5 8 6 10 3 1 11 13 2
15 8 1 23 29 9 34 17 10 4
15 2 1 1 40 8 6 6 8 1
3 24 14 24 8 14 28 12 18 7
1 5 6 10 54 12 13 1 22 45
5 12 2 14 12 1 33 23 7 5
12 5 46 18 2 2 6 2 39 7
4 4 2 19 1 25 12 3 5 1
Graficando los tiempo entre arribos de ómnibus
a una terminal terrestre (minutos)

T
0 Δ1=18 18 Δ2=13 31 Δ3=3 34 Δ4=40 74
Creando una Distribución de Probabilidad

• Segundo paso: creación de un histograma de


frecuencia (probabilidad) relativa a la data. Agrupar la
data por intervalos.

• Intervalos de clase:
• Regla de STURGES: K = 1 + 3.3 Log (n)
– n: número total de observaciones
– K: número de intervalos

– Para nuestro ejemplo: K = 1 + 3.3 Log (100) = 7.6


– Entones K es igual a 8 intervalos de clase.

Ancho de clase = (Max valor – Min valor) / k


Ancho de clase = (54 - 1) / 8 = 6.625
Frecuencia relativa del tiempo entre arribos

Nro. Intervalo Frecuencia Probabilidad


de clase
1 [01.000 - 07.625) 44 0.44
2 [07.625 – 14.250) 26 0.26
3 [14.250 – 20.875) 9 0.09
4 [20.875 – 27.500) 8 0.08
5 [27.500 – 34.125) 7 0.07
6 [34.125 – 40.750) 3 0.03
7 [40.750 – 47.375) 2 0.02
8 [47.375 – 54.000] 1 0.01
TOTAL 100 1
Creando una Distribución de Probabilidad

• La ecuación matemática que describe una


función de densidad es a menudo dificultosa
para establecerla.
• Esto puede ser aproximado frecuentemente
hallando una distribución de probabilidad
estándar conocida (ejemplo: normal,
exponencial, gamma, etc.), la cual representa
con precisión la distribución de frecuencia
relativa de la data actual.
• La figura de un histograma de frecuencia
relativa provee una pista o indicio para
encontrar una distribución estándar
representativa.
Creando una Distribución de Probabilidad

• Tercer paso: Graficar en un Histograma la frecuencia


relativa
• La figura del histograma en el gráfico indica que una distribución
exponencial es un candidato probable para representar la
distribución de probabilidad de la data observada.
Función Exponencial
• Media: 
• Varianza: 2
1 x 
f ( x)  e

Para nuestro ejemplo  = 12.41 (este valor resulta de la


suma total de los valores observados, entre el número
de observaciones)
Función de densidad de probabilidad

f(x) 1  x12.41
f ( x)  e
0.08
12.41
1
. 1.- y = f(0) = 0.08
Probabilidad

0.05
2.- y = f(10) = 0.035
0.035 2
.
3.- y = f(40) = 0.003
3
.
0.003
0
0
x
20 40 60 80

Tiempo entre arribos


PRUEBA DE BONDAD DE AJUSTE

• Luego de analizar la forma que tiene el gráfico del


histograma de frecuencias relativas, éste puede mostrar
que uno o más de las distribuciones estándares se
parecen para ajustar la data.

• Su utilidad es determinar cual es el mejor tipo de


distribución que ajusta la data.

• Prueba Chi-Cuadrado (²)


• Prueba Kolmogorov – Smirnov (K-S)
Test 2

Aplicable a v.a. continuas y v.a .discretas y compara las funciones de densidad


de probabilidad

Procedimiento
1o. Elaborar el histograma de frecuencias relativas, con la que podemos apreciar
cuál sería la función teórica de   densidad que se ajusta mejor a los datos del
histograma.
2o. Desarrollo de la prueba estadística :
2.1. Planteamiento de hipótesis
    Hp : La variable en estudio se ajusta a determinada distribución teórica
(Uniforme, exponencial, normal, poisson).
Ha : La variable en estudio tiene un comportamiento aleatorio que no se ajusta
a determinada distribución teórica.
3o. Establecimiento del nivel de significación  .
4o. Cálculos previos y estimación de la frecuencia esperada o teórica
5o. Criterios de decisión :
    Se acepta la Hp, si X2 calc < X2 tab
    Se rechaza la Hp si X2 calc > X2 tab
Test 2

Dada una muestra X1, X2, ..., Xn de una Fx(x) desconocida. Se


desea contrastar.
Ho : Fx(x) = Fo(x) v/s H1 : Fx(x)  Fo(x)

Efectuando una partición del soporte de X en k subconjuntos I1, I2, ..., Ik :


Ii  X  Ii I j  

 
2
k
 f i  ei 
2
 2 ( k 1 p )
i 1 ei
•fi : Número observados en el subconjunto i-ésimo (Ii)
•ei: número de observaciones esperadas en Ii bajo Ho
Prueba Chi-Cuadrado (²)

P(X x) =1- e-x/ (Oi  E i ) 2


  Intervalos O P(X<=Ls) - P(X<=Li) Prob. E   Ei
1 01.000 - 07.625 44 0.459 0.077 0.3816 38.163 0.893
2 07.625 - 14.250 26 0.683 0.459 0.2238 22.377 0.587
3 14.250 - 20.875 9 0.814 0.683 0.1312 13.120 1.294
4 20.875 - 27.500 8 0.891 0.814 0.0769 7.693 0.012
5 27.500 - 34.125 7 0.936 0.891 0.0451 4.511 1.374
6 34.125 - 40.750 3 0.963 0.936 0.0264 2.645 0.048
7 40.750 - 47.375 2 0.978 0.963 0.0155 1.551 0.130
8 47.375 - 54.000 1 0.987 0.978 0.0091 0.909 0.009

Total 100     4.35

Chi - cuadrado calculado


2(calculado)
Prueba Chi-Cuadrado (²)

P(X x) =1- e-x/ (Oi  E i ) 2


  Intervalos O P(X<=Ls) - P(X<=Li) Prob. E   Ei
1 01.000 - 07.625 44 0.459 0.077 0.3816 38.163 0.893
2 07.625 - 14.250 26 0.683 0.459 0.2238 22.377 0.587
3 14.250 - 20.875 9 0.814 0.683 0.1312 13.120 1.294
4 20.875 - 27.500 8 0.891 0.814 0.0769 7.693 0.012
5 27.500 - 34.125 7 0.936 0.891 0.0451 4.511 1.374
6 34.125 - 40.750 3 0.963 0.936 0.0264 2.645 0.048
7 40.750 - 47.375 2 0.978 0.963 0.0155 1.551 0.130
8 47.375 - 54.000 1 0.987 0.978 0.0091 0.909 0.009

Total 100     4.35

Chi - cuadrado calculado


2(calculado)
Prueba Chi-Cuadrado (²)
Para un nivel de confianza del 95% Grados de Libertad

Cantidad parámetros a estimar


(media)

 2(teorico) = 2(95%, k – 1-P ) = 2(95%, 8 – 1-1 )

Se tiene las siguientes hipótesis:

 2(95%, 6) = 12.592 Ho: Los datos se ajustan a una fdp


Exponencial
Hi: Los datos NO se ajustan a una
 2
(calculado) <  2
(teorico)
fdp Exponencial

4.35 < 12.592

˙
·· No se rechaza la hipótesis H0
Test de Kolmogorov - Smirnov (Test K-S)

Mediante la prueba se compara la distribución acumulada de las frecuencias teóricas


(Fo) con la distribución acumulada de las frecuencias observadas (Fn), se encuentra
el punto de divergencia máxima y se determina qué probabilidad existe de que una
diferencia de esa magnitud se deba al azar.

Procedimiento:

1o. Calcular las frecuencias esperadas de la distribución teórica específica por


considerar para determinado número de clases, en un arreglo de rangos de menor a
mayor.
2o Arreglar estos valores teóricos en frecuencias acumuladas.
3o Arreglar acumulativamente las frecuencias observadas.
4o Aplicar la ecuación D = |Fo – Fn| , donde D es la máxima discrepancia de ambas.
5o Comparar el valor estadístico D de Kolmogorov-Smirnov en la tabla de valores
críticos de D.
6o Decidir si se acepta o rechaza la hipótesis.
Test de Kolmogorov - Smirnov (Test K-S)
Sea Fo una función de distribución continua y sea Fn la
función de distribución empírica de la muestra.
Bajo Ho: Fn(x) = Fo(x) se espera que Fn se aproxime a Fo

Dn = Sup | Fn(x) - Fo(x) |


xR
La distribución exacta de Dn está tabulada para valores
n  40 y distintos niveles de significación .
Para muestras grandes se utiliza la distribución
asintótica de Dn dada por

lim P(
n 
n Dn  z )  L( z )  1  2 (1) e
i 1  2 i 2 z

i 1
Prueba Kolmogorov Smirnov
Se tiene las siguientes hipótesis:
Ho: Los datos se ajustan a una fdp Exponencial
Hi: Los datos NO se ajustan a una fdp Exponencial F ( x)  1  e  x /12.41
K_S
Intervalos FO FOA POA PE PEA IPEA-POAI
1 7.625 44 44 0.44 0.38162846 0.38162846 0.05837154
7.625 14.25 26 70 0.7 0.22376666 0.60539512 0.09460488
14.25 20.875 9 79 0.79 0.13120489 0.73660001 0.05339999
20.875 27.5 8 87 0.87 0.07693158 0.81353159 0.05646841
27.5 34.125 7 94 0.94 0.0451086 0.85864019 0.08135981
34.125 40.75 3 97 0.97 0.02644929 0.88508948 0.08491052
40.75 47.375 2 99 0.99 0.01550846 0.90059793 0.08940207
47.375 54 1 100 1 0.00909334 0.90969127 0.09030873
100

Max-Dif D 0.09460488Menor
no se Rechaza
D Tabla 0.05 0,13403

FO: Frecuencia Observada


Como:
FOA: Frec. Observada Acumulada
Máxima Diferencia < D(5%,100) POA: Prob. Observada Acumulada
·˙· No se rechaza la hipotesis H0 PEA: Prob. Esperada Acumulada
Prueba Kolmogorov Smirnov
Se tiene las siguientes hipótesis:
Ho: Los datos se ajustan a una fdp Exponencial
Hi: Los datos NO se ajustan a una fdp Exponencial F ( x)  1  e  x /12.41
K_S
Intervalos FO FOA POA PE PEA IPEA-POAI
1 7.625 44 44 0.44 0.38162846 0.38162846 0.05837154
7.625 14.25 26 70 0.7 0.22376666 0.60539512 0.09460488
14.25 20.875 9 79 0.79 0.13120489 0.73660001 0.05339999
20.875 27.5 8 87 0.87 0.07693158 0.81353159 0.05646841
27.5 34.125 7 94 0.94 0.0451086 0.85864019 0.08135981
34.125 40.75 3 97 0.97 0.02644929 0.88508948 0.08491052
40.75 47.375 2 99 0.99 0.01550846 0.90059793 0.08940207
47.375 54 1 100 1 0.00909334 0.90969127 0.09030873
100

Max-Dif D 0.09460488Menor
no se Rechaza
D Tabla 0.05 0,13403

FO: Frecuencia Observada


Como:
FOA: Frec. Observada Acumulada
Máxima Diferencia < D(5%,100) POA: Prob. Observada Acumulada
·˙· No se rechaza la hipotesis H0 PEA: Prob. Esperada Acumulada
Conclusiones
• El Ajuste de curvas se realiza con datos
obtenidos del sistema real
• La pruebas de bondad de ajuste nos ayudan a
determinar que distribución se ajusta mejor a los
datos recolectados.

También podría gustarte