Documentos de Académico
Documentos de Profesional
Documentos de Cultura
31/03/2015
TALLER DE SIMULACION
Unidad III
Ajustes a una distribucin de
probabilidad
31/03/2015
Objetivos Unidad II
Identificar y seleccionar la
familia de distribuciones de
probabilidad adecuada a la
situacin en estudio.
Seleccionar
por
medio
de
software especfico los test de
bondad de ajuste.
Cmo
enfrentar
situaciones
reales en ausencia de datos.
GRAFICO DE CORRELACION
1. Si las observaciones 1 , 2 , . . . , , (listados en orden de
tiempo) son independientes.
2. En un grfico de correlacin, es el estimador de la
muestra para = 1,2, . . . ( ).
3. =
4. =
2
()
=1
5. 2 =
() [ + ()]
2
=1 [ ()]
31/03/2015
GRAFICO DE CORRELACION
1. La correlacin de la muestra , es un estimador de la
correlacin verdadera ( 1 1), entre
dos observaciones que son separadas en el tiempo.
2. Si las observaciones 1 , 2 , . . . , son independientes,
entonces = 0 , para = 1,2, 1.
3. Sin embargo, los no son exactamente 0 incluso
cuando los son independientes, esto se debe a que
es una observacin de una variable aleatoria cuya
media no es igual a cero.
GRAFICO DE CORRELACION
31/03/2015
GRAFICO DE DISPERSIN
GRAFICO DE DISPERSIN
31/03/2015
GRAFICO DE DISPERSIN
1. Si los tienen correlacin positiva, entonces, los puntos
tendrn una tendencia a agruparse en el primer
cuadrante, sobre una lnea con pendiente positiva.
2. Si los tienen correlacin negativa, entonces los
puntos tendrn una tendencia a agruparse en el primer
cuadrante, sobre una lnea con pendiente negativa.
GRAFICO DE DISPERSIN
10
31/03/2015
Box Plot
http://www.slideshare.net/ddalgleish/how-tocreate-a-box-plot-box-whisker-chart-in-excel
11
12
31/03/2015
FAMILIA DE DISTRIBUCIONES
HIPTESIS
1. Parece razonable pensar que el primer paso debe ser
seleccionar una distribucin de probabilidades en base a
su forma aparente, sin preocuparse an de los
parmetros relevantes.
2. Otro aspecto que facilita una identificacin de la
distribucin de probabilidad es el tipo de sistema que se
trate y la experiencia que se tenga para analizarlos.
3. A continuacin se sugieren mtodos ms formales para
lograr un anlisis acabado de cada situacin en estudio.
13
RESUMEN ESTADISTICA
14
31/03/2015
FAMILIA DE DISTRIBUCIONES
HIPTESIS
1. Estadstica descriptiva., Algunas distribuciones son
caracterizadas parcialmente por funciones de sus
verdaderos parmetros, como son;
a. Mximo,
b. Mnimo,
c. Media,
d. Mediana,
e. Varianza,
f. Coeficiente de variacin ( =
g. Razn Lexis ( =
h. Oblicuidad =
),
),
[ 3 ]
3
( 2 ) 2
15
FAMILIA DE DISTRIBUCIONES
HIPTESIS
1. Estas funciones pueden ser usadas en algunos casos para
sugerir una apropiada familia de distribuciones. Para una
distribucin continua simtrica (Ej., Normal), la media y
la mediana son iguales. (Para una distribucin discreta
simtrica, la media de la poblacin y la mediana pueden
slo ser aproximadamente iguales. De esta manera si el
estimador
y 0.5 son casi iguales hay un
indicio que la distribucin subyacente puede ser
simtrica.
Mg. Jose Rodrguez L.
16
31/03/2015
FAMILIA DE DISTRIBUCIONES
HIPTESIS
1. Hay que tener presente que y 0.5 son
observaciones de variables aleatorias sus relaciones no
necesariamente proveen informacin definitiva acerca
de la verdadera relacin entre y 0.5
2. Coeficiente de variacin. (cv), algunas veces puede
proveer informacin til acerca de la forma de la
distribucin continua. En particular, para la distribucin
exponencial, = 1, ahora, sin tener en cuenta el
parmetro de escala , () es prxima al valor 1
sugiriendo esto que la distribucin subyacente es
exponencial.
Mg. Jose Rodrguez L.
17
FAMILIA DE DISTRIBUCIONES
HIPTESIS
1. Para las distribuciones, Gamma y Weibull los valores de
pueden ser mayores, iguales o menores que 1,
cuando el parmetro de forma es mayor, igual o menor
que 1, estas distribuciones tendrn una forma similar a
las distribuciones de densidad.
2. Por otra parte, la distribucin Lognormal tiene una
forma caracterstica pero su puede ser cualquier
nmero real positivo. As, si la distribucin subyacente
(observada en el histograma) tiene esta forma y
> 1 la Lognormal puede ser un mejor modelo que
la distribucin Gamma o Weibull.
Mg. Jose Rodrguez L.
18
31/03/2015
FAMILIA DE DISTRIBUCIONES
HIPTESIS
1. Para el resto de
particularmente til.
distribuciones
el
no
es
2
),
19
FAMILIA DE DISTRIBUCIONES
HIPTESIS
1. La Oblicuidad es una medida de simetra de una
distribucin. Para distribuciones simetricas como la
Normal, = 0, si > 0 (Ej., = 2 para la distribucin
exponencial). La distribucin es oblicua a la derecha
si < 0, la distribucin es oblicua a la izquierda si el
estimador puede ser usado para comprobar la
forma de la distribucin subyacente.
2. La experiencia indica que muchas de las distribuciones
encontradas en la prctica son oblicuas a la derecha y,
adems, para muchos ejemplos, es algo menor
que .
Mg. Jose Rodrguez L.
20
10
31/03/2015
FAMILIA DE DISTRIBUCIONES
HIPTESIS
21
FAMILIA DE DISTRIBUCIONES
HIPTESIS
22
11
31/03/2015
23
FAMILIA DE DISTRIBUCIONES
El siguiente paso es determinar la familia de distribuciones que
se probar para representar el conjunto de datos en estudio.
Para ello se cuenta con la forma del histograma y tambin se
cuenta con la naturaleza del proceso. En efecto, se han
desarrollado numerosas distribuciones tericas para procesos
determinados, por ejemplo:
Despus de haber seleccionado una familia de distribuciones,
el prximo paso es la estimacin de los parmetros
correspondientes.
24
12
31/03/2015
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
25
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
0,01
0,01
0,01
0,01
0,01
0,01
0,01
0,01
0,02
0,02
0,03
0,03
0,03
0,04
0,04
0,04
0,04
0,04
0,04
0,05
0,05
0,05
0,05
0,05
0,05
0,05
0,05
0,05
0,05
0,06
0,06
0,06
0,06
0,07
0,07
0,07
0,07
0,07
0,07
0,07
0,07
0,07
0,07
0,08
0,08
0,08
0,08
0,09
0,09
0,1
0,1
0,1
0,1
0,1
0,1
0,1
0,1
0,1
0,11
0,11
0,11
0,11
0,11
0,12
0,12
0,12
0,12
0,13
0,14
0,14
0,14
0,14
0,15
0,15
0,15
0,15
0,15
0,15
0,17
0,18
0,19
0,19
0,19
0,2
0,21
0,21
0,21
0,21
0,21
0,22
0,22
0,22
0,23
0,23
0,23
0,23
0,23
0,24
0,25
0,25
0,25
0,25
0,25
0,26
0,26
0,26
0,26
0,26
0,27
0,28
0,28
0,29
0,29
0,3
0,31
0,31
0,32
0,35
0,35
0,35
0,36
0,36
0,36
0,37
0,37
0,38
0,38
0,38
0,38
0,38
0,39
0,4
0,4
0,41
0,41
0,43
0,43
0,43
0,44
0,45
0,46
0,47
0,47
0,47
0,48
0,49
0,49
0,49
0,49
0,5
0,5
0,5
0,51
0,51
0,51
0,52
0,52
0,53
0,53
0,53
0,54
0,54
0,55
0,55
0,56
0,57
0,57
0,6
0,61
0,61
0,63
0,63
0,64
0,65
0,65
0,65
0,69
0,69
0,7
0,72
0,72
0,72
0,74
0,75
0,76
0,77
0,79
0,84
0,86
0,87
0,88
0,88
0,9
0,93
0,93
0,95
0,97
1,03
1,05
1,05
1,06
1,09
1,1
1,11
1,12
1,17
1,18
1,24
1,24
1,28
1,33
1,38
1,44
1,51
1,72
1,83
1,96
26
13
31/03/2015
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
0,40
0,03
0,27
0,05
0,38
0,15
2,21
1,47
1,95
0,01
1,96
86,76
217,00
27
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
HISTOGRAMA
1. Numero de datos = N
n=
217
1,96
0,01
1,95
28
14
31/03/2015
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
HISTOGRAMA
3. Calculo del nmero de Clase o Intervalos (K)
Mtodo 1.
K=Ln(n)/Ln(2), donde el Ln logaritmo natural y n numero de datos a agrupar.
K=
Mtodo 2.
K=1+3.322log(N), donde el Log, logaritmo base 10 y N numero de datos a
agrupar. (aqui hay que decidir - comentario)
K=
8,76
Mtodo 3.
Escoger K de la tabla siguiente segun el numero de muestra n
n
K
n < 50
5a7
50<= n <100 6 a 7
100<= n <250 7 a 12
n>=250
10 a 20
29
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
HISTOGRAMA
4. Amplitud del intervalo (A)
A= Rango/nmero de clase = R/K
(aqui hay que decidir - ver comentario)
A=
0.2 0.21666667
0.01
0.2267
Li
0.01
0.23
0.44
0.66
0.88
1.09
1.31
1.53
1.74
Ls
0.23
0.44
0.66
0.88
1.09
1.31
1.53
1.74
1.96
30
15
31/03/2015
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
HISTOGRAMA
a sumar =
0.5
Li
Ls
Lri
Lrs
0.0
0.2
0.4
0.7
0.9
1.1
1.3
1.5
1.7
0.2
0.4
0.7
0.9
1.1
1.3
1.5
1.7
2.0
-0.5
-0.3
-0.1
0.2
0.4
0.6
0.8
1.0
1.2
0.7
0.9
1.2
1.4
1.6
1.8
2.0
2.2
2.5
31
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
HISTOGRAMA
Li
Ls
Lri
Lrs
Xj
0,01
0,23
0,44
0,66
0,88
1,09
1,31
1,53
1,74
0,23
0,44
0,66
0,88
1,09
1,31
1,53
1,74
1,96
-0,49
-0,27
-0,06
0,16
0,38
0,59
0,81
1,03
1,24
0,73
0,94
1,16
1,38
1,59
1,81
2,03
2,24
2,46
0,12
0,34
0,55
0,77
0,99
1,20
1,42
1,64
1,85
32
16
31/03/2015
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
HISTOGRAMA
Li
Ls
Lri
Lrs
Xj
ni
0,01
0,23
0,44
0,66
0,88
1,09
1,31
1,53
1,74
0,23
0,44
0,66
0,88
1,09
1,31
1,53
1,74
1,96
-0,49
-0,27
-0,06
0,16
0,38
0,59
0,81
1,03
1,24
0,73
0,94
1,16
1,38
1,59
1,81
2,03
2,24
2,46
0,12
0,34
0,55
0,77
0,99
1,20
1,42
1,64
1,85
n=
92
47
37
14
12
8
4
1
2
217
33
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
HISTOGRAMA
Li
Ls
Lri
Lrs
Xj
ni
fi
0,0
0,2
0,4
0,7
0,9
1,1
1,3
1,5
1,7
0,2
0,4
0,7
0,9
1,1
1,3
1,5
1,7
2,0
-0,5
-0,3
-0,1
0,2
0,4
0,6
0,8
1,0
1,2
0,7
0,9
1,2
1,4
1,6
1,8
2,0
2,2
2,5
0,1
0,3
0,6
0,8
1,0
1,2
1,4
1,6
1,9
n=
92
47
37
14
12
8
4
1
2
217
0,4
0,2
0,2
0,1
0,1
0,0
0,0
0,0
0,0
1,00
34
17
31/03/2015
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
HISTOGRAMA
10. Clculo de la Frecuencia Absoluta acumulada; Ni
Li
Ls
Lri
Lrs
Xj
ni
fi
Ni
0,0
0,2
0,4
0,7
0,9
1,1
1,3
1,5
1,7
0,2
0,4
0,7
0,9
1,1
1,3
1,5
1,7
2,0
-0,5
-0,3
-0,1
0,2
0,4
0,6
0,8
1,0
1,2
0,7
0,9
1,2
1,4
1,6
1,8
2,0
2,2
2,5
0,1
0,3
0,6
0,8
1,0
1,2
1,4
1,6
1,9
n=
92,0
47,0
37,0
14,0
12,0
8,0
4,0
1,0
2,0
217
0,4
0,2
0,2
0,1
0,1
0,0
0,0
0,0
0,0
1,00
92,0
139,0
176,0
190,0
202,0
210,0
214,0
215,0
217,0
35
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
HISTOGRAMA
11. Clculo de la Frecuencia Relativa acumulada; Fi
Li
Ls
Lri
Lrs
Xj
ni
fi
Ni
Fi
0,0
0,2
0,4
0,7
0,9
1,1
1,3
1,5
0,2
0,4
0,7
0,9
1,1
1,3
1,5
1,7
-0,5
-0,3
-0,1
0,2
0,4
0,6
0,8
1,0
0,7
0,9
1,2
1,4
1,6
1,8
2,0
2,2
0,1
0,3
0,6
0,8
1,0
1,2
1,4
1,6
n=
92,0
47,0
37,0
14,0
12,0
8,0
4,0
1,0
217
0,4
0,2
0,2
0,1
0,1
0,0
0,0
0,0
1,00
92,0
139,0
176,0
190,0
202,0
210,0
214,0
215,0
0,4
0,6
0,8
0,9
0,9
1,0
1,0
1,0
36
18
31/03/2015
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
HISTOGRAMA
0,49
0,49
0,5
0,5
0,5
0,51
0,51
0,51
0,52
0,52
0,53
0,53
0,53
0,54
0,54
0,55
0,55
0,56
0,57
0,57
Frecuencia
Histograma
100,0
90,0
80,0
70,0
60,0
50,0
40,0
30,0
20,0
10,0
0,0
0,2
0,4
0,7
0,9
1,1
0,0
0,2
0,4
0,7
0,9
37
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
DE
38
19
31/03/2015
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
0,49
0,49
0,5
0,5
0,5
0,51
0,51
0,51
0,52
0,52
0,53
0,53
0,53
0,54
0,54
0,55
0,55
0,56
0,57
0,57
Frecuencia
Histograma
100,0
90,0
80,0
70,0
60,0
50,0
40,0
30,0
20,0
10,0
0,0
0,2
0,4
0,7
0,9
1,1
0,0
0,2
0,4
0,7
0,9
39
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
40
20
31/03/2015
ESTIMACION DE LA
DISTRIBUCIONES DE PROBABILIDAD
f(x)
la
41
42
21
31/03/2015
GRFICO q-q
Grafico q-q:
Sea una variable aleatoria con distribucin
acumulada (), el q-quantile de es el valor
talque = = para 0 < < 1.
Cuando () tiene inversa, el quantile es igual a
= 1 ()
43
GRFICO q-q
Sea X una variable aleatoria con distribucin
acumulada F(x), el q-quantile de X es el valor
talque F()=P(X)=q para 0<q<1. Cuando F(x)
tiene inversa, el quantile es igual a =F-1 (q)
Sea {xi, i=1,2,n} una muestra de X. dicha lista
ordenada de menor a mayor origina una
nueva lista {yj, j=1,2,,n} donde y1 y2 yn
el grfico q-q se basa en que yj es una
estimacin de (j-0.5)/n quantile de X.
Mg. Jose Rodrguez L.
44
22
31/03/2015
GRFICO q-q
y1 ~ F-1 ((j-0.5)/n).
Suponga que se esta probando una
distribucin con funcin de probabilidad
acumulada F(X) para presentar los datos en
estudio, si F(X) es de la familia de
distribuciones adecuada; entonces el grfico,
yj vs. F-1 ((j-0.5)/n) ser aproximadamente una
lnea recta.
Mg. Jose Rodrguez L.
45
GRFICO q-q
Considere los datos mostrados a continuacin:
99.79, 100,26, 100.23, 99.55, 99.96, 99.56,
100.41, 100.27, 99.62, 99.60, 100.17, 99.98,
100.02, 99.65, 100.06, 100.33, 99.83, 100.47,
99.82, 99.85.
46
23
31/03/2015
47
Histograma
Usando SW ARENAS imput Analyzer, se obtuvo
el histograma.
48
24
31/03/2015
Histograma
Usando SW ARENAS imput Analyzer, se obtuvo
el histograma.
49
50
25
31/03/2015
51
52
26
31/03/2015
53
54
27
31/03/2015
55
56
28
31/03/2015
57
58
29
31/03/2015
F(yj)
0.80
0.60
Lineal (Grafico
0.40
0.20
0.00
0.00
0.20
0.40
0.60
qj
0.80
1.00
1.20
59
60
30
31/03/2015
Otro criterio.
Es posible tambin detectar si una variable X
tienen una misma distribucin que otra Z.
Para ello se grafican los valores ordenados de
la primera variable vs los valores ordenados
de la segunda variable.
Si el grfico resulta una lnea recta ambas
variables pueden ser representadas con la
misma distribucin.
Mg. Jose Rodrguez L.
61
Si no existe an el sistema o el
proceso de medicin no puede
realizarse por algn motivo,
ser necesario contar con una
distribucin sin contar con los
datos del sistema.
La informacin para ello puede
obtenerse de distintas fuentes,
como ser:
Especificaciones
tcnicas,
generalmente se cuenta con
datos tcnicos de un producto o
proceso, Ej, tiempo medio entre
fallas, velocidad de impresin,
consumo promedio, etc.
62
31
31/03/2015
63
Unidad III
Ajustes a una distribucin de
probabilidad
32