Está en la página 1de 83

UNIVERSIDAD BOLIVARIANA

SEDE LA SERENA
ESCUELA DE INGENIERÍA

UNIDAD III1
SIMULACIÓN DE VARIABLES ALEATORIAS
MODELOS DE SIMULACIÓN
PROFESOR: MARCELO A. GUTIERREZ S.

CONTENIDO

1. Definiciones...................................................................................................... 3
1.1. Introducción ................................................................................................. 3
1.2. Variable aleatoria ......................................................................................... 3
1.2.1. Variables aleatorias discretas ................................................................. 3
1.2.2. Variables aleatorias continuas ................................................................ 4
1.3. Distribución de probabilidad ......................................................................... 5
1.4. Valor esperado ............................................................................................. 6
1.5. Procesos estocásticos .................................................................................. 6
2. Distribuciones de probabilidad ....................................................................... 7
2.1. Distribuciones de probabilidad discretas ...................................................... 7
Distribución Binomial ........................................................................................ 8
Distribución de Poisson .................................................................................. 12
2.2. Distribuciones de probabilidad continuas ................................................... 14
2.3. Elección de una distribución ....................................................................... 16
Distribuciones de probabilidad de ProModel (32) .............................................. 16
Distribuciones de probabilidad Crystal Ball ....................................................... 17
3. Determinación del tipo de distribución de un conjunto de datos............... 20
3.1. Prueba Chi-cuadrado ................................................................................. 20
3.2. Prueba de Kolmogorov-Smirnov (K-S) ....................................................... 25
3.3. Prueba de Anderson-Darling ...................................................................... 29
3.4. Ajuste de datos con Stat::Fit de ProModel ................................................. 33
3.5. Ajuste de distribuciones con Crystal Ball .................................................... 38
Criterios de aceptación................................................................................... 43
4. Generación de variables aleatorias .............................................................. 45
4.1. Método de la transformada inversa ............................................................ 45
4.2. Método de convolución .............................................................................. 57
4.3. Método de composición ............................................................................. 61
4.4. Método de transformación directa .............................................................. 64

1Apunte preparado preferentemente en base a la siguiente referencia bibliográfica:


García, E.; García, H. y Cárdenas, L. (2006). “Simulación y Análisis de Sistemas con ProModel”, México: Pearson
Educación.

1/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Anexo 1. Expresiones comunes de algunos generadores de variables


aleatorias ............................................................................................................ 66
Anexo 2. Fichas Estadísticas de Distribuciones de Probabilidad .................. 68
A.2.1 Distribuciones discretas ........................................................................... 68
A.2.2 Distribuciones continuas .......................................................................... 73

2/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

1. Definiciones

1.1. Introducción

A lo largo de los capítulos anteriores se ha mencionado que un modelo de


simulación permite lograr un mejor entendimiento de prácticamente cualquier
sistema. Para ello resulta indispensable obtener la mayor aproximación a la
realidad, lo cual se consigue modelando los procesos estocásticos en base a
variables aleatorias que interactúen entre sí. ¿Cómo podemos usarlas en el
modelo, una vez que conocemos su distribución de probabilidades asociada? En
esta unidad se comentarán los métodos y herramientas que pueden dar
contestación a estas interrogantes clave para la generación del modelo.

1.2. Variable aleatoria


Podemos decir que las variables aleatorias son aquellas que tienen un
comportamiento probabilístico en la realidad.

Las variables aleatorias se asocian a la ocurrencia de un fenómeno aleatorio y


asumen diferentes valores como consecuencia.

Podemos diferenciar las variables aleatorias de acuerdo con el tipo de valores


aleatorios que representan. Si se permite que una variable aleatoria adopte sólo
un número limitado de valores, se le llama variable aleatoria discreta. Por el
contrario, si se le permite asumir cualquier valor dentro de determinados límites,
recibe el nombre de variable aleatoria continua.

1.2.1. Variables aleatorias discretas

Este tipo de variables deben cumplir con las siguientes reglas de distribución de
probabilidad:

 b
P( x )  0  pi  1
i 0
P  a  x  b    pi  Pa  ...  Pb
i a

Por ejemplo, si habláramos del número de clientes que solicitan cierto servicio en
un período de tiempo determinado, podríamos encontrar valores tales como 0, 1,
2, …, n, es decir, un comportamiento como el que presentan las distribuciones de
probabilidad discretas.

3/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Algunas distribuciones de probabilidad con variable aleatoria discreta son:

 Uniforme discreta  Geométrica


 Poisson  Hipergeométrica
 Binomial  Logarítmica
 Bernoulli

Podemos asociar a estas u otras distribuciones de probabilidad el comportamiento


de una variable aleatoria discreta. Por ejemplo, si nuestro propósito al analizar un
muestreo de calidad consiste en decidir si la pieza bajo inspección es buena o no,
estamos realizando un experimento con dos posibles resultados: la pieza es
buena o la pieza es mala. Este tipo de comportamiento está asociado a una
distribución de Bernoulli.

Por otro lado, si lo que queremos es modelar el número de usuarios que llamarán
a un teléfono de atención a clientes, el tipo de comportamiento puede llegar a
parecerse a una distribución de Poisson.

Incluso podría ocurrir que el comportamiento de la variable no se pareciera a otras


distribuciones de probabilidad conocidas. Si éste fuera el caso, es perfectamente
válido usar una distribución empírica que se ajuste a las condiciones reales de
probabilidad. Esta distribución puede ser una ecuación o una suma de términos
que cumplan con las condiciones necesarias para ser consideradas una
distribución de probabilidad.

Incluso podría ocurrir que el comportamiento de la variable no se pareciera a otras


distribuciones de probabilidad conocidas. Si éste fuera el caso, es perfectamente
válido usar una distribución empírica que se ajuste a las condiciones reales de
probabilidad. Esta distribución puede ser una ecuación o una suma de términos
que cumplan con las condiciones necesarias para ser consideradas una
distribución de probabilidad.

1.2.2. Variables aleatorias continuas

Este tipo de variables se representan mediante una ecuación que se conoce como
función de densidad de probabilidad f(x). Dada esta condición, cambiamos el uso
de la sumatoria por la de una integral para conocer la función acumulada de la
variable aleatoria F(x). Por lo tanto, las variables aleatorias continuas deben
cumplir con las siguientes reglas de distribución de probabilidad:

 b

P( x )  0 P( x  a )  0  f ( x)  1 P  a  x  b   P  a  x  b    f ( x) dx
 a

4/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Entre las distribuciones de probabilidad con variable aleatoria continua se


encuentran:

 Uniforme continua  Erlang


 Exponencial  Triangular
 Normal  Beta
 Weibull  Extreme value
 Chi-cuadrado  Gamma

Al igual que en el caso de las distribuciones discretas, algunos procesos pueden


ser asociados a variables aleatorias continuas.

Por ejemplo, es posible que el tiempo que media entre las llegadas de cada cliente
a un sistema tenga una distribución de probabilidad muy semejante a una
exponencial, o que el tiempo que le toma a un operario realizar una serie de
tareas se comporte de manera muy similar a la dispersión que presenta una
distribución normal.

Si habláramos del tiempo que tarda en ser atendida una persona, nuestra
investigación tal vez arrojaría resultados como 1,54 minutos, 0,028 horas o 1,37
días, es decir, un comportamiento como el que presentan las distribuciones de
probabilidad continuas.

Sin embargo, se debe hacer notar que este tipo de distribuciones tienen sus
desventajas, dado que el rango de valores posibles implica que existe la
posibilidad de tener tiempos infinitos de llegada de clientes o tiempos de ensamble
infinitos, situaciones lejanas a la realidad. Por fortuna, es muy poco probable que
se presenten este tipo de eventos, aunque el analista de la simulación debe estar
consciente de cómo pueden impactar valores como los descritos en los resultados
del modelo. En las siguientes secciones revisaremos algunas herramientas útiles
para lograr ese objetivo.

1.3. Distribución de probabilidad

La podemos concebir como una distribución teórica de frecuencia, es decir, es una


distribución que describe como se espera que varíen los resultados de una
variable aleatoria.

Cuando una de estas variables aleatorias toma diversos valores, la probabilidad


asociada a cada uno de tales valores puede ser organizada como una
distribución de probabilidad, la cual es la distribución de las probabilidades
asociadas a cada uno de los valores de la variable aleatoria.

5/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Las distribuciones de probabilidad pueden representarse a través de una tabla,


una gráfica o una fórmula, en el caso de tener una fórmula la regla de
correspondencia se le denomina función de probabilidad.

Dado que esta clase de distribuciones se ocupan de las expectativas, son modelos
de gran utilidad para hacer inferencias y tomar decisiones en condiciones de
incertidumbre.

1.4. Valor esperado


El valor esperado de la distribución de probabilidad de una variable aleatoria es la
media de la misma, la cual a su vez estima la verdadera media de la población.

Este concepto se aplica en situaciones donde se toman decisiones en condiciones


de incertidumbre. Para obtener el valor esperado de una variable aleatoria
discreta, se multiplica cada valor que ésta puede asumir por la probabilidad de
ocurrencia de ese valor y luego se suman los productos. Es un promedio
ponderado de los resultados que se esperan en el futuro:
n
Valor esperado =  fi  xi
i 1

1.5. Procesos estocásticos


En estadística y teoría de probabilidades un proceso estocástico (o probabilístico)
es un concepto matemático que sirve para caracterizar y estudiar todo tipo
fenómenos aleatorios que evolucionan, generalmente, con el tiempo.

Un proceso estocástico es una sucesión de variables aleatorias indexadas por una


variable (continua o discreta), generalmente, el tiempo. Cada una de las variables
aleatorias del proceso tiene su propia función de distribución de probabilidad y,
entre ellas, pueden estar correlacionadas o no.

Cada variable o conjunto de variables sometidas a influencias o impactos


aleatorios constituye un proceso estocástico.

Siempre que estudiamos el comportamiento de una variable aleatoria a lo largo del


tiempo, estamos ante un proceso estocástico. En general, trabajamos con
procesos estocásticos en cualquier caso en que intentamos ajustar un modelo
teórico que nos permita hacer predicciones sobre el comportamiento futuro de un
proceso.

Dicho de otra manera, cualquier proceso en el que se involucren probabilidades es


un proceso estocástico.

6/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Un ejemplo de proceso estocástico es el número de clientes que llegan cada hora


a un banco lo que depende del momento del día, del día de la semana y de otros
factores: por lo general, la afluencia de clientes será mayor al mediodía que muy
temprano por la mañana; la demanda será más alta el viernes que el miércoles;
habrá más clientes un día de pago que un día normal, etc.

2. Distribuciones de probabilidad

Recordemos que los resultados de una variable aleatoria discreta se pueden


describir con una distribución de probabilidad discreta.

Por su parte, los resultados de una variable aleatoria continua se pueden describir
con una función de probabilidad continua.

Hay que hacer notar que las reglas de distribución de probabilidad se enuncian
suponiendo que conocemos el valor de la probabilidad, pero en la realidad ésto no
ocurre, es decir, que no sabemos la probabilidad y lo que se hace es trabajar con
estimaciones. Precisamente esto nos lleva a modelos teóricos que estiman los
resultados,

A continuación, se describirán ejemplos de procesos estocásticos y las


distribuciones de probabilidad con que se pueden modelar.

2.1. Distribuciones de probabilidad discretas

Entre las distribuciones de probabilidad de variable discreta más importantes se


encuentran las siguientes:

 Uniforme discreta  de Bernoulli


 Binomial  Geométrica
 Binomial negativa  Hipergeométrica
 de Poisson  Rademacher

 Uniforme discreta. Es la distribución donde todos los eventos elementales


tienen la misma probabilidad. Por ejemplo: tirar un dado, donde la función
P(X=k)=1/6 para valores de k = 1, 2, 3, 4, 5, 6. La función de Excel que
proporciona sus valores es: = aleatorio.entre (a, b)2

2 Para valores continuos de la distribución uniforme U(a, b) se utiliza la expresión a + r (b-a)

7/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

 Binomial. Es la que maneja la distribución de la probabilidad de obtener cierta


cantidad de éxitos al realizar una cantidad de experimentos con probabilidad
de éxito constante y con ensayos independientes. La función de Excel que
proporciona sus valores es: = DISTR.BINOM (núm_éxitos; ensayos;
prob_éxito; acumulado)

 Geométrica. Es la distribución de la probabilidad de realizar cierto número de


experimentos antes de obtener un éxito.

 Hipergeométrica. Es similar a la binomial, pero con un tamaño de muestra


grande en relación al tamaño de la población. La función de Excel que
proporciona sus valores es: = HIPERGEOM (muestra_éxito;
tamaño_de_muestra; población_éxito; tamaño_de_población)

 De Poisson. Es la distribución de la probabilidad de que ocurra un evento raro


en un periodo de tiempo, un espacio o un lugar. La función de Excel que da los
valores de la distribución es: = POISSON (x; media; acumulado)

Distribución Binomial

Consideremos una clase de experimentos que satisface las siguientes


condiciones:

1. El experimento consiste de una secuencia de n ensayos idénticos.


2. Son posibles únicamente dos resultados en cada ensayo mutuamente
excluyentes, a los que se denominarán éxito y fracaso.3
3. Las probabilidades de los dos resultados no cambian de un ensayo al
siguiente.
4. Los ensayos son independientes (es decir, el resultado de un ensayo no
afecta al resultado de cualquier otro ensayo).

Los experimentos que satisfacen las condiciones 2, 3 y 4 son generados por un


proceso llamado de Bernoulli. Por ejemplo, los siguientes son ensayos Bernoulli:

 Un tornillo, puede estar defectuoso o no defectuoso.


 El sexo de un bebé al nacer: niño o niña.
 La respuesta correcta o incorrecta en un examen.

Además, si se satisface la condición 1 (hay 𝑛 ensayos idénticos), tenemos un


experimento binomial. La cantidad de éxitos que pueden producirse en un
número cualquiera de ensayos es una importante variable aleatoria discreta
asociada con el experimento binomial. Si suponemos que 𝑥 denota el valor de esta
3 A cuál resultado se le denomina “éxito” y a cuál “fracaso” es cuestión de comodidad y no afecta en lo más mínimo la
resolución del problema

8/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

variable aleatoria, entonces 𝑥 puede tener un valor de 0, 1, 2, 3, … , 𝑛 dependiendo


del número de éxitos observados en los 𝑛 ensayos.

En el denominado experimento binomial, el número de ensayos se denota con 𝑛,


la probabilidad de éxito con 𝑝 y la de fracaso con 𝑞, donde 𝑝 + 𝑞 = 1.

La distribución de probabilidad asociada con esta variable aleatoria se conoce


como distribución de probabilidad binomial.

𝑛
𝑝(𝑥) = ( ) 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 𝑥 = 0, 1, 2, … , 𝑛
𝑥
donde:
𝑥 = cantidad de éxitos en 𝑛 ensayos
𝑝(𝑥) = probabilidad de 𝑥 éxitos en 𝑛 ensayos
𝑛 = número total de ensayos
𝑝 = probabilidad de éxito en un ensayo

Ejemplo 1: Distribución Binomial

¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces?

x es el número de éxitos o aciertos (salga "cara" al lanzar la moneda).


En este ejemplo x es igual a 6 (en cada acierto decíamos que la variable toma el
valor 1: como son 6 aciertos, entonces x=6).

n es el número de ensayos.
En nuestro ejemplo son 10 lanzamientos de la moneda.

p es la probabilidad de éxito, es decir, que salga "cara" al lanzar la moneda.


Por lo tanto p = 0,5.

Luego, la probabilidad sería:


10
𝑝(𝑥 = 6) = ( ) 0,56 (1 − 0,5)10−6 = 0,20508
6
Es decir, se tiene una probabilidad del 20,508% de obtener 6 caras al lanzar 10
veces una moneda.

Cálculo en Excel:

DISTR.BINOM (núm_éxito; ensayos; prob_éxito; acumulado)

= DISTR.BINOM (6; 10; 0,5; FALSO)

9/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Nótese que la primera parte de la fórmula corresponde a la combinatoria de 𝑛


sobre 𝑥:
𝑛 𝑛!
( )=
𝑥 𝑥! (𝑛 − 𝑥)!
Así, si en el software no se dispone de la función binomial, este cálculo se puede
realizar alternativamente como:

= COMBINAT(10; 6) * 0,5^6 * (1-0,5)^(10-6)

Cálculo en Excel para los 10 eventos posibles del número de éxitos x.

n= 10
p= 0,5
Distribución Binomial BI(N=10, p=0,5)
Nº Éxitos x B(x; n; p)
0 0,00098 0,30
1 0,00977
2 0,04395
0,20
3 0,11719
p(x)

4 0,20508
0,10
5 0,24609
6 0,20508
0,00
7 0,11719
0 1 2 3 4 5 6 7 8 9 10
8 0,04395
Nº éxitos
9 0,00977
10 0,00098
1,00000

Se comprueba en la tabla anterior el cumplimiento de:


∑ 𝑝𝑖 = 1
𝑖=0

10/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Ejemplo 2: ¿Cuál es la probabilidad de obtener cuatro veces el número 3 al lanzar


un dado ocho veces?

x (número de aciertos) toma el valor 4


n toma el valor 8
p (probabilidad de que salga un 3 al tirar el dado) es 1/6 = 0,1666

Luego, la probabilidad sería:


8
𝑝(𝑥 = 4) = ( ) 0,16666 (1 − 0,1666)8−4 = 0,02604
4
En Excel: = DISTR.BINOM (4; 8; 0,16666; FALSO)

Es decir, se tiene una probabilidad del 2,604% de obtener cuatro veces el número
3 al tirar un dado 8 veces.

Ejemplo 3: Al inspeccionar lotes de tamaño n = 5, la probabilidad de que una


pieza sea defectuosa es p = 3%. Calcular la probabilidad que en el proceso de
inspección por lote salga un número de piezas defectuosas k = 0, 1, 2, 3, 4, 5

n= 5 número de ensayos
p= 3% probabilidad de éxito

Nº Éxitos x B(x, n, p)

0 0,85873
1 0,13279
2 0,00821
3 0,00025
4 0,00000
5 0,00000
1,00000

De la tabla anterior se desprende, por ejemplo, que la probabilidad de que no


salga ninguna pieza defectuosa al inspeccionar un lote de tamaño n = 5 es de
85,873%.

11/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución de Poisson

Esta distribución describe el comportamiento de una variable aleatoria discreta


que frecuentemente es útil cuando tratamos con la cantidad de ocurrencias de un
evento a lo largo de un intervalo de tiempo o espacio especificados. Por ejemplo,
la variable aleatoria de interés podría ser la cantidad de llegadas a un lavado de
automóviles en una hora, el número de reparaciones necesarias en 10 kilómetros
de autopista, o la cantidad de fugas en 100 kilómetros de oleoducto.

Si se satisfacen las siguientes dos suposiciones, es aplicable la distribución de


probabilidad de Poisson.

1. La probabilidad de una ocurrencia del evento es la misma para cualesquier


intervalo de igual longitud
2. La ocurrencia o no ocurrencia del evento en cualquier intervalo es
independiente de la ocurrencia o no ocurrencia en cualquier otro intervalo

La función de distribución de probabilidad de la variable aleatoria de Poisson está


dada por la ecuación:
 x e 
p ( x)  x  0,1, 2,...
x!
donde:
𝜆 = media o cantidad promedio de ocurrencia del evento en un intervalo
𝑥 = cantidad de ocurrencias del evento en el intervalo
𝑝(𝑥 ) = probabilidad de 𝑥 ocurrencias en el intervalo

12/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Ejemplo: Se desea determinar la probabilidad de que se produzcan 𝑥 llegadas de


clientes a un banco durante media hora. Se sabe que los clientes llegan a un tasa
promedio de  = 6 clientes por hora. Para aplicar la fórmula hay que ajustar  al
período de tiempo bajo estudio, esto es, se espera una llegada promedio de:  = 3
clientes en media hora.

x p(x)
0 0,04979
Poisson(3)
1 0,14936
2 0,22404 0,25
3 0,22404 0,20
4 0,16803
0,15
5 0,10082
0,10
6 0,05041
7 0,02160 0,05
8 0,00810 0,00
9 0,00270 0 1 2 3 4 5 6 7 8 9 10 > 10

10 0,00081
> 10 0,00029
Total 1,00000

13/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

2.2. Distribuciones de probabilidad continuas

Entre las distribuciones de probabilidad de variable continua más importantes se


encuentran las siguientes:

 Uniforme continua  Erlang  F


 Exponencial  Triangular  T de Student
 Normal  Beta 
 Weibull  Extreme value 
 Chi-cuadrado  Gamma 

Al igual que en el caso de las distribuciones discretas, algunos procesos pueden


ser asociados a ciertas distribuciones continuas.

Por ejemplo, es posible que el tiempo que media entre las llegadas de cada cliente
a un sistema tenga una distribución de probabilidad muy semejante a una
exponencial, o que el tiempo que le toma a un operario realizar una serie de
tareas se comporte de manera muy similar a la dispersión que presenta una
distribución normal.

Sin embargo, se debe hacer notar que este tipo de distribuciones tienen sus
desventajas, dado que el rango de valores posibles implica que existe la
posibilidad de tener tiempos infinitos de llegada de clientes o tiempos de ensamble
infinitos, situaciones lejanas a la realidad. Por fortuna, es muy poco probable que
se presenten este tipo de eventos, aunque el analista de la simulación debe estar
consciente de cómo pueden impactar valores como los descritos en los resultados
del modelo. En las siguientes secciones revisaremos algunas herramientas útiles
para lograr ese objetivo.

14/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Ejemplo Distribución de Weibull



 x  
 
f  x       x   
 1   
Función de densidad de probabilidad: e
 = parámetro de localización = 0 (valor mínimo)
 = parámetro de escala = 5
 = parámetro de forma = 3

x Weibull(x, 3, 5) = DIST.WEIBULL(x; 3; 5; FALSO)


0,0 0,0000000
0,5 0,0059940
1,0 0,0238088
1,5 0,0525615 Distribución de Weibull (0, 3, 5)
2,0 0,0900485
2,5 0,1323745 0,3
3,0 0,1740388
3,5 0,2086336
0,2
4,0 0,2301296
4,5 0,2344421
0,2
5,0 0,2207277
5,5 0,1918186
6,0 0,1534804 0,1

6,5 0,1126920
7,0 0,0756316 0,1
7,5 0,0461945
8,0 0,0255577 0,0
8,5 0,0127456 0,0 2,0 4,0 6,0 8,0 10,0 12,0
9,0 0,0057002
9,5 0,0022742
10,0 0,0008051
10,5 0,0002515
11,0 0,0000690
11,5 0,0000165
12,0 0,0000034

15/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

2.3. Elección de una distribución

Seleccionar una distribución de probabilidad para modelar un proceso estocástico


es uno de los pasos más desafiantes al crear un modelo de simulación.

El primer paso para seleccionar una distribución de probabilidad es utilizar los


datos disponibles para la variable, realizando un análisis de frecuencia de los
datos y un histograma para ver la forma de la distribución de probabilidad.

Si no existiesen datos, hay que usar los conocimientos de la física e Ingeniería,


haciendo analogías con otros procesos similares o las condiciones de la variable
para ayudar a seleccionar una distribución. Finalmente, se aplican límites
razonables a una distribución simple.

La elección de una distribución de probabilidad teórica que se ajuste a los datos es


esencialmente una hipótesis, la cual se debe probar estadísticamente (ver punto
3).

En los puntos 3.4 y 3.5 de más adelante se analiza cómo determinar el tipo de
distribución de un conjunto de datos utilizando los software ProModel y Crystal
Ball, respectivamente

Distribuciones de probabilidad de ProModel (32)

Beta Extreme Value IB Laplace Pearson 5


Binomial Gamma Logarithmic Pearson 6
Cauchy Geometric Logistic Poisson
Chi Squared Hypergeometric Log-Logistic Power Function
Discrete Uniform Inverse Gaussian Lognormal Rayleigh
Erlang Inverse Weibull Negative Binomial Triangular
Exponential Johnson SB Normal Uniform
Extreme Value IA Johnson SU Pareto Weibull

16/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribuciones de probabilidad Crystal Ball

Crystal Ball cuenta con varias distribuciones continuas y discretas que se pueden
utilizar para describir un supuesto (Asumption), incluida una distribución
personalizada (Custom), que puede ser una combinación de rangos continuos y
discretos.
 Una distribución de probabilidad continua supone que todos los valores en el
rango son posibles, por lo tanto, cualquier rango contiene un número infinito de
valores posibles. Estas distribuciones son curvas sólidas y suaves.
 Una distribución de probabilidad discreta describe valores distintivos, finitos y
comúnmente enteros. Estas distribuciones aparecen como columnas de
diferentes alturas ubicadas una al lado de la otra.

A continuación se presenta una tabla con las distribuciones disponibles en Crystal


Ball, con una descripción de las aplicaciones de cada una y ejemplos de uso.

Lista de Distribuciones de Probabilidad de Crystal Ball

17/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Lista de Distribuciones de Crystal Ball (continuación)

18/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Lista de Distribuciones de Crystal Ball (continuación)

19/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

3. Determinación del tipo de distribución de un conjunto de datos

La distribución de probabilidad de los datos históricos puede determinarse


mediante las pruebas Chi-cuadrado, de Kolmogorov-Smirnov y de Anderson-
Darling. En esta sección se revisarán los procedimientos de cada una de estas
pruebas, así como la forma de realizarlas a través de Stat::Fit, una herramienta
complementaria del software ProModel.

3.1. Prueba Chi-cuadrado

Se trata de una prueba de hipótesis a partir de datos, basada en el cálculo de un


valor llamado estadístico de prueba, al cual suele comparársele con un valor
conocido como valor crítico  2 , , el que se obtiene generalmente de tablas
estadísticas, o utilizando la función de Excel: PRUEBA.CHI.INV (alfa; m-k-1).

El procedimiento general de la prueba es:

1. Obtener al menos 30 datos de la variable aleatoria a analizar.


2. Calcular la media y varianza de los datos.
3. Crear un histograma de m  n intervalos y obtener la frecuencia observada en
cada intervalo FOi.
4. Establecer explícitamente la hipótesis nula H0, proponiendo una distribución de
probabilidad que se ajuste a la forma del histograma.
5. Calcular la frecuencia esperada, FEi, a partir de la función de probabilidad
propuesta.
6. Calcular el estadístico de prueba C a través de la siguiente expresión:

 FEi  FOi 
2
m
C
i 1 FEi

7. Definir el nivel de significancia de la prueba, , y determinar el valor crítico de


la prueba  2 , mk 1 (k es el número de parámetros estimados en la distribución
propuesta).
8. Comparar el estadístico de prueba C con el valor crítico  2 , mk 1 . Si el
estadístico de prueba es menor que el valor crítico, no se puede rechazar la
hipótesis nula H0.

20/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Ejemplo:
En la tabla siguiente se presentan los datos del número de automóviles que entran
a una gasolinera cada hora:

14 13 13 20 12
7 15 20 10 14
13 10 8 18 20
16 15 17 15 15
16 16 19 13 10
13 14 11 16 13
14 12 12 24 21
17 17 17 18 23
15 14 9 16 15
16 12 18 18 18

Determinar la distribución de probabilidad con un nivel de significancia  = 5%.

El histograma de los n = 50 datos, considerando m = 11 intervalos, para analizar


su comportamiento probabilístico, la media muestral de 𝑥̅ = 15,04 y la varianza
muestral de 𝑠 2 = 13,14, permiten establecer la siguientes hipótesis 4:

Hipótesis nula H0: Poisson (=15 automóviles/hora).


Hipótesis alternativa H1: Otra distribución

Histograma

12
10
Frecuencia

8
6
4
2
0
> 25
0-7

8-9

10 - 11

12 - 13

14 - 15

16 - 17

18 - 19

20 - 21

22 - 23

24 - 25

Automóviles/hora

Comenzamos por calcular la probabilidad teórica de cada intervalo a partir de la


distribución de probabilidad de Poisson:

 x e  15x e15
p ( x)   x  0,1, 2,...
x! x!

4 La media y la varianza de una distribución de Poisson son iguales a .

21/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Para el primer intervalo hay que usar la distribución de probabilidad de Poisson


acumulada:

7
P  0  x  7    pi  P0  ...  P7  0, 0180
i 0

Cálculo en Excel = POISSON (7; 15; VERDADERO)

Para calcular la probabilidad, por ejemplo, para el intervalo 8-9, aplicando la


b
propiedad de las variables aleatorias discretas P  a  x  b    pi  Pa  ...  Pb , se
i a
obtiene:

158 e15 159 e15


P  x  8, 9     0, 0519
8! 9!
Cálculo en Excel = POISSON (8; 15; FALSO) + POISSON (9; 15; FALSO)

Para el último intervalo se calcula el complemento de la distribución de


probabilidad de Poisson acumulada hasta x = 25:

25
P( x  25)  1   pi  1   P0  ...  P25   0, 0062
i 0
Cálculo en Excel = 1 - POISSON (25; 15; VERDADERO)

Enseguida calculamos la frecuencia esperada en cada intervalo, multiplicando la


probabilidad p(x) de cada intervalo por el total de datos de la muestra, n=50:

FEi  n  p( xi )

22/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

A partir de los cálculos anteriores se obtiene la tabla siguiente:

 FEi  FOi 
2

Intervalo FOi p ( x) FEi  n  p( x)


FEi

0 7 1 0,0180 0,9001 0,0111


8 9 2 0,0519 2,5926 0,1354
10 11 4 0,1149 5,7449 0,5300
12 13 10 0,1785 8,9233 0,1299
14 15 11 0,2049 10,2436 0,0559
16 17 10 0,1808 9,0385 0,1023
18 19 6 0,1264 6,3180 0,0160
20 21 4 0,0717 3,5837 0,0483
22 23 1 0,0336 1,6821 0,2766
24 25 1 0,0133 0,6640 0,1700
> 25 0 0,0062 0,3092 0,3092
50 1,0000 50,0000 1,7848

C = 1,7848
 2 , mk 1   25%,1101  18,307 Cálculo en Excel, PRUEBA.CHI.INV(alfa; m-0-1)

El valor del estadístico de prueba, C = 1,7848 <  25%,1101  18,307 , lo que indica que
no podemos rechazar la hipótesis de que la variable aleatoria se comporta de
acuerdo con una distribución de Poisson, con una media de =15
automóviles/hora.

23/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Ajuste con Stat::Fit de ProModel

Auto::Fit of Distributions

distribution rank acceptance

Binomial(104, 0.145) 100 do not reject


Poisson(15.) 96.8 do not reject

24/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

3.2. Prueba de Kolmogorov-Smirnov (K-S)

Desarrollada en la década de los treinta del siglo XX, esta prueba permite –al igual
que la prueba Chi-cuadrado– determinar la distribución de probabilidad de una
serie de datos. Una limitante de la prueba K-S estriba en que solamente se puede
aplicar al análisis de variables continuas.

El procedimiento general de la prueba es:

1. Obtener al menos 30 datos de la variable aleatoria a analizar.


2. Calcular la media y varianza de los datos.
3. Crear un histograma de m  n intervalos y obtener la frecuencia observada en
cada intervalo FOi.
FOi
4. Calcular la probabilidad observada en cada intervalo POi  , esto es, dividir
n
la frecuencia observada FOi por el número total de datos n.
5. Acumular las probabilidades POi para obtener la probabilidad observada hasta
el i-ésimo intervalo, POAi.
6. Establecer explícitamente la hipótesis nula, proponiendo una distribución de
probabilidad que se ajuste a la forma del histograma.
7. Calcular la probabilidad esperada acumulada para cada intervalo, PEAi, a partir
de la función de probabilidad propuesta.
8. Calcular el estadístico de prueba C:
C  máx PEAi  POAi i  1, 2,3,..., k ,..., m
9. Definir el nivel de significancia  y determinar el valor crítico de la prueba, D , n
que se obtiene de la tabla de valores críticos de la prueba K-S.
10. Comparar el estadístico de prueba C con el valor crítico D , n . Si C  D , n , no
se puede rechazar la hipótesis nula H0. A su vez, el valor de D , n depende del
tipo de distribución a probar y se encuentra tabulado. En general es de la
c
forma: D , n  donde cα y k(n) se encuentran en las tablas siguientes:
k ( n)

25/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Ejemplo:
En la tabla siguiente se presenta un estudio del tiempo entre roturas de cierto
filamento, medido en minutos/rotura:

4,33 9,97 2,81 4,34 1,36


1,61 7,86 14,39 1,76 3,53
2,16 5,49 3,44 2,30 6,58
2,88 0,98 9,92 5,24 1,45
0,70 4,52 4,38 11,65 8,42
0,44 2,12 8,04 10,92 3,69
1,59 4,44 2,18 12,16 2,44
2,15 0,82 6,19 6,60 0,28
8,59 6,96 4,48 0,85 1,90
7,36 3,04 9,66 4,82 2,89

Determinar la distribución de probabilidad con un nivel de significancia  = 5%.

El histograma de los n = 50 datos, considerando m = 8 intervalos, la media


muestral de 4,7336 y la varianza muestral de 12,1991, permiten estimar un
parámetro de forma de 1,38 y un parámetro de escala de 5,19 y establecer la
siguientes hipótesis:

26/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Hipótesis nula H0: Weibull (=1,38, =5,19 minutos/rotura).


Hipótesis alternativa H1: Otra distribución

Histograma

14
12
Feecuencia

10
8
6
4
2
0
0-2 2-4 4-6 6-8 8 - 10 10 - 12 12 - 14 >14

Minutos/rotura

Luego calculamos la probabilidad acumulada esperada PEAi de cada intervalo, a


partir de la función de probabilidad acumulada de Weibull:

x
 
 
f ( x)     x 1 e

 
x x x
   
F ( x)      x 1 e  
dx  1  e  

0
1,38
 x 
 
F ( x)  1  e  5,19 

Por ejemplo, para el intervalo con el límite superior de 8 se tiene:

1,38
 8 
 
PEA8  PE  x  8  F (8)  1  e  5,19 
 0,83747
Cálculo en Excel = DIST.WEIBULL (8; 1,38; 5,19; VERDADERO)

27/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

A partir de estos cálculos se obtiene la siguiente tabla:

media = 4,7336  = 1,38 parámetro de forma


varianza = 12,1991 = 5,19 parámetro de escala

Intervalo FOi POi POAi PEAi PEAi  POAi

0 2 12 0,24 0,24 0,23526 0,0047


2 4 13 0,26 0,50 0,50247 0,0025
4 6 9 0,18 0,68 0,70523 0,0252
6 8 6 0,12 0,80 0,83747 0,0375
8 10 6 0,12 0,92 0,91559 0,0044
10 12 2 0,04 0,96 0,95839 0,0016
12 14 1 0,02 0,98 0,98042 0,0004
> 14 1 0,02 1,00 1,00000 0,0000
50 1,00 C = máx 0,0375

A continuación se determina el valor crítico D ,n :


c 0,856
D ,n    0,12106
k ( n) 50
El valor del estadístico de prueba C=0,0375 es menor que el valor crítico
D5%, 50  0,12106 , lo cual indica que no podemos rechazar la hipótesis de que la
variable aleatoria se comporta de acuerdo con una distribución de Weibull con
parámetro de escala 5,19 y parámetro de forma 1,38.

28/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

3.3. Prueba de Anderson-Darling

Dada a conocer en 1954, esta prueba tiene como propósito corroborar si una
muestra de variables aleatorias proviene de una población con una distribución de
probabilidad específica. En realidad se trata de una modificación de la prueba de
Kolmogorov-Smirnov, aunque tiene la virtud de detectar las discrepancias en los
extremos de las distribuciones.

La principal desventaja de la prueba de Anderson-Darling estriba en que es


necesario calcular los valores críticos para cada distribución. La prueba es muy
sensible en los extremos de la distribución, por lo que debe ser usada con mucho
cuidado en distribuciones con límite inferior acotado, y no es confiable para
distribuciones de tipo discreto.

Actualmente es posible encontrar tablas de valores críticos para las distribuciones


normal, lognormal, exponencial, log-logística, de Weibull y valor extremo tipo I.

El procedimiento general de la prueba es:

1. Obtener al menos 30 datos de la variable aleatoria a analizar.


2. Calcular la media y varianza de los datos.
3. Organizar los datos en forma ascendente: Yi i  1, 2,..., n
4. Organizar los datos en forma descendente Yn1i i  1, 2,..., n
5. Establecer explícitamente la hipótesis nula, proponiendo una distribución de
probabilidad que se ajuste a la forma del histograma.
6. Calcular la probabilidad esperada acumulada para cada número Yi , PEA(Yi ) , y
la probabilidad esperada acumulada para cada número, PEA(Yn1i ) , a partir de
la función de probabilidad propuesta.
7. Calcular el estadístico de prueba:
 1 n 
An2    n    2 i  1 ln PEA(Yi )  ln 1  PEA(Yn1i )   
 n i 1 
8. Ajustar el estadístico de prueba de acuerdo con la distribución de probabilidad
propuesta.
9. Definir el nivel de significancia  de la prueba, y determinar su valor crítico,
a , n de acuerdo a la tabla de ajuste de más adelante.
10. Comparar el estadístico de prueba con el valor crítico. Si el estadístico de
prueba es menor que el valor crítico, no se puede rechazar la hipótesis nula H0.

29/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Tabla de ajuste de valores críticos a , n para la prueba Anderson-Darling


Estadístico de Valores críticos de 
Distribución
prueba ajustado 0,1 0,05 0,025 0,001
Parámetros
An2 1,933 2,492 3,070 3,857
conocidos  5
 4 25 
Normal An2 1   2  0,632 0,751 0,870 1,029
 n n 
 3 
Exponencial An2 1   1,070 1,326 1,587 1,943
 5n 
 3 
De Weibull An2 1   0,637 0,757 0,877 1,038
 5 n
 3 
Log-logística An2 1   0,563 0,660 0,769 0,906
 4 n

Ejemplo
Los siguientes son los datos de un estudio del tiempo de atención a los clientes en
una florería, medido en minutos/cliente:

5,63282 8,97359 9,82943


5,76414 9,19190 9,83097
5,76414 9,25952 9,93504
6,95686 9,26901 10,05620
7,11163 9,27425 10,26970
7,11163 9,34602 12,19000
7,82660 9,34602 12,68530
8,30552 9,39954 13,32290
8,61959 9,53164 13,46630
8,86415 9,62768 13,46630

Determinar la distribución de probabilidad con un nivel de significancia  = 5%.


Histograma

14
12
Frecuencia

10
8
6
4
2
0
>14
10 - 11

11 - 12

12 - 13

13 - 14
9 - 10
0-6

6-7

7-8

8-9

Minutos/cliente

30/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Intervalo FOi
0 6 3
6 7 1
7 8 3
8 9 4
9 10 12
10 11 2
11 12 0
12 13 2
13 14 3
> 14 0
30

El histograma de los n = 30 datos, considerando m = 10 intervalos la media


muestral de 9,3409 y la desviación estándar muestral de 2,1235 permiten
establecer las siguientes hipótesis:

Hipótesis nula H0: Normal ( = 10,  = 2 minutos/ cliente).


Hipótesis alternativa H1: Otra distribución

i Yi Y30  1  i PEA(Yi ) PEA(Yn  1  i ) *

1 5,63282 13,46630 0,014496 0,95847 -7,4151


2 5,76414 13,46630 0,017090 0,95847 -21,7514
3 5,76414 13,32290 0,017090 0,95169 -35,4966
4 6,95686 12,68530 0,064058 0,91031 -36,1153
5 7,11163 12,19000 0,074343 0,86324 -41,2974
6 7,11163 10,26970 0,074343 0,55363 -37,4624
7 7,82660 10,05620 0,138585 0,51121 -34,9972
8 8,30552 9,93504 0,198431 0,48704 -34,2732
9 8,61959 9,83097 0,245033 0,46632 -34,5836
10 8,86415 9,82943 0,285043 0,46602 -35,7676
11 8,97359 9,62768 0,303904 0,42616 -36,6754
12 9,19190 9,53164 0,343088 0,40742 -36,6400
13 9,25952 9,39954 0,355602 0,38200 -37,8803
14 9,26901 9,34602 0,357371 0,37184 -40,3363
15 9,27425 9,34602 0,358349 0,37184 -43,2449
16 9,34602 9,27425 0,371838 0,35835 -44,4233
17 9,34602 9,26901 0,371838 0,35737 -47,2390
18 9,39954 9,25952 0,382001 0,35560 -49,0620
19 9,53164 9,19190 0,407423 0,34309 -48,7700
20 9,62768 8,97359 0,426160 0,30390 -47,3931
21 9,82943 8,86415 0,466017 0,28504 -45,0617
22 9,83097 8,61959 0,466323 0,24503 -44,8901

31/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

i Yi Y30  1  i PEA(Yi ) PEA(Yn  1  i ) *

23 9,93504 8,30552 0,487045 0,19843 -42,3263


24 10,05620 7,82660 0,511209 0,13858 -38,5473
25 10,26970 7,11163 0,553635 0,07434 -32,7566
26 12,19000 7,11163 0,863242 0,07434 -11,4399
27 12,68530 6,95686 0,910307 0,06406 -8,4893
28 13,32290 5,76414 0,951688 0,01709 -3,6716
29 13,46630 5,76414 0,958465 0,01709 -3,4006
30 13,46630 5,63282 0,958465 0,01450 -3,3644
Total -984,7721

 *   2 i  1 ln PEA(Yi )  ln 1  PEA(Yn1i )   -984,7721

 1   1 
An2    n   *   30   -984,7721  2,825735
 n   30 
Una vez calculado el estadístico de prueba An2 es necesario ajustarlo de acuerdo
con la tabla. En este caso, como tenemos n  5 no se requiere ajuste.

Finalmente, al comparar el estadístico de prueba An2  2,825735 con el valor crítico


de la prueba a5%, 30  2, 492 (ver tabla), se concluye que se rechaza la hipótesis
nula H0.

Replanteando una nueva hipótesis:

Hipótesis nula H0: Normal ( = 9,604,  = 2 minutos/ cliente).


Hipótesis alternativa H1: Otra distribución

Desarrollando una tabla de cálculo análoga a la anterior, se obtiene:

 *   2 i  1 ln PEA(Yi )  ln 1  PEA(Yn1i )   -940,5462

 1   1 
An2    n   *   30   -940,5462   1,351539
 n   30 
Ahora el estadístico de prueba An  1,351539 es menor que el valor crítico de la
2

prueba a5%, 30  2, 492 (ver tabla), por lo cual se concluye que esta vez no se puede
rechazar la hipótesis nula H0.

32/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

3.4. Ajuste de datos con Stat::Fit de ProModel


La herramienta Stat::Fit de ProModel se utiliza para analizar y determinar el tipo de
distribución de probabilidad de un conjunto de datos. Esta utilería permite
comparar los resultados entre varias distribuciones analizadas mediante una
calificación.

Entre sus procedimientos emplea las pruebas Chi-cuadrado, de Kolmogorov-


Smirnov y de Anderson-Darling. Además calcula los parámetros adecuados para
cada tipo de distribución, e incluye información estadística adicional como media,
moda, valor mínimo, valor máximo y varianza, entre otros datos.

Stat::Fit se puede ejecutar desde la pantalla de inicio de ProModel, o bien desde el


comando Stat::Fit del menú Tools.

Pantalla de inicio
de ProModel

Una vez que comience a ejecutarse el comando Stat::Fit, haga clic en el ícono de
la hoja en blanco de la barra de herramientas Estándar para abrir un nuevo
documento (también puede abrir el menú File y hacer clic en New). Enseguida se
desplegará una ventana con el nombre Data Table (ver figura) en la que deberá
introducir los datos de la variable a analizar, ya sea utilizando el teclado o
mediante los comandos Copiar y Pegar (Copy / Paste) para llevar dichos datos
desde otra aplicación, como Excel o el Bloc de Notas de Windows.

33/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Introduzca los datos de


la variable que desea
analizar en esta
ventana de Stat::Fit

Una vez introducida la información es posible seleccionar una serie de opciones


de análisis estadístico, entre ellas las de estadística descriptiva y las de pruebas
de bondad de ajuste, que se revisan a continuación:

Ejemplo:
En la tabla siguiente se presentan los datos del número de automóviles que entran
a una gasolinera cada hora:

14 13 13 20 12
7 15 20 10 14
13 10 8 18 20
16 15 17 15 15
16 16 19 13 10
13 14 11 16 13
15 12 12 24 21
17 17 17 18 23
15 14 9 16 15
16 12 18 18 18

Determinar la distribución de probabilidad con un nivel de significancia  = 5%.

Después de introducir estos datos en Stat::Fit, despliegue el menú Statistics y


selecciones el comando Descriptive. Enseguida aparecerá una nueva ventana
con el nombre de Descriptive Statistics, en donde se muestra el resumen
estadístico de la variable (ver figura).

34/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Ventana de resultados
estadísticos de Stat::Fit

Para determinar el tipo de distribución de probabilidad de los datos, seleccione el


comando Autofit del menú Fit en la pantalla principal de Stat::Fit. A continuación
se desplegará un cuadro de diálogo similar al que se ilustra en la figura de más
adelante, en el cual se tiene que seleccionar el tipo de distribución que se desea
probar, si dicha distribución es no acotada en ambos extremos (unbounded), o si
el límite inferior está acotado; en este último caso se puede aceptar la propuesta
de que la cota del límite inferior sea el dato más pequeño de la muestra (lower
bound), o seleccionar explícitamente otro valor como límite inferior (assigned
bound).

Este cuadro de diálogo permite


seleccionar el tipo de
distribución adecuado para el
tipo de variable aleatoria

Para este ejemplo seleccionamos una distribución de tipo discreto: discrete


distributions, ya que los datos de la variable aleatoria [automóviles/hora] tienen
esa característica.

Hay que hacer clic en el botón OK para que el proceso de ajuste se lleve a cabo.
El resultado se desplegará en la ventana Automatic Fitting, donde se describen

35/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

las distribuciones de probabilidad analizadas, su ranking de acuerdo con la


bondad del ajuste, y si los datos siguen o no alguna de las distribuciones. En la
figura siguiente se observa el resultado del análisis de ajuste del ejemplo, el cual
nos indica que no se puede rechazar la hipótesis de que los datos provengan de
cualquiera de dos distribuciones, Binomial, con N = 104 y p = 0,145, o de Poisson,
con media  = 15.0 (esta última coincide con el resultado que se obtuvo en el
punto 3.1 mediante la prueba de bondad de ajuste Chi-cuadrado).

Ventana de resultados
del análisis de la
variable aleatoria

Haciendo clic con el Mouse en cualquiera de las dos distribuciones, enseguida se


desplegará el histograma que se muestra más adelante: las barras azules
representan la frecuencia observada de los datos; las líneas de colores indica la
frecuencia esperada de la distribución teórica ajustada.

36/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Histogramas teórico y
real de la variable
aleatoria
El histograma anterior también se puede obtener a través del menú Fit  Result
Graphs  Density, donde se puede seleccionar otros tipos de gráfico como el
siguiente que muestra el ajuste de las distribuciones acumuladas.

Distribución acumulada
de la variable aleatoria
real comparada con las
distribuciones
teóricas ajustadas

El formato del histograma puede ser modificado mediante el comando Graphics


Style del menú Graphics (esta opción sólo está disponible cuando se tiene activa
la ventana Comparison Graph). Para incluir un gráfico en un informe, por ejemplo
en Word, éste se puede copiar o guardar a través del menú Graphics  Copy o
Save as.

37/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

3.5. Ajuste de distribuciones con Crystal Ball

Se selecciona la herramienta Batch_Fit del menú Tools del Crystal Ball, como se
muestra en la siguiente Figura.

La herramienta Batch_Fit permite determinar las distribuciones de probabilidad


que mejor se ajustan a un conjunto de datos de una variable aleatoria y estimar
sus respectivos parámetros.

A continuación, se presenta el siguiente cuadro de diálogo (Paso 1 de 3) en el cual


se ingresa la ubicación de los datos a ajustar:

38/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

En el siguiente cuadro de diálogo Fitting Options (Paso 2 de 3) se selecciona el


tipo de distribuciones a ajustar y la forma de ordenamiento (ranking) por bondad
de ajuste.

El Crystal Ball puede determinar automáticamente los parámetros de las


distribuciones de probabilidad con los cuales se obtiene el mejor ajuste. Pero
también se pueden fijar estos parámetros (Lock parameters) por parte del usuario.

Si no se tiene claridad del tipo de distribución resultante, o el criterio de ajuste, se


elige la opción AutoSelect.

Para ajustar distribuciones discretas se recomienda seleccionar el criterio de


ajuste (Fitness Criteria) Chi-Square (Chi cuadrado) pues los otros dos criterios K-S
y A-D no son confiables para este tipo de distribuciones y por lo tanto no están
disponibles para el ajuste discreto.

Para ajustar distribuciones continuas se puede utilizar cualquiera de los tres


criterios, aunque se recomienda seleccionar el test de Anderson-Darling que es el
que tiene mayor potencia

En el último cuadro de diálogo Output Options se ingresa la ubicación donde se


quiere mostrar los resultados, incluyendo la tabla estadística de bondad de ajuste
(goodness-of-fit) de todas las distribuciones de probabilidad testeadas.

39/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Ejemplo:

Se dispone de las siguientes series de datos de tres variables aleatorias:

Automóviles Minutos / Minutos /


n
/ hora rotura cliente
1 14 4,33 5,63282
2 7 1,61 5,76414
3 13 2,16 5,76414
4 16 2,88 6,95686
5 16 0,70 7,11163
6 13 0,44 7,11163
7 14 1,59 7,82660
8 17 2,15 8,30552
9 15 8,59 8,61959
10 16 7,36 8,86415
11 13 9,97 8,97359
12 15 7,86 9,19190
13 10 5,49 9,25952
14 15 0,98 9,26901
15 16 4,52 9,27425

40/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Automóviles Minutos / Minutos /


n
/ hora rotura cliente
16 14 2,12 9,34602
17 12 4,44 9,34602
18 17 0,82 9,39954
19 14 6,96 9,53164
20 12 3,04 9,62768
21 13 2,81 9,82943
22 20 14,39 9,83097
23 8 3,44 9,93504
24 17 9,92 10,05620
25 19 4,38 10,26970
26 11 8,04 12,19000
27 12 2,18 12,68530
28 17 6,19 13,32290
29 9 4,48 13,46630
30 18 9,66 13,46630
31 20 4,34
32 10 1,76
33 18 2,30
34 15 5,24
35 13 11,65
36 16 10,92
37 24 12,16
38 18 6,60
39 16 0,85
40 18 4,82
41 12 1,36
42 14 3,53
43 20 6,58
44 15 1,45
45 10 8,42
46 13 3,69
47 21 2,44
48 23 0,28
49 15 1,90
50 18 2,89

En las tablas siguientes se muestra las estadísticas de bondad de ajuste con el


ranking de los mejores ajustes obtenidos para cada serie de datos:

41/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Chi-Square
Ranked By:
Anderson-Darling
Data Series Automóviles / hora
Distribution Chi-Square Chi-Square P-Value Parameters
Neg Binomial 0,7728 0,979 Probability=0,53191, Shape=8
Poisson 1,1955 0,945 Rate=15,04
Binomial 1,4774 0,831 Trials=119, Probability=0,12639
Discrete Uniform 24,1600 0,000 Minimum=7, Maximum=24
Geometric 90,9229 0,000 Probability=0,06649

Data Series Minutos / rotura


Distribution A-D A-D P-Value Parameters
Gamma 0,1975 0,943 Location=0,20868, Scale=3,22178, Shape=1,40448
Lognormal 0,2718 0,563 Mean=4,84066, Std. Dev.=4,25437, Location=-0,74708
Weibull 0,3551 0,718 Location=0,16262, Scale=5,17375, Shape=1,37072
Max Extreme 0,6426 0,094 Likeliest=3,16798, Scale=2,54763
Logistic 1,1599 0,000 Mean=4,34483, Scale=2,015
Exponential 1,2639 0,054 Rate=0,21126
Normal 1,3697 0,000 Mean=4,7336, Std. Dev.=3,49272
Triangular 1,4492 --- Minimum=0,1403, Likeliest=0,28, Maximum=16,40036
Student's t 2,4058 --- Midpoint=4,7336, Scale=1,70141, Deg. Freedom=1
Min Extreme 2,4478 0,000 Likeliest=6,58813, Scale=3,89253
Minimum=0,64931, Maximum=16,12624, Alpha=0,76322,
Beta 2,6024 --- Beta=2,12892
BetaPERT 5,6757 --- Minimum=0,64931, Likeliest=2,90651, Maximum=16,12624
Pareto 9,4916 --- Location=0,26605, Shape=0,39146
Uniform 9,7905 0,000 Minimum=0,00333, Maximum=14,66667

Data Series Minutos / cliente


Distribution A-D A-D P-Value Parameters
Logistic 0,8179 0,017 Mean=9,29346, Scale=1,18285
Student's t 0,8252 --- Midpoint=9,34095, Scale=1,29382, Deg. Freedom=1
Lognormal 0,8660 0,000 Mean=9,34512, Std. Dev.=2,1267, Location=-8,82803
Gamma 0,8779 0,012 Location=-2,50666, Scale=0,36902, Shape=32,10555
Minimum=2,76135, Maximum=22,48572, Alpha=6,28494,
Beta 0,9149 --- Beta=12,55611
Weibull 0,9277 0,063 Location=4,11518, Scale=5,91973, Shape=2,66927
Normal 0,9419 0,015 Mean=9,34095, Std. Dev.=2,12351
Max Extreme 1,0303 0,010 Likeliest=8,3246, Scale=1,90707
Triangular 1,0469 --- Minimum=4,51341, Likeliest=9,34602, Maximum=14,64548
Uniform 1,4882 0,113 Minimum=5,38013, Maximum=13,71899
Min Extreme 1,6591 0,000 Likeliest=10,41674, Scale=2,14566
BetaPERT 2,5690 --- Minimum=2,76135, Likeliest=7,69965, Maximum=22,48572
Pareto 4,1682 --- Location=5,54033, Shape=2,01324
Exponential 8,6117 0,000 Rate=0,10706

42/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Criterios de aceptación

Existen dos métodos de hacer la prueba de hipótesis: el método clásico de los


tests, ya analizados, y el método del p-value que es la manera moderna de probar
hipótesis.

Prueba de Kolmogorov-Smirnov. El resultado de esta prueba es esencialmente


la distancia vertical más grande entre las dos distribuciones acumuladas.
Generalmente un valor menor que 0,03 indica un buen ajuste.

Prueba de Anderson-Darling. Este método se parece bastante al método de K-S,


pero da mayor peso a las diferencias entre las dos distribuciones en sus colas que
en el medio de la distribución. Se usa cuando se necesita un mejor ajuste en las
colas extremas de la distribución. Generalmente un valor menor que 1,5 indica un
buen ajuste.

El p-value, llamado el nivel de significación observado, es el valor de  al cual se


rechazaría la hipótesis nula si se usa el valor calculado de la prueba estadística.
En la práctica un p-value cercano a 0 indica un rechazo de la hipótesis nula. Así
un p-value mayor que  indicará que no se puede rechazar la prueba estadística.

Los principales programas estadísticos calculan los p-value para la mayoría de las
pruebas estadísticas.

En Crystal Ball, un p-value asociado mayor que 0,5 generalmente indica un buen
ajuste.

En el ejemplo procesado, Crystall Ball crea una hoja Batch Fit Output donde se
muestra un resumen de los mejores ajustes obtenidos para cada serie de datos:

Automóviles /
Data Series: hora Minutos / rotura Minutos / cliente
Distribution: 15,04 4,73 9,29
Best Fit: Neg Binomial Gamma Logistic
Rank
Methods:
Chi-Square 0,7728
Anderson-
Darling 0,1975 0,8179
P-Value: 0,979 0,943 0,017
se acepta se acepta se rechaza

Para revisar los gráficos de las distribuciones de probabilidad y los parámetros


resultantes que producen el mejor ajuste, hay que posicionarse en las celdas de
color verde y hacer click en el ícono de la barra de herramientas (Define
Assumption).

43/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

En el caso de la serie de datos de la tercera variable aleatoria Minutos / Cliente, su


p-value = 0,017 resultó inferior a 0,5 debido a lo cual el ajuste se debe rechazar.

El motivo de esto se puede comprobar al revisar la forma de la distribución de


frecuencias de esta variable aleatoria:

Histograma
8
7
6
Frecuencia

5
4
3
2
1
0

12,5
10
10,5
11
11,5
12

13
13,5
14
y mayor...
5,5
6
6,5
7
7,5
8
8,5
9
9,5

Rangos Minutos / cliente

El histograma evidencia que las dos colas de la distribución de frecuencias


presentan altas frecuencias, debido a lo cual ninguna distribución de
probabilidades teórica se pudo ajustar adecuadamente a los datos observados de
la variable aleatoria.

Por lo tanto, para simular el comportamiento de esta variable aleatoria en Crystal


Ball se deberá utilizar una distribución Custom, con datos de probabilidades
proporcionados por el usuario.

44/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

4. Generación de variables aleatorias

La variabilidad de eventos y actividades se representa a través de funciones de


densidad para fenómenos continuos, y mediante distribuciones de probabilidad
para fenómenos de tipo discreto. La simulación de estos eventos o actividades se
realiza con la ayuda de la generación de variables aleatorias.

Los principales métodos para generar variables aleatorias son:

 Método de la transformada inversa


 Método de convolución
 Método de composición
 Método de la transformación directa

A continuación se analizará el primero de los métodos. En secciones posteriores


se describirán los otros métodos.

4.1. Método de la transformada inversa

El método de la transformada inversa permite simular variables aleatorias


continuas que siguen una cierta distribución de probabilidades con función de
densidad 𝑓 (𝑥 ).

Este método utiliza la distribución de probabilidad acumulada 𝐹 (𝑥 ) de la


distribución que se desea simular. Como el dominio de 𝐹 (𝑥 ) está definido en el
intervalo [0 − 1], por lo tanto se puede representar por un número pseudo
aleatorio 𝑟𝑖 ~ 𝑈(0, 1) determinando el valor de la variable aleatoria para la cual su
distribución acumulada es igual a 𝑟𝑖 . Para esto hay que despejar el valor de la
variable aleatoria 𝑥𝑖 en la siguiente ecuación:

𝐹 (𝑥 ) = 𝑟 ⟹ 𝑥 = 𝐹 −1 (𝑟)

En esta expresión 𝐹 −1 (𝑟) corresponde a la función acumulada inversa, conocida


también como transformada inversa. Por ejemplo, si 𝑟 = 𝐹 (𝑥 ) = 𝑥 2 su
transformada inversa correspondiente será: 𝐹 −1 (𝑟) = √𝑟.

Con la función inversa ya determinada, se podrán obtener valores de la variable


aleatoria que se comporten de acuerdo a la distribución de probabilidad deseada,
generando para esto números pseudo aleatorios uniformes.

El método consta de los siguientes pasos:

45/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

1. Determinar la función de densidad 𝑓 (𝑥 ) que representa la variable aleatoria a


simular.
2. Calcular la función acumulada 𝐹 (𝑥 ) como:
𝑥

𝐹 (𝑥 ) = ∫ 𝑓 (𝑡) 𝑑𝑡
0
3. Para obtener la función acumulada inversa 𝑥 = 𝐹 −1 (𝑟) se despeja la variable
aleatoria 𝑥 en la función acumulada 𝐹 (𝑥 ).
4. Se generan valores para la variable aleatoria 𝑥 sustituyendo el valor de 𝐹 (𝑥 )
con números pseudo aleatorios 𝑟𝑖 ~ 𝑈(0, 1) en la función acumulada inversa.

En la figura siguiente se muestra el funcionamiento del método de la transformada


inversa:

El método de la transformada inversa también puede emplearse para simular


variables aleatorias de tipo discreto, como en las distribuciones de Poisson, de
Bernoulli, binomial, geométrica, discreta general, etc. La generación se lleva a
cabo a través de la distribución de probabilidad acumulada 𝑃 (𝑥 ) y la generación
de números pseudo aleatorios 𝑟𝑖 ~ 𝑈(0, 1). El método consiste en:

1. Calcular todos los valores de la distribución de probabilidad 𝑝(𝑥 ) de la variable


a modelar.
2. Calcular todos los valores de la distribución acumulada 𝑃(𝑥 ).
3. Generar números pseudo aleatorios 𝑟𝑖 ~ 𝑈(0, 1).
4. Comparar con el valor de 𝑃 (𝑥 ) y determinar qué valor de x corresponde a 𝑃 (𝑥 ).

46/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Este es el fundamento teórico que se utiliza para la construcción de una Tabla de


Montecarlo, aplicable al caso de distribuciones de probabilidad empíricas para
determinar su transformada acumulada inversa, tema que fue tratado en la Unidad
I – Principios de Simulación de este curso.

Una dificultad de este método radica en el hecho que algunas funciones de


densidad de probabilidad 𝑓 (𝑥 ) no se pueden integrar para obtener la distribución
de probabilidad acumulada 𝐹 (𝑥 ). Este es el caso, por ejemplo, de la distribución
de probabilidad normal cuya función de densidad es:

1 2 ⁄2𝜎 2
𝑓 (𝑥) = 𝑒 −(𝑥−𝜇) 𝑝𝑎𝑟𝑎 − ∞ < 𝑥 < ∞
𝜎 √2𝜋
Otra dificultad que se presenta es que en algunas ocasiones no resulta posible
obtener analíticamente la transformada inversa 𝑥 = 𝐹 −1 (𝑟). Este es el caso, por
ejemplo, de la distribución de probabilidad binomial cuya función de distribución
acumulada 𝑃 (𝑥 ) es:
𝑥
𝑛
𝑃(𝑥) = ∑ ( ) 𝑝𝑖 (1 − 𝑝)𝑛−𝑖
𝑖
𝑖=0
En estos casos, mediante métodos numéricos se puede discretizar la función de
densidad de probabilidad, dentro del rango de la variable aleatoria, y obtener sus
probabilidades acumuladas. Luego se genera una Tabla de Montecarlo con los
correspondientes rangos de números aleatorios.

Distribución uniforme 𝑼(𝒂, 𝒃)

A partir de la función de densidad de las variables aleatorias uniformes entre a y b:

1
f ( x)  a xb
ba

se obtiene la función de probabilidad acumulada:

xa
x x
1
F ( x)   f (t ) dt   dt  a xb
0 a
ba ba

Igualando la función acumulada 𝐹 (𝑥 ) con el número pseudo aleatorio 𝑟𝑖 ~ 𝑈(0, 1),


y despejando 𝑥 se obtiene:
𝑥𝑖 − 𝑎
𝑟𝑖 = 𝐹 (𝑥𝑖 ) =
𝑏−𝑎

47/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

𝑥𝑖 − 𝑎 = 𝑟𝑖 (𝑏 − 𝑎)

Luego:
𝒙𝒊 = 𝒂 + 𝒓𝒊 (𝒃 − 𝒂) 𝒄𝒐𝒏 𝒓𝒊 ∈ {𝟎, 𝟏}

Esta expresión corresponde a la transformada inversa de la distribución 𝑈(𝑎, 𝑏).

Con esta ecuación se pueden generar variables aleatorias 𝑥𝑖 ~ 𝑈 (𝑎, 𝑏) utilizando


un conjunto de números pseudo aleatorios 𝑟𝑖 ∈ {0, 1}. Cada número aleatorio 𝑟𝑖
generado determina así unívocamente una variable aleatoria 𝑥𝑖 que se distribuye
de acuerdo a una distribución uniforme ~ 𝑈(𝑎, 𝑏), como se muestra en la figura
siguiente:

F (x)

r0

x
a x0 b

Ejemplo 1: Distribución uniforme

La temperatura de una estufa se comporta uniformemente dentro del rango de 95


a 100 ºC. Una lista de números pseudo aleatorios ri y la ecuación xi  95  5 ri nos
permiten modelar el comportamiento de la variable aleatoria que simula la
temperatura de la estufa como sigue:

Medición ri Temperatura ºC
1 0,48 97,40
2 0,82 99,10
3 0,69 98,45
4 0,67 98,35
5 0,00 95,00
6 1,00 100,00

Distribución exponencial 𝑬(𝝀)

48/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

A partir de la función de densidad de las variables aleatorias exponenciales con


media 1⁄𝜆 :

𝑓 (𝑥 ) = 𝜆 𝑒 −𝜆𝑥 𝑝𝑎𝑟𝑎 𝑥 ≥ 0

se obtiene la función de probabilidad acumulada siguiente:


𝑥 𝑥

𝐹 (𝑥 ) = ∫ 𝑓(𝑡 ) 𝑑𝑡 = ∫ 𝜆 𝑒 −𝜆𝑡 𝑑𝑡 = 1 − 𝑒 −𝜆𝑥 𝑝𝑎𝑟𝑎 𝑥 ≥ 0


0 0

Se reemplaza la función acumulada 𝐹 (𝑥 ) con el número pseudo aleatorio


𝑟𝑖 ~ 𝑈(0, 1) y despejando 𝑥 se obtiene:

𝑟𝑖 = 𝐹 (𝑥𝑖 ) = 1 − 𝑒 −𝜆𝑥

𝑒 −𝜆𝑥𝑖 = 1 − 𝑟𝑖 / 𝑙𝑛

−𝜆 𝑥𝑖 = 𝑙𝑛 (1 − 𝑟𝑖 )

Luego:
𝟏
𝒙𝒊 = − 𝒍𝒏 (𝟏 − 𝒓𝒊 ) 𝒄𝒐𝒏 𝒓𝒊 ∈ {𝟎, 𝟏}
𝝀

Dado que la expresión (1 − 𝑟𝑖 ) ≤ 1 corresponde también a una variable aleatoria


~ 𝑈(0,1), entonces la expresión anterior se suele utilizar también como:

1
𝑥𝑖 = − 𝑙𝑛 (𝑟𝑖 ) 𝑐𝑜𝑛 𝑟𝑖 ∈ {0, 1}
𝜆

Comprobación en Maple

Distribución Exponencial
> f := x->lambda*exp(-lambda*x);
(  x )
f := x e

> int(f(t),t=0..x);
(  x )
1e

49/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Ejemplo 2: Distribución exponencial

Los datos históricos del tiempo de servicio en la caja de un banco se comportan


de forma exponencial con media de 1⁄𝜆 = 3 𝑚𝑖𝑛𝑢𝑡𝑜𝑠/𝑐𝑙𝑖𝑒𝑛𝑡𝑒. Una lista de
números pseudo aleatorios 𝑟𝑖 y la ecuación generadora exponencial:
𝑥𝑖 = −3 𝑙𝑛 (1 − 𝑟𝑖 )
nos permite simular el comportamiento de la variable aleatoria como sigue:

Tiempo de servicio
Cliente ri
(min)
1 0,64 3,06
2 0,83 5,32
3 0,03 0,09
4 0,50 2,08
5 0,21 0,71

Distribución triangular 𝑻(𝒂, 𝒃, 𝒄)

La distribución Triangular es una distribución continua acotada por ambos lados.


La función de densidad de la distribución triangular entre a y b con moda c es:

 2 x  a
 si a  x  c
  b  a  c  a 
f ( x)  
 2 b  x  si c  x  b
  b  a  c  a 

se obtiene la función de probabilidad acumulada:

 x 2 x  a
 dt si a  x  c
 a  b  a  c  a 
x
F ( x)   f (t ) dt   x
 2 b  t 
   b  a  c  a 
dt si c  x  b
0

c

50/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Desarrollo en Maple

Distribución triangular T(a, b, c)

> restart;
> assume(a<b,a<c,c<b);
> f := x-> piecewise(x>a and x< c,2*(x-a)/(b-a)/(c-a),x>c and
x<b,2*(b-x)/(b-a)/(b-c));
2 ( xa ) 2 ( bx )
f := xpiecewise ax and xc, , cx and xb, 

 ( b a ) ( c a ) ( b a ) ( b c ) 
> a := 1; b := 7; c:= 3;
a := 1
b := 7
c := 3
> plot(f(x),x=0..8);

> restart;
> f1 := x-> 2*(x-a)/(b-a)/(c-a);
2 ( xa )
f1 := x
( ba ) ( ca )

> F1 := int(f1(t),t=a..x);
x 2a 2 2 a ( xa )
F1 := 
( ba ) ( ca ) ( ba ) ( ca )

> simplify(%);
x 2a 22 a x
( ba ) ( ca )

> factor(%);
( xa ) 2
( ba ) ( ca )

51/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Igualando la función acumulada 𝐹 (𝑥 ) para 𝑎 ≤ 𝑥 ≤ 𝑐 con el número pseudo


aleatorio 𝑟𝑖 ~ 𝑈(0, 1) y despejando 𝑥 se obtiene:

 xi  a 
2

ri  F ( xi ) 
 b  a  c  a 
 xi  a    b  a  c  a  ri
2

Luego, para generar variables aleatorias xi distribuidas de acuerdo a una


distribución Triangular (a, b, c) en el primer tramo 𝑎 ≤ 𝑥 ≤ 𝑐 se utiliza la función
transformada inversa siguiente:

c  a
xi  a   b  a  c  a  ri si ri 
b  a 
Con un desarrollo análogo se obtiene la función transformada inversa siguiente en
el segundo tramo c  x  b:

c  a
xi  b   b  a  b  c  1  ri  si ri 
b  a 

Distribución de Bernoulli

A partir de la distribución de probabilidad de las variables aleatorias de Bernoulli


con media p, donde p = probabilidad de ocurrencia del evento x = 1:

p( x)  p x 1  p 
1 x
para x  0,1

Se calculan las probabilidades para x = 0 y x = 1, para obtener:

x 0 1
p(x) 1-p p

Acumulando los valores de p(x) se obtiene:

x 0 1
P(x) 1-p 1

Generando números pseudo aleatorios 𝑟𝑖 ~ 𝑈(0, 1) se aplica la regla:

52/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

 si ri   0, 1  p  x  0

xi  
 si ri  1  p, 1 x  1

Ejemplo 3: Distribución de Bernoulli

Los datos históricos sobre la frecuencia de detenciones de cierta máquina


muestran que existe una probabilidad de 0,2 de que ésta falle (x = 1), y de 0,8 de
que no falle (x = 0) en un día determinado. Generar una secuencia aleatoria que
simule este comportamiento.

A partir de la distribución de probabilidad de la variable aleatoria de Bernoulli con


una media p = 0,2 se calculan las probabilidades puntuales y las acumuladas
para x = 0 y x = 1, y se obtienen los siguientes datos:

p( x)  p x 1  p 
1 x
 0, 2 x 0,81 x para x  0,1

x 0 1
p(x) 0,8 0,2
P(x) 0,8 1

La regla para generar esta variable aleatoria estaría dada por:

 si ri   0  0,8  x  0 máquina no falla



xi  
 si ri   0,8  1 x  1 máquina falla

Con una lista de números pseudos aleatorios ri ~ U(0, 1) y la regla anterior es


posible simular el comportamiento de las fallas de la máquina a lo largo del
tiempo, considerando que:

 si el número pseudo aleatorio es menor que 0,8, la máquina no fallará


 si el número pseudo aleatorio es mayor que 0,8, ocurrirá la falla

Simulación de las fallas de la máquina


Evento: la
Día ri xi
máquina
1 0,453 0 no falla
2 0,823 1 falla
3 0,034 0 no falla
4 0,503 0 no falla
5 0,891 1 falla

53/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución de Poisson

x
Distribución de probabilidad p ( x)  e  si x  0,1, 2,...
x!
x
i
Distribución acumulada P( x)   e si x  0
i 0 i!

Esta es una distribución de probabilidad discreta donde  = tasa media de


ocurrencia del evento por unidad de tiempo

La distribución de Poisson es uno de los casos en que no existe una expresión


analítica para su función transformada inversa, puesto que no resulta posible
despejar 𝑥 a partir de su distribución acumulada 𝑃 (𝑥 ). Esto se puede subsanar
utilizando una Tabla de Montecarlo como se muestra en ejemplo siguiente:

Ejemplo 4: Distribución de Poisson

El número de piezas que entran a un sistema de producción sigue una distribución


de Poisson con media de  = 2 piezas/hora. Simular el comportamiento de la
llegada de las piezas al sistema.

A partir de la distribución de probabilidad de una variable aleatoria de Poisson con


media  = 2
 x e 2 x e2
p ( x)   para x  0, 1, 2, 3, ...
x! x!

se calculan las probabilidades puntuales y las acumuladas para x = 0, 1, 2, 3, …, y


se obtienen los siguientes datos:

54/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

x p(x) P(x)
0 0,13534 0,13534
1 0,27067 0,40601
2 0,27067 0,67668
3 0,18045 0,85712
4 0,09022 0,94735
5 0,03609 0,98344
6 0,01203 0,99547
7 0,00344 0,99890
8 0,00086 0,99976
9 0,00019 0,99995
10 0,00004 0,99999
Total 0,99999

Es importante señalar que la distribución de Poisson no tiene una expresión


analítica para su función transformada inversa. Esto se puede subsanar utilizando
una Tabla de Montecarlo como la siguiente:

Tabla de Montecarlo
Distribución
Distribución Rango Números
Nº de piezas de
Acumulada Aleatorios
probabilidad
xi p(xi) P(xi)  <
0 0,13534 0,13534 0 0,13534
1 0,27067 0,40601 0,13534 0,40601
2 0,27067 0,67668 0,40601 0,67668
3 0,18045 0,85712 0,67668 0,85712
4 0,09022 0,94735 0,85712 0,94735
5 0,03609 0,98344 0,94735 0,98344
6 0,01203 0,99547 0,98344 0,99547
7 0,00344 0,99890 0,99547 0,99890
8 0,00086 0,99976 0,99890 0,99976
9 0,00019 0,99995 0,99976 0,99995
10 0,00004 0,99999 0,99995 0,99999
> 10 0,00001 1,00000 0,99999 1,00000

Con una lista de números pseudos aleatorios ri ~ U(0, 1) y la tabla anterior es


posible simular la llegada de las piezas al sistema de producción, obteniéndose los
siguientes resultados:

55/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Simulación de la llegada de piezas al sistema


Día ri Piezas / hora

1 0,6754 2
2 0,0234 0
3 0,7892 3
4 0,5134 2
5 0,3331 1

Ejemplo 5:
La tabla siguiente muestra la demanda diaria observada (empírica) de cepillos
dentales en un supermercado. Simular el comportamiento de la demanda
mediante el método de la transformada inversa.

Día Demanda
1 3
2 2
3 2
4 1
5 3
6 0
7 2
8 1
9 3

A partir de la información histórica se determinan las probabilidades puntuales y


las acumuladas para x = 0, 1, 2, 3, … desarrollando la siguiente Tabla de
Montecarlo:

Tabla de Montecarlo
Frecuencia Frecuencia Frecuencia Rango Números
Demanda
Absoluta Relativa Acumulada Aleatorios
xi p(xi) P(xi)  <
0 1 11,111% 11,111% 0 0,1111
1 2 22,222% 33,333% 0,1111 0,4444
2 3 33,333% 66,667% 0,4444 0,6667
3 3 33,333% 100,000% 0,6667 1,0000
9 100,000%

Con una lista de números pseudos aleatorios ri ~ U(0, 1) y la tabla anterior es


posible simular la demanda diaria de cepillos dentales, obteniéndose los
siguientes resultados:

56/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Simulación de la demanda de cepillos dentales


Demanda
Día ri
diaria
1 0,213 1
2 0,345 2
3 0,021 0
4 0,987 3
5 0,543 2

4.2. Método de convolución

En algunas distribuciones de probabilidad la variable aleatoria a simular, Y, puede


generarse mediante la suma de otras variables aleatorias X de manera más rápida
que a través de otros métodos. Así, el método de convolución se puede expresar
como:
Y  X1  X 2  ...  X k

Las variables aleatorias de cuatro de las distribuciones más conocidas (de Erlang,
normal, binomial y de Poisson) pueden ser generadas a través de este método,
como se verá a continuación.

Distribución de Erlang

La variable aleatoria k-Erlang con media 1/ puede producirse a partir de la


generación de k variables exponenciales con media 1 :
k
1 1 1
Y  ln 1  r1   ln 1  r2    ln 1  rk 
k k k

1
Y  ln 1  r1   ln 1  r2    ln 1  rk 
k 

1
Y  ln 1  r1 1  r2  1  rk 
k 

1  k 
Y  ERi    ln  1  ri  
k   i 1 

57/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Ejemplo 6:
El tiempo de proceso de cierta pieza sigue una distribución 3-Erlang con media 1/
de 8 minutos/pieza (k = 3)

Una lista de números pseudos aleatorios ri ~ U(0, 1) y la ecuación de generación


de números Erlang permite obtener la siguiente tabla que indica el
comportamiento de la variable aleatoria:

8 k  8
Y  ERi   ln  1  ri     ln 1  r1 1  r2  1  rk  
3  i 1  3

Simulación del tiempo de proceso


Tiempo de
proceso
Pieza r1 r2 r3
(minutos /
pieza)
1 0,72 0,48 0,36 6,328
2 0,04 0,63 0,17 3,257
3 0,96 0,88 0,97 23,589
4 0,65 0,56 0,50 6,837
5 0,23 0,91 0,79 11,280

Distribución normal

La variable aleatoria normal ~ N ( ,  ) puede generarse usando el teorema del


límite central:

Y  X1  X 2   X k ~ N  k  x , k x2 

Al sustituir Xi por números pseudos aleatorios ri, se obtiene:

 1 1
Y  r1  r2   rk ~ N  k , k 
 2 12 

 12 12 
Y  r1  r2   r12 ~ N  ,  ~ N  6, 1
 2 12 

Y  Z   r1  r2   r12   6 ~ N  0, 1

12
x
Z    ri   6  ~ N  0, 1
i 1 

58/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Despejando x, tenemos que:

 12 
x  Ni    ri   6   
 i 1 

Ejemplo 7:
El volumen de líquido de un refresco sigue una distribución normal con media de
12 onzas y desviación estándar de 0,4 onzas. Generar 5 variables aleatorias con
esta distribución para simular el proceso de llenado.

 12 
x  Ni    ri   6   
 i 1 

 12 
Ni    ri   6 0, 4  12
 i 1 

Simulación del volumen de llenado de refrescos


12
Botella r   6
i 1
i
Volumen
(onzas)
Función
Excel

1 -0,47595 11,80962 12,29280


2 0,81390 12,32556 11,95984
3 1,07921 12,43168 11,24953
4 0,00843 12,00337 11,38771
5 2,07123 12,82849 11,97537
6 1,01621 12,40648 12,48087
7 0,05899 12,02359 11,83909
8 0,16368 12,06547 12,14481
9 -1,75269 11,29892 12,39592
10 -0,14412 11,94235 12,38903
promedio 12,11356 12,01150
desv. est. 0,41512 0,42307

Función Excel: = DISTR.NORM.INV(ALEATORIO(); 12; 0,4)

Dado un valor de probabilidad, DISTR.NORM.INV busca dicho valor x tal que


DISTR.NORM(x, media, desv_estándar, VERDADERO) = probabilidad. Así, la
precisión de DISTR.NORM.INV depende de la precisión de DISTR.NORM.

DISTR.NORM.INV utiliza una técnica de búsqueda iterativa. Si la búsqueda no


converge después de 100 iteraciones, la función devuelve el valor de error #N/A.

59/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución binomial

Una variable aleatoria binomial con parámetros N y p puede ser generada a través
de la suma de N variables aleatorias con distribución de Bernoulli con parámetro p.

Y  BIi  BE1  BE2   BEN ~ B  N , p 

Ejemplo 8:
Al inspeccionar lotes de tamaño N = 5, la probabilidad de que una pieza sea
defectuosa es p = 0,03. Simular el proceso de inspección para determinar el
número de piezas defectuosas por lote.

Este proceso sigue una distribución binomial con N = 5 y p = 0,03, y será simulado
mediante la generación de variables aleatorias de Bernoulli con p = 0,03, de
acuerdo con el procedimiento señalado en la sección anterior, donde BEi  0
representa una pieza en buen estado y BEi  1 una pieza defectuosa.

 si ri   0  0,97  x  0 máquina no falla



xi  
 si ri   0,97  1 x  1 máquina falla

BIi  BE1  BE2   BE5

Simulación del sistema de inspección


Piezas
Lote r1 BE1 r2 BE2 r3 BE3 r4 BE4 r5 BE5
defectuosas

1 0,49 0 0,32 0 0,15 0 0,01 0 0,45 0 0


2 0,11 0 0,85 0 0,93 0 0,99 1 0,61 0 1
3 0,57 0 0,92 0 0,84 0 0,74 0 0,82 0 0
4 0,62 0 0,01 0 0,68 0 0,98 1 0,99 1 2
5 0,34 0 0,98 1 0,99 1 0,02 0 0,98 1 3

60/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

4.3. Método de composición

El método de composición –conocido también como método mixto– permite


generar variables aleatorias x cuando éstas provienen de un función de densidad
de probabilidad f(x) que puede expresarse como la combinación convexa de m
distribuciones de probabilidad fi ( x) .
Así, f(x) se expresa como una mezcla de varias distribuciones de probabilidad
fi ( x) seleccionadas adecuadamente. La combinación convexa se puede expresar
como:
m
f ( x)   f i ( x)  I A ( x)
i 1

donde la función indicadora I A ( x) se define como :

0 si x  A
I A ( x)  
1 si x  A

El procedimiento para la selección de las fi ( x) se basa en el objetivo de minimizar


el tiempo de computación requerido para la generación de valores de la variable
aleatoria analizada.

El procedimiento general de generación es el siguiente:

1. Calcular la probabilidad de cada una de las distribuciones fi ( x) .


2. Asegurar que cada función fi ( x) sea función de densidad.
3. Obtener, mediante el método de la transformada inversa, las expresiones para
generar variables aleatorias de cada una de las distribuciones fi ( x) .
4. Generar un número pseudo aleatorio ri que permita definir el valor de I A ( x) .
5. Seleccionar la función generadora correspondiente a la función fi ( x) .
6. Generar un segundo número pseudo aleatorio ri y sustituirlo en la función
generadora anterior para obtener Y.

Algunas de las distribuciones más conocidas que pueden expresarse como una
combinación convexa son: triangular, de Laplace y trapezoidal.

61/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución triangular

A partir de la función de densidad de la distribución triangular acotada entre a y b


con moda c:

 2 x  a
 si a  x  c
  b  a  c  a 
f ( x)  
 2 b  x  si c  x  b
  b  a  c  a 

Se calcula la probabilidad de cada uno de los dos segmentos de la función:

 c 2 x  a c  a
 dx  si a  x  c
 a  b  a  c  a  b  a 
p( x)   b
 2 b  x  b  c 
   b  a  c  a 
dx  si c  x  b
c b  a 

Ya que los segmentos por separado no son funciones de densidad, se ajustan


dividiendo por su correspondiente p(x).

 2 x  a b  a   2  x  a 
  si a  x  c
  b  a  c  a   c  a   c  a 
2

f ( x)  
 2 b  x   b  a   2 b  x  si c  x  b
  b  a  c  a   b  c   b  c 2

Expresando la función como una combinación convexa se obtiene:

m 2
f ( x)   f i ( x)  I A ( x)   f i ( x)  I A ( x)
i 1 i 1

2 x  a 2 b  x 
f ( x)   I a  x c ( x)   I c  x b ( x )
c  a b  c 
2 2

donde:

0 si x  a  x  c

I A ( x)  
1 si x  a  x  c

62/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Primero integramos para aplicar el método de la transformada inversa a cada


segmento de la función:

 x 2 t  a   x  a
2

  dt  si a  x  c
 a c  a c  a
2 2

F ( x)  
 2 b  t   b  x
x 2

 dt  1  si c  x  b
   b  c 
2 2
c b c

Luego, despejando x y sustituyendo ri en F(x) obtenemos:

 a   c  a  ri

xi  
 
b   b  c  1  ri 

Por último, al expresar la ecuación anterior incluyendo la función indicadora I A ( x)


tenemos que:

 c  a
 a   c  a  ri si ri 
 b  a 
xi  
b   b  c 1  r  c  a
   i  si ri 
 b  a 

Ejemplo 9:
Generar una muestra de 5 variables aleatorias con distribución triangular a partir
de los parámetros: valor mínimo a = 5, valor máximo b = 20 y moda c =10.

Sustituyendo en las ecuaciones anteriores obtenemos:

 5
 5  5 ri si ri 
15
xi  
20  10 1  r  5
 i  si ri 
 15

Al generar una secuencia de números pseudo aleatorios se obtiene la secuencia


de variables triangulares que se muestran en la siguiente tabla:

63/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Simulación de variables aleatorias triangulares


n ri Ti
1 0,231 7,403
2 0,967 18,183
3 0,982 18,658
4 0,134 6,830
5 0,536 13,188

4.4. Método de transformación directa

Utilizado para generar variables aleatorias normales, este método se basa en el


teorema de Pitágoras. En la siguiente figura se muestra la relación entre las
variables involucradas en él.

h2  z12  z22
z2 ~ N(0, 1)


z1 ~ N(0, 1)
Geométricamente:

z2  h sen   z12  z22 sen 

La suma de  variables aleatorias normales estándar sigue una distribución Chi-


cuadrado con  grados de libertad:

z2  22 sen 

La función de densidad de una variable aleatoria Chi-cuadrado con 2 grados de


libertad es la misma de una distribución exponencial con media igual a 2. En
consecuencia, usando la ecuación obtenida por el método de la transformada
inversa para generar variables aleatorias exponenciales, y sustituyéndola en la
ecuación anterior se obtiene:

z2  2ln 1  ri  sen 

64/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Se generan valores aleatorios uniformes del ángulo  entre 0 y 2 mediante el


método de la transformada inversa de  ~ U(a, b):

  a   b  a  rj  2 rj

Y sustituyendo obtenemos:

z2  2ln 1  ri  sen  2 rj 
N 
Para cualquier variable aleatoria normal N, z  . Al despejar N y sustituir el

valor de z previamente desarrollado, se llega a la expresión final para la
generación de variables aleatorias normales:

Ni   2ln 1  ri  sen  2 rj    
 

Este procedimiento puede iniciarse también a través de la generación de la


variable aleatoria z1, lo cual dará lugar a la expresión alternativa:

Ni   2ln 1  ri  cos  2 rj    
 

Cualquiera de las dos últimas ecuaciones puede utilizarse para resolver el ejemplo
7, el cual se reproduce a continuación para una referencia más cómoda:

Ejemplo 10:
El volumen de líquido de un refresco sigue una distribución normal con media de
12 onzas y desviación estándar de 0,4 onzas. Generar variables aleatorias con
esta distribución para simular el proceso de llenado.

Ni   2ln 1  ri  sen  2 rj   0, 4  12
 

De manera que si producimos los números pseudo aleatorios uniformes 0,43 y


0,75, el volumen del líquido generado para el proceso de llenado de alguna de las
botellas sería:

Ni   2ln 1  0, 43 sen  2  0,75   0, 4  12  11,576 onzas


 

65/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Anexo 1. Expresiones comunes de algunos generadores de


variables aleatorias

En la tabla siguiente se presentan los generadores de variables aleatorias de las


distribuciones de probabilidad más usuales.

Distribución Generador Parámetros


a = límite inferior
Uniforme Ui  a   b  a  ri b = límite superior
Ui
𝑟𝑖 = Nº aleatorio ~𝑈(0,1)
c  a
Ti  a   b  a  c  a  ri si ri 
Triangular b  a  a = límite inferior
b = límite superior
Ti
Ti  b   b  a  b  c  1  ri  si ri 
c  a c = moda
b  a 
Ti  a   c  a  ri si ri 
c  a
Triangular b  a  a = límite inferior
b = límite superior
Ti
Ti  b   b  c   1  ri si ri 
c  a c = moda
b  a 
𝑛 𝑁𝑗 = números aleatorios
Chi-
cuadrado 𝜒𝑖2 = ∑ 𝑁𝑗2 con distribución normal
estándar ~ 𝑁(0,1)
𝜒𝑖2 𝑗=1
n = grados de libertad

k
1
Erlang ERi   ln  1  ri  1/ = valor esperado
ERi k i 1 k = parámetro de forma

Ni   2ln 1  ri  sen  2 rj    
Normal    = media
Ni Ni   2ln 1  ri  cos  2 rj      = desviación estándar
 

 12   = media
Normal Ni    ri   6   
Ni  i 1   = desviación estándar

Exponencial 1
Ei   ln 1  ri  1/ = media
Ei 

66/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución Generador Parámetros


 = parámetro de escala
 ln 1  ri 
Weibull
Wi     
 = parámetro de forma
Wi
 = parámetro de localización

k
1
Gamma Gi   ln  1  ri  1/ = valor esperado
Gi k i 1 k = parámetro de forma

𝐿𝑁𝑖 = 𝑒 𝑁𝑖 donde:
Lognormal  = valor esperado
 12   2  2
LNi Ni    ri   6  ln 1  2   ln 2 = varianza
 i 1      
2 2

𝑝 =probabilidad de ocurrencia
Bernoulli  si ri   0, 1  p  x  0
 del evento 𝑥 = 1
BEi  
BEi  si ri  1  p, 1 x  1
 1 − 𝑝 = probabilidad de
ocurrencia del evento 𝑥 = 0
𝐵𝐸𝑗 = números aleatorios con
distribución Bernoulli
𝑁
N = número del evento máximo de la
Binomial
𝐵𝑖 = ∑ 𝐵𝐸𝑗 distribución binomial
Bi
𝑗=1 p = probabilidad de éxito de la
distribución nominal que se involucra al
generar los Bernoulli
Inicialización: Hacer N = 0, T = 1 y generar un
Nº aleatorio ri.
Paso 1: Calcular T '  T  ri
Paso 2: Si T '  e , entonces hacer N = N + 1, T  = media
Poisson
= T’, calcular otro ri y regresar al paso1. N = contador
Pi
Si T '  e , entonces la variable generada está T = contador
dada por Pi  N .
Para generar la siguiente variable de Poisson,
regresar a la fase de inicialización.

𝑙𝑛(1 − 𝑟𝑖 )
Geométrica 𝐺𝐸𝑖 = 𝑐𝑜𝑛 𝐺𝐸𝑖 ≥ 1 ∈ ℤ 𝑝=probabilidad
𝑙𝑛(1 − 𝑝)

67/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Anexo 2. Fichas Estadísticas de Distribuciones de Probabilidad

A.2.1 Distribuciones discretas

Distribución de Bernoulli 𝑩𝑬(𝒑)


𝑝(𝑥) = 𝑝 𝑥 (1 − 𝑝)1−𝑥 o sea:
Distribución de probabilidad 1 − 𝑝, 𝑠𝑖 𝑥 = 0
𝑝(𝑥) = {
𝑝, 𝑠𝑖 𝑥 = 1
1 − 𝑝, 𝑠𝑖 𝑥 = 0
Distribución acumulada 𝑃(𝑥) = {
1, 𝑠𝑖 𝑥 = 1
Rango {0, 1}
Parámetros Probabilidad de éxito en el ensayo: 𝑝 ∈ (0, 1)
Media 𝑝
Varianza 𝑝 (1 − 𝑝 )

68/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución binomial 𝑩𝑰(𝒏, 𝒑)


𝑛
Distribución de probabilidad 𝑝(𝑥) = ( ) 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 𝑥 = 0, 1, 2, … , 𝑛
𝑥
𝑥
𝑛
Distribución acumulada 𝑃(𝑥) = ∑ ( ) 𝑝𝑖 (1 − 𝑝)𝑛−𝑖
𝑖
𝑖=0
Rango {0, 1, … , 𝑛}
𝑛 es un número entero
Parámetros
𝑝 ∈ (0, 1)
Media 𝑛𝑝
Varianza 𝑛 𝑝 (1 − 𝑝 )

69/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución geométrica 𝑮𝑬(𝒑)


Distribución de probabilidad 𝑝(𝑥) = 𝑝 (1 − 𝑝)𝑥−1 𝑝𝑎𝑟𝑎 𝑥 = 1,2,3 …
Distribución acumulada 𝑃(𝑥) = 1 − (1 − 𝑝)𝑥 𝑝𝑎𝑟𝑎 𝑥 = 1,2,3 …
Rango {0, 1}
Parámetros Probabilidad de éxito en cada ensayo: 𝑝 ∈ (0, 1)
1
Media
𝑝
(1 − 𝑝 )
Varianza
𝑝2

70/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución de Poisson 𝑷(𝝀)

x
Distribución de probabilidad p ( x)  e  si x  0,1, 2,...
x!
x
i
Distribución acumulada F ( x)   e  si x  0
i 0 i!
Rango {0, 1, 2, … }
Parámetros >0
Media 
Varianza 

71/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución uniforme
𝑼𝑫(𝒂, 𝒃)
discreta
1
𝑝(𝑥) = 𝑠𝑖 𝑥 ∈ {𝑖, 𝑖 + 1, … , 𝑗}
Distribución de probabilidad 𝑏−𝑎+1
𝑝(𝑥) = 0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
𝑥−𝑎+1
𝑃(𝑥) = 𝑠𝑖 𝑖 ≤ 𝑥 ≤ 𝑗
Distribución acumulada 𝑏−𝑎+1
𝑃(𝑥) = 0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
𝑎 y 𝑏 son números enteros, con 𝑎 < 𝑏
Parámetros Parámetro de localización: 𝑎
Parámetro de escala: 𝑏 − 𝑎
Rango {𝑖, 𝑖 + 1, … , 𝑗}
1
Media (𝑎 + 𝑏 )
2
1
Varianza [(𝑏 − 𝑎 + 1)2 − 1]
12

72/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

A.2.2 Distribuciones continuas

Distribución beta 𝜷(𝜶, 𝜷, 𝒂, 𝒃)


extendida
(𝑥 − 𝑎)𝛼−1 (𝑏 − 𝑥)𝛽−1
𝑓 (𝑥 ) = 𝑝𝑎𝑟𝑎 𝑎 < 𝑥 < 𝑏
Distribución de 𝐵(𝛼, 𝛽) (𝑏 − 𝑎)𝛼+𝛽−1
probabilidad Γ(𝛼 ) Γ(𝛽)
𝑑𝑜𝑛𝑑𝑒 𝛣(𝛼, 𝛽) = 𝑒𝑠 𝑙𝑎 𝑓𝑢𝑛𝑐𝑖ó𝑛 𝑏𝑒𝑡𝑎
Γ (α + β)
Distribución acumulada -
Rango [𝑎, 𝑏]
Parámetro de forma: 𝛼 > 0
Parámetro de forma: 𝛽 > 0
Parámetros
Mínimo: 𝑎
Máximo: 𝑏
𝛼
Media 𝑎 + (𝑏 − 𝑎 )
𝛼+𝛽
(𝑏 − 𝑎 ) 2 𝛼 𝛽
Varianza
(𝛼 + 𝛽 + 1) (𝛼 + 𝛽)2

73/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Nota:
La función de densidad de probabilidades de la distribución beta puede presentar
formas muy distintas dependiendo de los valores de los dos parámetros de forma
𝛼 y 𝛽 como se muestra en la siguiente figura:

𝑫𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒄𝒊ó𝒏 𝜷(𝜶, 𝜷, 𝟎, 𝟏)

74/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución de Erlang 𝒌 − 𝑬𝑹(𝟏⁄𝝀)


𝜆(𝜆𝑥)𝑘−1 −𝜆𝑥
Distribución de probabilidad 𝑓 (𝑥) = 𝑒 𝑝𝑎𝑟𝑎 𝑥 ≥ 0
(𝑘 − 1)!
Γ(𝑘, 𝑥𝜆)
Distribución acumulada 𝐹 (𝑥) = 1 −
Γ(𝑘 )
Rango [0, )
Parámetro de localización: 0
Parámetros Parámetro de forma: 𝑘
Parámetro de escala 1⁄𝜆 ≥ 0
1
Media 𝑘( )
𝜆
1 2
Varianza 𝑘( )
𝜆

La distribución gamma se conoce como la distribución de 𝛼-Erlang cuando el


parámetro de forma 𝛼 (𝑘 ) es un entero positivo, con un parámetro de escala
𝛽 (1⁄𝜆 ). En el ejemplo, con 𝑘 = 3; 𝜆 = 1⁄𝛽 = 1⁄10, la media de la distribución es:
1 3
𝑘( ) = = 30
𝜆 1⁄10

75/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución exponencial 𝑬(𝟏⁄𝝀)


Distribución de probabilidad 𝑓 (𝑥) = 𝜆 𝑒 −𝜆𝑥 𝑝𝑎𝑟𝑎 𝑥 ≥ 0
Distribución acumulada 𝐹 (𝑥) = 1 − 𝑒 −𝜆𝑥
Rango [0, )
Parámetros Parámetro de escala 1⁄𝜆 ≥ 0
Media 1⁄𝜆
Varianza 1⁄𝜆2

Nota:
 En el ejemplo 𝜆 = 0,25 (𝑟𝑎𝑡𝑒) y la media de la distribución es: 1⁄𝜆 = 4.
 Cuando el parámetro de forma ∝= 1, la distribución gamma devuelve la
distribución exponencial con: 𝜆 = 1⁄𝛽 .

76/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución 𝑮(𝜶, 𝜷)
gamma
1
𝑓 (𝑥) = 𝑥 𝛼−1 𝑒 −𝑥⁄𝛽 𝑝𝑎𝑟𝑎 𝑥 ≥ 0
𝛽 Γ(𝛼)
𝛼
Distribución ∞
de
probabilidad 𝑑𝑜𝑛𝑑𝑒 Γ(𝑥) = ∫ 𝑢 𝑥−1 𝑒 −𝑢 𝑑𝑢 𝑒𝑠 𝑙𝑎 𝑓𝑢𝑛𝑐𝑖ó𝑛 𝑔𝑎𝑚𝑚𝑎
0
Γ(𝑥) = (𝑥 − 1)! 𝑝𝑎𝑟𝑎 𝑥 𝑒𝑛𝑡𝑒𝑟𝑜
𝐹 (𝑥) = − 𝑝𝑎𝑟𝑎 𝛼 𝑛𝑜 𝑒𝑛𝑡𝑒𝑟𝑎
𝑗
Distribución
−𝑥⁄ (𝑥⁄𝛽 )
𝛼−1
acumulada
𝐹 (𝑥) = 1 − 𝑒 𝛽 ∑ 𝑝𝑎𝑟𝑎 𝛼 𝑒𝑛𝑡𝑒𝑟𝑎
𝑗!
𝑗=0

Rango [0, )
Parámetro de forma: 𝛼 > 0,05
Parámetros
Parámetro de escala: 𝛽 > 0
Media 𝛼𝛽
Varianza 𝛼 𝛽2

77/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Notas distribución gamma:


 Cuando el parámetro de forma ∝= 1, la distribución gamma devuelve la
distribución exponencial con: 𝜆 = 1⁄𝛽 .
 Cuando el parámetro de forma 𝛼 es un entero positivo, la distribución gamma
también se conoce como la distribución de 𝛼-Erlang con un parámetro 1⁄𝜆 = 𝛽

La función de densidad de probabilidades de la distribución gamma puede


presentar formas muy distintas dependiendo de los valores de los dos parámetros
𝛼 y 𝛽 como se muestra en la siguiente figura:

78/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución lognormal 𝑳𝑵(𝝁, 𝝈)


1 2 ⁄2𝜎 2
Distribución de probabilidad 𝑓 (𝑥) = 𝑒 − (𝑙𝑛 𝑥−𝜇) 𝑝𝑎𝑟𝑎 𝑥>0
𝜎√2𝜋
Distribución acumulada -
Parámetro de forma: 𝜎 > 0
Parámetros
Parámetro de escala: 𝜇
Rango [0, )
2 ⁄2
Media 𝑒 𝜇+𝜎
2 2
Varianza (𝑒 𝜎 − 1) 𝑒 2𝜇+𝜎

79/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución normal 𝑵(𝝁, 𝝈)


1 2 ⁄2𝜎 2
Distribución de probabilidad 𝑓 (𝑥) = 𝑒 −(𝑥−𝜇) 𝑝𝑎𝑟𝑎 − ∞ < 𝑥 < ∞
𝜎√2𝜋
Distribución acumulada -
Media 
Parámetros
Desviación estándar 
Rango (-, )
Media 
Varianza 2

80/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución triangular 𝑻(𝒂, 𝒃, 𝒄)


 2 x  a
 si a  x  c
  b  a  c  a 
Distribución de probabilidad f ( x)  
 2 b  x  si c  x  b
  b  a  c  a 

  x  a
2

 si a  x  c
  b  a  c  a 
Distribución acumulada F ( x)  
 b  x
2

1  b  a c  a si c  x  b
   
Valor mínimo: a
Parámetros Valor máximo: b
Moda: c (valor más probable o likeliest)
Rango  a, b 
1
Media a  b  c
3
Varianza 
1 2
18
a  b2  c 2  ab  ac  bc 

81/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución uniforme 𝑼(𝒂, 𝒃)


1
Distribución de probabilidad f ( x)  si a  x  b
ba
xa
Distribución acumulada F ( x)  si a  x  b
ba
Valor mínimo: a
Parámetros
Valor máximo: b
Rango  a, b 
1
Media a  b
2

b  a 
2

Varianza
12

82/83
UNIVERSIDAD BOLIVARIANA
SEDE LA SERENA
ESCUELA DE INGENIERÍA

Distribución de Weibull 𝑾(𝜸, 𝜶, 𝜷)



 x  
 
f  x       x   
Distribución de probabilidad  1   
e si x  0

 x  
 
F  x  1 e
Distribución acumulada   
si x  0
 = parámetro de localización (valor mínimo)
Parámetros  = parámetro de escala > 0
 = parámetro de forma > 0
Rango  ,  
Media     1   1 

Varianza  2  1  2 1   2 1   1 

83/83