Modela

Análisis de los Datos de
Entrada y Salida
Ing. César Fernández

Visión General
◼ Análisis de datos de entrada
◼ Identificación de distribuciones de probabilidad
de los datos de campo
◼ Pruebas de bondad de ajuste
◼ Generación de números aleatorios
◼ Análisis de datos de salida
◼ Non-terminating vs. terminating processes
◼ Intervalos de confianza
◼ Prueba de hipótesis para comparar diseños
¿Por qué el análisis de datos
de entrada y salida?
Input Data Output Data
Simulation Model
◼ Análisis de datos de entrada.

◼ Necesario para construir un modelo válido
◼ Tres aspectos
➢ Identificación de distribuciones (de tiempo)
➢ Generación de números aleatorios
➢ Generación de variables aleatorias.
➢ Análisis de datos de salida
➢ Necesario para sacar conclusiones correctas
➢ Las medidas de rendimiento informadas son típicamente variables
aleatorias.
Introducción
◼ Existen varias razones por las cuales los
análisis de datos de entrada/salida no se han
llevado a cabo de manera adecuada.
➢ Algunos usuarios tienen la impresión errónea de
que la simulación es en gran medida un ejercicio
de programación informática complicado, sin
embargo, una simulación es un experimento de
muestreo estadístico basado en computadora.
Introducción
➢ Una segunda razón para los análisis estadísticos
inadecuados es que los procesos de salida de
virtualmente todas las simulaciones no son
estacionarias y están autocorrelacionadas. Por lo
tanto, las técnicas estadísticas clásicas basadas
en observaciones IID no son directamente
aplicables.
Introducción
➢ Otro impedimento para obtener estimaciones
precisas de los parámetros o características
reales de un modelo es el tiempo de
procesamiento necesario para recopilar la
cantidad necesaria de datos de salida de
simulación. Esta dificultad a menudo ocurre en la
simulación de problemas militares a gran escala
o redes de comunicación de alta velocidad.
Introducción
◼ Nuestro objetivo es discutir métodos para el
análisis estadístico de los datos de entrada/salida
de simulación.
◼ Discutiremos algunos de los métodos importantes
para el análisis de resultados; sin embargo, se
hará hincapié en los procedimientos estadísticos
que son relativamente fáciles de entender e
implementar y que se ha demostrado que
funcionan bien en la práctica.
Aleatoriedad en datos de
entrada
◼ Recopilar datos de campo sin procesar y usar
como entrada para la simulación
◼ No hay dudas sobre la relevancia.
◼ Caro / imposible recuperar un conjunto de datos
lo suficientemente grande
◼ No disponible para nuevos procesos.
◼ No disponible para múltiples escenarios ⇒ Sin
análisis de sensibilidad
◼ Muy valioso para la validación del modelo.
Aleatoriedad en datos de
entrada
◼ Generar datos artificiales para usar como datos de
entrada.
◼ Debe capturar las características de los datos reales.
◼ Recopilar una muestra suficientemente grande de datos de campo
◼ Caracterizar los datos estadísticamente - Tipo de distribución y
parámetros
◼ Generar datos artificiales aleatorios que imiten los datos reales.
◼ Alta flexibilidad: fácil de manejar en nuevos escenarios
◼ Barato
◼ Requiere un análisis estadístico adecuado para garantizar la
validez del modelo
Procedimiento para modelar datos de entrada
1. Recopilar datos del ◼ Dibujar histogramas de los datos

sistema real ◼ Compare el histograma gráficamente
con formas de funciones de
distribución bien conocidas
2. Identificar una familia de ◼ Qué pasa con las colas de la
distribución, limitadas o ilimitadas
distribución adecuada.
Hipótesis de distribución rechazada
◼ ¿Cómo manejar los resultados

negativos?
3. Estimar los parámetros de • Prueba informal (al ojo)

la distribución y elegir una • Pruebas formales:
distribución "exacta" – 2 - test
– Kolmogorov-Smirnov test
4. Realizar la prueba de
bondad de ajuste Si no se puede aceptar una distribución
(¿Rechazar la hipótesis de que la Conocida  Usa una distribución empírica
distribución elegida es correcta?)
Ej: Modelado de tiempos entre
llegadas (I)
1. Recopilación de datos del sistema real
Tiempo entre llegadas (t) Frecuencia
0t<3 23
3t<6 10
6t<9 5
9t<12 1
12t<15 1
15t<18 2
18t<21 0
21t<24 1
24t<27 1
Etc.
llegadas (II)
◼ Identificar un tipo de distribución / familia apropiada
◼ Dibujar el histograma
1. Dividir los datos en intervalos apropiados
◼ Generalmente de igual tamaño
2. Determine la frecuencia del evento para cada intervalo
3. Dibujar la frecuencia (eje y) para cada intervalo (eje x)
25
20
15 La distribución
exponencial parece
10 ser una buena
primera suposición
5
0
0-3 3-6 6-9 9-12 <15 <18 <21 <24 <27
llegadas (III)
◼ Estimar los parámetros que definen la distribución elegida.
◼ En el ejemplo, 𝐸𝑥𝑝 𝛼 ha sido elegido ⇒ necesita estimar el
parámetro 𝛼
◼ ti = es el i-ésimo tiempo entre llegadas en la muestra recolectada de
𝑛 observaciones
N
 ti
1 1
= t = i=1   = = ... = 0.084
 N t
llegadas (IV)
◼ Realizar prueba de bondad de ajuste
◼ El propósito es probar la hipótesis de que los datos
se describen adecuadamente mediante la
distribución elegida en los pasos 1-3
◼ Dos de las pruebas estandarizadas más conocidas
son
◼ La prueba 2
◼ No debe aplicarse si el tamaño de la muestra n <20
◼ La prueba de Kolmogorov-Smirnov
◼ Una prueba relativamente simple pero imprecisa
◼ A menudo se usa para muestras pequeñas
Validez de la prueba 2
◼ Depende del tamaño de la muestra 𝑛 y del tamaño de los
intervalos
◼ Reglas de dedo
◼ La prueba  es aceptable para los niveles de significancia ordinarios
2
(𝛼 = 1%, 5%) si el número esperado de observaciones en cada

intervalo es mayor que 5 (n*pi>5 para todo i)
◼ En el caso de datos continuos y una selección de ancho de intervalo
de modo que pi sea igual para todos intervalos
◼ n<=20 No utilice la prueba 2
◼ 20<n<=50 5-10 intervalos recomendables
◼ 50 <n<=100 10-20 intervalos recomendables
◼ n>100 n0.5 - 0.2n intervalos recomendables
La prueba de Kolmogorov-
Smirnov (I)
◼ Ventajas sobre la prueba de chi-cuadrado
◼ No requiere decisiones sobre los anchos de
intervalos
◼ A menudo se aplica para tamaños de muestra
más pequeños
Smirnov (II)
◼ Desventajas
◼ Idealmente, todos los parámetros de distribución
deben conocerse con certeza para que la prueba
sea válida.
◼ Existe una versión modificada basada en valores de
parámetros estimados para las distribuciones Normal,
Exponencial y Weibull
◼ En la práctica, a menudo también se usa para otras
distribuciones
◼ Para muestras con n>=30, la prueba 2 es más
confiable
Smirnov (III)
◼ Compara un CDF empírico de "frecuencia
relativa" con el CDF teórico (𝐹(𝑥)) de una
distribución elegida (hipotética)
◼ El CDF empírico=Fn(x)=(número de xi<=x)/n
◼ n = número de observaciones en la muestra
◼ xi = el valor de la i-ésima observación más
pequeña en la muestra
◼ 𝐹𝑛 𝑥𝑖 = 𝑖 Τ𝑛
Smirnov (IV)
◼ Procedimiento
◼ Ordene los datos de muestra del valor más pequeño al
más grande
◼ Calcule D+, D– y D=max {D+,D–}
i − 1
D + = max  − F( x i ) D − = max  F( x i ) −
i
1i  n  n  1i  n  n 
◼ Encuentre el valor KS crítico tabulado correspondiente al

tamaño de muestra 𝑛 y el nivel de significancia elegido 𝛼,
◼ Si el valor crítico de KS>=D ⇒ rechaza la hipótesis de que
𝐹(𝑥) describe la distribución de los datos
Elección de distribución en
ausencia de datos de muestra
◼ Situación común especialmente al diseñar
nuevos procesos
◼ Tratar de aprovechar el conocimiento de personas
involucradas en tareas similares
◼ Cuando las estimaciones de las longitudes de
intervalo están disponibles
◼ Ex. El tiempo de servicio oscila entre 5 y 20 minutos.
⇒ Conviene usar una distribución uniforme con min = 5
y max = 20
Elección de distribución en
ausencia de datos de muestra
◼ Cuando existen estimaciones del intervalo y el
valor más probable
◼Ex. min=5, max=20, muy probablemente = 12
⇒ Conviene usar una distribución triangular con esos
valores de parámetros
◼ Cuando las estimaciones de min=a, muy
probablemente=c, max = b y el valor promedio =
x están disponibles
⇒Use una distribución 𝛽 con los parámetros 𝛼 y 𝛽
( x − a )( 2c − a − b) (b − x )
= =
(c − x )( b − a ) (x − a)
Comportamiento transitorio y de
estado estable de un Proceso
estocástico
Considere la salida del proceso estocástico Y1, Y2,
… Sea 𝐹𝑖 𝑦|𝐼 = 𝑃 𝑌𝑖 ≤ 𝑦|𝐼 para todo i=1,2,…
donde 𝑦 es un número real e 𝐼 representa las
condiciones iniciales usadas para empezar la
simulación en el tiempo 0.
Para un sistema de manufactura, 𝐼 podría
especificar el número de trabajos presentes y si
cada máquina está ocupada o inactiva, en el
tiempo 0.
estocástico
Llamaremos 𝐹𝑖 𝑦|𝐼 a la distribución transitoria del
proceso de salida en el tiempo (discreto) 𝑖 para
las condiciones iniciales 𝐼.
Para 𝑦 e 𝐼 fijos, las probabilidades 𝐹1 𝑦|𝐼 ,
𝐹2 𝑦|𝐼 , … son solo una secuencia de números. Si
𝐹𝑖 𝑦|𝐼 → 𝐹 𝑦 cuando 𝑖 → ∞ para toda 𝑦 y para
cualquier condición inicial 𝐼, entonces 𝐹(𝑦) se
llama distribución de estado estable del proceso
de salida Y1, Y2, …
estocástico
En la práctica, sin embargo, a menudo habrá un
índice de tiempo finito, por ejemplo, 𝑘 + 1, de
modo que las distribuciones a partir de este
momento serán aproximadamente iguales entre
sí; "estado estable" se dice figurativamente que
comienza en el tiempo k+1 como se muestra en
el siguiente slide.
estocástico
estocástico
Nota: El estado estable no significa que todas las
variables aleatorias Yk+1, Yk+2, … tomarán el
mismo valor en una simulación particular; más
bien, significa que tendrán aproximadamente la
misma distribución.
La distribución de estado estable 𝐹 𝑦 no depende
de las condiciones iniciales 𝐼; sin embargo, la tasa
de convergencia de la distribución transitoria
𝐹𝑖 𝑦|𝐼 a 𝐹 𝑦 sí
estocástico
Ejemplo: Considere el proceso estocástico 𝐶1, 𝐶2, …
para un problema de inventario donde 𝐶𝑖 es el
costo total en el iésimo mes. En la figura,
graficamos la convergencia de 𝐸(𝐶𝑖 ) con la media
de estado estable 𝑐 = 𝐸(𝐶) = 112.11 a medida
que aumenta 𝑖 hasta un nivel de inventario de 57
estocástico
Tipos de simulaciones con
respecto al análisis de la salida
Las opciones disponibles en el diseño y análisis de
experimentos de simulación dependen del tipo de
simulación disponible, como se muestra. Las
simulaciones pueden ser terminating o
nonterminating, dependiendo de si hay una forma
obvia de determinar la longitud de la ejecución.
Además, las medidas de rendimiento o parámetros
para simulaciones pueden ser de varios tipos,
como se muestra en la figura
Process
Process
Simulation
Simulation
Non-terminating
Non-terminating Terminating
Terminating
Steady
Steady state
state Transient
Transient state
state Time-controlled
Time-controlled Event-controlled
Event-controlled
analysis
analysis analysis
analysis termination
termination termination
termination
Terminating simulation: es uno para el que hay un
evento "natural" 𝐸 que especifica la duración de cada
ejecución (replicación). Dado que las diferentes
ejecuciones usan números aleatorios independientes y
la misma regla de inicialización, esto implica que las
variables aleatorias comparables de las diferentes
ejecuciones son IID.
Dado que las condiciones iniciales para una
terminating simulation generalmente afectan las
medidas de rendimiento deseadas, estas condiciones
deberían ser representativas de las del sistema real.
Termina después de un lapso de tiempo predeterminado
◼ Normalmente, el sistema comienza desde un estado vacío y termina
en un estado vacío
◼ Ex. Una tienda de comestibles, un proyecto de construcción, ...
◼ Los procesos de terminación pueden o no alcanzar el estado
estable
◼ Por lo general, el período transitorio es de gran interés para estos
procesos.
◼ Datos de salida generalmente obtenidos de múltiples
ejecuciones de simulaciones independientes
◼ La duración de una ejecución está determinada por la terminación
natural del proceso.
◼ Cada ejecución necesita un flujo diferente de números aleatorios
◼ El estado inicial de cada ejecución suele ser el mismo.
Ejemplo 1: un fabricante aeroespacial recibe un
contrato para producir 100 aviones, que deben
entregarse en 18 meses. A la compañía le gustaría
simular varias configuraciones de fabricación para ver
cuál puede cumplir con el plazo de entrega al menor
costo. En este caso E = 100 aviones completados.
Ejemplo 2: Considere una empresa de fabricación que
opera 16 horas al día (dos turnos) con WIP durante un
día al siguiente. ¿Calificaría esto como una simulación
de terminación con E = 16 horas de tiempo simulado?
No, dado que la operación de fabricación es
esencialmente un proceso continuo, siendo las
condiciones finales para un día las condiciones iniciales
para el día siguiente.
Nonterminating simulation: es uno para el que no hay
un evento natural 𝐸 para especificar la duración de
una corrida. Esto ocurre a menudo cuando estamos
diseñando un nuevo sistema o cambiando un sistema
existente, y estamos interesados en el
comportamiento del sistema a largo plazo cuando está
funcionando "normalmente". Se dice que una medida
de rendimiento para dicha simulación es un parámetro
de estado estable si es una característica de la
distribución en estado estable de algún proceso
estocástico de salida Y1, Y2, …
Cabe mencionar que los procesos estocásticos para la
mayoría de los sistemas reales no tienen distribuciones
de estado estable, ya que las características del
sistema cambian con el tiempo.
Ejemplo: Considerar un call center. Suponer que la
tasa de llegada de las llamadas al sistema varía con la
hora del día y el día de la semana, pero suponga que
el patrón de tasas de llegada es idéntico de semana a
semana.
Nonterminating process:
◼ Suele alcanzar un estado estable después de un período
transitorio inicial
◼ Asume que los datos de entrada son estacionarios
◼ Para estudiar el comportamiento en estado estable, es
vital determinar la duración del período transitorio
◼ Examine las gráficas de líneas de las variables de salida.
◼ Para reducir la duración del período transitorio (= “warm-
up")
◼ Inicialice el proceso con valores promedio apropiados
Estado transitorio y estable
Gráfica de línea de tiempos de ciclo y tiempo de ciclo promedio
30
Transient Steady state

state
25
20
Cy cle tim e
15
10
0 5 10 15 20 25 30 35 40 45 50
S imu lat ion time

Sea 𝐷𝑖 el retraso experimentado por la i-ésima llamada
entrante. El proceso estocástico 𝐷1, 𝐷2, … no tiene una
distribución de estado estable. Sea 𝐷𝑖𝐶 sea el retraso
promedio durante la i-ésima semana. Entonces
podríamos estar interesados en el retraso promedio
esperado en estado estable durante una semana, 𝜐 𝐶 =
𝐸 𝐷𝐶
Análisis estadístico para
terminating simulations
Asuma por simplicidad que hay una sola medida de
desempeño de interés. Sea Xj ser una variable
aleatoria definida en la j-ésima replicación para j = 1,
2, ..., n; se supone que las Xj son variables aleatorias
IID.
Estimación de medias:
Supongamos que nos gustaría obtener una estimación
puntual y un intervalo de confianza para la media 𝜇 =
𝐸(𝑋), donde X es una variable aleatoria
Si hacemos 𝑛 repeticiones independientes de la
simulación y tenemos 𝑋1 , 𝑋2 , … , 𝑋𝑛 variables aleatorias
IID resultantes, podemos calcular 𝑋ത 𝑛 como un
estimador para 𝜇, y un intervalo de confianza
aproximado del 100 (1 − 𝛼) por ciento (0 < 𝛼 < 1) para
𝜇 viene dado por:
𝑆2 𝑛
𝑋ത 𝑛 ± 𝑡𝑛−1,1−𝛼Τ2
𝑛
Donde 𝑆 2 𝑛 es la varianza muestral y llamaremos a este
intervalo de confianza, el procedimiento de tamaño de
muestra fijo
Existen teoremas de límite central para ciertos tipos de
datos correlacionados que establecen que los promedios
de estos datos se distribuyen aproximadamente de manera
normal a medida que aumenta el número de puntos en el
promedio.
Obteniendo una precisión especificada:

Una desventaja del tamaño fijo de la muestra basada en 𝑛
repeticiones es que el analista no tiene control de la
longitud media del intervalo de confianza o la precisión de
𝑋ത 𝑛 ; para 𝑛 fijo, la longitud media dependerá de 𝑉𝑎𝑟(𝑥),
la varianza poblacional de las 𝑋𝑗
El objetivo será definir un procedimiento para determinar
el número de repeticiones requeridas para estimar la
media 𝜇 = 𝐸 𝑋 con una precisión especificada.
El procedimiento asume que 𝑋1 , 𝑋2 , … es una secuencia de
variables aleatorias IID que no necesitan ser normales. El
objetivo específico del procedimiento es obtener un
estimado de 𝜇 con un error relativo de 𝛾 con 0 < 𝛾 < 1 y
un nivel de confianza de 100 1 − 𝛼 por ciento.
Para empezar elegir un número inicial de repeticiones 𝑛0 ≥
𝑆2 𝑛
2 y sea 𝛿 𝑛, 𝛼 = 𝑡𝑛−1,1−𝛼Τ2 el intervalo de confianza
𝑛
habitual de media longitud
Entonces el procedimiento secuencial es el siguiente:
0. Hacer 𝑛0 repeticiones de la simulación y hacer 𝑛 = 𝑛0
1. Calcular 𝑋ത 𝑛 y 𝛿 𝑛, 𝛼 a partir de 𝑋1 , 𝑋2 , … , 𝑋𝑛
2. Si 𝛿 𝑛, 𝛼 Τ 𝑋ത 𝑛 ≤ 𝛾′, usar como la estimación puntual y stop.
Equivalentemente 𝐼 𝛼, 𝛾 = 𝑋ത 𝑛 − 𝛿 𝑛, 𝛼 , 𝑋ത 𝑛 + 𝛿 𝑛, 𝛼 . Es un
intervalo de confianza aproximado del 100 (1 − 𝛼) por ciento con
la precisión deseada. Else, reemplazar n por n + 1, realizar una
replicación adicional de la simulación y vaya al paso 1.
Tener en cuenta que el procedimiento calcula una nueva
estimación de 𝑉𝑎𝑟(𝑋) después de cada repetición, y que el
número total de repeticiones requeridas por el
procedimiento es una variable aleatoria.
parámetros de Estado Estable
La técnica más frecuentemente sugerida para tratar este
tema se llama warming-up del modelo o eliminación de
datos iniciales. La pregunta es cómo elegir el período de
warm-up (o la cantidad a eliminar).
La técnica más simple y más general para determinar este
período (warming-up period) es un procedimiento gráfico.
El número de repeticiones debe ser lo suficientemente
grande como para incluir un número razonable de veces
los eventos no frecuentes (por ejemplo, fallas de equipos).
El principal problema con esta metodología es que se
deben realizar un gran número de repeticiones si los
procesos 𝑌1 , 𝑌2 , … son muy variables
Comparación de configuraciones
alternativas del sistema
Un requisito básico para utilizar muchos métodos
estadísticos para comparar configuraciones
alternativas es la capacidad de recopilar observaciones
IID con expectativas iguales a la medida de
rendimiento deseada.
El propósito es presentar varios tipos diferentes de
problemas de comparación y selección que se han
encontrado útiles en simulación, junto con los
procedimientos estadísticos apropiados para su
solución.
Intervalos de confianza para la diferencia entre las
respuestas esperadas de dos sistemas
Consideramos el caso especial de comparar dos sistemas
sobre la base de alguna medida de rendimiento o respuesta
esperada. Se efectúa esta comparación formando un
intervalo de confianza para la diferencia en las dos
expectativas, en lugar de hacer la prueba de hipótesis para
ver si la diferencia observada es significativamente diferente
de cero. Mientras que una prueba da como resultado solo
una conclusión de "rechazar" o "no rechazar", un intervalo de
confianza nos brinda esta información y también cuantifica
cuánto difieren las expectativas, si es que lo hacen.
Tomaremos un enfoque paramétrico, es decir, de teoría
normal, porque es simple y familiar, y además debería ser
bastante robusto en este contexto, ya que la asimetría
problemática en las distribuciones subyacentes de las
variables aleatorias de salida debería mejorarse con la
sustracción.
Se pueden considerar dos métodos:
➢ Un intervalo de confianza t emparejado
➢ Un intervalo de confianza modificado de dos muestras t

Clasificación y selección
Seleccionar el mejor de k sistemas:
El procedimiento estadístico para resolver este problema
involucra un muestreo de “dos etapas” para cada uno de
los k sistemas. En la primera etapa, hacemos un número
fijo de repeticiones de cada sistema, luego utilizamos las
estimaciones de varianza resultantes para determinar
cuántas repeticiones más de cada sistema son necesarias
en una segunda etapa de muestreo para llegar a una
decisión.
Métodos de Reducción de
Varianza
➢ En la mayoría de las simulaciones, los
experimentos tienen por objetivo obtener
valores medios de los resultados que se
muestrean (de sus distribuciones).
➢ El método utilizado es el de realizar varias
replicaciones independientes.
➢ Cuanto mayor sea la varianza obtenida,
mayor debe ser la cantidad de replicaciones a
realizar.
Varianza
➢ Replicaciones:
En el método de las replicaciones se ejecutan
𝑛 corridas independientes, se estima el valor
de la respuesta media, 𝜇𝑋 = 𝐸(𝑋) y la 𝑉𝑎𝑟(𝑋).
La mejora obtenida al realizar 𝑛 replicaciones,
en lugar de una, surge de:
σ 𝑋𝑖 1 𝑉𝑎𝑟 𝑋
ത
𝑋= y 𝑉𝑎𝑟 𝑋ത = 𝑛𝑉𝑎𝑟 𝑋 =
𝑛 𝑛2 𝑛
La reducción obtenida esta dada por:
1
𝑉𝑎𝑟 𝑋 − 𝑉𝑎𝑟 𝑋ത = 1 − 𝑉𝑎𝑟 𝑋
𝑛
Varianza
➢ Tasas Constantes:
El uso de tasas de arribo y/o estadías constantes
(determinísticas) reduce considerablemente la
varianza de las muestras obtenidas como
resultados.
Usarlos con precaución, todas las características
estocásticas del sistema pueden perderse, al quizás
obtener datos sobre o sub-evaluados.
La incorporación de valores constantes puede ser
útil como forma de establecer cotas para las
medidas buscadas.
Varianza
➢ Torrentes Comunes:
Esta técnica se usa para determinar diferencias
entre resultados, cuando los niveles de los factores
son cambiados.
Si 𝑋𝑖 es el resultado de una corrida respecto a un
determinado nivel e 𝑌𝑖 es el resultado respecto de
otro nivel, entonces 𝑋ത − 𝑌ത es la diferencia entre las
medias resultantes de 𝑛 corridas para cada nivel,
puede ser usada para estimar el valor esperado de
la diferencia 𝐸 𝑋ത − 𝑌ത
Varianza
Para reducir el número necesario de corridas
queremos minimizar la varianza de la estimación:
𝑉𝑎𝑟 𝑋ത − 𝑌ത = 𝑉𝑎𝑟 𝑋ത + 𝑉𝑎𝑟 𝑌ത − 2𝐶𝑜𝑣 𝑋, ത 𝑌ത
Si 𝑋ത e 𝑌ത son independientes 𝐶𝑜𝑣 𝑋,
ത 𝑌ത = 0
Observar que los resultados 𝑋𝑖 e 𝑌𝑖 de la corrida 𝑖
están emparejados de tal modo, que se puede asumir
que la diferencia entre ambos se debe nada más que
al cambio en el nivel del factor entonces 𝑋ത e 𝑌ത no son
independientes.
Si la covarianza es grande, la varianza de la diferencia
será mucho menor.
Varianza
Esta condición es verdadera siempre que se usen
diferentes torrentes de números para cada
distribución de los experimentos (si no, se puede
introducir correlación entre ellos). Solamente se
cambian los niveles de los factores entre pares de
experimentos.
Por ejemplo para un sistema del hospital se utilizan
distintos torrentes para los arribos, el tiempo de las
estadías de los pacientes a operarse, a no operarse,
tiempos de operación, tiempos pos-operatorios.
Varianza
Ejemplo: cambiamos el factor número de
camas; si lo aumentamos, entonces el largo de
las colas y los tiempos de espera disminuirán.
Las tasas de arribos y los tiempos de las
actividades se mantendrán intocables entre
ambos experimentos, así como las mismas
entidades utilizarán los recursos en el mismo
orden.
Del mismo modo podemos razonar con el factor
tiempo de apertura de la sala de operaciones.
Varianza
Si cambiamos un solo factor, entonces las
diferencias entre experimentos es bastante
determinada y los análisis estadísticos entre
resultados emparejados son más manejables.
En simulaciones más complejas y cuando se
cambia más de un nivel, entonces los efectos
en los resultados pueden ser impredecibles.
Varianza
Otro problema surge al intentar repetir
corridas de modo de comparar con diferentes
conjuntos de números pseudoaleatorios.
Tener especial cuidado de no repetir ningún
torrente de números ya que esto podría llegar
a causar correlación entre los resultados de
los experimentos.
Varianza
En resumen, el método de usar diferentes
torrentes para cada distribución, y utilizar
torrentes comunes en experimentos utilizando
distintos niveles en uno (o más) factor(es), es
un método efectivo para reducir la varianza
en simulaciones de tipo comparativas.
Varianza
➢ Método Antitético:
Este método se basa en las llamadas variables
antitéticas y en la hipótesis de que si un torrente de
números pseudoaleatorios produce resultados de
valores altos, entonces el torrente opuesto producirá
resultados bajos, por lo tanto están correlacionados
negativamente.
Variables antitéticas se llaman a dos conjuntos muy
especiales de torrentes (streams) de números
pseudoaleatorios: u1, u2, u3, u4, u5 ... y su
complementario (1-u1), (1-u2), (1-u3), (1-u4) ...
Varianza
Si una simulación se corre con dos torrentes de números

antitéticos, realizando n pares de corridas, el promedio
de los resultados deberá estar más cerca del valor
esperado que el promedio de corridas usando torrentes
de números independientes.
Esto es cierto en modelos pequeños y simples. No
siempre se cumple en sistemas complejos donde por
ejemplo la salida de alguna actividad es luego la tasa de
entrada de otra, etc...
Varianza
Es un método fácil de implementar y puede ser
utilizado para testear problemas sencillos.
Se ejecutan pares de corridas:
1 2 1 2
𝑋1 , 𝑋1 … 𝑋𝑛 , 𝑋𝑛
Donde:
1
➢ 𝑋𝑗 es el resultado de la corrida j usando el torrente u.
2
➢ 𝑋𝑗 es el resultado de la corrida j usando el torrente 1-u.
Varianza
1 2
Por ser 𝑋𝑗 y 𝑋𝑗 muestras resultantes del modelo,
entonces 𝐸 𝑋𝑗 1 = 𝐸 𝑋𝑗 2 = 𝜇.
El total de replicaciones es 2𝑛.
Los pares de resultados son independientes entre sí.
(Cada par de muestras es independiente de los otros).
1 2
Como (𝑋𝑗 ), (𝑋𝑗 ) están correlacionados
negativamente entonces existe reducción de varianza,
en modelos sencillos.
Varianza
➢ Método de variables de control:
Vamos a utilizar nuestro conocimiento sobre 𝑌 en el
sentido de que va a acercar a 𝑋 a su media µ
(hacia abajo o hacia arriba), reduciendo su
variabilidad de una corrida a otra.
Por eso llamamos a 𝑌 variable de control de 𝑋 , la
utilizaremos para ajustar 𝑋, es decir para controlarla
parcialmente. Para ello debemos cuantificar el porte de
ese ajuste.
Ejemplo: 𝑌 puede ser la variable aleatoria de los arribos
en una fila de espera.
Varianza
Sea 𝒂 una constante a determinar que tiene el mismo
signo que la correlación entre 𝑿 e 𝒀.
(𝒀 − 𝝂) es la desviación de 𝒀 con respecto de su media 𝝂.
Calculamos el valor controlado de 𝑋.
𝑋𝑐 = 𝑋 − 𝑎 𝑌 − 𝜈
Si 𝑿 e 𝒀 están correlacionados positivamente entonces 𝒂 >
𝟎, por lo que ajustaremos 𝑋, hacia abajo si 𝑌 > 𝜈, y hacia
arriba si 𝑌 < 𝜈.
Si X e Y están correlacionados negativamente haremos lo
opuesto.
Varianza
𝑋𝑐 = 𝑋 − 𝑎 𝑌 − 𝜈 , 𝐸 𝑋 = 𝜇 y 𝐸 𝑌 = 𝜈
Entones para cualquier 𝑎:
𝐸 𝑋𝑐 = 𝜇
𝑉𝑎𝑟 𝑋𝑐 = 𝑉𝑎𝑟 𝑋 + 𝑎2 𝑉𝑎𝑟 𝑌 − 2𝑎 𝐶𝑜𝑣 𝑋, 𝑌
O sea que la dispersión de 𝑋𝑐 es menor que la de 𝑋 si y

solo si:
2𝑎 𝐶𝑜𝑣 𝑋, 𝑌 > 𝑎2 𝑉𝑎𝑟 𝑌
Varianza
Lo importante de este método es elegir el mejor valor
de 𝑎, de forma de minimizar el valor de 𝑉𝑎𝑟 𝑋𝑐 .
Calculando la derivada de 𝑉𝑎𝑟 𝑋𝑐 en 𝑎, obtenemos:

2𝑎 𝑉𝑎𝑟 𝑌 − 2 𝐶𝑜𝑣 𝑋, 𝑌 , igualamos a 0 para obtener
el mejor valor
𝑎= 𝐶𝑜𝑣 𝑋, 𝑌 ൘𝑉𝑎𝑟 𝑌
Varianza
En la práctica esto no es tan fácil, ya que depende de

la naturaleza de la variable 𝒀, muchas veces no
conocemos 𝑽𝒂𝒓(𝒀).
Entonces se puede utilizar un método alternativo para

calcular "𝒂" con los datos de la propia simulación.
Varianza
Qué variables usar como variables de control, no es muy
fácil de determinar. En un simple M/M/1 podríamos estimar
𝑋 como la demora en cola y usar como variable de control
los tiempos de servicios (cuya tasa conocemos). En este
caso se utiliza nada más que una sola variable de control.
Pero la varianza de la estimación de una respuesta se
puede ver mejorada utilizando más de una variable de
control
En la elección de variables de control recordar que los
tiempos de las actividades influyen en los largos de las
colas y también en el uso de los recursos implicados.
Varianza
Sin embargo las tasas de arribo solo influyen en las primeras
actividades por eso es conveniente:
a) Identificar aquellos factores que puedan estar
correlacionados con las respuestas.
b) Estimar la varianza y el promedio de cada factor, así como
la covarianza entre ellos y la respuesta asociada.
c) Ajustar la estimación de la respuesta mediante la
ponderación de las variables de control.
d) Este método es muy usado para realizar experimentos, ya
que luego de haber calculado a) y b) se pueden realizar
muchas corridas cambiando niveles de factores e hipótesis.
Varianza
Resumen:
➢ El uso de torrentes comunes de números es útil
en simulaciones comparativas.
➢ El método de variables antitéticas es útil en
simulaciones simples.
➢ El método de variables de control es útil en caso
de realizar simulaciones para por ejemplo explorar el
efecto del uso de distintos datos o políticas en una
organización.
Análisis de datos de salida de
simulación
Los datos de salida recopilados de un modelo de
simulación son resultado de variables estocásticas.
◼ Resultados de datos de entrada aleatorios y tiempos
de procesamiento aleatorios
 Se requiere un análisis estadístico para

1. Estimar las características de rendimiento
– Media, varianza, intervalos de confianza, etc. para variables
de salida
2. Comparar características de rendimiento para
diferentes diseños
Análisis de datos de salida de
simulación
La validez del análisis estadístico y las
conclusiones del diseño dependen de un
enfoque de muestreo cuidadoso
◼ Tamaños de muestra: longitud de la corrida y
número de corridas.
◼ ¿Inclusión o exclusión de períodos de “warm-
up"?
◼ ¿Una simulación larga o varias más cortas?
Determinar un tamaño
apropiado de muestra
Un problema común en la simulación.
➢ ¿Cuántas corridas y de cuánto tiempo deberían ser?
Depende de la variabilidad de las variables de salida
buscadas.
Si se desea un intervalo de confianza simétrico de ancho
2d (donde d es la mitad del ancho del intervalo) para
una medida de rendimiento promedio 𝜇
x −d   x +d
Determinar un tamaño
apropiado de muestra
Si 𝑋ത esta normalmente distribuido entonces:
d = (  Z / 2 ) / n  n = ((   Z  / 2 ) / d )2
Si 𝜎 es desconocida se estima utilizando s:
n = ((s  Z  / 2 ) / d )2
Comparación de resultados de
diferentes diseños
En los proyectos de diseño de procesos de negocio, la
simulación se utiliza a menudo como una herramienta
para comparar el rendimiento de diferentes alternativas
de diseño de procesos.
Es importante no solo estimar el valor esperado de una
variable de salida, sino también investigar si este valor
es igual a un punto de referencia crítico o un valor
objetivo, o si existen diferencias estadísticamente
significativas entre las medidas de rendimiento promedio
de dos alternativas de diseño de procesos.
Comparación de resultados de
diferentes diseños
Las variables de salida en general son variables
aleatorias, que son importantes para que el análisis
comparativo tenga en cuenta la incertidumbre de la
estimación.
Una forma estadísticamente correcta de hacer esto es
utilizar la prueba de hipótesis.

Modela

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Modela

Cargado por

Copyright:

Formatos disponibles

Análisis de los Datos de

Ing. César Fernández

◼ Análisis de datos de entrada.

1. Recopilar datos del ◼ Dibujar histogramas de los datos

◼ ¿Cómo manejar los resultados

3. Estimar los parámetros de • Prueba informal (al ojo)

(𝛼 = 1%, 5%) si el número esperado de observaciones en cada

◼ Encuentre el valor KS crítico tabulado correspondiente al

Transient Steady state

S imu lat ion time

Obteniendo una precisión especificada:

➢ Un intervalo de confianza modificado de dos muestras t

Si una simulación se corre con dos torrentes de números

O sea que la dispersión de 𝑋𝑐 es menor que la de 𝑋 si y

Calculando la derivada de 𝑉𝑎𝑟 𝑋𝑐 en 𝑎, obtenemos:

En la práctica esto no es tan fácil, ya que depende de

Entonces se puede utilizar un método alternativo para

 Se requiere un análisis estadístico para

Si 𝜎 es desconocida se estima utilizando s:

También podría gustarte