Está en la página 1de 16

Universidad de San Carlos de Guatemala

Facultad de Ingeniería
Escuela Ingeniería Mecánica Industrial
Investigación de Operaciones II
Segundo Semestre 2020
Inga. Nora Leonor García Tobar

DISEÑOS DE EXPERIMENTOS DE
SIMULACIÓN

GRUPO 6 SECCIÓN A+

Nombre Carné Sección

Erwin Estuardo Aragón Gómez 201709060 A+

Sergio Rafael Garzaro Díaz 201700542 A+

Maria Fernanda Marroquin Marroquin 201800504 A+

Javier Marcelo Méndez Chacón 201807508 A+

Mario David Pineda Montoya 201504380 A+


INTRODUCCIÓN

Los estudios de simulación, empleados en diversas áreas de la investigación, son de


gran utilidad para conocer el comportamiento de ciertos fenómenos bajo diferentes
escenarios virtuales propiciador por el investigador, a través de algún software
especializado. En el campo de la estadística son muy comunes los estudios de
robustez, muchos de ellos utilizados para observar el comportamiento de un
estimador ante diferentes situaciones hipotéticas que pudieran presentarse en la
realidad. Dada la semejanza entre los estudios de simulación y los estudios
experimentales, el objetivo de este trabajo es proponer el uso de la metodología y del
diseño y análisis de experimentos en los estudios de simulación.

Los estudios experimentales de efectos fijos son utilizados para estudiar el efecto de
ciertas variables controladas por el investigador, una de las diferencias fundamentales
entre este tipo de experimentos computacionales y los experimentos físicos es que
en los primeros se tiene mayor control sobre los factores que inciden sobre una
respuesta ya que estos factores son generados a partir de algoritmos estocásticos
predefinidos cuyos parámetros son especificados por el investigador.

Una de las ventajas de estos estudios es que no requieren de muchas unidades


muéstrales o réplicas dado que la fuente de variabilidad es controlada. Cada
tratamiento se encuentra conformado por la combinación de los diferentes niveles de
los factores generando un escenario en particular.
JUSTIFICACIÓN

Los modelos markovianos pueden jugar un papel muy importante en los estudios
que involucran datos longitudinales bien sea de manera prospectiva o retrospectiva.
El análisis de los resultados del presente estudio de simulación se llevará a cabo bajo
el enfoque de un diseño experimental de efectos fijos, facilitando la presentación e
interpretación de los resultados.

Variables respuesta en muchos estudios de simulación podrían ser por ejemplo el


sesgo relativo, una media, una medida de dispersión o una proporción de aciertos.
Como factores se tomarían aquellas variables para las cuales se desea ver el efecto
sobre la respuesta.
OBJETIVOS

General
Desarrollar y explicar de manera amplia y entendible el tema de Diseños de
Experimentos de Simulación, de manera que se pueda entender la importancia y
utilidad de este.

Específicos
1. Comparar y evaluar los Sistemas de Muestras Independientes contra los
Sistemas de Muestras Correlacionadas.
2. Exponer de manera amplia los sistemas Múltiples, dentro de los cuales se
encuentran el Método de Bonferroni y los Modelos de Diseño Experimental.
3. Desarrollar ejemplos relacionados al tema de Diseños de Experimentos de
Simulación para permitir una mejor comprensión del mismo.
MARCO TEÓRICO

Desarrollo de experimentos de simulación

Los estudios de simulación, empleados en diversas áreas de la investigación, son de


gran utilidad para conocer el comportamiento de ciertos fenómenos bajo diferentes
escenarios virtuales propiciados por el investigador a través de algún software
especializado.

Existen diversos tipos de diseños experimentales de efectos fijos, para elegir alguno
de ellos se debe de tomar en cuenta la disponibilidad de recursos tales como el
tiempo. Una de las ventajas de estos estudios es que no requieren de muchas
unidades muestrales (más conocidas como unidades experimentales) o réplicas dado
que la fuente de variabilidad es controlada, garantizando las mismas condiciones en
cada corrida o ejecución del experimento. En total, un experimento arrojará (k x n)
observaciones, donde (k) es el número de tratamientos y (n) el número de réplicas.
Las herramientas estadísticas utilizadas para analizar los datos que resultan de un
experimento son muy conocidas y se basan en el análisis de varianza y en la regresión
múltiple o modelo lineal general.

Cada tratamiento se encuentra conformado por la combinación de los diferentes


niveles de los factores generando un escenario en particular. Cuando dicho escenario
corresponde a una situación virtual, propiciada por algún software especializado, se
habla de los estudios de simulación. El análisis de los datos que resultan de un estudio
de simulación se limita a la descripción de los mismos por medio de gráficos y tablas
que contienen medidas de tendencia central y dispersión de la variables y respuestas
para cada uno de los diferentes escenarios simulados, sin pasar luego por un análisis
inferencial. Los análisis realizados son muy descriptivos y no es común emplear
técnicas inductivas para establecer diferencias significativas entre los diferentes
tratamientos.

Materiales y métodos

Lo más importante que hay que definir es qué se va a medir variables y respuestas
en función de qué (factores y bloques). Para la generación de este se establece los
pasos siguientes:

1) Planteamiento del problema: el planteamiento del problema lleva a deducir


cuáles variables respuesta serán medidas, y a su vez, según la escala de estas
variables, qué tipo de análisis elegir.
2) Selección de las variables respuesta
3) Elección de factores y niveles: Los factores y sus niveles, tienen que ver
también con el planteamiento del problema ya que de éstos van a depender
las variables respuesta.
4) Elección del diseño experimental o tipo de experimento: se piensa en un
experimento multifactorial de efectos fijos.
5) Desarrollo del experimento: a partir d ellos datos ya establecidos se corre la
simulación.
6) Análisis estadístico de los datos: Al término de éstas se construye una base de
datos con los resultados y se procede al análisis estadístico. Éste comenzaría
con los gráficos de cajas y bigotes y en general con el uso de todas las
herramientas descriptivas que ayuden a formular posibles hipótesis que serán
probadas posteriormente por medio del análisis de varianza, el análisis de
regresión o las comparaciones múltiples, siempre y cuando se cumplan los tres
requisitos: 1) normalidad, 2) homocedasticidad e 3) independencia de los
residuales. En caso de que alguno(s) de estos no se cumplan, habrá que
pensar en una prueba o análisis no paramétrico equivalente.
7) Conclusiones y recomendaciones.

La idea general es observar el comportamiento de las variables respuesta en función


de los factores y estimar el efecto de estos últimos sobre la respuesta. Existen también
las variables controlables e incontrolables, ambas hacen referencia a variables que
estarán presentes y que probablemente afectarán a las variables respuesta. Las
primeras, también llamadas covariables, son controlables porque son plenamente
identificables y se pueden dejar constantes durante el experimento o medir. Las
segundas son aquellas variables que no se pueden ni fijar ni medir y que se sabe
harán parte del error o sesgo.

Comparación de dos sistemas


Estudio comparativo del comportamiento de un sistema bajo dos escenarios
excluyentes. Para comparar los dos sistemas el Analista debe seleccionar:
1. Un largo de corrida, Ti, para cada modelo (i=1,2)
2. Un número de réplicas, Ri, para simular cada modelo
Para estos sistemas existen dos tipos de hipótesis que se pueden generar a la hora
de un experimento, las cuales podemos definir como:

Hipótesis Nula: No existe una diferencia significativa en el desempeño entre ambos


diseños.
Hipótesis Alternativa: Existe una diferencia significativa.

Para la comparación de dos sistemas encontramos que se definen dos tipos de


muestras para la generación de un experimento de simulación, por lo que estas
muestras se pueden dividir en dos tipos diferentes las cuales son:
● Muestras Independientes: Procesar diferentes Entidades en cada Escenario
a) Variancias Iguales ( s’s iguales )
b) Variancias Desiguales ( s’s distintos)

● Muestras Correlacionadas:
a) Procesar las mismas entidades en ambos escenarios
b) Analizar las propiedades de la Entidad a su llegada

Muestras grandes Muestras pequeñas

La diferencia entre dos medias obedece Existen dos tipos, las varianzas
a una distribución normal desiguales e iguales

1) Iguales
I.C. para m1- m2
I.C. para m1- m2

Varianza combinada

Supuestos
Para muestras grandes n1 y n2 > 30 1.- Muestras independientes de
poblaciones normales
2.- Variancias desconocidas pero
La aproximación es buena, siempre que
ningún intervalo incluya el 0 o el 1 iguales
2) desiguales
I.C. para m1- m2

Muestras correlacionadas

Consideremos pares de observaciones relativas al factor común de los 2 sistemas


(Y1i, Y2i), Sea di = Y1i - Y2i la diferencia observada para el par i-ésimo I.C. para:

donde son la media y la desviación estándar de una muestra de n


diferencias.

De:

Luego, VCORR = VIND -

VCORR < VIND (siempre que la correlación sea positiva)

Una correlación positiva está generalmente inducida por el uso de los mismos
números aleatorios para generar entidades.
Comparación de Escenarios Múltiples

•Muestreo:
 Fijo (tamaño de las muestras predeterminado)
 Secuencial (se recogen suficientes datos en la muestra hasta que se alcanza
una precisión predeterminada)
Metas:
 Estimación de cada parámetro (K intervalos de confianza)
 Comparación de cada medida de funcionamiento c/r de un valor de control (K-
1 intervalos de confianza)
 Todas las comparaciones posibles (K(K-1) /2 intervalos de confianza)
 Selección del mejor (el más grande o el más pequeño)

Múltiples Medidas de Desempeño

En la mayoría de los modelos de simulación reales, se consideran varias medidas de


desempeño simultáneamente.
•Algunos ejemplos:

 Throughput (Medida Rendimiento Global)


 Largo promedio de la cola
 Utilización
 Tiempo promedio en el sistema

Cada medida de desempeño se estima frecuentemente con un intervalo de confianza.


Cualquiera de los intervalos podría “fallar” en relación a su medida de desempeño
esperada. Se debe tener cuidado con sobredimensionar los indicadores (ya que en
tal caso es difícil que todos los intervalos contengan sus medidas de funcionamiento
esperadas simultáneamente).
Suponga que tenemos k medidas de desempeño y el intervalo de confianza para la
medida de desempeño s para s = 1, 2, ..., k, está en un nivel de confianza. Entonces
la probabilidad que todos los k intervalos de confianza contengan simultáneamente
su medida real respectiva es

Esta desigualdad es conocida como la desigualdad de Bonferroni o desigualdad de


Boole. Para asegurar que la probabilidad (que los k intervalos de confianza contengan
simultáneamente a su verdadera media) sea por lo menos 100 (1- a) %, debemos
elegir los a‘s tales que
Se pueden seleccionar para todos los as = a/k, o escoger los diferentes ’s para las
medidas de desempeño más importantes).
Ejemplo: Si k =2 y quisiéramos que el nivel total deseado de confianza fuera por lo
menos 90%, podemos construir dos intervalos de confianza del 95%.
Dificultad: Si hay una gran cantidad de medidas de desempeño, y deseamos un nivel
total razonable de confianza (ej., 90% ), los as individuales podría llegar a ser muy
pequeño, haciendo los intervalos de confianza correspondientes muy amplios. Por lo
tanto, se recomienda que el número de medidas de desempeño no exceda de 10.

Análisis de varios Sistemas

La mayoría de los proyectos de simulación requieren de la comparación de dos o más


sistemas o configuraciones:
–Modificar la arquitectura de redes en centros de trabajo
–Evaluar varias políticas de despacho de trabajo (FIFO, LIFO, etc.)
Con dos sistemas alternativos, la meta puede ser:
–test de hipótesis: Ho: u1 = u2 v/s Ha: u1 > u2
–construir intervalos de confianza para u1 - u2
Con k > 2 alternativas, el objetivo puede ser:
–construya intervalos de confianza simultáneos para varias combinaciones de
u1 - u2
–seleccione la “mejor” de las k alternativas
–seleccione un subconjunto de tamaño m < k que contenga la “mejor”
alternativa

Comparación de dos Sistemas Alternativos

Formar un intervalo de confianza para la diferencia entre las medidas de desempeño


de los dos sistemas. Si el intervalo no contiene al 0, hay una diferencia estadística
significativa entre los dos sistemas.Los intervalos de confianza son mejores que los
test de hipótesis porque si existe una diferencia, el intervalo de confianza mide su
magnitud, no así un test de hipótesis.
Hay dos maneras levemente distintas de construir intervalos de confianza:
–Pares-t
–Dos-Muestras-t.

Comparación de los Métodos

El método de dos muestras-t requiere independencia entre Y1j’s e Y2j’s mientras que
el método de pares -t no requiere independencia entre Y1j’s e Y2j’s.
Por lo tanto, en el método de pares-t, números aleatorios pueden ser usados para
introducir correlación positiva entre las observaciones de los diferentes sistemas
como una forma de reducir la varianza.
En el método de pares-t, se debe cumplir que n1 = n2, mientras que en el método de
dos muestras n1 ≠ n2.

Intervalos de Confianza para Comparar más de dos Sistemas

En el caso de más de dos sistemas alternativos, hay dos maneras de construir un


intervalo de confianza en las diferencias seleccionadas u1 - u2.
–Comparación con un estándar o testigo
–Comparación de todos los pares
NOTA: Puesto que estamos haciendo k > 1 intervalos, para tener un nivel total de
confianza de 1-a, debemos hacer cada intervalo al nivel 1-a/k (Bonferroni).

Comparación con un estándar

En este caso, uno de los sistemas (quizás el sistema en operación o la política


existente) es un “estándar”. Si el sistema 1 es el estándar y deseamos comparar los
sistemas 2, 3, ..., k con el sistema 1, se deben construir k-1 intervalos de confianza
para las k-1 diferencias
u2 - u1, u3 - u1, …, uk - u1
Para alcanzar un nivel total de confianza de al menos , cada uno de los k-1
intervalos de confianza se debe construir en el nivel 1-a/(k-1)
Podemos usar los métodos pares-t o dos-muestras-t descritos en la sección previa
para hacer los intervalos individuales.

Ranking y Selección

El objetivo de la selección y el ranking son diferentes y más ambiciosas que hacer


simplemente una comparación entre varios sistemas alternativos. Aquí, la meta
puede ser:
–Seleccionar el mejor de k sistemas
–Seleccionar los distintos subconjuntos de tamaño m a partir de los k sistemas
–Seleccionar el mejor subgrupo m
–Seleccionar la mejor Solución dentro del subgrupo

1. Seleccionar el mejor de k sistemas:


Queremos seleccionar uno de los k sistemas alternativos como el mejor.Debido a la
aleatoriedad inherente en los modelos de simulación, no podemos estar seguros
que el sistema seleccionado es el de menor u (asumiendo que “menor” es bueno).
Por lo tanto, especificamos una probabilidad P* de selección correcta (cómo 0.90 o
0.95).
También especificamos una zona de indiferencia d* la cual quiere decir que, si la
mejor media y la segunda mejor media difieren por más de d*, seleccionamos la mejor
con probabilidad P*. Como ejemplo, suponga que tenemos 5 configuraciones
alternativas y queremos identificar el mejor sistema con una probabilidad de al menos
95%.
2. Seleccionar un subconjunto de tamaño m que contenga al mejor de los k sistemas:
Queremos seleccionar un subconjunto de tamaño m (< k) que contenga al mejor
sistema con una probabilidad de al menos P*. Este acercamiento es útil en la visión
inicial de las alternativas para eliminar las opciones inferiores. Por ejemplo, suponga
que tenemos 10 configuraciones alternativas y deseamos identificar un subconjunto
de 3 alternativas que contengan al mejor sistema con una probabilidad de al menos
95% .

3. Seleccionar el mejor m de k sistemas:


Queremos seleccionar el mejor m (no ordenado) de los k sistemas de modo que con
probabilidad de al menos P* las respuestas esperadas del subconjunto seleccionado
sean iguales a las m respuestas más pequeñas esperadas.
Esta situación puede ser útil cuando deseamos identificar varias buenas opciones, en
el caso de que la mejor sea inaceptable por alguna razón. Por ejemplo, suponga que
tenemos 5 configuraciones alternativas y deseamos seleccionar las 3 mejores y
tenemos que la probabilidad de seleccionar la correcta es al menos 90% .

Ejemplo. Comparación de Sistemas

Para ilustrar el peligro en la generación de un sólo paso y calcular visualmente los


resultados al comparar alternativas, considere el siguiente ejemplo:
Comparar:
Alternativa 1: M/M/1 cola con tiempo entre llegadas de 1 min., y una máquina
“rápida” con tiempo de servicio de 0.9 min., y
Alternativa 2: M/M/2 cola con tiempo entre llegadas de 1 min., y dos máquinas
“lentas” con tiempo de servicio de 1.8 min. por cada máquina.

Ejemplo. Comparación de Sistemas

Si la medida del desempeño de interés es el retardo medio esperado en la cola de los


100 primeros clientes, con condiciones iniciales vacías y ociosas, usando análisis de
colas, los retardos medios del estado estacionario en la cola son:
u1 = 4.13 > 3.70 = u2
Por lo tanto, sistema 2 es “mejor”
Si ejecutamos cada modelo apenas una vez y calculamos el retardo promedio, Yj, de
cada alternativa, y se selecciona el sistema con el Yj más pequeño, entonces
Prob(seleccionando sistema 1 (respuesta incorrecta)) = 0.52
Razón: La aleatoriedad de la salida
Solución:
–Replique cada alternativa n veces
–Haga Yij = retardo medio de la j-ésima réplica de la alternativa i
–Calcule el promedio de todas las réplicas para la alternativa i

–Seleccione la alternativa con el menor Yi


•Si hacemos este experimento muchas veces, obtendremos el siguiente resultado:

Dificultades en la solución del problema básico de DOE


● Múltiples Factores (F)
● Múltiples Respuestas (O)
● Respuesta incierta (Ruido)
● Limitaciones

Ejemplo de Factores
1. Tiempo Medio entre llegadas (Cuantitativa no controlable)
2. Tiempo Medio de servicio (Cuantitativa controlable o no)
3. Número de servidores (Cuantitativa controlable)
4. Disciplina de las colas (Cualitativa controlable)
5. Reorder point (Cuantitativa controlable)
6. Tiempo Medio entre demandas (Cuantitativa no controlable)
7. Distribución del tiempo entre demandas (Cualitativa no controlable)
Motivación y Terminología de DOE
Réplica - repetición de un experimento básico.
Tratamiento – una combinación específica de niveles de los factores.
Unidad Experimental - la unidad a la cual un tratamiento simple es aplicado (one
replication of the basic experiment).
Error Experimental - error entre dos unidades tratamientos experimentales
idénticos que producen resultados similares.
Confundido - el “mixing up” de dos o más factores de modo que es imposible
separar los efectos.
Aleatorización - Asignación aleatoria de tratamientos a las unidades
experimentales (assures independent distribution of errors)
Efecto Principal (de un factor) – una medida del cambio en una variable de
respuesta, debido al cambio de nivel del factor, promediando los efectos de todos
los factores restantes
Interacción es un efecto adicional (sobre la respuesta) debido a la influencia de
la combinación de dos o más factores.
Tipos de Diseños de experimentos Computacionales
•Diseño Completamente Aleatorizado
•Diseño en bloques Completamente Aleatorizado
•Diseño Factorial Completo
•Diseño Factorial Fraccionario
•Diseño Factorial Anidado
•Diseño de cuadrados latinos
•Diseño Jerarquizado
Diseño Factorial 𝟐𝒌
● Supongamos que tenemos k (k > 2) factores. Un diseño factorial 2k (2k factorial
design) requiere que dos niveles sean escogidos por cada factor, y que “n”
corridas de simulación (replicas) se ejecuten por cada una de las 2k posibles
combinaciones de niveles de los factores (design points). Para 3 factores,
podemos usar la Matriz de Diseño:

“+” se refiere a uno de los niveles de un factor y “-” se refiere al otro nivel.
Normalmente, para factores cuantitativos, el nivel más grande y más pequeño de cada
factor elegido.
CONCLUSIONES
1. Las muestras varian segun la cantidad de variables que se van a evaluar, por
lo que cada una de estas tienen diferentes caracteristicas, cada una presenta
sus ecuaciones a utilizar y especifica cual variable se utiliza en cada modelo.
Estas nos sirven exclusivamente par aun grupo de muestras que se relizan al
inicio, por lo que se debe conocer la definicion de cada una de estas para poder
utilizar las ecuaciones ya que tienen diferente valor a la hora de ser utilizadas.
2. Estas al igual que la anterior se diferencian segun las variables, por lo que se
debe de tomar en cuanta las caracteristicas para que la simulación se realice
de forma correcta. La simulación se pude utilizar para diferentes modelos por
lo que se debe de tener clara cada una de las variables que se utilizan y como
estas se dibidieron a lo largo del conteo para hacer el experimento.
3. Los ejercicios de simulación permiten que se comprenda mas cada una de las
ecuaciones que se presentan por lo que es necesario que se realicen ejercicios
de cada sistema para que la comprencion de los mismo sea mas facil. Conocer
estos problemas nos permite tener una vista mas amplia de lo que se esta
realizando y conocemos a detalle cada una de las variables y datos que se nos
presentan en el problema, de tal forma que es mas facil cuando tenemos que
hacer otros experimentos.
BIBLIOGRAFÍA

1. MONTGOMERY, DOUGLAS. Diseño y análisis de experimentos. Quinta


edición. Nueva York: John Wiley & Sons, Inc., 1997.
2. NETER, J; KUTNER, M; NACHTSHEIM, C; WASSERMAN, W. Modelos
estadísticos lineales aplicados. Cuarta edición. McGraw Hill, 1996.
3. LEY, A .; KELTON, W. Modelado y análisis de simulación. Tercera edicion.
Nueva York: Mc Graw Hill, 2000.

También podría gustarte