Está en la página 1de 24

UCSE - DASS

rea Matemtica Aplicada


CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 1
UNIDAD 3: UN MODELO ANALTICO PROGRAMACIN LINEAL

3.1 Simulacin. Definiciones
Simulacin es la imitacin de un proceso real o sistema de tiempo. La simulacin
involucra la generacin de una historia artificial del sistema y la observacin de esa
historia artificial para imaginar inferencias concernientes a las operaciones
caractersticas del sistema real que est representado.
La simulacin es utilizada para describir y analizar el comportamiento de un
sistema, realizar preguntas Qu pasara si? (What if analysis) sobre el sistema real y
ayudar en el diseo del sistema.
Si las relaciones y los componentes que constituyen el modelo son lo
suficientemente simples, podemos utilizar mtodos matemticos para obtener respuestas
exactas sobre ciertos interrogantes, en lo que se denomina una solucin analtica
(investigacin operativa y teora de colas). Sin embargo la complejidad de muchos
sistemas del mundo real hace difcil el uso de estas tcnicas, por lo que se recurre a la
simulacin.
Las reas de aplicacin de la simulacin son muchas y diversas
- Diseo y anlisis de sistemas de manufacturas.
- Evaluacin de requerimientos de hardware y de software.
- Evaluacin de nuevas tcticas o armas militares.
- Determinacin de polticas de reordenamiento para un sistema de inventario.
- Diseo de sistemas de comunicacin y sus protocolos
- Diseo y operacin de instalaciones de transporte, tales como autopistas, puertos,
aeropuertos, etc.
- Evaluacin y diseo de organizaciones de servicio como hospitales, oficinas,
restaurantes


3.2 Propsitos de la Simulacin
La simulacin ayuda a identificar problemas permitiendo:
- Experimentar nuevas situaciones y generar polticas de decisin
- Experimentar en un tiempo reducido
- Analizar, en algunos segundos, procesos que llevara meses o aos en tiempo
real.
- Reducir procesos analticos de investigacin y desarrollo convencional
- Estudiar situaciones complejas.
- Educar y entrenar
- Tener una visin global de un sistema.
- Dividir el sistema en subsistemas.

3.3 Fundamentos
Consideremos la operacin de un cajero automtico de un banco (Teller Bank),
donde los clientes arriban entre 1 y 10 minutos (solo valores enteros e igualmente
probables). El objetivo es simular la operacin del cajero a mano hasta que 20 clientes
sean atendidos y calcular medidas de performance como el tiempo de espera, etc.




UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 2


SIMULACION AD-HOC (Manual)















Tabla de Simulacin

Cliente
Tiempo entre
cada arribo
t arribo t servicio
Servicio
Inicio
Servicio
Termina
Tiempo en
Sistema
Tiempo
Ocioso
Tiempo
en Espera
1 - 0 2 0 2 2 0 0
2 5 5 2 5 7 2 3 0
3 1 6 6 7 13 7 0 1

79 30 10


Medidas de Performance

Tiempo Promedio en el Sistema min 95 , 3
20
min 79
= =
clientes


Tiempo en Espera Promedio x Cliente min 2
5
min 10
= =
clientes


Porcentaje de Tiempo Ocioso del Cajero o sin Operar % 30 100 *
) 30 10 79 (
30
~
+
=

Tiempo entre Arribo + Tiempo de Arribo = boottrapping


3.4 Clasificacin de las simulaciones

Existen 4 estructuras de simulacin.

1 Mtodo de interaccin de procesos (Process Interaction)
2 Mtodo de secuenciacin de sucesos (Event Scheduling)
Cajero
Automtico
Cliente
t arribo = 1 - 10
Generador Random
t
Servicio Cliente
t servicio = 1 6 min
Generador Random
t

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 3
3 Mtodo de monitores de actividad (Activity Scanning)
4 Mtodo de Tres Fases

3.4.1 Mtodo de Interaccin de Procesos

En esta estructura de simulacin el programa debera emular el flujo de un
objeto a travs del sistema. La entidad se mueve lo ms lejos posible en el sistema hasta
que: es retrasado, entra a una actividad o sale del sistema.
Tambin se la conoce como simulacin orientada a sucesos (asincrnica).
Ej: en un modelo de lavandera automtica un cliente puede entrar al sistema,
esperar por la mquina lavadora, lavar su ropa, esperar una canasta vaca, transportar su
ropa al secador, cargar el secador, secar la ropa, abandonar la lavandera.

3.4.2 Mtodo de Secuenciacin de Sucesos

El concepto bsico de la secuenciacin es avanzar el tiempo hasta que algo a
continuacin ocurra. Este suceso libera algn recurso. El suceso relocaliza objetos o
entidades por secuenciacin donde ellos puedan participar.
Ej: si la ropa lavada de un cliente est lista y hay una canasta disponible esta es
reasignada inmediatamente al cliente y la descarga de ropa se inicia.
El tiempo es avanzado hasta el suceso siguiente y las actividades son
examinadas para ver si alguna puede iniciarse como consecuencia.
Simulacin asncrona u orientada a sucesos.

3.4.3 Mtodo de Monitoreo de Actividad

Este mtodo es conocido tambin como mtodo de 2 fases. El monitoreo de
actividad est compuesto por una simulacin de mdulos independientes esperando ser
ejecutados. El monitoreo se maneja por incrementos fijos de tiempo en las cuales se
toma una decisin si un evento ocurri o no ocurri.
Si el suceso o evento ocurri el sistema es actualizado.
Simulacin sincrnica u orientada a intervalos.

3.4.4 Mtodo de Tres Fases

En este mtodo el tiempo es avanzado hasta que hay un cambio de estado en el
sistema o hasta que algo ocurriese. Solo cuando todos los recursos en este intervalo han
sido liberados se inicia la reasignacin para nuevas actividades en la tercera etapa de la
simulacin.
Resumimos: la primera fase es el avance del tiempo, la segunda fase es la
liberacin de recursos que finalizan su actividad y la tercera es el inicio de actividades
con los recursos reasignados.
Simulacin sincrnica u orientada a intervalos.


3.5 Ventajas de utilizar Simulacin por computadora

Cada nuevo desarrollo en la industria de la computacin tiene un efecto de empuje
hacia las industrias relacionadas, este es en caso del software de simulacin.

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 4

Ventajas

a) Elegir correctamente. Se pueden testear los diseos sin realizar adquisiciones
materiales.
b) Comprimir y expandir el tiempo. Se puede examinar un cambio real de horas
en pocos minutos y viceversa.
c) Entender el porqu. Se pueden explicar los porqu de ciertos fenmenos
reconstruyendo los escenarios.
d) Explorar posibilidades. Se pueden explicar nuevos mtodos, nuevas tcnicas
sin afectar el sistema real utilizando el modelo.
e) Diagnosticar problemas. Se refiere a los sistemas complejos. La simulacin
incluye las interacciones de sistemas complejos.
f) Identificar limitaciones. Se pueden identificar los cuellos de botella.
g) Desarrollar entendimiento. Los estudios de simulacin proveen
entendimiento sobre como un sistema opera (en vez de seguir las
predicciones de otro).
h) Visualizar el plan. Traducir los diseos de CAD a paquetes de simulacin.
Ayudan a ver defectos de diseo.
i) Construir consenso. Es ms sencillo aceptar una simulacin que la opinin
personal sobre los resultados de cambio en un diseo.
j) Preparar para el cambio. Se refiere a la construccin de escenarios para el
anlisis (que pasar si).
k) Invertir con inteligencia. El costo de una simulacin es mucho mas bajo que
el rediseo de una instalacin.
l) Entrenar el equipo de personal. Los modelos son excelentes para entrenar
equipo de personal.
m) Especificar requerimientos. Se puede especificar requerimientos de una
mquina o dispositivo por simulacin.

3.6 Desventajas de usar la simulacin por computadora

a) Aunque muchos paquetes de software permiten obtener un mejor escenario a
partir de una combinacin de variaciones posibles, la simulacin no es una
herramienta de optimizacin.
b) La simulacin puede ser costosa cuando se quiere emplearla en problemas
relativamente sencillos de resolver, en lugar de utilizar soluciones analticas
que se han desarrollado de manera especfica para este tipo de casos.
c) Se requiere bastante tiempo (generalmente meses) para realizar un buen
estudio de simulacin; por desgracia, no todos los analistas tienen la
disposicin (o la oportunidad) de esperar ese tiempo para obtener una
respuesta.
d) Es preciso que el analista domine el uso del paquete de simulacin y que
tenga slidos conocimientos de estadstica para interpretar los resultados.


UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 5

3.7 Elementos claves para garantizar el xito de un modelo de simulacin

- Tamao suficiente de la corrida: Como se mencion en la unidad
anterior, para poder llegar a conclusiones estadsticas vlidas a partir de los
modelos de simulacin es necesario que las variables aleatorias de respuesta
estn en un estado estable. El problema estriba en que, generalmente, cuando
el modelo consta de ms de una variable de decisin, es difcil que estas
alcancen el estado estable al mismo tiempo.
- Variable(s) de respuesta mal definidas(s): aun cuando el modelo de
simulacin sea muy eficiente y representante de la realidad en gran medida,
si la variable de respuesta no es la apropiada ser imposible tomar decisiones
que tengan impacto sobre las operaciones del sistema bajo estudio.
Por ejemplo: si la variable de respuesta es el nivel de inventarios de ciertos
productos. Al mismo tiempo, la poltica de la empresa establece que no se
debe parar ninguno de los procesos de fabricacin. En consecuencia, el
problema no ser el inventario final, sino el ritmo de produccin necesario.
- Errores al establecer las relaciones entre variables aleatorias: Un
error comn de programacin es olvidar las relaciones lgicas que existen
entre las variables aleatorias del modelo, o minimizar su impacto. Si una de
estas variables no est definida de manera correcta an es posible tener un
modelo que se apegue a la realidad actual. Sin embargo, si el sistema no se
lleva hasta su mxima capacidad para observar su comportamiento, podra
resultar imposible visualizar el verdadero impacto de las deficiencias.
- Errores al determinar el tipo de distribucin asociados a las
variables aleatorias del modelo: Este tipo de problema es muy similar al
anterior, solo que en este caso se utilizan distribuciones que no son las ms
adecuadas o que responden nicamente a un intento de simplificar los
estudios estadsticos.
- Falta de anlisis estadstico de los resultados: Un problema comn por
el que la simulacin suele ser objeto de crtica, radica en asumir que se trata
de una herramienta de optimizacin. Esta apreciacin es incorrecta, ya que
involucra variables aleatorias y caractersticas propias de un modelo que
incluye probabilidades. Por ello es necesario realizar varias corridas a fin de
producir diferentes resultados para las variables de respuesta y, a partir de
estos valores, encontrar un intervalo de confianza que puedan dar un rango
en donde encontrar valores definitivos
- Uso incorrecto de la informacin obtenida: Un problema que se presenta
en ocasiones es el uso incorrecto de la informacin recabada para la
realizacin del estudio, ya sea a travs de un cliente o de cualesquiera otras
fuentes. Muchas veces esta informacin se recolecta, analiza y administra d
acuerdo a las necesidades propias de la empresa, lo que implica que no
siempre est en el formato y la presentacin que se requiere para la
simulacin. Si la informacin se utiliza para determinar los parmetros del
modelo sin ser depurada y reorganizada, es muy probable que la precisin de
los resultados del estudio se vea afectada
- Falta o exceso de detalle en el modelo: Otro punto importante a
considerar es el nivel de detalle del modelo. En muchas ocasiones algn
proceso se simplifica tanto que tiende a verse como una caja negra que nos

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 6
impide ver que ocurre en el interior, aunque si haya entrada y salida de datos
que interactan con el modelo. Cuando esto sucede, el impacto que podran
tener los subprocesos que se llevan a cabo en la caja negra (es decir el
proceso sobre simplificado) no se incluyen en la simulacin.
Por ejemplo: si se analiza un sistema de distribucin y se da por sentado que
el almacn siempre surte sus pedidos, no incluiremos el impacto de los
tiempos necesarios parta surtir las rdenes, ni la posibilidad de que haya
faltantes del producto.
Por otra parte si el modelo se hace demasiado detallado, tanto el tiempo
dedicado al estudio como el costo de llevarlo a cabo podran incrementarse
sustancialmente. La labor del encargado de simulacin es sugerir y clasificar
los niveles de detalle que se requieren en el modelo, resaltando los alcances
y limitaciones de cada uno.

3.8 Etapas en el desarrollo de experimentos de Simulacin.


































Formulacin
Problema
Definicin de Objetos
Plan de Proyecto Completo
Conceptualizacin
del Modelo
Recoleccin de
Datos
Traduccin del
Modelo
Diseo Experimental
Verificado?
Validado?
NO
NO NO
Mas
Ensayos?
SI SI
NO
Documentacin.
Generacin de
Reporte
Implementacin
Ensayos de Produccin y
Anlisis

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 7





Etapa 1: Formulacin del problema

Se sugiere que un set de suposiciones se prepare entre el analista simulador y el
cliente. Es posible que se necesite reformular el problema. Esta etapa tambin se conoce
como Anlisis de Requerimientos.

Etapa 2: Definicin de Objetos. Plan de Proyecto Completo

Los objetivos indican las preguntas a ser respondidas por el estudio de
Simulacin. El plan de proyecto debera incluir diferentes escenarios a investigar.

Etapa 3: Conceptualizacin o Formulacin del Modelo

Los sistemas reales bajo investigacin son abstrados por un modelo conceptual.
Se recomienda que el modelo se inicie en forma simple y luego se desarrolle hasta un
modelo de complejidad avanzada o apropiada.

Etapa 4: Recoleccin de Datos
Se requiere un cronograma de requerimientos de datos al cliente. Se precisan
datos individuales y no valores promedios acumulados.

Etapa 5: Traduccin del Modelo
Codificacin del Modelo conceptualizado.

Etapa 6: Verificacin
Concierne al modelo operativo. Esta trabajando correctamente? Se recomienda
que la verificacin sea un proceso continuo. (Depuracin de cdigo, y dems estrategias
como TOP-DOWN, Programacin estructurada, etc.).

Etapa 7: Validacin
La validacin es la determinacin de que el modelo conceptual es una
representacin precisa de sistema real. Una forma ideal de validar el modelo es
comparar las salidas con las del sistema base (el sistema real).

Etapa 8: Diseo Experimental
Estos diseos conciernen a la extensin de la simulacin, el nmero de
replicaciones y la forma de inicializacin.

Etapa 9: Replicaciones o Ensayos de Produccin
Estas replicaciones o ensayos se utilizan para estimar medidas de performance
en diferentes escenarios.

Etapa 10: Determinacin de Continuar los Ensayos

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 8
El analista de simulacin y el cliente determinan si se necesitan escenarios
adicionales.

Etapa 11: Generacin de Reportes
Si el modelo de Simulacin se utilizar de nuevo por analistas diferentes ser
necesario entender como el modelo trabaja. Por ello existe la necesidad de una buena
documentacin.

Etapa 12: Implementacin
Consiste en la implantacin final del modelo.

Pasos de un estudio segn Law















3.8.1 Recoleccin de Datos

Debemos decidir cmo representar las variables aleatorias. Las tcnicas a utilizar
pueden variar de acuerdo:
- A la cantidad de datos disponibles
- Si los datos son crudos o son la sugerencia de alguien
- Si cada variable es independiente de otras variables aleatorias de entrada o
relacionadas de alguna forma
- Si las variables son independientes de otras variables, las posibilidades son:
a) Asumir que la variable es determinstica
Podemos estar tentados a asumir que la variable es determinstica o constante.
Ej: una mquina fabrica componentes den 1,5 min. La mquina requiere el
cambio de herramental de acuerdo a una distribucin exponencial, de un valor
esperado de 12 min. El tiempo de cambio de la herramienta es otra distribucin
exponencial con valor esperado de 3 min. Es posible simplificar este proceso
diciendo que la mquina opera en 1,875 min/min?
b) Ajustar una funcin de distribucin a los datos histricos
Si poseemos al menos 50 puntos, podemos intentar ajustar una funcin de
distribucin. Si se va a realizar un test de bondad de ajuste, se recomienda seguir
los siguientes 3 pasos:
Sistema Real
Modelo de
sistema
Modelo
Computacional
Programa
Simulacin
Objetivos
Representacin
Validacin
Codificacin
Validacin
Verificacin
Ajuste Datos Reales
Datos Simulados

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 9
I) Realizar una hiptesis sobre la funcin candidata. Esta funcin puede ser
continua o discreta. Entre las discretas sealamos: Poisson, Binomial,
Geomtrica. Entre las distribuciones continuas tenemos: Normal,
Student, Uniforme, Triangular, LogNormal, Gamma, Weibull.
II) Estimar los parmetros de la distribucin candidata o elegida. Por
Ejemplo, si la distribucin es normal, los parmetros a estimar son la
varianza, el Valor Esperado o esperanza.
III) Realizar un test de bondad de ajuste como chi cuadrado (x
2
). Si el test
rechaza la hiptesis es porque hay una fuerte indicacin de que no es
verdad. En ese caso se vuelve al paso 1 o se elige la distribucin
emprica.

c) Utilizar la distribucin emprica de los datos
Cuando todas las posibilidades se han agotado, utilizamos la distribucin
emprica. Ejemplo: Un sistema de cinta transportadora tiene los siguientes datos:

- El tiempo para reparar la cinta despus de una falla (x).

Para las 100 veces anteriores u ocurrencias:

Intervalo (h) Frecuencia de Ocurrencia
0 x 1 27
1 < x 2 13
2 < x 3 31
3 < x 4 18
4 < x 8 11


A veces no hay datos disponibles porque el sistema no est constituido. Una
posibilidad es estimar subjetivamente un valor. Ej: el tiempo de reparacin es de 3 a 8
minutos y asumir que los datos siguen una distribucin uniforme.

30





20





10





0
1 2 3 4 5 6 7 8 x
27
13
31
18
11

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 10

Por ello esta distribucin es referida como la distribucin de mxima ignorancia
(asume todos los valores por igual).


3.8.2 Verificacin y validacin del modelo

La verificacin es la determinacin de que el modelo conceptual en la
computadora es correcto para ello se sugiere tener en cuenta:

o Seguir principios de programacin (estructurada, etc).
o Hacer que el modelo operativo est bien documentado.
o Verificar el cdigo por ms de una persona.
o Verificar que los datos de entrada son utilizados correctamente.
o Verificar para un conjunto de datos de entrada que las salidas sean
razonables.
o Utilizar el depurador.
o Utilizar la animacin como verificacin.

La validacin es la determinacin de que el modelo conceptual pueda sustituir al
sistema real para la experimentacin.
Nombraremos las siguientes tcnicas subjetivas:

La validacin a simple vista (Face Validation): debe ser razonable a los
expertos en el rea.
Anlisis de sensibilidad: se modifican las entradas.
Test de condiciones extremas.

En cuanto a tcnicas objetivas sealaremos:

Validacin de transformacin de E/S: se compara las salidas del modelo
con datos reales. Ej: test t.
Validacin utilizando datos histricos de entrada: en vez de utilizar datos
artificiales utilizaremos datos histricos. Luego se compara la salida con
el sistema real. Ej: paired test t.

3.8.3 Anlisis de los Datos Simulados

El anlisis de simulacin se inicia con las medidas de performance (los tiempos,
el montaje de ocurrencias, tabulacin de varianzas y promedios, etc.). Ej: una estadstica
f
3 8

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 11
basada en el conteo de ocurrencias es el nmero de unidades aceptadas en 24hs de
simulacin.
Una herramienta para analizar o trabajar los datos de salida es el intervalo de
Confianza. Los 3 factores que influencian la amplitud del Intervalo de Confianza son: El
nmero de replicaciones (n), el nivel de confianza (1-) y la variacin de la medida de
performance (s).

Resumimos: si el nmero de replicaciones se incrementa, la amplitud del
intervalo de confianza disminuye.
Si el nivel de confianza aumenta, la amplitud del intervalo de confianza
aumenta.
Si la variacin se incrementa, la amplitud del intervalo se incrementa.



UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 12
3.9 Seleccin de una distribucin de entrada

3.10 Estadstica Descriptiva

Siendo x una variable aleatoria mnima, mxima, media o valor esperado o
esperanza matemtica o mediana X
0.5
.

Estimaciones de Muestra

) ( ) 1 (
,
n
X X (C, D)
) (n
X o
x
o ) (x E (C, D)

) (
5 , 0
n X ) 2 ) 1 (( + n x , si n es par
( ) ( ) | | 2 1 ) 2 / ( 2 / + + n x n x , si n es impar

Varianza
2
o

Coeficiente de Variacin

o
2
= cv
Lexis Ratio

o
2
= r

( ) ( ) ( )

=
=
n
i
i
x p x n S
1
2 2


( )
( )
( ) n X
n S
n v c
2
= (C, D)

( )
( )
( ) n X
n S
n r
2
=

Sesgo (Skewness)

( ) | |
( )
2
3
2
3
o

=
x E
v
( ) | |
( ) | |
2
3
2
1
3

n S
n n X X
y
n
i
i
=

=


Criterios a Utilizar

Para una distribucin simtrica o Continua (normal), la media es igual a la
mediana
5 , 0
X , no as para una distribucin discreta.

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 13
Si las estimaciones ( ) n X y la mediana
5 , 0

X son casi iguales, la distribucin


puede ser simtrica.
El coeficiente de variacin cv es igual a 1 para la distribucin exponencial, por
ello el v c (estimacin) cercano a 1, sugiere dicha distribucin.
Para las distribuciones de Gamma y Weibull:


1
1
1
<
=
>
cv
cv
cv

1
1
1
>
=
<
o
o
o


Siendo o un parmetro de forma:

Parmetro de localizacin: es una abscisa ) (
i
x . Ej: la media para la
distribucin normal. =
| Parmetro de escala: Comprime o expande la distribucin sin cambiar su forma.
o Parmetro de forma: Un cambio altera la forma (el sesgo o skewness).

La distribucin LogNormal, tiene un cv que puede ser cualquier nmero positivo
real, por eso si la forma concuerda, y el ( ) 1 > n v c , esta distribucin puede ser mejor que
la Gamma o Weibull.
Para las distribuciones discretas, el lexis ratio ( ) r , es fundamental:

1 = r Poisson
1 < r Binomial
1 > r Binomial Negativa o Geomtrica (Caso especial)

El sesgo de la distribucin es una medida de simetra.

Normal 0 = v

Sesgada a la derecha o Positivy Skewed 0 > v



Sesgada a la izquierda o Negativy Skewed 0 < v

Mediana
Media

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 14


Summary Stadistics



3.10.1 Histogramas y Grficos de Lnea

Podemos afirmar que las funciones de densidad tienden a poseer formas
reconocibles, por ello una estimacin grfica nos puede ser muy til para reconocer una
distribucin. Para el siguiente ejemplo construiremos un histograma basados en la regla
de Sturgis:

| | n k
10
log 322 , 3 1+ = Siendo k el nmero de intervalos
Ejemplo de Aplicacin

Un modelo de simulacin fue desarrollado para una facilidad en un banco. Los
datos fueron recolectados en base al patrn de arribo de los autos, sobre un intervalo fijo
de 90 minutos, 220 autos, llegados a la facilidad y se anot el tiempo de interarribo x
(en minutos) entre los autos i e i+1 para i=1, 2, 3,, 219.

n=219 Tiempo de interarribo (minutos) ordenados en orden creciente
0.01 0.05 0.08 0.14 0.22 0.35 0.46 0.55 0.79 1.28
0.01 0.05 0.09 0.14 0.23 0.35 0.47 0.55 0.84 1.33
0.01 0.05 0.09 0.14 0.23 0.36 0.47 0.57 0.86 1.38
0.01 0.05 0.10 0.14 0.23 0.36 0.47 0.57 0.87 1.44
0.01 0.05 0.10 0.15 0.23 0.36 0.48 0.60 0.88 1.51
0.01 0.05 0.10 0.15 0.23 0.37 0.49 0.61 0.88 1.72
0.01 0.06 0.10 0.15 0.24 0.37 0.49 0.61 0.90 1.83
0.01 0.06 0.10 0.15 0.25 0.38 0.49 0.63 0.93 1.96
0.02 0.06 0.10 0.15 0.25 0.38 0.49 0.63 0.93
0.02 0.06 0.10 0.15 0.25 0.38 0.50 0.64 0.95
0.03 0.07 0.10 0.17 0.25 0.38 0.50 0.65 0.97
0.03 0.07 0.10 0.18 0.25 0.38 0.50 0.65 1.03
0.03 0.07 0.11 0.19 0.26 0.39 0.51 0.65 1.05
0.04 0.07 0.11 0.19 0.27 0.40 0.51 0.69 1.05
0.04 0.07 0.11 0.19 0.28 0.40 0.51 0.69 1.06
0.04 0.07 0.11 0.20 0.28 0.41 0.52 0.70 1.09
Mediana
Media

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 15







| |
6 21 , 0
9
95 , 1
9 77 , 8 219 log 322 , 3 1
95 , 1
01 , 0 96 , 1
10
1 219

~ = = A
~ = + =
=
= =
k
R
b
k
R
X X R

Histograma


Los valores estn demasiado acumulados, por lo que se recomienda duplicar k, o
sea 2k = 18.

100 , 0
18
= A
= A
b
R
b


Estadstica Descriptiva

Mnimo 0,01
1
X
Mximo 1,96
219
X
Media 0,399
Mediana 0,270
0.04 0.07 0.11 0.21 0.29 0.41 0.52 0.72 1.10
0.04 0.07 0.12 0.21 0.29 0.43 0.53 0.72 1.11
0.04 0.07 0.12 0.21 0.30 0.43 0.53 0.72 1.12
0.05 0.07 0.12 0.21 0.31 0.43 0.53 0.74 1.17
0.05 0.08 0.12 0.21 0.31 0.44 0.54 0.75 1.13
0.05 0.08 0.13 0.22 0.32 0.45 0.54 0.76 1.24
0.05 0.08 0.13 0.22 0.35 0.45 0.55 0.77 1.24

h(x)

100




75




50




25
0,01 0,266 0,443 0,659 0,876 1,093
93
46
35
17
9
4
2
1

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 16
Varianza 0,144
c.v. 0,953
Sesgo 1,458

BoxPlot

Necesitamos conocer el mnimo, el mximo, la mediana y los cuartiles.

Mnimo = 0,01
Mximo = 1,96
Mediana = 0,27
Cuartiles = 0,100 y 0,545


La naturaleza elongada hacia la derecha seala que es una distribucin
exponencial (adems de otros criterios).

3.11 Estimacin de Parmetros

Ahora que poseemos una hiptesis sobre que distribucin puede ser utilizada,
necesitamos estimar los parmetros. Un estimador es una funcin numrica de los datos.
Aqu vamos a considerar los denominados MLE o Estimadores de Mxima Probabilidad
(Maximum Likelyhood Estimators).

3.11.1 Conceptos Tericos de MLE

Si utilizamos una distribucin discreta para nuestros datos y desconocemos el
valor del parmetro u (theta), la funcin de probabilidad o de masa ) (x p
u
. Definimos
la funcin de probabilidad (likelyhood function) de la siguiente forma
( ) ( ) ( ) ( )
n
x p x p x p L
u u u
u ...
2 1
= , siendo L la funcin de masa conjunta o de probabilidad

h(x)

100




75




50




25
0,01 0,266 0,443 0,659 0,876 1,093 1,96
93
46
35
17
9
4
2
1
0,100 0,27 0,545

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 17
conjunta que nos da la probabilidad de obtener nuestros datos, siu es el valor del
parmetro desconocido.
El MLE del parmetro desconocido ( ) u es u

, y es definido como el valor de u


que maximiza la funcin ( ) u L . ( ) ( ) u u L L >

para todo valor posible de u .


Para funciones continuas la funcin de densidad ( ) x f
u
, define la funcin de
probabilidad siguiente: ( ) ( ) ( ) ( )
n
x f x f x f L
u u u
u ...
2 1
=

donde el MLE u

, es definido a ser
el valor de u que maximiza la funcin ) (u L sobre todos los valores u posibles.

Ejemplo A: funcin exponencial y su estimador MLE

| u = (parmetro de escala)
|
u
|
x
e x f

=
1
) (


n
X = | = media (Cmo se llega a esta conclusin?)

( )
| | |
| | |
|
n
x x x
e e e L

=
1
...
1 1
2 1

( )
( )
|
|
|
.
|

\
|

=
|
|
.
|

\
|

|
|
.
|

\
|
=
=

|
|
.
|

\
|
+ + +
n
i
i
n
x
n
x x x n
e L
e L
1
2 1
1
...
1
|
| | |
| |
|
|

Aplicando ln a ambos miembros:

( ) ( )
( )
( )

=
=

|
|
.
|

\
|
+ =
=
n
i
i
n
i
i
n
x n l
x l
L l
1
1
1
ln
1
ln
ln
|
| |
|
| |
| |

0 x
f(x)

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 18
Como el logaritmo es estrictamente creciente, maximizamos la funcin l (
L l ~ ) ello implica que |

maximiza a la funcin L.

( ) n X
n
x
x
n
x
n
d
dl
n
i
i
i
n
i
i
= =
=
+ =


=
=
1
1
2
1
1
|
| |
| | |

Por lo tanto el MLE = |

= 0,399, con lo cual la funcin de distribucin


ajustada a los datos del problema es: ( )
399 , 0
399 , 0
1
x
e x f

=
u

El clculo diferencial y la bsqueda de mximos, a veces no funciona para todas
las distribuciones. Se puede utilizar, mtodos numricos para encontrar los estimadores
MLE.
Tabla de algunos MLEs para distribuciones sencillas (Law & Kelton)

Distribucin MLE
Exponencial ( ) n X = |

media
Uniforme
i
x a min =
i
x b max

=
Normal
( ) n X = ( )
2
1
2
1
(

= n S
n
n
o

3.12 Evaluacin del Modelo

3.12.1 Distribucin Ji-Cuadrado

Definicin: Sea v un entero positivo, entonces se dice que la variable aleatoria
X posee una distribucin ji-cuadrado, con parmetrov , si la funcin de densidad de
probabilidad de x es la funcin de densidad Gamma con
2
v
o = y 2 = | . La funcin de
densidad ji-cuadrado es:

( )
( ) x k f
o
x f
, 1
,

<
>
|
.
|

\
|
I
|
.
|

\
|
|
.
|

\
|
0 , 0
0 ,
2
2
1
2
1
2
2
x
x e x
x v
v
v


El parmetro v es llamado nmero de grados de libertad de x. El smbolo
2
X es
usado para representar el ji-cuadrado (chi-squared).


UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 19


k = nro de intervalos.
k-1 = nro de grados de libertad.

3.12.2 Test de Bondad de Ajuste

Supongamos que en un experimento cada observacin
i
X en una muestra es
clasificada como perteneciente a un nmero finito de categoras, con
i
p definimos la
probabilidad que cualquier observacin particular pertenezca a una categora i.
Deseamos verificar
0
H , que especifica completamente los valores de todas las
probabilidades. Ej:

05 , 0
15 , 0
35 , 0
45 , 0
4
3
2
1
=
=
=
=
p
p
p
p

El test estadstico ser una medida de la discrepancia entre los nmeros
observados en las categoras y los nmeros esperados cuando
0
H es verdadero.
Como la decisin sera alcanzada al comparar un clculo del test con un valor
crtico de la distribucin ji-cuadrado, este test de bondad de ajuste se denomina ji-
cuadrado.

Notacin:
j
N : nmero de observaciones
i
x en la categora j ( aleatoria)
j
n : nmero de observaciones esperado
n : numero total de observaciones

=
=
n
j
j
n N
1

j : categora o clasificacin
j
p : probabilidad de la categora j. La proporcin esperada de los valores
i
X
f(x)
0 1 x
No Rechaza Rechaza
Densidad ji-cuadrado
grados de libertad
Ji-crtico:
Regin Sombreada

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 20


Teorema

Siendo 5 >
j
np para cada j (j=1,2,,k).

La variable aleatoria es:

( )
( )


=

=
=
esperados
esperados observados
np
np N
X
n
j j
j j
2
1
2
2


Y tiene aproximadamente una distribucin ji-cuadrado con (k-1) grados de
libertad.

Test ji-cuadrado

Hiptesis Nula


0 20 2 10 1 0
, , , :
k k
p p p p p p H = = = con
k
p : observado
con
0 k
p : distribucin

Hiptesis Alternativa


a
H al menos un valor de probabilidad
i
p no es igual a
0 i
p

Frmula del Test

( ) ( )


=
(
(


=
=
esperado
esperado observado
np
np n
X
k
i i
i i
2
1 0
2
0 2


Regin de rechazo (rechazo de la hiptesis nula)

) 1 , 1 (
2 2
o > k X X

Si se supera el valor crtico, la distribucin no sirve, se rechaza la bondad de
ajuste.

Observaciones

Esperamos que el ji-cuadrado ( )
2
X sea pequeo para un buen ajuste. El punto
crtico del test es elegir el nmero y tamao de los intervalos. Algo de la ambigedad de
la seleccin del intervalo es eliminado si ellos son elegidos de tal forma que:


k
p p p p = = = =
3 2 1

Esto se denomina mtodo equiprobable o de probabilidades idnticas.

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 21

Law & Kelton sugieren para elegir los intervalos el mtodo equiprobable y
5 >
j
np para todas las categoras j en el caso continuo. En el caso discreto, sugieren los
j
np aproximadamente iguales y todos como mnimo de valor 5.
Ejemplo A: funcin exponencial y su MLE

( )
399 , 0
399 , 0
1

x
e x f

=
u
n = 219

Mtodo equiprobable
k
p p p = = =
2 1
k = 20 intervalos
05 , 0
20
1
2 1
= = = = =
k
p p p
( )
+ =
=
=
> = =
=
>

20
0
399 , 0
0
1

5 95 , 10 05 , 0 219
219
5
a
a
e x F
np
n
np
x
j
j


para j = 1 19
( )
20
1
20
1
20

399 , 0
399 , 0
j
e
j
e
j
a F
j
j
a
a
j
=
=
=



Aplicando ln a ambos miembros
|
.
|

\
|
=
|
.
|

\
|
=
20
1 ln 399 , 0
20
1 ln
399 , 0
j
a
j
a
j
j
j para 1 a 19
j
Intervalos ( )
j j
a a ,
1

j
N
j
np
j
j j
np
np N

1 (0, 0.0204) 8 10,950 0,7947
2 (0.0204, 0.042) 11 10,950 0,0002

19
188 , 22
2
= X

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 22
Valor crtico

( )
10 , 0
203 , 27 10 , 0 1 , 1 20
2
=
=
o
X
(por tabla de puntos crticos de ji-cuadrado)

Se acepta la Hiptesis nula. No se rechaza la bondad de ajuste.

Ejemplo B: Los valores y totales para n = 256 observaciones sobre el nmero de tems
demandados en una semana de un inventario de 3 aos, son los siguientes.

ITEM QTY ESCALADO
0 59 0,37
1 26 0,16
2 24 0,153
3 18 0,11
4 12 0,07
5 5 0,03
6 4 0,02
7 3 0,019
9 3 0,019
11 2 0,012

1. Estadstica descriptiva

Mnimo 0
Mximo 11
Media 8,91
Mediana 1
Varianza 5,285
Lexis ratio 2,795
Sesgo 1,655

2. Grfico de Lnea

Escala 59/156 = 0,37

No es simtrica, por lo tanto no es discreta uniforme. En consecuencia puede ser
Binomial, Binomial negativa, geomtrica o Poisson.

El Lexis Ratio es 2,795 > 1 es Binomial negativa o geomtrica.

0,4



0,3



0,2



0,1
0 1 2 3 4 5 6 7 8 9 10 11

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 23
El Sesgo es 1,655 > 1 es sesgada a la derecha

Elegimos un distribucin Geomtrica
3. Estimacin del parmetro MLE

( ) ( )
x
p
p p x P = 1 x = 0,1,,n
( ) 1 0 < < = p p u

Funcin de Probabilidad Conjunta ( ) ( ) ( )
2 1
1 1
x x
p p p p p L =
Aplicando ln a ambos miembros ( ) ( ) ( ) p x p n p l L
i
+ = =

1 ln ln ln
Derivamos e igualamos a 0
( ) 1
1

+
= =
X
p MLE
( ) ( )
x
p
p p x P = 1
1 891 , 1
1

+
= p
345 , 0 = p
( ) ( )
x
p
x P 345 , 0 1 345 , 0 =
( ) ( )
x
p
x P 655 , 0 345 , 0 = x = 0,1,,11

Test de Bondad

La moda en este caso vale 0, sugeriremos 3 intervalos. Uno que contenga a la
moda, otro de 1 a 2 y de all a la 11, el 3er intervalo.


1ra condicin ( )
3 2 1
p p p = =

( ) ( ) ( )
260 , 0 310 , 0 370 , 0
3 2 1
~ ~
~ ~ I p I p I p


0,4



0,3



0,2



0,1
0 1 2 3 4 5 6 7 8 9 10 11
I1 I2 I3

UCSE - DASS
rea Matemtica Aplicada
CARRERA: Ingeniera en Informtica
CTEDRA: Modelos y Simulacin
Ao:2014

Pgina 24
2da condicin ( ) 5 >
i
np
( ) ( ) 345 , 0 655 , 0 345 , 0 0
0
= =
p
P
5 82 , 53 345 , 0 156
0
> = = np OK
( ) ( ) ( ) ( ) 3739 , 0 655 , 0 345 , 0 655 , 0 345 , 0 2 1
2 1
= + = +
p p
P P
5 34 , 58 3739 , 0 156
12
> = = np OK
( ) ( ) ... 11 3 = + +
p p
P P
5
11 ,..., 3 , 2 , 1
> np OK

j intervalo
j
N
j
np
( )
j
j j
np
np N
2


1 0 59 53,82 0,471
2 1-2 50 58,34 1,203
3 3-11 47 43,658 0,256
930 , 1
2
= X

( ) ( ) 90 . 0 , 2
2
1 , 1
X X
k
=
o

605 , 4
2
= critico X
2 2
X critico X > por lo tanto est bien ajustado. La hiptesis nula no es rechazada.