Está en la página 1de 109

ndice

Unidad 1
1.1 Trminos bsicos.
1.2 Nociones claves en simulacin.
1.3 Punto de vista sistmico.
1.4 El rol de la simulacin. Ventajas y desventajas.

Unidad 2
2.1 Variables aleatorias uniformemente distribuidas.
2.2 Propiedades de los generadores de nmeros aleatorios.
2.3 Mtodos para generar nmeros aleatorios.
2.3.1 Mtodo de Von Newmann.
2.3.2 Variacin del mtodo de Von Newmann.
2.3.3 Mtodos basados en nmeros congruentes.
2.3.3.1 Mtodo del residuo potencia o congruencial multiplicativo.
2.3.3.2 Mtodo congruencial mixto o de perodo completo.
2.3.4 Otros generadores de nmeros aleatorios con distribucin uniforme.
2.3.5 Variables aleatorias continuas.
2.3.6 Variables aleatorias discretas.

Unidad 3
3.1 Pruebas estadsticas de aleatoriedad.
3.1.1 Prueba estadstica Chi cuadrado.
3.1.2 Prueba de frecuencia.
3.1.3 Prueba del espacio intermedio (Gap test).
3.1.4 Prueba de Kolmogorov-Smirnoff.

Unidad 4
4.1 Aplicaciones elementales.
4.1.1 Mtodo de Montecarlo para evaluar integrales
4.1.2 Determinacin del precio de lanzamiento de un artculo.
4.1.2.1 Herramienta de Excel para generar varias rplicas.
4.1.3 Distribuciones empricas.
4.1.3.1 Simulacin de un juego de negocios.
4.1.3.1.1 Utilizacin de la herramienta Crystal Ball.
4.1.3.1.2 Prueba de bondad de ajuste con Crystal Ball.
4.1.4 Modelos continuos y modelos discretos. Crecimiento poblacional.

Unidad 5
5.1 Variables aleatorias no uniformes.
5.1.1 Mtodo de la transformada inversa.
5.2 Distribucin exponencial.
5.3 Distribucin geomtrica.
5.4 Distribucin gamma (Erlang).
5.5 Distribucin de Poisson.
5.6 Distribucin normal.
5.7 Distribucin beta.
5.8 Distribucin de Weibull
5.8.1 Clculo de los parmetros de la distribucin de Weibull..
5.9 Distribucin triangular.
5.10 Criterios de seleccin de una distribucin.

Unidad 6
6.1 Utilizacin de un equipo.
6.2 Mantenimiento de equipos.
6.3 Control de inventarios probabilsticos.
6.4 Anlisis de riesgo.
6.5 Lnea de espera (cola).
6.6 Portafolios agrcolas
6.7 Control de la contaminacin en un cuerpo de agua.
6.8 Modelo de control del dengue por medio de depredadores.
6.9 Modelos macro economtricos.
6.10 Modelos de empresa. Modelo de telaraa.
6.11 Sistemas dinmicos. El caos determinstico.
6.12 Definicin de itinerarios para una compaa aeronutica.

Unidad 7
7.1 Convergencia estocstica, intervalos de confianza y tamao de una muestra.
7.1.1 Determinacin del nmero de rplicas n.
7.2 Validacin de un modelo.

Bibliografa recomendada

Anexos
Anexo 1: anlisis de regresin.
Regresin lineal simple.
Regresin mltiple.
Regresin no lineal.
Regresin de potencia.
Regresin exponencial.
Regresin logartmica.
Regresin polinomial.
Regresin en EXCEL. Grficos y tendencias lineal., Logartmica, polinomial,
potencial., exponencial.

Anexo 2: variacin aleatoria de la tendencia..


Anexo 3: tablas de distribuciones
Normal estndar.
T de student y chi cuadrado.
Kolmogorov-Smirnov
Poisson.
Tabla de mortalidad.
Anexo 4: teora sobre modelos de control de inventarios determinsticos.
Unidad 1

1.1 Trminos bsicos


Sistema: es un conjunto aislado de componentes interactuantes. La naturaleza de los
componentes y el grado de interaccin varan.
Hay sistemas probabilsticas o estocsticos y determinsticos. Estos ltimos se
comportan de manera predecible, bien definida. Los probabilsticas implican
ocurrencias de eventos al azar. Son problemas analizados de manera ms real. Sobre
este tipo de sistemas tratar este curso sobre Simulacin.
Los sistemas estocsticos suelen ser clasificados como estticos o dinmicos. En los
sistemas estticos los eventos fortuitos ocurren independientemente del tiempo, por
ejemplo modelos de redes; en los dinmicos los eventos fortuitos ocurren
secuencialmente en el tiempo, por ejemplo en los modelos de control de inventarios o
colas (un cliente no es servido mientras el anterior no haya abandonado el servidor).

Modelo: Provee una descripcin del sistema Pueden ser fsicos o matemticos y cada
uno de esos a su vez puede ser esttico o dinmico. Estos se subdividen en numricos y
analticos. Para simulacin usaremos modelos matemticos, dinmicos y numricos. En
un modelo matemtico existen ecuaciones que relacionan entre s los parmetros y las
variables. Dado cierto conjunto de condiciones, o sea valores para los parmetros, el
modelo proporciona una medida cuantitativa del comportamiento del sistema en
cuestin y de los valores de sus variables. Otra clasificacin de modelos: modelo
analgico cuando el sistema real se representa por otro anlogo. Modelo continuo
experimenta cambios uniformes en sus caractersticas en el tiempo, por ejemplo el caso
de una ecuacin diferencial que rige el comportamiento de algn sistema fsico.
Modelos discretos: por eventos.

Estado: conjunto de atributos especficos que caracteriza un sistema. A cada uno de


esos atributos se les asigna un valor. En el caso de un avin (sistema) por ejemplo, su
velocidad, altitud, direccin, humedad, cantidad de pasajeros, combustible disponible
etc. Algunos de estos factores permanecen constantes mientras que otros cambian en el
tiempo. Algunos son determinsticos (cantidad de combustible), otros probabilsticos
(humedad, direccin del viento etc.). Otro ejemplo puede ser un sistema de control de
inventarios

Variables de estado: si cada atributo que caracteriza al sistema puede ser cuantificable,
se puede usar una nica variable para representar cada atributo. Estas son las variables
de estado S = (s1, s2,sm) por ejemplo: la velocidad v, la altura h, el vector de
direccin r, el nmero de pasajeros n etc.

Variables de decisin: son las variables cuyo valor puede ser especificado al principio
de un problema independientemente de cualquier otra consideracin. Se representarn
como X= (x1, x2,xn). Normalmente los valores escogidos para estas variables
afectan el estado del sistema. Hay variables de estados independientes (de decisin) y
dependientes. En el caso de un avin, las independientes sern por ejemplo n, nmero
de pasajeros, C, cantidad inicial de combustible etc., mientras que las dependientes
sern v, velocidad, h altura etc. En el sistema de inventarios la independiente podra ser
por ejemplo M la participacin en el mercado, las dependientes seran Q la cantidad
econmica, T tasa de produccin etc.
Parmetros del sistema: Parecidos a las variables de decisin cuyos valores pueden ser
especificados a priori. Los notaremos como el vector C= (c1, c2,ck) Usualmente
representan constantes fsicas sobre las que no se tiene ningn control y no cambian a lo
largo del problema, mientras que las variables decisin s pueden cambiar. Las variables
de estado dependen de los parmetros y de las variables de decisin: S= F(C, X)

Criterios de desempeo: indican el rendimiento del sistema. Son fsicamente


representados por los costos, niveles de produccin, tiempo de espera, longitud de una
cola etc. Y= F(S, X, C)

Poltica operativa: conforma un conjunto de valores dado de variables de decisin. Se


obtiene una nueva poltica operativa cuando se asignan valores diferentes a una o ms
variables de decisin. Por ejemplo decidir si alcanzar una participacin en el mercado
del 15%. El objetivo general de un estudio de simulacin consiste en determinar la
poltica operativa ptima pero en realidad lo que se hace es hallar una solucin
razonablemente satisfactoria, cercana a la ptima.

Simulacin: Es una actividad que permite trazar conclusiones sobre el comportamiento


de un sistema dado estudiando el comportamiento del modelo correspondiente. La
simulacin no optimiza, solo representa el sistema para probar alternativas de mejoras.
Los objetivos de la simulacin son visualizar, cuantificar y mostrar qu pasa con el
sistema.

1.2 Nociones claves en simulacin


La simulacin es una tcnica numrica que se usar como ltimo recurso cuando no se
disponga de otras tcnicas analticas ms baratas para obtener soluciones a un modelo
dado. Es tambin un experimento con un modelo del sistema. Se requiere uso
indispensable del computador. La mayora de los modelos de simulacin son de tipo
estocstico. Se experimenta con el modelo en un momento especfico del tiempo o bien
a lo largo de perodos prolongados (simulacin esttica o representativa y dinmica o de
series de tiempo). La simulacin esttica se logra repitiendo n veces una corrida de
simulacin (n rplicas) cambiando algunas condiciones, en la dinmica la simulacin se
ampla en el tiempo sin variar las condiciones. La pregunta es cuantas rplicas correr
para lograr un nivel especfico de precisin estadstica? O Cunto tiempo correr una
simulacin dinmica para que las inferencias estadsticas que se hagan no estn
influidas por las condiciones iniciales del sistema? Son preguntas que sern absueltas a
lo largo de este curso.

Simulacin de procesos estocsticos: Se le llama tambin simulacin de Monte-Carlo


o de eventos discretos y se refiere al uso de modelos matemticos para estudiar sistemas
caracterizados por la ocurrencia de eventos discretos aleatorios (discreto = individual)
que son representados por valores de variables aleatorias generadas por computador.
Un estudio completo de simulacin requiere que el sistema sea simulado repetidas veces
bajo condiciones variables, usando un diferente conjunto de valores para las variables
de decisin y para los parmetros del sistema en cada simulacin.
En este curso se ver una metodologa para simular varios procesos estocsticos en
negocios e industria, enfatizando en dos temas: la formulacin del modelo matemtico
apropiado y la solucin de un modelo usando computador para generar los eventos
aleatorios requeridos.

Cundo simular? Cuando se encuentre una combinacin de efectos de variabilidad,


incertidumbre e interdependencia compleja entre eventos.

Aleatoriedad + interdependencia = complejidad del sistema

1.3 Punto de vista sistmico


Un programa de simulacin se puede visualizar como una caja negra.

El criterio de desempeo o rendimiento Y, se expresa en muchos problemas como una


funcin de distribucin estadstica dando su valor esperado (promedio) y su desviacin.
En muchos problemas se tomar Y prom = (1/n) Yi
Donde los Yi sern los valores individuales para cada conjunto particular de S, X, C (los
valores de los Si dependern de los valores obtenidos para ciertos eventos generados
aleatoriamente).

La desviacin estndar S = (1/n) (Yi-Yprom)

S = [(1/n) (Yi)] - [Yprom ]

A veces se dan los valores de Yi agrupados en intervalos, pudiendo obtenerse un


conjunto de frecuencias relativas as:

Nj = nmero de valores de Yi que caen en el intervalo j (j= 1,2,m)


fj= frecuencia relativa para el intervalo j. (fj = Nj / N) y donde fj = 1

Una distribucin acumulada de las frecuencias relativas es

P1 = f1
P2 = f1+ f2

Pj = f1 + f2++ fj
.
Pm = fj = 1

El nmero de intervalos recomendado es el resultante de la frmula 1 + 3.3 log N


Siendo N el tamao de la muestra.

1.4 El rol de la simulacin. Ventajas y


desventajas
La ventaja principal de la simulacin es la flexibilidad: cualquier problema que
envuelva riesgo puede ser representado con un grado razonable de seguridad por medio
de un modelo de simulacin. Otra ventaja es que el estudio de simulacin posee
informacin estadstica sobre los criterios de rendimiento del sistema, lo cual permite
ver el comportamiento esperado de este y la probabilidad de que este comportamiento
sea significativamente diferente, en otras palabras, la simulacin nos indica el riesgo
asociado con una poltica de operacin particular as como una medida del rendimiento
esperado del sistema. Un estudio de simulacin es casi siempre ms barato que otras
formas de modelos (por ejemplo los icnicos: maquetas o prototipos).
Las desventajas que se pueden citar son: una simulacin requiere bastante tiempo y
recursos computacionales y de su anlisis pueden ser sacadas conclusiones errneas
sobre el comportamiento del sistema, a pesar de lo correcto del modelo y de su
resolucin, debido a que el tamao muestral ha sido quizs muy pequeo (muy pocos
eventos simulados) para poseer informacin estadstica correcta sobre el sistema. Otra
desventaja y tal vez la principal, es que para que el modelo de simulacin sea vlido, es
decir para que el modelo describa al sistema con un cierto grado de aproximacin, las
entradas del modelo deben ser vlidas, es decir que si por ejemplo, la informacin de
que se dispone sobre los parmetros de entrada del modelo es insuficiente, a su vez la
salida no va a ser muy confiable. En la prctica es bastante difcil de disponer
informacin confiable y suficiente sobre los parmetros estocsticos de entrada.
Simulando un sistema se pueden probar alternativas y resolver mltiples preguntas del
tipo Qu pasara si.? (What if.) en un tiempo comprimido pudindose hacer
inferencias estadsticas.

Unidad 2

2.1 Variables aleatorias uniformemente


distribuidas

Para poder simular eventos aleatorios discretos se debe generar una gran cantidad de
nmeros aleatorios con el computador, de la manera ms eficiente y rpida posible.
Algunos mtodos para realizar esto se vern a continuacin. En realidad los nmeros
no sern totalmente aleatorios puesto que son generados en secuencias reproducibles
por medio de tcnicas determinsticas y por eso se les llama nmeros seudo aleatorios,
pero en la prctica satisfacen las pruebas de aleatoriedad.
Se va a considerar nmeros seudo aleatorios con una distribucin uniforme en el
intervalo (0,1). Luego estos nmeros con distribucin uniforme servirn para generar
otros nmeros aleatorios que cumplen otro diferente tipo de distribucin (no uniforme),
requeridos para problemas de simulacin.

2.2 Propiedades de los generadores de


nmeros aleatorios
1. Aleatoriedad: es esencial que las secuencias de nmeros seudoaleatorios
generadas tengan las mismas propiedades que los verdaderos nmeros
aleatorios. El comportamiento aleatorio es determinado por una serie de pruebas
estadsticas que se vern posteriormente.
2. Perodo largo: debido a que las series seudoaleatorias se basan en frmulas
determinsticas precisas, cada secuencia de ellas comenzar eventualmente a
repetirse. La cantidad de nmeros no repetidos en cada secuencia se llama
perodo; este se desea lo ms largo posible de tal forma que no se deben repetir
las secuencias en una simulacin simple.
3. Reproducibilidad: es deseable generar la misma secuencia de nmeros durante
cada simulacin, cuando se usan los mismos valores para los parmetros y las
variables de entrada. Hay otros casos en los que se requieren frecuencias
diferentes. El generador de nmeros aleatorios debe ser capaz de generar ambas
secuencias, las repetidas y las diferentes, segn lo requerido.
4. Eficiencia computacional: el generador de nmeros no debe requerir demasiada
memoria, debiendo ser generados la mayor cantidad de nmeros en el menor
tiempo posible.
5. Independencia estadstica: baja correlacin entre los valores generados.
6. 7Distribucin uniforme de las variables.

2.3 Mtodos para generar nmeros aleatorios

2.3.1 Mtodo de Von Newmann (1946)

Es sencillo pero inefectivo pues se ha demostrad que la secuencia generada no cumple


las condiciones de los nmeros aleatorios: el perodo es impredecible y dependiente del
valor inicial de Ni, resultando a veces perodos demasiado pequeos.

Ejemplo: Comenzando con Ni = 25073


Ni = 628655329
N2 = 86553
N2 =7491421809
N3 = 14218
.

2.3.2 Variacin del mtodo de Von Newmann

Los dos primeros nmeros se multiplican entre s. Es un mtodo tambin insatisfactorio.

Ejemplo: Ni = 60455
N2 = 71287
Ni*N2 = 4309655585
N3 = 96555
N2*N3 = 6883116285
N4 = 31162

2.3.3 Mtodos basados en nmeros congruentes

Dado un entero positivo m, llamado mdulo, se dice que dos nmeros a y b son
congruentes en mdulo m, si (a-b) es un mltiplo entero de m tal que a-b = k*m siendo
k un nmero entero. Esta relacin se nota usualmente como a b (mod. m) y se lee a
congruente con b mdulo m.

Ejemplo: Dado m=8 hallar los pares de nmeros congruentes en mod. 8.

(8,0) 8-0 = 1*8 8 0 (mod. 8)


(11,3) 11-3=1*8 11 3 (mod. 8)
(6,-2) 6+2=1*8
(35,3) 35-3=4*8 35 3 (mod. 8)

Si a b (mod. m) y b c (mod. m) se cumple a c (mod. m)

2.3.3.1 Mtodo del residuo potencia o congruencial


multiplicativo

Hace uso de la relacin congruencial recursiva Ni A^i Ni-1 (mod. M) donde Ni-1 y
Ni son dos nmeros enteros aleatorios sucesivos.
Dados A, el multiplicador, y m, el mdulo, si se comienza con la constante N0
conocida, se tiene

N1 A^1 N0 (mod. M)
N2 A N1 (mod. M), o sea N2 A*A^1 N0 (mod. M).Queda N2 A^2 N0 (mod. M)
..
Ni A^i N0 (mod. M)

Para que los Ni tengan un aceptable comportamiento aleatorio es esencial que los
valores para m, N0 y A sean elegidos de acuerdo a las siguientes reglas:

1. El mdulo m podr ser escogido tan grande como sea posible para maximizar el
perodo de la secuencia de nmeros aleatorios. Si el computador trabaja con w bits por
palabra, el m seleccionado es m= 2^ (w-1)

2. El multiplicador A debe ser escogido de tal forma que minimice la correlacin entre
dos nmeros sucesivos y que haga el perodo lo ms grande posible. A debe satisfacer
las dos condiciones siguientes:
A 2^ (w/2) y A +/- 3 (mod. 8)

3. La semilla N0 puede ser cualquier nmero positivo entero impar cuyo valor sea
menor que m. Diferentes semillas se pueden usar para generar diferentes secuencias,
pero el mdulo m y el multiplicador A deben permanecer los mismos.

Cuando son escogidos de esta manera los valores de m, A y N0, cada secuencia
generada tendr un perodo T= m/4 y los valores obtenidos para los Ni estn entre 0 y
m-1. Para obtener las variables aleatorias distribuidas uniformemente U1, U2.cuando
0 Ui 1, se divide cada Ni/m = Ui

Ejemplo: Si el nmero de bits por palabra es w = 12, hallar m, A, N0 y los primeros Ui

La frmula es Ni A ^ i N0 (mod. m)

Aqu m = 2^ (12-1) = 2048

A 2^ (12/2) = 64 y A +/- 3 (mod. 8) de donde resulta A = 67


(67-3 = 64 = 8*8 pero tambin 61+3= 8*8)

Se elige N0 menor que m pudiendo ser por ejemplo, N0 = 129.

I=1 Ni 67^ 1 129 (mod. 2048) = 451 (67*129 = 8643


8643/2048 =4.2202.
0.2202*2048 = 451)
U1=451/2048 = 0.220214843
I=2 N2 67 ^ 2 129 (mod. 2048) = 1545
U2 = 1545/2048 = 0.7544

El perodo T= m/4 = 2048 / 4 = 512 distintos Ni. As N513 = N1 = 451


N514 = N2 = 1545 etc.

Este mtodo es ampliamente utilizado por que cumple las pruebas estadsticas para
aleatoriedad y es fcilmente implantable en el computador. Existen otros conjuntos de
reglas para escoger los valores de m, A y N0 diferentes al ya visto.

2.3.3.2 Mtodo congruencial mixto o de perodo completo

Basado en la siguiente relacin: Ni A Ni-1 + b (mod. m)

Donde Ni, Ni-1 son dos enteros aleatorios sucesivos; A, b, m constantes enteras
especficas y N0 es la semilla.

N1 A N0 + b (mod. m)
N2 A N1 + b (mod. m) = A (AN0+b (mod.m)) +b (mod.m) =A^2 N0 + b ((A^2)-1)/
(A-1) (mod. m)

Ni A Ni-1 + b (mod. m) = A^I N0 + (b ((A^i)-1)/ (A-1)) (mod. m)

Como cada Ni ser un residuo del lado derecho (por ser mod. m) 0 Ni < m
pudiendo obtenerse las variables aleatorias uniformemente distribuidas, como
Ui = Ni/ m donde Ui pertenecer al intervalo entre 0 y 1.

Cuando se implementa este mtodo en un computador se deben observar las siguientes


reglas:
1. El mdulo m podr ser escogido tan grande como sea posible para maximizar el
perodo de la secuencia de nmeros aleatorios. Si el computador trabaja con w bits por
palabra, el m seleccionado es m= 2^ (w-1)

2. El multiplicador A debe ser escogido de tal forma que minimice la correlacin entre
dos nmeros sucesivos y que haga el perodo lo ms grande posible. A debe satisfacer
las dos condiciones siguientes:
A 2^ (w/2) y A 1 (mod. 4)

3. La semilla N0 y la constante b son enteros positivos menores que m.


Para este mtodo resulta un perodo T = m. Se usa menos frecuentemente que el anterior
pues produce series menos aleatorias, a pesar de tener un T mayor. Valores apropiados
para algunos tamaos comunes de palabras w:

Tamao de palabra W Multiplicador A (2^ (w/2) +3) Mod -1(2^ (w/1) -1)
8 bits 19 127
12 67 2047
.
64 4294967299 9223372036854775807

2.3.4 Otros generadores aleatorios con distribucin uniforme

Ver libro Simulacin, mtodos y aplicaciones de D. Ros y S. Ros.

2.3.5 Variables aleatorias continuas

Si X es una v.a. continua distribuida uniformemente en el intervalo (a, b), con a menor
que b, llamamos U a la v. continua uniformemente distribuida en el intervalo (0,1)

Por proporcionalidad X-a / b-a = U-0 / 1-0 quedando X = a+ (b-a) U donde U ya se


ha generado antes.

Para generar en PASCAL, por ejemplo, nmeros entre 1 y 4: X = 1 + (4 1) RND


Donde RND es la biblioteca para generar nmeros aleatorios uniformes.

2.3.6 Variables aleatorias discretas

A y b son enteros y a menor que b. X es una variable entera (discreta) aleatoria


uniformemente distribuida en el intervalo (0,1). Se puede hallar

X = a + INT ((b a + 1) U)

Si 0 U < 1 entonces 0 (b-a+1) U < (b-a+1)


La cantidad INT ((b a + 1) U) toma valores enteros de 0, 1, 2, (b-a)
Y por ello se asumen para X los valores a, a+1, a+2,.b

Unidad 3
3.1 Pruebas estadsticas de aleatoriedad
Estas pruebas determinan qu tan bien puede ser representado un conjunto de
observaciones por una distribucin dada.

3.1.1 Prueba estadstica Chi cuadrado:

K ser el nmero de las diferentes categoras y cada observacin debe caer en una de
ellas. Oi es el nmero de eventos observados en cada una de las categoras i (i=1, k).
Ei es el nmero esperado de eventos en cada categora i. Si Oi y Ei son conocidos para
cada categora, la estadstica Chi cuadrado puede ser determinada como
k
Chi cuadrado = (O1-E1) ^2 / E1 + ..+ (Ok-Ek) ^2 / Ek = (Oi-Ei) ^2 / Ei
i=1
El resultado de este clculo se usa en unin de la tabla para la distribucin Chi
cuadrado. En ella la primera fila indica la probabilidad, en porcentaje, de que la
distribucin asumida pronostique incorrectamente. A esto se le llama nivel de
significacin. Algunas tablas dan el nivel de significacin 100-p, en vez de la
probabilidad de rechazo de la hiptesis. La columna de la izquierda representa el
nmero de grados de libertad v que es, para este caso, uno menos que el nmero de
categoras. (v= k-1) ya que en este caso no se est estimando ningn parmetro. En
general el nmero de grados de libertad es k-m-1 donde k es el nmero de categoras o
clases y m representa el nmero de parmetros estimados por los estadsticos muestrales
de la distribucin propuesta. Cuando no se estima ningn parmetro, m=0.
Cuando se hace una prueba estadstica, se est examinando si la hiptesis Ho de que los
resultados observados puedan ser representados por la distribucin dada, es correcta. La
probabilidad de que la hiptesis sea incorrecta (o sea, de que la distribucin sea
inapropiada) aumenta cuando el valor calculado para Chi cuadrado aumenta.

En la prctica, la hiptesis se rechaza Ho si el valor calculado para Chi excede el


tabulado para alguna probabilidad de rechazo razonablemente pequea, por ejemplo
p=5% o 1%. Fuera indeseable que los resultados observados difirieran grandemente con
los esperados si la hiptesis fuera vlida. La hiptesis es rechazada si el valor calculado
de Chi cuadrado es menor que el tabulado para alguna probabilidad de rechazo muy
grande, por ejemplo p= 95% o 99%. En este caso fuera indeseable que los resultados
observados estuvieran pronosticados perfectamente por la distribucin. La hiptesis es
aceptada si el valor de Chi cuadrado calculado est en el intervalo formado por los
valores tabulados correspondientes a las dos probabilidades de rechazo extremas.
Si la hiptesis nula Ho resulta cierta y aun as se rechaza a favor de la hiptesis
alternativa Ha, se est cometiendo un error de tipo I: probabilidad . Pero si Ha es cierta
y aun as no se rechaza Ho, se comete un error de tipo II: probabilidad
Las pruebas de hiptesis se configuran para permitir especificar la probabilidad de un
error de tipo I, mientras se hace todo lo posible por maximizar la probabilidad de
error tipo II. Si se exige pequea, se obtiene pero al costo de una mayor. El nivel de
significancia es entonces la mxima probabilidad aceptable del error tipo I. Si = 0.05
existe 5 de 100 posibilidades de rechazar Ho cuando es correcta y existe 95% de
confianza (1- es el nivel de confianza) en haber tomado la decisin correcta (aceptar
Ho).
V F
Aceptar Ho Error tipo II
Rechazar Ho Error tipo I

Otra forma de llevar a cabo la prueba es no tomar una decisin si-no sino cuantificar
qu tan acertado se est sobre cul es la hiptesis correcta. El valor del parmetro p nos
indica la probabilidad de obtener un conjunto de datos, si Ho es cierta, que est ms a
favor de Ha. Si p es muy pequeo, la evidencia para Ha es fuerte. Si p es grande (de 0.5
a 0.7) no hay razn para sospechar de Ho. Si p est en el lmite (0.1) el resultado es no
concluyente.
Ho no se acepta si calculado tabulado para p=5% (p es la probabilidad de
que se pronostique incorrectamente). La distribucin Chi cuadrado tiene la forma

Y su ecuacin es Y = C () ^ ((v-2)/2) exp (-/2) donde v es el nmero de grados de


libertad y C es una constante que depende de v, elegida de tal forma que el rea bajo la
curva sea 1.
Las pruebas de hiptesis aparecen en la simulacin: 1. En el ajuste de las distribuciones
de probabilidad de los parmetros de entrada al modelo y 2. En los resultados, cuando
hay varios modelos que se estn comparando en base a una medida de desempeo:
existe diferencia entre las medias de estas medidas?

Ejemplo 1: se lanza un dado un nmero n=60 veces. Las frecuencias tericas esperadas,
Ni* para este caso, son de 10 veces cada cara y las frecuencias reales, Ni, son los
resultados del lanzamiento. A base de un nivel de significacin del 5%, permite
su8poner que el dado es perfecto, es decir, no est cargado?

Caras Ni Ni* Ni-Ni* (Ni-Ni*)^2 (Ni-Ni*)^2/ Ni*

1 7 10 -3 9 0.9
2 14 10 4 16 1.6
3 8 10 -2 4 0.4
4 5 10 -5 25 2.5
5 16 10 6 36 3.6
6 10 10 0 0 0

Suma 60 60 0 9.0
La prueba se realiza teniendo en cuenta los siguientes pasos:

1. Formulacin de hiptesis: Hiptesis nula Ho: Ni = Ni* (dado legtimo)


Hiptesis alterna Ha: Ni Ni* (dado no legtimo)

P es la evidencia en contra de Ho que hay en las observaciones.

2. Nivel de significancia (Alfa) =0.05 (normalmente se usa 1%, 5% o 10%). Es la


mxima probabilidad que se especifique con el fin de hacer mnimo el error de rechazar
la hiptesis si sta es verdadera. Si se trabaja con 5% de significancia el resultado es
significativo, si se emplea el 1% el resultado es altamente significativo. es la
probabilidad de que se pronostique errneamente.

En este punto se est estableciendo el criterio de decisin para juzgar si las frecuencias
observadas, en promedio, difieren significativamente de las frecuencias esperadas. El
valor del nivel de significacin corresponde a un rea bajo la curva de probabilidad
normal llamada zona de rechazo, ZR, o regin crtica, siendo ZA la zona de aceptacin.

3. calculado= (Ni-Ni*) ^ 2/ Ni* = 9


Aqu se ve que a mayor coincidencia entre las frecuencias reales y esperadas, Chi
cuadrado tendr menor valor. Si su valor fuera igual a cero. Ambas frecuencias
coincidiran.

4. Grados de libertad v = k-m 1 = 6-0 1 = 5


El nmero de parmetros estimados m es cero pues en este caso no se est estimando
ningn parmetro. Para este valor se busca en la tabla de la distribucin Chi cuadrado,
v = 5 y = 0.05. Se halla el valor para (5.0.05) tabulado = 11.07

5. Aceptacin o rechazo de la hiptesis: como calculado menor que tabulado, se


acepta la hiptesis nula de que la diferencia entre las frecuencias no es significativa. Se
puede afirmar al nivel del 5%, que las diferencias que presentan las frecuencias reales,
en relacin con las tericas, no nos dan una base para afirmar que el dado est cargado.

Ejemplo 2: se estudiaron 64 cras de cruzamiento entre conejos de las cuales 34 son


rojos, 10 negros y 20 blancos. El modelo gentico predice que la relacin entre cras con
estos colores es 9:3:4. Al nivel del 5% se puede afirmar que los datos son consistentes
con el modelo?

9+3+4 =16
Prob 1 = 9/16 = .5625, Prob2 = 3/16 =.19, Prob3= 4/16 = .25
N1* = n*P1= 64*.5625 = 36, N2*= 64*.19= 12, N3* = 64*.25 = 16

Ni observados Ni *esperados (Ni-Ni*)^2 / Ni*

34 36 4 / 36 = .111
10 12 4 / 12 = .33
20 16 16/ 16 =1
Total 64 64 calc=1.441

Con grados de libertad v= 3-0-1= 2 y = 0.05 (2,0.05) tab = 5.99


(m = 0 por que no se est estimando ningn parmetro).

Como el valor de Chi tabulado es menor que el de Chi calculado, se acepta la hiptesis
al nivel del 5%: se puede afirmar que los datos son consistentes con el modelo.

3.1.2 Prueba de frecuencia

Es la ms sencilla y utilizada de las pruebas de aleatoriedad. Aqu el intervalo (0,1) se


subdivide en k subintervalos de igual longitud. El nmero de variables aleatorias que
cae dentro de cada subintervalo se determina y luego se calcula una estadstica Chi
cuadrado con v= k-m-1 grados de libertad. El xito o fracaso de la prueba lo determina
el valor obtenido por el estadstico Chi.

Ejemplo 3: Por medio de un algoritmo se generan 1000 nmeros seudoaleatorios cuyas


frecuencias observadas son:

Digito 0 1 2 3 4 5 6 7 8 9
F observada 94 93 112 101 104 95 100 99 108 94

Para un = 0.05 se pide verificar la hiptesis de que el generador funciona


correctamente. Se calculan las frecuencias esperadas as:

F esperada 100 100 100 100 100 100 100 100 100 100

Puesto que estas frecuencias se pueden obtener sin estimar ningn parmetro a partir de
los datos muestrales, m=0. El estadstico tendr (k-m-1) = 10-0-1 = 9 grados de
libertad. As que
(9,0.05) tabulado = 16.92

El valor
calculado = (94-100) / 10 + (93 100)/ 100 +.+ (94 100)/ 100 = 3.72

Por lo tanto no se puede rechazar la hiptesis nula.

Ejemplo 4: Se realizan 50 mediciones del voltaje de salida de una fuente de


alimentacin dando como resultado los siguientes valores:

4.56 5.053 5.064 5.041 5.019


4.95 4.91 4.97 5.081 4.85
5.023 4.99 5.014 5.027 4.99
4.99 5.059 4.96 4.9 5.066
4.97 4.72 5.035 4.96 4.99
5.019 5 4.84 5 5.038
4.96 4.97 5.045 5.069 5.06
5.122 5.132 5.09 5.099 5.089
5.141 5.098 5.128 5.15 5.145
5.138 5.144 5.131 5.139 5.094
Promedio 5.02046

Con = 0.05 se desea determinar si el voltaje de salida se rige por la distribucin


normal. Las estimaciones muestrales de la media y de la desviacin son:

Xmedia = 5.02046 V y S= 0.110602 V

Una prctica comn para construir intervalos de clase en la prueba de Chi cuadrado, es
seleccionar los lmites de las clases de forma tal que las frecuencias esperadas Ei = n Pi
(n tamao de la muestra, Pi la probabilidad de la clase) sean iguales para todos los
subintervalos. Las fronteras para las k clases a0, a1,ak se escogen de tal forma que las
probabilidades Pi = P(a (i-1) X ai) = f(x) dx siendo la integral calculada entre a (i-
1) y a (i), sean iguales.
Suponga que se decide utilizar 8 celdas o subintervalos. Para la distribucin normal
estndar, los intervalos que dividen la escala en segmentos igualmente probables son

En cada subintervalo tendramos 12.5% de probabilidad. Los valores de Z se hallan en


la tabla de la distribucin normal asignando 0.125 de rea al primer intervalo. As se
obtiene Z = 0.32. Al segundo intervalo se le asigna un rea tambin de 0.125 que
sumada al rea anterior dara 0.25 y cuyo Z es 0.675 etc. Se hace lo mismo tambin a la
izquierda del 0.

Intervalos FREC. Observada FREC. Esperada Chi cuadrado


4.948 6 6.25 0.01
4.948 4.986 7 6.25 0.09
4.986 5.014 6 6.25 0.01
5.014 5.04 7 6.25 0.09
5.04 5.066 6 6.25 0.01
5.066 5.094 5 6.25 0.25
5.094 5.132 6 6.25 0.01
5.132 7 6.25 0.09
Sumas 50 50 0.56

Debido a que se han estimado los dos parmetros de la distribucin normal, el


estadstico Chi cuadrado tabulado con k-m-1 = 8-2-1 = 5 grados de libertad y con =
0.05 vale 11.07. De este modo no se puede rechazar la hiptesis de que el voltaje de
salida est regido por una distribucin normal.

Se le aconseja al estudiante revisar los valores calculados para los intervalos y verificar
si son o no los correctos. (Sugerencia: comience con el valor de la variable que
corresponde al 12.5% del rea total calculada por medio de la frmula de traslacin de
escalas Z = (x - ) / )
Los siguientes ejemplos ilustran el procedimiento general para estimar parmetros de
una serie de datos experimentales u observaciones, e identificar la distribucin que rige
estos datos con el fin de simularlos, utilizando esta distribucin en el modelo.

Ejemplo 5: El nmero de defectos en un producto hecho de madera se propone que


sigue una distribucin de Poisson. Los defectos pueden ser por ejemplo, en el color, en
la veta,, en el terminado, en el tamao etc. En una muestra aleatoria de 60 piezas, la
distribucin del nmero de defectos hallados es:

Numero de defectos 0 1 2 3
Frecuencia observada 32 15 9 4

La media de la distribucin de Poisson propuesta debe ser estimada a partir de los datos
muestrales:
= (32*0 + 15*1 + 9*2 + 4*3) /60 = 0.75
X
La funcin de densidad de probabilidad de Poisson es f(x) = exp. (- t) (t) / X!
A partir de ese valor y esta frmula se puede calcular Pi = probabilidad hipottica
asociada al i-simo intervalo de clase, asignando arbitrariamente a t el valor de 1; cada
intervalo corresponde a un nmero particular de defectos.

Fesp Fobs
P1 = P(X=0) = exp (-0.75)*(0.75) / 0! = 0.472 P1*60 = 28.32 32
P2 = P(X=1) = exp (-0.75)*(0.75) / 1! = 0.354 P2*60 = 21.24 15
P3 = P(X=2) = exp (-0.75)*(0.75) / 2! = 0.133 P3*60 = 7.98 9
P4 = P (X3) = 1-P1-P2-P3 = 0.041 P4*60 = 2.46 4

Puesto que la frecuencia esperada en la ltima celda es menor que 0.3, se combinan las
dos ltimas celdas:

Nmero de defectos Fobs F esp


0 32 28.32
1 15 21.24
2 o ms 13 10.44

En este caso k-m-1 = 3-1-1 = 1 (3 categoras y un parmetro estimado, la media.)


(1,0.05) tabulado = 3.84
calculado = 2.94

Por ello no se puede rechazar la hiptesis nula.

Ejemplo 6: Suponga que 17 observaciones para un tiempo entre llegadas, en minutos, a


un sistema de colas, tuvieron los siguientes valores:

Llegada 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Tiempo 5 2 1 2 1 3 1 3 2 1 4 4 1 2 1 1 1

Se desea generar v.a. que se rijan segn la distribucin del tiempo entre llegadas dado.
Procedimiento: para tener alguna sospecha sobre la distribucin a hipotetizar, es
conveniente hacer el histograma de frecuencias de la variable en cuestin.

Subintervalo 1 2 3 4 5
Conteos 8 4 2 2 1

Si se hace una grfica se ver que la funcin de densidad de probabilidad se parece a


una exponencial, as que esta es la primera distribucin que hipotetizamos. El parmetro
de la distribucin exponencial es la media que se calcula

= (5+2+1+2+.+1+1) min. / 17 llegadas = 35 min. / 17 = 2.05 min. /llegada

El valor del parmetro alfa: = 1 / = 1 / 2.05 = 0.488 clientes / min.

Como suponemos (hiptesis Ho) que la distribucin de tiempos entre llegadas es


exponencial, se debe utilizar la expresin de densidad de probabilidad f(x) exponencial
como frecuencia esperada:
X1 X1
f (x) dx = exp(- x) dx = - exp (- t ) | = - (exp(- x1) exp(- x0)) =
X0 X0
= exp (-0.488 x0) exp (-0.484 x1)

Con esta formula se calculan los valores de la funcin de densidad de probabilidad para
los diferentes intervalos, siendo X1 y X2 los lmites inferior y superior de cada uno de
ellos.

Marca Xi Intervalo X0, X1 fobservada fesperada

0.5 ( 0,1] 8 exp (-0.488*0)-exp (-.488*1)


= 1- 0.613 = .386 = 6.56/17
1.5 (1,2] 4 0.2361 = 4 / 17
2.5 (2,3] 2 0.1455 = 2.47 / 17
3.5 (3,4] 2 0.0893 = 1.51/17
4.5 (4,5] 1 0.0544 = 0.92 / 17
5.5 (5,10] 0 0.079 = 1.3 / 17
Se comparan ahora los dos conjuntos de datos: fobs y fesp utilizando las pruebas de
o K-S; se define un nivel de significancia de = 0.05 por ejemplo, donde los grados de
libertad para el caso de una distribucin exponencial son k-m-1 = 6-1-1 = 4
Si se comprueba la hiptesis nula Ho, para generar las variables aleatorias
exponenciales podemos utilizar la frmula

Xexp = xo (-xo) ln u = 1 - (2.05-1) ln u

3.1.3 Prueba del espacio intermedio (Gap test)

Se usa para examinar el orden de una secuencia de dgitos seudoaleatorios. Las


anteriores pruebas han sido de uniformidad, esta es una prueba de aleatoriedad. Aqu se
cuentan los nmeros de los dgitos que intervienen entre la ocurrencia i y la i+1 de
algn digito particular, d. Si intervienen n dgitos, se tiene un espacio intermedio de
longitud n. Los espacios se determinan para cada d cuando se le permite tomar 10
valores (d= 0, 1,29). Se tabula el nmero total de ocurrencias para cada longitud de
espacio intermedio. El nmero de espacios de longitud n es dado por

En = (0.9) ^ n (0.1) N

Siendo N el nmero total de espacios. Esta frmula se halla a partir de calcular la


probabilidad de tener una cadena de longitud n+1 con un dgito de comienzo no
repetido en una muestra de tamao N.

Ejemplo 7: Considere la secuencia de 48 dgitos aleatorios consecutivos:

923060497710807406852632953903562526358756195478

Paso 1: determinar los espacios asociados a cada dgito.

D Longitud del espacio intermedio

0 1, 5, 1, 2, 11
1 31
2 18, 2, 8, 1
3 19, 3, 2, 6
4 8, 29
5 5, 4, 2, 3, 2, 3
6 12, 3, 9, 3, 5
7 0, 4, 24, 6
8 5, 19, 8
9 6, 16, 2, 15

N= 38 espacios. El mayor espacio posible es n mx. =46


Rango de 38 espacios hallados entre (n min, n mx.)= (0,31)
Paso 2. Tabular el nmero de espacios observados On y esperados En para cada
longitud utilizando la relacin En = (0.9) ^n (0.1) N

As, por ejemplo E0 = (0.9) ^0 (0.1) 38 = 3.8


E1 = (0.9) ^1 (0.1) 38 = 3.42

n On En n On En n On En
0 1 3.8 19 2 .51 39 0 .06
1 3 3.42 20 0 .46 40 0 .06
2 6 3.08 21 0 .42 41 0 .05
3 5 2.77 22 0 .37 42 0 .05
4 2 2.49 23 0 .34 43 0 .04
5 4 2.24 24 1 .3 44 0 .04
6 3 2.02 25 0 .27 45 0 .03
7 0 1.82 26 0 .25 46 0 .03
8 3 1.64 27 0 .22
9 1 1.47 28 0 .2
10 0 1.32 29 1 .18
11 1 1.19 30 0 .16
12 1 1.07 31 1 .14
13 0 .97 32 0 .13
14 0 .87 33 0 .12
15 1 .78 34 0 .11
16 1 .7 36 0 .09
17 0 .63 37 0 .08
18 1 .57 38 0 .07

Paso 3. Para aplicar la prueba Chi cuadrado se deben combinar las categoras de tal
forma que Ei 5 para cada nueva categora.

I n Oi Ei

1 0-1 4 7.22
2 2-3 11 5.85
3 4-6 9 6.75
4 7-10 4 6.25
5 11-16 4 5.58
6 17-46 6 6.08

Nmax
Paso 4. Se halla el valor calculado = (On En) ^ 2 / En = 7.98
n=1

El valor de tabulado (5,0.05) = 11.07

La hiptesis nula se acepta: la secuencia dada es aleatoria.


3.1.4 Prueba de Kolmogorov-Smirnof

Ejemplo 8: Para ilustrar la prueba de K-S se debe considerar la siguiente lista de 100
nmeros seudoaleatorios generados a partir de cualquier generador.

Lista original
0,71737 0,137189 0,027109 0,33978 0,69776
0,34985 0,75759 0,706141 0,24287 0,63228
0,60552 0,62753 0,042967 0,7821 0,88768
0,95304 0,537105 0,913921 0,9749 0,94915
0,50274 0,648736 0,238971 0,97854 0,05264
0,91186 0,995236 0,461956 0,24425 0,55761
0,12566 0,146339 0,139518 0,84442 0,63479
0,65523 0,396992 0,702397 0,79611 0,07854
0,50363 0,782123 0,378967 0,85043 0,04523
0,62129 0,368505 0,251721 0,73613 0,70679
0,25921 0,657123 0,438599 0,49227 0,22951
0,09768 0,445516 0,145883 0,26099 0,1434
0,58337 0,233252 0,786293 0,23766 0,42738
0,27453 0,234646 0,884543 0,90359 0,86524
0,00341 0,988611 0,65796 0,41962 0,95343
0,986 0,385912 0,28162 0,04967 0,85275
0,43642 0,397358 0,92938 0,86879 0,62916
0,54114 0,842296 0,088264 0,41657 0,40498
0,37442 0,909516 0,653527 0,31922 0,7559
0,20667 0,492185 0,448303 0,05089 0,74692
mnimo mximo
0,00341 0,995236

La lista debe ordenarse de menor a mayor. Los valores esperados se calculan como i
/ 100 para cada variable, donde i es el puesto que ocupa la variable en la lista (i va desde
1 hasta 100). En las columnas rotuladas como D, se calcula para cada variable, la
diferencia absoluta entre el valor observado, f (obs), de la variable y el esperado f (esp).

Lista ordenada
f(obs) f(esp) D f(obs) f(esp) D f(obs) f(esp) D f(obs) f(esp) D f(obs) f(esp) D
0,003 0,01 0,007 0,238 0,21 0,0277 0,4196 0,41 0,0096 0,6348 0,61 0,025 0,844 0,81 0,034
0,027 0,02 0,007 0,239 0,22 0,019 0,4274 0,42 0,0074 0,6487 0,62 0,029 0,85 0,82 0,03
0,043 0,03 0,013 0,243 0,23 0,0129 0,4364 0,43 0,0064 0,6535 0,63 0,024 0,853 0,83 0,023
0,045 0,04 0,005 0,244 0,24 0,0042 0,4386 0,44 0,0014 0,6552 0,64 0,015 0,865 0,84 0,025
3E-
0,05 0,05 04 0,252 0,25 0,0017 0,4455 0,45 0,0045 0,6571 0,65 0,007 0,869 0,85 0,019
0,051 0,06 0,009 0,259 0,26 0,0008 0,4483 0,46 0,0117 0,658 0,66 0,002 0,885 0,86 0,025
0,053 0,07 0,017 0,261 0,27 0,009 0,462 0,47 0,008 0,6978 0,67 0,028 0,888 0,87 0,018
0,079 0,08 0,001 0,275 0,28 0,0055 0,4922 0,48 0,0122 0,7024 0,68 0,022 0,904 0,88 0,024
0,088 0,09 0,002 0,282 0,29 0,0084 0,4923 0,49 0,0023 0,7061 0,69 0,016 0,91 0,89 0,02
0,098 0,1 0,002 0,319 0,3 0,0192 0,5027 0,5 0,0027 0,7068 0,7 0,007 0,912 0,9 0,012
0,126 0,11 0,016 0,34 0,31 0,0298 0,5036 0,51 0,0064 0,7174 0,71 0,007 0,914 0,91 0,004
0,137 0,12 0,017 0,35 0,32 0,0298 0,5371 0,52 0,0171 0,7361 0,72 0,016 0,929 0,92 0,009
0,14 0,13 0,01 0,369 0,33 0,0385 0,5411 0,53 0,0111 0,7469 0,73 0,017 0,949 0,93 0,019
0,143 0,14 0,003 0,374 0,34 0,0344 0,5576 0,54 0,0176 0,7559 0,74 0,016 0,953 0,94 0,013
0,146 0,15 0,004 0,379 0,35 0,029 0,5834 0,55 0,0334 0,7576 0,75 0,008 0,953 0,95 0,003
0,146 0,16 0,014 0,386 0,36 0,0259 0,6055 0,56 0,0455 0,7821 0,76 0,022 0,975 0,96 0,015
0,207 0,17 0,037 0,397 0,37 0,027 0,6213 0,57 0,0513 0,7821 0,77 0,012 0,979 0,97 0,009
0,23 0,18 0,05 0,397 0,38 0,0174 0,6275 0,58 0,0475 0,7863 0,78 0,006 0,986 0,98 0,006
0,233 0,19 0,043 0,405 0,39 0,015 0,6292 0,59 0,0392 0,7961 0,79 0,006 0,989 0,99 0,001
0,235 0,2 0,035 0,417 0,4 0,0166 0,6323 0,6 0,0323 0,8423 0,8 0,042 0,995 1 0,005

De los 100 valores calculados para D1, D2D100 se calcula el estadstico D de K-S
como el mximo de los Di: Dcalculado = max | f (esp)-f (obs) | = 0,051 para i=57.

Luego se busca en la tabla del estadstico dn, de Kolmogorov-Smirnoff, con n = 100,


en nuestro caso, y = 0.05 = 0.134. En la tabla se observa el valor d100, 0.05 = 0.134
Si D dn, , no se puede rechazar la hiptesis de que la distribucin que rige los
nmeros generados es uniforme.

Existen varias pruebas de hiptesis ms: la de Anderson-Darling, la prueba de las series,


prueba de independencia para descubrir auto correlacin entre nmeros, pruebas de
bondad de ajuste (grfico cuantil-cuantil) etc. Se recomienda leer el libro Simulacin
de Ral Coss-Bu, para tener una idea sobre estas otras pruebas. Para un ejemplo de
Prueba de series, cargue Texto completo sobre simulacin en la seccin Aplicaciones
de simulacin de la pgina de la materia y lea la seccin 3.2.3.2 sobre pruebas de
independencia. Lea en ese mismo texto, de la pgina 66 a la 73, seccin 3.3.3, un
ejemplo prctico sobre modelado de entradas donde se aplica la prueba K-S.

Ejemplo 9: Se desea probar si el nmero de rayos gamma emitidos por segundo por
cierta sustancia radiactiva es una variable aleatoria que tiene la distribucin de Poisson
de parmetro l =2,4. Utilice los siguientes datos obtenidos en 300 intervalos de segundo
para probar dicha hiptesis a un nivel de significacin 0,05.

N&ordm; de 0 1 2 3 4 5 6 7o
rayos gamma ms

Valores 20 48 65 75 45 34 9 4
observados

La poblacin en estudio son los rayos gamma emitidos por una sustancia radiactiva.

Se trata de contrastar las hiptesis:

Ho: La distribucin observada sigue una distribucin P (2,4).

H1: La distribucin observada no sigue una distribucin P (2,4)

El nivel de confianza es 1-a =0,95 puesto que el nivel de significacin es a =0,05 y el


tamao de la muestra n=300.
El estadstico del contraste ser el definido anteriormente, para ello deberemos calcular
los valores esperados bajo la hiptesis Ho.

Calculamos los valores esperados para una Poisson de parmetro l =2,4. Se tiene que las
probabilidades de una Poisson de parmetro l =2,4 son (mirando en la tabla de la
distribucin de Poisson, como anexo al final del libro):

Valores de 0 1 2 3 4 5 6 7o
X ms

Probabilida 0,09 0,21 0,26 0,20 0,12 0,06 0,02 0,011


des 07 77 13 90 54 02 41 6

Para hallar los valores esperados bastar con multiplicar las probabilidades por el nmero de
observaciones, obtenindose:

Valores de X 0 1 2 3 4 5 6 7o
ms

Valores 27,21 65,31 78,39 62,7 37,62 18,06 7,23 3,48


esperados

Como se observa, existe un valor esperado menor que 5, por lo que debemos de agrupar
dos clases contiguas, en este caso, los clases 6 y 7 o ms, con lo cual las distribuciones
quedaran:

Valores de X 0 1 2 3 4 5 6o
ms

Valores 27,21 65,31 78,39 62,7 37,62 18,06 10,71


esperados

Valores 20 48 65 75 45 34 13
observados

Aplicando la frmula resulta que el valor del estadstico para dicho contraste vale
T= = 27,2047

Calculamos el valor del punto crtico de una chi-cuadrado con un valor de a =0,05(nivel
de significacin) y (7-1) grados de libertad, es decir, c20, 05(6) = 12,592 mirando en las
tablas.

La regin crtica es: T mayor o igual que 12,592, es decir, el intervalo (12,592,
+infinito).

Como el valor del estadstico T es mayor que el punto crtico se rechaza la hiptesis Ho.
T=27,2047 y 12,592 = c20,05(6)

Luego tenemos evidencias de que la distribucin emprica no sigue una distribucin P


(2,4).

OBSERVACIN: En el caso de que el ajuste sea por una distribucin normal es


preferible aplicar otro test ms potente: test de Kolmogorov.

Unidad 4

4.1 Aplicaciones elementales.


4.1.1 Mtodo de Monte Carlo para evaluar integrales

Usando simulacin de procesos estocsticos se puede evaluar integrales, haciendo notar


que lo ms interesante de esta aplicacin es que un mtodo probabilstico sea utilizado
para resolver un problema netamente determinstico. Se desea evaluar, por ejemplo, la
integral: I = f(x) dx, siendo f(x) continua en el intervalo para x entre a y b,
requirindose que 0 f(x) f mx.

El algoritmo es el siguiente:

1. Generar un nmero aleatorio uniformemente distribuido Ux entre a y b.


2. Evaluar f(Ux)
3. Generar otro nmero aleatorio Uy entre 0 y fmax.
Los dos nmeros Ux y Uy representarn las coordenadas de un punto en un
plano.
4. Comparar Uy con f (Ux): si Uy es menor o igual que f (Ux) entonces el punto
(Ux, Uy) caer en o debajo de la curva dada.
5. Repetir N veces los pasos 1 a 4. La fraccin de puntos que caen bajo la curva,
FRAC, se determina. El valor de la integral se obtiene como

I = FRAC* (b-a)* f (max)


El valor para la integral I as obtenido es razonablemente aproximado cuando N
es grande.
Supongamos, por ejemplo, que f(x) = x^2 entre a=0 y b= 4. El valor analtico de la
integral 4
x ^ 2 dx = 21.3
0
Por el mtodo de Montecarlo, se deben generar N nmeros aleatorios con distribucin
uniforme entre a y b y entre 0 y f (Max). Estos nmeros sern las coordenadas Ux, Uy
de un punto en el plano:
?
N Ux f(Ux) Uy Uy f(Ux) K

1 .823*4=3.292 10.83 .486*16=7.76 7.77610.83 1


2 .120*4= .48 0.23 .034*16=0.544 0.544>0.23
3 .556*4=2.224 4.94 0.933*16=14.9 14.9>4.94
4 .824*4=3.29 10.86 0.57*16=9.12 9.1210.86 2

Con solamente 4 puntos, el valor calculado para I ser


I= (fmax-fmin) (b-a) K/ N = 16 * 4 * 2 / 4 = 32

El valor hallado estocsticamente est obviamente muy lejos del valor analtico, pero
cuando se calculan ms de 500 parejas de nmero, el error obtenido va aminorando.
Este mtodo de calcular integrales es altamente ineficiente pero para algunas funciones,
por ejemplo para la funcin de densidad de probabilidad de la distribucin normal o
para algunas integrales dobles o triples, podra ser el nico ya que puede ser
extremadamente difcil o imposible, su resolucin analtica.

4.1.2 Determinacin del precio de lanzamiento de un artculo

Un fabricante de una nueva marca de detergente desea determinar el precio unitario con
el cual debe lanzar al mercado su producto para obtener una ganancia aceptable. Se
sabe que el costo por Kg de produccin es de $0.5. El sistema no presenta ninguna
restriccin ni de produccin ni de demanda.

Para tratar de realizar un modelo matemtico del sistema se podra comenzar


investigando sobre cmo se comporta la demanda con la competencia. Para ello se
escogen seis marcas de detergente diferentes existentes en el mercado, A, B, C, D, E y
F, con caractersticas semejantes al producto que se va a lanzar, y se estudia su demanda
en un supermercado de la ciudad durante treinta das. Los resultados fueron los
siguientes:

Demanda para la marca A:

205 219 236 207 239 212


220 225 230 227 205 224
225 200 233 238 215 207
200 219 230 215 199 221
219 207 234 211 240 210
Con estos resultados, se procede a ordenar la lista de manera ascendente, se identifica el
valor mnimo (199) y el mximo (240) para determinar el rango de valores y se calcula
la demanda media que resulta Dprom A = 219.4 219. Luego se elabora el histograma
de frecuencias para poder identificar la distribucin que rige la demanda:

Subintervalo i Rango Conteos f relatva

1 199-205 5 0.1666
2 206-212 6 0.2
3 213-219 5 0.166
4 220-226 4 0.133
5 227-233 4 0.133
6 234-240 6 0.2

Por medio de una prueba de Chi cuadrado o un test de Kolmogorov-Smirnoff, se puede


comprobar la hiptesis de que la demanda se rige por una distribucin uniforme con
media 219 y longitud del intervalo de muestra (199, 240) = 219 + / - 20.El estudiante
debe verificar esto.

Respecto a las dems marcas, B, C, D, E y F cuyos datos sobre demanda no se


presentan en esta hoja por motivo de espacio, se procede de la misma manera que para
la marca A. Al analizar estas demandas se llega a la conclusin de que tambin se rigen
por la misma distribucin uniforme pero con las siguientes medias:

Marca Precio/ Kg ($ / Kg) Demanda media


A 0.5 219
B 0.85 197
C 1 194
D 2 143
E 2.5 128
F 3 114

El ancho del intervalo total de variacin de las demandas para todas las marcas resulta
aproximadamente igual: D promedio + / - 20

Al hacer un grfico Dprom vs. Precio:


Se observa una dependencia de D como una exponencial negativa de P:

Dprom = K exp (- L P)

Siendo K y L las constantes a determinar. Para ello se puede utilizar el mtodo de


mnimos cuadrados para interpolar la curva que mejor se acomode al conjunto de puntos
hallados. Pero hay otra forma ms fcil: si suponemos que los puntos (0.5, 219) y (3,
114) hacen parte de la curva, se puede hallar las dos constantes desconocidas

114 = K exp (- L 3)
219 = K exp (- L 0.5)

Se divide la primera expresin por la segunda y queda Ln (114/219) = -2.5 L as que L


valdr 0.261 y la constante K = 219 exp (0.5 L) = 249.5 De manera que la relacin
entre P y Dprom ser

Dprom = 249.5 exp (- 0.261 P) (1)

Recordar que la demanda se rige por una distribucin uniforme con rango Dprom + / -
20

La expresin para la ganancia ser G = (P- C) D (2)

Siendo G la ganancia, C el costo de produccin, P el precio y D la demanda.

Habiendo planteado ya nuestro modelo matemtico conformado por las dos ecuaciones
anteriores, es posible ahora desarrollar un programa para simular la demanda del
producto durante un nmero suficiente de das (1000 por ejemplo) para determinado
precio, observando cmo resulta la ganancia. Los datos de entrada son el precio de
venta P (variable de decisin), el costo de produccin (parmetro determinstico) y la
distribucin de la demanda (parmetro estocstico). El dato de salida ser la ganancia G
(criterio de desempeo).
El algoritmo que se usar ser el siguiente:

1. Leer un valor inicial para el precio P: desde 0.50, por ejemplo.

2. Calcular por medio de la ecuacin (1) cul ha de ser el valor de Dprom para el P
anterior.

3.1 con el valor de Dprom conocido y sabiendo que se rige por una distribucin
uniforme cuyo rango es Dprom + / - 20, se generan 1000 v.a. u. entre 0 y 1 con la
funcin RANDOM o RND (en Delphy o C++) y se transforman a valores que
representen demandas por medio de la frmula (ver seccin 2.3.4.2)

D = (Dprom-20) + INT {{(Dprom+20) (Dprom 20)}*RANDOM}

3.2 Para cada valor de D generado, se calcula su correspondiente ganancia G por medio
de la ecuacin (2), con el valor para C constante igual a 0.5.
3.3 Se acumulan estos 1000 valores para la ganancia y se calcula al final un promedio
dividiendo sobre 1000. Con esto obtenemos una primera pareja de datos: el valor del
precio P y su correspondiente valor para la ganancia promedio G.: (P1, G1)

4. Se aumenta el valor del precio en una pequea cantidad, por ejemplo en $0.01 y se
regresa al paso 2. El procedimiento se repite hasta que se haya examinado una regin
factible para los precios, por ejemplo entre 0.5 y 5, obteniendo de esta forma 450
parejas de datos (Pi, Gi) las cuales se pueden mostrar en un grfico para determinar la
regin ms recomendada para fijar el precio que ser, lgicamente, aquella donde la
curva sea ms alta. El programa puede lucir semejante al siguiente:
En base a los resultados se identifica aquella regin en la cual se debera fijar el precio
del artculo. Para una rplica, los resultados se muestran en la figura siguiente:

Este modelo se puede validar comparando sus resultados con los de la solucin analtica
del sistema de ecuaciones (1) y (2) el cual debe ser hallado por el estudiante.
Ambos resultados deben coincidir bajo un cierto margen de confianza. Para realizar
suficiente nmero de rplicas, por ejemplo 50 y de esta manera poder hallar estadsticas
confiables sobre el criterio de desempeo del modelo pero sin tener necesidad de copiar
otras tantas veces la hoja donde este se defini, se ejecutan los pasos detallados en la
siguiente seccin.

4.1.2.1 Herramienta de EXCEL para generar varias


rplicas.

Suponga el siguiente sencillo modelo donde los nicos parmetros van a ser:

Precio P = $130 Costo de produccin: C~ U (15,20) Demanda: D ~ U (165,235)

Siendo el criterio de desempeo el ingreso neto I = (P C) * D

En la hoja 1 de una nueva aplicacin de EXCEL 2003 se escriben las frmulas


necesarias entre las celdas A1 a la B4, para que aparezca un cuadro como el de la
figura:

PRECIO 130
COSTO 18,1698052
demanda 170
INGRESO 19011,13312
La hoja 2 de la misma aplicacin debe lucir semejante a la siguiente:

En la hoja 2 se tiene el resultado de correr 30 rplicas del modelo matemtico de la hoja


1 sin haber tenido que copiar 30 veces este ltimo. Para lograr esto luego de realizada la
hoja 1, se abre la hoja 2 y se escribe 1 en A1. Luego

En A1: Rellenar/series/ columnas /Limite 30

En B1: =HOJA1! B4

Seleccionar A1..B30 / Datos / Tabla: celda entrada col. C1

Copiar en la columna C solo los valores (no las frmulas) de la columna B para que no
recalcule las celdas:
Seleccionar B1..B30 / Edicin / Copiar / C1 / Edicin / Pegado especial: valores

Para ver las estadsticas, se deben instalar las herramientas para anlisis de datos:
Herramientas / Complementos / Anlisis de datos.

En D1: Herramientas / Anlisis de datos / Estadstica descriptiva / Rango de entrada:


C1..C30 / Resumen de estadsticas / Rango de salida: D1

Para ver el histograma del criterio de desempeo (Ingreso):


Herramientas / Anlisis de datos / Histograma / Rango de entrada:C1..C30 / Rango de
salida: G1..I7 / % acumulado / Crear grfico

Si se tiene el EXCEL 2007 se hacen los siguientes cambios:


Se abre la hoja 2 de la aplicacin

En B1: =hoja1! B4

Seleccionar A1..B30 / Datos / Anlisis y Si / Tabla de datos / celda entrada col. C1


(Con el rengln anterior se llenan las 30 casillas con los resultados de las 30 rplicas
diferentes del modelo de la hoja 1)

Para copiar en la columna C solo valores de la columna B:

Seleccionar B1..B30 / Ctrl.+ C / Cursor en C1 / Ctrl. V / Clic con el botn derecho


del Mouse / Pegado especial / valores

Para ver las estadsticas, instalar las herramientas para anlisis de datos:

Clic al Botn de Office en le esquina superior izquierda de la pantalla / Opciones de


EXCEL / Complementos / Herramientas para anlisis / ir / marcar Herramientas
para anlisis

Una vez instaladas las herramientas para anlisis estadstico, se desea que aparezca el
resumen de estadstica de los datos de la columna C con la media, la varianza, la moda
etc.:

Datos / Anlisis de datos / Estadstica descriptiva / Rgo. Entrada: C1..C30 /


Resumen de estadsticas / Rgo salida D1

Para obtener el histograma de los datos de la columna C:

Datos / Anlisis de datos / Histograma / Rgo. Entrada C1...C30 / Rgo. Salida


F1.H8/ Crear grfico / % acumulado

4.1.3 Distribuciones empricas

Hasta ahora se ha visto cmo generar variables aleatorias a partir de una funcin de
distribucin dada. El problema inverso consistir en la construccin de una funcin de
distribucin a partir de un conjunto de variables aleatorias que representan la medida del
comportamiento del sistema, cuando las distribuciones tabuladas (normal, pascal,
uniforme etc.) no se adecuan a estos datos.
Una distribucin emprica se usa cuando se desea utilizar los datos observados de la
muestra para especificar directamente la distribucin.
En problemas reales la probabilidad de ocurrencia de un evento es expresada en
trminos de datos agrupados con distribucin emprica, por ejemplo:
Cada subintervalo j = 1,2m, es representado como un rectngulo cuyos lmites
superior e inferior son Xsj y Xij. La altura de cada subintervalo f(x), representa la
probabilidad de que el valor de X para un evento aleatorio caiga dentro del j-simo
subintervalo, esto es, Xij X Xsj. Esta se halla determinando cuntas variables
aleatorias caen dentro de cada subintervalo y dividiendo luego por m,

Xij = a + ((b-a) / m) (j-1)

Xsj = a + ((b-a) / m) (j)

a= valor ms pequeo de la muestra, b= valor ms grande, m= nro. de subintervalos.


J vara desde 1,2,m.

Como las fj representan probabilidades: f1+f2+fm = 1


Se puede construir una distribucin aculada a partir de este conjunto de datos
agrupados, calculando simplemente la suma acumulada de los fj previos:

Y1 = f1
Y2= f1+f2

Ym= f1+f2+fm = 1

La altura de cada subintervalo Yj, representa la probabilidad de que el valor de X para


un evento aleatorio no exceda a Xsj. Para hacer uso del mtodo de la transformada
inversa se debe trazar una curva continua a travs de la distribucin acumulada, segn la
grfica anterior.

Ahora se puede generar un nmero aleatorio distribuido uniformemente en (0,1), U,


obtenindose el valor correspondiente para X por interpolacin lineal:

X = Xij + [(U-Yj-1) (Xsj-Xij) / (Yj-Yj-1)]

Pero Cmo determinar el subintevalo apropiado? Se puede empezar con el de ms a la


izquierda (cuando j=1) y comparar sucesivamente U con cada Yj. El intervalo deseado
ser el primero en el que Yj-1 U Yj
Cuando se implementa el mtodo en el computador, los valores de a y b y los Yj deben
ser ledos como datos de entrada. Los lmites del intervalo Xij y Xsj pueden ser ledos o,
si se trata de intervalos igualmente espaciados, calculados por medio de la expresin

Xij = a + ((b-a) / m) (j-1)

Xsj = a + ((b-a) / m) (j)

Donde m es el nmero de subintervalos. Se puede representar una porcin de la


distribucin acumulada por medio de una curva acoplada; esto se hace pasando un
polinomio de grado n a travs de los puntos de datos dentro de alguna regin de inters,
siendo este polinomio tpicamente una funcin cuadrtica o cbica, n) 2 n=3.
Ms informacin sobre este tema de aproximacin polinomial se puede consultar en
cualquier libro sobre anlisis numrico.

4.1.3.1 Simulacin de un juego de negocios

Una compaa desea calcular la ganancia esperada por la venta de un nuevo producto
con un precio de venta especfico, del cual se tienen las siguientes estimaciones sobre
las cantidades vendidas y los costos de produccin:

Respecto a los volmenes de ventas existe un 35% de probabilidad de vender entre


40000 y 60000 unidades, un 40% de probabilidad de vender entre 60000 y 80000
unidades y un 25% de probabilidad de vender entre 80000 y 100000 unidades.

Respecto al costo de produccin existe un 20% de probabilidad de que este flucte entre
$60 y $ 70, un 35% de que flucte entre $70 y $80, un 30% de que flucte entre $80 y
$90 y un 15% de que flucte entre $90 y $100.
Suponga que el precio de venta se decida segn el criterio: que sea un 25% mayor al
costo de produccin esperado.

La distribucin emprica del volumen de ventas es:

J Vol.ventas(unds) Prob.ocurrencia F acumulada


1 40-60 mil 0.35 0.35
2 60-80 mil 0.40 0.75
3 80-100 mil 0.25 1

La siguiente es la distribucin emprica del costo de produccin:

J Costo($/und) Prob de ocurrencia Facum


1 60-70 0.2 0.2
2 70-80 0.35 0.55
3 80-90 0.3 0.85
4 90-100 0.15 1

El valor del precio se determina calculando primero el valor esperado del costo de
produccin y multiplicndolo por 1.25:
(65*0.2 + 75.35 + 85*0.3 + 95*0.15)*1.25

A partir de esta informacin sobre el costo de produccin se generan , por ejemplo,10


variables uniformes U entre 0 y 1, las cuales podran ser .35, .97, .22, .15, .6, .43, .79, .
52, .81, .65
El primer nmero aleatorio .35, cae en la segunda (j=2) categora: 0.2 0.35 0.55, El
subintervalo j=2 tiene determinados los lmites inferior y superior para la variable
costo: Xij X Xsj ser Xi2 = 70 X Xs2 =80. De esta manera la primera variable
aleatoria con la distribucin emprica dada ser

X1 = Xi2 + [(U1-Y1) (Xs2-Xi2)/(Y2-Y1)] = 70+ [ (.35-.2) (80-70) / (.55-.2)]= 74.29

El segundo nmero aleatorio cae en la cuarta categora: 0.85 0.97 1 y as

X2 = 90+ [ (.97-.85) (100-90) / (1-.85]= 98

Y si se calculan las otras variables que representen costos de produccin, se obtendrn


los siguientes valores:

70.57, 67.5, 81.57, 76.57, 88, 79.14, 88.67, 83.33.

Estas variables cumplen la distribucin emprica dada. Una desventaja de generar v.a.
con distribucin emprica es que nunca sern menores que a ni mayores que b.
De la misma manera que se hace para generar valores de costo, se generan ahora
variables aleatorias que representen el volumen de ventas. El proceso se debe repetir un
nmero suficiente de veces (1000?). El criterio de desempeo del modelo es la
ganancia neta que se calcula como

G = (Precio Costo de prod.) * Vol. De ventas

Se calculan de esta manera 1000 valores para G: G (1), G (2),..G (1000), con los
cuales se puede hallar su valor esperado y su dispersin, y elaborar el histograma de
frecuencias para determinar qu tan incierta es la prediccin.

4.1.3.1.1 Utilizacin de la herramienta Crystal


Ball
Primero se desarrolla el modelo matemtico, muy sencillo

Precio 130 Distribucin de la demanda


Costo de Produc 0 1000 2000 0,35
Demanda 0 2001 3000 0,45
3001 4000 0,2
Ingreso 0

El precio es una variable de decisin, su valor es fijo: 130 y se escribe en la casilla B1;
el costo de produccin y la demanda son parmetros estocsticos cuya distribucin se va
a definir mientras que el ingreso es simplemente (Precio-Costo de produccin)*
Demanda para lo cual se escribe en la celda B5 la frmula + (B1-B2)*B3.
Con el cursor en la casilla B2 se selecciona el cono de Crystall ball Define
assumption (primero a la izquierda) para definir el tipo de distribucin que rige el
costo de produccin, una normal con media 90 y desviacin 15. La pgina luce as:

Luego se define la distribucin que rige la demanda, una emprica detallada en la tabla
D2...F4. Con el cursor en B3, se selecciona Define assumption, se escoge la opcin
Custom y luego de sealar el rea donde van los datos, queda as

Luego, con el cursor puesto en la celda donde est el criterio de desempeo: B5. , se
toma la opcin Define forecast, que es el tercer icono de cristal ball, se seala el
cuadro de la opcin Fit distribution , se seala la anterior celda y luego OK. Se
puede tener ms de una celda sealada con Define Forecast.
El noveno icono de Cristal Ball, Run preferences, se escoge para decidir el nmero de
rplicas que se va a correr: 100. Por ltimo se escoge la opcin Start simulation.
Momentos despus aparece el informe sobre las 100 rplicas corridas del modelo.
Con la opcin View se puede ver el histograma de la distribucin de
probabilidad del criterio de desempeo (Ingreso) , o sea la variable Forecast , con
una curva de distribucin ajustada, su funcin de probabilidad acumulada, el informe
sobre los parmetros estadsticos y la identificacin de esta distribucin hecha con tres
tipos de pruebas: Anderson-Darling, Chi cuadrado y Kolmogorov-Smirnoff.

.
Para contestar el tipo de pregunta P (70000 Ingreso 90000), simplemente se
escriben estos dos valores en la parte inferior izquierda y derecha del histograma de
probabilidad y la respuesta se observa de inmediato.

Si se desea volver a correr las n rplicas, se debe elegir el cono reset.


En cuanto a las variables de decisin, se hace clic sobre la celda donde est y se
elige el men Cell/decisin. Luego se introduce el rango de valores entre los que se
puede mover la variable en cuestin y se define si es discreta o continua. Para discretas,
se debe indicar el tamao del cambio. Al simular, el programa las considera como
constantes con el valor que se escribi en la celda pero luego se puede llegar a optimizar
(con Cbtools/Decision table o con Optquest.)
El anlisis de sensibilidad se puede hacer a travs de una grfica tipo tornado: Run
/ open Sensitivity Chart que muestra la importancia de cada variable aleatoria sobre el
resultado final.
Tambin se puede optimizar ensayando con diferentes valores de las variables de
decisin definidas con Cell / Decision. En el men Tools / Decision table se define cul
Forecast se desea evaluar con los diferentes calores de las variables de decisin y se
eligen las variables de decisin. Se debe definir cuntos valores diferentes ensayar y
cuantas iteraciones har en cada simulacin. Se puede hacer un reporte de la simulacin
con Run / Create report.
Se sugiere como ejercicio, resolver el problema de la seccin 4.2.1 utilizando Crystal
Ball.

4.1.3.1.2 Prueba de bondad de ajuste con Crystall


Ball .

El Crystall Ball permite identificar la distribucin que rige un conjunto de datos. Para
ello basta introducirlos desde A1 hasta A100 por ejemplo. Cursor en A1, luego se elige
Define forecast / Fit distribution / destacar el bloque A1...A100 / split view y se
obtiene una lista de aquellas distribuciones posibles junto con su grado de ajuste.
Para una serie de datos con distribucin desconocida, se selecciona Galera / fit /se
escribe el rango donde se encuentran los datos y el paquete buscar la mejor funcin
que ajuste los datos y se la asigna a la celda en cuestin.

4.1.4 Modelos continuos y discretos. Crecimiento poblacional.

Para desarrollar esta unidad se aconseja que el estudiante repase inicialmente los temas
de anlisis de regresin y de variacin aleatoria de la tendencia incluidos como anexos
en este texto, temas estos que ya debi tratar en cursos anteriores.

Suponga que se conoce los siguientes valores para tres aos consecutivos de una
determinada poblacin:

Ao 2007 2008 2009


Poblacin 782 = P0 811 = P1 833 = P2

Se quiere modelizar matemticamente su comportamiento.

El modelo continuo expresa el cambio de poblacin (la rapidez con la que la poblacin
vara) como proporcional al tamao de esta, por medio de la ecuacin diferencial

dP / dt = k P

Acomodando trminos dP/P = k dt


Integrando y exponenciando exp (ln P) = exp (k t + c)

Exponenciando P = C exp (k t)

En t = 0 P0 = C exp (k * 0) = C

Sustituyendo P0 P = P0 exp (k t) = 782 exp (k t)

En t = 2 P2 = 782 exp (k*2) = 834

Tomando logaritmos ln (834 / 782) = 2 k

Despejando k = 0.03218

En base al modelo la proyeccin de la poblacin para el ao 2013 ser:

P6 = 782 exp (0.03218 * 6) = 948.5

Segn el modelo, la poblacin para el ao 2002 debera haber sido

P-5 = 782 exp (0.03218 * (-5)) = 665

Suponga que los datos reales desde el ao 1999 hasta el 2013 sean los siguientes:

/ Ao Poblacin
real
1999 610
2000 631
2001 654
2002 676
2003 692
2004 713
2005 736
2006 758
2007 782
2008 812
2009 834
2010 863
2011 893
2012 919
2013 954

En este caso el modelo continuo tendr cierto error en la prediccin para 2002 y 2013.

Ahora miremos cmo sera otra forma de solucin del problema, el enfoque de modelo
discreto: lo primero que se hace es una regresin para hallar la forma como vara la
poblacin a lo largo del tiempo. La regresin lineal nos proporciona una buena
aproximacin al conjunto de puntos.

Tasa crecimiento prom 3,218


Ecuacin de regresin y = 24,088x 47553
R2 = 0,9941

Tasa de Segn
/ Ao Pobl. real crecimiento ec.regr. Diferencia Var. De %

1999 610 3,5 599 11,088 1,8177049


2000 631 3,6 623 8,35 1,3225627
2001 654 3,4 647 6,9906 1,0687706
2002 676 2,3 671 5,1412724 0,7601864
2003 692 3,11 695 -3,3914303 -0,4901813
2004 713 3,23 719 -5,9621934 -0,8357553
2005 736 2,98 743 -7,0077026 -0,9515746
2006 758 3,12 768 -9,1500202 -1,2065250
2007 782 3,83 792 -9,5766272 -1,2245709
2008 812 2,7 816 -3,7125192 -0,4572110
2009 834 3,5 840 -5,8767492 -0,7047178
2010 863 3,46 864 -0,7777155 -0,0901069
2011 893 2,95 888 4,9976235 0,5596658
2012 919 3,75 912 7,2521094 0,7888660
2013 954 2,84 936 17,638163 1,8492863

Analizamos la distribucin de las variaciones de porcentaje dividiendo estas en 4


intervalos que van desde -1,22 hasta 1,98.

Var. De %
1,817704918 Var. Inf Var.sup Conteos Frecuencia Frec. Acum.
1,322562762
1,068770634 -1,22 -0,42 7 0,47 0,47
0,76018647 421 -38 0 0,00 0,47
-0,490181355 -0,381 1,18 5 0,33 0,8
-0,835755342 1.181 198 3 0,20 1
-0,951574597
-1,206525037
-1,224570983
-0,457211602
-0,704717808
-0,090106992
0,559665838
0,788866035
1,849286369

Esta es la distribucin de frecuencia de la variacin aleatoria para nuestra variable de


poblacin. Es una distribucin emprica de frecuencias.
Si se quiere predecir el valor de la poblacin para el ao 2014, primero se calcula con la
ecuacin de regresin el valor medio de la poblacin,

P2014 = 24,088*2014 - 47553 = 960,23

Enseguida se genera la variacin aleatoria de acuerdo a la distribucin emprica hallada:


Con la calculadora se genera primero una variable aleatoria entre 0 y 1: 0.659. Este
valor cae dentro del tercer subintervalo de la frecuencia acumulada. El valor de la
variacin se calcula de acuerdo a la frmula de interpolacin lineal

Var. Aleatoria de porcentaje = -0.38+ ((.659-0.47)/(0.8-0.47)) * (1.18 + 0.38) = 0.5134

A ese valor medio se le suma (o se resta si resulta con signo negativo) la variacin
aleatoria segn la distribucin hallada, resultando el valor de la poblacin

P2014 = 960,23 + (0.5134/100) *960.23 = 965.16

Es el valor de la poblacin pronosticado para el ao 2014,

Unidad 5

5.1 Variables aleatorias no uniformes


Muchos problemas de la vida real requieren, para ser simulados en el computador, de la
generacin de nmeros aleatorios con distribucin variada, no siempre uniforme. La
distribucin uniforme entre (0,1) puede ser usada para generar otras distribuciones no
uniformes de nmeros aleatorios las cuales pueden ser empricas o tericas, discretas o
continuas. Muchas funciones de densidad de probabilidad tienen parmetros de forma,
de escala y de posicin que las definen. Reconociendo sus caractersticas se puede tener
una idea ms clara para aplicar la distribucin apropiada cuando no existan datos
histricos de un sistema.

5.1.1 Mtodo de la transformada inversa

Suponemos dada una funcin de densidad de probabilidad f(x), con la cual se desea
generar una variable aleatoria x gobernada por esta funcin.

Primero se obtiene la distribucin acumulada F(x) correspondiente a f(x):

F(x) = f(x) dx para 0 F(x) 1

Una tpica funcin de distribucin acumulada luce como la siguiente grfica:


Esta funcin de distribucin acumulada se resuelve para x, esto es, si y = F(x) , se
puede escribir x = 1/ F(y) (transformada inversa de y) , expresin que permite
determinar el valor particular de x que corresponde a un valor dado de y: (x0,y0). Ahora
supondremos que X es una variable aleatoria gobernada por una funcin de densidad de
probabilidad dada y que Y = F(X) es el valor correspondiente de la distribucin
acumulada. Se puede escribir
Prob (Y y0) = Prob (X x0) = F(x0)

Pero F(x0) = y0 entonces Prob (Y y0) = y0

La cual es expresin para la distribucin uniforme acumulada en (0,1). Esto nos dice
que Y es uniformemente distribuida dentro de este intervalo (0,1) sin importarla
distribucin de X.
Para generar un valor para X usando l mtodo de la transformada inversa, se representa
primero Y por medio de un nmero aleatorio con distribucin uniforme en (0,1), U. Se
puede obtener el correspondiente valor para X evaluando la expresin X = 1 / F (U)
Con el mtodo de la transformada inversa se puede generar muchas funciones de
distribucin, pero no todas, por ejemplo la distribucin normal no puede ser generada
con este mtodo pues esta funcin no es analticamente integrable y no es posible
obtener una ecuacin explcita para x.

5.2 Distribucin exponencial


Es una distribucin continua. Para utilizarla en un modelo debe conocerse o estimarse la
media. Es especialmente til en problemas que envuelvan secuencias de arribos o
partidas independientes, por ejemplo, una ventanilla de un banco, clientes que llegan a
un supermercado, el nmero de autos en un tramo de autopista etc. Y tambin dentro del
ramo de la fsica, en problemas de emisin de partculas a partir de substancias
radioactivas (tiempo de vida media de un emisor de partculas y estudios de carbono 14
para datar la antigedad de un objeto).
Supondremos que x representa el tiempo y asumiremos que la probabilidad de un
evento aleatorio, por ejemplo, la llegada de un cliente, una pulsacin en una lnea
telefnica, la emisin de una partcula alfa etc. Ocurriendo entre los tiempos x y x+dx es
dx, donde es una constante positiva conocida, dependiente de las caractersticas del
sistema especfico que se simule. La probabilidad de que el evento no ocurra es 1- dx.
Consideremos ahora un largo intervalo de tiempo entre 0 y x subdividido en n intervalos
de igual longitud, dx, as que x= n dx. La probabilidad de que u evento aleatorio no
ocurra se puede expresar como
Lim ((1-dx) ^n = Lim (1-dx)^(x/ dx)
dx0, ninf dx0

Siendo este ltimo trmino igual a

Lim ((1- dx) ^ (-1/ dx)) ^ (- x) = e^ (- x)= 2.7182^ (- x)


dx0
Siendo e la base del sistema de los logaritmos naturales.
La probabilidad de que un evento ocurra es Prob (0 X x) = F(x) = 1-e^ (- x)
Siendo la probabilidad (densidad) correspondiente f(x) = e^ (- x) si x 0

Como antes (ver mtodo de la transformada inversa) se tena


x
F(x) = f(x) dx = 1-e^ (- x)
0
f (x) ser la derivada de F(x). El promedio de la distribucin exponencial se halla al
calcular la integral: Var S = = x e^ (- x) dx = 1 / que es el valor esperado de x.
Para ello se hace uso de la transformada inversa para x = 1/ F (y)

Donde y = F(x) y F(x) = f(x) dx

Sale x = - (1/) Ln (1-F(x))

Si F(x) es uniformemente distribuido, 1- F(x) tambin lo es, entonces se puede escribir

Xexp = -(1 / ) Ln U

Donde Xexp es la v.a. con distribucin exponencial buscada y U es un nmero aleatorio


con distribucin uniforme en (0,1), como antes. Suponga ahora que se requiera que Xexp
sea mayor que una cantidad especfica xo positiva; la ecuacin anterior se debe
modificar
Xexp = xo - (1 / ) Ln U = xo ( xo) Ln U donde = 1/ ( xo)

En muchos problemas de lneas de espera, la probabilidad de una llegada aleatoria entre


los tiempos x y x+dx es proporcional al intervalo de tiempo dx, tal como est implcito
en la distribucin exponencial. Tales llegadas pueden ser descritas por la distribucin,
cuando la variable aleatoria X representa el tiempo entre dos llegadas sucesivas.

Ejemplo: se pide generar v.a. exponencialmente distribuidas, dados x0 = 2 y = 6


.
En la columna A de la imagen anterior se pueden observar las variables aleatorias
uniformes ui y en la columna B las correspondientes variables aleatorias distribuidas
exponencialmente por medio de la frmula Xexp = 2 + 6 * Ln u
Obsrvese la forma del histograma, coincidente con una distribucin exponencial

5.3 Distribucin geomtrica.

Es discreta y se utiliza para hacer pronsticos del nmero de fallas antes de obtener el
primer xito es una secuencia de n ensayos independientes, para pronosticar el nmero n
de tems inspeccionados antes de encontrar uno defectuoso, para simular el nmero n de
tems demandado en un sistema de inventarios. A la distribucin binomial se le llama
de Bernoulli si los parmetros son B (1, p), o simplemente binomial si los parmetros
son B(n, p) cuando n es el nmero de experimentos y p la probabilidad de xito. La
distribucin geomtrica tiene como variable X al nmero de experimentos de Bernoulli
independientes realizados antes del primer xito (p: probabilidad de xito). Una
variable geomtrica (binomial) es la suma de n variables aleatorias independientes de
Bernoulli con el mismo parmetro p de xito.

Xbin (n, p) = X1Ber (p) + X2Ber (p) +..+ XnBer (p)

Ejemplo: El 60% de los elementos de un grupo son H, el 40% son M. Cul es la


probabilidad de obtener H en el cuarto intento de una prueba con reemplazo?

P(X=H) = 0.6 con XBer (p=0.6)


P (y=4) = .4 * .4 * .4 * .6 = .038 con YGeom (4,0.6)

Para generar una variable regida por la distribucin geomtrica, considere una secuencia
de experimentos independientes entre s, cuyo resultado puede ser xito o fracaso. Si p
es la probabilidad de xito para cada experimento (0 p 1) y q = 1 p es la
probabilidad de fracaso, la probabilidad de obtener x fracasos consecutivos seguidos por
un xito es f(x) = p * q^x donde x es un entero no negativo. La ecuacin anterior
representa la densidad de probabilidad para la distribucin geomtrica cuya media es
= q / p y cuya varianza es S^2 = q / p^= / p

La funcin de distribucin acumulada correspondiente se expresa como


x
F(x) = f (0) + f (1)++f(x) = p+ p q + p q^2 +.+ p q^x = p q^k
K=0

Observe que F (0) = p y p F(x) 1

Para usar el mtodo de la transformada inversa, se debe expresar de otra forma la


distribucin acumulada.
Prob (X>0) = 1 F (0) = 1 p = q
Prob (X>1) = 1 F (1) = (1 p) p q = q (1-p) = q^2

Prob (X>x) = 1 F(x) = .. = q^ (x+1)

Donde X es una variable aleatoria con distribucin geomtrica. (1 F(x)) / q = q^x

Se sabe que F(x) es uniforme en (F (0) = p, 1) y por ello tambin lo es (1 F(x)) / q en


(0,1). Por ello se puede concluir que 0 q^x 1

Y para usar el mtodo de la transformada inversa u = q^x cuando u es un nmero


aleatorio distribuido uniformemente en (0,1). Resolviendo para x:

Ln u = x Ln q o sea x = Ln u / Ln q

Y debido a que la distribucin geomtrica es discreta, las variables deben ser enteras y
por ello se debe tomar el valor entero de la funcin Xgeom = INT [Ln u / Ln q]
Ejemplo: Generar v.a. con distribucin geomtrica con p = 0.3
En la columna A del grfico se observa el valor de las v.a. uniformes y en la columna B
los valores de las v.a. con distribucin geomtrica segn la frmula

Xgeom = ENTERO (LN (aleatorio ()) / LN (0.7))

El valor de Xgeom se puede interpretar como el nmero de intentos antes de que se


produzca un evento, por ejemplo, Xgeom ser el nmero de pruebas de control de
calidad antes de que sea hallado un elemento defectuoso en un lote de artculos.

5.4 Distribucin Binomial Negativa

Es una distribucin adecuada para los procesos en los que se repite x veces un ensayo
(nmero de fracasos) hasta conseguir un determinado nmero de xitos, k. Si x=1 esta
distribucin coincide con la distribucin geomtrica. Los supuestos son: independencia
de los ensayos y reposicin.

Siendo p la probabilidad de xito y q la de fracaso, la funcin de distribucin de


probabilidad es de la forma
Una variable BN es la suma de k variables geomtricas G con parmetro p
(xito).Recordemos que una variable geomtrica representa el nmero de intentos
necesarios para alcanzar el primer xito en ensayos independientes y sucesivos de un
experimento de Bernoulli con parmetro p.

Un algoritmo sencillo para generar variables de tipo BN es el siguiente:

Generar x1, x2,xk valores independientes de una distribucin G (p)


XBN = x1 + x2 +.+ xk

5.4 Distribucin Gamma (Erlang)

Su empleo en Simulacin/MonteCarlo est relacionado con los fenmenos de espera, el


hecho de que sea siempre positiva la liga a magnitudes como el tiempo para realizar una
tarea o el tiempo hasta el fallo de un dispositivo, entre otras posibles aplicaciones. Estas
aplicaciones se derivan del hecho de que puede considerarse como la probabilidad de
que ocurran sucesos en un periodo (1/) de tiempo (por ejemplo que fallen los k
subsistemas de un dispositivo que harn que ste finalmente deje de funcionar; que se
lleven a cabo las k subtareas que componen un tarea principal con lo que sta puede
considerarse terminada, etc.)

Es una distribucin continua y se usa para representar datos empricos, por ejemplo,
tiempos de funcionamiento de equipos entre fallas, debido a que puede tomar una gran
variedad de formas, dependiendo de los valores asignados a los parmetros y . Se
usa para modelar variables que describen el tiempo hasta que se produce P veces un
cierto suceso. Se puede generar el tiempo de falla de un sistema con componentes,
cada uno con frecuencia esperada de falla , o el tiempo para completar una operacin
compuesta cuando esta requiere suboperaciones cada una con la misma frecuencia :
los valores generados por esta distribucin pueden representar el tiempo total requerido
para completar n repeticiones independientes de cierta tarea. El mtodo de la
transformada inversa solo se puede usar si se puede obtener una expresin para la
funcin de distribucin acumulada y si se puede resolver explcitamente para x, pero
hay muchas funciones de densidad de probabilidad donde esto no es posible, por ello se
debe buscar una tcnica alternativa, Una de estas tcnicas es la distribucin gamma, la
cual tiene una densidad de probabilidad

f(x) = ^ x^ (-1) e^ (-x) / ( 1)!

Donde al denominador ( 1)! se le llama la funcin Gamma: = ( 1)!

x
La media de esta distribucin es = / = x f(x) dx
0

su varianza s = / = / , su rango [0,) y sus parmetros y .


La variable x en f(x) puede interpretarse como la suma de las variables aleatorias
exponencialmente distribuidas, teniendo cada una como valor esperado 1 / as:

Xgamma = x1 + x2 +.x con f (xi) = e^ (- xi)

La funcin de densidad de probabilidad para la distribucin gamma no se puede integrar


analticamente. Se usa entonces el mtodo de la transformada inversa para generar
variables aleatorias gamma. Si se suman las variables aleatorias exponenciales:

Xexp = (- 1 / ) Ln u con u = 1 F(x)


Se suman las variables ui: Xgamma = (-1/) Ln ui = (-1/) Ln ui
i=1 i=1

La funcin gamma se reduce a la exponencial cuando = = 1


Ejemplo: generar v.a. con distribucin gamma, siendo los parmetros = 1 y = 2

Suponga que las v.a. uniformes sean .35, .97, .22, .15, .6, .43, .79


Las variables gamma se generan segn la frmula Xgamma = -(1 / ) Ln Ui
i=1
La primera variable gamma se calcula X1gamma = - (1/ 1) Ln (.35 * .97) = 1.08

La segunda vale 3.41 etc.

5.5 Distribucin de Poisson.


La distribucin del nmero de sucesos raros (llamadas de telfono, emisiones de
partculas radioactivas, accidentes de trco, nmero de erratas) que ocurren en un
periodo jo de tiempo (una hora, un segundo, un ao, una pgina) es la llamada
distribucin de Poisson. Esta distribucin tiene un parmetro que representa el nmero
medio de accidentes por unidad de tiempo.
Es una distribucin discreta y para utilizarla se debe conocer o estimar el valor
promedio de la distribucin. Es semejante a la distribucin exponencial y se usa en
modelos para simular demandas en un sistema de inventarios, o en problemas que
envuelvan secuencias de llegadas y salidas. Si el tiempo entre dos eventos sucesivos
tiene distribucin exponencial, el nmero de eventos x que ocurren en un intervalo de
tiempo t finito tendr una distribucin de Poisson cuya densidad de probabilidad est
dada por
F(x) = ( t) ^(x) e^ (- t) / x!

Donde y t son constantes positivas y la variable x debe ser no negativa y entera. La


media
= s^2 = t

Para generar variables de poisson se debe notar que la cantidad total de tiempo entre
eventos sucesivos no puede exceder a t, esto es
x x+1
ti t < ti
i=1 i=1

Siendo ti las variables aleatorias exponenciales, las cuales se pueden expresar como

ti = (- 1 / ) Ln ui
k+1
El valor ms pequeo de k que satisface la inecuacin (- 1 / ) Ln ui > t
Ser la variable de Poisson buscada. Para obtener un mejor procedimiento de
generacin reescribimos k+1 k+1
Ln ui < - t o Ln ui < - t
i=1 i=1
Exponenciando a ambos lados: k+1
ui < e^ (- )
Tomando arbitrariamente t=1. i=1
Problema: se hace un muestreo del nmero de llamadas que entra a una central
telefnica durante un intervalo de tiempo de 5 min. Los siguientes son los resultados:

7, 6, 4, 5, 6, 10, 5, 9, 1, 3, 4, 7, 4, 5, 6, 4, 4, 6, 8, 5, 9, 4, 4, 11, 5, 6

Al agrupar los datos por intervalos se obtiene la tabla:


Nmero de llamadas 4-5 6-7 8-9 10-11
Frecuencia 12 7 3 2

Observe la forma de la curva resultante: curva de Poisson (recuerde que la variable es


discreta).

Problema: se toman los tiempos entre llegadas, en minutos, para 17 clientes a un


sistema de colas. Los siguientes son los resultados:

5, 2, 1, 2, 1, 3, 1, 3, 2, 1, 4, 4, 1, 2, 1, 1, 1

Se pide hallar la forma de la distribucin de los tiempos entre llegadas y del nmero de
llegadas por tiempo. Para hallar la distribucin de los tiempos entre llegadas se forma la
siguiente tabla:

T entre lleg. 1 2 3 4 5
Frecuencia 8 4 2 2 1

Respecto al nmero de llegadas por unidad de tiempo, en este caso la unidad de tiempo
ms apropiada es 5 min. (t = 5 min.).

Tiempo entre llegadas 5, 2, 1, 2, 1, 3, 1, 3, 2, 1, 4, 4, 1, 2, 1, 1, 1


Intervalo de tiempo 5 5 5 5 5 5 5
Nmero de llegadas 1 3 3 2 2 2 4

La tabla de frecuencias quedara:

Nmero de llegadas cada 5 min. 1 2 3 4


Frecuencia 1 3 2 1
Los histogramas para ambas distribuciones lucen como los siguientes:

Se debe observar que la forma del primer histograma coincide con la de una distribucin
exponencial y el segundo histograma coincide con una distribucin de Poisson.

5.6 Distribucin normal

Es una funcin de distribucin continua, caracterizada por la curva de la funcin de


probabilidad simtrica y en forma de campana. Se utiliza frecuentemente para medir
varios tipos de error en instrumentos calibrados: el valor que arroja la medida a travs
de un instrumento de medicin se asume con distribucin normal alrededor de la
dimensin verdadera de lo que se est midiendo. La expresin de su funcin de
densidad de probabilidad es
f(x) = [ 1 / ( s (2) ) ] exp [-1/2 [( x ) / s ]^2 ]

Con parmetros media y desviacin estndar s. El rango es (-, ). Esta funcin


tampoco puede ser integrada analticamente y el mtodo de la transformada inversa no
puede ser usado para generar variables aleatorias normalmente distribuidas; por ello se
hace por simulacin directa.

Consideremos un caso especial de la ecuacin anterior, donde s = 1 y Z = (x ) / s


La ecuacin queda
f (x) = [1 / (s (2))] exp [-1/2 [Z] ^2]

Esta es la funcin de densidad de probabilidad para la distribucin normal estndar;


cuando en la frmula anterior ocurre = 0 y s = 1, se le llama funcin normal
estandarizada. Una secuencia de muchas muestras de cualquier funcin de distribucin
estadstica tender a ser distribuida normalmente alrededor de la media terica si el
tamao de la muestra es suficientemente grande. Si cada media muestral es obtenida de
un conjunto de N nmeros aleatorios uniformemente distribuidos entre (0,1), la cantidad
N
Z = (1 / N ){ [ ui ] 1 / 2 } / { [ 1 / 12*N ]^ ( 1 / 2 ) }

Ser una variable normal estndar. Si se multiplica y divide por N:

Z = [ ( ui ) N / 2 ] / { [ N / 12 ]^ ( 1 / 2 ) }

Por conveniencia computacional se toma arbitrariamente N = 12, quedando la frmula


12
Z = ui - 6
1
Simplemente se suman 12 nmeros aleatorios uniformes entre 0 y 1, se resta 6 y se
obtiene Z, pero para generar una variable aleatoria normal con media y desviacin
estndar S, se calcula el valor de Xnormal como X = + S * Z. La funcin de densidad y
su integral o sea la funcin de distribucin acumulada, se muestran en la siguiente
figura:

Sin embargo, la frmula ms utilizada para generar variables aleatorias normales es la


siguiente:

Z = ( -2 Ln u1 )^(1/2) Sen (2 u2 ) Z = ( -2 Ln u1 )^(1/2) Cos (2 u2 )

Siendo u1 y u2 variables aleatorias uniformes entre (0,1) y con el valor del ngulo 2 u2
dado en radianes. Cuando Z se haya generado de esa manera, se calcula ahora la
variable aleatoria normal con media y desviacin S: Xnormal = + S * Z

Ejemplo: de la medicin de cierto fenmeno se han obtenido los siguientes 25 datos:


Valor del fenmeno:7, 12, 5, 3, 6, 4, 8, 7, 9, 3, 6, 7, 11, 8, 7, 6, 9, 10, 8, 11, 9, 8, 10, 7, 5
Se pide simular el fenmeno.

Ante todo se debe identificar el tipo de distribucin que presentan los datos de entrada.
La tabla de frecuencias de estos datos es

Valor del fenmeno 3- 4 5- 6 7- 8 9-10 11-12


Frecuencia 3 5 9 5 3

La distribucin de esta variable es, a simple vista, normal aunque para ser rigurosos se
debera hacer un prueba de chi cuadrado para verificar esta hiptesis. La lista tiene una
media = 7.44 y una desviacin s = 2.3993

Las dos variables uniformes para calcular Z pueden ser u1 = 0.743 y u2 = 0.215. Con
los anteriores valores se calcula

Z = (-2 Ln 0.743) ^ (1/2) Sen (2 0.215) = 0.7707*0.9759 = 0.7522

Y luego la variable aleatoria normal Xnormal = + S * Z = 7.44 + 1.8047 =


9.2447

Pero como los valores muestrales son todos enteros, se toma solo la parte entera: 9
Por cada vez que se quiera simular una variable normal, se deben generar dos variables
uniformes, u1 y u2.

5.7 Distribucin beta.

Se utiliza para ciertos modelos como el PERT (tiempo para completar una actividad) y
en ausencia de datos para simular la proporcin de tems defectuosos en un conjunto de
ellos. Su funcin de densidad de probabilidad es

f(x) = ( 1 + 2 1 )! x^( 1 1 ) (1 x ) ^ ( 2 1 ) para 0< x < 1


(1 1)! (2 1)!

Con 1 y 2 enteros positivos y 0 x 1, as que el rango es [o, 1]. La media de esta


distribucin es = 1 / (1 + 2) y su varianza S^2 = * 2 / [(1 + 2) (1 + 2 + 1)]

La variable X se interpreta como X = x1 / (x1 + x2) donde x1 y x2 son variables


gamma con parmetros (, 1) y (, 2) respectivamente.
5.8 Distribucin de Weibull.

Se trata de una distribucin de valores positivos desarrollada (por Walladi Weibull) para
explicar la duracin aleatoria - el tiempo de vida o de funcionamiento - de cualquier
dispositivo, natural o no, si ste pasa por una primera fase de gran mortalidad
(mortalidad infantil o defectos de fabricacin) una fase intermedia con muy poca
probabilidad de fallo (periodo adulto o periodo til de servicio) y una fase final en la
que la probabilidad de fallo (de avera o de muerte) aumenta rpidamente. Tambin se
aplica para modelizar la duracin de una tarea en estudios PERT/CPM.La notacin
habitual es XWei(,) o bien XWeibull(,), el parmetro (>0) es de escala
mientras que es el parmetro de forma (>0).

Esta distribucin es una de las ms ampliamente usadas en el clculo de confiabilidad,


en procesos de ingeniera y en simulaciones, debido a su versatilidad que toma las
caractersticas de otros tipos de distribucin, basado en el valor de un parmetro de
forma, . Se utiliza para modelar el tiempo entre fallas de maquinarias o componentes
electrnicos, para tiempos para completar tareas, para las variaciones de la velocidad del
viento, en predicciones sobre el tiempo de vida de un producto ( para dar tiempo de
garanta) , en inventarios de piezas de repuesto, en huelgas laborales para modelar su
duracin, en mortalidad del SIDA, en probabilidad de terremotos, para diseo de
productos de materiales quebradizos, para estimar la probabilidad acumulada de que un
puente falle bajo cierta carga, etc.

Los dos parmetros ms comunes de la funcin se suelen llamar parmetro de forma y


parmetro de escala . El parmetro de forma representa la pendiente de la recta
describiendo su grado de variacin, el de escala gobierna la extensin de la distribucin
a lo largo del eje horizontal. Existe un parmetro adicional eventual que es el de
posicin to que representa el valor mnimo que puede tomar la variable. La esperanza es
(1/ + 1) donde ( ) es la funcin gamma del argumento 1/ +1.

Su funcin de densidad de probabilidad para dos parmetros (existen de tres y de uno


tambin) tiene la forma
- -1
f(x) = x e^ [-(x / )] si x > 0
0 En otros casos.

La probabilidad acumulada se expresa como



F(x) = 1- e^ (- x / ) si x > 0

0 en otros casos

La forma de generar una variable aleatoria Xw con distribucin Weibull es:


1/
Xw = (- Ln u) donde ambos parmetros y , deben ser mayores que cero.
1/
Cuando existe un lmite mnimo o vida mnima to, se debe sumar Xw = to + (- Ln u)

Ejemplo: en una fbrica de chips, se desea simular los tiempos entre fallas (aos) del
circuito teniendo los siguientes datos: = 2 y = 100

1/
I ui Xw = (- Ln u)

1 .7138 1.98
2 .9765 1.93
3 .7848 1.97
4 .3852 2
5 .2138 2.01

Ejemplo En una fbrica de roldanas para gras se est definiendo el tiempo de garanta
de su producto y para ello se ha hecho pruebas de duracin en laboratorio con 20
roldanas obtenindose los siguientes resultados para tiempos entre fallas (en horas) de
las roldanas:

7 1219 2850
37 1255 3040
132 1334 3154
150 1510 3171
176 1630 3206
253 1647 3245
475 1745 3249
540 1774 3420
545 1916 3502
564 1927 3552
636 2130 3646
722 2448 3649
992 249 0 3663
996 2508 3730
1003 2601 3794
1025 2635 3890
1120 2731 3949
1122 2747 3952
1209 2828

La direccin est considerando dar a los clientes una garanta de confiabilidad del 95%
para 3200 horas al 70% de nivel de confianza.

5.8.1 Clculo de los parmetros de la distribucin de


Weibull

Ejemplo:
(Bajado de La siguiente direccin:
http://confiabilidad.net/articulos/calculo-de-los-parametros-de-la-distribucion-de-
weibull/ )
La distribucin de Weibull es una distribucin continua y triparamtrica, es decir, est
completamente definida por tres parmetros y es la ms empleada en el campo de la
confiabilidad.
El mtodo que se presenta es el mtodo de los Mnimos Cuadrados, por tres razones: la
primera, es un mtodo simple y expedito de aplicar; la segunda, la grfica de los datos
sirven como una prueba de bondad de ajuste de la distribucin y, la tercera, da un
indicio sobre si se debe calcular o no el parmetro de localizacin.

EXPRESIN MATEMTICA DE LA DISTRIBUCIN

La funcin de densidad de la distribucin de Weibull para la variable aleatoria t est dada por
la siguiente expresin:

Donde

t: Variable aleatoria que, para el caso de la confiabilidad, representa el tiempo entre fallas.

: Parmetro de forma (0<<)

: Parmetro de escala (0<<)

: Parmetro de localizacin (-<)

El parmetro beta, como su nombre indica, determina la forma o perfil de la


distribucin, la cual es funcin del valor de ste.
El parmetro theta indica la escala de la distribucin, es decir, muestra que tan aguda o
plana es la funcin.

El parmetro delta indica, en el tiempo, el momento a partir del cual se genera la


distribucin.

Una distribucin biparamtrica est completamente definida por los parmetros de forma y
de escala.

La funcin confiabilidad R (t) de Weibull se determina por la siguiente expresin:

La funcin distribucin acumulativa F (t) es el complemento de la funcin confiabilidad y se


define de la siguiente manera:

De la expresin anterior, se concluye que la funcin distribucin acumulativa se puede


interpretar como la probabilidad

DETERMINACIN DE LOS PARMETROS POR EL MTODO DE LOS MNIMOS


CUADRADOS

Como se mencion en el numeral uno, existen cinco mtodos para calcular los parmetros de
la distribucin de Weibull. Ellos son:

Mnimos cuadrados.

Grfico de la funcin tasa de falla.

Mxima similitud.

Estimacin de momentos.

Estimadores lineales.

Para ilustrar el mtodo de los mnimos cuadrados, se desarrollar paso a paso un ejemplo.

El mtodo de los mnimos cuadrados permite calcular los parmetros de forma y escala,
mediante la transformacin doble logartmica de la funcin de distribucin acumulativa
(ecuacin 3). El clculo del parmetro de localizacin es ms complejo, emplendose para
ello rutinas de clculo, como el programa Solver de Excel.
La transformacin doble logartmica permite transformar la funcin de distribucin
acumulativa en una ecuacin lineal de regresin.

Deduccin de la ecuacin lineal de regresin

Funcin acumulativa de Weibull.

Aplicando logaritmos naturales.

Propiedad exponencial de los logaritmos.

Aplicando logaritmos naturales.

La expresin (*) representa una ecuacin lineal de la forma

La cual es una recta de regresin, con:

De la expresin (**) se concluye que el parmetro de forma, , es la pendiente de la recta


de regresin.
De la expresin (***) se observa que el parmetro de escala, , est en funcin del
intercepto b de la recta de regresin y del parmetro de escala; por lo tanto:

(4) Definicin de logaritmo.

Rango de mediana

Para poder trazar la recta de regresin, se debe calcular un estimador para la funcin de
distribucin acumulativa F(x). Este estimador, llamado Rango de mediana, es un estimador
no paramtrico basado en el orden de las fallas. Este aspecto implica que la muestra de
datos se debe organizar de menor a mayor (en forma ascendente).

La expresin matemtica para este estimador es:

Donde:

W (i): Rango de mediana para un nivel de confianza (1-), donde es el nivel de


significancia y toma el valor de 0.5 para este estimador.

i: Orden de la falla.

n: Nmero total de datos de la muestra.

F, v1, v2: Valor crtico de la distribucin F, evaluada en el nivel de significancia y con


grados de libertad v1 y v2.

Dada la complejidad de la ecuacin (5), generalmente el rango de mediana se aproxima


mediante la siguiente expresin, exacta dentro de 0.005 [1]:

Donde:

RM(xi): Rango de mediana.

i: Orden de falla.
n: Nmero total de datos de la muestra.

La ecuacin (5) es ms exacta, y se usan rutinas en Excel: en los clculos se empelar sta.
Para facilitar su empleo, a continuacin se presenta el cdigo fuente para crear una funcin
definida por el usuario en Excel.

Para crear la funcin, sganse los siguientes pasos:

Abra Excel.

Hgase la combinacin de teclas Alt +F11. Esta accin abrir el editor de Visual
Basic.
En el men insertar de VB, seleccinese la opcin Mdulo.

En el panel derecho, cpiese el siguiente cdigo fuente:

Public Function RangoMediana(alfa As Single, n As Long, i As Long) As Double

*************************************************************************
****

*Esta funcin calcula el rango de mediana en funcin de la distribucin F. *

*alfa representa el nivel de significancia con el que se calcula la dist. F.*

*n es el nmero de puntos de la muestra. *

*i es el orden de falla. *

*************************************************************************
****

Dim a As Double, f As Double

On Error GoTo ManejarError

a = i / (n - i + 1)

f = Application.WorksheetFunction.FInv(alfa, 2 * (n - i + 1), 2 * i)

RangoMediana = a / (f + a)

Salir:

Exit Function

ManejarError:

Select Case Err.Number

Case 1004
MsgBox Los argumentos (n) o (i) no pueden ser cero., vbCritical + vbOKOnly

Case Else

MsgBox Se ha generado el error & Err.Number & _

Err.Description, vbCritical + vbOKOnly

End Select

Resume Salir

End Function

Hgase clic en guardar del men Archivo del editor de VB para guardar la funcin.

Hgase clic en Cerrar y volver a Excel del editor de VB. Esta accin cierra el editor de
VB.
Para usar la funcin creada, seleccinese Funcin del men Insertar de Excel. Se
abre la ventana Insertar funcin.
En la ventana Insertar funcin, en la lista desplegable O seleccionar una categora,
seleccinese la categora Definidas por el usuario.
En el cuadro de lista Seleccionar una funcin, hgase clic en RangoMediana.

Hgase clic en el botn Aceptar.

En la ventana Argumentos de funcin, digtese los valores de los argumentos.


Tngase en cuenta que el valor del argumento alfa siempre es 0.5.

Ejemplo:

A continuacin se presenta la secuencia que se debe seguir en la (parmetro de )


aplicacin del mtodo de los Mnimos Cuadrados.

1. Asuma localizacin igual cero y ordene los datos de menor a mayor. El criterio de
ordenacin debe ser el tiempo entre fallas. Vase la tabla 1.
2. Calcule el rango de mediana para cada observacin usando la ecuacin (5) (6).

En nuestro caso se usar la ecuacin (5), empleando la funcin definida por el usuario
RangoMediana. Vase la figura 2.

Los argumentos de la funcin RangoMediana toman los siguientes valores:

Alfa=0.5; n=140 (total de puntos de la muestra); i= toma el valor indicado en la columna A.


Los valores calculados se muestran en la tabla 2.
3. Calcule el logaritmo natural del tiempo entre fallas para cada observacin.

Vase la figura 3.

Obsrvese que en la funcin LN(nmero) de la columna D, el parmetro de localizacin, el


cual se obtiene de la celda L8, vale cero. Esto es importante, ya que la celda que contiene el
parmetro de localizacin ser la celda cambiante de Solver, en el caso que sea necesario
calcular este parmetro. Los valores de la abscisa x se muestran en la tabla 3.
4. Calcule el valor de la ordenada y, es decir, el logaritmo del logaritmo del inverso de uno
menos el rango de mediana para cada uno de las observaciones de la muestra. Vase la
figura 4.

Obsrvese la anidacin de la funcin logaritmo. El valor del rango de mediana se obtiene de


los datos calculados en la columna C. Los valores de la ordenada y se muestran en la tabla 4.

5. Genere un grfico con los datos de las columna D y E.


Al trazar estos puntos, se genera la recta de regresin. Para ello seleccinese Grfico del
men Insertar de Excel; aparece la ventana Asistente para grficos. En sta, escjase la
opcin XY (Dispersin) en la lista Tipo de grfico y sganse las instrucciones en pantalla.
Vase la figura 5

Para hallar la ecuacin de la recta de regresin, emplense las funciones: PENDIENTE


(conocido_y; conocido_x) donde: conocido_y son los valores dependientes (valores de la
columna E) y conocido_x son los valores independientes (valores de la columna D) para
estimar la pendiente de la recta; INTERSECCIN.EJE (conocido_y; conocido_x) para estimar
el intercepto de la recta. Para determinar el grado de correlacin lineal de los puntos,
emplense las funciones: PEARSON (matriz1; matriz2) donde matriz1 son los valores
dependientes (columna E) y matriz2 son los valores independientes (columna D). Esta
funcin devuelve el coeficiente de correlacin r. COEFICIENTE.R2 (conocido_y; conocido_x)
devuelve el cuadrado del coeficiente de correlacin. Estos valores, en s, representan una
especie de prueba de bondad de ajuste de la recta de regresin. El coeficiente de correlacin
est indicando que tan fuerte o dbil es la relacin lineal entre los datos; si este valor es ms
cercano a uno, hay una fuerte dependencia lineal. Por otro lado, el coeficiente de
determinacin, r2, est indicando el porcentaje de los puntos que estn relacionados
linealmente.

Aplicando las anteriores funciones de Excel, se obtiene la siguiente recta de regresin:

y=0.6995x-1.9514 (7)

De donde:
El coeficiente de correlacin, r, indica que hay una excelente relacin (dependencia) lineal de
los datos, ya que su valor est muy prximo a uno. El coeficiente de determinacin, r2,
indica que el 94.64% de los datos estn relacionados linealmente. En conclusin, estos
valores indican que la muestra se comporta conforme a la funcin de densidad de Weibull.

6. Estime el valor del parmetro de forma y de escala.

Dado que el parmetro de forma es la pendiente de la recta de regresin, de la ecuacin (7)


se obtiene:

De la ecuacin (4), numeral 3.1, se obtiene el valor del parmetro de escala:

Consideraciones sobre el parmetro de localizacin

Las siguientes consideraciones se deben tener en cuanta al momento de analizar un


parmetro de localizacin diferente de cero. Vanse las referencias bibliogrficas [1], [6]

a) Si al graficar los puntos de la muestra aparece una cola de puntos hacia arriba o hacia
abajo, es un indicativo de que el parmetro de localizacin debe ser calculado.

b) Una cola hacia abajo o una reduccin sbita de la pendiente son indicativos de que un
parmetro de localizacin positivo est presente. Vase la figura 5.

c) Una cola hacia arriba o un incremento sbito de la pendiente son indicativos de que un
parmetro de localizacin negativo est presente. Este . Vase el numeral 2.punto est de
acuerdo con el intervalo de validez de

Un parmetro de localizacin negativo se presenta cuando hay unidades con fallas en


servicio, o unidades en servicio con defectos que causarn fallas. Ejemplos:

Defectos originados durante el ensamble.

Defectos originados durante el transporte.

Defectos originados durante la instalacin o montaje.

Defectos originados durante el almacenamiento.

d) Valores grandes del parmetro de forma (>10) son otro indicativo de que el parmetro
de localizacin debe ser calculado.
Teniendo en cuanta las consideraciones anteriores, y analizando la figura 5, se proceder a
calcular el parmetro de localizacin.

Clculo del parmetro de localizacin

Para el clculo del parmetro se usar el complemento Solver de Excel, ya que debe ser
determinado por ensayo y error.

Para empezar, se debe definir la celda cambiante que, como se mencion en el paso 3 del
numeral 3.3, debe ser la celda donde se asign el valor cero. Esta celda debe estar
involucrada en una funcin. Vase la figura 3.

El mejor estimador de es el valor de que proporcione el mejor ajuste de la lnea de


regresin de los datos mustrales. El coeficiente de determinacin, r2, proporciona esta
medida [1], ya que ste mide la cantidad de puntos que estn relacionados linealmente y,
por lo tanto, la celda que contenga este valor ser la celda objetivo a maximizar pues el
objetivo es mejorar el ajuste de la recta de regresin. Para iniciar el clculo se debe indicar
al programa un punto de inicio, o punto semilla, en la celda cambiante. El mejor valor de

inicio de es un valor ligeramente inferior al valor ms bajo del tiempo entre fallas de la
muestra. Para el ejemplo, el punto semilla sera 0.166 (es ligeramente inferior al valor ms
bajo del tiempo entre fallas de la muestra, el cual corresponde al dato de orden uno 0.167
. Vase la tabla 1). Este constituye la restriccin en Solver. Vase la figura 6.

Es importante tener en cuenta que la celda objetivo debe contener una formula que relacione
directa o indirectamente el valor de la celda cambiante. Para el ejemplo la formula sera
COEFICIENTE.R2 (E3:E142, D3:D142). Obsrvese que el rango del segundo argumento
involucra la celda cambiante L8. Vase la figura 3.
Al hacer clic en el botn Resolver de la ventana Parmetros de Solver, el programa genera la
solucin 0.161, siendo este el valor del parmetro de localizacin, y el coeficiente de
correlacin se maximiza a 0.9886; es decir, al tener en cuenta el parmetro de localizacin
se mejora el ajuste de la recta de regresin. De igual manera, los parmetros de forma y
escala, y los valores de las abscisas (Xi) y ordenadas (Yi) se actualizan. Vase la figura 7.

Para que los valores se actualicen automticamente, stos deben estar relacionados por
frmulas, tal y como se muestra en la figura 8.

Ntese que el valor del parmetro de localizacin es positivo, corroborando lo dicho en la


parte b) del numeral 3.4. La figura 9 muestra el trazo de la nueva recta de regresin, siendo
notable la agrupacin de los puntos en forma de lnea. Comparece esta figura con la figura 5.

En la figura 10 se muestra el grfico de la funcin de densidad de Weibull para los


parmetros calculados. Reemplazndolos en la ecuacin (1) se obtiene la siguiente ecuacin:
CONCLUSIONES
1. El mtodo de los mnimos cuadrados facilita el clculo de los parmetros de la distribucin
de Weibull cuando se emplean programas informticos como Excel.

2. El anlisis del grfico de la recta de regresin sirve de criterio para determinar si es


necesario calcular el parmetro de localizacin.

3. El parmetro de localizacin tiene un gran efecto en la recta de regresin; sin embargo, se

debe analizar concienzudamente si un diferente de cero es necesario.

4. El coeficiente de correlacin, r, y el coeficiente de determinacin, r2, se constituyen en


una prueba de bondad de ajuste para la recta de regresin.

REFERENCIAS BIBLIOGRFICAS

1. Dodson, Bryan. The Weibull Analysis Handbook. 2da ed. Milwaukee, Wisconsin: ASQ
Quality Press, 2006.
2. Abernethy, Robert B. The New Weibull Handbook. 5ta ed. North Palm Beach, Florida.
2006
3. Walpole, Ronald E y Raymond Meyers. Probabilidad y estadstica para ingenieros. 3ra
ed. Mxico: Interamericana, 1990
4. Cspedes Zapata, Lucas y Santiago Meja Isaza. Implementacin de un Sistema de
Indicadores para la gestin de Mantenimiento de una empresa textilera. Medelln,
2005,194p. Trabajo de grado Ingeniera Mecnica. Universidad EAFIT. Departamento
de Ingeniera Mecnica. rea de mantenimiento.
5. Tamborero del Pino, Jos Mara. NPT 331: Fiabilidad: La distribucin de Weibull [En
lnea] Disponible en:
http://www.insht.es/InshtWeb/Contenidos/Documentacion/FichasTecnicas/NTP/Ficher
os/301a400/ntp_331.pdf [Consulta: 22 de julio de 2010]
6. Estimation of the Weibull parameters [En lnea] Disponible en:
http://www.weibull.com/LifeDataWeb/lifedataweb.htm [Consulta. 26 de julio de
2010]
7. Yez, Medardo; Perdomo, Jos L y Gmez de la Vega, Hernando. Ingeniera de
Confiabilidad: Pilar fundamental del mantenimiento [En lnea] Disponible en:
http://confiabilidad.net/articulos/ingenieria-de-confiabilidad-pilar-fundamental-del-
mantenimiento/#comment-list [Consulta: 28 de julio de 2010]
8. Duarte Holgun, Juan Carlos. Mantenimiento centrado en confiabilidad usando
mtodos de simulacin del ciclo de vida [En lnea] Disponible en:
http://www.noria.com/sp/rwla/conferencias/mem/Duarte-paper.pdf [Consulta: 28 de
julio de 2010]
9. Garca Palencia, Oliverio. Optimizacin estadstica del mantenimiento industrial [En
lnea] Disponible en:
http://www.aciem.org/bancoconocimiento/O/Optimizacionestadisticadelmantenimient
oindustr/Optimizacionestadisticadelmantenimientoindustr.asp [Consulta: 28 de julio
de 2010]
10. Luna, Ana Eugenia. Teora de la confiabilidad [En lnea] Disponible en:
http://focuslab.lfp.uba.ar/public/CursoTErrores2k4/Monografias2005/Ana_E_Luna.pd
f [Consulta: 22 de julio de 2010]

5.9 Distribucin triangular

Se utiliza en modelos econmicos y cuando no se conoce mucho sobre la variable. Solo


se requiere contar con expectativas acerca de tres valores: a mnimo posible, b ms
probable y c mximo posible, los cuales se pueden obtener a partir de los datos
histricos o a partir de opiniones de expertos. Es muy til para modelar precios de
cosechas, precios de acciones, niveles de produccin de cosechas, produccin de carne,
tonelaje de pesca etc.

La media de esta distribucin es = (a + b + c) / 3

La varianza s = [a(a b) + c (c a) + b (b c)] / 18

La funcin de densidad de probabilidad f/x) = 2 (b-x) / [(b a) (b c) cxb


f (x) = 2 (x-a) / [(b a) (b c) axc
f (x) = 0 en otros casos.

La variable aleatoria con distribucin triangular se genera de la siguiente forma:

X t = a + (b a) u si u umbral
c (c b) u si u > umbral

Siendo umbral = (b a) / (c a)

Una frmula alterna es la siguiente: Xt = a+ [(c-a) (b-a) u] si u umbral


c-[(c-a) (c-b) (1+u)] si u umbral

Ejemplo: La empresa MABOL posee un camin con capacidad de 6 T para transportar


troncas. El peso de las troncas sigue una distribucin triangular con parmetros a = 1.5,
b = 2, c = 3.5. El camin debe transportar diariamente 3 troncas. Si el peso de las tres
troncas excede la capacidad del camin, MABOL debe pagar $350 por contratar un
camin extra que cargue la tronca que no cupo en el camin de 6 T. El costo total
promedio anual, incluidos los costos de adquisicin, devaluacin y operacin de un
nuevo camin ms grande es de $75000. Trabajando los 360 das del ao, cul
alternativa es ms rentable: alquilar el camin o comprar uno nuevo?

Para generar valores que representen pesos de troncas:

Umbral = (2-1.5)/(3.5-1.5) = 0.25

I ui Xt
1 0.624 > 0.25 3.5 - (3.5 2) 0.25 = 2.75
2 0.214 < 0.25 1.5 + (2 - 1.5) 0.214 = 1.27
3 . . 2.85
Peso total de las tres troncas 6.87 T debe pagar $150 el da 1

Se debe repetir el procedimiento anterior para los 360 das, acumulando el costo de cada
da y calculando as el costo total anual de la primera rplica. De todo el procedimiento
anterior se realizan unas 49 rplicas ms para hallar en total 50 valores diferentes del
costo total anual. Con estos 50 valores se calcula su media, su varianza y su funcin de
densidad de probabilidad. La media del costo total acumulado se compara con el costo
que tendra el nuevo camin.
Con la funcin de densidad de probabilidad se puede contestar preguntas del tipo Cul
es la probabilidad de que el costo total est entre cualesquiera dos valores a y b?

P (a Costo total b) =?

5.10 Criterios de seleccin de una distribucin


Existen otras distribuciones como la binomial, la hipergeomtrica, la binomial negativa,
la gamma y la beta no enteras etc. Los procedimientos para generar las distribuciones
chi cuadrado, t y F, son extensiones directas del procedimiento para generar las
variables normales. El generador logartmico normal se basa tambin en la distribucin
normal. Los generadores hiperexponencial, exponencial generalizado (Pearson) y el de
Weibull, se pueden derivar del generador exponencial. Las distribuciones beta y
Dirichlet son extensiones de la distribucin gamma.

Al elegir una cierta distribucin o familia de distribuciones para ser usada para generar
una variable aleatoria particular en una simulacin, se debe considerar cuatro aspectos:
1. Las caractersticas de la funcin de distribucin.
2. La exactitud con la que la funcin puede representar un conjunto de datos
empricos.
3. La facilidad con la que la funcin puede ser ajustada a un conjunto de datos
empricos.
4. Eficiencia computacional al generar las variables aleatorias.

La distribucin exponencial o la de Poisson se eligen a menudo para representar


llegadas aleatorias a un sistema debido a su especial aplicabilidad en tales situaciones.
Adems pueden ser eficientemente generadas y si su media no ha sido determinada, la
distribucin puede ser fcilmente ajustada a un conjunto de datos empricos
simplemente trazando una lnea a travs de los datos, usando coordenadas
semilogartmicas. Su uso es ampliamente recomendado.

La distribucin normal es usada ampliamente a causa de que muchos fenmenos


naturales son gobernados por ella, pero es menos eficiente que la exponencial por que
no se aplica el mtodo de la transformada inversa. Se puede ajustar a un conjunto de
datos empricos especificando la media y la desviacin estndar o representando los
datos en una grfica apropiada y luego envolviendo estos por medio de una lnea.

La distribucin gamma se usa para representar conjuntos de datos empricos. No es muy


conveniente trabajar con ella puesto que no es fcilmente ajustable a un conjunto de
datos empricos (se requiere regresin no lineal) y es relativamente ineficiente al ser
generada en el computador. En algunas aplicaciones prcticas ser ms adecuado una
distribucin emprica.

Algunas aplicaciones requieren cierta distribucin que no es fcilmente ajustable a


partir de los datos disponibles, requirindose tcnicas de anlisis de regresin para
hallar las distribuciones. Ciertas situaciones, si se est seguro, por ejemplo, de que los
clientes llegan uno por vez, independientemente, se puede postular que la variable 4es
exponencial. Para modelos fsicos se usan la distribucin binomial, La geomtrica y la
binomial negativa. Los tiempos de servicio no pueden ser generados, por ejemplo, por
medio de una distribucin normal pues esta variable podra ser negativa.

La proporcin de tems defectuosos en un paquete no puede tener una distribucin gama


pues la proporcin debe estar entre 0 y 1 mientras que las variables gamma no tienen l.

5.11 Resumen sobre generacin de variables


aleatorias

Normal
Para generar una variable aleatoria Normal con media y desviacin estndar . Lo podemos
hacer de la siguiente forma. =DISTR.NORM.INV(ALEATORIO(), , )

Para la versin de Excel en Ingls: =NORMINV(RAND(), , )

Exponencial

Para generar la distribucin Exponencial : =-LN(1-ALEATORIO())*

Para la versin de Excel en Ingls: =-LN(1-RAND())*


Beta
Puesto que Excel cuenta con una funcin para la inversa de la funcin de distribucin, la
generacin de variables aleatorias puede hacerse directamente por inversin utilizando
la frmula siguiente: DISTR.BETA.INV(ALEATORIO();, , a , b ). Los parmetros
pueden ser estimados de la forma siguiente:

Los parmetros y pueden ser deducidos a partir de: la media que se desee tenga la
distribucin, del valor m ms probable que se le supone, del mximo a y del mnimo b,

en la forma siguiente:

Gamma

Excel cuenta con una funcin para la inversa de la funcin de distribucin, la


generacin de variables aleatorias puede hacerse utilizando la frmula siguiente:

DISTR.GAMMA.INV(ALEATORIO();;)

Triangular

Excel no cuenta con una funcin para la inversa de la funcin de distribucin, sin
embargo, la generacin de variables aleatorias triangulares puede hacerse utilizando
cualquiera de las dos frmulas siguientes:

c + (a+ALEATORIO()*(b-a)-c)*MAX(ALEATORIO();ALEATORIO())

c + (a+ALEATORIO()*(b-a)-c)*RAIZ(ALEATORIO())

Weibull

La generacin de variables aleatorias puede hacerse utilizando la frmula siguiente:

*(-LN(1-ALEATORIO()))^(1/)
Unidad 6

6.1 Utilizacin de un equipo

El objetivo de simular este sistema es determinar el uso ms eficiente del equipo


balanceando subutilizacin (tiempo ocioso) con sobreutilizacion (demoras o prdida de
clientes).

Los parmetros probabilsticos sern: tiempo entre llegadas y tiempo de servicio.


Ambos pueden estar regidos por la distribucin exponencial con diferente valor para la
media.

La variable de decisin: nmero de equipos (servidores).

Algunas variables de estado que se pueden usar: hora de llegada del cliente i, hora de
salida del cliente i

Algunos criterios de desempeo: Nmero de clientes atendidos, Nmero de clientes


rechazados, Porcentaje de tiempo de utilizacin o de tiempo ocioso del equipo.

Simularemos la utilizacin de un equipo de rayos X en un hospital donde el tiempo


entre llegadas de los pacientes est distribuido exponencialmente con media de 1.4
horas y el tiempo de servicio se rige por una distribucin normal con media 0.8 horas y
desviacin estndar 0.2 horas. La simulacin se har por eventos hasta legar a 8
pacientes atendidos. Se supondr, para facilitar el anlisis, que no hay cola y si un
cliente llega cuando el equipo est ocupado, este cliente es rechazado.

Llamaremos Ai al tiempo de llegada del cliente i.


Di ser el tiempo de salida del cliente i.
*Ati ser el lapso de tiempo entre la llegada de la orden i-1 y la orden i.
*Pti el tiempo para atender al paciente i.
ITi el tiempo ocioso cuando el equipo no est siendo usado, antes de la orden i.
TOTIT el tiempo ocioso acumulado.
El modelo matemtico que utilizaremos ser el siguiente:

Ai =Ai-1 +Ati Para las llegadas consecutivas. 1


Di = Di-1 + Pti + ITi tiempo para salidas consecutivas. 2
Di = Ai + Pti tiempo para llegada y salida/ cliente. 3
Ai Di-1 Condicin cuando llega un cliente y
est ocupado el equipo. 4
(Si no se satisface, el cliente se pierde y se genera un nuevo Ati y Ai
Se incrementa en Ai = Ai + Ati) 5

ITi = Di (Di-1 + Pti) = (Ai + Pti) (Di-1 + Pti) = Ai Di-1 de 2 y 3.

Igualmente supondremos que los tiempos entre llegada de los clientes al sistema y los
tiempos de servicio, generados por alguna frmula seudoaleatoria vista anteriormente y
de acuerdo a los valores ya mencionados , son:

Cliente 1 2 3 4 5 6 7
T entre llegadas 0 1.47 .04 2.12 2.65 .71 1.18
T de servicio .75 1.08 2.3 .88 .78 .43 .69

Estos valores estn debidamente representados en el siguiente modelo grfico del


sistema:

En la primera fila del diagrama anterior se indica el cliente i en orden de llegada al


sistema, la siguiente fila indica el tiempo entre llegadas. La tercera fila indica el tiempo
de atencin para el cliente i .La siguiente indica la hora de llegada. Las filas de abajo
indican la hora de salida, el tiempo ocioso del equipo (4.7 HR. en total, sobre un total de
8.86 horas trabajadas) y los clientes rechazados (el segundo y el sexto, dos rechazados
sobre un total de siete atendidos).

Una prueba de escritorio ms formal de este algoritmo puede lucir como la siguiente:
I *Ati Ai Ai Di-1 ? *Pti Di ITi TOTIT

1 0 .746 .746 0 0
2 1.47 1.47 SI 1.082 2.552 .724 .724
3 .043 1.513 NO
3 2.12 3.633 SI .886 4.519 1.081 1.805
4 2.656 6.289 SI .782 7.071 1.77 3.575
5 .715 7.004 NO
5 1.182 8.186 SI .694 8.88 1.115 4.69
6 .33 8.516 NO
6 .915 9.431 SI .648 10.079 .551 5.241
7 .295 9.726 NO
7 .603 19.329 SI .84 1.169 .25 5.491
8 2.253 12.582 SI 1.182 13.764 1.413 6.904

En esta simulacin el equipo estuvo ocioso durante 6.904 horas sobre un tiempo total de
13.764 horas de trabajo.

6.2 Mantenimiento de equipos

El objetivo del algoritmo de mantenimiento de equipos es ayudar a determinar un plan


de mantenimiento regular del equipo en cuestin, que sea razonablemente econmico y
no causante de muchas interrupciones. El plan no debe ser ni tan frecuente ni tan
infrecuente pues los dos extremos causan excesivos tiempos muertos (Downtimes) .El
balance deseado se debe determinar segn algunos factores: probabilidad de la falla,
tiempo de reparacin correspondiente, frecuencia de mantenimiento preventivo y sus
costos asociados, primas, multas por incumplimiento etc.

Las suposiciones que se harn es que el equipo, cierto tipo de maquinaria, presentar
fallas intermitentemente, con un tiempo de reparacin aleatorio para cada falla. Se
asume un intervalo de tiempo regular para el mantenimiento preventivo.
Tomaremos como NC al nmero de ciclos de mantenimiento por perodo de tiempo
simulado.
Ai ser el tiempo para la falla i, el momento en que esta ocurre.
Di el tiempo de reparacin de la falla i.
*Dti es el intervalo de tiempo entre la reparacin i-1 y la falla i.
*Rti el intervalo de tiempo requerido para reparar la falla i.
Mt el tiempo para el mantenimiento preventivo. (Constante).
Ct el ciclo de tiempo entre servicios de mantenimiento.
RC el costo de reparacin por unidad de tiempo.
MC el costo de mantenimiento unitario.
TOTC el costo total acumulado por ciclo de mantenimiento.
NC nmero de ciclos de mantenimiento por perodo de tiempo.
N ser el nmero de mquinas que conforman el taller completo.
(*Parmetros aleatorios.)

El modelo matemtico estar compuesto por las siguientes relaciones:


Ai = Di-1 + Dti
Di = Ai + Rti
TOTC = TOTC + RC * Rt para el costo de reparacin.
TOTC = TOTC + MC * Mt para el costo de mantenimiento.

Supondremos que las fallas peridicas del equipo se rigen por la distribucin emprica:

Tiempo entre fallas (Dti) / das Frec relativa Frec. acumulada


0 1.99 0,021 0,021
2 3.99 0,044 0,065
4 5.99 0,079 0,144
6 - 7.99 0,106 0,25
8 9.99 0,119 0,369
10 11.99 0,128 0,497
12 13.99 0,123 0,62
14 15.99 0,113 0,733
16 17.99 0,092 0,825
18 19.99 0,067 0,892
20 21.99 0,047 0,939
22 23.99 0,032 0,971
24 25.99 0,018 0,989
26 27.99 0,008 0,997
28 29.99 0,003 1
Tomaremos el tiempo de reparacin Rti regido por una distribucin Gamma con
parmetros ( = 3, = 2). En este caso la media = 2 / 3 es el valor esperado del
tiempo de reparacin.
Supondremos el costo de reparacin RC de $100 por da y asumiremos que no hay cola
en este servicio.
Supondremos tambin que el mantenimiento regular requiere 6 horas por mquina a un
costo unitario MC de $50.
Si se adopta el programa de mantenimiento todas las mquinas seran servidas luego de
60 das de operacin continua, valor del tiempo de ciclo entre cada mantenimiento, Ct.

El algoritmo y su prueba de escritorio seran como sigue:

I *Dit Ai Ai < 60 ? *Rti Di Di< 60 ? RC*Rti TOTC


1 9.64 9.64 si .36 10 si 100*.36 36
2 24.05 34.05 si 1.14 35.19 si 100*1.14 150
3 7.51 42.7 si .45 43.15 si 100*.45 195
4 6.1 49.25 si .8 50.05 si 100*.8 275
5 13.77 63.82 no 275+50=325

Para esta corrida de ilustracin, el costo total TOTC result ser 325. Dado que TOTC es
el criterio de desempeo del modelo, se debe hallar su funcin de distribucin
realizando n rplicas del algoritmo, siendo n un nmero suficientemente grande
(1000?) para que el resultado sea estadsticamente confiable y almacenando los valores
obtenidos en un vector de n elementos. Se halla la media del TOTC para cada valor de
la variable de decisin que es Ct, comenzando desde 60 das y finalizando en 90 das,
con una variacin de 4 das, por ejemplo.

As obtendremos parejas de puntos (Ct, TOTC) que barrern el rango de Ct desde 60,
64,68.90. El valor aceptable de Ct que va a influir en la decisin que se tome se
elegir en la regin donde el costo TOTC sea ostensiblemente ms bajo. Esto se podra
representar tambin en una grfica para identificar la regin ms fcilmente.

6.3 Control de inventarios probabilsticos


Se recomienda repasar la teora sobre modelos determinsticos de control de inventarios
presentada como anexo al final de este texto. El objetivo de este algoritmo es mantener
un nivel de inventario adecuado, tan econmico como sea posible. Se debe determinar
el valor del punto de reorden ROP y del tamao de la orden Q, de manera conveniente.
Estos valores no deben ser ni muy altos, pues aumentar el costo del manejo de
inventarios, ni muy bajos, pues se incurrir en costos de penalizacin por dficit.
Para analizar este sistema vamos a usar un modelo basado en el tiempo, utilizando
intervalos de un da. La demanda ser aleatoria y la orden de pedido de mercanca
adicional se hace cuando el inventario llega a un cierto nivel (punto de reorden) ROP.
Tomaremos en cuenta un tiempo de reorden Lt para la llegada de la mercanca, dado. El
nivel del inventario fluctuar peridicamente.

Para nuestro modelo matemtico tomaremos:

IL como nivel de inventario.


*D ser nuestra demanda diaria.
ROP el punto de reorden (nmero de unidades).
Q el tamao de la orden (nmero de unidades).
Lt el tiempo de demora del pedido (das).
t el tiempo acumulado(das).
Tf el tiempo final, el criterio de finalizacin de corrida.
T el tiempo cuando llega el pedido.
NB el nmero de unidades represadas en el tiempo t.
CI el costo de almacenamiento por unidad por da.
CIT el costo de almacenamiento acumulado.
Co el costo de orden.
COT el costo de orden acumulado.
CS el costo por faltante por unidad por da.
CST el costo acumulado por faltantes.
TOTC el costo total acumulado.
(*D es el parmetro aleatorio.)

El modelo matemtico constar de las siguientes relaciones:

1. IL = IL + Q NB cuando llega una nueva orden.


2. IL = IL D segn la demanda diaria.
3. NB = NB Q cuando una nueva orden se recibe.

t= t+1 despus de cada da.


T = t + Lt al colocar una orden; Lt el tiempo de demora.
CIT = CIT + CI*IL reactualiza el costo de almacenamiento.
CST = CST + CS*NB reactualiza el costo por faltante.
COT = COT + CO reactualiza el costo de orden.
TOTC = CIT + CST + COT el costo total acumulado.

Para llevar a cabo una prueba de escritorio del algoritmo, asignaremos los siguientes
valores a los parmetros:

CI = $0.25 / un. /da costo de almacenamiento.


CO = $20 costo de orden.
CS = $2 / un. /da costo de faltante
Tf = 1 un ao (365 das)
IL = 60 unds. Inventario inicial.
LT = 5 das demora en llegar el pedido.
D demanda diaria regida por una distribucin de Poisson con = 7 un.

Adems ROP = 40 un. Y Q = 50 un. Como variables de decisin.

Supondremos los siguientes valores aleatorios generados para la demanda durante 10


das: 10, 12, 9, 11, 8, 12, 6, 9, 11, 5 unds.
T t D* IL NB Nva. orden ? CIT CST COT TOTC
0 0 0 60 0 0 0 0 0
1 10 50 0 no 12.5 0 0 12.5
2 12 38<ROP 0 si 22 0 20 42.
7 3 9 29 0 no 29.25 0 0 49.25
4 11 18 0 no 33.75 0 20 53.75
5 8 10 0 no 36.25 0 20 56.25
6 12 0 2 36.25 4 20 60.25
7 6 42 0 no 46.75 4 20 70.75
13 8 9 33<ROP 0 si 55. 4 40 99.
9 11 22 0 no 60.5 4 40 104.5
10 5 17 0 no 64.75 4 40 108.75

..

6.4 Anlisis de riesgo

Es una de las ms importantes y usadas aplicaciones de simulacin de eventos discretos.


El objetivo es evaluar la conveniencia de cierta inversin, basados en algunos criterios
de decisin financiera como el valor presente neto, el valor futuro, o la tasa de retorno.
La aplicacin producir una distribucin acumulada generada para el criterio de
desempeo. Se puede obtener no solo el valor esperado de este criterio sino tambin la
posibilidad o verosimilitud de alcanzar valores mucho mayores o mucho menores.
Suponga que se considera un desembolso efectivo inicial I, que generar una serie de m
flujos anuales de efectivo FAEm

El valor presente de cada flujo de efectivo es

VPn = FAEn / (1 + i) (1)

Siendo i la tasa de inters anual especificada. As que el valor presente de la inversin


total ser

m m j
VP = ( VPj ) - I = ( FAEj / ( 1 + i ) ) - I (2)
j=1 j=1

Cada flujo anual de efectivo consta de varios componentes, como el Volumen anual de
ventas, los costos de produccin, los impuestos etc. Estos tems son representados en
trminos de funciones de distribucin apropiadas. As el procedimiento computacional
implica el generar un valor aleatorio para cada componente del flujo de efectivo,
resultando un valor para VPj generado aleatoriamente. Todos los flujos anuales de
efectivo son evaluados de esta manera y sustituidos en la ecuacin (2), resultando un
nico valor para VP. Se repite enteramente el procedimiento N veces, lo que permite
obtener una distribucin para VP.

Ejemplo: Una corporacin desea adquirir una empresa que manufactura radios para
automvil. La inversin inicial es de $U.S. 1.5 millones. Las ventas a futuro dependen
de factores desconocidos como competitividad y penetracin de mercados. El precio de
venta unitario P de los radios se estima que ser una variable normalmente distribuida
con media $U.S. 65 por unidad y desviacin estndar de $U.S.4. El costo unitario de
produccin Cp se estima regido por la distribucin Exp ($U.S. 32) con un mnimo de
$U.S. 20.

El volumen de ventas V es regido por la siguiente distribucin emprica:

La tasa de inters anual es del 12 %, la tasa de impuestos R es del 48% y la depreciacin


D es a 10 aos siendo I / n = I / 10
Se desea obtener la distribucin del valor presente del Flujo Anual de Efectivo.

FAE = Ventas Costos totales Impuestos

= (P Cp) * V* (1 R) + R * I / n

Ventas = Precio unitario * Nro. Unidades vendidas

Costos totales = Costo de produccin * Nro. Unidades vendidas

Impuestos = R * (Ventas Costos totales depreciacin)

El algoritmo es:

Leer I, i, R
Repetir para k = 1, 1000
Para n = 1, 10 (10 aos)
Generar v.a. para P, CP, V
Calcular FEAn = (P CP) * U * (1 R) + R * I / 10
Calcular vr. Presente para cada FEAn: VPn = FEAn / (1 + i)
10
Calcular VPk = VPn - I
n=1 ___
Hallar f (VP) y F (VP), VP, vp

En los siguientes grficos se puede apreciar dos ejemplos que ilustran la distribucin
del Valor Presente para dos proyectos, A y B. En el ejemplo 1 el proyecto A tiene un
valor esperado de 9.8 mientras que el proyecto B tiene un valor esperado de 12.5. En el
segundo ejemplo el proyecto A tiene un valor esperado de 5 mientras el B tiene 5
tambin, la diferencia es que en este caso la dispersin para el B es mucho mayor que
para el A y por ello es ms incierto, adems el B tiene cierta probabilidad de producir
prdida.

6.5 Lnea de espera (cola)

Al simular una lnea de espera, se tomarn como parmetros estocsticos


*DTlleg (i) el tiempo entre llegada para el cliente i.
*DTserv (i) el tiempo de servicio para el cliente i.

Como parmetros deterministicos


Max capacidad mxima de la cola.

Como variable de decisin


S el nmero de servidores.

Como variables de estado


Num_llegadas el nmero de llegadas que se desea simular.
i cliente nmero i en hacer arribo al sistema.
N nmero de clientes en cola.
Ntot nmero total de clientes servidos.
Tlleg (i) hora de llegada para el cliente i.
Tsal (i) hora de salida del sistema del cliente i.
HORA la hora que transcurre en el momento del clculo.

Como criterios de desempeo del sistema


DTocio porcentaje del tiempo de ocio de los servidores.
DTTOT (i) tiempo total del cliente i en el sistema.

El algoritmo en seudo cdigo para este problema, es el siguiente:

Leer Num_llegadas
I=0, HORA =0, Tlleg (0) = 0, DTserv (0) = 0
Tsal (0) = 0, DTTOT (0) = 0, DTocio = 0, DTlleg (0) = 0
REPEAT I=I+1
Generar DTlleg (i)
Tlleg (i) = Tlleg (i-1) + DTlleg (i)
Generar DTserv (i)
If HORA > Tlleg (i) Tsal (i) = Tsal (i-1) + DTserv (i)
ELSE begin if I = 1 HORA = Tlleg (i)
Tsal (i) = Tlleg (i) + DTserv (i)
DTocio = DTocio + Tlleg (i) HORA
End
DTTOT (i) = Tsal (i) Tlleg (i)
HORA = Tsal (i)
UNTIL I Num_llegadas

Para realizar una prueba de escritorio del algoritmo, supondremos que el tiempo entre
llegadas de los clientes al sistema DTlleg, est gobernado por una distribucin
exponencial con media 2.3 min., y que el tiempo de servicio DTserv, est gobernado por
una distribucin normal con parmetros (1.8 min., 0.5 min.).

Supondremos que los valores generados para los anteriores parmetros durante 7
llegadas, son los siguientes:

I DTlleg(i) DTserv(i)

1 1.3 2.9
2 2.7 0.3
3 0.9 1.4
4 1.4 2.0
5 0.5 1.7
6 0.8 1.0
7 3.8 1.0

Usando los valores anteriores, la prueba de escritorio quedar:

I DTlleg(i) Tlleg(i) DTserv(i) Tsal(i) DTocio DTTOT(i) HORA


0 0 0 0 0 0 0 0
1 1.3 1.3 2.9 4.2 2.9 1.3
2 2.7 4 0.3 4.5 0.5 4.2
3 0.9 4.9 1.4 6.3 0.4 1.4 4.5
4 1.4 6.3 2.0 8.3 2.0 6.3
5 0.5 6.8 1.7 10.0 3.2 8.3
6 0.8 7.6 1.0 11.0 3.4 10
7 3.8 11.4 1.0 12.4 0.8 1.0 11
12.4

6.6 Portafolios agrcolas


Tomado de la siguiente direccin:
Portafolios_Agricolas_Eficientes.pdf

En el caso de los portafolios agrcolas, el modelo de simulacin se utiliza para obtener


la distribucin de probabilidad de los mrgenes brutos de las distintas actividades
agrcolas.
Sean A1,....., An las n actividades agrcolas que constituirn los posibles portafolios.
Para cada i hemos definido al retorno Ri de una actividad Ai como su margen bruto de
explotacin por hectrea. Entonces tenemos que:

Ri = (1- i) QiPi iQi i (1)

Donde
Ri es el margen bruto por hectrea;
Qi es el rinde en quintales por hectrea de la actividad Ai;
Pi es el precio a cosecha por quintal del cultivo considerado en Ai;
i es la proporcin del ingreso bruto (QiPi) que representa la suma de los gastos de
cosecha, comisiones e impuestos menos las bonificaciones que pudieran existir;
i es el costo de comercializacin por quintal producido;
i es el total de gastos directos.

El rendimiento Qi y el precio Pi son variables aleatorias a las que se les ajustarn


distribuciones de probabilidad, mientras que i, i y i son valores fijos conocidos.
Mediante un mtodo de muestreo aleatorio (Monte Carlo o Latin Hypercube) se
obtienen simulaciones de las variables Pi y Qi. Se calcula la ecuacin iterando y se
obtiene un muestreo estadsticamente significativo para la variable Ri de retornos de la
actividad Ai.

Repitiendo el ejercicio de simulacin para las n actividades agrcolas se obtienen para


cada actividad Ai (1 i n), estimadores de su retorno esperado y de su riesgo dados
por:
T
i = (1 / T) Rjk (2)
k=1

T
= (1 / T) (Rik i) (3)
k=1

Donde T es el tamao del muestreo simulado y para cada i (1 i n), i es la media de


Ri y i es el desvo estndar muestral de Ri
Adems se pueden estimar las covarianzas de los retornos de las distintas actividades
agrcolas, dadas por:

T
ij = (1 / T) (Rik i) (Rjk j) (4)
k=1

Una vez estimados los retornos esperados de las n actividades agrcolas y su matriz de
varianzas y covarianzas, se puede calcular el modelo cuadrtico paramtrico y obtener
la frontera de eficiencia.

Ejemplo de aplicacin: Diversificacin intrazonal

Consideremos la posibilidad de armar un portafolio agrcola intrazonal en el Oeste de la


provincia de Buenos Aires diversificando entre los cuatro cultivos principales girasol,
maz, soja y trigo. Se tienen cuatro actividades distintas:

A1: girasol en el Oeste de la provincia de Buenos Aires


A2: maz en el Oeste de la provincia de Buenos Aires
A3: soja en el Oeste de la provincia de Buenos Aires
A4: trigo en el Oeste de la provincia de Buenos Aires

Para cada i (1 i 4) sea Qi el rinde de Ai y sea Pi el precio a cosecha del cultivo de


Ai: Luego de analizar los datos disponibles de estas variables (histricos, de mercado y
otros elementos de juicio), asignamos a estas variables distribuciones triangulares tales
que:
Qi ~ Triang (ai, bi, ci) y Pi ~ Triang (ui, vi, wi)

En los siguientes cuadros se presentan los parmetros de las distribuciones

Mn. posible Ms probable Mx. Posible

Rindes en qq/ha para el Oeste de Buenos Aires

ai bi ci
Girasol Q1 16 24 30
Maz Q2 60 80 100
Soja Q3 15 28 45
Trigo Q4 14 32 40

Precios en $/qq
ui vi wi
Girasol P1 37.70 53.36 63.80
Maz P2 17.40 20.30 29.00
Soja P3 37.70 46.40 69.60
Trigo P4 22.04 26.97 38.16

Adems se cuenta con datos de costos de comercializacin, cosecha y gastos directos.

Cuadro de datos para el Oeste de Buenos Aires

Cultivo Girasol Maz Soja Trigo


Comisin %.3 %3 %3 %3
Impuestos % 0.65 % 0.65 %. 0.65 % 0.65
Bonificacin por grasa %. -10
Cosecha %8 %8 % 8 % 8
i 0.0165 0.1165 0.1165 0.1165

Gastos varios 0.40 0.40 0.40 0.40


Secada 1,5 ptos. 0.26 5 ptos. 0.85 1,5 ptos. 0.26
Flete corto 20 km 1.21 20 km 1.01 20 km 1.01 20 km 1.01
Flete largo 400Km.7.46 400Km 6.22 400Km.6.22 400Km.6.22
i $/qq 9.33 $/qq 8.48 $/qq 7.89 $/qq 7.63

Total Labores $/ha 132.75 $/ha 85.50 $/ha 144.00 $/ha144.00


Semilla $/ha 53.86 $/ha 275.50 $/ha 93.53 $/ha 57.42
TotAgroqum $/ha 129.95 $/ha 253.98 $/ha 115.25 $/ha235.33
i $/ha 316.56 $/ha 614.98 $/ha 352.77 $/ha 436.75

Con los datos de todos los parmetros se puede realizar la simulacin del modelo. Se
obtienen los siguientes resultados:

Perfiles de retorno/riesgo de las cuatro actividades

Media desvo estndar


Oeste de
Buenos Aires en $/ha i i
Girasol R1 650.01 170.15
Maz R2 278.36 199.22
Soja R3 743.49 290.58
Trigo R4 80.74 131.76

Podemos ver los perfiles en un grfico


Adems se obtiene la siguiente matriz de covarianzas (aplicando (4)) estimada para los
mrgenes brutos de los cuatro cultivos en el Oeste de Buenos Aires.

ij Girasol Maz Soja Trigo


Girasol 28951.61 880.06 -1501.39 -14.93
Maz 880.06 39689.43 1102.45 -31.38
Soja -1501.39 1102.45 84439.30 47.68
Trigo -14.93 -31.38 47.68 17361.95

Resolviendo el problema de optimizacin (3.3.1) obtenemos la Frontera de Eficiencia


que es la curva que forman los portafolios eficientes. La concavidad de la curva
depende de la correlacin. Si la correlacin es igual a 1, ser una recta, si es menor que
1 se vuelve ms cncava.

En el cuadro se muestran los perfiles y las composiciones de algunos portafolios


eficientes

Media$/ha Desv est Giras.A1 Maz A2 Soja A3 Trigo A4


mn riesgo 333 88 27% 19% 9% 45%
Portafolio 1 415 92 37% 17% 14% 32%
Portafolio 2 497 103 46% 16% 18% 20%
Portafolio 3 579 119 56% 14% 23% 7%
Portafolio 4 661 140 67% 4% 29% 0%
mx retorno 743 291 0% 0% 100% 0%

Donde 333= .27*650.01+.19*278.36+.09*743.49+.45*80.74


Y 88 = ((.27*170.15)+ (.119*199.22)+.(.45*131.76) )

Los agentes ms aversos al riesgo se ubicarn en el punto inferior de la Frontera de


eficiencia priorizando el trigo como actividad menos riesgosa aunque esto les signifique
tener un portafolio con menor margen bruto esperado. Aquellos que deseen un poco ms
de retorno optarn por el girasol y la soja.

Tomando como parmetros:

i Rendimiento esperado de cada actividad i.


i Varianza del rendimiento de cada actividad.
ij Covarianzas.
B Presupuesto disponible.
Xi Monto a invertir en cada actividad.
Aversin al riesgo (<= 1)

Se puede resolver ptimamente el siguiente modelo cuadrtico:


n n n
Max Z = i* Xi - ij Xi Xj
i i j

s.a: Xi <= B

El segundo trmino de la F.O., el trmino cuadrtico, es el que corresponde al riesgo. El


riesgo total (climtico, de Mercado, productivo, macroeconmico), se reduce
diversificando, eligiendo actividades con diferente riesgo. El portafolio ser eficiente si
las variaciones de las diferentes actividades se compensan unas con otras. A menor
correlacin entre activos, menor el riesgo del portafolio.
En una metodologa multicriterio se puede adoptar una serie de objetivos: beneficio
mximo, dao ecolgico mnimo, tiempo de ciclo mnimo, riesgo mnimo etc.

6.7 Control de la contaminacin en un cuerpo


de agua
Suponga el caso de una laguna de descontaminacin de aguas servidas a la cual en un
momento dado se le suspende el flujo entrante de agua servida reemplazndolo por un
flujo de agua no contaminada ( suponga que se ha considerado que la contaminacin era
ya demasiado alta ). El volumen de la laguna es V m3, supuesto constante. La
contaminacin se supone uniformemente distribuida en el cuerpo de agua. El nmero de
gramos de contaminante por metro cbico de agua en un momento dado t, es X (t). La
tasa o flujo de salida del agua de la laguna es Fs m3/da, igual al flujo de entrada Fe. Se
desea elaborar un modelo para predecir, por ejemplo, cunto tiempo transcurre despus
de que se suspende el flujo de contaminantes, para que el nivel de contaminacin llegue
a cierto valor.

Desarrollando como modelo continuo:


La cantidad total de contaminante en la laguna en el tiempo t es: X (t) * V
El cambio en un lapso de tiempo t de esta cantidad es d(X (t) * V) / dt
La cantidad de contaminante que sale de la laguna en un da es Fs * X (t)
Si el volumen del cuerpo de agua se mantiene constante, obtenemos la ecuacin
diferencial

D (X (t) * V) / dt = - Fs * X (t) (1)

Reordenando [1/X (t)] [dX (t)] = - dt Fs / V

Integrando a ambos lados y exponenciando, obtenemos la solucin a la ecuacin


diferencial (1)
X (t) = Xo exp (- Fs t / V)

Si se desea saber entonces el tiempo para el cual la contaminacin llega al 5% de su


nivel en t=0, basta reemplazar

0.05 X(o) = Xo exp (- Fs t / V)

Y hallamos t= 3* V / Fs

Suponga V = 1000 m3, Fs = 100 m3/da, Xo = 100 gr/m3

Con estos valores resulta un tiempo de 30 das para que el cuerpo de agua de volumen
V reduzca su contaminacin a un 5% de su nivel inicial, siempre que el flujo de entrada
no est contaminado.

Este modelo tiene varias limitaciones, por ejemplo si el flujo de entrada contina
llegando con una cierta densidad de contaminante, el modelo falla; lo mismo si el
volumen V de la laguna vara o si la densidad de contaminante en el flujo de entrada
vara a lo largo del tiempo (tal como ocurre en realidad en una laguna de purificacin) o
si se toma en cuenta evaporacin o absorcin del agua de la laguna. Una forma
alternativa de resolver la ecuacin (1) es por iteracin numrica, en un enfoque de
modelo discreto:

Rescribimos la ecuacin (1) de una forma un poco diferente:

[X (t) X (t-1)] * V = - Fs * X (t-1) (2)

Siendo X (t) la densidad de contaminante en el da t, y X (t-1) la densidad de


contaminante el da anterior al da t.

Transformamos la ecuacin (2): X (t) = X (t-1) * [1 Fs / V]

Con esta ecuacin y con los datos supuestos, se puede calcular iterativamente el valor
de la densidad X (t) para el da 1, por ejemplo:

X (1) = X (o) * [1 100 / 1000] = 100 * 0.9 = 90

Si se programa en una tabla en Excel, los resultados coinciden con los de la solucin de
la ecuacin diferencial del modelo continuo.
Ahora se pueden incorporar al modelo discreto ciertas consideraciones que el modelo
contnuo no permita: Si vara, por ejemplo, el volumen V del lago de un tiempo t a otro
t+1, esta variacin se puede incorporar al modelo discreto. Lo mismo ocurrira con una
posible variacin del flujo de salida r. Si estas variaciones se producen de manera
aleatoria, esta condicin se puede simular con el modelo discreto generando valores
aleatorios con diferentes distribuciones, para la(s) variable(s) que posea(n) esta
caracterstica. La distribucin de la(s) variable(s) aleatoria(s) se debe determinar por
medio de un adecuado muestreo.
A modo de ilustracin se va a variar el algoritmo para incorporar variacin de flujo as
como evaporacin (tambin se podra considerar la precipitacin).

Variacin de flujo

Supongamos que el volumen V del cuerpo de agua no es constante. Significa que el


flujo de entrada Fe, no es el mismo de salida Fs. A lo largo del da, hora tras hora, el
flujo puede tomar una distribucin cualquiera, suponga que a travs de un muestreo
estadstico se concluye que entre las 8 de la maana y las 4 de la tarde Fe est regido
por la siguiente distribucin de probabilidad:

Se debe generar una variable aleatoria que simule el valor que representa a Fe, segn la
distribucin anterior, Fs lo supondremos igual al flujo de entrada de la hora anterior. La
prueba de escritorio quedara as:

T(hora) Fe Xe Vl Xl Fs Xs

0 120 100 100000 50 90 50


1 112 90 100030 50.06 120 50.06
2 etc.

T representa el perodo, se puede medir en horas, es una variable que aumenta de uno en uno
indefinidamente.
Fe tiene unidades de m3/h y es el flujo de entrada generado aleatoriamente segn la
distribucin de probabilidad anterior.
Xe tiene unidades de g/m3 y representa la densidad de contaminacin con slidos del flujo de
entrada.
Vl es el volumen del lago, m3.
Xl es la densidad de contaminacin con slidos del agua del lago, medida en g/m3.
Fs, en m3/h, es el flujo de salida, igual al de entrada del perodo inmediatamente anterior.
Xs es la densidad de contaminacin del flujo de salida, igual a la del lago.

La primera lnea de la prueba de escritorio est conformada por valores asumidos (inicializacin
de variables).En la segunda lnea se ha generado valores aleatorios para Fe y Xe. El volumen
del lago V(t) se calcula como

V (t-1) + Fe (t-1) Fs (t-1).

La nueva densidad de contaminacin del lago se calcula como

(V (t-1)*Xl (t-1) +Fe (t-1)*Xe (t-1)-Fs (t-1)*Xs (t-1)) / V (t)

El flujo de salida Fs (t) es igual a Fe (t-+1).

La densidad de contaminacin del flujo de salida Xs (t) es la misma que la del lago Xl (t).

En la realidad, la primera laguna es la anaerbica (bacterias anaerbicas), es la ms larga y


profunda y el paso del agua a travs de ella tarda unos 20 das para que la densidad de
contaminacin con slidos decaiga a un 60% y la demanda biolgica de oxgeno DBO caiga un
70% aproximadamente. La segunda laguna es la aerbica y despus de unos 4 das la DBO
cae hasta un 90% y la contaminacin con slidos decae a menos del 5%.

Subdivisin del espejo de agua en superficies ms pequeas: si se divide la superficie total


del lago en superficies ms pequeas, digamos en tres, S0, S1 y S2, de igual superficie, se
puede desarrollar una aproximacin adicional al modelo:

S0 = S1 = S2

Vt = V t-1 - FSal t-1 + Fentr t-1

Ki = Si / (S0+S1++Si++Sn)

X S0 = (K0 * V t-1 - F sal t-1 ) * X S0 t-1 + Fentr t-1 * X entr t-1

Xtot S1, t = K1 * V * X S1,t-1 + Fentr * X S0,t-1 Fsal X S1, t-1


Xtot S2, t = K2 * V * X S2,t-1 + Fentr * X S1,t-1 Fsal X S2, t-1

T V XS0 XS1 XS2 Fsal Fentr Xentr

0 10 100 105 110 0.2 0.2 80


1 10 116 349 369

V= 10-.2+.2 = 10
XS0 = (10/3 - .2)* 100 + .2 * 80 = 116
XS1 = (10/3) * 105 + 2 * 100 - .2 * 105 = 349
XS2 = (10/3) * 110 + .2 * 105 + .2 * 110 = 369

El flujo de entrada es aleatorio, lo mismo que su densidad de contaminacin X entr

Decantacin de los slidos incorporados al agua:


Hasta el momento, nuestro modelo no simula an la principal funcin de una laguna de
purificacin, que es el retener un gran porcentaje de los slidos incorporados al agua. Para
simular esta condicin, supongamos que por medio de una toma de muestras a lo largo de los
400 m lineales de una de estas lagunas de purificacin, se han obtenido los siguientes valores
para el porcentaje de slidos agregados al agua (tomando el valor del flujo entrante a la
primera seccin de la laguna como del 100%):
% de
Longitud contamin
0 1 1,27
2,6862E-
100 0,65 19
5,6817E-
200 0,4 38
1,2018E-
300 0,3 56
2,5419E-
400 0,25 75

La ecuacin que interpola estos datos es una exponencial negativa, como se ve.
La densidad de contaminacin Xsi de cada una de las secciones, debe disminuir a un
porcentaje igual al valor calculado por esta ecuacin dependiente de la variable x, posicin
respecto del origen 0 de la laguna. Esta variable va desde 0 hasta 400, que se supone que es
la longitud total de la laguna.

6.8 Modelo de control del dengue por medio


de depredadores
(Modelo depredador presa)

En algunos pases se ha ensayado a controlar el mosquito Aedes Aegypti por medio del
Mesocyclops, un depredador de sus larvas. Los siguientes factores se han tenido en
cuenta para construir el modelo matemtico del sistema (modelo de Lotka-Volterra):

Se consideraron tres estados del A.Aegypti.; huevo (H), larva (L) y adulto(A). El
depredador (D) solo acta sobre las larvas. El estado de pupa es irrelevante para el
modelo puesto que en este estado, las pupas no son depredadas por el Mesocyclops. Los
valores de las constantes que se enumeran a continuacin son hipotticos.

Nombre de los parmetros Smbolo Valor (%)

Tasa de oviposicin del A. Aegypti B 0.3


Tasa de inviabilidad natural de huevos del A.E. Un 0.28
Tasa de transformacin de huevos a larvas G 0.7
Tasa de mortalidad natural de larvas Ul 0.09
Tasa de transformacin de larvas a adulto d 0.9
Tasa de depredacin de A.E. por Mesocyclops a 0.4
Tasa de mortalidad natural de adultos del A.E. Ua 0.1
Tasa de incremento de Mesocyclops por depredacin de A.E. e 0.21
Constante media de saturacin m 0.21
Tasa de captura K 0.4
Tasa de mortalidad natural de Mesocyclops Uc 0.15

De acuerdo a la dinmica de la biologa, se construy el siguiente modelo para el


control del A.Aegypti, que contiene las siguientes ecuaciones diferenciales ordinarias de
primer orden:
H'(t) = B A (t) G H (t) Un H (t)

Esta ecuacin representa la dinmica vital de los huevos del mosquito o sea su tasa de
variacin por perodo, la cual depende de la oviposicin de los adultos, la tasa de
inviabilidad y el paso al estado L (t).

L'(t) = G H (t) d L (t) a D (t) L (t) Ul L (t)

Es la ecuacin que permite calcular la variacin de larvas entre cada perodo. El trmino
a D (t) L (t) representa el control del depredador que destruye las presas de forma
lineal. El tercer trmino en el miembro de la derecha de la ecuacin se puede sustituir
luego por (K D (t) L (t)) / (D (t)+m) que se acomoda mejor a la realidad.

A'(t) = d L (t) Ua A (t)

Es la ecuacin que rige el incremento de los mosquitos adultos entre cada perodo. Este
incremento es regulado por el paso de L (t) a A (t) menos la mortalidad natural de los
adultos.

D' (t) = e D (t) L (t) Uc D (t)

Esta ecuacin representa la variacin del depredador entre cada perodo. El primer
trmino se puede sustituir luego por (e D (t) L (t)) / (D (t) + m) que se acomoda ms
al sistema real. Cada una de las ecuaciones anteriores representa solamente la variacin
de los individuos de un perodo al siguiente. La cantidad de individuos existente en cada
perodo se debe calcular como la cantidad en el perodo anterior ms la variacin.
Se puede ensayar con distintos valores iniciales de las poblaciones de huevos, larvas,
adultos y depredadores y observar si, por ejemplo, la poblacin de A. Egypti se extingue
a largo plazo (pendiente m< 0), queda en estado endmico (m= 0) o se presenta una
epidemia (m> 0). Los eventos de vida y mortalidad son procesos de Poisson y se deben
simular sus valores para reemplazarlos en las frmulas. Para el conjunto de valores
iniciales dado en la tabla que se edita a continuacin, se puede observar la variacin de
las poblaciones a lo largo de 50 ciclos o perodos.

ciclo huevos larvas adultos Depredador

1 50 20 40 0,5
2 17 31,2 54 0,45
3 17,9 6,596 76,68 0,5058
4 24,794 11,2615 74,948 0,319625
5 24,9639 16,0286 77,589 0,231801
6 25,7731 16,1488 84,256 0,19021
7 27,854 16,974 90,364 0,156538
8 29,8946 18,6047 96,604 0,131411
9 31,9708 20,1344 103,69 0,114603
10 34,3035 21,6579 111,44 0,10345
11 36,8624 23,3328 119,79 0,096535
12 39,6227 25,136 128,81 0,093317
13 42,605 27,049 138,55 0,093571
14 45,8257 29,0816 149,04 0,097405
15 49,2945 31,2357 160,31 0,105356
16 53,0222 33,5021 172,39 0,118496
17 57,0193 35,8626 185,3 0,138645
18 61,2929 38,2833 199,05 0,168766
19 65,8441 40,7035 213,6 0,213601
20 70,6642 43,0201 228,87 0,280687
21 75,7282 45,065 244,7 0,381848
22 80,9838 46,5772 260,79 0,535083
23 86,3358 47,1854 276,63 0,765995
24 91,6231 46,4494 291,44 1,105873
25 96,593 44,0538 304,1 1,58028
26 100,888 40,2087 313,34 2,182487
27 104,089 35,9219 318,19 2,846342
28 105,866 32,3234 318,7 3,46809
29 106,197 29,5891 315,92 3,976055
30 105,396 27,5744 310,96 4,340984
31 103,827 26,1729 304,68 4,564494
32 101,787 25,1544 297,77 4,671572
33 99,5091 24,4981 290,63 4,685999
34 97,14 23,9821 283,62 4,638959
35 94,7986 23,7369 276,84 4,544523
36 92,5312 23,4472 270,52 4,429721
37 90,4083 23,4605 264,57 4,292153
38 88,4112 23,242 259,23 4,159995
39 86,6088 23,4456 254,22 4,013733
40 84,9272 23,2189 249,9 3,888952
41 83,4627 23,5623 245,81 3,750421
42 82,0883 23,3121 242,43 3,642581
43 80,9385 23,7285 239,17 3,519613
44 79,8448 23,4882 236,61 3,430109
45 78,9671 23,8994 234,09 3,326396
46 78,1228 23,7163 232,19 3,253178
47 77,4686 24,0618 230,31 3,169658
48 76,841 23,9616 228,94 3,11018
49 76,3655 24,2183 227,61 3,045591
50 75,9194 24,1944 226,65 2,997976

Se puede simular el sistema alimentando el modelo con diferentes valores iniciales de


poblacin tanto de huevos como de larvas, adultos y depredadores, y as observar para
cules de estos valores se presenta una epidemia (pendiente m> 0, no hay atractor. El
atractor es el nmero al cual tiende el valor de la poblacin casi estable para un nmero
grande de ciclos), un estado endmico (m= 0) o la extincin de la enfermedad (m< 0).
Los eventos de vida y muerte son procesos que suelen ser gobernados por distribuciones
de Poisson. Los valores de las constantes de la tabla de arriba (tabla de parmetros) no
se deben tomar sino como promedios y en cada simulacin deben ser generados en
funcin de una cierta distribucin cuya media conocida es dada en la tabla.

Correccin al modelo

El modelo anterior es bastante limitado y no toma en cuenta las influencias del


ambiente como son, por ejemplo, temperatura, humedad, presin, precipitaciones, etc.
Una hiptesis bastante plausible es la influencia de la temperatura y la humedad en el
sistema, influencia que podra aclararse al analizar los siguientes datos:

Temperatura/C Humedad/% % Cambio aprox. en nmero de huevos H

20 59 1.6%
21 61.8 1.8%
22 64.2 2.2%
23 65.9 2.3%
24 67.7 2.7%
25 71.5 2.9%
26 72 3.1%
27 73.6 3.6%
28 75.8 3.9%
29 78.2 4.3%
30 80.3 4.8%

El modelo inicial se determina con condiciones ideales de laboratorio, manteniendo la


temperatura T y la humedad hum constantes. Pero en condiciones reales la cantidad de
huevos detectados es mayor que la cantidad de huevos predichos por el modelo. La
cantidad H es la diferencia entre los huevos detectados en el sistema corregido
menos los predichos por el modelo a condiciones ideales.

Se debe incorporar esta correccin a la simulacin, hallando primero la relacin entre


H, T y hum, insertando esta relacin en el modelo. La relacin se puede hallar por
mtodos de anlisis matemtico y lo ms fcil es utilizar algn paquete como el
EXCEL, que nos arroje la dependencia H = f (T, hum). La expresin de esta relacin
se debe adicionar a la frmula del modelo original donde se calcula el nmero de
huevos para el primer ciclo, en la fila 2, columna rotulada Huevos. Luego de
completarlo as, se debe generar un valor simulado de T y uno de hum para cada ciclo.
A veces estas dos variables se acomodan a una distribucin de Weibul. Despus de
llevar a cabo estos cambios, la tendencia de las poblaciones luce un poco ms estable,
de la siguiente manera:
6.9 Modelos macro economtricos

Sirven para simular la economa a nivel macro. Se trabajar a partir de las siguientes
hiptesis:

1. El consumo de un ao depender del ingreso nacional en dicho ao.


2. La inversin depender de las utilidades del ao.
3. Los ingresos fiscales dependern del futuro producto bruto nacional PBN.
4. El PBN es la suma de consumo, inversin y gastos gubernamentales.
5. Ingreso nacional es igual a PBN menos impuestos.

Parmetros:

C= consumo Y= ingreso nacional I= inversin


U= utilidades del ao anterior F= ingresos fiscales B= producto bruto nacional
G= gasto gubernamental

Modelo: C= a*Y+b B= C+I+G


I= c*U+d Y= B-F
F= e*B

Con a, b, c, d, e, constantes de igualacin.

Los parmetros cuyo valor suponemos conocido inicialmente sern las constantes de
igualacin y el valor inicial de C, de U y de G. Las constantes dependern de cada
sistema en particular, o sea de la economa de cada pas, mientras que los parmetros C,
U y G debern ser estimados tanto sus medias como sus distribuciones en funcin de los
datos histricos de que se disponga. La cantidad interesante sera Y, el ingreso nacional
y para hallarla se debe realizar un nmero suficiente de corridas con el fin de
determinar un valor promedio de este criterio de desempeo junto con su distribucin de
probabilidad.

6.10 Modelos de empresa. Modelo de telaraa.


La suposicin sobre la que se basa este modelo es que la demanda de un producto
durante un perodo de tiempo t, depende del precio y otros factores. Tambin la oferta
depende del precio del producto en el perodo de tiempo inmediatamente anterior, t-1.
Adems la oferta y la demanda sern semejantes.

Las variables endgenas del modelo sern: precio Pt, demanda Dt y oferta Ot, en el
perodo t, Las variables exgenas sern Ut, Vt y Wt, y representan variaciones aleatorias
con distribuciones de probabilidad conocidas (ver 4.1.1.1).

Las ecuaciones del modelo sern:

Dt = K1 K2 * Pt + Ut (1)
Ot = K3 + K4 * Pt-1 + Vt (2)
Ot = Dt + Wt (3)

Remplazando Ot en (2) por su expresin en (1):

K3 + K4 * Pt-1 + Vt = (K1 K2 * Pt + Ut) + Wt

Simplificando y trasponiendo trminos:

Pt = (1/K2) [K1- K3 - K4*Pt-1 + Ut + Wt Vt] (4)

Las constantes K1 hasta K4 se calculan a partir de datos histricos mediante las tcnicas
de manejo de datos de la econometra (mnimos cuadrados etc).
Para generar trayectorias de tiempo para precios, demandas y ofertas en base a datos del
perodo t=0, utilizamos el siguiente procedimiento:

Leer Po, Do, K1.K4


Para t=1, N
Generar Ut, Vt y Wt
Calcular Ot segn (2)
Calcular Dt = Ot- Wt
Calcular Pt segn (4)

6.11 Sistemas dinmicos. El caos


determinstico
En algunos modelos biolgicos se pide determinar la poblacin de cierta especie para
cierto ao o ciclo, conocida la poblacin del ciclo inmediatamente anterior. Es un
ejemplo del comportamiento de una poblacin dentro de un sistema cerrado donde no
existen depredadores y no se toma en cuenta los recursos del entorno.
Considere una poblacin cuya cifra inicial sea X0 y que deba crecer un cierto porcentaje
p%. Al final de un ciclo reproductivo que generalmente es un ao, la poblacin llega al
nivel
X1 = X0 + X0*p/100 = X0 (1+p/100)
X2= X1 (1+p/100)

Xn+1= Xn (1+p/100)

Si p es menor que cero la poblacin decrecer.


Se puede escribir 1 + p / 100 = k donde Xn+1 = k * Xn
Si 0 k 1 la poblacin disminuye, si k mayor que 1, la poblacin crece.
Los factores que frenan el crecimiento dependen del tamao mismo de la poblacin, de
lo favorable que sea el medio, de los medios de subsistencia, de los depredadores, la
mortalidad etc. K= f (Xn)

Tomemos por supuesto: Tamao mnimo de la poblacin Xn> 0


Tamao mximo de la poblacin Xn< 1

Describiremos la cantidad de poblacin en el intervalo (0,1).


Ambas exigencias K= f (Xn) y Xn (0,1) se satisfacen. Tomando k = w (1-Xn) con
w= parmetro de crecimiento.

Para Xn 0, k w alcanzando su mayor valor.


Para Xn 1, k 0 alcanzando su menor valor.

Xn+1 = k*Xn = w (1-Xn) Xn = w Xn w Xn^2

A esta relacin se la denomina el Mapa logstico de poblaciones biolgicas, tiene un


trmino lineal y un trmino no lineal.
W es el parmetro de crecimiento que toma en cuenta el efecto que produce el entorno
sobre la poblacin. Para cada tipo de entorno que una poblacin posea, cambia el valor
de w.
Dinmica de la poblacin Xn+1 = w Xn w Xn^2

Por ejemplo, con un valor constante de X0 (condicin inicial) = 0.2 se puede examinar
qu pasa cuando

0<w 1, 1<w 3, 3<w 3.4, 3.45<w 3.54, 3.54<w 3.5697, 3.5697<w

El primer ensayo se puede hacer con


1. X0= 0.2, w = 0.9 en cuyo caso el Xn decae a 0 en unos cuantos aos.
2. X0= 0.2, w = 2 aqu la poblacin tiende a una constante. Est en equilibrio.
3. X0= 0.2, w = 0.9
4. X0= 0.2, w = 0.9

Cuando Xn tiende a cierto valor para un nmero suficientemente numeroso de ciclos, a


este valor se le denomina un atractor. Xn no siempre tiende a un solo valor sino que
puede variar entre dos o ms valores. Estos valores tambin se denominan atractores.
Cuando Xn no presenta tendencia clara, este sistema presenta una conducta catica. Es
lo que ocurre con nuestro modelo cuando se examina para valores de w = 4. Se da una
transicin al caos y se le llama un sistema dinmico porque su valor final depende de
las finas variaciones de las condiciones iniciales. Son sistemas con extrema sensibilidad
a las condiciones iniciales. Sistemas muy semejantes en un t= 0, pueden evolucionar de
forma muy diferente alcanzando estados diferentes en t.

Se podra tomar como parmetro estocstico del modelo w. Su valor en los anteriores
clculos se podra ahora generar por medio de una variable aleatoria con distribucin
uniforme entre (0,5) por ejemplo y repetir las anteriores mediciones.
(Ver ms en: Teora del caos, Fractales, Sistemas disipatvos, oscilaciones caticas etc.)
Ver en esta misma pgina: Fractales

6.12 Definicin de itinerarios para una


compaa aeronutica.

Unidad 7
7.1 Convergencia estocstica, intervalos de
confianza y tamao de una muestra
7.1.1 Determinacin del nmero de rplicas n.

El objetivo de la simulacin es producir informacin sobre cantidades o promedios de


poblacin, por ejemplo nivel de ingresos, tiempo promedio de espera, nmero de
unidades vendidas etc.
Como estimaciones de los promedios de poblacin, los promedios de muestra
calculados a travs de un nmero n de corridas estarn sujetos a variaciones aleatorias y
no equivaldrn exactamente a los promedios de poblacin, pero si la muestra es mayor
(ms corridas), la probabilidad de que los promedios de muestra sean similares a los
promedios de poblacin , es mayor. Los promedios de muestra deben converger a
medida que crece la muestra, a un cierto valor. La pregunta ser: Qu tan cerca est la
media muestral de la media poblacional ? Es claro que para n mayor, el error -
ser menor y si n tiende a infinito, el error tender a cero. Pero la es una variable
aleatoria en s misma, con distribucin aproximada normal con media y desviacin
estndar S/n (por teorema central del lmite) para n mayor a 10.

Se debe determinar el nmero de rplicas n requerido para establecer un intervalo de


confianza dado para un valor medio calculado del criterio de desempeo del sistema. En
esto consiste el clculo que sigue:

Sean la media del criterio de desempeo del modelo calculado a partir de las
muestras, S su desviacin estndar, n el nmero de valores simulados del criterio de
desempeo Yi, y la media verdadera del criterio de desempeo (desconocida).
n n
= 1/n Yi S = ((1/n Yi) - )
I
Si los Yi son normalmente distribuidos, el estadstico (( ) / S) (n-1) se puede
conocer, pues su distribucin es T de student.

-T (n-1, 1- /2) < (( ) / S) (n-1) < T (n-1, 1- /2)

T es el valor tabulado del estadstico con n-1 grados de libertad y 1- como intervalo de
confianza.

El valor del parmetro se representa por dos nmeros entre los cuales se supone que
existe tal parmetro. El intervalo entre estos dos nmeros es el intervalo de confianza.
Los lmites que contienen un parmetro con una probabilidad del 95% se llaman lmites
de confianza del 95% (el parmetro debe caer en el rea no sombreada). Es la
probabilidad de que el verdadero valor del parmetro a estimar est (1-)*1/100 dentro
de dicho intervalo. Si se realiza 100 veces la estimacin, el 100*(1-) de las veces, el
verdadero valor del parmetro cae en este intervalo.

- T (n-1, 1- /2) * S / (n-1) < < + T (n-1, 1- /2) * S / (n-1)

es la media verdadera (poblacional) del criterio de desempeo Y que cae en este


Intervalo con (1-) % de probabilidad. Si se especifica el nivel de confianza (1-) se
puede obtener el valor de T (n-1, 1- /2) a partir de la tabla; los lmites del intervalo se
pueden determinar con la ecuacin

- / + T (n-1, 1- /2) * S / (n-1)

Ejemplo: Simulando 100 veces un modelo se hall = 0.626 y S = 0.108. Se debe


determinar los lmites de la media real correspondientes al 95% del intervalo de
confianza, asumiendo que las Yi tienen distribucin normal.

Tenemos = 0.05, n = 100 veces, y de la tabla de la distribucin T student se obtiene el


valor para T (99 1-0.05/2). Pero si la tabla no contiene este valor pero s los de
T (60, 0.975)= 2.00 y T (120, 1-0.975)= 1.98, con los cuales se puede hacer una
interpolacin lineal:

T (99, 1-0.05/2) = 2.00 + ((99-60)/ (120-60)) (1.98-2.00) = 1.987

Los lmites por la izquierda y por la derecha de sern


- / + T (99, 0.975) * S / (n-1) = 0.626 - / + (1.978) (0.108)/ 99 = 0.626-/+0.022

O sea que la media de la Y verdadera est entre 0.604 << 0.648 con probabilidad de
95%.

Si n> 30 se puede usar la distribucin normal estndar en lugar de la student:

- / + Z (1- /2) * S / (n-1) = 0.626 -/+ (1.96) (0.108) / 99 = 0.626- / + 0.021

Donde Z(1-0.05/2) = Z (0.975) = 1.96

Para determinar el valor de n (nmero de simulaciones) que produzca la media


verdadera dentro de cierto intervalo de confianza dado, se hace por ensayo y error: se
elige un n y se calculan los correspondientes lmites del intervalo segn el mtodo
anterior. Si el intervalo que resulta es muy ancho, se aumenta n y se recalcula de nuevo,
sin perder los valores de las corridas anteriores, hasta que se obtenga uno que sea menor
o igual al intervalo deseado.
Si se asume que el Y promedio calculado y la S no cambian apreciablemente cuando n
se incrementa, y si se expresa el intervalo deseado como

+ / - con = Z (1-/2) * S / (n-1) despejo n = (Z (1 /2) * S / ) + 1

Ejemplo: simular n veces hasta que la media verdadera () de caiga dentro de


+/- 1% de la media calculada con el 95% de confianza. Hallar n.

Para n= 100 se obtuvo un I de C de 0.626 + / - 0.022, esto es +/- 0.035 . Suponga


que la Y calculada permanece en 0.6 aproximadamente y que S permanece en 0.1
aproximadamente.
= 0.01 = 0.01* 0.6 = 0.006 que es el 1% de

As n= (Z (1-0.05/2)*S / ) + 1 = (Z (0.975)*0.1 / 0.006) + 1 = 1068 simulaciones.

Si se llevan a cabo 1068 rplicas independientes del modelo y se calcula su , se puede


decir que hay 95% de probabilidad de que la diferencia - sea menor que 0.01 .

Si la muestra es grande, la probabilidad de que los promedios de la muestra sean


semejantes a los verdaderos (poblacionales) es mayor. Se utilizan tcnicas para no
aumentar demasiado el nmero de rplicas y reducir el error: muestreo de regresin,
muestreo estratificado, muestreo de importancia etc.
Ejemplo: Se quiere estimar un intervalo de confianza al nivel de significacin
para la altura media de los individuos de una ciudad. En principio slo
sabemos que la distribucin de las alturas es una v.a. X de distribucin normal. Para ello
se toma una muestra de n=25 personas y se obtiene

En primer lugar, en estadstica inferencial, los estadsticos para medir la dispersin ms


conveniente son los insesgados. Por ello vamos a dejar de lado la desviacin tpica
muestral, para utilizar la cuasidesviacin tpica:

Si queremos estimar un intervalo de confianza para , es conveniente utilizar el


estadstico

y tomar como intervalo de confianza aquella regin en la que

es decir,

o dicho de forma ms precisa: Con un nivel de confianza del 95% podemos decir que la
media poblacional est en el intervalo siguiente

Ejemplo: En el ejemplo anterior se ha estudiado la variable altura de los individuos de


una poblacin, considerando que sta es una variable que se distribuye de modo
gaussiano. Para ello se tom una muestra de 25 individuos (que podemos considerar

piloto), que ofreci los siguientes resultados:

Calcular el tamao que debera tener una muestra para que se obtuviese un intervalo de

confianza para la media poblacional con un nivel de significacin (al )y


con una precisin de d=1 cm.

Solucin: sobre la muestra piloto, el error cometido al estimar el intervalo al 95% fue
aproximadamente de 4'2 cm. por lo que si buscamos un intervalo de confianza tan
preciso, el tamao de la muestra, N, deber ser bastante mayor. En este caso se obtiene:
Por tanto, si queremos realizar un estudio con toda la precisin requerida en el
enunciado se debera tomar una muestra de 694 individuos. Esto es una indicacin de
gran utilidad antes de comenzar el estudio. Una vez que el muestreo haya sido realizado,
debemos confirmar que el error para el nivel de significacin dado es inferior o igual a 1
cm., utilizando la muestra obtenida.

7.2 Validacin de un modelo

Validar un modelo significa comprobar si este modelo representa al sistema que se


modeliza. La validacin tiene tres pasos:

1. Correr n rplicas del modelo de simulacin y hallar la distribucin de su criterio


de desempeo Ysim, su media y su varianza.
2. Realizar n mediciones del sistema real y hallar la distribucin de la variable
medida Yreal, su media y su varianza.
3. Llevar a cabo una prueba de hiptesis con Ho: Y sim = Y real
Ha: Y sim Y real

Mientras ms grande sea la muestra, la probabilidad de que los promedios de la muestra


sean semejantes a los verdaderos (poblacionales) es mayor, pero para no aumentar
demasiado el tamao muestral n (nmero de rplicas del modelo) y reducir el error que
sera la diferencia entre el modelo simulado y el sistema real, se pueden emplear
algunas tcnicas de disminucin de la varianza como por ejemplo muestreo de
regresin, muestreo estratificado, muestreo de importancia etc.

Bibliografa recomendada.
Azarang/Garca. Simulacin y anlisis, modelos estocsticos.
Banks, Jerry Elements of stochastic process Simulation.
Banks, Jerry Discrete event system simulation.
Coss, Bu Anlisis y evaluacin de proyectos de inversin.
Coss, Bu Simulacin, un enfoque prctico.
Crespo, Simulacin y modelos.
Deo, Narsingh. System simulation with digital Computer.
Gallagher, Modelos cuantitativos para tomar decisiones en admn.
Gottfried, Elements of stochastic process simulation.
Gordon, Geoffrey System simulation.
Hanke, Pronstico en los negocios.
Kelton, Simulation modeling.
Kobayashi, H. Modeling and analysis.
Low, Simulation modeling and analysis.
Naylor, Experimentos de simulacin.
Ortiz, M. A. Simulacin.
Ros, Sixto Simulacin, mtodos y aplicaciones.

Para nociones bsicas de estadstica:


http://carmesimatematic.webcindario.com/introduccionestadistica.htm

http://www.aulafacil.com/CursoEstadistica/Lecc-1-est.htm

http://www.hacienda.go.cr/cifh/sidovih/cursos/material_de_apoyo-f-c-
cifh/1materialdeapoyocursoscifh/4estad
%C3%ADsticabasica/estadisticadescriptiva-lillianaorellana.pdf

Anexos
Anexo 1: anlisis de regresin.
El material de este acpite bajado de INTERNET, se incluye como repaso del tema que
se supone ya visto por el alumno en cursos anteriores.

FISICA I
Escuela Politcnica de Ingeniera de Minas y Energa Torrelavega

AJUSTE POR MNIMOS CUADRADOS

Existen numerosas leyes fsicas en las que se sabe de antemano que


dos magnitudes x e y se relacionan a travs de una ecuacin lineal

y =ax +b

donde las constantes b (ordenada en el origen) y a (pendiente)


dependen del tipo de sistema que se estudia y, a menudo, son los
parmetros que se pretende encontrar.

EJEMPLO: La fuerza F de traccin sobre un muelle y el alargamiento


l que experimenta ste estn ligadas a travs de una ley lineal:

l = (1/K)F

con ordenada en el origen cero y donde el inverso de la pendiente


(K) es una caracterstica propia de cada muelle: la llamada
constante elstica del mismo.

El mtodo ms efectivo para determinar los parmetros a y b se


conoce como tcnica de mnimos cuadrados.

Consiste en someter el sistema a diferentes condiciones, fijando


para ello distintos valores de la variable independiente x, y
anotando en cada caso el correspondiente valor medido para la
variable dependiente y. De este modo se dispone de una serie de
puntos (x1,y1), .... (xn,yn) que, representados grficamente,
deberan caer sobre una lnea recta. Sin
embargo, los errores experimentales siempre presentes hacen que no
se hallen perfectamente alineados (ver Fig. 1). El mtodo de
mnimos cuadrados determina los valores de los parmetros a y b de
la recta que mejor se Ajuste por mnimos cuadrados ajusta a los
datos experimentales. Sin detallar el procedimiento, se dar aqu
simplemente el resultado:

donde n es el nmero de medidas y S representa la suma de todos los


datos que se indican.Los errores en las medidas, se traducirn en
errores en los resultados de a y b. Se describe a continuacin un
mtodo para calcular estos errores. En principio, el mtodo de
mnimos cuadrados asume que,al fijar las condiciones experimentales
,los valores yi de la variable independiente se conocen con
precisin absoluta (esto generalmente no es as, pero lo aceptamos
como esencial en el mtodo). Sin embargo, las mediciones de la
variable x, irn afectadas de sus errores correspondientes, si e es
el valor mximo de todos estos errores, entonces se tiene:

El coeficiente de correlacin es otro parmetro para el estudio de


una distribucin bidimensional, que nos indica el grado de
dependencia entre las variables x e y. El coeficiente de
correlacin r es un nmero que se obtiene mediante la frmula:

Su valor puede variar entre 1 y -1.

Si r = -1 todos los puntos se encuentran sobre la recta existiendo


una correlacin que es perfecta e inversa.

Si r = 0 no existe ninguna relacin entre las variables.


Si r = 1 todos los puntos se encuentran sobre la recta existiendo
una correlacin que es perfecta y directa.

Ejemplo: Supongamos un muelle sometido a traccin, se ha cargado el


muelle con diferentes pesos (F, variable independiente o y ) y se
han anotado los alargamientos (l variable dependiente o x) Cargas
sucesivas F(yi)gramos

con lo cual aplicando las expresiones [1] , [2], [3] y [4]


b = -18,4153; a =3,4959 ; .b =0,08164966; .a =0,00102217; r =
0,9995
Redondeando en la forma usual b = -18,42 0,08 mm; a =3,50 0,00
mm/Kp

No se debe olvidar que se persigue el valor de la constante


elstica del muelle:
K = a = F / l

Regresin lineal simple

En la prctica, para clculos relacionados con anlisis de regresin se utilizan paquetes


computacionales por lo que las frmulas detalladas en esta seccin se incluyen
nicamente a ttulo de ilustracin habida cuenta de que ellas van inmersas en el
algoritmo usado por el respectivo paquete (EXCEL). Para estimar los coeficientes bo y
b1 por medio de mnimos cuadrados, se utilizan las siguientes frmulas:
Cuadro 1.
Operaciones Mensuales en
una Empresa de Transporte
de Pasajeros.

Costos Millas
Totales
Vehculo
(miles)
(miles)
Mes N Y
X

1 213.9 3147
2 212.6 3160
3 215.3 3197
4 215.3 3173
5 215.4 3292
6 228.2 3561
7 245.6 4013
8 259.9 4244
9 250.9 4159
10 234.5 3776
11 205.9 3232
12 202.7 3141
13 198.5 2928
14 195.6 3063
15 200.4 3096
16 200.1 3096
17 201.5 3158
18 213.2 3338
19 219.5 3492
20 243.7 4019
21 262.3 4394
22 252.3 4251
23 224.4 3844
24 215.3 3276
25 202.5 3184
26 200.7 3037
27 201.8 3142
28 202.1 3159
29 200.4 3139
30 209.3 3203
31 213.9 3307 Cuadro 3
32 227.0 3585
33 246.4 4073 Demanda de Automviles Nuevos
y Variables Relacionadas,
1932-56.
X1 X2 X3 Y
Fuente: J. Johnston,
Anlisis Estadstico de los
1932 126.5 83.4 18.7 1.10 Cuadro 2
Bancos Comerciales Privados en Guatemala (1991).
Costes 1933 128.5 82.6 17.9 1.53 Gastos Total Agencias
(Barcelona: Sagitario, S. A., Generales Activo
1966), p. 118. 1934 128.5 90.9 18.9 1.93 y de Promedio
1935 120.5 99.3 19.4 2.87 Admin.
XY y X
b1 1936 117.0 111.6 20.1 3.51 G&T
X2 xX 1937 121.0 115.6 21.5 3.51 INDUSTRIAL
48.8 831.5 30
43.2 1204.0 18
1938 133.8 109.0 22.3 1.96 OCCIDENTE
b0 y b1 x 39.4 1153.5 20
1939 131.0 118.5 22.7 2.72 del CAFE 29.8 499.6 25
1940 134.3 127.0 23.2 3.46 del AGRO 26.2 466.6 30
En nuestro ejemplo, 1941 144.9 147.9 24.5 3.76 AGRICOLA MERC. 24.8 522.3 12
aplicando estas .. .. .. .. .. INTERNACIONAL 24.0 376.6 12
frmulas tenemos: 1949 186.6 184.9 30.6 4.87 INMOBILIARIO 21.5 431.3 20
1950 186.6 200.5 33.1 6.37 CONSTRUBANCO 18.3 282.2 10
25,216,020.3219.1242(113,879) 1951 181.5 203.7 35.7 5.09 del EJERCITO 15.6 311.8 13
b1 =
1952
195.7 209.2 37.6 4.19 LLOYDS =
14.3
0.044674
284.5 7
398,855,769 3,450.879(113,879)
1953 188.2 218.7 39.3 5.78 METROPOLITANO 12.9 339.0 8
b0 = 219.1242 0.044674(3,450.879) 1954 190.2
= 64.96 221.6 41.6 5.47 BANEX 12.5 462.8 3
1955 196.6 236.3 43.0 7.20 del QUETZAL 8.8 205.0 12

Expresando los 1956 193.4 247.2 47.0 5.90 PROMOTOR 6.0 162.4 3

resultados en trminos CITIBANK 5.9 45.8 1


de la recta de regresin, Fuente: The Demand for New CONTINENTAL 3.6 113.7 4
tenemos: Automobiles in the United States, REFORMADOR 1.7 237.3 7
Review of Economics and Statistics, UNO 1.0 170.8 5
Fuente: Superintendencia de Bancos, Boletn de Estadsticas
40 (August 1958): 279. Bancarias (Guatemala, 4 Trimestre, 1992).