Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PUB DOC Tabla AEN 4232 1 PDF
PUB DOC Tabla AEN 4232 1 PDF
la simulación de
Monte Carlo
Juan Carlos López Agüí
Índice
Capítulo 1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.1. Principios de la simulación de Monte Carlo . . . . . . . . . . . . . . . . . . 16
Bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
1 Introducción
Para los objetivos de esta guía básica, simulación será sinónimo de generación
de datos artificiales en un ordenador. Entre sus objetivos podemos destacar los
siguientes (DAVISON, A.C. Cambridge Series in Statistical and Probabilistic
Mathematics. Cambridge. 2003 {12}):
a) estudiar la variabilidad que puede esperarse al muestrear en un determinado
modelo estadístico,
b) evaluar el grado de adecuación de una aproximación teórica determinada,
c) realizar análisis de sensibilidad de las conclusiones de un estudio en relación
con las hipótesis adoptadas,
d) aportar mayor luz respecto de un supuesto o intuición, sobre la base de que
es preferible una respuesta incompleta a una cuestión correctamente formula-
da, que una respuesta precisa a una cuestión incorrecta,
e) proporcionar solución numérica a un determinado problema estadístico
cuando la solución analítica o no existe o si existe es demasiado compleja,
f) proporcionar solución numérica a un determinado problema matemático
—pero de raíz no directamente estadística— cuando la solución analítica o
no existe o si existe es demasiado compleja.
g) servir de apoyo a los métodos clásicos de enseñanza de la Estadística.
La simulación es, por otra parte, una manera económica y útil de experimenta-
ción. En muchas ocasiones, el científico o el técnico se encuentran con sistemas
14 Guía básica para la simulación de Monte Carlo
describiese el sistema real o incluso un prototipo del mismo. Por definición, las
ecuaciones constitutivas del modelo —es decir, su especificación— son conocidas,
de modo que el proceso interno de transformación de las variables de entrada en
variables de salida es conocido y fijo una vez construido el modelo, y general-
mente establecido en forma de algoritmo.
I D
f(x) dx % 1. [1.1]
E[X] %
I D
x f (x) dx, [1.2]
Introducción 17
E[g(X)] %
I D
g(x) f (x) dx. [1.3]
Pr (X à S) %
I S
f (x) dx, [1.4]
E
1 si x à S
⺙S(x) % ⺙ [x à S] % [1.5]
0 si x â S (ó x à S1 ).
Pr (X à S) %
I D
⺙S(x) f (x) dx, [1.6]
I D
⺙S(x)f(x) dx %
I S
1 · f(x) dx !
IS1
0 · f(x) dx %
I
S
f(x) dx, [1.7]
Pr (X à S) % E [⺙S(x)], [1.8]
I
1
a% g(x) dx, [1.9]
0
siendo g(x) una función de la que se va a suponer que no tiene primitiva expresa-
ble analíticamente, lo que hace que a no sea calculable por métodos analíticos
—en particular por la regla de Barrow—. El camino tradicional seguido en tales
casos es el de utilizar algún método de integración numérica para calcular a con
una precisión prefijada. Muchos son los métodos competidores, pudiéndose men-
cionar entre otros la aproximación de Riemann, la regla del trapecio o de Simp-
son, el procedimiento de Newton-Cotes, el método de Romberg, etc. Se trata en
todos los casos de métodos deterministas aplicados a un problema de enunciado
puramente determinista como es [1.9].
Sin embargo, a pesar de que el sistema real es determinista y de que los mejores
procedimientos de resolución de [1.9] son también en este caso los del análisis
numérico —de base determinista—, es posible construir un modelo de simula-
ción de base estocástica que permita estimar a mediante la metodología Monte
Carlo.
Considérese al efecto la variable aleatoria auxiliar X z U V Unif (0 ; 1) distribuida
uniformemente en el intervalo [0 ; 1]. La función de densidad en dicho caso es:
E
0 ; x m 0,
f (x) % 1 ; 0 a x m 1, [1.10]
0 ; 1 a x.
Introducción 19
Eso hace que se pueda interpretar [1.9], es decir la integral a calcular, como la
esperanza matemática de g(X), siendo X una variable aleatoria uniforme en el
intervalo [0 ; 1]:
a % E[g(X)], [1.11]
1 m
a4 m % ; g(xi). [1.13]
m i%1
Nótese que si g( · ) es integrable en [0 ; 1], entonces por la ley fuerte de los gran-
des números se obtiene el importante resultado de que a4 m tiende a a con probabi-
lidad 1 cuando m tiende a ä.
I
1
p2g % var [g(X)] % [g(x) . a]2 dx, [1.14]
0
Nótese que eso significa que si se desea aumentar al doble la precisión en la esti-
mación de a, será necesario multiplicar por cuatro el número de puntos muestrea-
dos —o lo que es igual, el número de variables aleatorias uniformes generadas—.
Aún más, si se desea ampliar en un dígito significativo la precisión del resultado
habrá que multiplicar por 100 el número de puntos muestreados.
De vuelta a los resultados [1.15] y [1.16], especialmente a este último, nótese que
no pueden ser aplicados directamente para la construcción de intervalos de con-
fianza para a, porque pg no es conocida ‘‘a priori’’ —véase por [1.14] que su cál-
culo precisa de a, que es precisamente la cantidad a estimar por ser desconocida—.
Este inconveniente se soslaya en parte al calcular
Introducción 21
J
m
1
sg % ; [g(xi) . a4 m]2, [1.17]
m . 1 i%1
para lo que sólo es necesario utilizar resultados del modelo de simulación. Con
ayuda de sg se puede establecer un intervalo de confianza de nivel 100(1 . d)%
para a. Dicho intervalo, que tiene el carácter de aproximado, es a4 m u zd/2 sg /∂m,
pues al ser m un número elevado en las aplicaciones de los modelos de simulación
está justificado utilizar el cuantil zd/2 de la N(0 ; 1). Se puede así poner,
A B
sg sg
Pr a4 m . zd/2 m a m a4 m ! zd/2 ^1.d, [1.18]
∂m ∂m
I
b
a% h(y) dy, [1.19]
a
I I
1 1
a % (b . a) h[a ! (b . a)x] dx % g(x) dx, [1.20]
0 0
con g(x) % (b . a)h[a ! (b . a)x]. Esta integral coincide con [1.9], lo que hace
aplicable inmediamente la metodología de Monte Carlo para su resolución. Incluso
22 Guía básica para la simulación de Monte Carlo
si alguno de los límites no es finito existe una transformación adecuada para utili-
zar los resultados anteriores. Sea por ejemplo la integral
ä
a%
I 0
t(y) dy, [1.21]
I A B I
1 1
1 dx
a% t % g(x) dx, [1.22]
0 1 ! x (1 ! x)2 0
I
b
a% m(y) dy, [1.24]
.ä
a%
II I
ñ
S
g(x1, x2, ..., xd) dx1 dx2 ñ dxd, [1.26]
ción. Para fijar ideas se comentará a continuación la aplicación del muestreo por
importancia al cálculo de integrales.
Supóngase que se quiere estimar como antes la integral [1.9]. Si la función g(x)
difiere mucho de la función de densidad de la distribución uniforme —en forma,
no en altura o valor— entonces var [g(x)] dado por [1.14] toma un valor elevado,
incidiendo negativamente en la precisión de la estimación a4 m. La Figura 1.4 es útil
para entender que el hecho de que el muestreo se lleve a cabo en la distribución
uniforme tiene una relación directa en la varianza de g(x) y por tanto en la preci-
sión de la estimación. Se ha elegido una función g(x) particular marcadamente de-
creciente en el intervalo (0 ; 1). Nótese que a representa a la vez el área bajo la
curva g(x) en el intervalo (0 ; 1) y el valor medio de g(x) en dicho intervalo por ser
de ancho unidad.
Esta última es la razón por la que a aparezca representado en la Figura 1.4 como
una ordenada que, aunque desconocida por hipótesis, existe, y su inclusión es útil
porque facilita la exposición. Es evidente que la mayor parte del área que represen-
ta a se encuentra en la parte más a la izquierda del intervalo (0 ; 1), donde las orde-
nadas de g(x) son altas, mientras que una parte pequeña de dicha área se encuen-
tra en la zona de la derecha del intervalo (0 ; 1) por la razón contraria. Eso
significa que cuando una extracción aleatoria de la Unif (0 ; 1) ha ocurrido en una
parte de la izquierda del intervalo (0 ; 1) la contribución de dicha extracción al
área estimada a4 m, medida por g(xi)/m según [1.13], tiende a sobrevalorar la con-
tribución media, y que la contribución de dicha extracción a sg2 —véase [1.17]—
Introducción 25
tiende a ser muy alta. De forma parecida, cuando una extracción aleatoria de la
Unif (0 ; 1) tiene lugar en la parte derecha del intervalo (0 ; 1), la contribución de
dicha extracción al área estimada a4 m tiende a infravalorar la contribución media
pero a aumentar el valor de sg2.
a % E f [g(X)] %
I
D
g(x)f(x) dx. [1.27]
Como el método del muestreo por importancia utiliza diferentes métricas para el
cálculo de esperanzas matemáticas, conviene utilizar el criterio de nomenclatura
expresado en [1.27] por ser más informativo.
26 Guía básica para la simulación de Monte Carlo
Sea ahora h(x) una función de densidad auxiliar, cuyo soporte se va a designar por
H, de modo que D Ñ H, es decir que el soporte D de f(x) queda incluido en H
o, lo que es igual, que f(x) b 0 implica que h(x) b 0 para todo x. Esta exigencia
también implica que h(x) b 0 para x à D, de modo que la siguiente transforma-
ción en [1.27] es válida:
IC D
g(x) f (x)
a % E f [g(X)] % h(x) dx. [1.28]
D h(x)
C D IC D
g(x)f (x) g(x) f (x)
Eh % h(x) dx, [1.29]
h(x) H h(x)
IC D IC D I C D
g(x) f (x) g(x) f (x) g(x) f (x)
h(x)dx % h(x)dx ! h(x)dx, [1.30]
H h(x) D h(x) HçD1 h(x)
y si se observa que por ser D el soporte de f (x) debe ser necesariamente f (x) % 0
para x à D1 y por tanto para x à H ç D1 , se concluye que la última integral de este
desarrollo es nula, por lo que se obtiene:
IC D C D
g(x) f (x) g(x) f (x)
a % E f [g(X)] % h(x) dx % E h . [1.31]
D h(x) h(x)
Si se designan por xf1, xf2, ..., xfm ciertas extracciones aleatorias e independientes
de la distribución f(x), y por xh1, xh2, ..., xhm ciertas extracciones aleatorias e inde-
pendientes de la distribución h(x), se pueden construir dos estimaciones diferen-
tes de a, que van a ser designadas por a4 f, m y a4 h, m :
1 m
a4 f, m % ; g(xf i), [1.32]
m i%1
C D
1 m f (xhi)
a4 h, m % ; g(xhi). [1.33]
m i%1 h(xhi)
Al comparar las expresiones [1.32] y [1.33] se observa que el muestreo por im-
portancia es equivalente a calcular a4 h, m ponderando los valores g(xhi) con los pe-
sos f (xhi)/mh(xhi). Algunos de estos pesos pueden ser cero —cuando xhi à D1 — y
otros en cambio relativamente elevados, siendo en tal caso xhi extracciones impor-
tantes por su contribución al cálculo de a. Nótese que a pesar de la apariencia de
[1.33], a4 h, m no será en general una media ponderada de los valores g(xhi), y ello
porque los pesos de las diferentes observaciones g(xhi) no tienen por qué sumar la
unidad.
El muestreo por importancia pone de manifiesto que en muchos casos será conve-
niente muestrear de distribuciones h(x) cualesquiera y no sólo de la distribución
uniforme. No obstante, el muestreo de la distribución uniforme es muy importan-
te la en simulación de Monte Carlo, tanto porque es la base de la resolución de
algunos problemas típicos de la metodología Monte Carlo —como la integración
y la optimización de funciones— como por ser un paso previo para la generación
de otro tipo de variables aleatorias, en tanto que los algoritmos ideados para llevar
a cabo esa generación se apoyan siempre en la extracción de variables aleatorias
uniformemente distribuidas.
Esta nueva obra de Genieviève Krebs es una recopilación real de situaciones vividas a lo largo de las
auditorías donde la autora comparte su experiencia respondiendo a las preguntas planteadas con mayor
frecuencia tanto por los auditores como por los auditados:
,6%1