Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cartilla - S5Simulacion Gerencial
Cartilla - S5Simulacion Gerencial
GERENCIAL
Modelos estadsticos en Simulacin 2
MODELOS ESTADSTICOS EN SIMULACIN 2
1. ndice
1. Distribuciones de Probabilidad Continuas
1.1. Distribucin Exponencial
1.2. Distribucin Uniforme Continua
1.3. Distribucin Normal
1.4. Distribucin Triangular.
2. Estimacin Puntual
3. Estimacin por Intervalos de Confianza
3.1. Intervalos de Confianza Para una sola Muestra: Estimacin de la Media
3.2. Intervalos de Confianza Para dos Muestras: Estimacin de la diferencia entre dos
Medias
4. Pruebas de Hiptesis
4.1. Pruebas Para una sola Media
4.2. Pruebas Para dos Medias
2. Introduccin
El propsito del presente documento es presentar a los estudiantes los conceptos bsicos de
estadstica necesarios para desarrollar una simulacin de Montecarlo. La estadstica ser una
herramienta esencial para el soporte de la construccin de modelo, tanto al inicio como al final
para realizar el anlisis de resultados.
Por otra parte, teniendo en cuenta que el objetivo general del mdulo es que los estudiantes
desarrollen las capacidades necesarias para llevar a cabo un estudio completo de simulacin,
en esta unidad, se har un repaso de las principales funciones de probabilidad continuas que
se emplean frecuentemente en la construccin de estos tipos de modelo.
Finalmente, se presentar al estudiante una serie de ejercicios relacionados para reforzar los
conocimientos adquiridos en el desarrollo del mdulo.
3. Objetivo general
Al finalizar el mdulo los estudiantes sabrn cules son los conceptos bsicos de estadstica
relacionados con la simulacin de Montecarlo, as como las principales funciones de
probabilidad continuas aplicadas en la construccin de este tipo de modelos y la aplicacin de
tcnicas de estimacin por intervalo y pruebas de hiptesis.
2 [ POLITCNICO GRANCOLOMBIANO]
Al finalizar la primera semana de aprendizaje el estudiante estar en capacidad de:
4. Desarrollo temtico.
(; ) = ( ) = 1 ( > )
(; ) = ( ) = 1 ( 0 )
[ SIMULACIN GERENCIAL] 3
()0
(; ) = ( ) = 1
0!
(; ) = ( ) = 1
(; ) = > 0
Ejemplo:
Suponga que la vida til de una lmpara industrial, en miles de horas, se distribuye
exponencialmente con tasa de falla =1/3 (una falla cada 3000 horas, en promedio).
4 [ POLITCNICO GRANCOLOMBIANO]
La probabilidad de que la lmpara dure ms de esta vida til est dada por:
( > 3) = 1 ( 3)
1
() = { ,
0, . . .
0 <
F(X) = { <
1
+
() =
2
( )2
=
12
[ SIMULACIN GERENCIAL] 5
La distribucin uniforme juega un papel importante en simulacin. Los nmeros aleatorios,
distribuidos uniformemente entre 0 y 1, proveen los medios bsicos para generar eventos
aleatorios. Estos nmeros aleatorios se usan para generar muestras de variables aleatorias de
otras distribuciones de probabilidad.
6 [ POLITCNICO GRANCOLOMBIANO]
x
F ( x ) P X x P Z
( x ) / 1 z2 / 2 z 1 t 2 / 2
e dz donde ( z ) e dt
2
2
( x ) /
( z )dz ( x )
La funcin (z) es la funcin de distribucin de probabilidad de una VA normal con media cero
y varianza 1. A esta distribucin se le conoce como la distribucin normal estndar, y ha sido
tabulada en distintos formatos para una mejor comprensin y resolucin de situaciones que
involucren VA normales.
Dentro de los recursos adicionales encontrar la tabla donde se resumen los valores que toma
la distribucin normal estndar.
Ejemplo:
El tiempo requerido en horas para cargar un container se distribuye normalmente con media
= 12 y varianza = 4. La probabilidad de que el container se cargue en menos de 10 horas, estara
dada por
10 12
F (10 ) (1) 0.1587
2
[ SIMULACIN GERENCIAL] 7
2( x a)
(b a)(c a ) a x c
2(b x)
f ( x) c xb
(b a)(b c)
0 dlc
El nombre de esta distribucin viene dado por la forma de su funcin de densidad, cuyo
comportamiento grfico est dado por:
( x a) 2
axc
(b a )(c a )
(b x) 2
F ( x) 1 c xb
(b a )(b c)
1 xb
abc
E ( x)
3
8 [ POLITCNICO GRANCOLOMBIANO]
a 2 b 2 c 2 ab ac bc
V ( x)
18
Un ejemplo del uso de esta distribucin se encuentra en el anlisis del riesgo, donde la
distribucin ms apropiada es la beta pero dada su complejidad, tanto en la su comprensin
como en la estimacin de sus parmetros, se utiliza la distribucin triangular como
aproximacin.
2. ESTIMACIN PUNTUAL
N
1
= Yi
Y
N
i=1
N
1
2
S = |2 ,
|Yi Y
N1
i=1
[ SIMULACIN GERENCIAL] 9
Cabe anotar que estos estimadores son puntuales, lo que quiere decir que proveen un
estimado escalar de algn parmetro desconocido.
Es muy poco probable que, incluso el estimador Insesgado ms eficiente estime con exactitud
el parmetro poblacional. A pesar que, dicha precisin aumenta con muestras grandes, no
existe ninguna razn por la cual deberamos considerar que el estimador puntual de una
muestra aleatoria sea exactamente igual al parmetro poblacional que se est estimando. Por
lo tanto, sera ms conveniente pensar que se debera estimar un Intervalo, es decir, un lmite
inferior y un lmite superior en el cual, se esperara encontrar el valor del parmetro. Este
intervalo se le conoce como estimacin por intervalo.
(
< <
)
sup = 1
Donde es algn valor entre 0 y 1. Esto, en palabras significa que tenemos una probabilidad
1- de seleccionar una Variable (Aleatoria) que contenga el parmetro. Por lo tanto, el
intervalo de la forma < < calculado a partir de la muestra aleatoria se le
denomina Intervalo de Confianza, el Porcentaje 1 se le denomina Nivel de Confianza y los
valores
y
se denominan lmites Inferior y Superior del Intervalo, respectivamente.
Cuando se realiza la estimacin por intervalo para la media, debemos recordar que, de acuerdo
al Teorema del Limite Central, la distribucin muestral de ser aproximadamente:
2
~ (; )
Siempre y cuando el tamao de la muestra sea grande. Por lo tanto, la forma lmite de la
distribucin de :
10 [ POLITCNICO GRANCOLOMBIANO]
X
Z
n
P X Z / 2 X Z / 2 1
n n
LI X Z / 2
n
LS X Z / 2
n
[ SIMULACIN GERENCIAL] 11
X
T
S n
S S
P X t v / 2 X t v , / 2 1
n n
S
LI X t / 2
n
S
LS X t / 2
n
Donde
t es el valor t que tiene un rea a la derecha.
12 [ POLITCNICO GRANCOLOMBIANO]
3.2. Intervalos de Confianza Para dos Muestras: Estimacin de la diferencia entre dos
Medias
Muchas veces, en el anlisis de los modelos de simulacin de Montecarlo nos interesar
realizar un anlisis sobre dos poblaciones, con medias 1 y 2 y varianzas 1 y 2
respectivamente. Un estimador puntual de la diferencia 1 2 est dado por el estadstico
1 2 . Teniendo en cuenta esto, para realizar una estimacin puntual sobre la diferencia de
dos medias (1 2 ), se deber seleccionar 2 muestras aleatorias independientes, de tamao
n1 y n2 respectivamente. Al calcular la diferencia de los promedios 1 2 , debemos
considerar la distribucin muestral de dicho estadstico.
21 2 2 21 2 2
P X 1 X 2 Z / 2
1 2 X 1 X 2 Z / 2 1
n1 n2 n1 n2
1
P X 1 X 2 t / 2 S p 1 2 X 1 X 2 t / 2 S p
1 1 1
n
n n
n 1
1 2 1 2
n1 1S 21 n2 1S 2 2
Sp
n1 n2 2
Se debe tener en cuenta que S 21 y S 2 2 son las varianzas muestrales de las muestras n1 y n2
respectivamente.
[ SIMULACIN GERENCIAL] 13
4. PRUEBAS DE HIPTESIS
Para entender la estructura de las pruebas de hiptesis, se deben definir ciertos conceptos:
- Hiptesis Estadstica: Una hiptesis estadstica (HE) es una afirmacin acerca del valor de
los parmetros de la distribucin de una poblacin si dicha distribucin se conoce o sobre
el tipo de distribucin si sta es desconocida. Si la hiptesis caracteriza completamente la
distribucin, se le llama hiptesis simple, de lo contrario decimos que es una hiptesis
compuesta.
- Prueba estadstica (de H0 contra H1): Una prueba para confrontar una hiptesis estadstica
H0 contra una hiptesis estadstica H1 (dichas hiptesis deben ser excluyentes) es una regla
que permite tomar la decisin de aceptar o rechazar la hiptesis H0 (y consecuentemente
rechazar o aceptar H1), segn los valores obtenidos en la muestra aleatoria y de acuerdo
con cierto porcentaje admisible de error.
Se debe tener en cuenta que, al momento de plantear las hiptesis estadsticas, dichas
pruebas pueden ser a 1 o 2 colas. En otras palabras, la regin de aceptacin y de rechazo
de las pruebas puede ser una o dos, dependiendo del planteamiento de la Hiptesis
alterna.
: =
}
:
: =
}
: >
14 [ POLITCNICO GRANCOLOMBIANO]
3. Pruebas de cola inferior (1 Cola) basadas en un estimador apropiado del parmetro.
: =
}
: <
Nota: Se debe tener en cuenta que, segn la presentacin de las alternativas anteriores, las
Hiptesis Nulas (Ho) en cualquier caso siempre se presentan en Igualdad.
- Regin crtica (C): La regin crtica (C) asociada a la prueba de una hiptesis estadstica es
el conjunto de todos los posibles resultados de la muestra aleatoria para los cuales la
hiptesis nula es rechazada, de acuerdo con la prueba aplicada.
Al igual que en los intervalos de confianza, el objetivo de la prueba de hiptesis para una sola
media busca contrastar si el parmetro poblacional () es igual a un valor especfico de una
muestra aleatoria, denotado anteriormente como , con un nivel de confianza 1-.
Teniendo en cuenta que los estadsticos utilizados en los intervalos de confianza para una
media se distribuan Normal o t de Student, bajo la afirmacin del conocimiento de la varianza
poblacional ( 2 ), los estadsticos de prueba de las pruebas de hiptesis tendrn el mismo
comportamiento.
[ SIMULACIN GERENCIAL] 15
X 0
Zp n
Bajo la Hiptesis nula (Ho), dicho estadstico se distribuye Normal Estndar N(0,1). El rechazo
de Ho a un nivel de significancia resulta cuando el estadstico de prueba Zp excede a /2 o
es menor a /2 siempre y cuando la prueba sea de dos colas. Si la prueba es de una cola se
rechazar Ho a un nivel de significancia cuando el estadstico de prueba Zp excede a o es
menor a , siempre y cuando la prueba sea de cola superior o inferior, respectivamente.
X 0
tp n
S
Bajo la Hiptesis nula (Ho), dicho estadstico se distribuye t de Student con n-1 grados de
libertad t(n-1). Nuevamente, el rechazo de Ho a un nivel de significancia resulta cuando el
estadstico de prueba tp excede a /2,1 o es menor a /2,1 siempre y cuando la prueba
sea de dos colas. Si la prueba es de una cola se rechazar Ho a un nivel de significancia cuando
el estadstico de prueba tp excede a ,1 o es menor a ,1 , siempre y cuando la prueba
sea de cola superior o inferior, respectivamente.
Ejemplo: En cierto estudio sobre la duracin de las llamadas en un centro de quejas y reclamos,
se recolect una muestra aleatoria de 100 llamadas. Dicha muestra aleatoria mostr que, la
duracin promedio de una llamada es de 71,8 minutos con una desviacin estndar poblacional
de 8.9 minutos. Dicha informacin indicar que el tiempo promedio de duracin de las
llamadas es superior a 70 minutos? Indicar que el tiempo promedio de duracin de las
llamadas es diferente a 70 minutos? Valide dichas afirmaciones con un nivel de confianza del
95% (1 )
16 [ POLITCNICO GRANCOLOMBIANO]
1. Establezca las hiptesis Nula y Alterna.
Teniendo en cuenta que la afirmacin que se quiere validar es que la duracin promedio de las
llamadas sea mayor a 70 minutos, las hiptesis para esta prueba son:
: = 70
: > 70
Nota: La hiptesis nula siempre debe ir en igualad. La hiptesis alterna se plantea de acuerdo
con la afirmacin a verificar, que en este caso, hace referencia a que la duracin promedio de
las llamadas es mayor a 70 minutos.
Para este problema, se quiere validar la hiptesis con un nivel de confianza del 95%. Por lo
tanto, el nivel de significancia es = 5% o = 0,05
X 0 71 .8 70
Zp n Zp 100 Z p 2.02
8.9
Teniendo en cuenta que la Hiptesis alterna es de orientacin mayor (>), se puede establecer
que la prueba es a una cola, en este caso, a una cola superior. Por lo tanto, se debe encontrar
el valor crtico de la distribucin. En este caso, como el estadstico de prueba se distribuye
normal estndar, se debe encontrar el valor en la distribucin normal que acumula en la cola
superior el nivel de significancia del 5%. Grficamente, este anlisis ser:
[ SIMULACIN GERENCIAL] 17
Por lo tanto, buscando en la tabla de la distribucin Normal Estndar, el valor de la distribucin
que acumula el 95% de probabilidad es 1.645. En Excel, este valor se calcula por medio de la
siguiente funcin:
Teniendo en cuenta el resultado del valor crtico del numeral anterior, podemos establecer
que la regin de rechazo de Ho ser cualquier valor mayor a 1.645. Por lo tanto, teniendo en
cuenta que el valor del estadstico de prueba es 2.02, podemos ver que el estadstico se
encuentra en la zona de rechazo de Ho.
Teniendo en cuenta el resultado anterior, se establece que, con un nivel de confianza del 95%,
se rechaza la hiptesis nula. Esto quiere decir que, la duracin de las llamadas es superior a 70
minutos.
18 [ POLITCNICO GRANCOLOMBIANO]
1. Establezca las hiptesis Nula y Alterna.
Teniendo en cuenta que la afirmacin que se quiere validar es que la duracin promedio de las
llamadas es diferente a 70 minutos, las hiptesis para esta prueba son:
: = 70
: 70
Nota: La hiptesis nula siempre debe ir en igualad. La hiptesis alterna se plantea de acuerdo
con la afirmacin a verificar, que en este caso, hace referencia a que la duracin promedio de
las llamadas es diferente a 70 minutos.
Para este problema, se quiere validar la hiptesis con un nivel de confianza del 95%. Por lo
tanto, el nivel de significancia es = 5% o = 0,05
X 0 71 .8 70
Zp n Zp 100 Z p 2.02
8.9
Teniendo en cuenta que la Hiptesis alterna es de orientacin mayor (), se puede establecer
que la prueba es a dos colas. Por lo tanto, en este caso se deben encontrar los valores crticos
de la distribucin. En este caso, como el estadstico de prueba se distribuye normal estndar,
se debe encontrar el valor en la distribucin normal que acumula en la cola superior el nivel de
significancia del 2.5%, ya que el nivel de significancia se reparte equitativamente entre las dos
colas. Grficamente, este anlisis ser:
[ SIMULACIN GERENCIAL] 19
Por lo tanto, buscando en la tabla de la distribucin Normal Estndar, el valor de la distribucin
que acumula el 97.5% de probabilidad es 1.959 y el valor de la distribucin que acumula el 2.5%
de probabilidad es -1.959. En Excel, estos valores se calculan por medio de la siguiente funcin:
Teniendo en cuenta el resultado del valor crtico del numeral anterior, podemos establecer
que la regin de rechazo de Ho ser cualquier valor mayor a 1.959 y cualquier valor menor a -
1.959. Por lo tanto, teniendo en cuenta que el valor del estadstico de prueba es 2.02, podemos
ver que el estadstico se encuentra en la zona de rechazo de Ho.
Teniendo en cuenta el resultado anterior, se establece que, con un nivel de confianza del 95%,
se rechaza la hiptesis nula. Esto quiere decir que, la duracin de las llamadas es diferente a
70 minutos.
Al igual que en los intervalos de confianza, el objetivo de la prueba de hiptesis para dos
medias busca contrastar si la diferencia de los parmetros poblacionales (1 2 ) es igual a
un valor especfico de una muestra aleatoria, denotado como , con un nivel de confianza 1-
.
20 [ POLITCNICO GRANCOLOMBIANO]
Teniendo en cuenta que los estadsticos utilizados en los intervalos de confianza para la
diferencia de medias se distribuan Normal o t de Student, bajo la afirmacin del conocimiento
de las varianzas poblacionales ( 21 y 2 2 ), los estadsticos de prueba de las pruebas de
hiptesis tendrn el mismo comportamiento.
Por lo tanto, si las varianzas poblacionales son conocidas ( 21 y 2 2 ) y teniendo en cuenta que
el modelo se centra en un experimento con X1, X2,., Xn de dos muestras aleatorias de una
distribucin con media y varianza 2 el estadstico de prueba para la hiptesis de contraste
de una diferencia de medias (0 : 1 2 = 0 ), ser:
X1 X 2 d0
Zp
21 22
n1 n2
Bajo la Hiptesis nula (Ho), dicho estadstico se distribuye Normal Estndar N(0,1). El rechazo
de Ho a un nivel de significancia resulta cuando el estadstico de prueba Zp excede a /2 o
es menor a /2 siempre y cuando la prueba sea de dos colas. Si la prueba es de una cola se
rechazar Ho a un nivel de significancia cuando el estadstico de prueba Zp excede a o es
menor a , siempre y cuando la prueba sea de cola superior o inferior, respectivamente.
X1 X 2 d0
tp
1 1
Sp
n1 n2
S 21 n1 1 S 2 2 n2 1
Sp
n1 n2 2
Bajo la Hiptesis nula (Ho), dicho estadstico se distribuye t de Student con n1+n2-2 grados de
libertad t(n1+n2-2). Nuevamente, el rechazo de Ho a un nivel de significancia resulta cuando
el estadstico de prueba tp excede a /2,n1+n22 o es menor a /2,n1+n22 siempre y cuando
la prueba sea de dos colas. Si la prueba es de una cola se rechazar Ho a un nivel de significancia
cuando el estadstico de prueba tp excede a ,n1+n22 o es menor a ,n1+n22 , siempre y
cuando la prueba sea de cola superior o inferior, respectivamente.
[ SIMULACIN GERENCIAL] 21