Cartilla - SEMANA 5 MODELOS ESTADISTICSO 2 PDF

SIMULACIÓN
GERENCIAL
Modelos estadísticos en Simulación 2
 MODELOS ESTADÍSTICOS EN SIMULACIÓN 2
1. Índice
1. Distribuciones de Probabilidad Continuas
1.1. Distribución Exponencial
1.2. Distribución Uniforme Continua
1.3. Distribución Normal
1.4. Distribución Triangular.
2. Estimación Puntual
3. Estimación por Intervalos de Confianza
3.1. Intervalos de Confianza Para una sola Muestra: Estimación de la Media
3.2. Intervalos de Confianza Para dos Muestras: Estimación de la diferencia entre dos
Medias
4. Pruebas de Hipótesis
4.1. Pruebas Para una sola Media
4.2. Pruebas Para dos Medias
2. Introducción
El propósito del presente documento es presentar a los estudiantes los conceptos básicos de
estadística necesarios para desarrollar una simulación de Montecarlo. La estadística será una
herramienta esencial para el soporte de la construcción de modelo, tanto al inicio como al final
para realizar el análisis de resultados.
Por otra parte, teniendo en cuenta que el objetivo general del módulo es que los estudiantes
desarrollen las capacidades necesarias para llevar a cabo un estudio completo de simulación,
en esta unidad, se hará un repaso de las principales funciones de probabilidad continuas que
se emplean frecuentemente en la construcción de estos tipos de modelo.
Adicionalmente, se presentarán dos de los conceptos de la estadística inferencial más

utilizados en la Simulación. Los Intervalos de Confianza y las Pruebas de Hipótesis.
Finalmente, se presentará al estudiante una serie de ejercicios relacionados para reforzar los
conocimientos adquiridos en el desarrollo del módulo.
3. Objetivo general
Al finalizar el módulo los estudiantes sabrán cuáles son los conceptos básicos de estadística
relacionados con la simulación de Montecarlo, así como las principales funciones de
probabilidad continuas aplicadas en la construcción de este tipo de modelos y la aplicación de
técnicas de estimación por intervalo y pruebas de hipótesis.
2 [ POLITÉCNICO GRANCOLOMBIANO]
Al finalizar la primera semana de aprendizaje el estudiante estará en capacidad de:
1. Identificará los conceptos fundamentales de los modelos estadísticos aplicados a

simulación
2. Reconocerá las distintas funciones de probabilidad continuas utilizadas en simulación
de Montecarlo
3. Reconocerá los estimadores por intervalo
4. Reconocerá las pruebas de hipótesis.
4. Desarrollo temático.
4.1 Recomendaciones académicas.

Se recomienda al estudiante realizar la lectura de la cartilla, en la cual se encuentra toda la
información relevante que se verá en la semana. Adicional a la lectura de la cartilla es necesario
que revise las teleconferencias así como las video-diapositivas, pues estas son un medio que
puede aclarar las dudas generadas con la lectura o también dar soporte a los temas expuestos
en la misma.
Finalmente, se recomienda al estudiante realizar los ejercicios planteados y sugeridos por el

tutor ya que estos a pesar de no tener un valor porcentual en la nota sí harán que su formación
sea completa y pueda ser reforzada de forma práctica.
4.2 Desarrollo de cada una de las unidades temáticas.
1. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS
A continuación se presentarán las distribuciones de probabilidad continuas más empleadas en

el modelaje de sistemas a través de la simulación de eventos discretos, aunque existen otro
tipo de distribuciones que también pueden emplearse, aquí solo presentaremos las más
relevantes.
1.1 Distribución Exponencial

Considérese un Proceso de Poisson de parámetro λ observado a partir de un instante t0, y
defínase la VA continua XE como:
XE = tiempo que transcurre entre el instante t0 y la próxima llegada del proceso
La función de distribución acumulada, F(X) de la VA XE estará dada por:
𝐹𝑥𝑔 (𝑡; 𝜆) = 𝑃(𝑋𝑔 ≤ 𝑡) = 1 − 𝑃(𝑋𝑔 > 𝑡)

𝐹𝑥𝑔 (𝑡; 𝜆) = 𝑃(𝑋𝑔 ≤ 𝑡) = 1 − 𝑃(ℎ𝑎𝑦𝑎 0 𝑙𝑙𝑒𝑔𝑎𝑑𝑎𝑠 𝑒𝑛 𝑒𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑡)
[ SIMULACIÓN GERENCIAL] 3
(𝜆𝑡)0 −𝜆𝑡
𝐹𝑥𝑔 (𝑡; 𝜆) = 𝑃(𝑋𝑔 ≤ 𝑡) = 1 − 𝑒
0!
𝐹𝑥𝑔 (𝑡; 𝜆) = 𝑃(𝑋𝑔 ≤ 𝑡) = 1 − 𝑒 −𝜆𝑡
Por lo tanto, la función de distribución acumulada de la VA exponencial se expresa como:

𝐹𝑥𝑔 (𝑡; 𝜆) = 𝑃(𝑋𝑔 ≤ 𝑡) = 1 − 𝑒 −𝜆𝑡 𝑡 > 0
Se sabe que la función de distribución de probabilidad de una VA continua se obtiene

calculando la derivada de la función de distribución acumulada. Por lo tanto, dicha función,
fXE(t; λ) se expresa como:
𝑓𝑥𝑔 (𝑡; 𝜆) = 𝜆𝑒 −𝜆𝑡 𝑡 > 0
Su media y varianza están dadas por:

1
𝐸(𝑋) =
𝜆
1
𝑉𝑎𝑟 𝑋 = 2
𝜆
Ejemplo:
Suponga que la vida útil de una lámpara industrial, en miles de horas, se distribuye
exponencialmente con tasa de falla λ=1/3 (una falla cada 3000 horas, en promedio).
La probabilidad de que la lámpara dure más de esta vida útil está dada por:
𝑃(𝑋 > 3) = 1 − 𝑃(𝑋 ≤ 3)
En Excel, se busca la función DISTR.EXP, con parámetros: X=3; λ=1/3; Acumulado = 1. El

resultado de esta función sería de 0,632; luego la probabilidad de que la lámpara dure más que
la vida útil diseñada es de 1-0,632 = 0,368.
1.2 Distribución Uniforme
Una VA X se distribuye uniformemente en el intervalo (a, b) si su función de distribución de

probabilidad está dada por:
1
𝑓(𝑋) = {𝑏 − 𝑎 , 𝑎≤𝑋≤𝑏
0, 𝑑. 𝑙. 𝑐.
La función de distribución acumulada está dada por:
0 𝑥<𝑎
𝑥−𝑎
F(X) = {𝑏−𝑎 𝑎≤𝑥<𝑏
1 𝑥≥𝑏
Su media y varianza, están dadas respectivamente por:
𝑎+𝑏
𝐸(𝑋) =
2
(𝑏 − 𝑎)2
𝑉𝑎𝑟 𝑋 =
12
La distribución uniforme juega un papel importante en simulación. Los números aleatorios,
distribuidos uniformemente entre 0 y 1, proveen los medios básicos para generar eventos
aleatorios. Estos números aleatorios se usan para generar muestras de variables aleatorias de
otras distribuciones de probabilidad.
1.3 Distribución Normal
Considérese la VA binomial XB, definida por el lanzamiento de una moneda 15 veces. Si se

grafica la probabilidad de obtener 0,1,2,…,15 caras, se obtiene la siguiente gráfica
Se puede demostrar, en efecto, que si se realizan N experimentos independientes de Bernoulli

de parámetro p, para un valor de N suficientemente grande, se obtiene:
La aproximación anterior dio lugar a la definición de una VA continua conocida como la

distribución Normal de parámetros µ y σ, cuya función de probabilidad está dada por:
Esta expresión no se puede evaluar mediante métodos numéricos tradicionales; de hecho

estos métodos se podrían aplicar pero la integral debería evaluarse para cada par (µ, σ). Sin
embargo, una transformación de variables, z = (x- µ)/ σ, permite la evaluación de esa integral,
independiente de dichos valores.
Si 𝑋~𝑁(𝜇, 𝜎), 𝑠𝑒𝑎 𝑍 = (𝑋 − 𝜇)/𝜎, para obtener:
 x 
F ( x )  P  X  x   P Z  
  
( x ) /  1 z2 / 2 z 1 t 2 / 2
 e dz donde ( z )   e dt

2

2
( x ) / 
  ( z )dz   ( x  )

La función Φ(z) es la función de distribución de probabilidad de una VA normal con media cero
y varianza 1. A esta distribución se le conoce como la distribución normal estándar, y ha sido
tabulada en distintos formatos para una mejor comprensión y resolución de situaciones que
involucren VA normales.
Dentro de los recursos adicionales encontrará la tabla donde se resumen los valores que toma
la distribución normal estándar.
Ejemplo:
El tiempo requerido en horas para cargar un container se distribuye normalmente con media
= 12 y varianza = 4. La probabilidad de que el container se cargue en menos de 10 horas, estaría
dada por
 10  12 
F (10 )      (1)  0.1587
 2 
1.4 Distribución Triangular
Una VA X se distribuye de forma Triangular en el intervalo (a, c, b) si su función de distribución

de probabilidad está dada por:
 2( x  a)
 (b  a)(c  a ) a  x  c

 2(b  x)
f ( x)   c xb
 (b  a)(b  c)
0 dlc


El nombre de esta distribución viene dado por la forma de su función de densidad, cuyo
comportamiento gráfico está dado por:
La función de distribución acumulada está dada por:
 ( x  a) 2
 axc
 (b  a )(c  a )
 (b  x) 2
F ( x)  1  c xb
 (b  a )(b  c)
1 xb


Su media y varianza, están dadas respectivamente por:
abc
E ( x) 
3
a 2  b 2  c 2  ab  ac  bc
V ( x) 
18
La distribución triangular juega un papel fundamental en simulación. Esta distribución

proporciona una aproximación cuando hay poca información disponible, de forma que sólo se
necesita conocer el mínimo (valor pesimista (a)), el máximo (valor optimista (b)) y la moda
(valor más probable (c)). Estos tres valores son los parámetros que caracterizan a la
distribución.
Un ejemplo del uso de esta distribución se encuentra en el análisis del riesgo, donde la
distribución más apropiada es la beta pero dada su complejidad, tanto en la su comprensión
como en la estimación de sus parámetros, se utiliza la distribución triangular como
aproximación.
2. ESTIMACIÓN PUNTUAL
Un estimador es un estadístico aleatorio, es decir, una función de una muestra aleatoria de

algunos datos observados. Un valor cualquiera del estimador se le conoce como un estimado.
Cabe aclarar que un estimador es una variable aleatoria, mientras que un estimado es uno de
sus resultados. Los buenos estimadores son insesgados, lo que quiere decir que en la medida
que el tamaño de muestra tiende a infinito, las esperanzas de dichos estimadores convergen
hacia el valor real del parámetro.
Comúnmente, los momentos y las estadísticas relacionadas se calculan a partir de datos

muestrales utilizando estimadores. Consideremos una muestra finita Y = {Y1, Y2, …, YN},
donde las observaciones aleatorias {j = 1, …, N} tienen una distribución común con media µ y
varianza σ2. Un estimador insesgado para la media, µ, basado en la muestra Y, es la media
muestral
N
1
̅ = ∑ Yi
Y
N
i=1
Un estimador insesgado para la varianza, σ2, basado en la muestra Y, es la varianza muestral
N
1
2
S = ̅|2 ,
∑|Yi − Y
N−1
i=1
Donde la desviación estándar muestral, S, es simplemente la raíz cuadrada de S2.
Cabe anotar que estos estimadores son puntuales, lo que quiere decir que proveen un
estimado escalar de algún parámetro desconocido.
3. ESTIMACIÓN POR INTERVALOS DE CONFIANZA
Es muy poco probable que, incluso el estimador Insesgado más eficiente estime con exactitud
el parámetro poblacional. A pesar que, dicha precisión aumenta con muestras grandes, no
existe ninguna razón por la cual deberíamos considerar que el estimador puntual de una
muestra aleatoria sea exactamente igual al parámetro poblacional que se está estimando. Por
lo tanto, sería más conveniente pensar que se debería estimar un Intervalo, es decir, un límite
inferior y un límite superior en el cual, se esperaría encontrar el valor del parámetro. Este
intervalo se le conoce como estimación por intervalo.
La estimación por intervalo de un parámetro poblacional (Denotado por φ), es un intervalo de

la forma φ ̂𝑖𝑛𝑓 < φ < φ̂,
𝑠𝑢𝑝 donde φ ̂𝑖𝑛𝑓 y φ
̂𝑠𝑢𝑝 dependen del valor del estimador φ ̂ para una
muestra y de su distribución de muestreo. Como muestras distintas, darán como resultado
diferentes valores de φ̂𝑖𝑛𝑓 y φ
̂,
𝑠𝑢𝑝 dichos valores serán aleatorios. Por lo tanto, si queremos
realizar dicha estimación con algún grado de certeza, deberíamos realizar la estimación de la
forma:
𝑃(φ
̂𝑖𝑛𝑓 < φ < φ
̂)
sup = 1−∝
Donde ∝ es algún valor entre 0 y 1. Esto, en palabras significa que tenemos una probabilidad
1-∝ de seleccionar una Variable (Aleatoria) que contenga el parámetroφ. Por lo tanto, el
intervalo de la forma φ ̂𝑖𝑛𝑓 < φ < φ̂ 𝑠𝑢𝑝 calculado a partir de la muestra aleatoria se le
denomina Intervalo de Confianza, el Porcentaje 1−∝ se le denomina Nivel de Confianza y los
valores φ
̂𝑖𝑛𝑓 y φ
̂𝑠𝑢𝑝 se denominan límites Inferior y Superior del Intervalo, respectivamente.
3.1 Intervalos de confianza para una sola muestra: Estimación de la Media
Cuando se realiza la estimación por intervalo para la media, debemos recordar que, de acuerdo
al Teorema del Limite Central, la distribución muestral de 𝑋̅ será aproximadamente:
𝜎2
𝑋̅~𝑁 (𝜇; )
𝑛
Siempre y cuando el tamaño de la muestra sea grande. Por lo tanto, la forma límite de la
distribución de :
X 
Z
 n
Cuando n   es la distribución Normal estándar n (z; 0, 1).
Adicionalmente, otro de los elementos a tener en cuenta es el conocimiento de la varianza

poblacional 𝜎 2 . En este caso, si conocemos la varianza poblacional, el intervalo de confianza
de 1−∝ de una muestra aleatoria de tamaño n para el parámetro poblacional µ estimado por
𝑋̅ será:
   
P X  Z  / 2    X  Z / 2   1  
 n n
Es claro que los límites Inferior y Superior del Intervalo son:

LI  X  Z  / 2
n

LS  X  Z / 2
n
En el caso de no conocer la varianza poblacional 𝜎 2 , debemos estimarla por medio de la

varianza muestral 𝑆 2 . Si la muestra aleatoria proviene de una distribución normal, la
distribución de:
X 
T
S n
Es la distribución t de Student t(n-1). Se debe tener en cuenta que S es la desviación estándar

de la muestra y (n-1) corresponde a los grados de libertad de la distribución t.
En este caso, si no conocemos la varianza poblacional, el intervalo de confianza de 1−∝ de

una muestra aleatoria de tamaño n para el parámetro poblacional µ estimado por 𝑋̅ será:
 S S 
P X  t v / 2    X  t v , / 2   1  
 n n
Donde 𝑡𝛼/2 es el valor de 𝑡 con v=n-1 grados de libertad.
Es claro que los límites Inferior y Superior del Intervalo son:
S
LI  X  t / 2
n
S
LS  X  t / 2
n
Donde
t es el valor t que tiene un área α a la derecha.
3.2. Intervalos de Confianza Para dos Muestras: Estimación de la diferencia entre dos
Medias
Muchas veces, en el análisis de los modelos de simulación de Montecarlo nos interesará
realizar un análisis sobre dos poblaciones, con medias 𝜇1 y 𝜇2 y varianzas 𝜎1 y 𝜎2
respectivamente. Un estimador puntual de la diferencia 𝜇1 − 𝜇2 está dado por el estadístico
𝑋̅1 − 𝑋̅2 . Teniendo en cuenta esto, para realizar una estimación puntual sobre la diferencia de
dos medias (𝜇1 − 𝜇2 ), se deberá seleccionar 2 muestras aleatorias independientes, de tamaño
n1 y n2 respectivamente. Al calcular la diferencia de los promedios 𝑋̅1 − 𝑋̅2 , debemos
considerar la distribución muestral de dicho estadístico.
Como se analizó en el numeral anterior, debemos realizar previamente un análisis y determinar

si se conocen las varianzas poblacionales. Si 𝑋̅1 𝑦 𝑋̅2 son las medias de dos muestras aleatorias
independientes de tamaño n1 y n2 respectivamente, de poblaciones con varianzas conocidas
(𝜎1 y 𝜎2 ), el intervalo de confianza de 1−∝ para la diferencia 𝜇1 − 𝜇2 es:
  21  2 2  21  2 2 
P X 1  X 2   Z  / 2
   1   2  X 1  X 2   Z  / 2   1
 n1 n2 n1 n2 

Por el contrario, si 𝑋̅1 𝑦 𝑋̅2 son las medias de dos muestras aleatorias independientes de
tamaño n1 y n2 respectivamente, de poblaciones aproximadamente normales con varianzas
desconocidas (𝜎1 y 𝜎2 ) pero iguales, el intervalo de confianza de 1−∝ para la diferencia 𝜇1 −
𝜇2 es:
 1 
P X 1  X 2   t / 2 S p  1   2   X 1  X 2   t  / 2 S p
1 1 1
n

n n

n   1
 1 2 1 2 
Donde t / 2 es el valor de la distribución t con un nivel de significancia de 𝛼/2 con v=n1+n2-2

grados de libertad y Sp es la estimación de la unión de la desviación estándar poblacional. Dicha
estimación se calcula por medio de:
n1  1S 21  n2  1S 2 2

Sp 
n1  n2  2
Se debe tener en cuenta que S 21 y S 2 2 son las varianzas muestrales de las muestras n1 y n2
respectivamente.
4. PRUEBAS DE HIPÓTESIS
Las pruebas de hipótesis constituyen uno de los elementos más importantes de la Simulación
de Montecarlo y en la estadística inferencial, ya que representan la formalización de los
intervalos de confianza y su principal objetivo es generar un procedimiento de decisión basado
en un postulado o conjeturas y muestras aleatorias que permitan concluir sobre algún sistema
bajo estudio con un nivel de confianza 1 − 𝛼.
Para entender la estructura de las pruebas de hipótesis, se deben definir ciertos conceptos:
- Hipótesis Estadística: Una hipótesis estadística (HE) es una afirmación acerca del valor de
los parámetros de la distribución de una población si dicha distribución se conoce o sobre
el tipo de distribución si ésta es desconocida. Si la hipótesis caracteriza completamente la
distribución, se le llama hipótesis simple, de lo contrario decimos que es una hipótesis
compuesta.
- Prueba estadística (de H0 contra H1): Una prueba para confrontar una hipótesis estadística
H0 contra una hipótesis estadística H1 (dichas hipótesis deben ser excluyentes) es una regla
que permite tomar la decisión de aceptar o rechazar la hipótesis H0 (y consecuentemente
rechazar o aceptar H1), según los valores obtenidos en la muestra aleatoria y de acuerdo
con cierto porcentaje admisible de error.
- Hipótesis nula e hipótesis alterna: En pruebas de hipótesis estadísticas, se acostumbra a

llamar hipótesis nula (H0) a aquella que se asume hasta el momento como verdadera, e
hipótesis alterna (H1) a aquella que se presenta como “nueva alternativa” a la hipótesis H0
que hasta el momento aparecía como verdadera.
Se debe tener en cuenta que, al momento de plantear las hipótesis estadísticas, dichas
pruebas pueden ser a 1 o 2 colas. En otras palabras, la región de aceptación y de rechazo
de las pruebas puede ser una o dos, dependiendo del planteamiento de la Hipótesis
alterna.
Dichas alternativas son:
1. Pruebas de 2 colas basadas en un estimador apropiado del parámetro.
𝐻𝑜: 𝜃 = 𝜃𝑜
}
𝐻𝑎: 𝜃 ≠ 𝜃𝑜
2. Pruebas de cola superior (1 Cola) basadas en un estimador apropiado del parámetro.
}
𝐻𝑎: 𝜃 > 𝜃𝑜
3. Pruebas de cola inferior (1 Cola) basadas en un estimador apropiado del parámetro.
}
𝐻𝑎: 𝜃 < 𝜃𝑜
Nota: Se debe tener en cuenta que, según la presentación de las alternativas anteriores, las
Hipótesis Nulas (Ho) en cualquier caso siempre se presentan en Igualdad.
- Región crítica (C): La región crítica (C) asociada a la prueba de una hipótesis estadística es
el conjunto de todos los posibles resultados de la muestra aleatoria para los cuales la
hipótesis nula es rechazada, de acuerdo con la prueba aplicada.
El Procedimiento general para realizar las pruebas de hipótesis es:
1. Establezca las hipótesis Nula y Alterna.

2. Defina el nivel de significancia de la prueba (𝛼).
3. Seleccione un estadístico de prueba adecuado.
4. Establezca la región crítica con base en (𝛼).
5. A partir del estadístico de prueba calculado, rechace Ho si el estadístico de prueba está
en la región crítica. De lo contrario, no rechace Ho.
6. Genere sus conclusiones.
4.1. Pruebas para una sola Media
Al igual que en los intervalos de confianza, el objetivo de la prueba de hipótesis para una sola
media busca contrastar si el parámetro poblacional (𝜇) es igual a un valor específico de una
muestra aleatoria, denotado anteriormente como 𝜃𝑜, con un nivel de confianza 1-∝.
Teniendo en cuenta que los estadísticos utilizados en los intervalos de confianza para una
media se distribuían Normal o t de Student, bajo la afirmación del conocimiento de la varianza
poblacional (𝜎 2 ), los estadísticos de prueba de las pruebas de hipótesis tendrán el mismo
comportamiento.
Por lo tanto, si la varianza poblacional es conocida (𝜎 2 ) y teniendo en cuenta que el modelo se

centra en un experimento con X1, X2,…., Xn de una muestra aleatoria de una distribución con
media 𝜇 y varianza 𝜎 2 el estadístico de prueba para la hipótesis de contraste de una media
será:
X  0
Zp  n

Bajo la Hipótesis nula (Ho), dicho estadístico se distribuye Normal Estándar – N(0,1). El rechazo
de Ho a un nivel de significancia 𝛼 resulta cuando el estadístico de prueba Zp excede a 𝑍𝛼/2 o
es menor a −𝑍𝛼/2 siempre y cuando la prueba sea de dos colas. Si la prueba es de una cola se
rechazará Ho a un nivel de significancia 𝛼 cuando el estadístico de prueba Zp excede a 𝑍𝛼 o es
menor a −𝑍𝛼 , siempre y cuando la prueba sea de cola superior o inferior, respectivamente.
Por otro lado, si la varianza poblacional es desconocida (𝜎 2 ) el estadístico de prueba para la

hipótesis de contraste de una media será:
X  0
tp  n
S
Bajo la Hipótesis nula (Ho), dicho estadístico se distribuye t de Student con n-1 grados de
libertad – t(n-1). Nuevamente, el rechazo de Ho a un nivel de significancia 𝛼 resulta cuando el
estadístico de prueba tp excede a 𝑡𝛼/2,𝑛−1 o es menor a −𝑡𝛼/2,𝑛−1 siempre y cuando la prueba
sea de dos colas. Si la prueba es de una cola se rechazará Ho a un nivel de significancia 𝛼 cuando
el estadístico de prueba tp excede a 𝑡𝛼,𝑛−1 o es menor a −𝑡𝛼,𝑛−1 , siempre y cuando la prueba
sea de cola superior o inferior, respectivamente.
Ejemplo: En cierto estudio sobre la duración de las llamadas en un centro de quejas y reclamos,
se recolectó una muestra aleatoria de 100 llamadas. Dicha muestra aleatoria mostró que, la
duración promedio de una llamada es de 71,8 minutos con una desviación estándar poblacional
de 8.9 minutos. ¿Dicha información indicará que el tiempo promedio de duración de las
llamadas es superior a 70 minutos? ¿Indicará que el tiempo promedio de duración de las
llamadas es diferente a 70 minutos? Valide dichas afirmaciones con un nivel de confianza del
95% (1 − 𝛼)
Solución: Para solucionar el problema anterior, se construirán dos pruebas de hipótesis. La

primera con el objetivo de validar si la duración de las llamadas es superior a 70 minutos y la
siguiente con el objetivo de validar si la duración de las llamadas es diferente a 70 minutos.
Adicionalmente, se utilizará el procedimiento presentado anteriormente para la construcción

de las pruebas de hipótesis:
Prueba 1: Validar si la duración de las llamadas es superior a 70 minutos
Utilizando el procedimiento para la construcción de las pruebas de hipótesis, los resultados

son:
Teniendo en cuenta que la afirmación que se quiere validar es que la duración promedio de las
llamadas sea mayor a 70 minutos, las hipótesis para esta prueba son:
𝐻𝑜: 𝜃 = 70
𝐻𝑎: 𝜃 > 70
Nota: La hipótesis nula siempre debe ir en igualad. La hipótesis alterna se plantea de acuerdo
con la afirmación a verificar, que en este caso, hace referencia a que la duración promedio de
las llamadas es mayor a 70 minutos.
Para este problema, se quiere validar la hipótesis con un nivel de confianza del 95%. Por lo
tanto, el nivel de significancia es 𝛼 = 5% o 𝛼 = 0,05
Para seleccionar el estadístico de prueba adecuado, se debe analizar la información disponible

en el problema. En este caso, en la información inicial tenemos la varianza poblacional 𝜎 = 8.9
o 𝜎 2 = (8.9)2 . Teniendo en cuenta esto, usamos como estadístico de prueba:
X  0 71 .8  70
Zp  n  Zp  100  Z p  2.02
 8.9
Teniendo en cuenta que la Hipótesis alterna es de orientación mayor (>), se puede establecer
que la prueba es a una cola, en este caso, a una cola superior. Por lo tanto, se debe encontrar
el valor crítico de la distribución. En este caso, como el estadístico de prueba se distribuye
normal estándar, se debe encontrar el valor en la distribución normal que acumula en la cola
superior el nivel de significancia del 5%. Gráficamente, este análisis será:
Por lo tanto, buscando en la tabla de la distribución Normal Estándar, el valor de la distribución
que acumula el 95% de probabilidad es 1.645. En Excel, este valor se calcula por medio de la
siguiente función:
5. A partir del estadístico de prueba calculado, rechace Ho si el estadístico de prueba está en

la región crítica. De lo contrario, no rechace Ho.
Teniendo en cuenta el resultado del valor crítico del numeral anterior, podemos establecer
que la región de rechazo de Ho será cualquier valor mayor a 1.645. Por lo tanto, teniendo en
cuenta que el valor del estadístico de prueba es 2.02, podemos ver que el estadístico se
encuentra en la zona de rechazo de Ho.
Teniendo en cuenta el resultado anterior, se establece que, con un nivel de confianza del 95%,
se rechaza la hipótesis nula. Esto quiere decir que, la duración de las llamadas es superior a 70
minutos.
Prueba 2: Validar si la duración de las llamadas es diferente a 70 minutos.
Utilizando el procedimiento para la construcción de las pruebas de hipótesis, los resultados

son:
Teniendo en cuenta que la afirmación que se quiere validar es que la duración promedio de las
llamadas es diferente a 70 minutos, las hipótesis para esta prueba son:
𝐻𝑜: 𝜃 = 70
𝐻𝑎: 𝜃 ≠ 70
Nota: La hipótesis nula siempre debe ir en igualad. La hipótesis alterna se plantea de acuerdo
con la afirmación a verificar, que en este caso, hace referencia a que la duración promedio de
las llamadas es diferente a 70 minutos.
Para este problema, se quiere validar la hipótesis con un nivel de confianza del 95%. Por lo
tanto, el nivel de significancia es 𝛼 = 5% o 𝛼 = 0,05
Para seleccionar el estadístico de prueba adecuado, se debe analizar la información disponible

en el problema. En este caso, en la información inicial tenemos la varianza poblacional 𝜎 = 8.9
o 𝜎 2 = (8.9)2 . Teniendo en cuenta esto, usamos como estadístico de prueba:
X  0 71 .8  70
Zp  n  Zp  100  Z p  2.02
 8.9
Teniendo en cuenta que la Hipótesis alterna es de orientación mayor (≠), se puede establecer
que la prueba es a dos colas. Por lo tanto, en este caso se deben encontrar los valores críticos
de la distribución. En este caso, como el estadístico de prueba se distribuye normal estándar,
se debe encontrar el valor en la distribución normal que acumula en la cola superior el nivel de
significancia del 2.5%, ya que el nivel de significancia se reparte equitativamente entre las dos
colas. Gráficamente, este análisis será:
Por lo tanto, buscando en la tabla de la distribución Normal Estándar, el valor de la distribución
que acumula el 97.5% de probabilidad es 1.959 y el valor de la distribución que acumula el 2.5%
de probabilidad es -1.959. En Excel, estos valores se calculan por medio de la siguiente función:
5. A partir del estadístico de prueba calculado, rechace Ho si el estadístico de prueba está en

la región crítica. De lo contrario, no rechace Ho.
Teniendo en cuenta el resultado del valor crítico del numeral anterior, podemos establecer
que la región de rechazo de Ho será cualquier valor mayor a 1.959 y cualquier valor menor a -
1.959. Por lo tanto, teniendo en cuenta que el valor del estadístico de prueba es 2.02, podemos
ver que el estadístico se encuentra en la zona de rechazo de Ho.
Teniendo en cuenta el resultado anterior, se establece que, con un nivel de confianza del 95%,
se rechaza la hipótesis nula. Esto quiere decir que, la duración de las llamadas es diferente a
70 minutos.
4.2 Pruebas para dos Medias
Al igual que en los intervalos de confianza, el objetivo de la prueba de hipótesis para dos
medias busca contrastar si la diferencia de los parámetros poblacionales (𝜇1 − 𝜇2 ) es igual a
un valor específico de una muestra aleatoria, denotado como 𝑑𝑜, con un nivel de confianza 1-
∝.
Teniendo en cuenta que los estadísticos utilizados en los intervalos de confianza para la
diferencia de medias se distribuían Normal o t de Student, bajo la afirmación del conocimiento
de las varianzas poblacionales ( 𝜎 21 y 𝜎 2 2 ), los estadísticos de prueba de las pruebas de
hipótesis tendrán el mismo comportamiento.
Por lo tanto, si las varianzas poblacionales son conocidas (𝜎 21 y 𝜎 2 2 ) y teniendo en cuenta que
el modelo se centra en un experimento con X1, X2,…., Xn de dos muestras aleatorias de una
distribución con media 𝜇 y varianza 𝜎 2 el estadístico de prueba para la hipótesis de contraste
de una diferencia de medias (𝐻0 : 𝜇1 − 𝜇2 = 𝑑0 ), será:
X1  X 2  d0
Zp 
 21  22

n1 n2
Bajo la Hipótesis nula (Ho), dicho estadístico se distribuye Normal Estándar – N(0,1). El rechazo
de Ho a un nivel de significancia 𝛼 resulta cuando el estadístico de prueba Zp excede a 𝑍𝛼/2 o
es menor a −𝑍𝛼/2 siempre y cuando la prueba sea de dos colas. Si la prueba es de una cola se
rechazará Ho a un nivel de significancia 𝛼 cuando el estadístico de prueba Zp excede a 𝑍𝛼 o es
menor a −𝑍𝛼 , siempre y cuando la prueba sea de cola superior o inferior, respectivamente.
Por otro lado, si las varianzas poblacionales son desconocidas (𝜎 21 y 𝜎 2 2 ), el estadístico de

prueba para la hipótesis de contraste de una diferencia de medias (𝐻0 : 𝜇1 − 𝜇2 = 𝑑0 ), será:
X1  X 2  d0
tp 
1 1
Sp 
n1 n2
Donde, Sp se calcula por medio de:
S 21 n1  1  S 2 2 n2  1
Sp 
n1  n2  2
Bajo la Hipótesis nula (Ho), dicho estadístico se distribuye t de Student con n1+n2-2 grados de
libertad – t(n1+n2-2). Nuevamente, el rechazo de Ho a un nivel de significancia 𝛼 resulta cuando
el estadístico de prueba tp excede a 𝑡𝛼/2,n1+n2−2 o es menor a −𝑡𝛼/2,n1+n2−2 siempre y cuando
la prueba sea de dos colas. Si la prueba es de una cola se rechazará Ho a un nivel de significancia
𝛼 cuando el estadístico de prueba tp excede a 𝑡𝛼,n1+n2−2 o es menor a −𝑡𝛼,n1+n2−2 , siempre y
cuando la prueba sea de cola superior o inferior, respectivamente.

Cartilla - SEMANA 5 MODELOS ESTADISTICSO 2 PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Cartilla - SEMANA 5 MODELOS ESTADISTICSO 2 PDF

Cargado por

Copyright:

Formatos disponibles

SIMULACIÓN

Adicionalmente, se presentarán dos de los conceptos de la estadística inferencial más

1. Identificará los conceptos fundamentales de los modelos estadísticos aplicados a

4.1 Recomendaciones académicas.

Finalmente, se recomienda al estudiante realizar los ejercicios planteados y sugeridos por el

4.2 Desarrollo de cada una de las unidades temáticas.

1. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS

A continuación se presentarán las distribuciones de probabilidad continuas más empleadas en

1.1 Distribución Exponencial

XE = tiempo que transcurre entre el instante t0 y la próxima llegada del proceso

La función de distribución acumulada, F(X) de la VA XE estará dada por:

𝐹𝑥𝑔 (𝑡; 𝜆) = 𝑃(𝑋𝑔 ≤ 𝑡) = 1 − 𝑃(𝑋𝑔 > 𝑡)

Por lo tanto, la función de distribución acumulada de la VA exponencial se expresa como:

Se sabe que la función de distribución de probabilidad de una VA continua se obtiene

𝑓𝑥𝑔 (𝑡; 𝜆) = 𝜆𝑒 −𝜆𝑡 𝑡 > 0

Su media y varianza están dadas por:

𝑃(𝑋 > 3) = 1 − 𝑃(𝑋 ≤ 3)

En Excel, se busca la función DISTR.EXP, con parámetros: X=3; λ=1/3; Acumulado = 1. El

1.2 Distribución Uniforme

Una VA X se distribuye uniformemente en el intervalo (a, b) si su función de distribución de

La función de distribución acumulada está dada por:

Su media y varianza, están dadas respectivamente por:

1.3 Distribución Normal

Considérese la VA binomial XB, definida por el lanzamiento de una moneda 15 veces. Si se

Se puede demostrar, en efecto, que si se realizan N experimentos independientes de Bernoulli

La aproximación anterior dio lugar a la definición de una VA continua conocida como la

Esta expresión no se puede evaluar mediante métodos numéricos tradicionales; de hecho

Si 𝑋~𝑁(𝜇, 𝜎), 𝑠𝑒𝑎 𝑍 = (𝑋 − 𝜇)/𝜎, para obtener:

1.4 Distribución Triangular

Una VA X se distribuye de forma Triangular en el intervalo (a, c, b) si su función de distribución

La función de distribución acumulada está dada por:

Su media y varianza, están dadas respectivamente por:

La distribución triangular juega un papel fundamental en simulación. Esta distribución

Un estimador es un estadístico aleatorio, es decir, una función de una muestra aleatoria de

Comúnmente, los momentos y las estadísticas relacionadas se calculan a partir de datos

Un estimador insesgado para la varianza, σ2, basado en la muestra Y, es la varianza muestral

Donde la desviación estándar muestral, S, es simplemente la raíz cuadrada de S2.

3. ESTIMACIÓN POR INTERVALOS DE CONFIANZA

La estimación por intervalo de un parámetro poblacional (Denotado por φ), es un intervalo de

3.1 Intervalos de confianza para una sola muestra: Estimación de la Media

Cuando n   es la distribución Normal estándar n (z; 0, 1).

Adicionalmente, otro de los elementos a tener en cuenta es el conocimiento de la varianza

Es claro que los límites Inferior y Superior del Intervalo son:

En el caso de no conocer la varianza poblacional 𝜎 2 , debemos estimarla por medio de la

Es la distribución t de Student t(n-1). Se debe tener en cuenta que S es la desviación estándar

En este caso, si no conocemos la varianza poblacional, el intervalo de confianza de 1−∝ de

Donde 𝑡𝛼/2 es el valor de 𝑡 con v=n-1 grados de libertad.

Es claro que los límites Inferior y Superior del Intervalo son:

Como se analizó en el numeral anterior, debemos realizar previamente un análisis y determinar

Donde t / 2 es el valor de la distribución t con un nivel de significancia de 𝛼/2 con v=n1+n2-2

n1  1S 21  n2  1S 2 2

- Hipótesis nula e hipótesis alterna: En pruebas de hipótesis estadísticas, se acostumbra a

Dichas alternativas son:

1. Pruebas de 2 colas basadas en un estimador apropiado del parámetro.

2. Pruebas de cola superior (1 Cola) basadas en un estimador apropiado del parámetro.

El Procedimiento general para realizar las pruebas de hipótesis es:

1. Establezca las hipótesis Nula y Alterna.

4.1. Pruebas para una sola Media

Por lo tanto, si la varianza poblacional es conocida (𝜎 2 ) y teniendo en cuenta que el modelo se

Por otro lado, si la varianza poblacional es desconocida (𝜎 2 ) el estadístico de prueba para la

Solución: Para solucionar el problema anterior, se construirán dos pruebas de hipótesis. La

Adicionalmente, se utilizará el procedimiento presentado anteriormente para la construcción

Prueba 1: Validar si la duración de las llamadas es superior a 70 minutos