Está en la página 1de 67

Marcos Rivas Pea

Simulacin de Sistemas

Anlisis de Resultados
Marcos Rivas Pea
Objetivos de la Sesin
1. Aplicar el mtodo de intervalo de
confianza para las respuesta de la
simulacin
2. Resolver problemas de cmo empezar la
simulacin.
3. Determinar cundo deternerse de generar
nuevos datos




Marcos Rivas Pea
Simulacin de Sistemas
Anlisis de Resultados
Tabla de Contenido
1. Estimacin de Parmetros
2. Teorema Central de Lmite
3. Estimacin de Intervalos
4. Anlisis de Resultados de la Simulacin.





Marcos Rivas Pea
Recordando la Estadstica
Poblacin:
Es la recoleccin completa de todas las observaciones de
inters para el investigador
Parmetro:
Es una medida descriptiva de la poblacin total de todas las
observaciones de inters para el investigador.
Muestra:
Es una parte representativa de la poblacin que se selecciona
para ser estudiada
Estadstico:
Elemento que describe una muestra y sirve como una
estimacin del parmetro de la poblacin
Variable:
Es una caracterstica de la poblacin que se esta analizando en
un estudio estadstico.
Marcos Rivas Pea
Medidas de Tendencia Central
La media:
Es la medida de tendencia central que normalmente es
considerada como el promedio.
Si tenemos 56, 67, 52, 45, 67, la media se calcula as:


4 . 57
5
67 45 52 67 56
__
=
+ + + +
= X
Marcos Rivas Pea
Medidas de Tendencia Central
La mediana:
La mitad de las observaciones estar por debajo de ella y la
otra mitad por encima.

Posicin de la mediana = =

Para los datos ordenados, la mediana es 56 (la tercera
posicin).
Si tenemos: 35, 45, 52, 56, 67 y 67. (n es par),
promediamos los dos valores medios (52 + 56)/2 = 54
2
1 + n
3
2
1 5
=
+
Marcos Rivas Pea
Medidas de Tendencia Central
La moda:
Observacin que ocurre con mayor frecuencia.
Si tenemos 35, 45, 52, 56, 67, 67, la moda es 67
Si agregramos una observacin adicional de 56, el
conjunto de datos seria bimodal, con modas 56 y 67.
Marcos Rivas Pea
Medidas de Dispersin
Miden que tanto se dispersan las observaciones alrededor de su
media.
El rango:
Es la diferencia entre la observacin mas alta y mas baja.
Su desventaja es que considera solo dos observaciones del total
de observaciones.
Marcos Rivas Pea
Medidas de Dispersin
La Varianza:
Es el promedio de las desviaciones respecto a su media elevadas
al cuadrado
Varianza poblacional:


Varianza de una muestra:
( ) ( ) ( ) ( )
( )
N
x
N
x x x x
i
N


=
+ + + +
=
2
2 2
3
2
2
2
1
2
...


o
1 1
...
2
__
2
__
2
__
3
2
__
2
2
__
1
2

|
.
|

\
|

=

|
.
|

\
|
+ + |
.
|

\
|
+ |
.
|

\
|
+ |
.
|

\
|

=

n
X x
n
X x X x X x X x
S
i n
Marcos Rivas Pea
Medidas de Dispersin
La Varianza:
Si tenemos: 87, 120, 54, 92, 73, 80 y 63






La media de los valores observados es de 81.29, con
tendencia a variar por arriba o debajo de dicha media en
21.58
29 . 81
__
= X
9 . 465
1 7
) 29 . 81 63 ( ... ) 29 . 81 120 ( ) 29 . 81 87 (
2 2 2
2
=

+ + +
= S
58 . 21 9 . 465 = = S
Marcos Rivas Pea
Estimacin de Parmetros
Parmetros poblacionales y Estadsticos Muestrales
UMSNH - FIE
Datos
(Poblacin de Inters)
Muestras
-4 -2 0 2 4
0
20
40
60
80
100
120
140
160
Histograma de la Poblacion
Clases
F
r
e
c
u
e
n
c
i
a
-4 -2 0 2 4
0
2
4
6
8
10
12
14
16
Histograma de la Muestra
Clases
F
r
e
c
u
e
n
c
i
a
Parmetros:
Media ()
Varianza(o
2
)
Desv. Est. (o)
Etc.
Estadsticos:
Promedio ( )
Varianza muestral(S
2
)
Desv. Est. muestral(S)
Etc.
Inferencias
Muestreo
X
Marcos Rivas Pea
Media Muestral
Suponga que x
1
,x
2
,...x
n
son variables aleatorias
independientes con la misma funcin de distribucin; es
decir, = E[x
i
] y o
2
= var(x
i
), la cantidad:



Que es el promedio aritmtico de los n datos es la media
muestral.
Cuando no se conoce la media poblacional, con
frecuencia se toma la media muestral para estimarla.

Marcos Rivas Pea
Varianza Muestral
En muchos problemas reales la varianza poblacional
se desconoce, para este tipo de situaciones, es
posible utilizar el siguiente estimador de la varianza.
Marcos Rivas Pea
Teorema de limite central
Dado una variable aleatoria X , con media y varianza
2
, la
distribucin muestral de la media ( ), basada en muestras
aleatorias de tamao n , tiene las siguientes caractersticas:

1. La media de la distribucin muestral es .
2. La varianza de la distribucin muestral es
2
/n
3. Si la distribucin de la variable X es normal, entonces la
distribucin muestral tambin lo es.
4. Si la distribucin de la variable no es normal, la forma de la
distribucin muestral tiende a ser normal si el tamao
muestral n es mayor a 30 , para n menores sigue una
distibucin t
n-1,o/2


Marcos Rivas Pea
Aplicaciones del teorema de limite central
Siendo X una V.A. con distribucin normal de media
y varianza
2
, la distribucin de

Z =

es normal con media = 0 y desvo estndar = 1
usualmente llamada z o normal tipificada.


n /
X
o

Marcos Rivas Pea
Grficamente: para una normal tipificada (Z) , un intervalo de
confianza del 95% se puede representar como:
95%
2.5%
2.5%
La probabilidad de que
una variable normal
tipificada tome valores en
el intervalo
[-1.96,1.96] es del 95%.
Aplicaciones del teorema del teorema de limite central
Marcos Rivas Pea
Estimacin de Intervalos
En el enfoque de estimacin de intervalos, para un parmetro
no se estima un valor, sino un intervalo de la forma L s s U,
donde los valores extremos L, U dependen del valor numrico del
estadstico para una muestra en particular y de la distribucin
de muestreo.
Partiendo de la distribucin de muestreo para , es posible
determinar valores de L, U tales que se cumpla lo siguiente:
P (L s s U) =1 o Donde 0 < o < 1
Es decir, se puede garantizar con una probabilidad de 1- o
que la muestra elegida contendr el valor verdadero de
Al intervalo resultante L s s U se le conoce como el
intervalo de confianza del 100(1 o) % para el parmetro
desconocido .



X
X
Marcos Rivas Pea
Ejemplo: Construccin repetida de un intervalo de confianza
para la media :
Estimacin de Intervalos

Si los intervalos de confianza
mostrados son del 95% significa
que si se construye un gran
nmero de ellos, el 95% de ellos
contendr a la media
Marcos Rivas Pea
Intervalo para la media
Varianza Conocida
De acuerdo a lo anterior, podemos suponer que la variable


Tiene una distribucin N(0,1)

de la figura: P{-z
o/2
s Z s z
o/2
}=1-o.
Con lo cual el intervalo de confianza del 100(1-o)% para la media es
N /

X
___
Z


=
-z
o/2
z
o/2
Z
o/2 o/2
N / z N / z
/2
__
/2
__
x x
+ s s
Marcos Rivas Pea
Intervalo para la media
Varianza Desconocida
Si no se conoce la varianza o
2
de la poblacin, una posibilidad
es utilizar la varianza muestral S
2
en las ecuaciones obtenidas
para estimar intervalos en el caso de varianza conocida

Este procedimiento funciona para muestras grandes (N>30),
por ello los intervalos de confianza anteriores se les suele
llamar intervalos de confianza para muestras grandes.
Marcos Rivas Pea
Intervalos de Confianza
Ejemplo
Supongamos que la simulacin se esta utilizando para analizar las
demoras en un proceso de produccin.
Cada replica independiente del modelo produce una respuesta
potencial de la distribucin de todas las posibles demoras. Una sola
salida, produce solo una muestra de la distribucin.
Asumamos que 100 puntos estimados del promedio de demora en un
proceso esta normalmente distribuido con una media de 40 y una
desviacin estndar de 12.

Cien muestras de esta distribucin pueden ser distribuidas como siguen

__
X
Marcos Rivas Pea
Intervalos de Confianza
39 43
35 39 43 47 Distribucin Normal
35 39 43 47 = 40
35 39 43 47 = 12
3 1 3 5
38 42 47 51
31 34 38 42 46 51
27 31 34 38 42 46 51 55
27 30 34 38 42 46 50 55
27 30 34 37 41 46 50 55
23 26 30 33 37 41 45 50 54 58
19 22 26 29 33 37 41 45 49 54 58 63
14 19 21 25 29 33 37 41 45 49 53 57 63 69
12 17 21 25 29 33 37 41 45 49 53 57 61 66
16-20 < 16 20-24 24-28 28-32 32-36 36-40 40-44 44-48 48-52 52-56 56-60 60-64 > 64
Marcos Rivas Pea
Intervalos de Confianza
Los principios de inferencia estadstica, nos permiten hacer
estimaciones de una media verdadera y una varianza o2
Suponga que los siguientes valores son aleatoriamente
seleccionados de la distribucin mostrada en el grfico
anterior: 26, 31, 38, 49, 50 y 58.
Un punto estimado de es designado como:
42
6
58 50 49 38 31 26
) 6 (
__
=
+ + + + +
= X
4 . 152
1 6
] ) 6 ( [
) 6 (
6
1
2
__
2
=

=

X Xi
S
La varianza de la distribucin es aproximada como:
Marcos Rivas Pea
Intervalos de Confianza
n
n S
t n X
n
) (
) (
2
2 / , 1
__
o

6
4 . 152
015 . 2 42
16 . 52 84 . 31 s s
Como la cantidad de datos (n=6) es menor que 30, usamos
un valor t de una distribucin t, para construir el intervalo de
confianza para el punto estimado ,
un intervalo de confianza nos dice con que certeza
(90%), el parmetro de la media verdadera esta contenida
dentro de nuestro intervalo calculado.
Usamos =
10%
Un 90% de
certeza
Marcos Rivas Pea
Media Muestral vs. Verdadera
u = 40
Media
Muestral
Media
Verdadera
_
X = 42
Marcos Rivas Pea
Intervalos de Confianza
Qu son?
Un intervalo, expresado en el formato (min, max), el
cual provee un estimado realista del valor verdadero de
un parmetro del sistema particular.
La longitud del intervalo depende del tamao n
de la muestra.
Los niveles tpicos son: 90%, 95% y 99%.
Marcos Rivas Pea
Intervalos de Confianza
Media
Muestral
Media
Verdadera
95%
90%
u = 40
_
X = 42
Marcos Rivas Pea
Intervalos de Confianza
El principio del intervalo de confianza puede ser
demostrado utilizando los nmeros descritos en la
distribucin normal anterior.
El siguiente ejercicio ilustra esta explicacin.
1) Coloque los nmeros de la distribucin normal en 100 papeles
pequeos.
2) Ponga los papeles en un contenedor.
3) Busque en el contenedor y extraiga seis papeles.
4) Registre el nmero mostrado en cada papel seleccionado.
5) Calcule un intervalo de confianza a un 90%, para los seis valores
obtenidos.
6) Retorne todos los papeles al contenedor.
Marcos Rivas Pea
Intervalos de Confianza
Si ejecutamos los pasos tres al seis, 100 veces, podemos
esperar que 90 de los intervalos de confianza calculados,
contienen el parmetro de la media verdadera ( = 40 en
este ejemplo).
Desarrollar el siguiente ejemplo y verifique los resultados
para 10 repeticiones.
Marcos Rivas Pea
Intervalos de Confianza
) 6 (
__
X ) 6 (
2
S Exp.
Valores
Seleccionados
Intervalo
Intervalo contiene a
= 40?
1
2
3
4
5
6
7
8
9
10
Marcos Rivas Pea
Anlisis de Resultados
Marcos Rivas Pea
ANLISIS DE RESULTADOS
En general es aconsejable realizar varias corridas
independientes para tomar varias muestras como respuestas
tanto para calcular la media como la varianza (y la desviacin
estndar).

Por lo tanto....
El anlisis estadstico de los experimentos de simulacin
requieren de varias respuestas independientes x
1
, ...,x
n
.

Cada una de estas muestras se obtienen a partir de alguno de
los siguientes mtodos.

Marcos Rivas Pea
MTODOS MUESTREO RESULTADOS (1)
1.- Se realizan n corridas de simulacin.
Cada corrida con muestras de nmeros aleatorios
diferentes e independientes.
Cada corrida es una replicacin.


X1

Warm-up
period

X2


Warm-up
period

X3

Warm-up
period


X4

Warm-up
period

Marcos Rivas Pea
MTODOS MUESTREO RESULTADOS (3)
3.- Mtodo batch means, usado en simulaciones de estado estacionario,
aquellos que llevan mucho tiempo en alcanzar ese estado.
Se corre el perodo Wam-up una sola vez; a partir de all se registran valores
de x
i
en intervalos sucesivos de tiempo de igual longitud, 1 ... n.
Riesgo: correlacin entre resultados sucesivos.

X1

X2

X3

X4

Warm-up period
Marcos Rivas Pea
Nmero de Rplicas
Un mtodo esencial para mejorar la confiabilidad de los
resultados es ejecutar mltiples replicas independientes de
la simulacin.
Los resultados de mltiples rplicas del modelo deben ser
analizados con principios de inferencia estadstica para
realizar conclusiones validas.
El ejemplo anterior puede ser usado para demostrar el nivel
de confianza asociado al numero de replicas necesarias
para asegurar la exactitud de (un punto estimado de ) con
respecto a la media verdadera de la distribucin
Marcos Rivas Pea
Nmero de Rplicas
La ecuacin para conocer el numero de replicas necesarias es:
2
2 / , 1
) (
(

=

e
n S t
N
n o
Donde:
N: Numero de replicas necesarias para lograr un nivel de exactitud deseado
S(n): Es un punto estimado de o, basado en n replicas del modelo.
e: Denota la cantidad de error entre la media estimada y
t: Valor critico de la tabla t
Marcos Rivas Pea
Nmero de Rplicas
Deseamos conocer cuantas replicas del modelo deben ser realizadas
para tener un 90% de confianza que nuestra media estimada no varia
de la media verdadera por mas de 9 das.
Media
Muestral
Media
Verdadera
e = 9
Marcos Rivas Pea
Nmero de Rplicas
Estimamos el valor de o, seleccionando aleatoriamente seis valores de la
distribucin (en la simulacin esto equivale a realizar 6 replicas
independientes del modelo)
Si los valores seleccionados son 26, 31, 38, 49, 50 y 58
El estimado de la desviacin estndar es 12.3
Insertando estos valores en la ecuacin anterior, esto nos da N=8.
Implica que si aleatoriamente seleccionamos 8 muestras de la distribucin y
calculamos un valor de
Podemos esperar que aproximadamente 90 veces de un total de 100, el valor
de no variara de la media verdadera = 40, por mas de 9 das, verificar
estos resultados en la siguiente tabla.
2
2 / , 1
) (
(

=

e
n S t
N
n o
8 58 . 7
9
) 3 . 12 )( 015 . 2 (
2
~ =
(

= N
__
X
__
X
Marcos Rivas Pea
Nmero de Rplicas
) 8 (
__
X
Rep. Valores Seleccionados Dentro del limite 9?
( = 40)
1
2
3
4
5
6
7
8
9
10
verificar los resultados anteriores en la siguiente tabla:
Marcos Rivas Pea
Ejemplo
Suponga que la simulacin de un proyecto de inversin
arroj los siguientes resultados:





Determinar un intervalo de confianza del 95 % (o=5%)
para la tasa interna de retorno.
12 8 5 3 7 5 3 29 27 9
15 22 7 21 3 15 26 17 8 13
18 13 18 17 5 3 4 7 13 19
11 16 13 13 9 8 7 13 15 12
13 12 14 14 20 22 11 12 18 11
17 4 23 8 15 7 18 19 24 15
19 24 12 7 18 15 13 8 21 4
9 17 11 15 21 18 15 28 13 3
14 19 19 18 4 27 21 4 5 8
10 21 25 21 7 2 8 9 7 11
Marcos Rivas Pea
Comparacin de Alternativas
Marcos Rivas Pea
Comparacin de Alternativas
El objetivo es determinar si una configuracin es mejor
que otra con respecto a un criterio de performance.
Hay dos pruebas estadsticas para responder esta pregunta:
El Paired-t Test y
El Two-Sample Test.
Tratan de determinar un punto estimado de la diferencia
promedio entre las medias respectivas de los diseos de
configuracin de sistemas.
Se construye un intervalo de confianza para un punto
estimado de la diferencia entre las medias.
Marcos Rivas Pea
Comparacin de Alternativas
Debemos tener en cuenta las siguientes consideraciones:

H
0
:
1
=
2
su equivalente H
0
:
1
-
2
= 0
H
1
:
1

2
su equivalente H
1
:
1
-
2
0

H
0
nos dice que el valor de
1
no es significativamente
diferente de
2
con un nivel de significancia.
H
1
nos dice que el valor de
1
y
2
son significativamente
diferentes con un nivel de significancia.
Marcos Rivas Pea
Comparacin de Alternativas
Consideremos el intervalo de confianza siguiente:
[ L_inferior <
1
-
2
< L_superior ]
Si H
0
es verdadera, el intervalo de confianza hallado debe incluir el
valor cero con una probabilidad de 1- .
Si el intervalo de confianza incluye el valor cero, no debemos
rechazar H
0
y concluimos que el valor de
1
no es significativamente
diferente del valor de
2
con un nivel de significancia.
Si el intervalo de confianza no incluye cero, rechazamos H
0
y
concluimos que el valor de
1
es significativamente diferente que el
valor de
2
con un nivel de significancia.
Marcos Rivas Pea
Comparacin de Alternativas
(a)
(b)
(c)
No
debemos
rechazar Ho
Rechazamos
Ho
Rechazamos
Ho

1-

2
= 0
Posibles posiciones de un intervalo de confianza
Marcos Rivas Pea
Paired-t Test
Dos grupos de observaciones son diferentes solo en un
aspecto o tratamiento.
Muestras Pareadas: Se llaman pares correspondientes a
dos observaciones que son los mas similares posibles entre
si. Solo difieren en un aspecto relevante.

Marcos Rivas Pea
Paired-t Test
Ejemplo.
Un investigador mdico desea probar los efectos de nuevos
medicamentos.
A veinte personas en un grupo se les hace corresponder de la manera
mas prxima posible con 20 personas de un segundo grupo en
trminos de peso, edad, sexo, nivel de actividad, colesterol y cualquier
otro factor.
Entonces tenemos 20 pares de gemelos idnticos.
A uno de los grupos se le proporciona una nueva droga, y el otro
recibe otra medicina.
Solo el investigador sabe cual grupo recibe cada medicamento.
Toda diferencia subsiguiente, buena o mala, en las presiones
sanguneas de los gemelos se atribuye a las medicinas debido a que
se han corregido todos los otros factores relevantes
Es decir, se han elaborado pares de observaciones (gemelos) que son
idnticos en trminos de los dems factores relevantes.
Marcos Rivas Pea
Paired-t Test
Otro mtodo para utilizar muestras pareadas
involucra el anlisis de las mismas observaciones
antes y despus del tratamiento.
Una prctica comn en la industria es evaluar a los
empleados en los programas de capacitacin.
Entonces se tiene un puntaje antes y uno
despus de la capacitacin en cada observacin
(empleado).
Todo cambio en el puntaje puede atribuirse a esta
formacin adicional.
Marcos Rivas Pea
Empleado
Puntaje
Antes de la
capacitacin
Despus de la
capacitacin
1 9.0 9.2 -0.2 0.04
2 7.3 8.2 -0.9 0.81
3 6.7 8.5 -1.8 3.24
4 5.3 4.9 0.4 0.16
5 8.7 8.9 -0.2 0.04
6 6.3 5.8 0.5 0.25
7 7.9 8.2 -0.3 0.09
8 7.3 7.8 -0.5 0.25
9 8.0 9.5 -1.5 2.25
10 7.5 8.0 -0.5 0.25
74.0 79.0 -5.0 7.38
Paired-t Test
i
d
2
i
d
Sea la diferencia entre todo par correspondiente. La media
de las diferencias entre todos los pares seria entonces:
i
d
Marcos Rivas Pea
Paired-t Test
5 . 0
10
0 . 5
_
=

= =

n
d
d
i
736 . 0
9
) 5 . 0 ( 10 38 . 7
1
2
2
_
2
=

=

=

n
d n d
S
i
d
Diferencia promedio entre las observaciones pareadas:
Desviacin estndar de las diferencias entre las observaciones pareadas:
Se requiere del estadstico t, para un nivel de confianza del 90% y n-1=
9 grados de libertad t = 1.833:
Marcos Rivas Pea
Paired-t Test
n
S
t d para C I
d
d
=
_
. .
10
736 . 0
) 833 . 1 ( 5 . 0 =
Intervalo para la diferencia entre medias; observaciones pareadas:
073 . 0 927 . 0 s s
d

Como se restaron los puntajes posteriores al entrenamiento, produciendo


valores negativos, se puede estar 90% seguro de que la media de los
puntajes posteriores al entrenamiento esta entre 0.073 puntos y 0.927
puntos mas alto.
Marcos Rivas Pea
Paired-t Test y la Simulacin
Una prueba pareada (Paired-t Test) requiere que el nmero
de rplicas ejecutadas de un modelo para cada alternativa
sea igual.
La ecuacin para calcular un intervalo de confianza bajo
estas condiciones es:
n
S
t d
n
S
t d
d
n
d
d
n )
2
, 1 (
_
)
2
, 1 (
_
o o


+ < <
2
d d
S S =
( )
) 1 (
2
2
2

=

n n
d d n
S
i i
d
Marcos Rivas Pea
Paired-t Test y la Simulacin
Suponga que se usa la simulacin para analizar el % de
utilizacin de recursos para dos alternativas.
Llamemos a las dos alternativas mtodo #1 y mtodo #2.
Se ejecutan diez rplicas de un modelo para cada
alternativa.
La siguiente tabla contienen los datos de utilizacin de
recursos (expresado en porcentaje de tiempo total
trabajado) generado para cada rplica del modelo.
Marcos Rivas Pea
Observacion
es
pareadas
% utilizacin en la
i-sima rplica
para el mtodo #1
% utilizacin en
la i-sima rplica
para el mtodo #2
Diferencia entre
metodo #1 y #2
en la i-sima
rplica
Cuadrado de la
diferencia en la
i-sima rplica
Rplica i
1 75 67 8 64
2 76 85 -9 81
3 73 68 5 25
4 74 62 12 144
5 76 71 5 25
6 91 87 4 16
7 55 63 -8 64
8 67 55 12 144
9 85 90 -5 25
10 89 85 4 16
Ejercicio
i
X
1 i
X
2
i i i
X X d
2 1
=
2
i
d

= 28
i
d

= 604
2
i
d
?????
Marcos Rivas Pea
Ejercicio
( )
) 1 (
2
2
2

=

n n
d d n
S
i i
d
4 . 58
) 9 ( 10
) 28 ( ) 604 )( 10 (
2
2
=

=
d
S
2
d d
S S =
64 . 7 ) 4 . 58 ( = =
d
S
8 . 2
10
28
_
= = d
833 . 1
95 . 0 , 9
= t
n
S
t d
n
S
t d
d
n
d
d
n )
2
1 , 1 (
_
)
2
1 , 1 (
_
o o


+ < <
10
64 . 7
833 . 1 8 . 2
10
64 . 7
833 . 1 8 . 2 + < <
d

23 . 7 632 . 1 < <


d

Marcos Rivas Pea


Ejercicio
Un intervalo de confianza al 90% para la diferencia en la
utilizacin del recurso para los dos mtodos es :
[-1.63,7.23 ]
Podemos estar seguros a un 90% que la diferencia
verdadera de la utilizacin del recurso entre el mtodo #1 y
el mtodo #2 esta contenida dentro del intervalo anterior.
Para el ejemplo, la diferencia verdadera tiene la posibilidad
de ser igual a cero.
Un valor de cero implica que no hay diferencia entre el
mtodo #1 y el mtodo #2.
Por lo tanto no podemos concluir que un mtodo es
superior a otro en trminos de la variable de decisin.
Marcos Rivas Pea
Two-Sample Test
Este es otro mtodo para verificar la diferencia entre dos
medias.
Empleado cuando el numero de replicas no es igual para
las dos alternativas comparadas.
Aqu el inters esta en estimar la diferencia entre dos
medias poblacionales (1 - 2).

Marcos Rivas Pea
Two-Sample Test
Grados de libertad cuando las varianzas poblacionales no son iguales:
( ) ( ) 1 1
. .
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1

|
|
.
|

\
|
+

|
|
.
|

\
|
|
|
.
|

\
|
+
=
n
n
S
n
n
S
n
S
n
S
l g
Debido a que g.l. se calcula de esta manera alterada, el estadstico t
se simboliza con t`. El intervalo de confianza se ha calculado entonces
como:
( )
2
2
2
1
2
1 `
2 1 2 1
. .. .
n
S
n
S
t x x para C I + =
Marcos Rivas Pea
Two-Sample Test
Ejm.
Telefnica del Per aplico dos programas de entrenamiento
utilizados por IBM.
Doce ejecutivos a quienes se les dio el primer tipo de
entrenamiento obtuvieron un promedio de 73.5 en la prueba de
competencia.
Se asume que la varianza en los puntajes para este grupo fue de
100.2.
Quince ejecutivos a quienes se les administro el segundo
programa de entrenamiento obtuvieron un promedio de 79.8.
Se asume una varianza de 121.3 para este segundo grupo.
Haga un intervalo de confianza del 95% para la diferencia en los
puntajes promedios
Marcos Rivas Pea
Two-Sample Test
55 . 24
14
15
3 . 121
11
12
2 . 100
15
3 . 121
12
2 . 100
. .
2 2
2
=
|
.
|

\
|
+
|
.
|

\
|
|
.
|

\
|
+
= l g
Si g.l. es fraccionario, se aproxima hacia abajo, hacia el entero
inmediatamente anterior. As , g.l. =24.
Un intervalo de confianza del 95% con 24 grados de libertad requiere
un valor t = 2.064.
Marcos Rivas Pea
Two-Sample Test
( )
2
2
2
1
2
1 `
2 1 2 1
. .. .
n
S
n
S
t x x para C I + =
( )
06 . 2 66 . 14
36 . 8 3 . 6
15
3 . 121
12
2 . 100
064 . 2 8 . 79 5 . 73
2 1
s s
=
+ =

Debido a que el intervalo contiene cero, no existe una fuerte
evidencia de que exista diferencia alguna en la efectividad de los
programas de entrenamiento.
Marcos Rivas Pea
Two-Sample Test y Simulacin
( ) ( )
2
2
2
1
2
1
2
,
2 1 2 1
2
2
2
1
2
1
2
,
2 1
n
S
n
S
t x x
n
S
n
S
t x x
v v
+ + < < +
o o

La ecuacin para construir un intervalo de confianza con esta prueba es:
donde v es estimado de la siguiente manera:
( ) ( ) 1 1
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1

|
|
.
|

\
|
+

|
|
.
|

\
|
|
|
.
|

\
|
+
~
n
n
S
n
n
S
n
S
n
S
v
Marcos Rivas Pea
Ejercicio Para el Alumno
Siguiendo con el ejemplo anterior, suponga que 15 rplicas
de un modelo son ejecutadas para otra alternativa (mtodo
#3),
Cada rplica es independiente de las 10 rplicas ejecutadas
para el mtodo #1.
La siguiente tabla contiene la data del % de utilizacin del
recurso producida por estos escenarios.
Marcos Rivas Pea
i-sima
rplica
Mtodo #1
X
1i

Mtodo #3
X
2i

1 77 -3.7 13.69 89 -0.53 0.28
2 82 1.3 1.69 91 1.47 2.16
3 89 8.3 68.89 91 1.47 2.16
4 76 -4.7 22.09 88 -1.53 2.34
5 86 5.3 28.09 88 -1.53 2.34
6 76 -4.7 22.09 87 -2.53 6.40
7 77 -3.7 13.69 88 -1.53 2.34
8 84 3.3 10.89 89 -0.53 0.28
9 88 7.3 53.29 90 -0.47 0.22
10 72 -8.7 75.69 91 1.47 2.16
11 90 0.47 0.22
12 91 1.47 2.16
13 89 -0.53 0.28
14 91 1.47 2.16
15 90 0.47 0.22





Ejercicio
1 1i
X - X
( )
2
1 1i
X - X
2 2i
X - X ( )
2
2 2i
X - X
807
10
1
1
=

= i
i
X
1 . 310
2
10
1
1 1
=
|
.
|

\
|

i
i
X X
1343
15
1
2
=

= i
i
X
72 . 25
2
15
1
2 2
=
|
.
|

\
|

i
i
X X
????? ?????
Marcos Rivas Pea
Ejercicio Para el Alumno
( ) ( ) 1 1
) 4 ) 3
1
) 2 ) 1
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
2
1 ,
1
2
) (
_
) (
2
1
) (
_

|
|
.
|

\
|
+

|
|
.
|

\
|
|
|
.
|

\
|
+
~

|
.
|

\
|

= =

= =

n
n
S
n
n
S
n
S
n
S
v t
n
x x
S
n
x
x
v
n
i
n
i
n
n
i
i
n o
14
15
837 . 1
9
10
45 . 34
15
837 . 1
10
45 . 34
14
72 . 25
9
1 . 310
15
1343
10
807
2 2
2
) 2 (
2
) 1 (
2
) 2 (
_
) 1 (
_
|
.
|

\
|
+
|
.
|

\
|
|
.
|

\
|
+
~ = = = = v S S x x
Marcos Rivas Pea
Ejercicio
( ) ( )
2
2
2
1
2
1
2
1 ,
2 1 2 1
2
2
2
1
2
1
2
1 ,
2 1
n
S
n
S
t x x
n
S
n
S
t x x
v v
+ + < < +

o o

15
837 . 1
10
45 . 34
81 . 1 83 . 8
15
837 . 1
10
45 . 34
81 . 1 83 . 8
2 1
+ + < < +
41 . 5 25 . 12
2 1
< <
Un intervalo de confianza al 90% para la diferencia en la utilizacin
de labor entre el mtodo #1 y mtodo #3 es [-12.25, -5.41]
Marcos Rivas Pea
Conclusiones
1. El mtodo de intervalo de confianza tradicional se aplica
slo cuando las variables que interactuan en el sistema
son independiente y el sistema esta en estado
estacionario
2. Para anlisar los resultados de la simulacin es necesario
realizar varias replicas.
3. Si los intervalos de confianza mostrados son del 95%
significa que si se construye un gran nmero de ellos, el
95% de ellos contendr el valor buscado
4. Es importante realizar el anlisis de esenarios para
determinar cul es el mejor diseo.

También podría gustarte