Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Comparacion de Alternativas
Comparacion de Alternativas
Comparacin de Alternativas
El objetivo es determinar si una configuracin es mejor
que otra con respecto a un criterio de performance.
Hay dos pruebas estadsticas para responder esta
pregunta:
El Paired-t Test y
El Two-Sample Test.
Tratan de determinar un punto estimado de la diferencia
promedio entre las medias respectivas de los diseos de
configuracin de sistemas.
Se construye un intervalo de confianza para un punto
estimado de la diferencia entre las medias.
2
Comparacin de Alternativas
Debemos tener en cuenta las siguientes consideraciones:
H0 : 1 = 2
H1 : 1 2
su equivalente
su equivalente
H0 : 1 - 2 = 0
H1 : 1 - 2 0
Comparacin de Alternativas
Consideremos el intervalo de confianza siguiente:
Comparacin de Alternativas
Posibles posiciones de un intervalo de confianza
(a)
No
debemos
rechazar Ho
(b)
Rechazamos
Ho
(c)
Rechazamos
Ho
1- 2 = 0
Paired-t Test
Dos grupos de observaciones son diferentes solo en un
aspecto o tratamiento.
Muestras Pareadas: Se llaman pares correspondientes
a dos observaciones que son los mas similares posibles
entre si. Solo difieren en un aspecto relevante.
Paired-t Test
Ejm.
Un investigador mdico desea probar los efectos de nuevos
medicamentos.
A veinte personas en un grupo se les hace corresponder de la
manera mas prxima posible con 20 personas de un segundo grupo
en trminos de peso, edad, sexo, nivel de actividad, colesterol y
cualquier otro factor.
Entonces tenemos 20 pares de gemelos idnticos.
A uno de los grupos se le proporciona una nueva droga, y el otro
recibe otra medicina.
Solo el investigador sabe cual grupo recibe cada medicamento.
Toda diferencia subsiguiente, buena o mala, en las presiones
sanguneas de los gemelos se atribuye a las medicinas debido a
que se han corregido todos los otros factores relevantes
Es decir, se han elaborado pares de observaciones (gemelos) que
son idnticos en trminos de los dems factores relevantes.
7
Paired-t Test
Otro mtodo para utilizar muestras pareadas
involucra el anlisis de las mismas
observaciones antes y despus del tratamiento.
Una prctica comn en la industria es evaluar a
los empleados en los programas de
capacitacin.
Entonces se tiene un puntaje antes y uno
despus de la capacitacin en cada
observacin (empleado).
Todo cambio en el puntaje puede atribuirse a
esta formacin adicional.
8
Paired-t Test
Puntaje
di di
Empleado
Antes de la
capacitacin
Despus de la
capacitacin
9.0
9.2
-0.2
0.04
7.3
8.2
-0.9
0.81
6.7
8.5
-1.8
3.24
5.3
4.9
0.4
0.16
8.7
8.9
-0.2
0.04
6.3
5.8
0.5
0.25
7.9
8.2
-0.3
0.09
7.3
7.8
-0.5
0.25
8.0
9.5
-1.5
2.25
10
7.5
8.0
-0.5
0.25
74.0
79.0
-5.0
7.38
Paired-t Test
Diferencia promedio entre las observaciones pareadas:
_
d
n
5.0
0.5
10
2
i
_2
nd
n 1
7.38 10(0.5) 2
0.736
9
Se requiere del estadstico t, para un nivel de confianza del 90% y n1= 9 grados de libertad t = 1.833:
10
Paired-t Test
Intervalo para la diferencia entre medias; observaciones pareadas:
Sd
I .C. para d d t
n
_
0.736
0.5 (1.833)
10
0.927 d 0.073
dt
( n 1,1 )
2
_
Sd
Sd
d d t
( n 1,1 )
n
n
2
n d i d i
2
Sd Sd
Sd
n(n 1)
12
13
% utilizacin en
la i-sima rplica
para el mtodo
#1
% utilizacin en
la i-sima
rplica para el
mtodo #2
Diferencia entre
metodo #1 y #2
en la i-sima
rplica
Rplica i
X 1i
X 2i
d i X 1i X 2i
75
67
64
76
85
-9
81
73
68
25
74
62
12
144
76
71
25
91
87
????? 16
55
63
-8
64
67
55
12
144
85
90
-5
25
10
89
85
16
28
Cuadrado de la
diferencia en la
i-sima rplica
di
d i 604 14
2
Sd
n(n 1)
Sd Sd
_
d
_
dt
( n 1,1 )
2
Sd
(10)(604) (28) 2
58.4
10(9)
S d ( 58.4 ) 7.64
28
2.8
10
t 9, 0.95 1.833
_
Sd
Sd
d d t
( n 1,1 )
n
n
2
2.8 1.833
1.632 d 7.23
7.64
7.64
d 2.8 1.833
10
10
15
Two-Sample Test
Este es otro mtodo para verificar la diferencia entre dos
medias.
Empleado cuando el numero de replicas no es igual
para las dos alternativas comparadas.
Aqu el inters esta en estimar la diferencia entre dos
medias poblacionales (1 - 2).
17
Two-Sample Test
Grados de libertad cuando las varianzas poblacionales no son iguales:
S1
S2
n
n2
1
2
g.l.
S1 2
n
1
n1 1
S22
n
2
n2 1
I .C.. para.1 2 x1 x 2 t `
S1
S2
n1
n2
18
Two-Sample Test
Ejm.
Telefnica del Per aplico dos programas de entrenamiento
utilizados por IBM.
Doce ejecutivos a quienes se les dio el primer tipo de
entrenamiento obtuvieron un promedio de 73.5 en la prueba
de competencia.
Se asume que la varianza en los puntajes para este grupo
fue de 100.2.
Quince ejecutivos a quienes se les administro el segundo
programa de entrenamiento obtuvieron un promedio de 79.8.
Se asume una varianza de 121.3 para este segundo grupo.
Haga un intervalo de confianza del 95% para la diferencia en
los puntajes promedios
19
Two-Sample Test
g.l.
100.2 121.3
12
15
100.2
12
11
121.3
15
14
24.55
20
Two-Sample Test
I .C.. para.1 2 x1 x 2 t
73.5 79.8 2.064
S1
S2
n1
n2
100.2 121.3
12
15
6.3 8.36
14.66 1 2 2.06
x1 x2 t v,1
S1
S
2 1 2 x1 x 2 t
v ,1
n1
n2
2
S1
S
2
n1
n2
2
S1 2
S2
n n
1
2
S1 2
n
1
n1 1
S22
n
2
n2
22
23
Mtodo #1
X1i
X 1i - X 1
77
-3.7
13.69
89
-0.53
0.28
82
1.3
1.69
91
1.47
2.16
89
8.3
68.89
91
1.47
2.16
76
-4.7
22.09
88
-1.53
2.34
86
5.3
28.09
88
-1.53
2.34
76
-4.7
22.09
87
-2.53
6.40
77
-3.7
13.69
88
-1.53
2.34
84
3.3
10.89
89
-0.53
0.28
88
7.3
53.29
90
-0.47
0.22
10
72
-8.7
91
1.47
?????2.16
11
90
0.47
0.22
12
91
1.47
2.16
13
89
-0.53
0.28
14
91
1.47
2.16
15
90
0.47
0.22
i 1
?????75.69
10
10
X1i - X1
1i
807
Mtodo #3
X2i
i 1
X 1i X 1
310.1
15
15
X
i 1
X 2i - X 2 X 2i - X 2 2
2i
1343
i 1
X 2i X 2
25.72
24
1) x ( n )
x
i 1
2) S 2 ( n )
i 1
xi x ( n )
n 1
3) t
v ,1
S1 S 2
n n
1
2
4) v
2 2
2 2
S1
S2
n
n
1 2
n1 1 n2 1
2
807
x (1)
10
_
x ( 2)
1343
15
S 2 (1)
310.1
9
S 2 ( 2)
25.72
14
34.45 1.837
15
10
2
34.45
1.837
10
15
9
14
25
x2 t
8.83 1.81
v ,1
S1
S
2 1 2 x1 x 2 t
v ,1
n1
n2
2
S1
S
2
n1
n2
34.45 1.837
34.45 1.837
1 2 8.83 1.81
10
15
10
15
12.25 1 2 5.41
Un intervalo de confianza al 90% para la diferencia en la utilizacin
de labor entre el mtodo #1 y mtodo #3 es [-12.25, -5.41]
26