Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 2 de
Tema 2 de
completamente aleatorizado
Introduccin y ejemplos
Este modelo es el ms sencillo del diseo de experimentos, en el cual la variable respuesta puede depender de la influencia de un nico factor, de forma que el resto de las
causas de variacin se engloban en el error experimental.
Se supone que el experimento ha sido aleatorizado por completo, es decir, todas las
unidades experimentales han sido asignadas al azar a los tratamientos.
Vamos a considerar dos tipos de modelos: el de efectos fijos y el de efectos aleatorios.
Se presentan ambos tipos mediante dos ejemplos:
Ejemplo 1. Una firma comercial desea conocer la influencia que tiene el nivel cultural
de las familias en el xito de una campaa publicitaria sobre cierto producto. Para ello,
aprovecha los resultados de una encuesta anterior clasificando las respuestas en tantos
grupos como niveles culturales ha establecido.
Estamos ante un modelo de un solo factor, ya que la firma slo est interesada en
averiguar si los distintos niveles culturales influyen o no de la misma manera sobre las
ventas, no importndole la influencia del resto de los factores que pueden inducir a una
mayor o menor tendencia a la compra. El modelo es de diseo fijo porque la firma aplicar
los resultados de la investigacin exclusivamente a los niveles culturales establecidos por
ella, que pueden abarcar o no la gama completa de formacin cultural.
Ejemplo 2. En una fbrica se han observado anomalas en la calidad de las piezas pro1
ducidas por un tipo de mquinas: por haber sido revisadas recientemente se piensa que
los defectos puedan deberse a los trabajadores. Para contrastar esta hiptesis se toma una
muestra aleatoria de trabajadores y se controla la calidad de las distintas piezas que cada
uno obtiene.
Al igual que en el ejemplo anterior el modelo de comportamiento es de un solo factor,
la calidad del trabajo de los trabajadores, pero al extender el resultado del anlisis a toda
la poblacin de la que procede la muestra de obreros, el modelo es aleatorio, ya que de l
deduciremos si los obreros que integran la poblacin estudiada realizan un trabajo de la
misma calidad o no.
En el Ejemplo 1, la firma tena una gama de formaciones culturales muy amplia, pero
slo le interesaban unas determinadas. Para ella, la poblacin de niveles estaba compuesta
por los elegidos en el estudio, por lo cual los resultados slo se pueden aplicar a ellos. En
este caso, los niveles del factor se han elegido de forma determinista, basndose en datos
histricos.
Por el contrario, en el Ejemplo 2, no interesa la calidad del trabajo de los trabajadores,
sino poder atribuir la aparicin de piezas defectuosas a todos los trabajadores o a las
mquinas. Si del anlisis se deduce que la muestra de trabajadores no presenta diferencias
de calidades, se inferir que en la poblacin tampoco, por lo cual se pueden atribuir los
fallos a las mquinas. En este caso, los niveles del factor se han elegido de forma aleatoria,
pudindose inferir los resultados a toda la poblacin de trabajadores.
As, se pueden considerar dos posibles variantes de diseo unifactorial:
(i) Los niveles del factor se seleccionan de modo especfico por el experimentador. Esto
constituye el llamado modelo de efectos fijos.
(ii ) Los niveles de un factor son una muestra aleatoria de una poblacin mayor de
tratamientos. Esto es el modelo de efectos aleatorios.
a
X
i=1
i = 0
j=1 i=1
a
X
n i = 0 =
i=1
a
X
i = 0
i=1
Nivel
1
2
..
.
a
Observaciones
y11 y12 y1n
y21 y22 y2n
ya1
Totales Promedios
y1
y1
y2
y2
ya2 yan
ya
y
ya
y
n
a X
X
i=1 j=1
donde
1 XX
yij
n a i=1 j=1
a
y =
(yij y )2
n
n
a X
X
i=1 j=1
= n
a
X
i=1
(yij y )2 =
(
yi y )2 +
= SCT ra + SCE.
n
a X
X
i=1 j=1
n
a X
X
i=1 j=1
((
yi y ) + (yij yi ))2 =
(yij yi )2 =
ya que
2
= 2
n
a X
X
i=1 j=1
a
X
i=1
(
yi y ) (yij yi ) =
(
yi y )
n
X
j=1
(yij yi )
pero
n
X
j=1
(yij yi ) = n
yi n
yi = 0
Las diferencias de las observaciones dentro de los tratamientos con respecto al promedio
del tratamiento, se considera error aleatorio.
Grados de libertad.
Se tiene un total de a n observaciones y de a tratamientos.
SCT tiene (an 1) grados de libertad.
SCT ra tiene (a 1) grados de libertad.
SCE tiene a(n1) grados de libertad, porque hay n rplicas dentro de cada tratamiento, es decir, se tienen (n 1) grados de libertad para estimar el error experimental. Al
tener a tratamientos, se tiene un total de a(n 1) grados de libertad.
Observaciones.
Se tiene que
SCE =
n
a X
X
i=1 j=1
(yij yi )2 =
" n
a
X
X
i=1
j=1
(yij yi )2 .
s2i
SCE
=
N a
donde N = a n.
Si no hay diferencias entre los a tratamientos, se puede estimar la varianza poblacional
2 como
n
SCT ra
=
a1
a
X
i=1
(
yi y )2
a1
(
yi y )2
a1
MCT ra =
Cuando no existen diferencias entre las medias de los tratamientos, las estimaciones
deben ser similares.
Si consideramos las medias de cuadrados anteriores, entonces, se puede demostrar,
sustituyendo, que
E(MCE) = 2
2
E(MCT ra) = +
Pa
2i
.
a1
i=1
SCT ra
2a1
2
siempre que i = 0, i.
NOTA: Teorema de Cochran:
zi2 = Q1 + Q2 + + Qs
SSE
2
SST ra
2
lo que si i = 0, i, entonces
F0 =
SCT ra
a1
SCE
Na
MCT ra
MCE
S. Cuadrados
a
P
SCT ra = n (
yi y )2
i=1
Error
SCE =
a P
n
P
Total
SCT =
gl
a1
M. Cuadrados
MCT ra =
(yij yi )2
N a MCE =
(yij y )2
N 1
i=1 j=1
n
a P
P
i=1 j=1
SCT ra
a1
SCE
na
F0
Fo =
MCT ra
MCE
a X
n
X
2ij
i=1 j=1
a X
n
X
i=1 j=1
(yij i )2 ,
i=1 j=1
a
n
X
L
= 0 = 2
(yij
i ) = 0,
i
j=1
i = 1, 2, . . . , a
se obtiene
2 + + n
a = y
N
+ n
1 + n
n
+n
1
= y1
+n
2
= y2
..
..
+n
a = ya
Estas se denominan ecuaciones normales de mnimos cuadrados. Si se suman las ltimas a ecuaciones, se obtiene la primera ecuacin, de modo que no forman un sistema
independiente de ecuaciones y no existe solucin nica. Para evitar esto, se considera la
restriccin
a
X
i = 0,
i=1
= y
i = yi y
para i = 1, 2, . . . , a.
Si se asume que los errores estn distribuidos segn una normal, entonces cada yi
N (i , 2 /n) . De este modo, cuando 2 es desconocida un intervalo de confianza al 100(1
) % es
"
yi t 2 ,Na
De la misma manera,
"
#
MCE
.
n
(
yi y ) t 2 ,N a
2MCE
.
n
Diseo desequilibrado.
Si el nmero de observaciones es diferente segn cada tratamiento i: ni donde i =
1, 2, . . . , a, las expresiones previas son iguales salvo que se sustituye n por ni :
ni
ni
a X
a X
X
X
y2
2
SCT =
(yij y ) =
yij2
N
i=1 j=1
i=1 j=1
ni
a X
a
X
X
yi2 y2
2
(
yi y ) =
SCT ra =
ni
N
i=1 j=1
i=1
ni i = 0
i=1
10
% de algodn
15
20
25
30
35
Suma Media
49
9.8
77
15.4
88
17.6
108
21.6
54
10.8
376 15.04
diagrama de dispersin
25
25
22
22
19
19
16
16
13
13
10
10
7
7
15
20
25
30
porcentaje de algodn
12
35
observaciones
medias
Diagrama de cajas
observaciones
25
22
19
16
13
10
7
15
20
25
30
35
porcentaje de algodn
Sumas
y1
..
.
Medias
y1
..
.
yI1 , , yInI
yI
y
yI
y
B) Metodologa
En nuestro anlisis vamos a seguir los siguientes pasos:
Estimar los parmetros del modelo.
Contrastar si el factor influye en la respuesta, es decir, si los valores medios de Y
son diferentes al cambiar el nivel del factor.
Si el factor influye en la variable respuesta, es decir, las medias no son iguales, buscar
las diferencias entre poblaciones (o niveles del factor).
Diagnosis del modelo: comprobar si las hiptesis del modelo son ciertas mediante el
anlisis de los residuos.
14
1 = y1 = 9,8
2 = y2 = 15,4
3 = y3 = 17,6
4 = y4 = 21,6
5 = y5 = 10,8
Por ejemplo, el intervalo de confianza para 1 , al nivel (1 ) = 0,95, es:
"
#
r
MCE
yi t 2 ,Na
=
n
#
"
r
8,06
=
= 9,8 t0,025,20
5
[7,1515, 12,4485]
D) Anlisis de la varianza
El contraste de hiptesis que vamos a abordar es el siguiente:
nivel de significacin
FV
Tratamiento
Error
Total
SC
P
SCT ra = ai=1 ni (
y y )2
Pa Pni i
SCE = i=1 j=1 (yij yi )2
P P i
SCT = ai=1 nj=1
(yij y )2
GL
F
a 1 F0 =
N a
N 1
SCT ra/(a1)
SCE/(N a)
XX
X
yij2 n
y2
ni yi2 n
y2
Cuando slo hay dos poblaciones (un factor con dos niveles), este contraste es idntico
al contraste de la t para comparar las medias de dos poblaciones normales e idependientes
con la misma varianza.
Analizamos a continuacin la tabla de anlisis de la varianza del ejemplo 1
SCT =
XX
y2 =
yij2 n
SCT ra =
y2 =
ni yi2 n
F4,20;0,1 = 2,2489
F4,20;0,05 = 2,8661
F4,20;0,01 = 4,4307
Por lo tanto, rechazamos H0 a los niveles anteriores y concluimos que hay diferencias
entre los tratamientos.
Ejemplo 2. Analizaremos los siguientes conjuntos de datos:
16
Primer caso
Segundo caso
Sumas
20 19 20 21 80
22 22 22 22 88
24 24 23 25 96
264
Medias
20
22
24
22
Sumas
45 0 10 25 80
8 30 38 12 88
15 44 2 35 96
264
Medias
20
22
24
22
Las medias son iguales en los dos casos, con lo cual la diferencia de medias debera ser
igual en ambos casos. Los diagramas de puntos, considerando en abscisas los grupos y en
ordenadas las observaciones, son:
Primer caso
25
24
23
22
21
2
20
19
1
Segundo caso
50
40
30
20
10
0
1
17
Debido a las diferentes dispersiones (varianzas) que existen en los dos casos, la impresin visual es muy distinta. En el segundo caso no se aprecia diferencia entre los tres
grupos (el factor no parece influir), mientras que en el primer caso, la cosa no est tan
clara. Entonces, no es suficiente slo con comparar las medias de cada grupo, la variabilidad tambi influye. Lo que vamos a hacer es comparar la variabilidad entre las medias
con la variabilidad dentro de cada grupo, mediante el anlisis de la varianza.
Vamos a construir la tabla ANOVA:
Caso 1 :
ni
a X
X
(yij y )2 = 36.
SCT =
i=1 j=1
a
X
(
yi y )2 = 32
SCT ra =
i=1
SCT =
SCT ra =
XX
X
ni yi2 n
y2 = 5840 12 222 = 32
F.V.
S.C. G.L. M.C.
F
Tratamiento
32
2
16
0.05
Error
2852
9
316.889
Total
2884
11
Como F2,9;0,05 = 4,2565, no rechazamos la hiptesis nula y concluimos que el factor no
influye en la respuesta al nivel = 0,05..
19
i 6= j
H0 i 6= j ,
i 6= j
Los mtodos generales son las comparaciones mltiples y los tests de recorrido studentizado.
Comparaciones mltiples.
LSD de Fisher (Least significant dierence)
Se contrasta i = j , para todo i 6= j, (i, j = 1, . . . , a).
Se tiene que se distribuye como una t de Student:
(
yi yj ) i j
q
tNa
n1i + n1j
LSD = tN a, 2
1
1
+
ni nj
1. Si |
yi yj | > LSD = Se rechaza que i = j a nivel .
2. Si |
yi yj | < LSD = Se acepta que i = j a nivel .
Definicin. (Distribucin de recorrido estudentizada)
20
Si
Z1 , . . . , Za N(0, 1)
U 2m
independientemente, entonces,
Q = max
i6=j
U
m
Mtodo de Tukey
Se requiere que ni = n, i = 1, . . . , a. Si esto no se cumple, entonces se toma n =
mni {ni } .
1. Si |
yi yj | > qa,N a;
2. Si |
yi yj | < qa,N a;
q
q
1
n
1
n
Mtodo de Bonferroni
En este criterio se rechaza i = j (i 6= j) si
|
yi yj | > tN a, 2p
1
1
+
ni nj
tv, = z +
1 3
z z ,
4v
21
a
.
2
Ejemplos.
En el problema de comparacin del porcentaje de algodn en las prendas, las medias
muestrales eran:
yi
y1 y2
y3
y4
y5
9,8 15,4 17,6 21,6 10,8
Se tiene que
a=5
n=5
N = 25
2 = 8,06
N a = 20.
LSD de Fisher
LSD = tNa, 2
1
1
+
= t20,00 025
ni nj
8,06
2
= 3,745
5
Mtodo de Tuckey
HSD = qa,N a, =
n
8,06
q5,20,00 05 = 1,269 4,24 = 5,38
5
Mtodo de Bonferroni
Como
5
p=
= 10
2
B = tNa, 2p
1
1
+
= t20, 00 05
20
ni nj
8,06
2
5
Como
1 3
z0,0025 z0,0025 =
4 20
1
2,813 2,81 = 3,052
= 2,81 +
80
luego
B = t20, 00 05
20
2
8,06 = 3,052
5
8,06
2
= 5,48.
5
(i, j) (
yi yj ) LSD = 3,745 HSD = 5,38 B
(1,2)
5,6
6
=
6
=
(1,3)
7,8
6
=
6
=
(1,4)
11,8
6=
6=
(1,5)
1,0
=
=
(2,3)
2,2
=
=
(2,4)
6,2
6=
6
=
(2,5)
4,6
6=
=
(3,4)
4
6=
=
(3,5)
6,8
6=
6
=
(4,5)
10,8
6=
6=
= 5,48
6=
6=
6=
=
=
6=
=
=
6=
6=
1
1
+ +
n=a
n1
na
dp = rp,Na,
n
donde rp,Na, se obtiene a partir de la tabla de intervalos significativos de
Duncan.
23
Newman-Keuls.
NKp = qp,Na,
n
donde qp,Na, se obtiene a partir de la tabla de la distribucin de recorrido
studentizado.
Por ejemplo, para p = a se contrasta si
r
1
n
r
1
|
y(a) y(1) | > qa,N a;
n
|
y(a) y(1) | > ra,N a;
Para p = a 1 se contrasta si
1
n
r
1
|
y(a1) y(1) | > ra1,N a;
n
|
y(a) y(2) | > ra1,N a;
1
n
r
1
|
y(a1) y(1) | > qa1,Na;
n
|
y(a) y(2) | > qa1,Na;
2
3
4
5
6
7
8
4.02 4.22 4.33 4.4 4.47 4.53 4.58
4.02 4.64 5.02 5.29 5.51 5.69 5.84
p
rp,20,00 01
qp,20,00 01
yi
y1 y5
y2
y3
y4
9,8 10,8 15,4 17,6 21,6
Test de Newman-Keuls:
p=5
p=4
p=3
p=2
q5,20,00 05
q4,20,00 05
q3,20,00 05
q2,20,00 05
= 4,24
= 3,96
= 3,58
= 2,95
NK5
NK4
NK3
NK2
= 5,38
= 5,03
= 4,54
= 3,74
Test de Duncan:
p=5
p=4
p=3
p=2
r5,20,00 05
r4,20,00 05
r3,20,00 05
r2,20,00 05
= 3,25
= 3,18
= 3,10
= 2,95
De este modo,
25
d5
d4
d3
d2
= 4,12
= 4,04
= 3,93
= 3,74
|
yi yj |
Newman-Keuls
Duncan
|
y1 y4 | = 11,8
> 5,38
> 4,12
|
y1 y3 | = 7,8
|
y5 y4 | = 10,8
> 5,03
> 5,03
> 4,03
> 4,03
|
y1 y2 | = 5,6
|
y5 y3 | = 6,8
|
y2 y4 | = 6,2
> 4,54
> 4,54
> 4,54
> 3,93
> 3,93
> 3,93
|
y1 y5 | = 1
|
y5 y2 | = 4,6
|
y3 y2 | = 2,2
|
y3 y4 | = 4
< 3,74
> 3,74
< 3,74
> 3,74
< 3,74
> 3,74
< 3,74
> 3,74
2 3
x______y
Pa
j=1 cj
= 0.
= c1 x1 + c2 x2 + + ca xa
y la estimacin de la varianza de es
= MCE
c2a
c21
+ +
n1
na
26
>
q
(a 1)Fa1,Na, ,
1 = 1 + 3 4 5
2 = 1 4
Las estimas son
1 = x1 + x3 x4 x5 = 9,8 + 17,6 21,6 10,8 = 5,0
y como Fa1,Na,
v
r
u
5
u
X
c2i
4
t
MCE
= 8,06 = 2,54
1 =
n
5
i=1 i
r
2
2 =
8,06 = 1,8
5
p
1
2,54
se acepta la H0 .
27
se rechaza la H0 .
11,8
= 6,56 > 4,21
1,8
28
Pa Pni
i=1
j=1 dij di /(N a)
F0 = Pa
i=1 ni di d /(a 1)
donde
dij = |yij yi | ,
Pni
j=1 dij
di =
,
ni
Pa Pni
i=1
j=1 dij
.
d =
N
29
Si las varianzas son homogneas, entonces este estadstico F0 se distribuye como una
F de Snedecor, Fa1,Na, , siendo el nivel de significacin elegido.
6= 0
xij
log(xij )
=0
31
SCT ra
a1
SCE
Na
MCT ra
Fa1,Na
MCE
32
E [MCE] = 2 .
Si la hiptesis alternativa es cierta, entonces el valor esperado del numerador en F0 es
mayor que el esperado del denominador. As, se rechaza H0 para valores altos de F0 , con
lo cual, la regin crtica es unilateral superior, rechazndose si
F0 > Fa1,Na,
El procedimiento de clculo es igual que en el modelo de efectos fijos, aunque las
conclusiones se aplican a toda la poblacin de tratamientos.
2 = MCE
2 =
MCT ra MCE
n
NOTA:
Si ni , para i = 1, . . . , a son distintos entre s, se sustituye en la expresin anterior n
por
#
" a
Pa
2
X
n
1
i
.
ni Pi=1
n0 =
a
a 1 i=1
n
i=1 i
33
Ejemplo.
Una fbrica de maquinillas de afeitar utiliza una gran cantidad de mquinas en la
produccin. Se desea que las mquinas sean homogneas para producir objetos de la
misma calidad. Para investigar si existen variaciones significativas entre las mquinas,
se seleccionan 4 al azar y se mide el porcentaje de un cierto componente de la hoja. El
experimento se realiza con orden aleatorio.
Mquina
Mquina
Mquina
Mquina
1
2
3
4
98
91
96
95
97
90
95
96
99
93
97
99
96
92
95
98
yi
390
366
383
388
y = 1527
Como
F3,12,00 05 = 3,49 < 15,68
Se rechaza H0 = 0.
Estimacin de los componentes de la varianza:
2 = MCE = 1,90
2 =
MCT ra MCE
29,73 1,90
=
= 6,96.
n
4
2 +
2 = 1,90 + 6,96 = 8,86
y la mayor parte de la variabilidad se debe a diferencias entre las mquinas.
34
El intervalo de confianza para 2 no se puede calcular de modo exacto, dado que depende
de una combinacin lineal de 2 s. Por tanto se calcula el intervalo para el cociente
2
.
2 + 2
Se denomina
l1
l2
!
MCT ra
1
1
MCE Fa1,Na , 2
!
1
1 MCT ra
=
1
n
MCE Fa1,Na,1 2
1
=
n
1
F12,3,0,025
= 0,070.
De este modo
l1
l2
!
1
MCT ra
1 = 0,625
MCE Fa1,Na , 2
!
1
1 MCT ra
=
1 = 54,883
n
MCE Fa1,Na,1 2
1
=
n
35
de modo que
l1
2
l2
2
2
1 + l1
+
1 + l2
2
0,625
54,883
2
2
1, 625
+
55,883
2
0,98
0,39
2 + 2
Esto es, la variabilidad de las mquinas justifica entre el 40 % y el 98 % de la variabilidad
total.
36
Test de Kruskal-Wallis
Cuando no est justificado asumir normalidad, se puede utilizar la metodologa no
paramtrica. El test de Kruskal-Wallis propone como hiptesis nula que los a tratamientos
son iguales, frente a la hiptesis alternativa de que algunas observaciones son mayores que
otras entre los tratamientos. Se puede considerar que este test es adecuado para contrastar
la igualdad entre las medias.
Procedimiento.
Se calculan rangos de cada una de las observaciones yij de manera creciente y se reemplaza por su rango Rij , donde la menor observacin tendra el valor 1. En caso de empates,
se asigna a todas las observaciones empatadas el valor medio de sus correspondientes rangos.
Se denota como Ri la suma de los rangos del i-simo tratamiento de modo que el
estadstico es
" a
#
N(N + 1)2
1 X Ri2
H= 2
S i=1 ni
4
" a n
#
i
2
XX
1
N(N
+
1)
R2
.
S2 =
N 1 i=1 j=1 ij
4
N(N +1)
12
37
% de algodn
15
20
25
30
35
7
12
14
19
7
Observaciones
7 15 11 9
17 12 18 18
18 18 19 19
25 22 19 23
10 11 15 11
2 2 12.5 7 4
9.5 14 9.5 16.5 16.5
11 16.5 16.5 20.5 20.5
20.5 25.5 23 20.5 24
2 5 7 12.5 7
Suma
27.5
66
85
113
33.5
As, calculando
" a n
#
i
2
XX
1
N(N
+
1)
S2 =
R2
=
N 1 i=1 j=1 ij
4
1
25 262
5497,79
= 53,03
24
4
" a
#
N(N + 1)2
1 X Ri2
=
H =
S 2 i=1 ni
4
1
25 262
=
52,45
= 19,25.
53,03
4
Como H > 24,0,01 = 13,28, entonces se rechaza la hiptesis nula obtenindose la misma
conclusin que en el caso de usar el test clsico paramtrico.
38
39
MCT ra
MCE
cuando
la hiptesis nula es falsa. Se puede demostrar que en ese caso, se distribuye como una F
no centrada con a 1 y N a grados de libertad y un cierto parmetro de centralidad.
Se utilizan curvas caractersticas que dibujan la probabilidad de error de tipo II ()
frente a un parmetro donde
n
2 =
a
X
2i
i=1
a 2
=
40
a
X
ni 2i
i=1
a 2
La cantidad 2 est relacionada con el parmetro de centralidad, y se presentan habitualmente curvas para = 0,05 y = 0,01.
El parmetro anterior, depende de
1. Los valores 1 , . . . , a o bien 1 , . . . , a para los que se consideran medias distintas,
ya que obviamente dichos valores no son conocidos previamente.
2. El valor de 2 , que al ser tambin desconocido, se suele usar el valor que se obtiene
mediante una muestra piloto.
3. El nmero de rplicas por tratamiento.
As, fijados los valores de i y el valor de 2 se debe determinar n para que la potencia
sea (1 ). Una manera de hacerlo es buscando en las tablas de curvas caractersticas de
operacin.
Ejemplo.
Supongamos que en el ejemplo de las prendas el experimentador est interesado en
rechazar la igualdad entre los tratamientos con una probabilidad mnima de 0,9 (error de
tipo II: = 0,1).
Se asumen unas medias poblacionales por grupo igual a
1 = 11, 2 = 12, 3 = 15, 4 = 18, 5 = 19
de modo que la media total es =
11+12+15+18+19
5
= 15.
Entonces
n
2 =
5
X
i=1
2
2i
=
n(16 + 16 + 9 + 9)
= 1,11 n
59
(1-) Potencia
4 4,44 2,11
(4, 15)
0,3
0,7
5 5,55 2,36
(4, 20)
0,15
0,85
6 6,66 2,58
(4, 25)
0,04
0,96
Por tanto es necesario realizar, al menos, 6 rplicas.
D2 n
.
2a 2
Como es el valor mnimo, entonces se obtiene el tamao muestral adecuado para obtener
como mnimo la potencia especificada.
MCT ra
Fa1,Na
MCE
de manera que se pueden usar las tablas habituales de la F de Snedecor para determinar
el tamao muestral.
Tambin se pueden usar curvas de operacin caracterstica, donde aparecen las grficas
del error de tipo II, frente al parmetro
=
1+
n 2
2
43
Aplicacin con R
Se puede usar la librera Rcmdr de R, y ejecutar las siguientes sentencias en la ventana
de arriba de Rcmdr:
library(Rcmdr)
Datos <- read.table("C:/CursoCIII/Disenno/Practicas06/dat1Fac.txt",
header=TRUE, sep="", na.strings="NA", dec=".", strip.white=TRUE)
Datos$grupo <- factor(Datos$grupo,
labels=c('15%','20%','25%','30%','35%'))
tapply(Datos$medida, Datos$grupo, var, na.rm=TRUE)
levene.test(Datos$medida, Datos$grupo)
tapply(Datos$medida, Datos$grupo, var, na.rm=TRUE)
bartlett.test(medida ~ grupo, data=Datos)
anova(lm(medida ~ grupo, data=Datos))
tapply(Datos$medida,
tapply(Datos$medida,
tapply(Datos$medida,
tapply(Datos$medida,
Datos$grupo,
Datos$grupo,
Datos$grupo,
Datos$grupo,
44
45
# test de Tukey
TukeyHSD(aov(medida ~ elgrupo))
46
Levels
5
Values
1 2 3 4 5
Number of observations
25
47
Source
Model
Error
Corrected Total
DF
4
20
24
R-Square
0.746923
Sum of
Squares
475.7600000
161.2000000
636.9600000
Coeff Var
18.87642
Source
grupo
DF
4
Mean Square
118.9400000
8.0600000
Root MSE
2.839014
Anova SS
475.7600000
F Value
14.76
Pr > F
<.0001
medida Mean
15.04000
Mean Square
118.9400000
F Value
14.76
Pr > F
<.0001
Alpha
Error Degrees of Freedom
Error Mean Square
Critical Value of t
Least Significant Difference
0.05
20
8.06
2.08596
3.7455
t Grouping
Mean
grupo
21.600
B
B
B
17.600
15.400
C
C
C
10.800
9.800
48
Alpha
Error Degrees of Freedom
Error Mean Square
Number of Means
Critical Range
2
3.745
0.05
20
8.06
3
3.931
4
4.050
5
4.132
Duncan Grouping
Mean
grupo
21.600
B
B
B
17.600
15.400
C
C
C
10.800
9.800
49
Alpha
Error Degrees of Freedom
Error Mean Square
Number of Means
Critical Range
2
3.7454539
0.05
20
8.06
3
4.5427095
4
5.0256316
5
5.3729604
SNK Grouping
Mean
grupo
21.600
B
B
B
17.600
15.400
C
C
C
10.800
9.800
Alpha
Error Degrees of Freedom
Error Mean Square
Critical Value of Studentized Range
Minimum Significant Difference
0.05
20
8.06
4.23186
5.373
Tukey Grouping
Mean
grupo
A
A
A
21.600
17.600
C
C
C
15.400
10.800
9.800
B
B
B
D
D
D
50
Levels
6
Values
1 2 3 4 5 6
Number of observations
21
51
Source
Model
Error
Corrected Total
DF
5
15
20
R-Square
0.634720
Sum of
Squares
36.69285714
21.11666667
57.80952381
Coeff Var
2.361750
Mean Square
7.33857143
1.40777778
Root MSE
1.186498
F Value
5.21
Pr > F
0.0057
peso Mean
50.23810
Source
caja
DF
5
Type I SS
36.69285714
Mean Square
7.33857143
F Value
5.21
Pr > F
0.0057
Source
caja
DF
5
Type III SS
36.69285714
Mean Square
7.33857143
F Value
5.21
Pr > F
0.0057
Source
caja
DF
5
15
Type III SS
36.692857
21.116667
Mean Square
7.338571
1.407778
F Value
5.21
Pr > F
0.0057
Levels
6
Values
1 2 3 4 5 6
Number of observations
21
Dependent Variable:
peso
52
Source
caja
Error
Corrected Total
DF
5
15
20
Sum of
Squares
36.692857
21.116667
57.809524
Mean Square
7.338571
1.407778
.
Type 1 Estimates
Variance Component
Var(caja)
Var(Error)
Estimate
1.72026
1.40778
53