Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Experimentos Con Un Solo Factor 1
Experimentos Con Un Solo Factor 1
1. DEFINICIONES y CONCEPTOS
1.1.- EXPERIMENTO
Definicin
Concepto
Definicin
Concepto
1
- Si el Experimento se realiza durante el desarrollo normal del proceso en estudio,
se tendr adems cuidado de interferir lo menos posible en el trabajo normal y
protegerse de las interferencias no autorizadas o involuntarias en la prueba por
parte del personal adepto.
1.3.- VARIABLE
Definicin
Concepto
Variables cualitativas:
Son aquellas cuyos valores, de carcter nominal, slo pueden ser comparados
como diferentes entre s.
Ejemplos: La variable "color" puede tomar los valores rojo, azul, amarillo, etc.
La variable "empleado" puede tomar los valores Juan, Jos, Cristina, etc.
Variables continas:
Definicin
2
1.5.- OBSERVACIN
Definicin
Variable independiente.
Esta variable se llama tambin "tratamiento" y cada uno de los valores que se le
asignarn "nivel de tratamiento".
Variable dependiente.
Variables extraas.
3
Variable de bloqueo.
1.7.- REPETICIN
Definicin
Proporciona una oportunidad para que los efectos de las variables extraas,
incontroladas se compensen y permite, adems, medir el error experimental.
1.8.- ALEATORIZACIN
Definicin
Concepto
4
2. REALIZACIN
2.1. REALIZACIN DEL DISEO PROPIAMENTE DICHO
Paso 1: Definir claramente la hiptesis a comprobar
Ejemplo:
5
Hiptesis: Hay diferencias entre el tiempo necesario para la carga de un remolque
slo con mercancas pequeas, o slo con mercancas grandes, o la mezcla de
ambas.
Se tiene entonces tres niveles de tratamiento; grande (1), pequeo (2) y mixto (3).
Slo puede existir una nica variable dependiente. Esta deber tener,
necesariamente, un nivel de medida continuo, o lo ms prximo a ese extremo
que sea posible.
Ejemplo:
Esta es una parte muy importante del Diseo, ya que asegurar que las
diferencias que se encuentren entre los tratamientos son debidas a ellos mismos y
no a efectos laterales no deseados.
Un procedimiento muy fcil y comn para asignar los sujetos a los diferentes
tratamientos al azar es el siguiente:
6
Numerar los sujetos y hacer para cada sujeto un papel con el nmero
correspondiente.
Poner todos los papeles en una bolsa y mezclarlos. Extraer, para cada
tratamiento, tantos papeles "a ciegas", cuantas son las observaciones planificadas
para el mismo.
Ejemplo:
Tr 1 6 11 9 1
Tratamientos
Tr 2 2 8 5 10
Tr 3 7 4 3 12
7
Paso 8: Identificar posibles factores de "ruido" y/o variables de bloqueo
- O bien se espera que la aleatorizacin sea suficiente para que sus efectos se
contrarresten en las repeticiones de cada tratamiento. Esta posibilidad ser
aceptable slo si la variable en cuestin est fuera de nuestro control y se
considera que su influencia es bastante limitada. Su efecto se englobar dentro
del "error experimental", o "ruido".
Ejemplo:
Comprobar que el tipo de resultados que obtendremos del Experimento tal y como
lo hemos planificado, nos proporcionar efectivamente la informacin que
necesitamos.
8
Paso 10: Realizacin del Experimento
9
2.2. REALIZACIN DE LA TCNICA DE ANLISIS DE VARIANZA
Una vez se ha realizado el experimento, los datos obtenidos debern ser
procesados mediante tcnicas estadsticas apropiadas para la comprobacin de
hiptesis.
Sean
Tratamientos
Observaciones Totales Promedios
(niveles)
1 11 1 1. 1.
2 21 2 2. 2.
. . . . .
. . . . .
. . . . .
a 1 . .
.. ..
= + , = 1, , ; = 1, ,
10
Se considera ( ) = . ; ( ) = 0
= + + , = 1, , ; = 1, ,
Supuestos:
~(0, 2 ), es decir ~( + i , 2 )
yij son independientes.
En la tabla N1
.
. = . =
=1
. .
. . = . . =
=1 =1
11
El objetivo operativo que se persigue al aplicar la tcnica del ANOVA es conjeturar
sobre las hiptesis estadsticas abajo planteadas, es decir:
0 : 1 = 2 =
Probar
1 : ,
=1
=
Esto implica que
= 0
=1
Se quiere:
0 : 1 = 2 = = 0
Probar
1 : 0
Por ello, se habla de probar la igualdad de las medias o probar que los efectos de
los tratamientos son cero.
Teorema 1.
2 2
( . . ) = ( . . )2 + ( . )
=1 =1 =1 =1
= +
12
Demostracin.
2 2
( . . ) = [( . . . ) + ( . )]
=1 =1 =1 =1
2
= [( . . . )2 + 2( . . . )( . ) + ( . ) ]
=1 =1
2
= ( . . . )2 + 2 ( . . . )( . ) + ( . )
=1 =1 =1 =1 =1 =1
2
= ( . . . )2 + ( . )
=1 =1 =1
Ya que
( . ) = . = = 0
=1 =1 =1 =1
13
2
=1( )
2 = , = 1, ,
1
La suma de las varianzas de los tratamientos ponderadas puede ser expresada no
solo mediante , sino tambin mediante , esto se evidencia de la
siguiente manera:
2
( 1)12 + ( 1)22 + + ( 1)2 =1 [=1( ) ]
= =
( 1) + ( 1) + + ( 1) =1( 1) ( )
Es decir, () es un estimador de la varianza comn de cada uno de los
tratamientos.
Ahora,
=1( . . . )2
=
1 1
Es una estimacin de 2 si las medias de los tratamientos son iguales.
=
1
=
Los cuadrados medios son variables aleatorias con las siguientes propiedades:
Teorema 2.
() = 2
=1 2
2
( ) = +
1
14
Demostracin
1 2
() = [ ]= [ ( . ) ]
=1 =1
1
= [ ( 2 2 . + .2 )]
=1 =1
1
= [ 2 2 .2 + .2 ]
=1 =1 =1 =1 =1
1 1
= [ 2 .2 ]
=1 =1 =1
2
1 2 1
= [ ( + + ) ( + + ) ]
=1 =1 =1 =1
1 2
= [ [( + )2 + 2( + ) + ]
=1 =1
1 2
( + + ( + + )) ]
=1
15
1
= [ [ 2 + 2 + 2 + 2 + 2 +
2
]
=1 =1
1 2
[2 2 + 2( ) + ( )2 + + ]]
=1
1
= [ 2 + 2 + 2 + 2 + 2
=1 =1 =1 =1 =1 =1
2
+ ( 2 + 2 2 )]
=1 =1 =1
1
= [ 2 + 2 + 2 ( 2 + 2 2 )]
=1 =1
1
= [ 2 + 2 + 2 2 2 2 ] = 2
=1 =1
Teorema 3
Suponga que tiene lugar el esquema de efectos lineales descrito con anterioridad,
es decir,
~ (0, 2 )
1 2
, 2 ( . . . )2 ~ 1
=1
1 2 2
2
( . ) ~ (1)
=1 =1
( 1)
, 0 = = ~ 1,
( )
16
Entonces 0 deber rechazarse y concluirse que hay diferencias en las medias
de los tratamientos.
0 > , 1,
OJO. Tambin:
2. .
= 2
=1 =1
1 2. .
= 2 .
=1
Ejemplo 3.1:
Se trata de un experimento con un solo factor con a=5 niveles del factor y n=5
rplicas. Las 25 corridas debern realizarse de manera aleatoria. Para ilustrar
como puede aleatorizarse el orden de las corridas suponga que las corridas se
enumeran de la siguiente manera:
Tabla 2.
17
Ahora se selecciona un nmero aleatorio entre 1 y 25. Suponga que este nmero
es 8. Entonces la observacin numero 8 (20% de algodn) se corre primero. Este
proceso se repetir hasta que las 25 observaciones tengan asignada una posicin
en la secuencia de la prueba. La nica restriccin sobre la aleatorizacin en este
caso, es que si se saca de nuevo el mismo nmero (es decir 8), se descarta
Tabla 3.
18
Resultados de la variable resistencia a la tensin segn porcentaje de algodn de
la fibra
Peso
porcentual del Observaciones
algodn 1 2 3 4 5 Total promedio
15 7 7 15 11 9 49 9.8
20 12 17 12 18 18 77 15.4
25 14 18 18 19 19 88 17.6
30 19 25 22 19 23 108 21.6
35 7 10 11 15 11 54 10.8
. . = 376 . . = 15.04
0 : 1 = 2 = 3 = 4 = 5
Probar:{
1 :
Para resolver este interrogante, primero se calculan las sumas de cuadrados como
sigue:
5 5
2 ..2
=
=1 =1
(376)2
= (7)2 + (7)2 + (15)2 + + (15)2 + (11)2 = 636.96
25
1 2
..2
=
=1
2
1 (376)
= [(49)2 + + (54)2 ] = 475.76
5 25
=
19
Tabla 5. Anlisis de varianza de la resistencia a la tensin
Observ que el cuadrado medio entre los tratamientos (118.94) es varias veces
mayor que el cuadrado medio del error (8.06). Esto indica que no es posible que
las medias de los tratamientos sean iguales. En trminos formales se puede
118.94
calcular el cociente entre , 0 = = 14.76 y comparar este valor con un punto
8.06
porcentual apropiado de la cola superior de la distribucin 4,20 . Suponga que el
investigador ha seleccionado = 0.05 por tanto 0.05,4,20 = 2.87. Puesto que 0 =
14.76 > 2.87 se rechaza 0 y se concluye que por lo menos una de las medias es
diferente, es decir que el peso porcentual del algodn en la fibra afecta de manera
significativa la resistencia a la tensin media.
Ejemplo 3.2:
Codificacin de Observaciones
Los clculos del anlisis de Varianza pueden hacerse con frecuencia de manera
ms precisa o simplificada codificando las observaciones. Por ejemplo, considere
los datos de la resistencia a la tensin del ejemplo
Peso Observaciones
porcentual
del
algodn Totales ( )
1 2 3 4 5
15 -8 -8 0 -4 -6 -26
20 -3 2 -3 3 3 2
25 -1 3 3 4 4 13
30 4 10 7 4 8 33
35 -8 -5 -4 0 -4 -21
20
3-1. Suponga que se resta 15 de cada observacion. Los datos codificados se
muestran en la tabla 8. Es sencillo verificar que
()
= () + () + + () = .
() + () + + () ()
= = .
y
= .
Suponga ahora que cada una de las observaciones del ejemplo 3-1 se multiplica
por 2. Es sencillo verificar que las sumas de cuadrados de los datos transformados
son = . , = . = . . Estas sumas de
cuadrados parecen diferir considerablemente de las que se obtuvieron en el
ejemplo 3-1. Sin embargo, si se dividen por 4 (es decir, 22 ), los resultados son
idnticos. Por ejemplo, para la suma de cuadrados de los tratamientos,
1903.044 = 475.76. Asimismo, para los datos codificados, el cociente es =
(1903.044)(644.8020) = 14.76, que es idntico al cociente de los datos
originales. Por lo tanto, los anlisis de varianza son equivalentes.
. 2, . + 2,
21
Un intervalo de confianza de 100(1 ) por ciento para la diferencia en las
medias de dos tratamientos cualesquiera, por ejemplo , sera
2 2
. . 2, . . + 2,
Ejemplo 3.3:
Utilizando los datos del ejemplo 3-1 pueden encontrarse las estimaciones de la
media global y de los efectos de los tratamientos como = 37625 = 15.04
8.06 8.06
21.60 2.086 4 21.60 + 2.086
5 5
22
2.4 VERIFICACIN DE LA ADECUACIN DEL MODELO
Si
= + + , ~(0, 2 ) , .
1. Examen de residuales.
= ( +
= ) .. + (. .. ) = . .
=
2. Supuesto de normalidad.
Grfica Cuantil-Cuantil
7 Distribucin
Normal
5
3
RESIDUOS
-1
-3
-5
-5 -3 -1 1 3 5 7
Distribucin Normal
23
Para detectar puntos atpicos pueden examinarse los residuales
estandarizados:
=
Si ~(0, 2 ), entonces ~(0,1). Cuando es > 3 desviaciones
estndar, entonces la observacin correspondiente es un punto atpico
potencial.
2
residuos
-2
-4
-6
0 5 10 15 20 25
nmero de fila
24
Grfico de Residuos para Resistencia
2
residuos
-2
-4
-6
9 12 15 18 21 24
predichos
: 2 = 2 = = 2.
{ 0
1 :
= ( ) log10 2 ( 1) log10 2 ,
=1
1
c = 1 + 3(a1) [ai=1(ni 1)1 (N a)1 ],
=1( 1)2
2 =
25
La hiptesis nula se rechaza cuando:
02 > ,1
2
= | |,
01,2 ; = 1,2,
Ejemplo 3.4:
1 5 1
=1+ ( ) = 1.10
3(4) 4 20
Y el estadstico de prueba es
(0.45)
02 = 2.3026 = 0.93
(1.10)
2
Puesto que 0.05, 4 = 9.49, no puede rechazarse la hiptesis nula y se concluye
que las cinco varianzas son iguales. Se trata de la misma conclusin a la que lleg
al analizar la grfica de los residuales contra los valores ajustados.
26
Ejemplo 3.5:
Mtodo de
Observaciones .
estimacin
1 0.34 0.12 1.23 0.70 1.75 0.12 0.71 0.520 0.66
2 0.91 2.94 2.14 2.36 2.86 4.55 2.63 2.61 1.09
3 6.31 8.37 9.75 6.09 9.82 7.24 7.93 7.81 1.66
4 17.15 11.82 10.95 17.20 14.35 16.82 14.72 15.59 2.77
Implica que hay una diferencia en las estimaciones de la descarga pico promedio
obtenidas en los cuatro procedimientos. La grfica de los residuales contra los
valores ajustados, la cual se muestra en la figura 1 es preocupante porque la
forma de embudo con la boca hacia afuera indica que no se satisface el supuesto
de la varianza constante.
27
Figura 1. Grfica de los residuales contra las medias de las observaciones
para el ejemplo 3-5.
Se supone que:
() = ;
28
Tabla 9. TEV
Relacin
= 1 TEV Comentario
Sin
0 1
transformar
0.5 0.5 0.5 Raz Datos de poisson
1 1 0 Log
Raz
1.5 1.5 -0.5
recproca
2 2 -1 Recproco
Si las medias de los niveles del factor son idnticas, las medias muestrales
observadas . se comportaran como un conjunto de observaciones tomadas
al azar de una distribucin normal con media .. Y desviacin estndar .
Visualice una distribucin normal con la capacidad de ser deslizada sobre un
eje abajo del cual estn graficadas 1. , 2. , . . Si todas las medias de los son
iguales, deber haber una posicin de esta distribucin que haga evidente que
los valores . se sacaron de la misma distribucin. La falla en esta lgica es
que es desconocida.
Contrastes
DEFINICIN:
=
=1
Se llaman contraste.
29
0 : = 0
=1
1 : 0
{ =1
Utilizando .
(=1 . )2
0 = > 2 , ( )
=1 2
Utilizando F
La hiptesis nula se rechaza si
(=1 . )2
0 = > 2 ,
=1 2
. 2 , 2
=1 =1 =1
. + 2 , 2
=1 =1
Ejemplo 3.6:
Considere los datos del ejemplo 3-1. Hay cinco medias de los tratamientos y
cuatro grados de libertad entre estos tratamientos. Suponga que antes de correr el
experimento se especific la siguiente serie de comparaciones entre las medias de
los tratamientos y sus (contrastes asociados):
30
Hiptesis Contraste
0 : 4 = 5 1 = 4 + 5
0 : 1 + 3 = 4 + 5 2 = 1 + 3 + 4 5
0 : 1 = 3 3 = 1 + 3
0 : 42 = 1 + 3 + 4 + 5 4 = 1 + 42 3 4 5
Observe que los coeficientes de los contrastes son ortogonales. Utilizando los
datos de la tabla N1, se encuentra que los valores numricos de los contrastes y
de la suma de cuadrados son los siguientes:
1 = 1(108)+1(54)=-54 (54)2
1 = = 291.60
5(2)
2 = 1(49)+1(88)-1(108)-1(54)=-25 (25)2
2 = = 31.25
5(4)
3 = +1(49) 1(88) = 39 (39)2
3 = = 152.10
5(2)
4 = 1(49) + 4(77) 1(88) 1(108) 1(54) (9)2
=9 4 = = 0.81
5(20)
Suma de
Fuente de variacin G.L C.m F0 p
cuadrados
Peso porcentual del algodn 475.76 4 118.94 14.76 <0.001
1 = 4 + 5 291.60 1 291.60 36.18 >0.001
2 = 1 + 3 + 4 5 31.25 1 31.25 3.88 0.06
3 = 1 + 3 152.10 1 152.10 18.87 <0.001
4 = 1 + 42 3 4
0.81 1 0.81 0.10 0.76
5
Error 161.20 20 8.06
Total 636.96 24
Por los valores p se concluye que hay diferencias significativas entre los niveles 4
y 5 ,1 y 3 del peso porcentual del algodn, pero que el promedio de los niveles 1 y
3 no difieren del promedio de los niveles 1 y 5 con el nivel de significancia = 0.05
y que el nivel 2 no difiere del promedio de los otros cuatros niveles.
31
Mtodo de Scheff para comparar todos los contrastes
Prueba de Tukey
Ejemplo 3.7:
Para ilustrar la prueba de Tukey, se usan los datos del experimento del peso
porcentual del algodn del ejemplo 3-1. Con = 0.05 y = 20 grados de libertad
para el error se obtiene que 0.05 (5,20) = 4.23 (estadstico del rango studentizado)
8.06
Por tanto se tiene: 0.05 = 0.05 (5,20) = 4.23 = 5.37
5
Cualquier para de promedios del peso porcentual del algodn que difiera en valor
absoluto por ms de 5.37 implicara que el par correspondiente de las medias
poblacionales son significativamente diferentes.
Los valores marcados con asteriscos indican pares de medias que son
significativamente diferentes.
Ejemplo 3.8:
Utilizando procedimiento LSD, si se usan los datos del experimento del ejemplo 3-
1, la LSD con = 0.05 es
2 2(8.06)
= 0.025,20 = 2.086 = 3.75
5
32
Por tanto cualquier par de promedios de los tratamientos que difiera del valor
absoluto por ms de 3.75 implicara que el par correspondiente de medias
poblacionales es diferente.
Los valores marcados con asteriscos indican pares de medias que son
significativamente diferentes.
Ejemplo 3.9:
1. = 9.8
5. = 10.8
2. = 15.4
3. = 17.6
4. = 21.6
33
El error estndar de cada promedio es = 8.065 = 1.27. En el conjunto de
rangos significativos de la tabla del estadstico del rango studentizado para 20
grados de libertad y = 0.05 , se obtiene 0.05 (2,20) = 2.95, 0.05 (3,20) = 3.10,
0.05 (4,20) = 3.18 0.05 (5,20) = 3.25. Por lo tanto, los rangos de significacin
mnima son
Por el anlisis se observa que hay diferencias significativas entre todos los pares
de medias con excepcin de la 3 y la 2 y la 5 y la 1. Observe que en este ejemplo
la prueba de rango mltiple de Duncan y el mtodo LSD llevan a conclusiones
idnticas.
Ejemplo 3.10:
2 2(8.06)
0.05 (4,20) = 2.65 = 4.76
5
Por lo tanto, cualquier media de los tratamientos que difiera del control por ms de
4.76 se declarara significativamente diferente. Las diferencias observadas son
El parmetro usado es
2
=1 2
=
2
La magnitud 2 est relacionada con el parmetro de no centralidad.
35
Ejemplo 3.11:
1 = 11 2 = 12 3 = 15 4 = 18 5 = 19
1 75
Planea utilizar = 0.01 en este caso, puesto que = 5 5=1 = = 15 y
5
1 = 1 = 11 15 = 4
2 = 2 = 12 15 = 3
3 = 3 = 15 15 = 0
4 = 4 = 18 15 = 3
5 = 5 = 19 15 = 4
Por lo tanto 5=1 2 = 50. Suponga que el investigador piensa que la desviacin
estndar de la resistencia a la tensin con cualquier nivel particular del peso
porcentual del algodn no ser mayor que = 3 . Entonces se tiene que:
5=1 2 (50)
2
= = = 1.11
2 5(3)2
Tabla 10.
( ) Potencia (
4 4.44 2.11 15 0.30 0.70
5 5.55 2.36 20 0.15 0.85
6 6.66 2.58 25 0.04 0.96
Por tanto, deben realizarse al menos = 6 replicas para obtener una prueba con
la potencia requerida.
36
2.7 MTODOS NO PARAMTRICOS EN EL ANLISIS DE
VARIANZA
Prueba de Kruskal Wallis.
El estadstico de prueba
1 .2 ( + 1
= 2 [ ]
4
=1
Si
2
> ,1
Ejemplo 3.12:
2
1 2 ( + 1)2
= [ ( ) ]
1 4
=1 =1
1 25(26)2
= [5497.79 ]
24 4
= 53.03
37
Tabla 11. Datos y rangos para el experimento de la resistencia a la tensin
del ejemplo 3-1
Y el estadstico de prueba es
1 2 ( + 1)2
= 2 [ ]
4
=1
1 25(26)2
= [5245.0 ]
53.03 4
= 19.25
2
Puesto que > 0.01,4 , 4 = 13.28, se rechazara la hiptesis nula y se concluira
que los tratamientos difieren.
38