Está en la página 1de 38

EXPERIMENTOS CON UN SOLO FACTOR: ANALISIS DE VARIANZA

1. DEFINICIONES y CONCEPTOS

1.1.- EXPERIMENTO

Definicin

El trmino "Experimento" se refiere a la creacin y preparacin de lotes de prueba


que verifiquen la validez de las hiptesis establecidas sobre las causas de un
determinado problema o defecto, objeto de estudio.

Concepto

En un Experimento, el experimentador escoge ciertos factores para su estudio, los


altera deliberadamente de forma controlada y despus, observa el efecto
resultante.

El Experimento puede realizarse bien en laboratorio o bien en el exterior: En la


fbrica, en unos almacenes, en los locales del usuario, etc.

1.2.- DISEO DE EXPERIMENTOS

Definicin

Metodologa estadstica destinada a la planificacin y anlisis de un Experimento.

Concepto

El Diseo de un Experimento debe garantizar que este cumpla ciertos requisitos


mnimos:

- Debe poder comprobar las hiptesis objeto de estudio, no dejndose confundir


por variables insospechadas (=ruido), como errores de medida
desproporcionados, etc.

- Debe poder revelar la existencia de cualquier causa importante de variacin,


aunque no haya sido adelantada como hiptesis.

- Debe mantener los costes de experimentacin a un nivel razonable, en


comparacin con el problema objeto de estudio.

- Debe tener un alto grado de seguridad en las respuestas.

- Si el Experimento se realiza en un laboratorio, ste ha de ser, respecto a las


variables estudiadas, un buen indicador de las pruebas que se obtendran en el
taller o "in situ".

1
- Si el Experimento se realiza durante el desarrollo normal del proceso en estudio,
se tendr adems cuidado de interferir lo menos posible en el trabajo normal y
protegerse de las interferencias no autorizadas o involuntarias en la prueba por
parte del personal adepto.

1.3.- VARIABLE

Definicin

Caracterstica de un objeto que puede ser observada y que puede tomar


diferentes valores, tanto en el mismo objeto como entre diferentes objetos.

Concepto

En base a la posibilidad de medida se distinguen dos tipos fundamentales de


variables:

Variables cualitativas:

Son aquellas cuyos valores, de carcter nominal, slo pueden ser comparados
como diferentes entre s.

Ejemplos: La variable "color" puede tomar los valores rojo, azul, amarillo, etc.

La variable "empleado" puede tomar los valores Juan, Jos, Cristina, etc.

Variables continas:

Son aquellas cuyos valores, de carcter numrico, permiten realizar un mayor


nmero de comparaciones. Una variable continua permite tericamente, un infinito
nmero de valores entre dos valores consecutivos. (En la realidad la precisin de
los instrumentos de medida pone un lmite operativo).

Ejemplos: La variable "peso de la tableta de chocolate" puede tomar cualquier


valor entre 95 y 110 gr. La variable "consumo de gasolina por 100 Km" puede
tomar cualquier valor entre 9 y 15 litros etc.

1.4.- SUJETO O UNIDAD EXPERIMENTAL

Definicin

El sujeto o unidad experimental es la unidad bsica sobre la que se efecta el


proceso de medida.

Ejemplo: El contenido de azcar en el zumo de naranja producido se medir


recogiendo cada hora una unidad experimental de 1 litro de zumo.

2
1.5.- OBSERVACIN

Definicin

Una observacin es una toma de medida de una variable y consta entonces de un


valor de la misma. Dependiendo del tipo de Diseo, las observaciones pueden
tomarse a diferentes sujetos o al mismo sujeto de manera secuencial.

1.6.- DIFERENTES TIPOS DE VARIABLES EN EL DISEO DE UN


EXPERIMENTO

En un Diseo de Experimento se distinguen los siguientes tipos de variables,


segn el contenido conceptual, o papel que tienen en el mismo.

Variable independiente.

Es el factor (causa) que suponemos influye sobre la caracterstica que medimos


(defecto, error, etc). Para comprobar su influencia, el investigador la manipular
durante el Experimento, en el sentido que le asignar valores diferentes a cada
observacin.

Esta variable se llama tambin "tratamiento" y cada uno de los valores que se le
asignarn "nivel de tratamiento".

En este Procedimiento se consideran slo Experimentos con una nica variable


independiente.

Si se quiere o necesita manipular ms de una variable independiente, ser


necesaria la colaboracin de un experto en estadstica, puesto que el Diseo del
Experimento y la interpretacin de los resultados se complican notablemente.

Variable dependiente.

Es aquella variable que se mide en cada observacin del Experimento, para


establecer si la variable independiente efectivamente influye sobre sus valores.

Variables extraas.

Son todas aquellas que el investigador no puede manipular, pero influyen en la


variable dependiente. Son la causa de que las observaciones en un mismo nivel
de tratamiento no necesariamente arrojen el mismo valor de medida.

El conjunto de variables extraas se denomina generalmente en el Diseo y


Anlisis de Experimentos "ruido" o "error experimental".

3
Variable de bloqueo.

Es una variable que sabemos puede intervenir en los niveles de la variable


dependiente y decidimos eliminar su influencia mediante el control de la misma,
creando bloques de observaciones, en los que esta variable, asume
respectivamente un valor constante. A cada bloque se asignarn todos los niveles
de tratamiento.

Con la creacin de bloques se persiguen dos objetivos:

- Aislar el efecto de los tratamientos, eliminando la influencia de la variable de


bloqueo.

- Estimar los efectos de los bloques.

1.7.- REPETICIN

Definicin

Reiteracin de una observacin o medida al mismo nivel de tratamiento.

Proporciona una oportunidad para que los efectos de las variables extraas,
incontroladas se compensen y permite, adems, medir el error experimental.

1.8.- ALEATORIZACIN

Definicin

Tcnica utilizada para reducir la influencia no predeterminable de variables


extraas sobre los resultados del Experimento.

Concepto

La aleatorizacin consiste en asignar los sujetos a los distintos niveles de


tratamiento al azar, con la esperanza de que los efectos extraos se contrarresten
entre los distintos sujetos y observaciones que componen cada nivel de
tratamiento (condicin experimental).

La aleatorizacin es fundamental en el Diseo de Experimentos ya que:

a) Previene la existencia de sesgo.

b) Evita la dependencia entre observaciones.

c) Confirma la adecuacin de los procedimientos estadsticos para el anlisis de


los resultados del Experimento.

4
2. REALIZACIN
2.1. REALIZACIN DEL DISEO PROPIAMENTE DICHO
Paso 1: Definir claramente la hiptesis a comprobar

Es de importancia fundamental identificar de forma muy especfica el objetivo del


Experimento, es decir, la pregunta exacta que se quiere contestar o la hiptesis
que se necesita contrastar.

Esta pregunta bsica se formular por escrito.

Paso 2: Identificar la variable independiente

La variable independiente representa la caracterstica que, suponemos, influye


sobre los valores de la variable dependiente.

Puesto que, para la realizacin del Experimento, se le asignarn diferentes


valores, hay que asegurarse que est en nuestro poder manipularla.

Paso 3: Establecer los tratamientos

En base a la naturaleza de la variable, las condiciones reales del proceso o


situacin y la pregunta especfica que se quiere contestar, se identificarn los
valores o el recorrido de valores de la variable independiente, relevantes para el
Experimento y se establecern los tratamientos a efectuar.

Paso 4: Decidir el nmero de repeticiones para cada tratamiento

Es absolutamente aconsejable realizar varias observaciones para cada nivel de


tratamiento (condicin experimental), para que los errores de medida e influencias
no controladas de variables extraas puedan contrarrestarse entre s.

Ejemplo:

Se desea hacer un estudio de transporte de mercancas.

La idea que se tiene en la cabeza es que el tamao de los paquetes afecta al


tiempo necesario para la carga del volumen disponible en un remolque.

La variables independiente estar relacionada entonces con el tamao de los


paquetes a transportar.

Se distinguirn dos tipos de paquetes, los que exceden el tamao de 60x60x60


cm, a los que llamarn grandes, y los menores de estas dimensiones, a los que se
llamarn pequeos.

5
Hiptesis: Hay diferencias entre el tiempo necesario para la carga de un remolque
slo con mercancas pequeas, o slo con mercancas grandes, o la mezcla de
ambas.

Se tiene entonces tres niveles de tratamiento; grande (1), pequeo (2) y mixto (3).

Se decide realizar cuatro observaciones (repeticiones) para cada tratamiento.

Paso 5: Definir los sujetos sobre los que se va a realizar la medida

Paso 6: Determinar la variable dependiente

Slo puede existir una nica variable dependiente. Esta deber tener,
necesariamente, un nivel de medida continuo, o lo ms prximo a ese extremo
que sea posible.

Cuantas ms posibilidades de apreciar diferencias entre distintas observaciones


ofrezca la variable dependiente, ms se favorecer la sensibilidad de la misma a
los distintos tratamientos.

Ejemplo:

En el ejemplo de transporte de mercancas, los sujetos de medicin deberan ser


diferentes remolques, pero utilizar varios remolques para cada tratamiento exigir
una facturacin por encima de la normal.

Lo que se puede hacer es dividir un remolque en varias parcelas de igual tamao


y determinar como sujeto cada una de las parcelas.

Se divide entonces un remolque en 12 cajoneras aprovechables de igual tamao.

A cada condicin experimental se le asignan cuatro cajoneras.

La variable dependiente va ser el tiempo necesario para completar la carga de una


cajonera.

Paso 7: Explicitar el procedimiento de aleatorizacin

Esta es una parte muy importante del Diseo, ya que asegurar que las
diferencias que se encuentren entre los tratamientos son debidas a ellos mismos y
no a efectos laterales no deseados.

Un procedimiento muy fcil y comn para asignar los sujetos a los diferentes
tratamientos al azar es el siguiente:

6
Numerar los sujetos y hacer para cada sujeto un papel con el nmero
correspondiente.

Poner todos los papeles en una bolsa y mezclarlos. Extraer, para cada
tratamiento, tantos papeles "a ciegas", cuantas son las observaciones planificadas
para el mismo.

Ejemplo:

Volviendo al ejemplo: se ha dividido el remolque en 12 cajoneras.

Se trata ahora de asignar a cada tratamiento 4 cajoneras.

Se asigna primero un nmero a cada cajonera y se escribe un papel para cada


nmero.

Luego se extraen 4 nmeros aciegas: las cajoneras correspondientes se


utilizarn para el tratamiento 1 (paquetes grandes).

Los prximos 4 papelitos que se extraigan indicarn las cajoneras destinadas al


tratamiento 2 (paquetes pequeos), y las 4 cajoneras restantes servirn para el
tratamiento 3 (paquetes mixtos).

Tr 1 6 11 9 1
Tratamientos

Tr 2 2 8 5 10

Tr 3 7 4 3 12

7
Paso 8: Identificar posibles factores de "ruido" y/o variables de bloqueo

Analizar la futura situacin experimental e identificar los factores que puedan,


adems de la variable independiente, influir sobre los valores de la variable
dependiente. Segn su relevancia y las posibilidades tcnicas, la decisin a
adoptar respecto a los factores de ruido y/o variables de bloqueo, ser la
siguiente:

- O bien tenerlos bajo control (constantes), a lo largo de todas las observaciones.

- O bien integrarlos en el Diseo, como variable de bloqueo.

- O bien transformarlos en una variable independiente. Esto ser necesario,


aunque se complique notablemente el Diseo de Experimento desde el punto de
vista estadstico, cuando su influencia sobre la variable dependiente resulte ser
relevante.

- O bien se espera que la aleatorizacin sea suficiente para que sus efectos se
contrarresten en las repeticiones de cada tratamiento. Esta posibilidad ser
aceptable slo si la variable en cuestin est fuera de nuestro control y se
considera que su influencia es bastante limitada. Su efecto se englobar dentro
del "error experimental", o "ruido".

Ejemplo:

Un posible factor de ruido influye en el tiempo necesario para la carga de los


paquetes, mezclndose al efecto del tamao de los paquetes, puede ser el
cansancio del personal de carga.

Se intenta entonces mantener esta variable lo ms constante posible a lo largo del


experimento, realizando siempre solo una observacin (= carga de una cajonera)
por da, y siempre a primera hora.

Paso 9: Asegurarse de la aptitud del Diseo del Experimento para contestar


la pregunta inicial

Comprobar que el tipo de resultados que obtendremos del Experimento tal y como
lo hemos planificado, nos proporcionar efectivamente la informacin que
necesitamos.

El resultado de este paso ser el Diseo, propiamente dicho, del Experimento.

8
Paso 10: Realizacin del Experimento

Se crearn las condiciones experimentales (tratamientos) y se efectuarn las

observaciones segn el plan establecido, teniendo un cuidado particular en evitar


posibles influencias extraas sobre los valores de la variable dependiente.

Se registrarn los resultados del Experimento, anotando adems toda la


informacin posiblemente relevante sobre las circunstancias prcticas de cada

observacin. (Persona que realiza la medicin, hora, temperatura, etc...).

Ejemplo: Resultados de las mediciones realizadas sobre los tiempos de carga

Tratamiento Tiempos de carga


Tr 1 6,10 5,40 6,80 5,68
Tr 2 10,90 10,20 9,20 11,90
Tr 3 6,70 6,08 7,10 5,93

9
2.2. REALIZACIN DE LA TCNICA DE ANLISIS DE VARIANZA
Una vez se ha realizado el experimento, los datos obtenidos debern ser
procesados mediante tcnicas estadsticas apropiadas para la comprobacin de
hiptesis.

Cuando el objetivo es juzgar sobre la validez de hiptesis estadsticas


relacionadas con las medias de tratamientos el anlisis de varianza es la
herramienta apropiada para ello, se presentan a continuacin los elementos
metodolgicos de aplicacin de esta tcnica:

Sean

son los valores de la variable dependiente evaluada en el tratamiento y la


observacin .

Se consideran tratamientos y observaciones (replicas).

Bajo estos supuestos los valores de la variable dependiente pueden ser


presentados en la siguiente tabla:

Tabla 1. Datos tpicos de un experimento de un solo factor

Tratamientos
Observaciones Totales Promedios
(niveles)
1 11 1 1. 1.
2 21 2 2. 2.
. . . . .
. . . . .
. . . . .
a 1 . .
.. ..

Los valores anteriores se presentan de manera recurrente as:

Modelos Estadsticos lineales:

a) Modelo de las medias

= + , = 1, , ; = 1, ,

10
Se considera ( ) = . ; ( ) = 0

b) Modelo de los efectos

= + + , = 1, , ; = 1, ,

Requisito: que el experimento se lleve a cabo en orden aleatorio para que el


ambiente en el que se apliquen los tratamientos sea lo ms uniforme posible.

Objetivos: Probar las hiptesis apropiadas acerca de las medias de los


tratamientos y estimarlas.

Supuestos:

~(0, 2 ), es decir ~( + i , 2 )
yij son independientes.

Tipos de modelos de efectos:

a) Fijos: El experimentador escoge los niveles en los que va a realizar los


experimentos.

b) Aleatorios: Los tratamientos son una muestra de una poblacin ms grande


de tratamientos.

ANALISIS DEL MODELO CON EFECTOS FIJOS

En la tabla N1

.
. = . =

=1


. .
. . = . . =

=1 =1

11
El objetivo operativo que se persigue al aplicar la tcnica del ANOVA es conjeturar
sobre las hiptesis estadsticas abajo planteadas, es decir:

0 : 1 = 2 =

Probar

1 : ,

Por lo general, se considera como media global, as:

=1
=

Esto implica que

= 0
=1

Se quiere:

0 : 1 = 2 = = 0

Probar

1 : 0

Por ello, se habla de probar la igualdad de las medias o probar que los efectos de
los tratamientos son cero.

Una consideracin importante para establecer un criterio sobre el cual juzgar la


veracidad o no de las hiptesis formuladas en la prueba se demuestra a
continuacin:

Teorema 1.

2 2
( . . ) = ( . . )2 + ( . )
=1 =1 =1 =1

= +

12
Demostracin.

2 2
( . . ) = [( . . . ) + ( . )]
=1 =1 =1 =1

2
= [( . . . )2 + 2( . . . )( . ) + ( . ) ]
=1 =1

2
= ( . . . )2 + 2 ( . . . )( . ) + ( . )
=1 =1 =1 =1 =1 =1

2
= ( . . . )2 + ( . )
=1 =1 =1

Ya que

( . ) = . = = 0
=1 =1 =1 =1

Es frecuente encontrar en la literatura la denominacin siguiente para las


expresiones utilizadas:

- Variacin total de los datos es la combinacin de:

Suma de cuadrados de los errores


- Variacin debida al azar (Variacin dentro de las muestras) y

Suma de cuadrados debida a los tratamientos


-Variacin debida al azar cuando la hiptesis nula es verdadera
(Variacin entre los tratamientos).

Tiene 1 grados de libertad

- Tiene 1 grados de libertad

- Tiene ( 1) = = grados de libertad

2 - Varianza muestral del tratamiento

13
2
=1( )
2 = , = 1, ,
1
La suma de las varianzas de los tratamientos ponderadas puede ser expresada no
solo mediante , sino tambin mediante , esto se evidencia de la
siguiente manera:

2
( 1)12 + ( 1)22 + + ( 1)2 =1 [=1( ) ]
= =
( 1) + ( 1) + + ( 1) =1( 1) ( )


Es decir, () es un estimador de la varianza comn de cada uno de los
tratamientos.

Ahora,

=1( . . . )2
=
1 1
Es una estimacin de 2 si las medias de los tratamientos son iguales.

A las expresiones obtenidas se les denomina Cuadrados Medios, as:


=
1


=

Los cuadrados medios son variables aleatorias con las siguientes propiedades:

Teorema 2.

() = 2

=1 2
2
( ) = +
1

14
Demostracin

1 2
() = [ ]= [ ( . ) ]

=1 =1

1
= [ ( 2 2 . + .2 )]

=1 =1

1
= [ 2 2 .2 + .2 ]

=1 =1 =1 =1 =1

1 1
= [ 2 .2 ]

=1 =1 =1
2

1 2 1
= [ ( + + ) ( + + ) ]

=1 =1 =1 =1


1 2
= [ [( + )2 + 2( + ) + ]

=1 =1

1 2
( + + ( + + )) ]

=1

15

1
= [ [ 2 + 2 + 2 + 2 + 2 +
2
]

=1 =1

1 2
[2 2 + 2( ) + ( )2 + + ]]

=1

1
= [ 2 + 2 + 2 + 2 + 2

=1 =1 =1 =1 =1 =1

2
+ ( 2 + 2 2 )]
=1 =1 =1

1
= [ 2 + 2 + 2 ( 2 + 2 2 )]

=1 =1

1
= [ 2 + 2 + 2 2 2 2 ] = 2

=1 =1

Las anteriores consideraciones sirven para formular el teorema que explicita el


anlisis estadstico seguido en la aplicacin de ANOVA para comprobar la media
de tratamientos.

Teorema 3

Suponga que tiene lugar el esquema de efectos lineales descrito con anterioridad,
es decir,

~ (0, 2 )

1 2
, 2 ( . . . )2 ~ 1

=1


1 2 2
2
( . ) ~ (1)

=1 =1

( 1)
, 0 = = ~ 1,
( )

16
Entonces 0 deber rechazarse y concluirse que hay diferencias en las medias
de los tratamientos.

0 > , 1,

OJO. Tambin:

2. .
= 2

=1 =1


1 2. .
= 2 .

=1

Ejemplo 3.1:

Un ingeniero de desarrollo de productos tiene inters en investigar la resistencia a


la tensin de una fibra sinttica nueva que se usar para hacer telas de camisas
para caballero. El ingeniero sabe por experiencia previa que la resistencia a la
tensin se afecta por el peso porcentual del algodn utilizado en la mezcla de
materiales de la fibra. Adems, sospecha que al aumentar el contenido de algodn
deber variar ente 10 y 40 por ciento para que el producto final tenga otras
caractersticas de calidad que se desean (como la capacidad de ser sometido a un
tratamiento de planchado permanente). El ingeniero decide probar ejemplares en
cinco niveles del peso porcentual del algodn: 15, 20, 25, 30 y 35 por ciento.
Tambin decide probar cinco ejemplares en cada nivel del contenido de algodn.

Se trata de un experimento con un solo factor con a=5 niveles del factor y n=5
rplicas. Las 25 corridas debern realizarse de manera aleatoria. Para ilustrar
como puede aleatorizarse el orden de las corridas suponga que las corridas se
enumeran de la siguiente manera:

Tabla 2.

Peso porcentual del


algodn Nmero de corrida experimental
15 1 2 3 4 5
20 6 7 8 9 10
25 11 12 13 14 15
30 16 17 18 19 20
35 21 22 23 24 25

17
Ahora se selecciona un nmero aleatorio entre 1 y 25. Suponga que este nmero
es 8. Entonces la observacin numero 8 (20% de algodn) se corre primero. Este
proceso se repetir hasta que las 25 observaciones tengan asignada una posicin
en la secuencia de la prueba. La nica restriccin sobre la aleatorizacin en este
caso, es que si se saca de nuevo el mismo nmero (es decir 8), se descarta

Suponga que la secuencia de la prueba es:

Tabla 3.

Secuencia de prueba Nmero de corrida Peso porcentual del


(cod) algodn
1 8 20
2 18 30
3 10 20
4 23 35
5 17 30
6 5 15
7 14 25
8 6 20
9 15 25
10 20 30
11 9 20
12 4 15
13 12 25
14 7 20
15 1 15
16 24 35
17 21 35
18 11 25
19 2 15
20 13 25
21 22 35
22 16 30
23 25 35
24 19 30
25 3 15

Supongamos que el ingeniero corre la prueba en el orden aleatorio que se ha


determinado. En la siguiente tabla se muestran las observaciones que se obtienen
para la resistencia a la tensin.

18
Resultados de la variable resistencia a la tensin segn porcentaje de algodn de
la fibra

Tabla 4. Datos del experimento de la resistencia a la Tensin

Peso
porcentual del Observaciones
algodn 1 2 3 4 5 Total promedio
15 7 7 15 11 9 49 9.8
20 12 17 12 18 18 77 15.4
25 14 18 18 19 19 88 17.6
30 19 25 22 19 23 108 21.6
35 7 10 11 15 11 54 10.8
. . = 376 . . = 15.04

Se usar el anlisis de varianza para probar:

0 : 1 = 2 = 3 = 4 = 5
Probar:{
1 :

Para resolver este interrogante, primero se calculan las sumas de cuadrados como
sigue:
5 5
2 ..2
=
=1 =1

(376)2
= (7)2 + (7)2 + (15)2 + + (15)2 + (11)2 = 636.96
25
1 2
..2
=

=1

2
1 (376)
= [(49)2 + + (54)2 ] = 475.76
5 25
=

= 636.96 475.76 = 161.20

19
Tabla 5. Anlisis de varianza de la resistencia a la tensin

Fuente de Suma de Grados de Cuadrado


Valor p
variacin cuadrados libertad medio
Peso
porcentual 475.76 4 118.94. 14.76 <0.01
del algodn
Error 161.20 20 8.06
Total 636.96 24

Observ que el cuadrado medio entre los tratamientos (118.94) es varias veces
mayor que el cuadrado medio del error (8.06). Esto indica que no es posible que
las medias de los tratamientos sean iguales. En trminos formales se puede
118.94
calcular el cociente entre , 0 = = 14.76 y comparar este valor con un punto
8.06
porcentual apropiado de la cola superior de la distribucin 4,20 . Suponga que el
investigador ha seleccionado = 0.05 por tanto 0.05,4,20 = 2.87. Puesto que 0 =
14.76 > 2.87 se rechaza 0 y se concluye que por lo menos una de las medias es
diferente, es decir que el peso porcentual del algodn en la fibra afecta de manera
significativa la resistencia a la tensin media.

Ejemplo 3.2:

Codificacin de Observaciones

Los clculos del anlisis de Varianza pueden hacerse con frecuencia de manera
ms precisa o simplificada codificando las observaciones. Por ejemplo, considere
los datos de la resistencia a la tensin del ejemplo

Tabla 6. Datos Codificados de la resistencia a la tensin del ejemplo 3-2

Peso Observaciones
porcentual
del
algodn Totales ( )
1 2 3 4 5

15 -8 -8 0 -4 -6 -26
20 -3 2 -3 3 3 2
25 -1 3 3 4 4 13
30 4 10 7 4 8 33
35 -8 -5 -4 0 -4 -21

20
3-1. Suponga que se resta 15 de cada observacion. Los datos codificados se
muestran en la tabla 8. Es sencillo verificar que


()
= () + () + + () = .

() + () + + () ()
= = .

y

= .

Al comparar estas sumas de cuadrados con las que se obtuvieron en el ejemplo 3-


1, se observa que al restar una constante de los datos originales las sumas de
cuadrados no se modifican.

Suponga ahora que cada una de las observaciones del ejemplo 3-1 se multiplica
por 2. Es sencillo verificar que las sumas de cuadrados de los datos transformados
son = . , = . = . . Estas sumas de
cuadrados parecen diferir considerablemente de las que se obtuvieron en el
ejemplo 3-1. Sin embargo, si se dividen por 4 (es decir, 22 ), los resultados son
idnticos. Por ejemplo, para la suma de cuadrados de los tratamientos,
1903.044 = 475.76. Asimismo, para los datos codificados, el cociente es =
(1903.044)(644.8020) = 14.76, que es idntico al cociente de los datos
originales. Por lo tanto, los anlisis de varianza son equivalentes.

Adems, de comprobar la veracidad de las hiptesis sobre la igualdad de las


medias el anlisis estadstico permite estimar los parmetros en los modelos que
definen los valores de la variable dependiente, as:

2.3 ESTIMACIN DE LOS PARMETROS DEL MODELO


Un estimador puntual de sera = + = . . Ahora bien, si se supone que
los errores siguen una distribucin normal, cada . es una NID (( , 2 ). Por lo
tanto, si 2 fuera conocida, podra usarse la distribucin normal para definir el
intervalo de confianza. Al utilizar como estimador de 2 , el intervalo de
confianza se basara en la distribucin . Por lo tanto, un intervalo de confianza de
100(1 ) por ciento para la media del tratamiento es


. 2, . + 2,

21
Un intervalo de confianza de 100(1 ) por ciento para la diferencia en las
medias de dos tratamientos cualesquiera, por ejemplo , sera

2 2
. . 2, . . + 2,

Ejemplo 3.3:

Utilizando los datos del ejemplo 3-1 pueden encontrarse las estimaciones de la
media global y de los efectos de los tratamientos como = 37625 = 15.04

1 = 1 . . . = 9.80 15.04 = 5.24

2 = 2 . . . = 15.40 15.04 = +0.36

3 = 3 . . . = 17.60 15.04 = 2.56

4 = 4 . . . = 21.60 15.04 = +6.56

5 = 5 . . . = 10.80 15.04 = 4.24

Un intervalo de confianza de 95% para la media del tratamiento 4 (30% de


algodn) se calcula con la ecuacin 3-12 como

8.06 8.06
21.60 2.086 4 21.60 + 2.086
5 5

21.60 2.65 4 21.60 + 2.65

Por lo tanto, el intervalo de confianza de 95% deseado es


18.95 4 24.25.

22
2.4 VERIFICACIN DE LA ADECUACIN DEL MODELO
Si

= + + , ~(0, 2 ) , .

Entonces, la tcnica de ANOVA es una prueba exacta para la hiptesis de que no


hay diferencias en las medias de los tratamientos.

En la prctica estos supuestos no se cumplen siempre. Por ello, en todo anlisis


deben realizarse acciones para verificar la adecuacin del modelo:

1. Examen de residuales.

Definicin: El residual de la en el es.

= ( +
= ) .. + (. .. ) = . .
=

Los residuales debern estar sin estructura.

2. Supuesto de normalidad.

Graficar el histograma de los residuales (la grfica debe aparecer como


grfica normal con centro en cero).
Graficar la probabilidad normal de los residuales (deber aparecer como
una lnea recta). Shapiro- Wilks. .(Fig. 3-4).

Grfica Cuantil-Cuantil

7 Distribucin
Normal
5

3
RESIDUOS

-1

-3

-5
-5 -3 -1 1 3 5 7
Distribucin Normal

Examen de puntos atpicos.

23
Para detectar puntos atpicos pueden examinarse los residuales
estandarizados:

=

Si ~(0, 2 ), entonces ~(0,1). Cuando es > 3 desviaciones
estndar, entonces la observacin correspondiente es un punto atpico
potencial.

3. Supuesto de independencia de las observaciones.

Graficar los residuales en el orden temporal. (no debe haber tendencias).


.(Fig. 3-5).

Grfico de Residuos para Resistencia

2
residuos

-2

-4

-6
0 5 10 15 20 25
nmero de fila

Graficar los residuales contra los valores ajustados.(Fig. 3-6).

24
Grfico de Residuos para Resistencia

2
residuos

-2

-4

-6
9 12 15 18 21 24
predichos

4. Supuesto de igualdad de la varianza.

La prueba para probar igualdad de varianza se formula as:

: 2 = 2 = = 2.
{ 0
1 :

El procedimiento utilizado es la prueba de Bartlett.

El estadstico de prueba es.



02 = 2.3026 ,

= ( ) log10 2 ( 1) log10 2 ,
=1

1
c = 1 + 3(a1) [ai=1(ni 1)1 (N a)1 ],

=1( 1)2
2 =

25
La hiptesis nula se rechaza cuando:

02 > ,1
2

Prueba de Levene modificada

Utiliza las desviaciones absolutas de las observaciones con respecto a las


medianas

= | |,
01,2 ; = 1,2,

El estadstico de Levene es el estadstico ANOVA usual para probar la igualdad


de las medias que se aplica a las desviaciones absolutas.

Ejemplo 3.4:

Ya que el supuesto de normalidad no est en entredicho, la prueba de Barlett


puede aplicarse a los datos de la resistencia a la tensin del experimento del peso
porcentual de algodn del ejemplo 3-1. Se calculan primero las varianzas
muestrales de cada tratamiento y se encuentra que 12 = 11.2, 22 = 9.8, 32 =
4.3, 42 = 6.8 52 = 8.2. Entonces

4(11.2) + 4(9.8) + 4(4.3) + 4(6.8) + 4(8.2)


2 = = 8.06
20
= 20 log10 (8.06) 4[log10 11.2 + log10 9.8 + log10 4.3 + log10 6.8 + log10 8.2]
= 0.45

1 5 1
=1+ ( ) = 1.10
3(4) 4 20

Y el estadstico de prueba es

(0.45)
02 = 2.3026 = 0.93
(1.10)

2
Puesto que 0.05, 4 = 9.49, no puede rechazarse la hiptesis nula y se concluye
que las cinco varianzas son iguales. Se trata de la misma conclusin a la que lleg
al analizar la grfica de los residuales contra los valores ajustados.

26
Ejemplo 3.5:

Un Ingeniero Civil est interesado en determinar si cuatro mtodos diferentes para


estimar la frecuencia de las inundaciones producen estimaciones de la descarga
pico cuando se aplican a la misma cuenca. Cada procedimiento se usa seis veces
en la cuenca, y los datos de las descargas resultantes (en pies cbicos por
segundo) se muestran en la parte superior de la tabla 7.

Tabla 7. Datos de la descarga pico

Mtodo de
Observaciones .


estimacin
1 0.34 0.12 1.23 0.70 1.75 0.12 0.71 0.520 0.66
2 0.91 2.94 2.14 2.36 2.86 4.55 2.63 2.61 1.09
3 6.31 8.37 9.75 6.09 9.82 7.24 7.93 7.81 1.66
4 17.15 11.82 10.95 17.20 14.35 16.82 14.72 15.59 2.77

Mtodo de Desviaciones para la prueba de


estimacin Levene modificada
1 0.18 0.40 0.71 0.18 1.23 0.40
2 1.70 0.33 0.47 0.25 0.25 1.94
3 1.495 0.565 1.975 1.715 2.015 0.565
4 1.56 3.77 4.64 1.61 1.24 1.23

El anlisis de varianza de los datos, el cual se resume en la tabla 8.

Tabla 8. Anlisis de Varianza de los datos de la descarga pico

Fuente de Suma de Grados de Cuadrado


Valor p
variacin cuadrados libertad medio
Mtodos 708.3471 3 236.1157 76.07 <0.001
Error 62.0811 20 3.1041
Total 770.4282 23

Implica que hay una diferencia en las estimaciones de la descarga pico promedio
obtenidas en los cuatro procedimientos. La grfica de los residuales contra los
valores ajustados, la cual se muestra en la figura 1 es preocupante porque la
forma de embudo con la boca hacia afuera indica que no se satisface el supuesto
de la varianza constante.

27
Figura 1. Grfica de los residuales contra las medias de las observaciones
para el ejemplo 3-5.

Se aplicar la prueba de Levene modificada a los datos de la descarga pico. La


parte superior de la tabla 7 contiene las medianas de los tratamientos y la parte
inferior contiene las desviaciones alrededor de las medianas. La prueba de
Levene consiste en realizar un anlisis de varianza estndar en las . El
estadstico de prueba que resulta en este caso es 0 = 4.55, para el cual el valor
es = 0.0137. Por lo tanto, la prueba de Levene rechaza la hiptesis nula de
que las varianzas son iguales, coincidiendo en esencia con el diagnostico que se
hizo a partir del examen visual de la figura 1. Los datos de la descarga pico son un
buen candidato para una transformacin de datos.

Seleccin emprica de una transformacin

Si se conociera la relacin entre las observaciones y la media, podra usarse


esta informacin para la seleccin de la forma de la transformacin.

El objetivo es encontrar una Transformacin Estabilizadora de Varianza (TEV)


de las observaciones. Esto es:

Se supone que:

() = ;

Si la TEV tiene la forma: = , entonces si se hace = 1 , los datos


transformados por tienen varianza constante. En la tabla 9 varias TEV.

28
Tabla 9. TEV

Relacin
= 1 TEV Comentario

Sin
0 1
transformar
0.5 0.5 0.5 Raz Datos de poisson
1 1 0 Log
Raz
1.5 1.5 -0.5
recproca
2 2 -1 Recproco

2.5 COMPARACIONES DE MEDIAS


Se supondr que al hacer el ANOVA se rechaza la hiptesis nula, es decir hay
diferencias entre las medias de los tratamientos.

Comparaciones grficas de medias

Si las medias de los niveles del factor son idnticas, las medias muestrales
observadas . se comportaran como un conjunto de observaciones tomadas

al azar de una distribucin normal con media .. Y desviacin estndar .

Visualice una distribucin normal con la capacidad de ser deslizada sobre un
eje abajo del cual estn graficadas 1. , 2. , . . Si todas las medias de los son
iguales, deber haber una posicin de esta distribucin que haga evidente que
los valores . se sacaron de la misma distribucin. La falla en esta lgica es
que es desconocida.

Contrastes

DEFINICIN:

La combinacin lineal de la forma:


=
=1

Se llaman contraste.

La prueba de hiptesis sobre contraste se formula as.

29

0 : = 0
=1

1 : 0
{ =1

Para juzgar esta prueba hay dos enfoques:

Utilizando .

La hiptesis nula se rechaza si

(=1 . )2
0 = > 2 , ( )
=1 2

Utilizando F
La hiptesis nula se rechaza si

(=1 . )2
0 = > 2 ,
=1 2

Determinando los intervalos de confianza para un contraste

El intervalo de confianza del 100(1 )% para el contraste =1 es:



. 2 , 2

=1 =1 =1



. + 2 , 2

=1 =1

Ejemplo 3.6:

Considere los datos del ejemplo 3-1. Hay cinco medias de los tratamientos y
cuatro grados de libertad entre estos tratamientos. Suponga que antes de correr el
experimento se especific la siguiente serie de comparaciones entre las medias de
los tratamientos y sus (contrastes asociados):

30
Hiptesis Contraste
0 : 4 = 5 1 = 4 + 5
0 : 1 + 3 = 4 + 5 2 = 1 + 3 + 4 5
0 : 1 = 3 3 = 1 + 3
0 : 42 = 1 + 3 + 4 + 5 4 = 1 + 42 3 4 5

Observe que los coeficientes de los contrastes son ortogonales. Utilizando los
datos de la tabla N1, se encuentra que los valores numricos de los contrastes y
de la suma de cuadrados son los siguientes:

1 = 1(108)+1(54)=-54 (54)2
1 = = 291.60
5(2)
2 = 1(49)+1(88)-1(108)-1(54)=-25 (25)2
2 = = 31.25
5(4)
3 = +1(49) 1(88) = 39 (39)2
3 = = 152.10
5(2)
4 = 1(49) + 4(77) 1(88) 1(108) 1(54) (9)2
=9 4 = = 0.81
5(20)

Tabla 9. Anlisis de varianza de la resistencia a la tensin

Suma de
Fuente de variacin G.L C.m F0 p
cuadrados
Peso porcentual del algodn 475.76 4 118.94 14.76 <0.001
1 = 4 + 5 291.60 1 291.60 36.18 >0.001
2 = 1 + 3 + 4 5 31.25 1 31.25 3.88 0.06
3 = 1 + 3 152.10 1 152.10 18.87 <0.001
4 = 1 + 42 3 4
0.81 1 0.81 0.10 0.76
5
Error 161.20 20 8.06
Total 636.96 24

Por los valores p se concluye que hay diferencias significativas entre los niveles 4
y 5 ,1 y 3 del peso porcentual del algodn, pero que el promedio de los niveles 1 y
3 no difieren del promedio de los niveles 1 y 5 con el nivel de significancia = 0.05
y que el nivel 2 no difiere del promedio de los otros cuatros niveles.

31
Mtodo de Scheff para comparar todos los contrastes
Prueba de Tukey

Ejemplo 3.7:

Para ilustrar la prueba de Tukey, se usan los datos del experimento del peso
porcentual del algodn del ejemplo 3-1. Con = 0.05 y = 20 grados de libertad
para el error se obtiene que 0.05 (5,20) = 4.23 (estadstico del rango studentizado)

8.06
Por tanto se tiene: 0.05 = 0.05 (5,20) = 4.23 = 5.37
5

Cualquier para de promedios del peso porcentual del algodn que difiera en valor
absoluto por ms de 5.37 implicara que el par correspondiente de las medias
poblacionales son significativamente diferentes.

Las diferencias en los promedios son:

1 2 = 9.8 15.4 = 5.6


1 3 = 9.8 17.6 = 7.8
1 4 = 9.8 21.6 = 11.8
1 5 = 9.8 10.8 = 1.0
2 3 = 15.4 17.6 = 2.2
2 4 = 15.4 21.6 = 6.2
2 5 = 15.4 10.8 = 4.6
3 4 = 17.6 21.6 = 4.0
3 5 = 17.6 10.8 = 6.8
4 5 = 21.6 10.8 = 10.8

Los valores marcados con asteriscos indican pares de medias que son
significativamente diferentes.

Ejemplo 3.8:

Utilizando procedimiento LSD, si se usan los datos del experimento del ejemplo 3-
1, la LSD con = 0.05 es

2 2(8.06)
= 0.025,20 = 2.086 = 3.75
5

32
Por tanto cualquier par de promedios de los tratamientos que difiera del valor
absoluto por ms de 3.75 implicara que el par correspondiente de medias
poblacionales es diferente.

Las diferencias de los promedios son:

1 2 = 9.8 15.4 = 5.6


1 3 = 9.8 17.6 = 7.8
1 4 = 9.8 21.6 = 11.8
1 5 = 9.8 10.8 = 1.0
2 3 = 15.4 17.6 = 2.2
2 4 = 15.4 21.6 = 6.2
2 5 = 15.4 10.8 = 4.6
3 4 = 17.6 21.6 = 4.0
3 5 = 17.6 10.8 = 6.8
4 5 = 21.6 10.8 = 10.8

Los valores marcados con asteriscos indican pares de medias que son
significativamente diferentes.

Los nicos pares de medias que no difieren significativamente son 1 y 5 y 2 y 3 y


el tratamiento 4 produce una resistencia a la tensin significativamente mayor que
los otros tratamientos.

Prueba de rango mltiple de Duncan

Ejemplo 3.9:

La prueba del rango mltiple de Duncan puede aplicarse al experimento del


ejemplo 3-1. Recuerde que = 8.06, = 25, = 5, y hay 20 grados de libertad
del error. Al arreglar los promedios de los tratamientos en orden ascendente, se
tiene

1. = 9.8

5. = 10.8

2. = 15.4

3. = 17.6

4. = 21.6

33
El error estndar de cada promedio es = 8.065 = 1.27. En el conjunto de
rangos significativos de la tabla del estadstico del rango studentizado para 20
grados de libertad y = 0.05 , se obtiene 0.05 (2,20) = 2.95, 0.05 (3,20) = 3.10,
0.05 (4,20) = 3.18 0.05 (5,20) = 3.25. Por lo tanto, los rangos de significacin
mnima son

2 = 0.05 (2,20) = (2.95)(1.27) = 3.75

3 = 0.05 (3,20) = (3.10)(1.27) = 3.94

4 = 0.05 (4,20) = (3.18)(1.27) = 4.04

5 = 0.05 (5,20) = (3.25)(1.27) = 4.13

Los resultados de las comparaciones seran

4 . 1: 21.6 9.8 = 11.8 > 4.13(5 )

4 . 5: 21.6 10.8 = 10.8 > 4.04(4 )

4 . 2: 21.6 15.4 = 6.2 > 3.94(3 )

4 . 3: 21.6 17.6 = 4.0 > 3.75(2 )

3 . 1: 17.6 9.8 = 7.8 > 4.04(4 )

3 . 5: 17.6 10.8 = 6.8 > 3.94(3 )

3 . 2: 17.6 15.4 = 2.2 < 3.75(2 )

2 . 1: 15.4 9.8 = 5.6 > 3.94(3 )

2 . 5: 15.4 10.8 = 4.6 > 3.75(2 )

5 . 1: 10.8 9.8 = 1.0 < 3.75(2 )

Por el anlisis se observa que hay diferencias significativas entre todos los pares
de medias con excepcin de la 3 y la 2 y la 5 y la 1. Observe que en este ejemplo
la prueba de rango mltiple de Duncan y el mtodo LSD llevan a conclusiones
idnticas.

Comparaciones de medias de tratamientos con un control

Ejemplo 3.10:

Para ilustrar la prueba de Dunnett, considere el experimento del ejemplo 3-1,


asumiendo que el tratamiento 5 es el control.
34
En este ejemplo,

= 5, 1 = 4, = 20 = = 5 . Con el nivel de 5%, en la tabla IX del


apndice se encuentra 0.05 (4,20) = 2.65. Por lo tanto, la diferencia crtica es

2 2(8.06)
0.05 (4,20) = 2.65 = 4.76
5

Por lo tanto, cualquier media de los tratamientos que difiera del control por ms de
4.76 se declarara significativamente diferente. Las diferencias observadas son

1 . 5: 1 . 5 . = 9.8 10.8 = 1.0


2 . 5: 2 . 5 . = 15.4 10.8 = 4.6
3 . 5: 3 . 5 . = 17.6 10.8 = 6.8
4 . 5: 4 . 5 . = 21.6 10.8 = 10.8

Solo las diferencias 3 . 5 . y 4 . 5 . indican alguna diferencia significativa


cuando se comparan con el control; por lo tanto, se concluye que 3 5 y 4
5 .

Cuando se hace la comparacin de los tratamientos con un control, una buena


idea es usar ms observaciones para el tratamiento de control (por ejemplo, )
que para los dems tratamientos, suponiendo un nmero igual de observaciones
para los 1 tratamientos restantes. El cociente deber elegirse de tal
modo que sea aproximadamente igual a la raz cuadrada del nmero total de
tratamientos. Es decir, se elige = .

2.6 DETERMINACIN DEL TAMAO DE LA MUESTRA


DEFINICIN: Curva de operacin caracterstica es una grfica de la probabilidad
del erros tipo II de una prueba estadstica para un tamao de la muestra particular
contra un parmetro que refleja la medida en que la hiptesis nula es falsa.

El parmetro usado es

2
=1 2
=
2
La magnitud 2 est relacionada con el parmetro de no centralidad.

35
Ejemplo 3.11:

Considere el experimento de la resistencia a la tensin descrito en el ejemplo 3-1.


Supongamos que el experimentador est interesado en rechazar la hiptesis nula
con una probabilidad de al menos 0.90, si la media de los cinco tratamientos es

1 = 11 2 = 12 3 = 15 4 = 18 5 = 19
1 75
Planea utilizar = 0.01 en este caso, puesto que = 5 5=1 = = 15 y
5

1 = 1 = 11 15 = 4
2 = 2 = 12 15 = 3
3 = 3 = 15 15 = 0
4 = 4 = 18 15 = 3
5 = 5 = 19 15 = 4

Por lo tanto 5=1 2 = 50. Suponga que el investigador piensa que la desviacin
estndar de la resistencia a la tensin con cualquier nivel particular del peso
porcentual del algodn no ser mayor que = 3 . Entonces se tiene que:

5=1 2 (50)
2
= = = 1.11
2 5(3)2

Se usa la curva de operacin caracterstica para 1 = 5 1 = 4 con =


( 1) = 5( 1)grados de libertad del error y = 0.01 como primera conjetura
para el tamao de la muestra requerido, se prueba con = 4 rplicas. Esto
produce 2 = 1.11(4) = 4.44, = 2.11 y (5) (3) grados de libertad del error. Por
consiguiente en encuentra que ~0.30. por lo tanto la potencia de la prueba es
aproximadamente 1 = 0.70, que es menor que el 0.90 requerido, por lo que se
concluye que = 4 no son suficientes procediendo de manera similar se
construye la siguiente tabla:

Tabla 10.

( ) Potencia (
4 4.44 2.11 15 0.30 0.70
5 5.55 2.36 20 0.15 0.85
6 6.66 2.58 25 0.04 0.96

Por tanto, deben realizarse al menos = 6 replicas para obtener una prueba con
la potencia requerida.

36
2.7 MTODOS NO PARAMTRICOS EN EL ANLISIS DE
VARIANZA
Prueba de Kruskal Wallis.

Si el supuesto de normalidad no est justificado. El procedimiento alternativo al


ANOVA es:

El estadstico de prueba

1 .2 ( + 1
= 2 [ ]
4
=1

Aqu, .2 es la suma de los rangos del tratamiento .

Si
2
> ,1

La hiptesis nula se rechaza.

Ejemplo 3.12:

En la tabla 11 se muestran los datos del ejemplo 3-1 y sus rangos


correspondiente.


2
1 2 ( + 1)2
= [ ( ) ]
1 4
=1 =1

1 25(26)2
= [5497.79 ]
24 4

= 53.03

37
Tabla 11. Datos y rangos para el experimento de la resistencia a la tensin
del ejemplo 3-1

Peso porcentual del algodn


15 20 25 30 35
1 1 2 2 3 3 4 4 5 5
7 2.0 12 9.5 14 11.0 19 20.5 7 2.0
7 2.0 17 14.0 18 16.5 25 25.0 10 5.0
15 12.5 12 9.5 18 16.5 22 23.0 11 7.0
11 7.0 18 16.5 19 20.5 19 20.5 15 12.5
9 4.0 18 16.5 19 20.5 23 24.0 11 7.0
27.5 66.0 85.0 113.0 33.5

Y el estadstico de prueba es

1 2 ( + 1)2
= 2 [ ]
4
=1

1 25(26)2
= [5245.0 ]
53.03 4

= 19.25
2
Puesto que > 0.01,4 , 4 = 13.28, se rechazara la hiptesis nula y se concluira
que los tratamientos difieren.

38

También podría gustarte