Está en la página 1de 43

EL MTODO ESTADSTICO PARA

EL DISEO DE EXPERIMENTOS

Contenido
El anlisis de varianza.
Modelos clsicos de diseo experimental.
La homogeneidad estadstica de las
comparaciones: diseos factoriales.
Diseos por bloques aleatorios.

El Anlisis de Varianza
Introduccin:
Cuando definimos el diseo de experimentos,
diferenciamos dos aspectos:
La planeacin del experimento.
El mtodo estadstico.

El Anlisis de Varianza
El anlisis de varianza fue creado por R.A. Fisher
(1925).
Consideraremos el problema de definir si las
diferencias observadas entre ms de dos medias
de una muestra pueden atribuirse al azar.

La Metodologa
1. Representar grficamente los datos:
Diagramas de caja si se disponen de 10 datos
o mas.
2. Formulacin de las hiptesis.
3. Comprobacin de requisitos

Anlisis de Varianza en un Solo Sentido


Ejemplo:
Supngase que se desea comparar la accin de
limpieza de tres detergentes sobre la base de los
siguientes registros de blancura tomados en 15
muestras de tela blanca manchada con una tinta
comn y despus lavada con los detergentes
respectivos en una mquina con agitador.
Registros de Blancura
Detergente A

Detergente B

Detergente C

77

72

76

81

58

85

71

74

82

76

66

80

80

70

77

Detergente: niveles del


factor fijos! Se analizar
los existentes sin
necesidad de tomar una
muestra.

Registro de blancura

Anlisis de Varianza
en un Solo Sentido

Suposiciones sobre las


variables yij:
1) Son independientes.
2) Tienen distribuciones
normales con las medias
respectivas i
3) Tienen varianza comn 2

Tratamientos
1

...

...

y11

y12

... y1 j

... y1k

y21

y22 ... y2 j

... y2 k

y31

y32

... y3 j

... y3k

...

...

...

...

...

yi1

yi 2

...

yij

... yik

Medias 1

... j

... k

...

Anlisis de Varianza en un Solo Sentido


El modelo de las
observaciones esta
dado por:

Yij = +j+ij;

donde:
es la media global
j son los efectos del
tratamiento (j= j- )
ij : variables aleatorias
independientes con con
medias cero y varianza
comn 2. (ij : Yij j)

Totales/columna
Nmero
Medias

Tratamientos
1

...

y11

y12

... y1 j

... y1k

y21

y22 ... y2 j

... y2 k

y31

y32 ... y3 j

... y3k

...

...

...

...

...

yi1

yi 2

...

yij

... yik

T .1

T .2

... T . j

... T .k

n1
Y.1

n2
Y.2

nj
Y.j

...

...

nk N
Y.k Y..

Anlisis de Varianza en un Solo Sentido


Hiptesis:
La hiptesis nula que se desea probar es que las
medias de la poblacin son iguales, es decir, que 1=
2= k o lo que es lo mismo:

H 0 : 1 ... k 0
vs.

H1 : j 0, j 1,2,...k

Si la hiptesis nula es verdadera, toda la variabilidad se debe al azar.

Ecuacin Fundamental del Anlisis de


Varianza (Niveles del Factor Fijo)

nj

j 1

i 1

(Yij Y.. ) j 1 i 1 (Y. j Y.. ) j 1 i 1 (Yij Y. j )

Suma de
cuadrados de las
desviaciones de
la gran media

nj

Suma de
cuadrados de las
desviaciones
entre los
tratamientos

nj

Suma de
cuadrados de
las desviaciones
dentro de
tratamientos

Tabla ANOVA (Niveles del Factor Fijo)


Fuente

df

SS

MS

Tratamiento

k-1

SS
SS
tratamientos tratamientos/
(k-1)

Error

N-k

SS error

TOTAL

N-1

SS total

SS error/(N-k)

Valor p

MS tratamientos P(F(1, 2)f)


MS error

Anlisis de Varianza en un Solo Sentido


Ejemplo:
Supngase que se desea comparar la accin de limpieza de tres
detergentes sobre la base de los siguientes registros de blancura
tomados en 15 muestras de tela blanca manchada con una tinta
comn y despus lavada con los detergentes respectivos en una
mquina con agitador.
Pruebe en el nivel de significancia 0.01 si las diferencias entre las
medias son significativas.
Registros de Blancura
Detergente A

Detergente B

Detergente C

77

72

76

81

58

85

71

74

82

76

66

80

80

70

77

Anlisis de Varianza en un Solo Sentido


Anova: Single Factor

SUMMARY
Groups
Detergente A
Detergente B

Count
5
5

Sum
385
340

Detergente C

400

80

SS
390
276

df
2
12

MS
F
P-value
F crit
195
8,48
0,01
6,93
23 Debe rechazarse la hiptesis nula,

ANOVA
Source of Variation
Between Groups
Within Groups
Total

666

14

Average Variance
77
15,5
68
40

Estadstica
Descriptiva

13,5

concluimos que los tres detergentes


no son igualmente efectivos

Despus de ANOVA qu?


Si el analista decide seleccionar las
comparaciones para luego del resultado del
ANOVA, las comparaciones se pueden
realizar.
Sin embargo, el valor se altera, debido a que
la decisin de comparaciones no es aleatoria.
Mtodos:
Student - Newman Keuls (SNK)
Scheff test

Pasos para la prueba: Student - Newman Keuls


(SNK)

El mtodo SNK se limita a


comparar pares de medias.

Pasos para la prueba: Student - Newman Keuls


(SNK)
1.
2.

3.

Ordene las k medias muestrales de menor a mayor.


Tome la media cuadrada del error y los grados de libertad del
error.
Obtenga el error estndar de la media para cada tratamiento,
dicho valor ser el denominador de la prueba F.
SY. j

4.
5.
6.

MSerror
cantidad _ de _ observaciones _ en _ y. j

Tome los valores de la tabla: Studentized Range, con el valor de


deseado. Usando n2 como los grados de libertad del error y p =
2,3,..k.
Multiplique los rangos por el error estndar de la media para cada
tratamiento, para encontrar los LSR (least significant ranges)
Analice los rangos entre las medias por pares comenzando con el
valor mas alto y mas bajo.

Mtodo de Scheff
Usa el mtodo de contrastes, sin embargo esos contrastes no
necesitan ser ortogonales.
Pasos:
1. Establezca los contrastes de inters y calcule sus valores
numricos.
2. Determine el valor de f para el que P( Fk 1, N k f
3. Calcule A (k 1) f usando el valor de f del paso 2.
4. Calcule el error estndar de cada contraste. Para el contraste:
Cm c1mT.1 ... ckmT.k , el error estndar esta dado por:

SCm (MSerror )(n1c 21m ... nk c 2 km )


5.

Sea cm el valor que denote a Cm. Rechace la hiptesis de que el


contraste de medias es cero si cm Ascm

Ejemplo
La tabla adjunta muestra la vida
de un tipo especfico de bacteria
(en minutos) expuesta a 4
temperaturas distintas.
Encuentre la tabla ANOVA y
defina si la temperatura tiene
efecto en la vida de la bacteria.
Establezca un contraste para
comparar el promedio de vida de
la bacteria entre la temperatura 1
y 2.
Establezca un contraste para
comparar la vida de la bacteria
bajo la temperatura 1 y las tres
restantes.

T1

T2

T3

T4

1,93

2,55

2,4

2,33

2,38

2,72

2,68

2,40

2,20

2,75

2,31

2,28

2,25

2,70

2,28

2,25

COMPONENTES DE VARIANZA

Componentes de la Varianza
Si los niveles del factor son aleatorios, el modelo se llama
modelo aleatorio.
En un modelo aleatorio, el analista no esta interesado
probar hiptesis, sino en estimar los componentes de la
varianza.
Cunta varianza en el experimento puede ser atribuida a diferencias de
las medias de los tratamientos?
Cunta varianza puedo ser atribuida al error aleatorio y no a las medias
de los tratamientos?

Tabla ANOVA (Niveles del Factor


Aleatorios)

Fuente

df

SS

MS

Tratamiento

k-1

SS tratamientos SS
tratamientos/(k1)

Error

N-k

SS error

TOTAL

N-1

SS total

SS error/(N-k)

EMS (Valor esperado)


2
error
n 2
2
error

Tabla ANOVA (Niveles del Factor


Aleatorios)
Ejemplo:
Una empresa provee a un cliente con varios cientos de lotes de materia
prima cada ao. El cliente esta interesado en un mayor rendimiento del
porcentaje de qumico usable del producto.
Usualmente se toman tres muestras del rendimiento de cada lote para
verificar la calidad de la materia prima. Ocurre variacin dentro del lote,
pero el cliente sospecha que existe variacin significativa entre los lotes.
Para revisar esto, se han tomado cinco lotes aleatoriamente de varios
lotes disponibles y tres rendimientos por lote. Los rendimientos se
muestran en la tabla adjunta.
Cunta varianza del experimento puede ser atribuida a las diferencias
entre lotes?
Cunta varianza del experimento puede ser atribuida al error aleatorio?

Tabla ANOVA (Niveles del Factor


Aleatorios)
Rendimiento del qumico por lotes
Lotes
1

74

68

75

72

79

76

71

77

74

81

75

72

77

73

79

Tabla ANOVA (Niveles del Factor


Aleatorios)
Factor Type Levels Values
Lote random
5 1. 2. 3. 4. 5

Diferencia
significativa
entre los
lotes

Analysis of Variance for Yield


Source
Lote
Error
Total

Source
1 Lote
2 Error

DF
4
10
14

SS
147,733
18,000
165,733

Variance
component
11,711
1,800

MS
36,933
1,800

Error
term
2

F
20,52

P
0,000

Expected Mean
Square for Each
Term (using
unrestricted
model)
(2) + 3 (1)
(2)

2
2
total
Stotal
S2 S2 11,711 1,8 13,511

2
error

n E (MS tratamiento )
2

2
error
E MS error

REVISIN DEL MODELO

Revisin del Modelo


Las tcnicas que se presentaron en este captulo estn
basadas en:

Independencia
Muestras aleatorias
Distribuciones normales
Varianzas iguales

En la prctica no se espera que las suposiciones del modelo


sean satisfechas exactamente.
Sin embargo, para que el procedimiento de resultados
confiables las suposiciones deben ser satisfechas de forma
razonable.

Revisin del Modelo


Los residuos deben ser normales.
Los residuos de un experimento son los restos,
luego de que los efectos estimados en el modelo
se han sustrado de los valores de la variable de
respuesta.

Eij Yij Yij

Yij es el valor de Yij

que se predice utilizando el

modelo.

Eij Yij Y. j

Revisin del Modelo


Las varianzas deben ser homogneas.
Analizar el rango de las observaciones en cada
tratamiento.
Utilizar criterio de control estadstico.
D4 R

Revisin del Modelo


Los errores deben ser independientes.
Los datos del experimento deben ser obtenidos de
una forma completamente aleatoria.
La falta de independencia afecta seriamente las
inferencias.
Se deben hacer esfuerzos para evitar errores
correlacionados.

Revisin del Modelo


Procedimientos para revisar independencia:
Clculo de auto-correlaciones.
La independencia de los errores se debe cuestionar si el
valor absoluto de la auto-correlacin es mayor a:

1,96

Durbin-Watson (DW)
Si el valores de DW mayores a 1.7 soportan la
suposicin de independencia.
2
(
e

e
)
i 2 i i 1
n

DW

i 1

ei

Qu ocurre si el modelo no es
adecuado?
Qu ocurre si no se cumplen las suposiciones
del modelo?
Considere un modelo distinto.
Transforme los datos a fin de lograr normalidad.

DISEO POR BLOQUES ALEATORIOS

Diseos por bloques aleatorios


Son aquellos en los que se introduce una
variable bloque.
Se denomina variable bloque a aquella
variable o factor que se introduce en el
experimento para obtener comparaciones
homogneas. La variable bloque es un factor
que:
Suponemos (a priori) que influye en la variable de
respuesta.
No tiene interaccin con el resto de factores
incluidos en el experimento.

Diseos por bloques aleatorios


El diseo aleatorizado por bloques permiten
remover el efecto del bloque y concentrarse en
los efectos de la variable de inters.
De ah, que se reduce el estimado de la varianza del
error.

Ejemplos:
Probar el efecto de mtodos de enseanza en
diferentes estudiantes.
Probar el efecto de los de materiales en varias
mquinas.
Probar el efecto de los fertilizantes en distintos tipos
de suelos.
Bloques: estudiantes, mquinas y suelos

Diseo por Bloques Aleatorios


El modelo:

Yij i j ij

Donde i representa el efecto del bloque.

Tabla ANOVA (Diseo por bloques


aleatorios)

Fuente

df

SS

MS

Entre los
bloques

n-1

SS bloques

SS bloques/(n-1)

MS bloques/MS
error

Entre los
tratamientos

k-1

SS
tratamientos

SS tratamientos/(k-1)

MS
tratamientos/MS
error

Error

(n-1)(k-1)

SS error

SS error/(n-1)(k-1)

TOTAL

nk-1

SS total

Ejemplo
El jefe de transporte de una firma, desea determinar si
el desgaste de 4 marcas de llantas es el mismo luego de
haber utilizado las mismas por 20,000 Km.
Las marcas a considerar son A, B, C y D. El jefe de
transporte desea probar el desempeo de las llantas
en las condiciones actuales de las vas que utilizan los
cuatro camiones de la empresa.
La tabla adjunta muestra la prdida del labrado de las
llantas por vehculo y por tipo de llanta.
Se puede confirmar la variacin entre los vehculos de la
flota?
El desgaste de las llantas es el mismo para todas las
marcas?

Ejemplo
Distribucin de
marcas y
desgaste del
labrado

Vehculo 1

Vehculo 2

Vehculo 3

Vehculo 4

B(14)

D(11)

A(13)

C(9)

C(12)

C(12)

B(13)

D(9)

A(17)

B(14)

D(11)

B(8)

D(13)

A(14)

C(10)

A(13)

Anova: Ejemplo de Desgaste de Neumticos


Analysis of Variance for Desgaste
Source DF
Vehculo 3
Marc
3
Error
9
Total
15

SS
38,688
30,688
11,563
80,938

MS
12,896
10,229
1,285

F
10,04
7,96

Se rechaza la hiptesis de
igualdad entre las
medias de desgaste por
vehculo y por marca.

P
0,003
0,007

Ejemplo
Se desea determinar la efectividad
de un fertilizante orgnico en suelos
de cultivo de un producto a lo largo
del ao. En la tabla adjunta se
registra la efectividad del fertilizante
en las cuatro estaciones del ao:
invierno, verano, otoo y primavera.
Formule un modelo para este diseo
Describa sus hiptesis.
Analice los datos utilizando un
modelo aleatorizado por bloques y
describa sus conclusiones.
Revise la validez del modelo.

resp
4,0
4,8
5,0
4,6
4,8
5,0
5,2
4,6
4,0
4,8
5,6
5,0

fert
1
1
1
1
2
2
2
2
3
3
3
3

estacin
1
2
3
4
1
2
3
4
1
2
3
4

Anexos

Cartas de Control para la Media y el


Rango
Grfico de
medias

Grfico de
Rangos

Tamao de
muestra n

Factor A2

Factor
D3

Factor
D4

1.88

3.27

1.02

2.57

0.73

2.28

0.58

2.11

0.48

2.00

0.42

0.08

1.92

0.37

0.14

1.86

0.34

0.18

1.82

10

0.31

0.22

1.78

Tabla 1. Factores para lmites de control en grficos de medias y rangos

Sofa A. Lpez MSc.

También podría gustarte