Está en la página 1de 14

2014

Diseo de Experimentos

Anova de un solo factor

Morales Nelson
Tito Jhonny
Tierra Jos

Universidad Central del Ecuador


03/07/2014

Diseo de Experimentos 2014

Introduccin
El anlisis de la varianza (ANOVA) es una potente herramienta estadstica, de gran utilidad tanto
en la industria, para el control de procesos, como en el laboratorio de anlisis, para el control
de mtodos analticos.
Los ejemplos de aplicacin son mltiples, pudindose agrupar, segn el objetivo que persiguen,
en dos principalmente: la comparacin de mltiples columnas de datos y la estimacin de los
componentes de variacin de un proceso.
Nos ocupamos en este artculo de la primera de ellas.

Diseo de Experimentos 2014

Contenidos
Introduccin ............................................................................................................. 1
Contenidos ............................................................................................................... 2
Anova de un solo Factos ........................................................................................... 3
Planteamientos del problema ..........................................................................................3
Objetivo ..........................................................................................................................3
Hiptesis .........................................................................................................................3
Definiciones bsicas .........................................................................................................4
Experimento ........................................................................................................................................ 4
Factor: .................................................................................................................................................. 4
Nivel: .................................................................................................................................................... 4
Tratamiento ......................................................................................................................................... 4
Rplicas: ............................................................................................................................................... 4

Resultados .......................................................................................................................5
Aleatorizacin ...................................................................................................................................... 5

Mediciones ......................................................................................................................7
Anlisis de varianza..........................................................................................................7
Errores.............................................................................................................................8
Tabla de anlisis de la varianza .........................................................................................8
Anlisis Residual Y Verificacin Del Modelo .................................................................... 10
Qu hacer si alguna hiptesis falla? ................................................................................................. 11

Conclusin ..................................................................................................................... 11

Diseo de Experimentos 2014

Anova de un solo Factos


Planteamientos del problema
Se tiene inters en investigar la resistencia a la tensin de una fibra sinttica nueva que se
usar para hacer tela de camisas para caballero.
l sabe por experiencia que la resistencia a la tensin se afecta por el peso porcentual de
algodn utilizado en la mezcla de materiales de la fibra y sospecha que al aumentar el
contenido de algodn se incrementa la resistencia, sabe adems que el contenido de
algodn deber variar entre 10 y 40% para que el producto final tenga otras caractersticas
de calidad que se desean (Como la capacidad de ser sometido a un tratamiento de
planchado permanente).
El ingeniero decide probar ejemplares para pesos porcentuales de 15, 20, 25, 30, 35.
Tambin decide probar cinco ejemplares para cada porcentaje de algodn.

Objetivo
Determinar que el peso porcentual del algodn utilizado en la mezcla de materiales de la
fibra afecta significativamente en la resistencia de la tensin.
Mediante la utilizacin de la tcnica estadstica ANOVA.

Hiptesis
El porcentaje ms bajo de peso de algodn utilizado en la mezcla de materiales de la fibra
afecta significativamente en la resistencia de la tensin.
Se utiliza el anlisis de varianza (ANOVA) para probar
0 :

1 = 2 = 3 = 4 = 5

Contra la hiptesis alternativa


1 :

Diseo de Experimentos 2014


Definiciones bsicas
Experimento: serie de pruebas en las que se hacen cambios en las variables de entrada de
los procesos o sistemas para obtener o identificar las razones de los cambios que pudieran
observarse en la variable de salida.
* Probar varios pesos de fibras y medir la tensin..

Factor: cada una de las variables experimentales que el experimentador puede controlar,
pueden ser cualitativas o cuantitativas.
*Los porcentajes

Nivel: grado de intensidad de un factor


*15-20-25-30-35

Tratamiento: combinacin especfica de niveles de un factor o de factores


* No consideran tratamiento por solo se considera un solo factor

Rplicas: es el nmero de observaciones que tiene cada tratamiento.


*5 por cada nivel

La comparacin de diversos conjuntos de resultados es habitual en los laboratorios


analticos. As, por ejemplo, puede interesar comparar diversos mtodos de anlisis con
diferentes caractersticas, diversos analistas entre s, o una serie de laboratorios que
analizan una misma muestra con el mismo mtodo (ensayos colaborativos). Tambin sera
el caso cuando queremos analizar una muestra que ha estado sometida a diferentes
tratamientos o ha estado almacenada en diferentes condiciones. En todos estos ejemplos
hay dos posibles fuentes de variacin: una es el error aleatorio en la medida y la otra es lo
que se denomina factor controlado
(Tipo de mtodo, diferentes condiciones, analista o laboratorio,...). Una de las herramientas
estadsticas ms utilizadas que permite la separacin de las diversas fuentes de variacin es
el anlisis de la varianza (ANOVA, del ingls Analysis of Variance) [Massart, 1997]
El ANOVA tambin puede utilizarse en situaciones donde ambas fuentes de variacin son
aleatorias. Un ejemplo sera el anlisis de algn compuesto de un vino almacenado en un
depsito. Supongamos que las muestras se toman aleatoriamente de diferentes partes del
depsito y se realizan diversos anlisis replicados. Aparte de la variacin natural en la

Diseo de Experimentos 2014


medida tendremos una variacin en la composicin del vino de les diferentes partes del
depsito
Cuando tengamos un factor, controlado o aleatorio, aparte del error propio de la medida,
hablaremos del ANOVA de un factor. En el caso de que estuvisemos desarrollando un
nuevo mtodo colorimtrico y quisiramos investigar la influencia de diversos factores
independientes sobre la absorbancia, tales como la concentracin de reactivo A y la
temperatura a la que tiene lugar la reaccin, entonces hablaramos de un ANOVA de dos
factores. En los casos donde tenemos dos o ms factores que influyen, se realizan los
experimentos para todas las combinaciones delos factores estudiados, seguido del ANOVA.
Se puede deducir entonces si cada uno de los factores o una interaccin entre ellos tienen
influencia significativa en el resultado.
Para utilizar el ANOVA de forma satisfactoria deben cumplirse tres tipos de hiptesis,
aunque se aceptan ligeras desviaciones de las condiciones ideales:
1. Cada conjunto de datos debe ser independiente del resto.
2. Los resultados obtenidos para cada conjunto deben seguir una distribucin normal.
3. Las varianzas de cada conjunto de datos no deben diferir de forma significativa

Resultados
En el ejemplo propuesto la variable de inters es la resistencia a la tensin de la fibra
sinttica, se tiene un solo factor (peso porcentual del algodn) con a = 5 niveles del factor
(15, 20, 25, 30 y 35) y n = 5 rplicas. Quiere decir que se debern realizar 25 corridas (se
deben tomar 25 observaciones) de manera aleatoria.

Aleatorizacin
Para aleatorizar primero numeramos las corridas de la siguiente manera:
Peso de algdn %

Nmero de la corrida

15

20

10

25

11

12

13

14

15

30

16

17

18

19

20

35

21

22

23

24

25

Comando en R

Diseo de Experimentos 2014


sample(1:25)
sample(rep(seq(15,35,by=5),5))

Secuencia de prueba

Nmero de corrida

Peso de algodn %

1
2
3

8
18
10

20
30
20

23

35

17

30

15

7
8

14
6

25
20

9
10

15
20

25
30

11
12
13
14
15
16

9
4
12
7
1
24

20
15
25
20
15
35

17
18
19
20
21
22
23

21
11
2
13
22
16
25

35
25
15
25
35
30
35

24
25

19
3

30
15

La aleatorizacin es necesaria para evitar que los efectos de variables perturbadoras


desconocidas contaminen los resultados, por ejemplo si se utilizan mquinas en el proceso
estas pueden desajustarse, calentarse e influir en las medidas realizadas; los turnos de
trabajo y operarios tambin pueden influir en los resultados; lo que se busca con la
aleatorizacin es minimizar el efecto de fuentes generadoras de ruido.

Diseo de Experimentos 2014


Mediciones
Partiendo de los resultados anteriores y en el orden generado anteriormente se midi la
resistencia y se obtuvo el siguiente resultado.
Peso de algodn (%)

Observaciones

Total

Promedio

15

15

11

49

9.8

20

12

17

12

18

18

77

15.4

25

14

18

18

19

19

88

17.6

30

19

25

22

19

23

108

21.6

35

10

11

15

11

54

10.8

Total

376

15.04

Anlisis de varianza
Tratamientos
(Niveles)

Observaciones

Totales Promedios

11

12

13

21

22

23

31

32

33

..

Total

Es til describir las observaciones mediante el modelo estadstico lineal

= +

= 1,2,3, ; = 1,2,3 .

Es la observacin ij-sima.

Es la media del nivel del factor o tratamiento i-simo.


Es un componente del error aleatorio que incorpora todas las dems fuentes de
variabilidad del experimento.
A la ecuacin anterior se le llama modelo de medias. Una forma alternativa de describir un
modelo de los datos es definiendo.

Diseo de Experimentos 2014

= +

= 1,2,3,

De tal modo que la ecuacin ser de la siguiente manera.

= + +
Es la media global es el efecto del tratamiento i-simo.

Errores
Error dentro de grupos de tratamientos
2

2 = ( ) =
= 1,2,3, ; = 1,2,3 .
Error entre de grupos de tratamientos

2 = (. )2 =
Error Total

= +
Tabla de anlisis de la varianza
Una vez que se han calculado las sumas de cuadrados, las medias cuadrticas, los grados de
libertad y la F, se procede a elaborar una tabla que rena la informacin, denominada "Tabla
de Anlisis de varianza o ANOVA", que adopta la siguiente forma:
Matemticamente, la suma de cuadrados total SST, puede descomponerse como una suma
de dos sumas de cuadrados

SST = SSE + SSTRATAMIENTOS


SST es la suma de las diferencias al cuadrado de cada resultado individual respecto a la
media de todos los resultados y por tanto, representa la variacin total de los datos.
SSE mide las desviaciones entre los resultados individuales (Yan), de cada tratamiento
(donde n indica el n de tratamiento) y la media de los niveles ( ) y, por lo tanto, es una

Diseo de Experimentos 2014


medida de la dispersin dentro de las observaciones. Cuando se divide SSE por los
correspondientes grados de libertad, (N - a), se obtiene el cuadrado medio (o MS, del ingls
Mean Square) "dentro de las observaciones ", MSE
Por su lado, SSTRATAMIENTOS mide las desviaciones entre los resultados medios de las
observaciones y el resultado medio global y, dividido por sus grados de libertad, (a - 1),
constituye el cuadrado medio "entre observaciones", MSTRATAMIENTOS
La Tabla muestra las diferentes expresiones para calcular las sumas de cuadrados y las
correspondientes varianzas.
Expresiones para el clculo del ANOVA de un factor (a indica el nmero de observaciones y
N el nmero total de resultados)

2

=1 =1

.2

1
.2
= 2

=1

Se calculan, por tanto, MSTRATAMIENTOS y MSE como una medida de las dispersiones
comentadas y se comparan mediante una prueba de hiptesis F.
Si no existe diferencia estadsticamente significativa entre ellas, la presencia de errores
aleatorios ser la causa predominante de la discrepancia entre los valores medios. Si, por el
contrario, existe algn error sistemtico, MSTRATAMIENTOS ser mucho mayor que MSE,
con lo cual el valor calculado de F ser mayor que el valor tabulado Ftab para el nivel de
significacin escogido y los grados de libertad mencionados.

Diseo de Experimentos 2014


Entonces de acuerdo a los datos del ejemplo el anlisis ser el siguiente:

Ftab = 2.87 (= 0.05, 4, 20,una cola)


Comando en R qf(0.05,4,20,lower=F)
Como F > Ftab, en este caso se podra concluir que al menos uno de las observaciones ha
producido resultados la media de los cuales difiere de forma estadsticamente significativa
del resto de observaciones.

Anlisis Residual Y Verificacin Del Modelo

Normalidad en cada nivel de factor. (En cada nivel del factor la variable es
normal)
Grficos de Pr.Normal
Kolmogorof, Shaphiro Wilks

Homocedasticidad (igual varianza en cada nivel de factor)


Diagrama de Dispersin de residuos contra los promedios de
tratamientos
prueba de homogeneidad de variancia de Levene

Independencia de las observaciones: residuos aleatorios.

10

Diseo de Experimentos 2014


Qu hacer si alguna hiptesis falla?
Si falla la homocedasticidad, siempre que no haya grandes diferencias entre el
nmero de observaciones en los distintos grupos (niveles de factor), el ANOVA
sigue siendo fiable.
El contraste de ANOVA es robusto frente a la violacin del supuesto de
normalidad. El no-cumplimiento de esta hiptesis s puede afectar a la
estimacin del error experimental.
Transformaciones de los datos
El verdadero problema es la independencia de las observaciones. La violacin de
este supuesto s pone en duda las conclusiones del ANOVA; suele ser debido a:
1. errores en el muestreo (efecto aprendizaje, descuidos, falta de
aleatorizacin, etc.)
2. existencia de otros factores que tambin influyen en la variable
respuesta, y no han sido tomados en consideracin (necesidad de aplicar
no un ANOVA con un factor, sino un ANOVA multifactorial)
De hecho, la independencia de las observaciones debera quedar garantizada por el
modo en que se ha diseado el estudio:
(1)Modelo correcto: evidencia razonable de que hay un nico factor que pueda
tener influencia sobre Y.
(2) Una correcta recogida de los datos: Principio de aleatorizacin. Todos los
factores no controlados por el experimentador y que puedan influir en los
resultados, deben asignarse al azar a las observaciones
Conclusin
Se rechaza puesto que = 14.76 > 2.87,; es decir, el peso porcentual del algodn en la
fibra afecta de manera significativa la resistencia a la tensin media.
Dado que = 0.00000913 < 0.05, refuerza la conclusin dada.

IMPORTANTE: si se rechaza la hiptesis nula, en el contraste de ANOVA, eso significa


que no todas las medias son iguales. Sin embargo, puede que algunas s que sean iguales.
11

Diseo de Experimentos 2014


Para decidir qu grupos tienen medias similares, descomponemos los niveles del factor
en grupos homogneos.

Anexos

12

Diseo de Experimentos 2014

13

También podría gustarte