Está en la página 1de 84

DISEO DE EXPERIMENTOS

INTRODUCCIN AL DISEO DE
EXPERIMENTOS

INCAS - Innovacin y Gestin de Cadenas de Abastecimiento


Departamento de Ingeniera Industrial
Facultad de Ingeniera
Universidad de Antioquia
Marzo de 2015
AGENDA

1. Definiciones bsicas de Diseo de Experimentos (DOE)

2. Planeacin del experimento

3. Seleccin y Caracterizacin de los diferentes tipos de Diseo de Experimentos

4. Introduccin a los experimentos con un solo factor

5. Modelo de Efectos fijos


Estadstica y Mtodo Cientfico

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 3


Experimento

Todo experimento cientfico:


Pretende descubrir si un determinado suceso tiene lugar, en cuyo caso origina un
cambio.
consiste esencialmente en un desplazamiento que pueda medirse.
Si un determinado suceso no puede medirse, en lo que respecta a la ciencia es como si
no existiera.
Ejecutar una accin y observar alas consecuencias.
Manipulacin intencional de una accin para analizar las posibles consecuencias.
Estudio de investigacin:
Manipulan deliberadamente una o ms variables independientes (supuestas causas)
Analizan las consecuencias que la manipulacin tiene sobre una o ms variables
dependientes (supuestos efecto)
Condiciones controladas por el investigador

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 4


Principios bsicos DOE

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 5


Ejemplos

Para estudiar el nivel de contaminacin de un ro, se recogen


muestras de agua en cuatro puntos distintos del ro y se estudia la
cantidad de oxgeno existente en el agua recogida en cada uno de
ellos.
Estudiar los efectos de cinco marcas diferentes de gasolina con
respecto a la eficiencia de operacin de un motor automotriz.
Estudiar el crecimiento de bacterias en cuatro soluciones
azucaradas diferentes (glucosa, sucrosa, fructosa y una mezcla).
Investigar si la concentracin de madera dura en la pulpa(%) afecta
la resistencia a la tensin de bolsas hechas de la pulpa
Decidir si la densidad de color de un espcimen de tela depende
de la cantidad de tinte utilizado

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 6


Objetivos de un experimento

Determinar las principales causas de variacin en la


respuesta.
Encontrar las condiciones experimentales con las que se
consigue un valor extremo en la variable de inters o
respuesta.
Comparar las respuestas en diferentes niveles de
observacin de variables controladas.
Obtener un modelo estadstico-matemtico que permita
hacer predicciones de respuestas futuras.

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 7


Diseo Estadstico de Experimentos (DOE)

Metodologa basada en tiles matemticos y estadsticos para


ayudar al experimentador a:
Seleccionar la estrategia experimental ptima que permita obtener la
informacin buscada con el mnimo costo.
Evaluar los resultados experimentales obtenidos, garantizando la
mxima fiabilidad en las conclusiones que se obtengan.
Aplicacin
Se observan una o ms variables experimentales dependientes o
respuestas (y) cuyo valor depende de los valores de una o ms
variables independientes (x) controlables llamadas factores.
Respuestas adems pueden estar influidas por otras variables que
no son controladas por el experimentador.
La relacin entre x e y no tiene porqu ser conocida.

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 8


Unidades Experimentales
Factor
Niveles
Variable Respuesta
Error Experimental
Tamao del Experimento

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 9


Ejemplos

Para estudiar el nivel de contaminacin de un ro, se recogen


muestras de agua en cuatro puntos distintos del ro y se estudia la
cantidad de oxgeno existente en el agua recogida en cada uno de
ellos.
Estudiar los efectos de cinco marcas diferentes de gasolina con
respecto a la eficiencia de operacin de un motor automotriz.
Estudiar el crecimiento de bacterias en cuatro soluciones
azucaradas diferentes (glucosa, sucrosa, fructosa y una mezcla).
Investigar si la concentracin de madera dura en la pulpa(%) afecta
la resistencia a la tensin de bolsas hechas de la pulpa
Decidir si la densidad de color de un espcimen de tela depende
de la cantidad de tinte utilizado

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 11


Factores: Ejemplo
1. Velocidad Factor 1, nivel .1. 300 rpm
2 niveles Factor 1, nivel 2. 500 rpm

2. Temperatura Factor 2, nivel 1. 50C


2 niveles Factor 2. nivel 2. 100C
Nivel de Nivel de Tratamiento Variable
velocidad temperatura respuesta
[rpm] [C] yij1
yij2
300 50 1
y11 yij3
500 50 2
y21
yij .
.
.

300 100 3 yijk


y12
500 100 4 Replicas
y22
INCAS Innovacin y Gestin de Cadenas de Abastecimiento 12
Importancia de planificar el experimento

=+

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 13


Importancia de planificar el experimento

Concluir sobre el sistema en estudio y decidir actuaciones


futuras + costo elevado de la experimentacin
Dejaran la eleccin de los experimentos y la evaluacin de los
resultados a la mera intuicin del experimentador?.
Metodologa matemtica y estadstica
Planificar (disear, organizar)
Secuencia de experimentos de una forma ptima
Minimizar costo de la experimentacin y influencia del error experimental
sobre la informacin buscada.

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 14


Etapas del DOE
Identificacin del problema

Eleccin de factores, niveles y rangos

Seleccin de la variable respuesta

Seleccin del diseo experimental

Realizacin del experimento

Anlisis estadstico de los datos

Conclusiones y recomendaciones

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 15


Identificacin del problema
Por qu va a efectuar la
investigacin?
Factores
Identificacin del problema

Cmo la va a llevar a cabo? controlables

1 2

A qu tipo de conclusiones espera 1 1


llegar y qu validez tendran? Variables Variables
Proceso 2
de entrada 2 respuesta

A qu poblacin podran aplicarse
las conclusiones?
1 2

Lograr los propsitos establecidos Factores no


con los recursos financieros, controlables
humanos y de tiempo disponibles?

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 16


Esquema de Procesos

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 17


Eleccin de factores, niveles y rangos

Seleccionar el nmero de niveles


Seleccionar factores que basados en los objetivos experimentales

Seleccin de niveles de factores


representan propiedades y los recursos disponibles.
fundamentales y que puedan ser
Eleccin de factores

manipulados o controlados. Si es un factor cualitativo: seleccionar


niveles de inters, por ejemplo
maquinas, basados en objetivos
Si es necesario, utilizar los objetivos experimentales.
experimentales para aclarar si una
variable es un factor o parte de la
respuesta. Si es un factor cuantitativo: seleccionar
rangos de los niveles, nmero de
niveles, espaciamiento entre niveles y
puntos centrales.

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 18


Seleccin de la variable respuesta
Cmo se medir la variable respuesta?
Seleccin de la variable respuesta

Qu unidad experimental va a manejarse?

Qu precisin tendrn las mediciones?

Cul es la sensibilidad del instrumento de medicin?

A qu tipo de conclusiones espera llegar y qu validez


tendran?
Cul es la experiencia de quien realiza las
mediciones?

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 19


Seleccin del diseo experimental

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 20


Realizacin del experimento
Mecanismo de aleatorizacin
Realizacin del experimento

Manejo de los instrumentos de medicin

Reconocimiento de las unidades experimentales

Mantenimiento en forma uniforme de condiciones


ambientales del experimento.

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 21


Anlisis estadstico
Anlisis estadstico de los datos
Usar mtodos estadsticos inferenciales para ver si los
efectos muestrales son lo suficientemente grandes
de los datos

para que garanticen diferencias poblacionales.

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 22


Conclusiones y recomendaciones

Establecer inferencias estadsticas.


Conclusiones y recomendaciones

Realizar interpretacin fsica de resultados


estadsticos y evaluar su significacin prctica.

Decidir que medidas implementar para


generalizar el resultado del estudio y para
garantizar que las mejoras se mantengan.

Realizar recomendaciones para estudios


posteriores.

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 23


INCAS Innovacin y Gestin de Cadenas de Abastecimiento 24
Ejemplo - Contextualizacin

Para estudiar el nivel de contaminacin de un ro, se recogen muestras de


agua en cuatro puntos distintos del ro y se estudia la cantidad de oxgeno
existente en el agua recogida en cada uno de ellos. Los dos primeros
puntos se escogen de manera que el ro no ha pasado por una planta
industrial existente en la zona. El tercer y cuarto punto se eligen despus
de pasar el ro por la planta industrial, de manera que el tercero est
prximo a sta y el cuarto ms alejado. En cada punto se seleccionan
cinco muestras de agua. Los datos vienen dados en la siguiente tabla

Punto Contenido de oxgeno disuelto


1 6.1 5.9 6.3 6.1 6.0
2 6.6 6.3 6.4 6.4 6.5
3 4.3 4.8 5.0 4.7 5.1
4 6.2 6.0 6.1 5.8 5.9
En R
Pasos Iniciales Script
# Lectura de datos
1. Organizar los datos archivo datos<-
header=T)
read.table(file.choose(),

de texto

attach(datos)
punto <- as.factor(punto)

# Anlisis descriptivo y grfico


tapply(oxigeno, punto, summary)
punto replica oxigeno par(mfrow=c(1,2))
boxplot(oxigeno ~punto)

# Para realizar el grafico de


Punto Contenido de oxgeno disuelto medias instalamos la librera
gplots
install.packages("gplots")
1 6.1 5.9 6.3 6.1 6.0
2 6.6 6.3 6.4 6.4 6.5 # Llamado de la librera gplots
require(gplots)
3 4.3 4.8 5.0 4.7 5.1
# Grfico de medias
4 6.2 6.0 6.1 5.8 5.9 plotmeans(oxigeno ~punto)
Rcmdr

PUNTO REPLICA OXIGENO


1 1 6.1
2 1 6.6
3 1 4.3
4 1 6.2
1 2 5.9
2 2 6.3
3 2 4.8
4 2 6.0
1 3 6.3
2 3 6.4
3 3 5.0
4 3 6.1
1 4 6.1
2 4 6.4
3 4 4.7
4 4 5.8
1 5 6.0
2 5 6.5
3 5 5.1
4 5 5.9

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 27


Ejemplo

1. Identifique los distintos elementos que intervienen en el estudio.

2. Realice un anlisis descriptivo de las mediciones de oxgeno por


medio de grficos y de medidas de resumen.
Para qu?

3. Se aprecian diferencias significativas en las cantidades medias de


oxgeno disuelto en los cuatro puntos del ro?
Desde lo descriptivo NO se infiere, se lanzan hipteisis
Anlisis descriptivo

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 29


Anlisis Descriptivo

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 30


Anlisis Descriptivo

6.5
6.5
6.0

6.0
oxigeno
5.5

5.5
5.0

5.0
4.5

4.5

n=5 n=5 n=5 n=5

1 2 3 4 1 2 3 4

punto
Experimentos con un solo factor
Suponga que se tienen tratamientos o niveles diferentes de un solo factor
que quieren compararse, por ejemplo, especies, temperaturas,
concentraciones, etc. La respuesta observada de cada uno de los
tratamientos es una variable aleatoria.
Tratamiento Observaciones Totales Promedios
(Nivel)
1 11 12 . . . 1 1. 1.
2 21 22 . . . 2 2. 2.
. . . ... . . .
. . . . . .
. . . . . .
1 2 . . . . .
.. ..

Qu representa el elemento ?
Recomendaciones

El nmero de tratamientos es determinado por el


investigador y depende del problema particular que se trata.
El nmero de observaciones por tratamiento se debe
escoger con base en la variabilidad que se espera observar
en los datos, as como en la diferencia mnima que el
experimentador considera que es importante detectar.
Se recomienda entre 5 y 30 mediciones en cada tratamiento,
este nmero se debe calcular.
pwr.anova.test(f, k, power=0.90, sig.level=0.05)

2 Nmero 1-Error Error


de niveles tipo II
2 2 tipo I
Notacin de Puntos

. = Total de observaciones bajo


Tratam. el -simo tratamiento, =
(Nivel)
Observaciones Totales Prom 1,2, , .
1 11 12 . . . 1 1. 1.
i. = Promedio de observaciones
2 21 22 . . . 2 2. 2.
bajo el -simo tratamiento.
. . . . . .
. . . ... . . .
. . . . . .
.. = Total de todas las
observaciones.
1 2 . . . . .
.. .. .. = Promedio de todas las
observaciones

34
Modelo

1. Modelo de medias

= + , = 1,2, , y = 1,2, ,

donde, es la -sima observacin, es la media del nivel del factor o -


simo tratamiento y es un componente de error aleatorio.

2. Modelo de efectos (Modelo de anlisis de varianza o de un solo factor)

= + + , = 1,2, , y = 1,2, ,

donde, es un parmetro comn a todos los tratamientos (media global) y


es un parmetro nico del -simo tratamiento (efecto del -simo
tratamiento).
Observaciones

: incorpora todas las dems fuentes de variabilidad del


experimento
Mediciones,
Variabilidad que surge de factores no controlados,
Diferencias entre las unidades experimentales a las que se aplican los
tratamientos,
Ruido de fondo general del proceso (variabilidad con el tiempo, efectos
de variables ambientales, etc).

Requisito del experimento:


Orden aleatorio
Ambiente en el que se apliquen los tratamientos sea lo ms uniforme
posible,
Diseo completamente aleatorizado.
Caractersticas del diseo

Objetivo
Probar hiptesis adecuadas acerca de las medias de los tratamientos
y estimarlas.

Supuestos
Errores del modelo son variables aleatorias con distribucin normal e
independientes: 2
~(0, )

Varianza es constante para todos los niveles del factor:


~( + , 2 )
Observaciones son mutuamente independientes.
Factor fijo o aleatorio?
El modelo estadstico de los efectos describe dos situaciones diferentes con respecto a
los efectos de los tratamientos.

1. Modelo de efectos fijos:


Los tratamientos pueden ser elegidos expresamente por el experimentador.

Se quieren probar hiptesis sobre las medias de los tratamientos.

Las conclusiones se aplican nicamente a los niveles del factor considerado en el anlisis.

2. Modelo de efectos aleatorios (modelos de componentes de varianza):


Los tratamientos pueden ser una muestra aleatoria de una poblacin ms grande de
tratamientos.

Se desea extender las conclusiones a la totalidad de los tratamientos de la poblacin.

Se prueban hiptesis sobre la variabilidad de las y se intenta estimar su variabilidad.


Anlisis del modelo con efectos fijos
Probar la igualdad de las medias los tratamientos, es decir,
= + = , = 1,2, , .

0 : 1 = 2 == =
1 : , para al menos un par (, )

O equivalentemente probar que los efectos de los tratamientos, , son cero, es


decir,
= 0, = 1,2, , .

0 : 1 = 2 == = 0
1 : 0, para al menos una

Si se acepta 0 se confirma que los efectos sobre la variable respuesta de los


tratamientos son estadsticamente nulos, iguales a cero, y en caso de rechazar
0 se concluye que al menos un efecto es diferente de cero. 39
1

1


2

2
1
= ,
Efecto del tratamiento es la distancia entre la respuesta media del
tratamiento, , y la respuesta media global, .
Cuando un efecto es igual a cero, equivale a decir que la media del
tratamiento correspondiente es igual a la media global.
Tabla de anlisis de varianza

Fuente de Suma de Grados de Cuadrado medio


variacin cuadrados libertad
Entre los 1
=
tratamientos 1
Error
=
(dentro de los
tratamientos)
Total N1


1 2 ..2 2 ..2
= . =

=1 =1 =1

=
Criterio de Rechazo

Se rechaza 0 :
Hay diferencias en las medias
de los tratamientos.

Valor-p<,
Valor-p: error al rechazar H0
0 > ,1,

42
Ejemplo - Modelo

Para estudiar el nivel de contaminacin de un ro, se recogen muestras de


agua en cuatro puntos distintos del ro y se estudia la cantidad de oxgeno
existente en el agua recogida en cada uno de ellos. Los dos primeros
puntos se escogen de manera que el ro no ha pasado por una planta
industrial existente en la zona. El tercer y cuarto punto se eligen despus
de pasar el ro por la planta industrial, de manera que el tercero est
prximo a sta y el cuarto ms alejado. En cada punto se seleccionan
cinco muestras de agua. Los datos vienen dados en la siguiente tabla

Punto Contenido de oxgeno disuelto


1 6.1 5.9 6.3 6.1 6.0
2 6.6 6.3 6.4 6.4 6.5
3 4.3 4.8 5.0 4.7 5.1
4 6.2 6.0 6.1 5.8 5.9
Anlisis de Resultados
En R
Planteamiento del problema
# Modelo
modelo <- aov(oxigeno ~ punto)
1. Se aprecian diferencias summary(modelo)

significativas en las
cantidades medias de
oxgeno disuelto en los Df Sum Sq Mean Sq F value Pr(>F)
punto 3 7.8295 2.60983 66.493 2.982e-09 ***
cuatro puntos del ro? Residuals 16 0.6280 0.03925
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 .
2. Realice comparaciones 0.1 1

entre las cantidades


medias de oxgeno en los
cuatro puntos del ro.
44
Estimacin de los parmetros del modelo

Estimadores razonables de la media global y de los efectos de los tratamientos


estn dados por

y..
i yi. y.. , i 1,2,..., a.

de modo que una estimacin de la variable respuesta promedio ser

= +

Un intervalo de confianza para la media del -simo tratamiento es

MSE MSE
yi. t 2, N a i yi. t 2, N a
n n
Resumen
Modelo
Medias = + ,
= 1,2, , y = 1,2, ,

~(0, 2 ); ~( , 2 )
Anlisis
Efectos = + + ,
Varianza
simple o ,
= 1,2, , y = 1,2, ,
de un solo
factor o Efectos Probar la igualdad 0 : 1 = 2 == =
Fijos de: 1 : , para al menos un par ,
de una va Las medias
0 : 1 = 2 = = = 0
Los tratamientos 1 : 0, para al menos una i

46
Anlisis de varianza

= ( .. )2 = (i. .. )2 + ( i. )2
=1 =1 =1 =1 =1

= +
No hay efecto de tratamientos Hay efecto de tratamientos

Variabilidad Variabilidad
Variabilidad Variabilidad
debida a debida al
debida a debida al
tratamientos error
tratamientos error
El termino del error desaparece del modelo estimado por el hecho de que su valor
esperado es igual a cero. Como la media global se estima como .. y el efecto del
tratamiento con . -.. , el modelo ajustado se puede escribir como

= .. + (. .. ) = .

es decir, la respuesta predicha para cada observacin es la media muestral del


tratamiento correspondiente.

As, el residuo de la -sima observacin en el simo tratamiento se define como


= = . ,

Los supuestos del modelo, en trminos de los residuos , son:

1. Los son una muestra aleatoria de una distribucin normal con media cero.

2. Los son independientes entre s.

3. Los residuos de cada tratamiento proceden de una distribucin que tiene la misma
varianza.
Verificacin de los supuestos del modelo

Supuesto:

Los errores del modelo son variables aleatorias que siguen una distribucin normal e
independiente con media cero y varianza 2 .

~(0, 2 )

Esto implica que las observaciones son independientes con la siguiente distribucin

~( + , 2 )
Residuales (anlisis de residuales)

1. Normalidad:

a. Procedimiento grfico:
Grfico cuantil-cuantil, (quantile quantile plot, qqplot).
Histograma
Diagrama de cajas (boxplot)

b. Prueba estadstica:
Prueba de Shapiro-Wilk
Prueba de Jarque Bera
Prueba de Anderson Darling
Prueba de Cramer Von Mises
Prueba de Kolmogorov Smirnov
Grfico Cuantil - Cuantil
Histograma

Distribucin
Distribucin asimtrica, con
Distribucin
asimtrica, con sesgo negativo
simtrica (ideal)
sesgo positivo
Diagrama de cajas

Distribucin
asimtrica, con
sesgo positivo

Distribucin
asimtrica, con
sesgo negativo

Distribucin
simtrica (ideal)
Prueba estadstica: prueba de normalidad

: Los residuales proceden de una distribucin normal.


1 : Los residuales no proceden de una distribucin normal.

Prueba de Shapiro-Wilk
Prueba de JarqueBera
Prueba de Anderson Darling
Prueba de Cramer Von Mises
Prueba de Kolmogorov -Smirnov

Si valor-p es mayor que el nivel de significancia predefinido entonces se puede


concluir que los residuales proceden de una distribucin normal.
Ejemplo. Procedimiento grfico
modelo <- aov(oxigeno ~ punto)
summary(modelo)

residuales <- residuals(modelo)

par(mfrow=c(1,3))
qqnorm(residuales, xlab="Cuantiles tericos", ylab="Cuantiles muestrales",
main="Grfico cuantil-cuantil")
qqline(residuales)
hist(residuales, xlab="Residuales", ylab="Frecuencia", main="Histograma")
boxplot(residuales, xlab="Residuales", main="Grfico de cajas")

Prueba estadstica
require(nortest)
shapiro.test(residuales)
ad.test(residuales)
Ejemplo. Procedimiento grfico

Grfico cuantil-cuantil Histograma Grfico de cajas

5
0.2

0.2
4
Cuantiles muestrales

0.0

0.0
Frecuencia

3
2
-0.2

-0.2
1
-0.4

-0.4
0

-2 -1 0 1 2 -0.4 -0.2 0.0 0.2 0.4

Cuantiles tericos Residuales Residuales

Prueba estadstica
Shapiro-Wilk normality test Anderson-Darling normality test

data: residuales data: residuales


W = 0.9591, p-value = 0.527 A = 0.2845, p-value = 0.592
2. Varianza constante (homocedasticidad):

a. Procedimiento grfico:
Grfico de valores ajustados vs residuales.
Grfico de niveles de factor vs residuales.

b. Prueba estadstica:
Prueba de Breusch-Pagan
Prueba de Levene
Prueba de Bartlett
Prueba de Hartley
Prueba de Cochran
Grfico de valores ajustados vs residuales

Satisfactorio En embudo

En doble arco No lineal


Prueba de homogeneidad de varianza
0 : 12 = 22 = = 2 = 2

1 : 2 2 para algn

Prueba de Breusch-Pagan
Prueba de Levene
Prueba de Bartlett

Con cada prueba de igualdad de varianzas obtenemos el valor-p, el cual comparamos


con el nivel de significancia predefinido. Si el valor-p es mayor que el nivel de
significancia predefinido entonces se puede concluir que los residuales tienen la
misma varianza.
Ejemplo
Procedimiento grfico

valores_ajustados<-(fitted(modelo))
par(mfrow=c(1,2))
plot(valores_ajustados, residuales, xlab="Valores ajustados", ylab="Residuales")
abline(h=0, col = "gray60")
plot(as.numeric(punto), residuales, xlab="Punto", ylab="Residuales")
abline(h=0, col = "gray60")

Prueba estadstica
require(car)
leveneTest(oxigeno ~punto)
bartlett.test(oxigeno ~punto)

require(lmtest)
bptest(oxigeno ~punto)
0.2

0.2
Residuales

Residuales
0.0

0.0
-0.2

-0.2
-0.4

-0.4
5.0 5.5 6.0 6.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

Valores ajustados Punto


Prueba estadstica
Bartlett test of homogeneity of variances Levene's Test for Homogeneity of Variance (center =
median)
data: oxigeno by punto Df F value Pr(>F)
Bartlett's K-squared = 4.4567, df = 3, p-value = 0.2162 group 3 1.2678 0.3189
16
studentized Breusch-Pagan test

data: modelo
BP = 5.3502, df = 3, p-value = 0.1479
3. Independencia:

a. Procedimiento grfico:

Grfico de orden vs residuales.


Grfico de autocorrelacin (ACF)
Grfico de autocorrelacin parcial (PACF)

b. Prueba estadstica:

Prueba de Durbin-Watson
Grfico de orden vs residuales

Para realizar este grfico es importante ingresar la informacin de las variables en


el orden en que fueron tomadas.

Si no se observa algn patrn caracterstico (ciclo, tendencias) se puede concluir


que los residuales son independientes o estn aleatoriamente distribuidos

alrededor del cero.


Grfico ideal Problemas de independencia
Prueba de Durbin-Watson
Esta prueba permite diagnosticar la presencia de correlacin (autocorrelacin) entre
los residuos consecutivos (ordenados en el tiempo), que es una posible manifestacin
de la falta de independencia. La autocorrelacin se presenta en problemas en los
cuales cada medicin tiene alguna contaminacin de la medicin inmediata anterior,
lo cual contradice el supuesto de independencia. Sea = , 1 , =
2,3, , , el parmetro que representa la correlacin entre residuales consecutivos. La
hiptesis en la prueba es
0 : = 0
1 : 0

Con la prueba obtenemos el valor-p, el cual comparamos con el nivel de significancia


predefinido. Si valor-p es mayor que el nivel de significancia predefinido entonces se
puede concluir que los residuales tienen correlacin cero.
Ejemplo
Procedimiento grfico

par(mfrow=c(1,3))
plot(residuales, pch=16, ylab="Residuales", xlab="Orden", main="Grfico de Orden vs
Residuales")
abline(h=0)
acf(residuales,ylim=c(-1,1), main="Grfico de ACF")
pacf(residuales,ylim=c(-1,1), main="Grfico de PACF", ylab="PACF")

Prueba estadstica

require(lmtest)
dwtest(modelo,alternative="two.sided")
Grfico de Orden vs Residuales Grfico de ACF Grfico de PACF

1.0

1.0
0.2

0.5

0.5
0.0
Residuales

PACF
ACF

0.0

0.0
-0.2

-0.5

-0.5
-0.4

-1.0

-1.0
5 10 15 20 0 2 4 6 8 10 12 2 4 6 8 10 12

Orden Lag Lag

Durbin-Watson test

data: modelo
DW = 2.251, p-value = 0.8918
alternative hypothesis: true autocorrelation is
not 0
AGENDA SESIN 4

1. Medidas Remediales

2. Tamao de Muestra

3. Comparacin de Tratamientos (Tukey, LSD, Dunnet)

4. Prueba Krusbak-Wallis
Medidas Remediales

1. Normalidad
Transformar los datos.
Usar mtodos no paramtricos.

2. Homocedasticidad
Transformar los datos.

3. Independencia
No existen transformaciones o ajustes simples que corrijan la falta
de independencia en los errores. La solucin apropiada sera la
modificacin del diseo bsico o la forma de realizar el
experimento.

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 69


No cumplimiento de supuestos del modelo

1. Normalidad

Transformar los datos.

Usar mtodos no paramtricos.

2. Homocedasticidad

Transformar los datos.

3. Independencia

No existen transformaciones o ajustes simples que corrijan la falta de


independencia en los errores. La solucin apropiada sera la modificacin del
diseo bsico o la forma de realizar el experimento.

DISEO DE EXPERIMENTOS UNIDAD 3 EXPERIMENTOS CON UN SOLO FACTOR


Transformaciones de Potencia

Si no se cumple el supuesto de normalidad o de homogeneidad de


varianza, una alternativa es considerar transformaciones de los
datos.
Las transformaciones no son ms que una reexpresin de los
datos en unidades diferentes.
Los conteos pueden tener una forma ms normal, al tomar su raz
cuadrada
La transformacin logit puede funcionar para normalizar proporciones
No es fcil la seleccin de una transformacin adecuada. Una
familia til de transformaciones es la familia de transformaciones
de potencia, definida slo para variables positivas.

71
Transformaciones de Potencia
La familia de transformaciones de potencia es indexada con
el parmetro .
Un valor dado de implica una transformacin particular.
Transformacin sugerida
-2 1
2
-1 1

-0.5 1

0
0.5
1 x
2 2
INCAS Innovacin y Gestin de Cadenas de Abastecimiento 72
El mtodo analtico de Box-Cox est disponible para elegir una
adecuada transformacin de potencia
Ellos consideran una ligera familia modificada de transformaciones de
potencia
1
= 0
0
se obtiene como el valor de que minimiza la suma de cuadrados

2
=
=
donde es la media de la serie transformada usando
INCAS Innovacin y Gestin de Cadenas de Abastecimiento 73
Ejemplo transformaciones de Potencia

# Buscando transformaciones de potencia


multivariadas para los datos del
# ejemplo oxigeno ~ punto
require(car)
summary(powerTransform(oxigeno))

testTransform(powerTransform(oxigeno),lambda=?)

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 74


Tamao de Muestra

Leer:
Libro: Diseo de Experimentos
Autor: Montgomery

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 75


COMPARACIN DE TRATAMIENTOS

INCAS Innovacin y Gestin de Cadenas de Abastecimiento 76


Para estudiar la confiabilidad de ciertos tableros electrnicos para automviles
se someten a un envejecimiento acelerado durante 100 horas a determinada
temperatura y como variable de inters se mide la intensidad de corriente que
circula entre dos puntos, cuyos valores aumentan con el deterioro . Se
probaron 20 mdulos repartidos de manera equitativa en cinco temperaturas y
los resultados obtenidos fueron los siguientes

20C 40C 60C 80C 100C


15 17 23 28 45
18 21 19 32 51
13 11 25 34 57
12 16 22 31 48

La temperatura afecta la variabilidad de las intensidades?


Comparaciones mltiples
Cuando no se rechaza la hiptesis nula 0 : 1 = 2 == = el objetivo del
anlisis esta cubierto y la conclusin es que los tratamientos no son diferentes.

Si se rechaza 0 y por consiguiente se acepta 1 es necesario investigar


cules tratamientos resultaron diferentes o cules provocan la diferencia.

Para llegar a una de las conclusiones anteriores se usan los mtodos de


comparaciones mltiples o pruebas de rango mltiple.

La diferencia primordial entre los mtodos radica en la potencia que tiene una
prueba para detectar diferencias entre las medias. Se dice que una prueba es
ms potente si es capaz de detectar diferencias ms pequeas.
I. Comparacin de parejas de medias de tratamientos

1. Mtodo LSD, Least Significant Difference (Diferencia mnima


significativa )

2. Mtodo de Tukey

3. Mtodo de Duncan

II. Comparacin de tratamientos con un control

Mtodo de Dunnett

III. Comparacin por contrastes

Mtodo de Sheff
Mtodo LSD
El objetivo es probar la igualdad de todos los posibles pares de medias con la
hiptesis
0 : =
1 : para toda

El estadstico de prueba es
i. j.

Se rechaza la hiptesis nula, es decir, los pares de medias y se


consideran significativamente diferentes si
1 1
i. j. > 2, + = 2,

Un intervalo de confianza de 100(1 )para todos los pares de medias esta


dado por . . 2, . . + 2, ,
En R
require(agricolae)
LSD.test(modelo, "punto", console=TRUE, group=FALSE)

Study: modelo ~ "punto"

LSD t Test for oxigeno

Mean Square Error: 0.03925

punto, means and individual ( 95 %) CI

oxigeno std r LCL UCL Min Max


1 6.08 0.1483240 5 5.892176 6.267824 5.9 6.3
2 6.44 0.1140175 5 6.252176 6.627824 6.3 6.6
3 4.78 0.3114482 5 4.592176 4.967824 4.3 5.1
4 6.00 0.1581139 5 5.812176 6.187824 5.8 6.2

alpha: 0.05 ; Df Error: 16


Critical Value of t: 2.119905

Comparison between treatments means

Difference pvalue sig. LCL UCL


1 - 2 -0.36 1.103974e-02 * -0.6256234 -0.09437663
1 - 3 1.30 1.641580e-08 *** 1.0343766 1.56562337
1 - 4 0.08 5.322014e-01 -0.1856234 0.34562337
2 - 3 1.66 4.843821e-10 *** 1.3943766 1.92562337
2 - 4 0.44 2.891929e-03 ** 0.1743766 0.70562337
3 - 4 -1.22 3.976806e-08 *** -1.4856234 -0.95437663
Mtodo de Tukey:
El objetivo es probar la igualdad de todos los posibles pares de medias con la
hiptesis
0 : =
1 : para toda
Para esta prueba se usa la distribucin del rango estudentizado

=


Los pares de medias y se consideran significativamente diferentes si

i. j. > (, ) ,

Un intervalo de confianza de 100(1 )para todos los pares de medias esta dado
por

. . , . . + , ,

En R
require(agricolae)
HSD.test(modelo, "punto", group=FALSE, console=TRUE)

Study: modelo ~ "punto"

HSD Test for oxigeno

Mean Square Error: 0.03925

punto, means

oxigeno std r Min Max


1 6.08 0.1483240 5 5.9 6.3
2 6.44 0.1140175 5 6.3 6.6
3 4.78 0.3114482 5 4.3 5.1
4 6.00 0.1581139 5 5.8 6.2

alpha: 0.05 ; Df Error: 16


Critical Value of Studentized Range: 4.046093

Comparison between treatments means

Difference pvalue sig. LCL UCL


1 - 2 -0.36 0.048853 * -0.71848476 -0.001515244
1 - 3 1.30 0.000000 *** 0.94151524 1.658484756
1 - 4 0.08 0.917999 -0.27848476 0.438484756
2 - 3 1.66 0.000000 *** 1.30151524 2.018484756
2 - 4 0.44 0.013816 * 0.08151524 0.798484756
3 - 4 -1.22 0.000000 *** -1.57848476 -0.861515244
En R
TukeyHSD(modelo, "punto")
Tukey multiple comparisons of means
95% family-wise confidence level

Fit: aov(formula = oxigeno ~ punto)

$punto
diff lwr upr p adj
2-1 0.36 0.001515244 0.71848476 0.0488533
3-1 -1.30 -1.658484756 -0.94151524 0.0000001
4-1 -0.08 -0.438484756 0.27848476 0.9179993
3-2 -1.66 -2.018484756 -1.30151524 0.0000000
4-2 -0.44 -0.798484756 -0.08151524 0.0138156
4-3 1.22 0.861515244 1.57848476 0.0000002
95% family-wise confidence level

2-1
3-1
4-1
3-2
4-2
4-3

-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

Differences in mean levels of punto

También podría gustarte