Está en la página 1de 4

UNIVERSIDAD DE LAS FUERZAS ARMADAS ‒ ESPE

Carrera de Ingeniería en Biotecnología: Quinto nivel

PRUEBA CONJUNTA III: Diseño Experimental

INDICACIONES:
Únicamente se calificará lo que el estudiante desarrolle en la hoja de papel ministro proporcionada;
además de la presentación, se evaluará la forma cómo se redactan cada una de las respuestas. Cualquier
cálculo deberá efectuarse exclusivamente en el software estadístico R1. Una vez empezada la prueba
queda terminantemente prohibido hacer preguntas, pedir en préstamo cualquier cosa y salir del curso.
Ponderación: 30%. Tiempo máximo: 120 minutos.
Ejercicio 1: Se resolverá primero y sin consulta alguna; tendrá una duración máxima de 30 minutos.
Para un diseño experimental DCAB (diseño completamente aleatorizado balanceado) con a
tratamientos (el único factor x que explica a la respuesta Y tiene a niveles) y n repeticiones por
tratamiento, se ha propuesto el modelo de efectos fijos Yij     i   ij con i  1, 2, , a y j  1,2, , n ,
donde Yij es la j - ésima respuesta obtenida bajo el tratamiento i - ésimo,  es un parámetro común a
todos los tratamientos llamado media global,  i es un parámetro del tratamiento i denominado efecto
del tratamiento i - ésimo,  ij ID  0,  2  es un componente del error aleatorio asociado a la respuesta
Yij que incorpora todas las demás fuentes de variabilidad del experimento (incluyendo las mediciones
de las respuestas, la variabilidad que surge de los factores no controlables, las diferencias entre las
unidades experimentales a las que se aplican los tratamientos y el ruido de fondo general en el proceso
tales como la variabilidad en el tiempo y los efectos de variables ambientales); la respuesta media i
del tratamiento i - ésimo es tal que i     i . A fin de evitar que el modelo sea sobreespecificado, se
a
considera que la media global es el promedio de las medias de los tratamientos, es decir,    i a ;
i 1
a
las dos igualdades anteriores implican que 
i 1
i  0.

a) Demostrar que la suma de cuadrados total corregida SST   Yij  Y  se descompone como:
a n
2

i 1 j 1

SST  SSTr  SS E , donde: (2 puntos)


a
 SSTr  n Yi  Y 
2
es la suma de cuadrados debida a los tratamientos ‒es decir entre los
i 1
n
tratamientos‒ con Yi  Yi n el promedio de las respuestas del i - ésimo tratamiento y Yi   Yij
j 1

la suma de las respuestas del i - ésimo tratamiento; además, Y  Y N es el promedio todas las
a n
N  an repuestas, con Y   Yij la suma de dichas las respuestas.
i 1 j 1

 SS E   Yij  Yi  es la suma de cuadrados debida al error, es decir dentro de los tratamientos.
a n
2

i 1 j 1

 SST tiene N  1 grados de libertad puesto que hay N respuestas; SSTr tiene a  1 grados de
libertad ya que el factor x tiene a niveles y, por lo tanto, se tienen medias de a tratamientos;

1
R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing,
Vienna, Austria. URL http://www.R-project.org/.
1
SS E tiene a  n  1  an  a  N  a grados de libertad debido a que dentro de cualquiera de los a
tratamientos existen n repeticiones que proporcionan n 1 grados de libertad con los cuales
estimar el error experimental. Entonces el número de grados de libertad del término del lado
izquierdo es igual a la suma de del número de grados de libertad de los términos del lado derecho.
SS E
b) Demostrar que el cuadrado medio del error MS E  es un estimador insesgado de  , la
2

N a
varianza constante para todos los niveles del factor x . (3 puntos)
Ejercicio 2
Se investiga el hinchamiento del catalizador después de la extrusión en la fabricación de botellas de
polietileno de alta densidad. Los factores puestos a prueba son molde y catalizador; los datos obtenidos,
luego de realizar la parte experimental, se muestran a continuación:

SUGERENCIA: Introducir los datos del siguiente modo:


 hinchamiento = c(93, 92, 90, 91, 92, 91, 90, 91, 93, 90, 92, 94, 90, 91, 90, 91,
92, 92, 92, 91, 95, 94, 94, 94, 94, 97, 95, 96, 94, 96, 88, 88, 87, 87, 88, 87,
87, 87, 87, 88, 90, 88, 88, 88, 89, 90, 89, 88, 88, 89, 91, 90, 92, 90, 97, 89,
90, 91, 91, 91)
 molde = rep(1:2,each=30)
 molde = factor(molde,labels=c("A1","A2"))
 catalizador = rep(rep(1:3,each=10),2)
 catalizador = factor(catalizador,labels=c("B1","B2","B3"))
 ejc2 = data.frame(hinchamiento,molde,catalizador)
 rm(hinchamiento,molde,catalizador)
 attach(ejc2)
a) Realizar e interpretar: (3 puntos)
 Los diagramas de caja simultáneos para hinchamiento versus molde.
SUGERENCIA: Ingresar boxplot(hinchamiento~molde)
 Los diagramas de caja simultáneos para hinchamiento versus catalizador.
SUGERENCIA: Ingresar boxplot(hinchamiento~catalizador)
 El gráfico de los efectos univariados medios del diseño.
SUGERENCIA: Ingresar plot.design(ejc2,fun="mean")
 El gráfico de los efectos univariados medianos del diseño.
SUGERENCIA: Ingresar plot.design(ejc2,fun="median")
 El gráfico de interacción molde versus catalizador.
SUGERENCIA: Ingresar interaction.plot(molde,catalizador,hinchamiento)
 El gráfico de interacción catalizador versus molde.
SUGERENCIA: Ingresar interaction.plot(catalizador,molde,hinchamiento)
b) Construir la tabla ANOVA. (0.5 puntos)
SUGERENCIA: Ingresar lo siguiente:
 ejc2.aov = aov(hinchamiento~molde*catalizador,data=ejc2)
 summary(ejc2.aov)
c) Calcular las estimaciones de las medias del modelo de efectos fijos. (0.5 puntos)
SUGERENCIA: Ingresar lo siguiente:
2
 medias = model.tables(ejc2.aov,type="means")
 medias
d) Realizar la PDH (prueba de hipótesis) para contrastar la igualdad de los efectos medios en el
hinchamiento según los tipos de molde. (0.5 puntos)
e) Efectuar la PDH para contrastar la igualdad de los efectos medios en el hinchamiento de acuerdo a
los catalizadores utilizados. (0.5 puntos)
f) Realizar la PDH para contrastar la igualdad de los efectos medios en el hinchamiento según la
interacción entre los niveles de los dos factores que se investigan. (0.5 puntos)
g) Clasificar en grupos (A, B, etc.) según sus medias, tanto a los niveles de cada factor como a las
interacciones utilizando el método de Tukey. (1.5 puntos)
SUGERENCIA: Ingresar TukeyHSD(ejc2.aov) y formar los grupos en cada caso analizando la salida
obtenida.
h) Dibujar e interpretar el gráfico Q-Q2 para el diagnóstico exploratorio del supuesto de normalidad de
los residuos del modelo. (0.5 puntos)
SUGERENCIA: Ingresar qqnorm(residuals(ejc2.aov))
i) Realizar la PDH de Shapiro-Wilk para el diagnóstico inferencial del supuesto de normalidad de los
residuos del modelo. (0.5 puntos)
SUGERENCIA: Ingresar shapiro.test(residuals(ejc2.aov))
j) Dibujar e interpretar el gráfico de los residuos en función de los predichos para el diagnóstico
exploratorio de la homocedasticidad3 de los errores de los tratamientos4. (0.5 puntos)
SUGERENCIA: Ingresar plot(fitted.values(ejc2.aov),residuals(ejc2.aov))
k) Realizar la PDH de Levene para el diagnóstico inferencial del supuesto de homocedasticidad de los
errores o residuos asociados a las respuestas de los tratamientos del modelo. (0.5 puntos)
SUGERENCIA: Ingresar lo siguiente:
 tratamientos = c("T1", "T1", "T1", "T1", "T1", "T1", "T1", "T1", "T1", "T1",
"T2", "T2", "T2", "T2", "T2", "T2", "T2", "T2", "T2", "T2", "T3", "T3", "T3",
"T3", "T3", "T3", "T3", "T3", "T3", "T3", "T4", "T4", "T4", "T4", "T4", "T4",
"T4", "T4", "T4", "T4", "T5", "T5", "T5", "T5", "T5", "T5", "T5", "T5", "T5",
"T5", "T6", "T6", "T6", "T6", "T6", "T6", "T6", "T6", "T6", "T6")
 ejc2.aov.levene = aov(lm(abs(residuals(ejc2.aov))~tratamientos))
 summary(ejc2.aov.levene)
l) Realizar la prueba no paramétrica de Kruskal-Wallis, incluyendo la comparación de a pares por el
método de Bonferroni. (1 punto)
SUGERENCIA: Ingresar lo siguiente:
 ejc2.KW = data.frame(hinchamiento,molde,catalizador,tratamientos)
 kruskal.test(hinchamiento~tratamientos,data=ejc2.KW)
 comp.bonferroni =
pairwise.wilcox.test(hinchamiento,tratamientos,p.adj="bonferroni",exact = F)

Ejercicio 3 (5 puntos)
Los gorgojos causan daños por varios millones de dólares a los cultivos de algodón. Se aplicaron a tres
campos de algodón tres compuestos químicos diseñados para controlar las poblaciones de gorgojos, uno
a cada campo. Después de tres meses se seleccionaron aleatoriamente 10 parcelas de igual tamaño de
cada campo y se registró el porcentaje de plantas de algodón que presentaban daños por gorgojos en
cada parcela.

2
En diseño experimental un gráfico Q-Q (en inglés se conoce como Q-Q plot; la letra"Q" viene de la palabra inglesa
quantile) es un método descriptivo para el diagnóstico de diferencias entre la distribución de probabilidad de una población
de la que se ha extraído una muestra aleatoria y una distribución usada para la comparación.
http://es.wikipedia.org/wiki/Gr%C3%A1fico_Q-Q, enero del 2014.
3
En diseño experimental un modelo presenta homocedasticidad cuando la varianza del error de la variable de respuesta se
mantiene constante en todos los tratamientos. http://es.wikipedia.org/wiki/Homocedasticidad, enero del 2014.
4
Una forma de verificar el supuesto de homocedasticidad es graficando los predichos contra los residuos: los predichos o
respuestas estimadas van en el eje horizontal y los residuos en el eje vertical. Si los puntos en esta gráfica se distribuyen de
manera aleatoria en una banda horizontal, entonces es señal de que se cumple el supuesto de homocedasticidad; por el
contrario, si los puntos se distribuyen siguiendo algún patrón ‒como por ejemplo en forma de corneta o embudo‒ entonces
es evidencia de que no se cumple tal supuesto.
3
A B C
10.8 22.3 9.8
15.6 19.5 12.3
19.2 18.6 16.2
17.9 24.3 14.1
18.3 19.9 15.3
9.8 20.4 10.8
16.7 23.6 12.2
19.0 21.2 17.3
20.3 19.8 15.1
19.4 22.6 11.3
a) Estimar TODOS los parámetros del modelo de efectos fijos.
b) Efectuar la PDH (prueba de hipótesis) de igualdad de los tratamientos con respecto a la media de la
correspondiente variable de respuesta, también conocida como PDH de idoneidad del modelo.
c) Realizar la comparación de parejas de medias de tratamientos por el método de Duncan.
d) Comprobar los supuestos de normalidad y homocedasticidad del modelo.
e) Realizar la prueba no paramétrica de Kruskal-Wallis, incluyendo la respectiva comparación de a
pares; confrontar los grupos obtenidos con los del literal c.

¡Éxitos!

También podría gustarte