Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INDICACIONES:
Únicamente se calificará lo que el estudiante desarrolle en la hoja de papel ministro proporcionada;
además de la presentación, se evaluará la forma cómo se redactan cada una de las respuestas. Cualquier
cálculo deberá efectuarse exclusivamente en el software estadístico R1. Una vez empezada la prueba
queda terminantemente prohibido hacer preguntas, pedir en préstamo cualquier cosa y salir del curso.
Ponderación: 30%. Tiempo máximo: 120 minutos.
Ejercicio 1: Se resolverá primero y sin consulta alguna; tendrá una duración máxima de 30 minutos.
Para un diseño experimental DCAB (diseño completamente aleatorizado balanceado) con a
tratamientos (el único factor x que explica a la respuesta Y tiene a niveles) y n repeticiones por
tratamiento, se ha propuesto el modelo de efectos fijos Yij i ij con i 1, 2, , a y j 1,2, , n ,
donde Yij es la j - ésima respuesta obtenida bajo el tratamiento i - ésimo, es un parámetro común a
todos los tratamientos llamado media global, i es un parámetro del tratamiento i denominado efecto
del tratamiento i - ésimo, ij ID 0, 2 es un componente del error aleatorio asociado a la respuesta
Yij que incorpora todas las demás fuentes de variabilidad del experimento (incluyendo las mediciones
de las respuestas, la variabilidad que surge de los factores no controlables, las diferencias entre las
unidades experimentales a las que se aplican los tratamientos y el ruido de fondo general en el proceso
tales como la variabilidad en el tiempo y los efectos de variables ambientales); la respuesta media i
del tratamiento i - ésimo es tal que i i . A fin de evitar que el modelo sea sobreespecificado, se
a
considera que la media global es el promedio de las medias de los tratamientos, es decir, i a ;
i 1
a
las dos igualdades anteriores implican que
i 1
i 0.
a) Demostrar que la suma de cuadrados total corregida SST Yij Y se descompone como:
a n
2
i 1 j 1
la suma de las respuestas del i - ésimo tratamiento; además, Y Y N es el promedio todas las
a n
N an repuestas, con Y Yij la suma de dichas las respuestas.
i 1 j 1
SS E Yij Yi es la suma de cuadrados debida al error, es decir dentro de los tratamientos.
a n
2
i 1 j 1
SST tiene N 1 grados de libertad puesto que hay N respuestas; SSTr tiene a 1 grados de
libertad ya que el factor x tiene a niveles y, por lo tanto, se tienen medias de a tratamientos;
1
R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing,
Vienna, Austria. URL http://www.R-project.org/.
1
SS E tiene a n 1 an a N a grados de libertad debido a que dentro de cualquiera de los a
tratamientos existen n repeticiones que proporcionan n 1 grados de libertad con los cuales
estimar el error experimental. Entonces el número de grados de libertad del término del lado
izquierdo es igual a la suma de del número de grados de libertad de los términos del lado derecho.
SS E
b) Demostrar que el cuadrado medio del error MS E es un estimador insesgado de , la
2
N a
varianza constante para todos los niveles del factor x . (3 puntos)
Ejercicio 2
Se investiga el hinchamiento del catalizador después de la extrusión en la fabricación de botellas de
polietileno de alta densidad. Los factores puestos a prueba son molde y catalizador; los datos obtenidos,
luego de realizar la parte experimental, se muestran a continuación:
Ejercicio 3 (5 puntos)
Los gorgojos causan daños por varios millones de dólares a los cultivos de algodón. Se aplicaron a tres
campos de algodón tres compuestos químicos diseñados para controlar las poblaciones de gorgojos, uno
a cada campo. Después de tres meses se seleccionaron aleatoriamente 10 parcelas de igual tamaño de
cada campo y se registró el porcentaje de plantas de algodón que presentaban daños por gorgojos en
cada parcela.
2
En diseño experimental un gráfico Q-Q (en inglés se conoce como Q-Q plot; la letra"Q" viene de la palabra inglesa
quantile) es un método descriptivo para el diagnóstico de diferencias entre la distribución de probabilidad de una población
de la que se ha extraído una muestra aleatoria y una distribución usada para la comparación.
http://es.wikipedia.org/wiki/Gr%C3%A1fico_Q-Q, enero del 2014.
3
En diseño experimental un modelo presenta homocedasticidad cuando la varianza del error de la variable de respuesta se
mantiene constante en todos los tratamientos. http://es.wikipedia.org/wiki/Homocedasticidad, enero del 2014.
4
Una forma de verificar el supuesto de homocedasticidad es graficando los predichos contra los residuos: los predichos o
respuestas estimadas van en el eje horizontal y los residuos en el eje vertical. Si los puntos en esta gráfica se distribuyen de
manera aleatoria en una banda horizontal, entonces es señal de que se cumple el supuesto de homocedasticidad; por el
contrario, si los puntos se distribuyen siguiendo algún patrón ‒como por ejemplo en forma de corneta o embudo‒ entonces
es evidencia de que no se cumple tal supuesto.
3
A B C
10.8 22.3 9.8
15.6 19.5 12.3
19.2 18.6 16.2
17.9 24.3 14.1
18.3 19.9 15.3
9.8 20.4 10.8
16.7 23.6 12.2
19.0 21.2 17.3
20.3 19.8 15.1
19.4 22.6 11.3
a) Estimar TODOS los parámetros del modelo de efectos fijos.
b) Efectuar la PDH (prueba de hipótesis) de igualdad de los tratamientos con respecto a la media de la
correspondiente variable de respuesta, también conocida como PDH de idoneidad del modelo.
c) Realizar la comparación de parejas de medias de tratamientos por el método de Duncan.
d) Comprobar los supuestos de normalidad y homocedasticidad del modelo.
e) Realizar la prueba no paramétrica de Kruskal-Wallis, incluyendo la respectiva comparación de a
pares; confrontar los grupos obtenidos con los del literal c.
¡Éxitos!