Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Facultad de Ingeniería
highly dynamic Escuela de Estadística
Diseño y análisis de experimentos
Cali, abril de 2019
Trabajo Final
1. Problema 1:
1.1. Realice un informe sobre la visita al experimento que se llevó a cabo el
6 de marzo, sobre al análisis del efecto del uso de fertilizantes en caña
de azúcar y su efecto en variables biofísicas. En este informe indique:
(a)¿Cómo se diseñó el experimento? (b)¿Cómo se ejerció el control local?
y (c) ¿De qué manera fueron tomadas las mediciones?
En un terreno de 0.1 hectáreas ubicado en el área de estudio de Ingeniería Agrícola, se está realizando
un estudio con sembrados de caña de azúcar para determinar el efecto que tienen diferentes dosis de
fertilización nitrogenada en el desarrollo de la una variedad de caña de azúcar con las mediciones de
variables biofísicas. fotoquímicas y de carácter espectral.
El experimento fue diseñado en primera instancia por un plan de muestreo que permitiera determinar
la composición del suelo en el que se realizaría el experimento. El análisis de suelo permitió conocer la
variabilidad espacial de contenido de materia orgánica para así poder clasificar el suelo en bloques y
establecer de manera correcta los tratamientos a tener en cuenta. Para el diseño del estudio se tuvo en
cuenta el factor de “Fertilización” que se formaba de 4 niveles (0 unidades de nitrógeno/hectárea, 80 uni-
dades de nitrógeno/hectárea, 160 unidades de nitrógeno/hectárea y 200 unidades de nitrógeno/hectárea)
donde cada una de estas dosis se les aplicó a cinco bloques de parcelas. Para obtener el efecto de estos
tratamientos, se midieron variables como biofísicas. fotoquímicas y de carácter espectral.
El control local del diseño tuvo en cuenta que a partir de que en el plan de muestreo se conocieron las
necesidades de la tierra, entonces se hiciera una correcta dosis de fertilizante de acuerdo a la necesidad
del suelo sin modificar la aplicación de otros minerales como el fósforo y demás que deben ser por igual
en cada unidad experimental. Además, para que el fertilizante (tratamiento) sí haga efecto en el suelo,
se debe tener un cuidadoso sistema de riego de agua para cada bloque en el experimento. Éste se hace
con un sistema de bombas y llaves ubicada en cada surco (hileras de caña de azúcar) con determinado
tratamiento, y cada una de las parcelas son reconocidas por identificarse con cintas de diferentes colores,
además el sistema de riego tiene en cuenta las condiciones climáticas. Una de las herramientas que maneja
el experimento para que los fertilizantes aplicados a cada parcela no se combinen con las demás es la
distancia en las que fueron colocadas unas de otras, igualmente el sistema de riego de agua se compone
de dos fases: una en la que exclusivamente es para que el fertilizante sí sea absorbido por la planta y el
otro que es un lavado para remover los residuos que haya dejado determinada parcela con su respectivo
tratamiento donde cada una de estas fases toma 30 minutos.
Las variables de respuesta analizadas son: biofísicas (altura, cantidad de tallos, cantidad de hojas verdes,
área foliar) donde todas ellas se miden directamente en el lugar del sembrado y se le mide a cada una
de las plantas; fotoquímicas, donde se toman muestras de una hoja determinada y se lleva al laboratorio
para medir su nitrógeno foliar, clorofila a, clorofila b y una clorofila total a partir de un clorofilómetro; y
por último está la variable espectroscopia óptica donde a diferencia de los estudios más grandes que se
hace con un satélite a una altura grande, el satélite en este caso mide la deficiencia o excesos de nitrógeno
a baja altura dado el ruido que ocupa el lugar (nubes, condiciones climáticas.)
En el archivo de datos de la Campaña 6 se miden las variables de cantidad de tallos, altura y cantidad
de hojas verdes. Para obtener las medidas, se tuvo en cuenta que utilizaron 4 tratamientos aplicados a 5
bloques en cada uno de ellos y por lo cual a cada bloque generado se le aplicaba una de las 20 parcelas
disponibles para el estudio.
Las estadísticas descriptivas de cada una de las mediciones se presentan en la Tabla 1 y en la Tabla
2. Los valores calculados indican además que el archivo de datos se componen de 400 observaciones. Se
puede observar que generalmente, la unidad experimental analizada posee de 1 hasta 11 tallos, que la
altura varía entre 93 cm y 375 cm y que la cantidad de hojas verdes en ésta es de entre 3 y 14. Luego, al
analizarse por tratamientos, la mayor cantidad de tallos se presentan cuando se aplica el tratamiento 4
(aproximadamente 5); la mayor altura media presentada se da igualmente con el cuarto tratamiento (208.9
cm) y la cantidad de hojas verdes mayor se obtiene con el tratamiento 1 y 2 siendo aproximadamente 10
hojas en cada caso. De igual manera en la Tabla 3 se observa que el bloque 5 genera cantidad de tallas
un poco mayor (muy cercano a 5) y una altura media superior a la de los demás bloques (208.9cm), sin
embargo es el bloque 1 el que da mayor cantidad de hojas verdes (10).
Con los datos brindados por la Campaña 6, se puede observar que se miden 3 variables en una misma
unidad experimental (cantidad de tallos, altura, cantidad de hojas verdes), pero también utilizan parcelas
en cada bloque para aplicar los tratamientos, por lo tanto este experimento trata de un Diseño de Bloques
completamente al azar con submuestras que se le realiza a cada una de las variables respuesta. Teniendo
entonces tres diseños a evaluar se tiene la siguiente estructura general del modelo:
En un diseño de bloques completamente al azar con submuestras se evalúan las siguientes hipótesis:
1. H0 : Z1 = Z2 = Z3 = Z4 = Z
H1 : al menos una de estas igualdades no se cumple.
2. α1 = α2 = α3 = α4 = α5 = α
H1 : al menos una de estas igualdades no se cumple.
Lo anterior define si existen diferencias entre el tipo de fertilizante utilizado y si ocurre lo mismo en el de
bloques para cada variable de respuesta estudiada y en la interacción entre los dos factores fertilizante y
bloque, es decir que cada una de las tres hipótesis planteadas, se deben realizar para cada diseño definido
en (b).
Primero se evaluarán el cumplimiento de los supuestos para determinar sí es posible realizar el análisis
de varianza sin transformación de los datos.
Se obtuvo un valor-p = 0.432, por lo tanto no hay pruebas suficientes para decir que los residuales del
diseño no se distribuyen de manera Normal.
El valor-p obtenido es igual a 0.1654. Al ser mayor que α = 0.05 no se rechaza la hipótesis nula y por lo
tanto se cumple el supuesto de homogeneidad de varianzas.
Al obtener un valor-p = 0.5963, no se rechaza la hipótesis nula y los residuales del diseño muestran
independencia entre ellos.
2. Para altura:
obtuvo un valor-p = 0.414, al ser mayor que α = 0.05 no se rechaza la hipótesis nula y se dice que no
hay pruebas suficientes para afirmar que lo residuales no se distribuyen de manera Normal.
El valor-p obtenido al aplicar la prueba fue de 0.6851, como es mayor a α = 0.05, no hay pruebas sufi-
cientes para decir que los residuales no presentan independencia entre ellos.
Dado que el valor p = 0.1242 > α = 0.05, entonces no se rechaza la hipótesis nula y los residuales se
distribuyen Normalmente.
El valor p obtenido por la prueba fue de 0.1927, por lo tanto al ser mayor que α = 0.05, no hay pruebas
suficientes para decir que los residuales no cumplen la homocedasticidad.
Supuesto de Independencia Se tiene la siguiente hipótesis para la prueba t:
El valor p obtenido por la prueba fue de 0.3671, por lo tanto al ser mayor que α = 0.05, no hay pruebas
suficientes para decir que los residuales no presentan independencia.
d Calcule los valores de la tabla de análisis de varianza. No olvide las esperanzas de los
cuadrados medios.
1. Cantidad de tallos.
En la Tabla 4 se puede observar que ni los tratamientos ni los bloques en el experimento cuando se mide
la cantidad de tallos en la caña son significativos. Por lo tanto, no hay diferencias significativas entre las
cantidades de nitrógeno aplicados sobre el número de tallos.
2. Altura.
Al observar el análisis de varianza de la Tabla 5, se puede decir que la cantidad de nitrógeno aplicada
en los fertilizantes ni el bloque en el que esté ubicada la caña presentan diferencias significativas entre la
altura de la planta, pues se tiene una Pr>t que supera al α = 0.05.
Igualmente en la Tabla 6 los tratamientos del experimento y la ubicación en el que está plantada la caña
producen diferencias significativas en la cantidad de hojas verdes en la planta estudiada al ser el valor
del estadístico F muy cercano a 1.
f Utilizando los resultados obtenidos, analice los resultados y concluya de acuerdo a los
objetivos planteados.
Según los valores obtenidos en el análisis de varianza, se puede concluir que en ninguna de las variables
estudiadas (cantidad de tallos, altura y cantidad de hojas verdes) presentan diferencias significativas al
analizar los diferentes niveles de nitrógeno en los fertilizantes (tratamientos) ni en los bloques.
Se tendrán tres valores de coeficiente de variación; una para cada variable respuesta estudiada luego de
hallar los errores en el análisis de varianza. De manera general se tiene que CV = CM E
ȳ , en particular:
1. CVtallo = 0.42
2. CValtura = 0.13
3. CVHojasV erdes = 0.18
Se evidencia que el diseño que más estuvo controlado fue el de la altura con apenas 13 % de coeficiente de
variación y la cantidad de tallos fue el que estuvo menor controlado al tener un coeficiente de variación
aproximadamente del 40 %.
Al observar las conclusiones dadas en el ítem (f), no se presentaron diferencias ni en los tratamiento ni en
los bloques en cada variable de respuesta que se estudia al analizar en análisis de varianza, por lo tanto
no es necesario hacer pruebas de contraste.
i Halle la potencia de la prueba para cada una de las hipótesis planteadas. Analice los
resultados obtenidos.
1. Cantidad de tallos.
Se toma una diferencia de 0.28 (dada por la resta entre T1 y T4 y se obtiene así un parámetro de
excentricidad λ̂ = 15.21 y un φ = 2.76. Luego en la tabla de la distribución Beta se busca el valor dado
por n1 = t-1 = 3, n2 = tr-t = 76 y φ = 3 obteniendo una Pr(Error Tipo II)≈0.001. Por lo tanto se tiene
una potencia de 99.9 % al manejar una diferencia de 0.28, es decir que se tendrá un 99 % de confianza de
que se esté rechazando H0 cuando es falsa.
2. Altura.
Se toma una diferencia de 10.7 (dada por la resta entre T2 y T4 y se obtiene así un parámetro de
excentricidad λ̂ = 6.63 y un φ = 1.8. Luego en la tabla de la distribución Beta se busca el valor dado por
n1 = t-1 = 3, n2 = tr-t = 76 y φ = 2. Luego se tiene entonces una Pr(Error Tipo II)≈0.06, por lo tanto
la Potencia = 0.937. Finalmente se tiene una confianza de 93.7 % de que se esté rechazando la H0 cuando
ésta es falsa.
Se toma una diferencia de 1.32 (dada por la resta entre T2 y T4 y se obtiene así un parámetro de
excentricidad λ̂ = 24.71 y un φ = 3.5. Luego en la tabla de la distribución Beta se busca el valor dado
por n1 = t-1 = 3, n2 = tr-t= 76 y φ = 3.5. En este caso se tiene una Pr(Error Tipo II) = 0, por lo que
la potencia estaría dada 1. Entonces se tiene una confianza del 100 % de que se esté rechazando la H0
cuando ésta es falsa.
Al analizarse las estadísticas descriptivas teniendo en cuenta el tipo de tratamiento, en los tres casos
de la variable de respuesta no se observan diferencias dependiendo del tratamiento utilizado y ésto se
observa en los análisis de varianza de cada uno, donde no se encontraron diferencias significativas según
el tratamiento utilizado en el estudio. Sin embargo puede decirse que la altura de la planta y la cantidad
de hojas verdes de ésta estuvieron mejor controladas que la cantidad de tallos, dado que presentaron un
CV bajo. Finalmente, la variable que tiene mayor potencia es la de cantidad de hojas verdes, donde se
tiene la totalidad de rechazar la hipótesis nula cuando había que hacerlo.
2. Problema 2:
Un ingeniero de alimentos evalúa el rendimiento del almidón agrio de yuca (en kg), el cual ha sido
sometido a tres métodos de secado: 1) al sol, 2) con aire caliente, 3) 50 % al sol y 50 % aire caliente.
El experimento se lleva a cabo en dos rallanderias diferentes, utilizando el mismo lote de almidón agrio
(obtenido en Julio de 2008) y por cada rallanderíaa tres trabajadores llevan a cabo la experimentación.
Los resultados se muestran a continuación:
Método de
Rallandería I Rallandería II
Secado
Trabajador Trabajador
1 2 3 1 2 3
1 34.5 48 40.8 33.6 44 36.5
40.7 45.2 43 35.2 44.4 20.4
42 49.6 41.7 36.8 43.9 38.8
2 41.4 52.2 39.4 41.9 47 40.8
43.8 51.5 45.3 42.6 46.5 40.9
42.6 51.7 48.6 43.7 47.5 44.8
3 58 62.1 51.4 52.3 58.8 44.9
54.8 62.5 49.9 48.5 62 45.9
56.7 60.3 48.5 55.8 63.8 49
El objetivo del estudio es evaluar el rendimiento del almidón agrio de yuca (en Kg) sometido a tres
métodos de secado.
Para llevar a cabo el proceso de aleatorización, primero se le asigna al azar un valor a cada una de las
combinaciones entre las Rallanderias y el método de secado, para esto. Se deben introducir los nombres de
los niveles a un empaque de su factor correspondiente. Luego, se procede a sacar uno de cada y agruparlos
de acuerdo al orden de salida. Por último, se empacan los trabajadores y se saca de uno a uno y se van
organizando en orden de salida a cada una de las combinaciones.
Al observar la gráfica 1, el mejor método de secado es 50 % sol y 50 % Aire Caliente, el cual presenta
un mayor valor promedio, máximo y mínimo, pero, hay gran variación. Esto se confirma en la tabla 7
debido a que presenta una varianza y un coeficiente de variación más grande que el resto, y en general es
pequeño, por lo que se tuvo un buen control local.
Finalmente para las descriptivas de los trabajadores expuestas en la Figura 3 y en la Tabla 9 se evidencia
que el trabajador 2 es aquel que hace que el rendimiento de yuca sea mayor al de los otros trabajadores
y sin embargo su coeficiente de variación no es muy alto (13.9 %).
65
65
●
●
60
60
●
55
55
50
50
45
45
40
40
35
35
1 2 3 I II
T1 T2 T3
El modelo estadístico adecuado para este caso es el factorial andado o factorial jeráquico, donde, el
Método de Secado y las rallanderias son factores fijos y los trabajadores aleatorios, están anidados a las
rallanderias.
i = 1, 2, 3
j = 1, 2
yijkl = µ + αi + βj + (αβ)ij + γk(ij) + εijkl
k = 1, 2, 3
l = 1, 2, 3..., 54
yijkl = Rendimiento del almidón agrio de yuca debido al efecto del i-ésimo método de secado, la j-ésima
rallanderia y el k-ésimo trabajador
µ = Media general del rendimiento del almidón agrio de yuca sin tener en cuenta el método de secado.
αi = Efecto del i-ésimo método de secado sobre el rendimiento del almidón agrio de yuca (en kg).
βj = Efecto de la j-ésima rallanderia sobre el rendimiento del almidón agrio de yuca (en kg).
(αβ)ij = Efecto producido por la interación del i-ésimo método de secado y la j-ésima rallanderia sobre
el rendimiento del almidón agrio de yuca.
γk(ij) = efecto del k-ésimo trabajador dentro de la j-ésima rallanderia sobre el rendimiento del almidón
agrio de yuca.
εijkl = Error aleatorio debido al i-ésimo método de secado, j-ésima Rallandería, k-ésimo trabajador y
l-ésima réplica.
1. H0 : H0 : α1 = α2 = α3 = α0
H1 : al menos una de estas igualdades no se cumple.
2. H0 : β1 = β2 = β0
H1 : al menos una de estas igualdades no se cumple.
3. H0 : (αβ)ij = (αβ)0
H1 : al menos una de estas igualdades no se cumple.
4. H0 : γk(ij) = α0
H1 : al menos una de estas igualdades no se cumple.
Lo anterior define si existen diferencias entre los métodos de secado, entre las rallanderías utilizadas,
entre la interacción de rallandería y método de secado y entre los trabajadores respectivamente.
h Calcule los valores de la tabla de análisis de varianza. No olvide las esperanzas de los
cuadrados medios.
El análisis de varianza se expone en la Tabla 10. La tabla indica que existen diferencias significativas
para el método de secado, para la Rallandería y para la interacción entre estas dos últimas dado que
la el valor de F es muy grande.
27 ● ●
2
●
2
●
● ● ● ●
●
Studentized Residuals(anova)
● ●
● ●
Residuos estandarizados
● ●
●● ●
1
1
● ●
●●
● ● ●
●
●●●● ● ● ● ●
●● ● ● ●
●● ●
● ●
●
● ● ●
●● ●
0
●
0
●●● ● ● ●
●● ● ●
●● ● ●
● ●
●●●●● ●
●●
● ●● ● ●
●
●●● ● ● ● ●
● ●
−1
● ●
−1
●● ●
● ●
●
●
● ● ● ●
−2
●
−2
25
−3
● ●
−2 −1 0 1 2 10 20 30 40 50
Por lo tanto, al ser el valor-p de la prueba mayor a un α = 0.05, no hay suficientes pruebas estadísticas
para rechazar H0 y por lo tanto, los residuales cumplen con el supuesto de Independencia.
Autocorrelación DW P-Valor
1 -0.0006911 0.148
Tabla 11: Supuesto de Independencia - problema 2
j Utilizando los resultados obtenidos, analice los resultados y concluya de acuerdo a los
objetivos planteados.
Analizando los resultados de las estadísticas descriptivas y las interpretaciones de la ANOVA, puede
decirse que dado a que se presentaron diferencias significativas de algunas fuentes de variación como el
Método de Secado, la Rallandería y la interacción entre éstas, debe realizarse pruebas de contraste para
exponer qué factores producen mayor rendimiento de almidón de yuca.
• El Coeficiente de variación del experimento es del 16.09 %, un valor bajo, lo que indica que el
ejercio un buen control local al momento de realizar los procesos de aleatorización y selección de
las muestras.
Pt
( i=1 ai Ȳi.. )2 1 (−44.25 − 45.12 + 2(54.72))2 1 1
F = Pt
a2i
x 2
= 6 x = (20.09)2 x = 13.31 (1)
i=2 σ 6
30.31 30.31
bc
Rallanderia (β)
La Rallanderia I defiere con respecto a la rallanderia II.
H0 : β1 − β2 = 0 H0 : β1 − β2 6= 0
Pb
( j=1 aj Ȳ.j. )2 1 (48.37 − 45.57)2 1 (−5.2)2 1
F = P2 2 x 2
= 2 x = x = 2.67 (2)
j=1 aj σ 6
30.31 0.33 30.31
tc
Trabajador (γ)
H0 : −γ1 + 2γ2 − γ3 = 0 H0 : −γ1 + 2γ2 − γ3 6= 0
Pt Pb 2
( j=1 k=1 ak Ȳ.jk ) 1 (−44.72 + 2(52.27) − 43.93)2 1 (15.89)2 1
F = P2 2 x 2
= 6 x = x = 4.16 (3)
k=1 aj σ 3
30.31 2 30.31
c
Se obrtiene un valor de F(1,54,0.05) = 4.02. En la ecuación 1, se obtuvo un valor de F=13.31>F(1,54,0.05) =
4.02, se rechaza H0 , es decir, el método de secado 3 difiere con respecto a los demás, y con base a
los promedios se puede decir, este es el mejor método para obtener un mayor rendimiento del almidón
agrio de yuca. Ahora, en la ecuación 2, el valor del estadístico F =2.67<F(1,54,0.05) , no se rechaza H0
y la rallanderia I no difiere entre la rallanderia II, por lo tanto, ninguna de las dos influye más en el
rendimiento del almidón agrio de yuca. Por último, En la ecuación 3, se obtiene un valor F=4.16,que a
pesar de ser mayor que el F calculado no lo es por mucha diferencia, por lo que se pude inferir con base a
la tabla 9, el trabajador II difiere con respecto al resto en le rendimiento del almidón agrio, pero no con
mucha diferencia.
m Halle la potencia de la prueba para cada una de las hipótesis planteadas. Analice los
resultados obtenidos.
Método de secado Se utilizará la diferencia del método de secado 2 y 3 (9.61) se obtiene un λ̂ = 0.12,
el valor de φ =ˆ0.28 ≈ 1 y n1=t-1=2 y n2 =n-t=51 P(error II)= y la potencia =
Rallandería Se utiliza la diferencia de 2.81 dad por las dos rallanderías, obteniéndose un λ = 0.08,
φ = 0.23n1=t-1=2 y n2 =n-t=51 P(error II)=
Trabajador Se utiliza la diferencia de 7.56 dadas por los trabajadores 1 y 2, obteniendo un λ = 0.05
y un φ = 0.17
Las interaciones no son significativas, por eso, no hubo necesidad de realizar contrastes. Por otro lado,
al realizar los contrastes para los factores, en el caso de los trabajadores se evidencio que el trabajador 2
difiere con respecto al resto, cabe mencionar que con un valor cercano al F teórico.
Referencias
R Core Team (2017), R: A Language and Environment for Statistical Computing, R Foundation for
Statistical Computing, Vienna, Austria.
*https://www.R-project.org/
√
250 (4)
En la ecuacion 4