Está en la página 1de 9

TALLER DE EJERCICIOS 1.

DISEÑO DE EXPERIMENTOS CON UN SOLO FACTOR.

INSTRUCCIONES: Investigar, responder o resolver los ejercicios que se


describen a continuación.

Ejercicio 1. Explique en qué consiste y cuándo se deben aplicar cada uno de


los siguientes diseños comparativos: diseño completamente al azar, diseño
en bloques completos al azar, diseño en cuadro latino.

 Diseño completamente al azar (DCA)

Es el más simple de todos los diseños que se utilizan para comparar dos o más
tratamientos. Se llama completamente al azar porque todas las corridas
experimentales se realizan en orden aleatorio completo. La prueba es basada en
el análisis de la varianza, en donde la varianza total se descompone en la varianza
de los tratamientos y la varianza del error. Si durante el estudio se hacen N
pruebas, éstas se deben realizar al azar, de forma que los posibles efectos
ambientales y temporales se vayan repartiendo equitativamente entre los
tratamientos.

Su objetivo es determinar si existe una diferencia significativa entre los


tratamientos, para lo cual se compara “la varianza del tratamiento” contra la
“varianza del error” y se determina si la primera es lo suficientemente alta según la
distribución F. Objetivo

El diseño completamente al azar es ampliamente usado gracias a que es un


diseño simple de realizar, su aplicación se da cuando se estudian más
tratamientos y su uso se limita a las siguientes situaciones:

1. Donde las unidades experimentales son relativamente homogéneas, tal


como laboratorios, invernaderos, etc.,

2. En caso de que una parte del experimento se pierda y puede decirse que
las unidades experimentales deben tener la misma capacidad de respuesta.
Si se tiene un experimento pequeño y donde la mayor precisión de otras
distribuciones no compensan la perdida de grados de libertad del error.

En este diseño puede probarse cualquier número de tratamientos, pero no es


obligatorio asignar el mismo número de de unidades experimentales a cada
tratamiento, ya que puede ser un diseño con igual número de repeticiones o con
desigual número de repeticiones.

 Diseño en bloques completos al azar (D.B.C.A)

Es el diseño experimental de mayor uso ya que tiene grandes ventajas si él


número de tratamiento no excede de 15, se pueden agrupar las unidades
experimentales en estratos o bloques uniformes logrando que la variabilidad de las
unidades experimentales sea mínima a un que la variabilidad entre los estratos y
bloques sea alta, en este diseño el número de unidades experimentales dentro de
un bloque tiene que ser igual al número de tratamientos por investigar.

Trata de comparar tres fuentes de variabilidad: el factor de tratamientos, el factor


de bloques y el error aleatorio. El adjetivo completo se refiere a que en cada
bloque se prueban todos los tratamientos. La aleatorización se hace dentro de
cada bloque.

El diseño en bloques completamente al azar se usa en los casos siguientes:

1. Cuando el número de tratamientos es de 3 a 15.

2. Cuando el número de tratamientos es de 3 a 5, en cuyo caso deben tenerse


como mínimas seis repeticiones para contar con suficientes grados de
libertad del error experimental.

3. Cuando se conoce el gradiente de la variabilidad, en cuyo caso los bloques


deben orientarse perpendicularmente al gradiente y las unidades
experimentales deben tener su mayor dimensión en la misma dirección y
sentido que dicho gradiente.

 Diseño en cuadrado latino


En el diseño en cuadrado latino se tienen cuatro fuentes de variabilidad que
pueden afectar a la respuesta observada: los tratamientos, el factor de bloque I
(columnas), el factor de bloque II (filas) y el error aleatorio. Se llama cuadrado
latino porque se trata de un cuadrado que tiene la restricción adicional de que los
tres factores involucrados se prueban en la misma cantidad de niveles, y
es latino porque se utilizan letras latinas para denotar a los tratamientos o niveles
de factor de interés.

El diseño cuadro latino se usa cuando se tienen tres factores a evaluar en una
misma unidad experimental, por ejemplo, los tres factores pueden ser: Densidad
de siembra, cantidad de riego y tipo de fertilizante.

Lo importante del diseño es que con pocas unidades experimentales se pueden


probar varios factores, sin embargo, se tienen dos limitantes importantes:

a) Que el número de niveles deben ser iguales.

b) Que no se pueden evaluar interacciones.

En algunos casos se pueden realizar repeticiones, especialmente para cuadros de


3 o 4 tratamientos, que los datos son pocos.

Ejercicio 2. Supongamos que se desea probar la igualdad entre sí de cinco


medias, una alternativa para hacer esto sería comparar de dos en dos
utilizando la prueba T de Student, por ejemplo, y al final tomar una decisión.
Explique por qué esto aumenta el error tipo I.

El error de tipo I es el que rechaza la hipótesis nula, cuando esta no debe de ser
rechazada, considerando esto, mientras más pasos o acciones se lleven a cabo
para probar la igualdad, mayor es la posibilidad de cometer un error que permitiría
rechazar una hipótesis que no se tendría que rechazar.

Error tipo 2. Cuando la hipótesis nula es falsa y no se rechaza, se comete un


error de tipo II. La probabilidad de cometer un error de tipo II es β, que depende de
la potencia de la prueba. Se puede reducir el riesgo de cometer un error de tipo II
al asegurarse de que la prueba tenga suficiente potencia. Para ello, asegúrese de
que el tamaño de la muestra sea lo suficientemente grande como para detectar
una diferencia práctica cuando está realmente exista.

Error tipo III o error tipo gamma. El error tipo 3 es menos conocido porque no está
directamente asociado a otros tópicos fundamentales de las estadísticas como el
nivel de significancia Alpha y/o intervalo de confianza relacionados con el error tipo
1, o la prueba de potencia para cálculo de tamaño de muestra relacionada con el
error tipo 2. Sin embargo, es un error muy común de llegar a la conclusión correcta
por la vía equivocada, o de solucionar el problema equivocado de la manera
correcta, todos aquellos definidos por Allyn W. Kimball 1957, Henry F. Káiser
1966. 

En este caso con cinco medias tenemos diez posibles pares de medias, y si la
probabilidad de aceptar la H0 para cada prueba individual es de 1-0.05 = 0.95,
entonces la probabilidad de aceptar las diez H0 es de 0.95¹ ⁰ = 0.5987, lo cual
representa un aumento considerable del error tipo I.

Ejercicio 3. ¿Qué mide el cuadrado medio del error en un experimento?,


¿Qué son los grados de libertad para una suma de cuadrados en un análisis
de varianza?

1. El error cuadrático medio (RMSE) mide la cantidad de error que hay entre dos


conjuntos de datos. En otras palabras, compara un valor predicho y un valor
observado o conocido. También se lo conoce como Raíz de la
Desviación Cuadrática Media. Es la suma de cuadrados divididos entre sus
respectivos grados de libertad. Los cuadrados medios se utilizan para
determinar si los factores (tratamientos) son significativos. Mide el promedio de
los errores al cuadrado, es decir, la diferencia entre el estimador y lo que se
estima. El ECM es una función de riesgo, correspondiente al valor esperado de
la pérdida del error al cuadrado o pérdida cuadrática. La diferencia se produce
debido a la aleatoriedad o porque el estimador no tiene en cuenta la
información que podría producir una estimación más precisa.

2. Representa el número de piezas de información independientes en la suma de


cuadrados. En general, es el número de observaciones menos el número de
parámetros estimados de los datos.

Ejercicio 4. A continuación se muestra parte del ANOVA para comparar cinco


tratamientos con cuatro réplicas cada uno.

Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F


para cada una de las fuentes de variación.

Explique de manera esquemática cómo calcularía el valor P o significancia


observada para ver si hay diferencia entre tratamientos.

Valor-p es el área bajo la distribución F k−1 ,N −k a la derecha del estadístico F0, es


decir, el valor-p=P(F>F0)

¿Con la información disponible se pueden hacer conjeturas sobre si hay


diferencias significativas entre tratamientos? Argumente.

Es posible determinar las conjeturas sobre si hay diferencias significativas entre


tratamientos, ya que es posible calcularlo a partir de la tabla y los valores de las F,
así como los grados de libertad.
Anote el modelo estadístico y formule la hipótesis pertinente.

Y i=μ+T i + Ei

Hipótesis nula: Determinar si existe diferencia estadísticamente significativa entre


las 4 réplicas de cada tratamiento.

Ejercicio 5. Se desea investigar el efecto del pH en el crecimiento de cierto


microorganismo en un medio específico. Para ello se realiza un experimento,
teniendo como punto de partida la misma cantidad de microorganismos. Se
hacen cuatro repeticiones y se obtienen los siguientes resultados. ¿Estos
datos son evidencia suficiente para afirmar que los niveles de pH donde se
logra menor y mayor crecimiento son el 3 y el 2, respectivamente? Explique.

Estos datos no son suficientes para poder afirmar que los niveles de pH donde se
logra menor y mayor crecimiento son el 3 y el 2, ya que se requiere un análisis de
los datos completos, para poder calcular el error tanto en cada una de las
muestras, como el error total del experimento. Así como un análisis completo para
obtener su ANOVA y poder determinar si los niveles de pH donde se logra menor
y mayor crecimiento son el 3 y el 2.

Ejercicio 6. Describa en qué consiste cada uno de los supuestos del modelo
en un análisis de varianza (ANDEVA o ANOVA), y explique la forma típica en
que estos supuestos se verifican.

NORMALIDAD: Metodo Grafico: consiste en graficar los residuos en papel o en la


gráfica de probabilidad normal que se incluye casi en todos los paquetes
estadísticos. Esta gráfica del tipo X-Y tiene las escalas de tal manera que, si los
residuos siguen una distribución normal, al graficarlos tienden a quedar alineados
en una línea recta; por lo tanto, si claramente no se alinean se concluye que el
supuesto de normalidad no es correcto. Prueba de Shaffiro Willk

HOMOCEDASTICIDAD: Método grafico: Consiste en comprobar si existe o no


una diferencia en los residuos de cada tratamiento. Se verifica haciendo un gráfico
entre la predicción y los residuos en donde se observa el comportamiento de los
puntos, los cuales deben distribuirse de manera aleatoria para así comprobar que
la igualdad de varianzas entre los tratamientos. Prueba de Leven’s

INDEPENDENCIA: Consiste en graficar el orden en que se colectó un dato contra


el residuo correspondiente. De esta manera, si al graficar en el eje horizontal el
tiempo (orden de corrida) y en el eje vertical los residuos, se detecta una
tendencia o patrón no aleatorio claramente definido, esto es evidencia de que
existe una correlación entre los errores y, por lo tanto, el supuesto de
independencia no se cumple. Prueba de Durbin-Watson.

Ejercicio 7. ¿Qué son y cuándo se aplican las pruebas para comparar


medias?

Son métodos que permiten la comparación de los valores de una variable continua
entre los posibles pares de medias, el cual depende del número de tratamientos
con el fin de determinar diferencias entre ellos. Para realizar esta prueba,
es necesario que se haya realizado una prueba de hipótesis y que se haya
rechazado la hipótesis nula, es decir, que todas las medias sean iguales

Ejercicio 8. ¿Qué son y cuándo se aplican las pruebas para comparar


medianas?

La prueba de la mediana es una prueba no paramétrica que podemos considerar


un caso especial de la prueba de chi-cuadrado, pues se basa en esta última. Su
objetivo es comparar las medianas de dos muestras y determinar si pertenecen a
la misma población o no.

Para ello, se calcula la mediana de todos los datos conjuntamente. Después, se


divide cada muestra en dos subgrupos: uno para aquellos datos que se sitúen por
encima de la mediana y otro para los que se sitúen por debajo. La prueba de chi-
cuadrado determinará si las frecuencias observadas en cada grupo difieren de las
esperadas con respecto a una distribución de frecuencias que combine ambas
muestras.

Esta prueba está especialmente indicada cuando los datos sean extremos o estén
sesgados.

Ejercicio 9. En una industria química se prueban diferentes mezclas para ver


si difieren en cuanto al peso molecular final. Se prueban cuatro diferentes
mezclas, con cinco repeticiones cada una. A continuación se muestra una
parte de la tabla del análisis de varianza (ANOVA) y los promedios obtenidos
para cada mezcla.

a) ¿Las mezclas difieren de manera significativa en cuanto a su peso


molecular?

Sí, tomando en cuenta lo presentado por el valor p en el tratamiento que en


consideración a una eficiencia de 95%, presenta un valor menor al 0.5.
b) Con el análisis de varianza y de acuerdo con el promedio, ¿se puede
garantizar que la mezcla B es con la que se logra un menor peso
molecular? Argumente.

De acuerdo con el promedio se puede retomar la explicación brindada en el inciso


anterior con diferencias entre las mezclas, presentes entre 500 y 3 000 unidades,
con respecto a B, se consideran como valores unitarios que presentan una
diferencia considerable entre el peso molecular de cada mezcla.

Considerando el análisis de varianza presentado, de igual manera con el


argumento anterior, se confirma la existencia de diferencia estadísticamente
significativa entre las mezclas y el peso molecular de cada una, ya que,
contemplando un nivel de confianza del 95%, se muestra un valor p de 0.01 que
es menor a 0.05, que nos permite confirmar la diferencia entre las mezclas

c) Si al verificar los supuestos de varianza constante (igual varianza


entre las mezclas), éste no se cumple, ¿qué significa esto? ¿Se puede
seguir apoyando la conclusión del inciso (a)?

Al presentar un incumplimiento de por lo menos un supuesto de varianza


constante significa que el modelo presenta heterocedasticidad por lo que se
requiere pasar del lado paramétrico al no paramétrico en el que es posible utilizar
el contraste de Kruskal-Wallis.

Lo anterior implica ya no seguir apoyando la conclusión presentada en el inciso


(a), ya que se debe realizar una nueva evaluación al modelo.

También podría gustarte