Está en la página 1de 27

Proyectos de Investigación Ambiental II

Prof. Jorge Achata Prof. Anita Arrascue


pcigjach@upc.edu.pe anita.arrascue@upc.pe

Prof. José Carlos Lama Prof. Franco Canziani


pcigjlam@upc.edu.pe pcigfcan@upc.edu.pe

Prof. Enit Huamán


enit.huaman@upc.pe
TEMAS

Semana 6
Diseño de experimentos
Uso de harina de follaje de Tithonia diversifolia en la alimentación de pollos de engorde (scielo.org.co)
2011_II_EIF.pdf
DEFINICIONES El diseño de experimentos es la aplicación del método
científico para generar conocimiento acerca de un sistema o
proceso, por medio de pruebas planeadas
adecuadamente. Esta metodología se ha ido consolidando
como un conjunto de técnicas estadísticas y de ingeniería,
que permiten entender mejores situaciones complejas de
relación causa-efecto.

Un experimento es un cambio en las condiciones de


operación de un sistema o proceso, que se hace con el
objetivo de medir el efecto del cambio sobre una o varias
propiedades del producto o resultado. Asimismo, el
experimento permite aumentar el conocimiento acerca del
sistema.

Gutiérrez y de la vara (2008)


DEFINICIONES

La unidad experimental es la pieza(s) o


muestra(s) que se utiliza para generar un
valor que sea representativo del resultado
del experimento o prueba. Ej. si se quiere
investigar alternativas para reducir el porcentaje
de piezas defectuosas, en un proceso que
produce muchas piezas en un lapso corto de
tiempo, la unidad experimental será cierta
cantidad de piezas que se producen en las
mismas condiciones experimentales, y al final se
analizará cuántas de ellas están defectuosas y
cuántas no.

La unidad experimental es una unidad material a la cual se aplica un solo


tratamiento dentro de una repetición o bloque, puede ser parcela de terreno,
animal, una hoja de vegetales, un árbol, una maceta, un lote de semilla etc.

Gutierrez y De La Vara (2008)


Tamaño de la Unidad Experimental (UE)
Depende la precisión y costo. Mayor precisión con mayor
número de repeticiones y menor tamaño de UE. Pero el costo
incrementa. El tamaño de la parcela debe ser el adecuado
para conseguir los objetivos del ensayo, el tamaño de las
unidades experimentales debe satisfacer los requerimientos
de la investigación.
Es importante indicar que el número de repeticiones debe ser
el mismo, ya sea con parcelas pequeñas o grandes. Hay una
tendencia a creer en que grandes unidades experimentales
hacen mejores ensayos y que por lo tanto se necesitaran
menos repeticiones. Esto no es así parcelas más grandes
aumentan el costo de los ensayos y también la probabilidad
de un mayor error experimental debido a la heterogeneidad
dentro de las parcelas. En general, el tamaño de parcela
estará determinado por la cantidad de terreno disponible para
el ensayo y por la cantidad de mano de obra o insumos
disponibles para desarrollar el ensayo.
Etapas en el diseño de Análisis
experimentos Utilizando métodos estadísticos inferenciales se evaluará si las
Entender y delimitar el problema u objeto de diferencias o efectos muestrales (experimentales) son lo
estudio
suficientemente grandes para que garanticen diferencias
poblacionales (o a nivel proceso). La técnica estadística central en
Elegir la(s) variable(s) de respuesta que será el análisis de los experimentos es el llamado análisis de
medida en cada punto del diseño y verificar
que se mide de manera confiable varianza (ANOVA)

Determinar cuáles factores deben estudiarse


Interpretación
o investigarse, de acuerdo a la supuesta
influencia que tienen sobre la respuesta
Se debe analizar con detalle lo que ha pasado en el experimento,
desde contrastar las conjeturas iniciales con los resultados del
experimento, hasta observar los nuevos aprendizajes que sobre el
Seleccionar los niveles de cada factor, así
como el diseño experimental adecuado a los proceso se lograron, verificar supuestos y elegir el tratamiento
factores que se tienen y al objetivo del ganador, siempre con apoyo de las pruebas estadísticas.
experimento

Control y conclusiones finales


Planear y organizar el trabajo experimental
Para concluir, se recomienda decidir qué medidas implementar
para generalizar el resultado del estudio y para garantizar que las
Realizar el experimento
mejoras se mantengan. Además, es preciso organizar una
presentación para difundir los logros.
Gutierrez y De La Vara (2008)
DEFINICIONES (continuación)
Factores controlables. Son
Variable de
variables de proceso o
respuesta: A
características de los materiales
través de
experimentales que se pueden
esta(s)
fijar en un nivel dado. A los
variable(s) se
factores controlables también se
conoce el
les llama variables de entrada,
efecto o los
condiciones de proceso, variables
resultados de
de diseño, parámetros del
cada prueba
proceso, las x de un proceso o
experimental.
simplemente factores.
Factores estudiados. Niveles y tratamientos.
Factores no controlables o de ruido. Son las variables que se Los diferentes valores que
Son variables o características de investigan en el se asignan a cada factor
materiales y métodos que no se pueden experimento, respecto de estudiado en un diseño
controlar durante el experimento o la cómo influyen o afectan experimental se llaman
operación normal del proceso. Ej. luz, a la(s) variable(s) de niveles. Una combinación
humedad, temperatura, partículas, ruido, el respuesta. Pueden ser de niveles de todos los
ánimo de los operadores, la calidad del material controlables o no factores estudiados se
del proveedor. controlables. llama tratamiento.
Gutierrez y De La Vara (2008)
DEFINICIONES (continuación)

Error aleatorio. Es la medida de la Error experimental. Son los errores


variabilidad observada en la respuesta que el experimentador comete durante
que no se podrá explicar por los factores los experimentos, y si éstos son
estudiados (debido a las causas graves, más que error aleatorio
comunes o aleatorias). Ej. será parte de hablaremos de error experimental. De
este error aleatorio el pequeño efecto predominar éste, la detección de
que tienen los factores que no se cuáles de los factores estudiados
estudiaron, siempre y cuando se tienen un efecto real sobre la
mantenga pequeño o despreciable, así respuesta será difícil, si no es que
como la variabilidad de las mediciones imposible.
hechas bajo las mismas condiciones.

Cuando se corre un diseño experimental es importante que la variabilidad observada de la


respuesta se deba principalmente a los factores estudiados y en menor medida al error
aleatorio, y además que este error sea efectivamente aleatorio. Cuando la mayor parte de
la variabilidad observada se debe a factores no estudiados o a un error no aleatorio, no se
podrá distinguir cuál es el verdadero efecto que tienen los factores estudiados, con lo que el
experimento no alcanzaría su objetivo principal.
Gutierrez y De La Vara (2008)
PRINCIPIOS BÁSICOS
Aleatorización Repetición Bloqueo
Significa que las corridas Es correr más de una vez Consiste en tomar en cuenta
experimentales deben ser un tratamiento o una todos los factores que
aleatorias y con material combinación de factores. puedan afectar la respuesta
también seleccionado Repetir es volver a realizar observada. Con esto, el
aleatoriamente. Con esto un tratamiento, pero no subconjunto de datos que
aumenta la probabilidad de inmediatamente después de se obtengan dentro de
cumplir el requisito de haber corrido el mismo cada bloque (nivel
independencia de los tratamiento, sino cuando particular del factor
errores. También asegura corresponda de acuerdo con bloqueado), debe resultar
que las pequeñas diferencias la aleatorización. Las más homogéneo que el
provocadas por materiales, repeticiones permiten conjunto total de datos.
equipo y todos los factores distinguir mejor qué parte Ej. si se quieren comparar 4
no controlados, se repartan de la variabilidad total de máquinas, es importante tomar
de manera homogénea en los datos se debe al error en cuenta al operador de las
máquinas, en especial si se cree
todos los tratamientos. aleatorio y cuál a los
que la habilidad y los
factores. conocimientos del operador
pueden influir en el resultado.
CLASIFICACIÓN DE LOS DISEÑOS
ESTÁNDAR
1. Diseños completamente aleatorios (DCA)
• Ausencia de bloques.
• Cada unidad experimental tiene la misma probabilidad de recibir cualquier
tratamiento, el cual se repite en dos o más ocasiones.
• Son apropiados para los casos en el que el material experimental es
completamente homogéneo.
2. Diseños de bloques completamente aleatorizados (DBCA)
• Las unidades experimentales se agrupan en dos o más bloques completos.
• En cada unidad experimental se alojan una vez los tratamientos.
• Son apropiados en casos donde se observa una cierta tendencia de
variación en el material experimental.
3. Diseños aleatorios de bloques incompletos (DBI)
• No todos los tratamientos se encuentran representados en cada bloque.
• Son apropiados en casos donde ensayan muchos tratamientos.
• Se agrupan en bloque más pequeños.
Diseño completamente
al azar y ANOVA

Se utilizan para comparar dos o


más tratamientos, dado que sólo
consideran dos fuentes de
variabilidad: los tratamientos y el
error aleatorio.
TAMAÑO DE MUESTRA
Una decisión importante en cualquier diseño de experimentos es decidir el número de réplicas que se hará
por cada tratamiento (tamaño de muestra). Por lo general, si se esperan diferencias pequeñas entre
tratamientos será necesario un mayor tamaño de muestra. Aunque existen varios métodos para estimar el
tamaño muestral, muchas veces tienen poca aplicabilidad porque requieren cierto conocimiento previo sobre
la varianza del error experimental. Si recurrimos a la experiencia vemos que el número de réplicas en la
mayoría de las situaciones experimentales en las que se involucra un factor varía entre cinco y diez; incluso,
en algunos casos puede llegar hasta 30. La tendencia podría inclinarse por un extremo de este rango e
incluso salirse de éste, de acuerdo con las siguientes consideraciones:
• A menor diferencia que se espera en los tratamientos, mayor será la cantidad de réplicas si se quieren detectar
diferencias significativas, y viceversa, es decir, si se esperan grandes diferencias quizá con pocas réplicas sea suficiente.
• Si se espera mucha variación dentro de cada tratamiento, debido a la variación de fuentes no controladas como métodos
de medición, medio ambiente, materia prima, etc., entonces se necesitarán más réplicas.
• Si son varios tratamientos (cuatro o más), entonces éste es un punto favorable para reducir el número de réplicas.

Además de lo anterior, es preciso considerar los costos y el tiempo global del experimento. De aquí que si se
toman en cuenta las consideraciones antes expuestas se podrá establecer el tamaño de muestra que
permita responder en una primera fase las preguntas más importantes que se plantearon con el
experimento
Ejemplo
Un ingeniero de desarrollo de productos desea
investigar la resistencia a la tensión de una fibra
sintética nueva que se utilizará para hacer tela de
camisas. El ingeniero sabe por experiencia que la
resistencia a la tensión se afecta por el peso
porcentual del algodón utilizado en la mezcla de
materiales de fibra. Además, sospecha que al
aumentar el contenido de algodón se incrementará
la resistencia, al menos al principio. El ingeniero
decide probar ejemplares en cinco niveles del peso
porcentual del algodón: 15, 20, 25, 30 y 35 por
ciento. ¿Cuántos ejemplares de cada nivel deberá
probar considerando un nivel de significación de 5%,
potencia de prueba de 0,8 y si sabe que una
estimación de la dispersión es 2,5 lb/pulgadas2 y la
diferencia máxima entre las medias 6,5 lb/pulgadas2
Potencia y tamaño de la muestra
ANOVA de un solo factor
α = 0.05  Desviación estándar asumida = 2.5
Factores: 1  Número de niveles: 5
Ejemplo de aleatorización
Nro. Peso
Secuencia
Un ingeniero de desarrollo de productos porcentual
de la prueba Corrida algodón
desea investigar la resistencia a la
tensión de una fibra sintética nueva que 1 8 20 Utilizando una hoja de
se utilizará para hacer tela de camisas. El 2 18 30
3 10 20 cálculo se puede generar las
ingeniero sabe por experiencia que la
resistencia a la tensión se afecta por el
4 23 35 coridas aleatorias
5 17 30 =ALEATORIO.ENTRE(1;25)
peso porcentual del algodón utilizado en
6 5 15
la mezcla de materiales de fibra. 7 14 25
Además, sospecha que al aumentar el 8 6 20
contenido de algodón se incrementará la 9 15 25
resistencia, al menos al principio. El 10 20 30
ingeniero decide probar ejemplares en 11 9 20
cinco niveles del peso porcentual del 12 4 15
algodón: 15, 20, 25, 30 y 35 por ciento. 13 12 25 Datos de resistencia a la
También decide probar cinco ejemplares 14 7 20 tensión (en lb/pulgadas2)
en cada nivel del contenido de algodón. 15 1 15
Peso
Las 25 corridas serán: 16 24 35 porcentual Observaciones
Peso 17 21 35 del algodón
porcentual del Número de corrida experimental 18 11 25
algodón
15 7 7 15 11 9
19 2 15 20 12 17 12 18 18
15 1 2 3 4 5
20 13 25
20 6 7 8 9 10 25 14 18 18 19 19
21 22 35
25 11 12 13 14 15 30 19 25 22 19 23
22 16 30
30 16 17 18 19 20 23 25 35 35 7 10 11 15 11
35 21 22 23 24 25 24 19 30
25 3 15
ANOVA PARA EL DISEÑO COMPLETAMENTE AL
AZAR (DCA)
El ANOVA es la técnica utilizada en el análisis de datos experimentales que consiste
en separar la variación total en las partes con las que contribuye cada fuente de
variación en el experimento. En DCA la variabilidad total se separa en la variabilidad
debida a los tratamientos y la debida al error.

Tabla de ANOVA para el DCA

Yij = m + ti + eij
Donde:
m :Media global
ti : Efecto del tratamiento i
eij : Es el error atribuible a la medición Yij
ANOVA DE UN FACTOR

Triola (2018)
Aplicación
Un ingeniero de desarrollo de productos desea investigar la resistencia a la tensión de una fibra
sintética nueva que se utilizará para hacer tela de camisas. El ingeniero sabe por experiencia
que la resistencia a la tensión se afecta por el peso porcentual del algodón utilizado en la
mezcla de materiales de fibra. Además, sospecha que al aumentar el contenido de algodón se
incrementará la resistencia, al menos al principio. El ingeniero decide probar ejemplares en
cinco niveles del peso porcentual del algodón: 15, 20, 25, 30 y 35 por ciento. También decide
probar cinco ejemplares en cada nivel del contenido de algodón. Los datos de resistencia a la
tensión se muestran a continuación:
Peso porcentual del Analice los datos y concluya al nivel de significación
Observaciones
algodón de 5%:
15 7 7 15 11 9 1. ¿El peso porcentual de algodón influye en la
20 12 17 12 18 18 resistencia a la tensión?
25 14 18 18 19 19 2. ¿Qué peso o (pesos porcentuales) recomendaría
30 19 25 22 19 23 utilizar para incrementar la resistencia a la
35 7 10 11 15 11 tensión?
Yij = m + ti + eij
donde:
Yij : Es la j-ésima medición de la resistencia a la tensión en la fibra que contiene el i-ésimo peso
porcentual de algodón Supuestos del modelo:
m :Media global
1. Los errores provienen de una población normal
ti : Efecto del tratamiento i
2. Las varianzas poblacionales son iguales
eij : Es el error atribuible a la medición Yij
3. Los errores son independientes
Paso1. Estimación de los errores
Minitab: Estadísticos/ANOVA/Modelo lineal general/Ajustar modelo lineal general

Paso2. Analizando el cumplimiento de los supuestos


Normalidad
H0:Los errores sí provienen de una población normal
H1:Los errores no provienen de una población normal
a=0.05
Criterio de rechazo y no rechazo de Ho
Si valor p ≤ α  Se rechaza Ho
Si valor p > α  No se rechaza Ho

Como valor p= 0.170 > 0.05 No se rechaza Ho.


Por lo tanto, a un nivel de significación de 5%, los errores
provienen de una población normal
Paso2. Analizando el cumplimiento de los supuestos
Homocedasticidad

a=0.05
Criterio de rechazo y no rechazo de Ho
Si valor p ≤ α  Se rechaza Ho
Si valor p > α  No se rechaza Ho

Como valor p= 0.920> 0.05 No se rechaza Ho.


Por lo tanto, a un nivel de significación de 5%, los errores tienen igual varianza en cada tratamiento
Independencia de errores
Al analizar la gráfica de los residuales vs tiempo no se
aprecia correlación entre los residuales (es decir no se
observa tendencia a tener corridas de residuales
positivos y negativos)
Paso3. Análisis de la varianza

a=0.05

Criterio de rechazo y no rechazo de Ho


Si valor p ≤ α  Se rechaza Ho
Si valor p > α  No se rechaza Ho

Como valor p= 0 < 0.05 Sí se rechaza Ho.


Por lo tanto, a un nivel de significación de 5%, la evidencia muestral es suficiente para afirmar que el
peso porcentual de algodón influye en la resistencia a la tensión.
Paso4. Pruebas de comparaciones múltiples
Minitab: Estadísticas/ANOVA/Modelo lineal general/comparaciones

a=0.05

Agrupar información utilizando el método de Tukey y una


confianza de 95%
Peso
porcentual N Media Agrupación
30 5 21.6 A      
25 5 17.6 A B    
20 5 15.4   B C  
35 5 10.8     C D
15 5 9.8       D
Las medias que no comparten una letra son significativamente diferentes.

A un nivel de significación de 5%, con 30 como peso porcentual de algodón, se obtiene una
mayor resistencia a la tensión, comparado con el resto de tratamientos.
Aplicaciones

1. Se hace un estudio sobre la efectividad de tres marcas de spray para matar


moscas. Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta
el número de moscas muertas expresado en porcentajes. Se hacen seis réplicas y
los resultados obtenidos se muestran a continuación.

a) Formule la hipótesis adecuada y el modelo estadístico.


b) ¿Existe diferencia entre la efectividad promedio de los productos en spray?
c) ¿Hay algún spray mejor? Argumente su respuesta.
d) Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada
una de las marcas.
e) Dibuje las gráficas de medias y los diagramas de caja simultáneos, después interprételos.
f) Verifique los supuestos de normalidad y de igual varianza entre las marcas.
Aplicaciones

En un centro de investigación se realiza un estudio para comparar varios tratamientos que, al aplicarse previamente
a los frijoles crudos, reducen su tiempo de cocción. Estos tratamientos son a base de bicarbonato de sodio (NaHCO3)
y cloruro de sodio o sal común (NaCl). El primer tratamiento es el de control, que consiste en no aplicar ningún
tratamiento. El tratamiento T2 es el remojo en agua con bicarbonato de sodio, el T3 es remojar en agua con sal
común y el T4 es remojar en agua con una combinación de ambos ingredientes en proporciones iguales. La variable
de respuesta es el tiempo de cocción en minutos. Los datos se muestran en la siguiente tabla:

a) ¿De qué manera el experimentador debe aleatorizar los experimentos y el material experimental?
b) Dé ejemplos de factores que deben estar fijos durante las pruebas experimentales, para que no afecten los resultados y las
conclusiones.
c) Formule y pruebe la hipótesis de que las medias de los tratamientos son iguales.
d) Obtenga el diagrama de caja y el gráfico de medias, después interprételos.
e) ¿Hay algún tratamiento mejor? ¿Cuál es el tiempo de cocción esperado para el mejor tratamiento?
f) Algo importante a cuidar en un experimento es que no haya efectos colaterales no deseados, causados por el tratamiento
ganador; en este caso, piense en los posibles efectos colaterales que podría causar el mejor tratamiento.
g) ¿Se cumplen los supuestos del modelo? Verifique gráficamente.
h) Pruebe la hipótesis de igualdad de varianzas entre tratamientos (que corresponde a un supuesto)
Gutierrez y De La vara (2008). Análisis y diseño de experimentos. Segunda
edición, McGraw-hill/INTERAMERICANA

También podría gustarte