Está en la página 1de 3

UNIVERSIDAD DE LAS FUERZAS ARMADAS - ESPE

Carrera de Ingeniería en Biotecnología: Quinto Nivel


PRUEBA PARCIAL N° 1
Diseño de Experimentos

PROGRAMA 1 (2.0 puntos).


Realizar en R una función que genere números que se ajusten a una distribución normal estándar hasta encontrar
uno mayor que z. La función debe retornar el número de intentos que ha necesitado. Correr la función con los
siguientes valores de z : 3.5,3, 2,1,0, 1, 2, 3, 3.5 .

PROGRAMA 2 (5.0 puntos).


El siguiente programa de R contiene cinco errores; corregirlos.
# Modelo de crecimiento exponencial de poblaciones con
estocasticidad ambiental.
meanr <- 0.1 # Tasa instantánea media de crecimiento.
sdr <- 0.2 # Desv. Est. de la tasa instantánea de Crec.
N0 <- 10 # Tamaño inicial de la población.
tmax <- 100 # Duración de la simulación.
dt <- 1 # Paso de tiempo.
npasos <- tmax / dt # Número de pasos de la simulación.
t <- numeric(npasos) # Vector de tiempos.
n <- numeric(npasos) # Vector de tamaños poblacionales.
# Modelo de crecimiento exponencial de poblaciones.
crec_exp <- funcion(N, par1, tinc){
res <- N * par1 * tinc
return(res)
} #end crec_exp
i <- 1
t[i] <- 0
n[i] <- N0
if (N0 >= 1) extincion <- FALSE
while ((i < npasos) & extincion) {
i <- i + 1
t[i] <- t[i-1] + dt
rr <- rnorm(1,meanr,sdr)
n[i] <- n[i-1] + crec_exp(n[i-1],rr)
if (n[i] < 1){
cat("La población se ha extinguido en el tiempo", t[i])
extincion <- TRUE
} # end while
plot(t, n)
En el script debe constar el programa corregido identificando documentadamente y con letras mayúsculas los
cinco errores. Correr el programa corregido tres veces y pegar en el archivo Word el gráfico obtenido de cada
corrida.

PROGRAMA 3 (5.0 puntos).


Realizar una función que obtenga k muestras de tamaño n de una población N   ,  de tamaño N
2
y calcule,
con cada una muestra, un IdC 1  ; se debe incluir el tamaño poblacional en la fórmula del IDC (intervalo de
confianza) y considerar dos casos: MG (muestra grande: n  25 ) y MP (muestra pequeña: n  25 ). La función
debe retornar el número de intervalos que contienen a  . Correr diez veces la función con k  100 , n  50 ,
  14.50 ,  2  1.44 , N  1000 , 1    0.95 ; se debe poner en el archivo Word las 10 salidas obtenidas y la
respuesta a las siguientes preguntas: ¿Cuál es el valor esperado de una salida? ¿Cuántas de las 10 salidas son
menores que el valor esperado? ¿Cuántas de las 10 salidas coinciden con el valor esperado? ¿Cuántas de las 10
salidas son mayores que el valor esperado?

PROGRAMA 4 (3.0 puntos).


Según el método estudiado en clase, programar una función en R que construya una TdF para datos provenientes
de una VAC. Correr la función con los siguientes datos:

1
45.7 41.0 36.8 35.9 43.9 37.3 29.5 35.3 30.9 37.7
34.5 38.0 28.8 26.0 42.8 38.9 33.1 41.7 28.9 38.8
22.2 35.2 31.9 40.2 25.8 32.2 45.6 41.8 43.1 28.5
45.8 39.5 36.0 41.0 35.9 38.9 42.3 38.6 38.6 36.6
36.3 36.9 36.8 36.6 32.4 38.2 36.7 32.6 38.1 40.1
26.8 35.9 30.5 31.7 33.2 33.7 34.4 29.7 24.2 42.6
27.0 39.3 39.0 24.4 29.1 26.4 29.9 36.5 34.8 41.5
29.3 40.2 28.3 30.1 26.1 45.2 30.0 31.9 32.1 32.3
38.9 41.6 37.8 31.7 23.1 33.7 27.3 24.6 48.3 25.8
45.6 40.9 28.7 43.6 33.7 29.1 38.3 42.4 39.2 38.6

PROGRAMA 5 (5.0 puntos).


RCBD (randomized complete block design) o DBCA (diseño en bloques completos aleatorizados).
En cualquier experimento, los resultados pueden verse afectados por la variabilidad causada debido a los factores
de bloque (o factores perturbadores: Aquellos que probablemente tengan efecto sobre la variable de respuesta
pero sobre los que no existe ningún interés específico; en inglés se conocen como backgrounds variables o
blockings variables)1. Cuando además de un factor de interés (factor de tratamientos) hay un único factor de
bloque conocido y controlable, se emplea la técnica RCBD de diseño experimental para eliminar de manera
sistemática su efecto sobre las comparaciones estadísticas entre las medias de los tratamientos. En un RCBD se
consideran tres fuentes de variabilidad: el factor de tratamientos, el factor de bloque y el error aleatorio; es decir
se tienen tres posibles “culpables” de la variabilidad presente en los datos. La palabra completo en el nombre del
diseño se debe a que en cada bloque se prueban todos los tratamientos. La aleatorización se hace dentro de cada
bloque y no de manera total como en el DCA (diseño completamente aleatorizado) o, por sus siglas en inglés,
CRE (completely randomized experiment); el hecho de que existan bloques hace que no sea práctico o que
incluso sea imposible aleatorizar en su totalidad.
A fin de ilustrar esta idea, supongamos que se hace un estudio sobre la efectividad de tres tipos de metabolitos
secundarios obtenidos de plantas2 para el control de Drosophila melanogaster (la mosca de la fruta). Para ello se
establece un protocolo donde cada metabolito diluido se aplica diariamente a un grupo de 100 moscas; se cuenta
luego el número de moscas muertas. Se sospecha la existencia de un efecto perturbador en el tiempo, por lo que
se decide utilizarlo como factor de bloque. Los datos obtenidos se muestran a continuación:
Metabolito Lunes Martes Miércoles Jueves Viernes Sábado
A 72 65 67 75 62 73
B 55 59 68 70 53 50
C 64 74 61 58 51 69
Tabla 1: Datos experimentales para el control de Drosophila melanogaster.
El tradicional modelo estadístico de los efectos del RCBD es:
yij     i   i   ij .
En la ecuación anterior yij es el valor de la VDR (variable de respuesta) que corresponde al tratamiento i
 i  1, 2, , a  en el bloque j  j  1, 2, , b  ,  es la media global,  i es el efecto del tratamiento i ,  j es el
efecto del bloque j y  ij es el error aleatorio asociado a yij . Los efectos de los tratamientos y los efectos de los

1
La formación de bloques también puede ser útil en situaciones que no incluyen necesariamente factores perturbadores. Por ejemplo,
si un ingeniero en biotecnología está interesado en estudiar el efecto de la velocidad de alimentación del catalizador sobre la viscosidad
de un polímero y sabe que hay varios factores ‒como materia prima, temperatura y operador‒ que son muy difíciles de controlar en
procesos a gran escala, puede optar por probar en bloques la velocidad de alimentación del catalizador; cada bloque consistiría en
alguna combinación de estos factores no controlables. En este caso, el ingeniero estaría utilizando los bloques para probar la robustez
de su variable de proceso o factor (la velocidad de alimentación) en condiciones que no puede controlar con facilidad.
Diseño y análisis de experimentos, segunda edición 2004, Douglas Montgomery, Limusa Wiley, México.
2
“Se llama metabolitos secundarios de las plantas a los compuestos químicos sintetizados por las plantas que cumplen funciones no
esenciales en ellas, de forma que su ausencia no es fatal para la planta, ya que no intervienen en el metabolismo primario de las plantas.
Los metabolitos secundarios de las plantas intervienen en las interacciones ecológicas entre la planta y su ambiente.”
http://es.wikipedia.org/wiki/Metabolitos_secundarios_de_las_plantas, noviembre del 2016.
2
a b
bloques se consideran como desviaciones de la media global, por lo que 
i 1
i 0 y 
j 1
j  0 ; además, se supone

que  ij : N ID  0,  2  .
También, y considerando que ij     i   j , es posible usar el siguiente modelo de los promedios:
yij  ij   ij .
Luego de emplear el ANOVA (analysis of variance), que es la técnica central en el análisis paramétrico de datos
experimentales, se presentan los resultados en la siguiente tabla:
SoV SS df MS F0 p  value
Tratamientos SSTr dfTr  a  1 MSTr F0Tr p  valueTr
Bloques SS B df B  b 1 MS B F0B p  valueB
Error SS E df E   a  1 b  1 MS E
Total SST dfT  N  1
Tabla 2: Análisis de varianza para un RCBD.
En la tabla anterior SoV (source of variation) es la fuente de variación, SS (sum of squares) es la suma de
cuadrados, df (degrees of freedom) son los grados de libertad, MS (mean square) es la media de cuadrados, F0
( F  value ) es el estadístico de prueba para el contraste respectivo y p  value es el valor‒p. Además:

SSTr  b  yi•  y••  , SS B  a   y• j  y••  , SST    yij  y••  , SSE  SST  SSTr  SSB ,
a b a b
2 2 2

i 1 j 1 i 1 j 1

MSTr  SSTr dfTr , MSB  SSB df B , MS E  SS E df E , F0Tr  MSTr MSE , F0B  MSB MSE ,
  
p  valueTr  Pr FdfTr ,df E  F0Tr , p  value B  Pr Fdf B ,df E  F0 B . 
En un experimento en el que se use RCBD, el principal interés consiste en rechazar o no la igualdad de las medias
de los tratamientos. Para ello se efectúa la siguiente PDH (prueba de hipótesis), al NDS (nivel de significancia)
:
 H 0 : 1  2   a  

 H 1 : i i  
EDP : F0Tr  MSTr MS E
 p  valueTr    H 0
CDR : 
 p  valueTr    H 0
Decisión : Depende del contexto experimental.
Realizar una función R que:
• Tome un archivo tipo csv desde la carpeta DOE ubicada en el directorio de trabajo que por defecto tiene el
software R (la función getwd() devuelve el path de tal directorio); este archivo debe contener los datos
experimentales para un RCBD, dispuestos como en la tabla 1.
• Retorne un análisis de varianza igual a la tabla 2.
Como parte de la calificación se debe poner en el archivo Word la tabla ANOVA que resulte al correr la función
con los datos del archivo Metabolitos.csv.

¡Éxitos!