Está en la página 1de 13

Programa de Maestría en Estadística Especializada

Diseño de Experimentos

Examen Parcial N.º 2 1.

Defina y explique los siguientes conceptos:


a. Modelo completamente aditivo.
Un modelo completamente aditivo1 es un tipo de modelo matemático utilizado en
estadísticas y análisis de datos. En este tipo de modelo, se asume que el efecto de cada
variable independiente se suma de manera independiente para predecir el valor de la
variable dependiente. En otras palabras, el efecto total de cada variable es la suma de sus
contribuciones individuales. Este tipo de modelo es útil cuando no se espera que las
interacciones entre las variables sean significativas.

A modo de ejemplo, si se desea entender la cantidad de sol que hace que una planta crezca,
se analizan los factores que afectan a las plantas y su crecimiento con relación a su
exposición al sol; entonces, si para este estudio se utiliza un modelo completamente aditivo,
los efectos de cada factor se sumarán por separado. Si un factor hace que la planta crezca
más, su efecto se suma por sí mismo, sin tener en cuenta cómo interactúa con otros factores.

b. Importancia del bloqueo en un diseño experimental.


El bloqueo en un diseño experimental2 se refiere a la técnica de dividir los experimentos en
grupos o bloques homogéneos antes de aplicar tratamientos o condiciones. Esto se hace
para controlar el efecto de variables que podrían influir en los resultados del experimento.
Al bloquear, se asegura que cada bloque contenga una variabilidad similar, lo que reduce
la influencia de factores no deseados y permite obtener conclusiones más precisas sobre los
efectos de los tratamientos.

1
"Introduction to the Design and Analysis of Experiments", George W. Cobb.
2
"Design and Analysis of Experiments", Douglas C. Montgomery.
Por ejemplo, al hacer un experimento donde se prueban diferentes tipos de fertilizantes en
diferentes tipos de suelo, si no se toma en cuenta los tipos de suelo, los resultados pueden
no ser muy precisos, porque puede que el fertilizante sea efectivo, pero no para todos los
tipos de suelo. En este sentido el bloqueo consiste en dividir el experimento en grupos
similares, es decir probar cada fertilizante en cada tipo de suelo. Esto ayuda a asegurar que
cualquier diferencia en los resultados se deba realmente al fertilizante y no a diferencias en
el suelo.

c. Selección empírica de una transformación.


La selección empírica de una transformación3 consiste en elegir una función matemática
para aplicar a los datos originales con el objetivo de cambiar su distribución o estructura.
Esta transformación puede ser útil cuando los datos no cumplen con los supuestos de
normalidad u homocedasticidad en un análisis estadístico. La elección de la transformación
se realiza de manera empírica, mediante prueba y error, atreves de la observación del efecto
de esta sobre los datos, para determinar cuál transformación logra que los datos se ajusten
mejor a los supuestos necesarios para el análisis estadístico.

Por ejemplo, si los datos tienen una distribución que se sesga hacia la derecha, probar con
transformaciones como el logaritmo o la raíz cuadrada o elevado al cuadrado, podrían
ayudar a estandarizar los datos y lograr que estos se asemejen más a una distribución
normal. Estas trasformaciones son muy usadas cuando se utilizan variables como la edad
de las personas, la altura o el salario, porque los datos no se comportan de manera normal.

d. Utilidad de los polinomios ortogonales en el diseño experimental.


Los polinomios ortogonales4 son funciones polinómicas que tienen la propiedad de ser
mutuamente perpendiculares en un intervalo específico y se utilizan en análisis de diseño
experimental para modelar relaciones no lineales entre variables. Estos polinomios
permiten ajustar modelos flexibles a los datos sin la multicolinealidad que a menudo ocurre
con los términos de grado superior en los modelos de regresión tradicionales. Al usar

3
"Applied Linear Statistical Models", Michael H. Kutner, Christopher J. Nachtsheim, John Neter y William Li.
4
"Experimental Design: Procedures for the Behavioral Sciences", Roger E. Kirk.
polinomios ortogonales, es posible capturar patrones más complejos en los datos y evitar
problemas numéricos asociados con la multicolinealidad.

En otras palabras, los polinomios ortogonales son como bloques de construcción


matemáticos que ayudan a formar una curva más suave y simple para datos, asegurando
que estos no se mezclen o se vuelvan confusos.

Un ejemplo son los polinomios ortogonales de Legendre, que son una serie de funciones
polinómicas especiales que son perpendiculares entre sí en un intervalo específico. Y en
uno de segundo grado podría hacerse uso de un polinomio constante, un polinomio lineal y
un polinomio cuadrático en un mismo modelo.

2. Una investigación realizada por Singh et al y publicada en la revista Clinical Inmunology


and Inmunopathology se refiere a las anormalidades inmunológicas en niños autistas. Como
parte de su investigación, tomaron mediciones de la concentración sérica de un antígeno en
tres muestras de niños de diez años o menos edad. Las mediciones en unidades por milímetro
de suero son,

Niños autistas: 755, 385, 380, 215, 400, 343, 415, 360, 345, 450, 410, 435, 460, 360, 225, 900,
365, 440, 820, 400, 170, 300, 325, 925, 827, 693, 325, 452, 385, 425, 785, 345, 410.

Niños normales: 165, 390, 290, 435, 235, 345, 320, 330, 205, 375, 345, 305, 220, 270, 355, 360,
335, 305, 325, 245, 285, 370, 345, 345, 230, 370, 285, 315, 195, 270, 305, 375, 220.

Niños con retraso mental (sin síndrome de Down): 380, 510, 315, 565, 715, 380, 390, 245, 155,
335, 295, 200, 105, 105, 245, 416, 395, 275, 195, 453, 380, 715, 158, 332, 603, 335, 201, 108, 206,
264, 275, 398, 462.

a. Hacer un análisis exploratorio de estos datos. Interpretar los resultados obtenidos.


Al analizar los datos sobre la concentración sérica un antígeno en tres grupos de niños
observamos que:
1. En el grupo de los niños con autismo, el rango de concentraciones séricas va desde
170 hasta 925 unidades por mililitro, la mediana es 400, lo que indica que la mitad
de las mediciones están por encima de este valor y la otra mitad están por debajo; y
el valor promedio de las concentraciones séricas en este grupo es de 461.5.
2. En el grupo de niños normales o que evidentemente no parecen una condición, el
rango de concentraciones séricas va desde 165 hasta 435 unidades por mililitro, la
mediana es 315, lo que indica que la mitad de las mediciones están por encima de
este valor y la otra mitad están por debajo, y el valor promedio de las
concentraciones séricas en este grupo es de 305.
3. En el grupo de niños con retraso mental (sin síndrome de Down), el rango de
concentraciones séricas va desde 105 hasta 715 unidades por mililitro, la mediana
es 332, lo que indica que la mitad de las mediciones están por encima de este valor
y la otra mitad están por debajo; y el valor promedio de las concentraciones séricas
en este grupo es de 336.7.

De manera general se observa que, en promedio los niveles de concentración sérica del
antígeno en los niños “Normales” es menor que el valor promedio para los niños con
autismos y retazo mental. Mientras que, el grupo de los niños con autismos muestran que
estos tienen el mayor valor promedio de concentración sérica del antígeno por mililitro.

Análisis de varianza y desviación estándar


Al analizar los datos para el grupo de niños autistas, podemos observar que, este grupo posee la
varianza más alta (40182.2), lo que indica que, las concentraciones séricas del antígeno en este
grupo están más dispersas alrededor de la media en comparación con los otros grupos. Seguido por
el grupo de niños con retraso mental (sin síndrome de Down) que tiene una varianza de 25664.59,
lo que sugiere que las concentraciones séricas en este grupo también están bastante dispersas. Por
último, tenemos el grupo de niños normales que tienen una varianza de 4071.89, lo que representa
una dispersión moderada d los datos en comparación con los demás grupos.
El gráfico muestra que los datos de las concentraciones séricas del antígeno en el grupo de
los niños autistas se distribuyen normalmente, sin embargo, se evidencia la existencia de
valores atípicos. En el caso de los niños normales, los datos de la concentración sérica para
este grupo se distribuyen casi normalmente. Mientras que, en el caso de los niños con
retraso mental, los datos muestran una distribución asimétrica con valores atípicos.

a. Una vez realizado el análisis exploratorio, determinar si la condición del niño tiene
algún efecto sobre la concentración sérica de un antígeno.

Análisis de (ANOVA)

Planteamiento de hipótesis.
H0: No hay diferencias en la concentración sérica del antígeno en los grupos de niños.
H1: Por lo menos en un grupo de niños existe diferencias en la concentración sérica del
antígeno.

De acuerdo con los resultados, con un p-valor de 0.000146, menor que el nivel de
significancia de 0.05, se rechaza la hipótesis nula y se acepta la alternativa, que indica que
por lo menos en un grupo de niños existe diferencias en la concentración sérica del antígeno.
En este sentido concluimos que, existen diferencias significativas en las concentraciones
séricas del antígeno entre los grupos de niños.

b. De ser afirmativa la respuesta en el ítem (D) utilice un procedimiento para probar las
diferencias significativas entre pares de medias individuales. Interpretar los
resultados obtenidos.
Comparación de medias

La media estimada para el grupo de niños autistas es de 462 unidades por mililitro de suero;
para el grupo de niños normales, la media estimada es 305; y para el grupo de niños con
retraso mental, la media estimada es 337. Estos datos en sentido general indican que en
promedio existen diferencias de las concentraciones séricas del antígeno entre los grupos
de niños autistas, los niños normales y los niños con retraso mental.

Combinaciones por pares mediante el método de Tukey

Considerando las medias y los intervalos de confianza que se muestran, podemos observar
que,
1. El contraste de la diferencia entre las medias de los grupos de niños autistas y
normales es de 156.5 unidades por mililitro de suero, y el intervalo de confianza va
desde 67.0 hasta 246.0 unidades por mililitro de suero; Lo que sugiere una diferencia
estadísticamente significativa, porque el intervalo no incluye el cero.

2. El contraste de la diferencia entre las medias de los grupos de niños autistas y con
retraso mental es de 124.8 unidades por mililitro de suero, y el intervalo de confianza
va desde 35.3 hasta 214.3 unidades por mililitro de suero; Lo que sugiere una
diferencia estadísticamente significativa, porque el intervalo no incluye el cero.

3. El contraste de la diferencia entre las medias de los grupos de niños normales y con
retraso mental es de -31.7 unidades por mililitro de suero, y el intervalo de confianza
va desde -121.2 hasta 57.8 unidades por mililitro de suero. Para este caso no se
indica una diferencia estadísticamente significativa porque el intervalo de confianza
incluye el cero.

En general, el promedio de la concentración sérica en el grupo de niños con autismo


difiere significativamente del promedio de la concentración sérica en los niños
normales. Del mismo modo, el promedio de la concentración sérica en el grupo de niños
con autismo muestra diferencias en comparación con el promedio de la concentración
sérica en los niños con retraso mental. Mientras que, se evidencia que el promedio de la
concentración sérica en el grupo de niños normales es igual o equivalente al grupo de
niños con retraso mental.
Gráfica Método de Tukey

En la gráfica se observa lo antes expuesto. En la comparación entre los autistas y los


normales, como en el contraste de los autistas y los que tienen retraso mental, debido a que
el intervalo de confianza de estas combinaciones no contiene el cero, podemos concluir que
la concentración sérica de los grupos es diferente entre los grupos para cada combinación.
Mientras que, en la comparación de los normales con los que tienen retraso mental, se
observa que las medias son iguales o equivalentes debido a que el intervalo de confianza
contiene el cero.
3. Para un diseño cuadrado latino con efectos fijos, hallar:

a. La estimación de parámetros usando el método de mínimos cuadrados mediante un


sistema de ecuaciones normales.

Ecuaciones normales: Soluciones


b. La expresión algebraica para SCTr .

Desviaciones respecto de las medias

Aplicamos cuadrados de ambos lados para conseguir las sumas de cuadrados

Despejamos la suma de cuadrado de los tratamientos

SCtr =

c. E(MCTr).

4. En una investigación agrícola para estudiar la relación entre la densidad de plantas (X) y
el rendimiento (Y) en un invernadero, se utilizó un diseño completamente aleatorizado con 3
réplicas y 5 tratamientos con valores de densidad de plantas iguales a: 10, 20, 30, 40 y 50. Se
dispone de la siguiente información parcial por la salida del sistema R: SCTr = 87.60; SCE =
7.48 y yi. = 36; 48; 57; 54; 51.
a. Escribir el modelo y la tabla ANOVA correspondiente.

Suma de
Valor
Cuadrado

SCtr 87.6

Sce 7.48

SCt 95.08

Tabla de Anova Diseño Completamente Aleatorio

Fuente de Variación G.L S.C C.M F F (0.05,4,10)

Tratamientos 4 87.6 21.9 29.2780749 3.478

Error 10 7.48 0.748

Total 14 95.08 - - -

Planteamiento de hipótesis
Ho: Mt1 = Mt2 =Mt3…. = Mta
H1: Mt1 ≠ Mt2 ≠ Mt3…. ≠ Mta

Decisión= Ftabular ≤ Fcalculado Se Rechaza Ho

Modelo del Experimento


Yij = µ + Ti + Eij
Rendimiento = Media global + Efecto_tratamiento + Error

b. Suponga que el tercer nivel de tratamiento es usado por primera vez. Plantear los
contrastes ortogonales significativos que puedan ser útiles al inicio del experimento.
F
Contrastes Tratamientos r *Ci Ci*Yi SCcontr Valor F
(0.05,1,10)
1 2 3 4 5
C1 3 vs 1+2+4+5 -1 -1 4 -1 -1 60 39 25.4 33.8903743
-
C2 1+2 vs 5 1 1 0 0 -2 18 18 24.0641711
18
C3 2+5 vs 4 0 1 0 -2 1 18 -9 4 5.34759358 4.96
C4 1+4 vs 2 1 -2 0 1 0 18 -6 2 2.67379679
C5 4 vs 5 0 0 0 1 -1 6 3 1.5 2.00534759
Totales Yi 36 48 57 54 51 50.9

Para el primer contraste se tomó como control el tratamiento 3 respecto a los demás
tratamientos, y se plantearon otros contrastes para las posibles combinaciones que pudieran
ser significativas.

r * ∑ C12 = 3 * {(-1)2 + (-1) 2 + (4)2 + (-1)2 + (-1)2} = 60


Así con las demás
∑ C1 Y1 = (-1*36) + (-1*48) + (4*57) + (-1*54) + (-1*51) = 39
Así con las demás
SCcontr = ∑ (C1 Y1)2/ r * ∑ C12
F-valor = CMC/CME
El CMC equivale al cuadrado medio de los contrastes, porque cada contraste tiene un grado
de libertad. Se verifico que la suma de los coeficientes de cada contraste de 0.

Verificar si los contrastes son ortogonales.


∑ci*cí = 0
∑ C1 *C2 = (-1*1) + (-1*1) + (4*0) + (-1*0) + (-1*2) = 0
∑ C1 *C3 = 0
∑ C1 *C4 = 0
∑ C1 *C5 = 0
∑ C4 *C5 = 0
Se verifica que los contraste son ortogonales.
Sub-hipótesis
Ho: 4MT3 = Mt1+Mt2+MT4+MT5
Hi: 4MT3 ≠ Mt1+Mt2+MT4+MT5

c. ¿Cuál es el valor predicho del rendimiento de las plantas para el segundo nivel de
tratamiento? Explique.

ŷsegundo nivel = 16.4 + 16 - 16.4 = 16


De acuerdo con los resultados el valor predicho del rendimiento de las plantas para el
segundo nivel de tratamiento es 16. Lo que indica que, para una planta de densidad igual a
20, el rendimiento medio esperado es de 16 unidades

d. Escriba las conclusiones del experimento.

El modelo se evaluó asumiendo que el mismo cumple con todos los supuestos. Entre las
conclusiones de este ejercicio podemos mencionar que, se observa que los tratamientos
son estadísticamente significativos y que existen diferencias estadísticamente
significativas entre los ellos.

Debido a que existen diferencias estadísticamente significativas entre los tratamientos,


se realizó el contraste ortogonal para ver la significancia de las combinaciones. De
acuerdo con los contrastes planteados, utilizando como control el tratamiento 3, se
concluyó que son significativos, es decir los efectos de las combinaciones son
diferentes, tal como para el grupo 1 y 2 contra el tratamiento 5. De igual manera se
puede observar que existen combinaciones no significativas, como es el caso del
contraste entre los tratamientos 4 y 5, que de acuerdo con los resultados resultaron ser
no significativos.

También podría gustarte