Está en la página 1de 9

EVALUACIÓN FINAL

Jessica Mildred Vanegas Sánchez


Biometría y diseño experimental

EJERCICIO-1
Con base en los datos de diferentes niveles de glucosa en 60 niños, realizar los
siguientes puntos:
a. Construyan la tabla de distribución de frecuencias con las siguientes
columnas: Clases, Intervalos de clase, Marca de clase, Frecuencia
absoluta, Frecuencia absoluta acumulada, Frecuencia relativa.
Ver en el Excel
b. Realizar histograma y polígono de frecuencias.
Ver en el Excel
c. Promedio.
Ver en el Excel
d. Desviación estándar.
Ver en el Excel
e. Coeficiente de variación.
Ver en el Excel

f. Interpretar cada uno de los anteriores con fundamentación estadística.


Todos los parámetros calculados representan medidas de dispersión. La media,
que es 66.69, está ubicada entre los números más bajos, lo cual se observa
también en el histograma de frecuencias, en donde los números que más se
repiten están ubicados hacia el lado izquierdo. Esto significa que los datos están
más concentrados hacia el lado izquierdo de la gráfica, en otras palabras, que
existen pocos niños que tienen altos niveles de glucosa, y que la mayoría de los
niños tienen niveles de glucosa bajos, que oscilan entre 57 y 69, siendo el
promedio 66.69.
La desviación estándar (6.91) supera el ancho de clase (4), y nos dice que la
variabilidad de los datos es alta, es decir, que los niños tienen niveles de glucosa
altos y bajos que están dispersos en el rango de 57 a 81, y que se alejan en
muchos casos del promedio.
EJERCICIO-2
En 20 frascos se colocó una alimentación regular; en cada frasco se contó el
número de moscas. En otros 20 frascos se colocó zumo de uva e igualmente se
contó el número de moscas.
a. Calcular la media de la muestra, la varianza de la muestra, la
desviación estándar de la muestra y el coeficiente de variación de
cada conjunto de datos. Haga los respectivos comentarios.
Ver cálculos en Excel.
Para cada muestra se calculó la media, varianza y desviación estándar. Para la
muestra 1 (comida regular), se observa que la mayoría de los datos están
concentrados hacia la derecha de la media (25.71), pero que existen datos hacia
su derecha como a su izquierda que otorga gran variabilidad a los datos. Para la
muestra 2 (zumo de uva), la variabilidad de los datos es más alta, porque existen
gran concentración de datos tanto a la izquierda como a la derecha de la media
(11.37); en este caso, la mayor concentración de datos se encuentra hacia la
derecha de la media, y no concentrados en torno a la media.

b. ¿Cuál de estos dos conjuntos de datos tienen una mayor variabilidad?


Se observa que la muestra 1 (comida regular) tiene menos variabilidad en los
datos que la muestra 2 (zumo de uva), pues no solo su desviación estándar es
menor, sino que, en el caso de la muestra 2, los datos no están concentrados en
la media, sino hacia su derecha.

c. Para cada conjunto de datos crear gráficos de histograma.

Ver en Excel.
EJERCICIO-3
Un farmacéutico compro un material específico de dos diferentes proveedores.
Para comparar el nivel de impurezas presentes en los productos adquiridos de los
dos proveedores, el farmaceuta midió el porcentaje de impurezas para cada uno
de los dos grupos.
a. ¿Cuál de los productos adquiridos presenta la mayor uniformidad en
las impurezas? Justifique estadísticamente su respuesta.

Hipótesis Nula (H0): Los datos siguen una distribución uniforme, con un nivel de
significancia de 0.05 (5%).
Hipótesis Alternativa (H1): Los datos no siguen una distribución uniforme, con un
nivel de significancia de 0.05 (5%).

En ambos casos, la hipótesis nula se rechaza, porque el valor de “D” es mayor


que el valor “D” hallado en la tabla; esto significa que ambos conjuntos de datos
no siguen una distribución uniforme.
Sin embargo, en el caso del conjunto de datos del “proveedor B”, el valor de “D” es
mayor (2.3) que en el caso del “proveedor A” (1.7). Como está más alejado del
valor “D” hallado en la tabla, significa que presenta menor uniformidad en sus
datos.
EJERCICIO-4
Se investigó la pérdida de peso (Gómez y González, 1991) en porcentaje del peso
inicial de la carne de res tipo milanesa después de 5 días de empacada con
diferentes materiales.
Ya se ha comprobado que los datos son normales y con varianzas homogéneas.
De acuerdo a los datos presentados y a la distribución del experimento resuelva:
a. ¿Qué tipo de diseño experimental es? Justifique su respuesta.
Diseño en bloques completos al azar, porque cada uno de los tratamientos se
ubicó al azar en diferentes bloques. En este tipo de diseño, las Unidades
Experimentales (U.E) se hallan agrupadas en bloque con el fin de que cada uno
de éstos posea U.E homogéneas entre sí.
El bloqueo es una técnica para aumentar la precisión del ensayo; con su
conformación se pretende controlar los efectos de las variables extrañas que
perturben el normal desarrollo del ensayo. En este tipo de diseño se puede usar el
número de bloques y de Tratamientos que se desee.
El objetivo del diseño es eliminar el error de la variación entre bloques y asegurar
que las medias de los Tr estén libres de los efectos de éstos. Pero para que esto
se logre, se requiere homogeneidad dentro de los bloques, es decir, entre las U.E,
y heterogeneidad entre los bloques.

b. ¿Cuál es el modelo matemático? Para cada ítem en el ejercicio


planteado indique a que corresponde cada término del modelo

Para un diseño EN BLOQUES completos al azar, el modelo matemático es el


siguiente:
Yijk=u+Ti+ Bj+ Eij

Yijk = Resultado del tratamiento


u = media general del experimento (promedio global de la producción de materia
seca)
Ti = efecto del i-ésimo tratamiento (efecto del TIPO DE SUELO)
Bj = efecto de j-ésimo tratamiento (efecto de la PARCELA)
Eijk = error experimental
c. ¿Estipule claramente las hipótesis que interesa contrastar con el
análisis de varianza de este experimento?

Hipótesis Nula (H0): No existen diferencias estadísticamente significativas entre


los promedios de pérdida de sangre de los diferentes días y los diferentes tipos de
empaque, con un 5% de significancia.
Hipótesis Alternativa (H1): Al menos uno de los factores, ya sea tipo de
"empaque" o "día", influyen en la pérdida de sangre de la carne, con un nivel de
significancia de 0.05 (5%).

d. Realice el análisis de varianza en Excel, con las fórmulas, la tabla de


varianza debe recoger los valores de SC, CM, GL, F y probabilidad
realizados con fórmula debidamente evidenciable y relacionando las
operaciones. No se admitirán resultados que no sea del producto de
las fórmulas elaboradas en el archivo Excel.
Ver en Excel.

e. ¿Según el análisis de varianza hay diferencias significativas? ¿Por


qué?
Teniendo en cuenta los resultados tanto de las filas como de las columnas, se
rechaza la hipótesis nula, aceptándose la hipótesis alternativa de que “Al menos
uno de los factores, ya sea tipo de "empaque" o "día", influyen en la pérdida de
sangre de la carne, con un nivel de significancia de 0.05 (5%).” Esto significa que
si se varía ya sea el DÍA o EL TIPO DE EMPAQUE, habrá un efecto
estadísticamente significativo en la pérdida de sangre de la carne.
Para las filas: DÍA
En este caso, el valor del factor F (1.496) es menor que el valor crítico de F (3.26)
hallado en la tabla, cayendo dentro de la zona de aceptación, resultando que el
factor DÍA no sea estadísticamente significativo. Esto significa que, si varío el DÍA,
la pérdida de sangre de la carne no va a variar mucho.
Para las Columnas: TIPO DE EMPAQUE
En este caso, el valor del factor F (9.219) es mayor que el valor crítico de F (3.39),
cayendo dentro de la zona de rechazo, resultando que el factor TIPO DE
EMPAQUE sea estadísticamente significativo. Esto significa que, si varío EL TIPO
DE EMPAQUE, voy a tener diferentes valores de pérdida de sangre de la carne.
Además, se rechaza la hipótesis nula, teniendo en cuenta que la probabilidad (P)
es menor que la significancia usada en el análisis de varianza, en este caso 0.05
(5%).

f. Si encuentra diferencias estadísticas significativas, realice la prueba


de Tukey en Excel relacionando las operaciones.
Dado que se encontraron diferencias significativas entre los factores DÍA Y TIPO
DE EMPAQUE, se aplicó el test de Tukey para verificar donde están dichas
diferencias. Se encontró que el único dato que está haciendo varias de manera
significativa el promedio de pérdida de sangre de la carne, es el empaque
“ShoPak” en el quinto día (5) de almacenamiento.

g. Discuta ampliamente los resultados, desde la perspectiva biológica.


Los resultados indican que, para la mayoría de los tipos de empaque, la variación
en los días de almacenamiento no provoca que la pérdida de sangre presente
cambios significativos. Sin embargo, si se usa un empaque tipo ShoPak, se debe
tener cuidado con la pérdida de sangre de la carne luego del quinto día, dado que
es allí donde se presenta una variación significativa; en este caso, la pérdida de
sangre es menor que la que se venía presentando en los días anteriores.
Cabe resaltar que, en el cuarto día, con el mismo tipo de empaque, la pérdida de
sangre de la carne también varía, pero en este caso, estadísticamente no se
puede decir que la variación sea significativa, usando un nivel de significancia del
5%.
EJERCICIO-5
Se cuantifico las medias de linfocitos de células de ratones (1000(mm3) y fueron
comparadas después de usar dos medicamentos o fármacos y un placebo
(control). Camadas de ratones del mismo sexo se utilizaron para formar bloques
homogéneos de 3 ratos cada uno. Dentro de cada bloque, tres tratamientos fueron
distribuidos de forma aleatoria. ¿Parece razonable suponer que los efectos de los
tres tratamientos deben ser relativamente constante para varios genotipos de
ratones para diferentes camadas?

a. ¿Cuáles son las ventajas de usar un diseño de bloques completos al


azar? Justifique su respuesta

 Elimina una fuente de variación de error, aumentando de esta forma la


precisión del ensayo.
 Permite una gran flexibilidad, siempre y cuando exista un mismo número de
variables para cada tratamiento
 La pérdida de información por tratamiento, no dificulta el análisis
estadístico.

b. ¿Cuál es el modelo matemático? Para cada ítem en el ejercicio


planteado indique a que corresponde cada término del modelo.

Para un diseño EN BLOQUES completos al azar, el modelo matemático es el


siguiente:
Yijk=u+Ti+ Bj+ Eij

Yijk = Resultado del tratamiento


u = media general del experimento (promedio global de la producción de materia
seca)
Ti = efecto del i-ésimo tratamiento (efecto del TIPO DE SUELO)
Bj = efecto de j-ésimo tratamiento (efecto de la PARCELA)
Eijk = error experimental
c. ¿Estipule claramente las hipótesis que interesa contrastar con el
análisis de varianza de este experimento?

Hipótesis Nula (H0): No existen diferencias estadísticamente significativas entre


los promedios de linfocitos hallados con los diferentes fármacos y de los diferentes
bloques, con un 5% de significancia.

Hipótesis Alternativa (H1): Al menos uno de los factores, ya sea "bloque" o "tipo
de fármaco", influyen en el promedio de linfocitos, con un nivel de significancia de
0.05 (5%).
Se rechaza la hipótesis nula (H0) y se acepta la hipótesis alternativa (H1), dado
que, tanto para el tipo de farmaco como para el bloque, el F es mayor al Fcrítico.
Se debe aplicar la prueba de Tukey para observar en que tratamientos se
encuentran las diferencias significativas.

d. Realice el análisis de varianza en Excel, con las fórmulas, la tabla de


varianza debe recoger los valores de SC, CM, GL, F y probabilidad
realizados con fórmula debidamente evidenciable y relacionando las
operaciones. No se admitirán resultados que no sean del producto de
las fórmulas elaboradas en el archivo Excel.
Ver en Excel

e. ¿Según el análisis de varianza hay diferencias significativas? ¿Por


qué?
Si existen diferencias significativas en el caso de ambas variables, dado que, en
ambos casos, el F es mayor al F crítico.
f. Si encuentra diferencias estadísticas significativas, realice la prueba
de Tukey en Excel relacionando las operaciones.
Dado que se encontraron diferencias significativas entre los factores DÍA Y TIPO
DE EMPAQUE, se aplicó el test de Tukey para verificar donde están dichas
diferencias. Los bloques IV y VII son los únicos que no presentan una diferencia
significativa. Ver en el Excel.
EJERCICIO-6.
En un campo de maíz se seleccionan 20 parcelas. En cada una se observa la
densidad y el peso promedio de la mazorca.
a. Realizar el análisis de regresión lineal entre los dos métodos con las
herramientas para análisis de datos de Excel y con fórmulas
(relacionando operaciones) en Excel, presentar la ecuación y
coeficiente de determinación.
Ver en Excel.

b. Plantear la hipótesis respectiva.


Hipótesis nula (Ho) = “No existe ninguna relación lineal significativa entre la
variable dependiente y la variable independiente”.
Hipótesis alterna (Ha) = “Existe relación lineal significativa entre la variable
dependiente y la variable independiente”.

Se rechaza la hipótesis nula, dando que los coeficientes de correlación y


determinación son cercanos a 1, y el valor de F critico es cercano a cero.

c. ¿Para una densidad de 188, se puede estimar el peso de la mazorca?

Usando la ecuación obtenida mediante la regresión lineal, para un valor de


densidad de 188 se obtiene un peso de 181.19.

También podría gustarte