Está en la página 1de 6

07/11/2023

Examen Parcial II
Estadística (SP-6380), II Ciclo 2023
Duración Total del Examen 3 horas

Nombre Completo: José Israel Lopez Rodríguez


Resuelva de manera individual según lo visto en clases y las siguientes indicaciones.
El procedimiento realizado para obtener los resultados debe aparecer en el examen
cuando lo amerite.
I Parte. Conceptos teóricos. Complete los espacios según corresponda. (20 pts)

1) Existen dos tipos de pruebas t de Student, la prueba t para muestras


_____________ y la prueba t para muestras _________________, esta última se
subdivide en dos pruebas que utilizan diferentes estadísticos en función a la
igualdad o desigualdad de _______________. (2 pts)

2) La prueba t de Student se utiliza para comparar medias entre _____ grupos (elija
un número). (1 pto)

3) La prueba t de Student para muestras _____________ no necesita estar


balanceada, mientras que la prueba t para muestras _____________ si debe estar
balanceada. (2 pts)

4) Un valor de p mayor a 0.05 para un ANOVA indica a la persona investigadora


que:
________________________________________________________________
___________________________________________________________ (2 pts)

5) El ANOVA se utiliza para comparar medias entre ______ o más grupos (elija un
número). (1 pto)

6) Es menos probable encontrar diferencias significativas entre grupos cuando se


utiliza un _____________ (elija entre ANOVA o ANCOVA) ya que se
incrementa el error del modelo. (1 pto)

7) Un ANCOVA incluye una _____________, que es una variable generalmente


continua que se asocia a la variable respuesta y que usualmente no es de interés
para el experimento. (1 pto)
8) El grupo de pruebas que sirven para conocer cuantas y cuales medias difieren
entre si en un ANOVA que ha dado un valor p menor a 0.05 se llaman
__________________________________________________ y un ejemplo de
una prueba de este tipo que es recomendada es la prueba
______________________ (2 pts).

9) Una forma de realizar una regresión logística mediante un GLM es utilizar la


función de enlace _____________ para indicar el tipo de distribución de la
variable respuesta. (1 pto)

10) Basándose en la siguiente tabla de valores:

Indique, para los cinco modelos, el orden de peor a mejor modelo lineal
generalizado (GLM): _____,_____,_____,_____,_____ (1 pto).

11) En una base de datos se quiere analizar la correlación entre dos variables
continuas, al realizar la prueba de normalidad de Shapiro-Wilk para ambas
variables se obtienen los siguientes P-value: 0.04 y 0.03, Con base en la
información anterior, su recomendación del análisis de correlación a realizar
sería: coeficiente de correlación de _______________(Elija entre Pearson o
Spearman) (1 pto)

12) En un análisis se quiere correlacionar la variable Y con dos diferentes variables


X (X1 y X2), se corre una prueba de normalidad (Shapiro-Wilks) y se obtienen
los siguientes resultados.
a) Indique cual o cuales variables se distribuyen normalmente (1 pto)
____________________________________________________________

b) ¿Cuál método de análisis de correlación debe realizar entre Y y X1? Y ¿Cuál


método de análisis de correlación debe realizar entre Y y X2 (2 pts)
Y y X1: ______________________, Y y X2: ______________________

13) Si el supuesto de normalidad no se cumple y se quiere realizar una prueba para


comparar dos medias de muestras independientes se puede utilizar la prueba
denominada _______________________________________________. (1 pto)

14) Cuando los supuestos de pruebas paramétricas no se cumplen y se quiere


comparar entre medias de 3 o más tratamientos, la prueba que recomendaría
sería _________________________________________________________. (1
pto)
II Parte. Interpretación y sección práctica. Complete según corresponda. (30 pts)
1) Se quiere determinar si un periodo de tiempo de 7 días para un estadío
específico es un periodo suficiente para encontrar diferencias entre los
promedios de altura (cm) de un tipo de planta ornamental o si ya se ha
llegado a una altura que no cambia en ese periodo de tiempo. Para ello se
miden las mismas 50 plantas a los 60 y 67 días después de la siembra, los
datos se encuentran el la base de datos denominada “Datos_Parcial_II.xlsx”
en la pestaña denominada “Ornamentales”

a) Determine e indique la prueba más conveniente a utilizar en función al


problema y los datos facilitados
__________________________________________________________
_____________________________________________________(5 pts).

b) Indique ¿Cuál es la hipótesis nula asociada a esta prueba?


__________________________________________________________
_______________________________________________(1 pto).

c) ¿Qué valor p obtuvo para la prueba? ____________________(1 pto).

d) ¿Cuál es la conclusión apropiada en términos biológicos del problema?


__________________________________________________________
__________________________________________________________
__________________________________________________________
____________________________________________________ (3 pts)

2) Observe los resultados del siguiente ANCOVA y ANOVA para evaluar la


ganancia de peso diaria de animales en función a un tratamiento (Trat) y en
el caso de ANCOVA también considerando la inclusión del peso al
nacimiento (Peso_inicial).
a) En función a los resultados ¿Cuál de los dos análisis (ANOVA o
ANCOVA) considera más conveniente en este ejemplo? ¿Por qué? (2
pts)
__________________________________________________________
__________________________________________________________
__________________________________________________________

b) ¿A qué se debe que el valor p asociado al tratamiento cambia de este


ANCOVA a este ANOVA? (2 pts)
__________________________________________________________
__________________________________________________________
__________________________________________________________
__________________________________________________________

c) Haciendo uso de la información que se le brinda en la tabla de resultados


¿Cuántos tratamientos se utilizaron en este experimento?, conociendo
esta información ¿Es conveniente realizar un ANOVA? ¿Es conveniente
realizar un ANCOVA? (3 pts)

_____________________________________________________________

3) Indique mediante la nomenclatura correcta como se escribe un modelo lineal


general (GLM) para describir la inclusión de 2 factores (Finca = F y Época =
E) y 2 variables continuas (Precipitación = P y Temperatura = T) para
explicar una variable respuesta específica denominada: “y”. Indique que
significa cada término del modelo (7 pts) (Puede escribirlo en papel y pegar
una imagen o escribirlo directamente en el documento).

4) Se quiere determinar si unos tratamientos tienen efecto sobre la abundancia


relativa de microorganismos metanogénicos en el tracto gastrointestinal de
animales rumiantes, para el experimento solamente se cuenta con 18
animales a las que se les puede extraer el contenido del rumen, de esos 18
animales 6 consumieron el tratamiento A, otros 6 consumieron el tratamiento
B y los últimos 6 consumieron el alimento control (asuma valores basales
iniciales estadísticamente iguales antes del tratamiento para todos los
animales). Los datos se encuentran en la base de datos denominada
“Datos_Parcial_II.xlsx” en la pestaña denominada: “Metano”.
a) ¿Cuál es el análisis apropiado que debe realizar para saber si existen
diferencias o no entre medias de abundancia relativa de los
microorganismos metanogénicos? (2 pts)
b) ¿Cuál es el valor p obtenido para la prueba seleccionada? (1 pto)
c) Concluya en términos del problema y los resultados estadísticos
obtenidos (3 pts)

Pregunta Opcional (solo suma puntos si ha perdido en otras secciones, en otras


palabras la nota máxima del examen parcial II es un 100)

(Solo será válida si se contesta en el periodo de tiempo indicado para el examen)


1) En ganadería de leche es relevante la concentración de calcio en la sangre de las
vacas en el periparto. Se quiere saber si para un grupo de animales existe
asociación entre el número de parto y el nivel de calcio sanguíneo de los
mismos. Obtenga el coeficiente de correlación de Spearman entre el número de
parto y la concentración sanguínea de calcio (mg/dl) a partir de los datos y la
fórmula que se le facilita, muestre sus cálculos (3 pts).

Vaca Parto Calcio


N° (mg/dl)
1 1 9.1
2 2 8.4
3 3 7.2
4 4 7.9
5 13 9.5

También podría gustarte