Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Instrucciones:
• Resuelva cada uno de los enunciados según corresponda. El examen es de resolución
individual y cuenta con una semana para resolver la prueba.
• Todas las respuestas deben ser desarrolladas en un Script de R y solamente las
secciones que no son de R deben estar acá mostradas (hipótesis, interpretaciones
y otro texto se pueden poner en R como comentario). Cálculos en plataformas TIC
deben ser claramente incorporados en este documento (“pantallazos”). Las
expresiones matemáticas deben estar adecuadamente escritas con formato de
ecuación (En Word: insertar - ecuación). Las gráficas deben tener títulos y nombres
en los ejes según corresponda (si se entiende bien, puede usar los datos que se
generan por defecto). (Puntaje de estilo 3 pts).
• Debe adjuntar en Mediación Virtual: el archivo PDF del examen (entregar también
impreso), un Script de R desarrollado para la prueba y el set de datos usado en la
primera pregunta.
• Para todas las preguntas: Las pruebas de contraste de hipótesis deben ser
formuladas de acuerdo al método científico: Hipótesis, cálculos (software R o
herramienta TIC según corresponda), conclusión de hipótesis (referente al valor p)
e interpretación en contexto.
• El valor total es de 40 pts.
EVALUACION
EJERCICIO A
Para esta parte debe usar los datos generados en la pregunta 1 del Examen anterior,
referente al analito de escogencia y las 2 categorías asignadas. En caso de que no lo tenga,
debe generar de nuevo el archivo usando las instrucciones del examen 1.
1. Presente acá los datos totales del archivo (tabla o imagen) (1 pt).
En este ejercicio debe realizar un análisis basado en modelos lineales generales usando R.
El set de datos corresponde a la evaluación de la posibilidad de adquirir una infección intra-
hospitalaria de acuerdo con parámetros como estancia (días), edad, y parámetros
relacionados con el tamaño y capacidades del hospital: porcentaje de cultivos bacterianos
que salen positivos, número de facilidades, camas, enfermeros, y número promedio de
exámenes de rayos X.
1. Cargar los datos " Datos-riesgo-infección". Obtenga las estadísticas básica y gráficos
para la totalidad de datos con las funciones: summary, boxplot, pairs, multi.hist,
pairs.panels y corrplot.mixed.
2. Realizar un modelo de regresión lineal simple usando la “Stay” como predictor del
riesgo de infección “InfctRsk”. Muestre las estadísticas de la regresión y determine
si hay o no asociación significativa. Interprete el R2. Defina la ecuación del modelo.
3. Usando las funciones pairs.panels y plot, explore la asociación entre las variables del
modelo lineal.
4. Predecir el valor de la presión si la estancia es de la altura es 1, 10 y 18 días con el
modelo anterior.
5. Realizar un modelo de regresión lineal múltiple usando todos los predictores y el
riesgo de infección. Muestre las estadísticas de la regresión y determine si hay o no
asociación significativa por cada factor. Interprete el R2.
6. Realizar un modelo de regresión lineal múltiple usando únicamente los predictores
significativos del caso anterior y el riesgo de infección. Muestre las estadísticas de la
regresión y determine si hay o no asociación significativa por cada factor. Interprete
el R2.
7. Realizar un modelo de regresión lineal múltiple similar al anterior, pero
incorporando la interacción Estancia*rayosX. Muestre las estadísticas de la
regresión y determine si hay o no asociación significativa por cada factor. Interprete
el R2.
8. Basado en los valores R2 en un cuadro comparativo, seleccione el mejor modelo
múltiple (indique ecuación) e interprete brevemente. Usando el modelo finalmente
seleccionado, explore las posibles correlaciones entre los predictores con las
funciones pairs.panels y corrplot.mixed.
9. Usado una visualización de cuadrícula 2X2, explore los resultados del modelo
seleccionado en función de los supuestos. Concluya si los supuestos se cumplen.
10. Realice el análisis automático de los datos totales usando la herramienta TIC en línea
https://www.statskingdom.com/410multi_linear_regression.html y compare con
los resultados en R.
Interpretación:
La herramienta web nos evidencia que las categorías Stay, Culture, y Xray son significativas
en el modelo realizado, que concuerda con lo realizado anteriormente en el programa
informático R. La diferencia que se aprecia es que la herramienta en línea elige como mejor
modelo el que incluye todas las variables basándose en el R y sin considerar parsimonia.
8. Evalúe el desempeño del modelo resultante con una matriz de confusión y calcule
la exactitud ofrecida por el modelo seleccionado. Interprete los resultados
anteriores en función de los predictores y el desempeño.
9. Ejercicio a realizar sin uso de R: ¿Cuál es la ecuación que modela el Crecimiento (Y
despejado) y cuál es el valor esperado de crecimiento y categoría final (crece o no
crece) si la concentración es de 20 000? Detalle las expresiones matemáticas.
𝑦𝑦
ln( )=9.72 – 0.016 * Polifenoles
1−𝑦𝑦
𝑒𝑒 9.72−0.016∗𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
crecimiento (y)=
1−𝑒𝑒 9.72−0.016∗𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
SS
(120)2 (116)2 (126)2
3614- 3378- 3974-
4 4 4
=14 =14 =5
Grados SS Ms Fcalculado
de
Libertad
SSb (k-1) 2 12.66 6.33 1.73
SSw (n- 12-3=9 33 3.66
k)
Total 11 45.66
Interpretación:
Debido a que el Fcalculado <Fcrítico, No se rechaza la H0, por lo tanto, se
concluye que las medias de las variables estudiadas es la misma en los diferentes
grupos, en el contexto del ejemplo, los 3 analizadores hematológicos tienen el
mismo promedio de tiempo en que tardan en procesar 25 hemogramas