Está en la página 1de 3

Del archivo “Datos_Parcial_2.

csv”, seleccione un subconjunto de datos que contenga el


75% de los datos y úselo para ajustar los modelos. El otro 25% lo deben usar para la
validación. Para seleccionar los datos deben utilizar como semilla [set.seed()] el número de
cédula

1. Genere una tabla que contenga todos los estadísticos necesarios (incluyendo factor de
corrección cuando aplique) para decidir cuál de los siguientes modelos es el mejor.
Explique brevemente su(s) criterio(s) para escoger el mejor modelo. (60%):
b1
a) H=b0 DAP
a DAP
b) H=
( b+ DAP )
H=a ( 1−e−b DAP )
c

c)
El mejor modelo fue el modelo 3 porque tuvo menor MSE suma de cuadrado de los errores

2. Use el archivo de datos de validación para definir el sesgo e incertidumbre del mejor
modelo. ¿Qué significa lo que obtiene? (20%)

El sesgo y la incertidumbre son similares y lo que indican es que en promedio las


estimaciones se alejan entre 2 y 3 unidades (metros) de lo observado o real
3. Realice el grafico de dispersión del DAP vs la altura, incluya la línea de tendencia del
modelo seleccionado como el mejor, y el grafico de los valores de altura observados vs
los estimados por el mejor modelo, incluya la línea de tendencia de intercepto 0 y
pendiente 1. Haga las dos figuras en una sola ventana gráfica y elabore su respectiva
leyenda. Explique, interprete y concluya con base en los resultados de estas gráficas
(20%).

Deben entregar los resultados obtenidos en un archivo de formato Word y todos los análisis
realizados en R (script). Si el script no corre, se para en algún punto, o no genera la misma
información que presentan en el documento de Word, el examen no es válido.
Marque cada archivo con su nombre y/o apellidos. Los archivos con todos los análisis y
resultados deben ser enviados antes de las 12:00 m. Examen que entre al correo después de
la hora indicada tendrá una nota de 0 sin excepción.
Cualquier evidencia de copia da anulación directa de los dos exámenes.

También podría gustarte