Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Fecha: 19/05/2022
Nombre: Código:
Profesor: Camilo Barrios Pérez Grupo: 001
Dentro de las variables registradas en cada uno de los muestreos, se tienen las siguientes:
1.1. Evaluar y describir el perfil de las variables en la base de datos. Posteriormente, identificar
aquellas variables que presentan mayores anómalos, si los hay.
1.3. Realizar un análisis gráfico y estadístico para evaluar el nivel de correlación entre todas las
variables.
1.4. Identificar los posibles valores atípicos que se presentan en cada una de las variables de
estudio, y posteriormente omitirlos de la base de datos.
1.5. Realizar distintos tipos de gráficos (por ejemplo, de barras o de dispersión) que ayuden a
entender la relación entre las diferentes variables biofísicas y el número total de frutos
producidos en cada árbol.
2. Modelo de regresión
Con base en los análisis realizados en el punto anterior, seleccionar las variables que pueden servir
como potenciales predictores del número total de frutos. Posteriormente, construir y evaluar
(gráfica y estadísticamente) el desempeño un modelo de Random Forest que permita predecir
número total de aguacates producidos en un determinado árbol.
Identificar las variables que mayor importancia tienen dentro del modelo RF establecido.
Posteriormente, utilizar las gráficas de dependencia parcial para definir la relación funcional entre
las variables predictoras más importantes y la variable de respuesta del modelo (es decir, el
número total de frutos).
Nota:
1. Analizar y justificar todas las respuestas obtenidas en cada uno de los puntos planteados.
2. Entregar, vía email, i) un documento donde se presente el desarrollo de los diferentes
puntos del parcial; ii) todos los scripts programados.
3. Fecha de entrega: lunes, 23 de mayo del 2022; hasta las 6:00 pm.