Está en la página 1de 2

PREGRADO EN INGENIERÍA AGRONÓMICA

Diseño y Modelación de Cultivos (IA0301)


Tercer Examen Parcial (20%)

Fecha: 19/05/2022

Nombre: Código:
Profesor: Camilo Barrios Pérez Grupo: 001

Haciendo uso de la base de datos “Datos_Numero de aguacates_Sotara_Cauca”, se pide


desarrollar un modelo de Random Forest que estime el número total de frutos que tiene un árbol
de aguacate a partir de variables biofísicas monitoreadas en una finca ubicada en el municipio de
Sotará, en el departamento del Cauca. Los muestreos de las variables biofísicas y número de frutos
se realizaron para un total de 394 árboles de aguacate (Fig. 1), en cuatro diferentes días de
muestreo.

Dentro de las variables registradas en cada uno de los muestreos, se tienen las siguientes:

• id_arbol: identificación de cada uno de los árboles.


• Ubicación (latitud, longitud y elevación) de los árboles muestreados.
• Fecha de muestreo.
• Temperatura de bulbo húmedo.
• Presión barométrica.
• Humedad relativa.
• Temperatura.
• Velocidad del viento.
• Índice de estrés térmico.
• Temperatura de punto de rocío.
• Viento frío.
• Número de frutos afectados por Heilipus lauri Boheman (barrenador de la semilla del
aguacate).
• Número de frutos afectados por Stenoma catenifer (polilla del fruto del aguacate).
• Número de frutos afectados por factores desconocidos.
• Número total de frutos producidos.

1. Limpieza de la base de datos y análisis exploratorio

1.1. Evaluar y describir el perfil de las variables en la base de datos. Posteriormente, identificar
aquellas variables que presentan mayores anómalos, si los hay.

1.2. Realizar la descripción estadística de las diferentes variables en la base de datos.

1.3. Realizar un análisis gráfico y estadístico para evaluar el nivel de correlación entre todas las
variables.

1.4. Identificar los posibles valores atípicos que se presentan en cada una de las variables de
estudio, y posteriormente omitirlos de la base de datos.

1.5. Realizar distintos tipos de gráficos (por ejemplo, de barras o de dispersión) que ayuden a
entender la relación entre las diferentes variables biofísicas y el número total de frutos
producidos en cada árbol.

2. Modelo de regresión

Con base en los análisis realizados en el punto anterior, seleccionar las variables que pueden servir
como potenciales predictores del número total de frutos. Posteriormente, construir y evaluar
(gráfica y estadísticamente) el desempeño un modelo de Random Forest que permita predecir
número total de aguacates producidos en un determinado árbol.

3. Importancia de las variables

Identificar las variables que mayor importancia tienen dentro del modelo RF establecido.
Posteriormente, utilizar las gráficas de dependencia parcial para definir la relación funcional entre
las variables predictoras más importantes y la variable de respuesta del modelo (es decir, el
número total de frutos).

Nota:

1. Analizar y justificar todas las respuestas obtenidas en cada uno de los puntos planteados.
2. Entregar, vía email, i) un documento donde se presente el desarrollo de los diferentes
puntos del parcial; ii) todos los scripts programados.
3. Fecha de entrega: lunes, 23 de mayo del 2022; hasta las 6:00 pm.

También podría gustarte