Está en la página 1de 2

Computación Docente: Ing.

Remigio Hurtado, PhD

INTELIGENCIA ARTIFICIAL

FORMATO DE GUÍA DE PRÁCTICA DE LABORATORIO / TALLERES / CENTROS DE


SIMULACIÓN – PARA DOCENTES

CARRERA: COMPUTACIÓN ASIGNATURA: INTELIGENCIA ARTIFICIAL


TÍTULO PRÁCTICA: Examen Interciclo – Preprocesamiento, Aprendizaje y Predicción con
NRO. PRÁCTICA: 3
técnicas de inteligencia artificial (IA)
OBJETIVO:
Reforzar los conocimientos adquiridos sobre técnicas de preprocesamiento de datos y sobre técnicas de predicción con IA

INSTRUCCIONES:
1. Revisar el contenido teórico del tema
2. Profundizar los conocimientos revisando los libros guías, los enlaces contenidos en el material de aprendizaje y la
documentación disponible en fuentes académicas en línea
3. Revisar las prácticas previamente realizadas en la materia
4. Descargar del AVAC el dataset original “master_dataset.csv”. Este dataset ha sido tomado de
https://www.covid19survivalcalculator.com/download
4.1 Luego de un filtrado y limpieza, el dataset tiene: cantidad de variables=43, cantidad de instancias=1023426 pacientes. La
variable de salida es risk_mortality (indica el riesgo de mortalidad). Ejecutar y revisar el proceso de “Fase 1 Carga Dataset
y Preprocesamiento.ipynb” para cargar este dataset.
4.2 Realizar estadística descriptiva
4.3 Realizar preprocesamiento: transformaciones
4.4 Realizar un análisis exploratorio del dataset transformado:
a. Calcular las correlaciones
b. Realizar un mapa de calor de las correlaciones
c. ¿Cuáles son las 3 variables que están más correlacionadas positivamente con la variable risk_mortality?
d. ¿Cuáles son las 3 variables que están más correlacionadas negativamente con la variable risk_mortality?
e. Extraer estas variables, de tal manera, que el nuevo dataset tendrá estas 6 variables más la variable de salida risk_mortality.
Total 7 variables. Guardar este dataset en un .csv llamado “DatasetPreprocesamientoyExtraccion.csv”
4.5 A partir del dataset de 7 variables continuar con la fase de aprendizaje. Entrenar un modelo KNN con los valores de K
[1,5,10,25,50,100,200]. a. Crear la figura RMSE vs Cantidad de vecinos, b. indicar el mejor K y su RMSE
4.6 Realizar la predicción con un nuevo sample con KNN y su mejor K
4.7 Presentar las conclusiones con los resultados más relevantes

Subir al AVAC los cuadernos de Jupyter en formato ipynb y html, Subir los archicos .csv o al menos las primeras 50 filas de
cada csv. Revisar que las figuras se visualicen correctamente, y que el archivo se abra (copiar en otra ubicación de la
máquina e intentar abrir).

Rúbrica:
Actividad Puntaje Valor obtenido Observaciones
4.1 Carga de dataset 1
4.2 Medidas descriptivas 1
4.3 Preprocesamiento. Transformaciones 2
4.4.a Correlaciones 1
4.4.b Mapa de calor 1
4.4.c Variables correlacionadas positivamente 1.5
4.4.d Variables correlacionadas negativamente 1.5

Resolución CS N° 076-04-2016-04-20
4.4.e Extracción de variables y generación del 2
dataset
“DatasetPreprocesamientoyExtraccion”
4.5.a KNN figura RMSE vs K 3
4.5.b Mejor K y su RMSE 2
4.6 Predicción con un nuevo sample 2
4.7 Conclusiones con resultados 2
Total 20
RESULTADO(S) OBTENIDO(S):
Realiza análisis exploratorio
Identifica las técnicas de preprocesamiento de datos
Aplica técnicas de inteligencia artificial para problemas de clasificación y regresión

CONCLUSIONES:
Los estudiantes obtienen conocimiento de los datos a través de momentos, preprocesamiento de datos y técnicas de
inteligencia artificial

RECOMENDACIONES:
 Revisar la información proporcionada por el docente previo a la práctica.
 Haber asistido a las sesiones de clase.
 Consultar con el docente las dudas que puedan surgir al momento de realizar la práctica.

Docente: Ing. Remigio Hurtado

Firma: ______________________________

También podría gustarte