Está en la página 1de 2

Proyecto Clasificació n 20%

LEER BIEN LAS INSTRUCCIONES


1) Seleccionar una base de datos de clasificació n bi-clase, en el informe debe incluir una descripció n clara del
problema que se está abordando y de las características utilizadas. Nota: Descripció n clara, no extensa.
EJEMPLO: ¿Qué se está clasificando? ¿Qué características se está n empleando? ¿Cuá ntas muestras hay?
¿Cuá l es la utilidad? (y no es cuestió n de responder estas preguntas como un cuestionario sino armar un
texto estructurado donde los pá rrafos se unifiquen) ... Usar una base de datos balanceada (se debe reportar
el porcentaje de balanceo e investigar qué resultados han logrado otros investigadores usando la base de
datos seleccionada por cada grupo de trabajo). Esta debe ser importada a Python de forma externa es decir
cargando un archivo .txt, .xlsx, csv o de otros formatos.

Los siguientes son links donde pueden descargar bases de datos caracterizadas:
 https://www.kaggle.com/datasets
 https://archive.ics.uci.edu/ml/datasets.php
 https://www.dataquest.io/blog/free-datasets-for-projects/ (este link los remite a otros repositorios)
 https://sci2s.ugr.es/keel/datasets.php
 https://www.mldata.io/

2) Clasificar la base de datos utilizando un perceptró n simple, agregar en el informe, una descripció n de la
metodología empleada para determinar los pará metros del gradiente descendente.

3) Construir una funció n para calcular la matriz de confusió n sin usar librerías como sklearn.

4) Reportar el desempeñ o del clasificador en términos de la Exactitud, Precisió n, Sensibilidad, Especificidad y


F1-Score (investigar y explicar este para que sirve). (Construir la funció n para calcular las medidas de
desempeñ o no usar librerías como sklearn)

5) Incluir en el reporte una comparació n al usar la base de datos normalizada y sin normalizar, en términos
de las medidas de desempeñ o y tiempos de ejecució n (buscar la forma de medir el tiempo que tarda el
entrenamiento).

6) Crear una funció n o editar la funció n entregada por el docente que permita graficar el error (eje Y) vs las
iteraciones (eje X) y asi presentar la grafica que evidencie la disminució n del error a medida que va
iterando el gradiente descendente.

7) Selecció n visual de características: los grupos deben reportar también el desempeñ o realizando mínimo 3
combinaciones de un par de características es decir evaluar el desempeñ o usando solo las características 4
y 9 o las características 2 y 5, ademá s graficar la frontera de decisió n. Evaluar también el tiempo de
có mputo usando dos características contra el uso de todas las características.

El có digo debe estar en capacidad de preguntar con qué grupo de características se va a trabajar, ejemplo:
si se escribe todas es porque se va a utilizar todas las características, o si se escribe 7 y luego el 12 es
porque se van a utilizar solo la característica 7 y 12, adicional preguntar si se desea trabajar con la base de
datos normalizada y sin normalizar.
Nota, evaluar desempeñ os variando el alfa, la cantidad de iteraciones, diseñ ar unas buenas graficas con
título, colores, nombre de los ejes.

8) Reportar si el modelo esta sobre entrenado o no (Evaluar desempeñ o en el conjunto de entrenamiento y en


el de validació n y analizar).
9) Analizar la estabilidad del modelo, realizar entre 10 y 15 repeticiones y calcular desempeñ o y asi evaluar si
el resultado cambia en cada repetició n o por el contrario siempre entrega un desempeñ o similar la mayor
parte de las veces.

La entrega del laboratorio debe realizarse el 5 de mayo hasta el mediodía COMO RESPUESTA AL CORREO
ENVIADO POR EL DOCENTE (EL NO CUMPLIMIENTO DE ESTA CONDICION EQUIVALE A QUE EL TRABAJO SEA
EVALUADO SOBRE 3.5).

Otra pautas de entrega:

 El correo debe contener un archivo comprimido solo en .zip, cuyo nombre debe ser el primer nombre y
apellido de cada integrante, separado por un guion bajo (e.g EstebanZapata_BejaranoRamira.zip)  

 El archivo comprimido debe contener una carpeta con el mismo nombre del archivo, dentro de esta
carpeta debe estar el informe y una carpeta llamada có digo.

 El formato del informe podrá ser presentado a una sola columna, pero utilizando las reglas IEEE, como por
ejemplo el tipo de letra, la forma de nombrar y enumerar todas la tablas y figuras, los formatos de los
títulos y subtítulos, la forma de enumerar las ecuaciones como entre otros. , siguiendo las normas de
referencias usar mendeley, El informe del archivo debe estar en PDF y debe llamarse “Informe.pdf”

 La carpeta có digo debe contener la base de datos utilizada y todos los archivos .py necesarios para que la
ejecució n del có digo sea exitosa.

 Entregas posteriores a la fecha y hora recibirían una penalizació n de -1 por cada hora de retraso.

 Informes donde sean detectadas prá cticas de copiar y pegar de internet será n anulados.

 Conclusiones del tipo “Esta prá ctica nos permitió comprender el perceptró n simple”, no son vá lidas, las
conclusiones se redactan a partir de los resultados obtenidos.

Tener en cuenta que trabajos que no cumplan con el formato de entrega no será n evaluados, al igual que el plagio
en el informe y/o có digo es causal de anulació n del trabajo.

SE TENDRÁ EN CUENTA LA CAPACIDAD DE SEGUIR INSTRUCCIONES.

También podría gustarte