Está en la página 1de 4

Desarrollar un clasificador basado en el método Bayes Ingenuo

Objetivo: Desarrollar una herramienta de software basado en el algoritmo Bayes ingenuo que
permita clasificar instancias para apoyar la toma de decisiones en diversas áreas.

Productos entregables: Software de clasificación y documentación del software.

Características del software:

 Clasificador de dos o más clases considerando variables continuas y discretas.


 Entrada:
o Dataset con x atributos y un atributo de clase
o Parámetros de configuración
o El software puede funcionar solo con el dataset, o con instancias introducidas con un
archivo externo (pudiendo ser 1 o más instancias) a través de la interfaz aunque debe
de apoyarse del dataset.
o Probabilidades de variables continuas:
 Función de densidad (distribución normal)
 Data binning: Dividir los datos en secciones definidas por (discretización):
• Intervalos de frecuencias iguales
• Intervalos de anchos iguales
 Salida:
o Métricas de evaluación
 Matriz de confusión
 Precisión
 Exhaustividad/especificidad (recall)
 Medida f1
 Accuracy
 Método de validación
 Método Simple.
 X% para entrenamiento (configurable).
 100%-X% para pruebas.

 Etapas del desarrollo


 Validación: Validación de dataset y parámetros de entrada
 Procesos de clasificación
 Métricas de evaluación
Características de la documentación:

• Portada (-0.2 puntos)


• Índice (-0.2 puntos)
• Introducción:
 ¿Qué es el aprendizaje maquina? (un párrafo) (-0.5 puntos)
 ¿Qué es un clasificador? (un párrafo) (-0.5 puntos)
 Describir que se hará en este proyecto. (un párrafo) (-0.5 puntos)
• Marco teórico (5 hojas como mínimo)
 Aprendizaje Maquina (-0.3 puntos)
 Algoritmos supervisados y no supervisados (-0.3 puntos)
 Algoritmo de clasificación Bayes Ingenuo
 Probabilidad (-0.3 puntos)
 Teorema de Bayes (-0.3 puntos)
 Bayes Ingenuo (-0.3 puntos)
• Desarrollo del software
• Análisis (-0.5 puntos)
• Diseño: Describir cada figura o tabla que se ponga.
 Arquitectura basada en MVC (-0.5 puntos)
 Casos de uso
 Diagrama de casos de uso (-0.5 puntos)
 Casos de uso detallado (-0.5 puntos)
 Diagramas de secuencia (-0.3 puntos)
 Diagrama de clases (-0.5 puntos)
 Algoritmos del sistema (pseudocódigo o diagramas de flujo) (-0.5 puntos)
 Interfaz (-0.5 puntos)
• Implementación: Describir las tecnologías que se emplearon, lenguajes de
programación, librerías, etc.
• Experimento:
 Experimento: Describir la forma en como probaremos el clasificador (elegir un
dataset y probar con el) (-0.5 puntos)
 Dataset: Describir el dataset. (-0.5 puntos)
 Resultados: Mostrar gráficas y tablas de los resultados de las métricas de
evaluación. (-0.5 puntos)
 Discusión: Describir los resultados, fueron buenos, regulares o malos, justificar el
funcionamiento del software. (-0.5 puntos)
• Conclusiones: Describir los puntos más importantes del desarrollo de este proyecto. (-1
punto)
• Referencias: Manejar formato APA con el gestor de Word, no referencias de sitios de
internet. (-1 punto)
• Anexos
 Código (-2 puntos)
 Generar documentación del código: Describir las clases, métodos, atributos, usar
una herramienta del tipo Doxygen. (-1 punto)

 Descripción de los roles del proyecto: Describir el rol de cada integrante del
equipo en el proyecto, incluir fotografía. (-1 punto)

Notas:

• Desarrollo del código empleando Programación Orientada a Objetos (-1 punto)


• Desarrollar el proyecto entre 2 equipos
• Dos puntos menos por diseño de interfaces pobres, no consola. (-2 puntos)
• Fecha de entrega: 15 de noviembre de 2019
• Calificación (es necesario entregar el programa para revisar):
 Documento 40%
 Seguir las penalizaciones marcadas en el documento
 Programa 60%
 Validación: Validación de dataset y parámetros de entrada.
 Error de validación (-0.5 punto) x error
 Procesos de clasificación
 Errores de compilación en el proceso de clasificación, no se revisa
el trabajo
 Funcionamiento incorrecto, no se revisa el trabajo
 No funciona pruebas con el mismo dataset: no se revisa el
trabajo
 No funciona archivo de prueba externo (-1 punto)
 No se respetó el método de validación (-2 punto)
 Métricas de evaluación
 Matriz de confusión (-2 puntos)
 Precisión (-0.5 puntos)
 Exhaustividad/especificidad (recall) (-0.5 puntos)
 Medida f1 (-0.5 puntos)
 Accuracy (-0.5 puntos)
• Penalizaciones por entrega después del 18
 Antes del 18 de noviembre (Calificación sobre 10)
 Del 19 al 21 de noviembre (Calificación sobre 9)
 Del 22 al 24 de noviembre (Calificación sobre 8)
 Del 25 al 27 de noviembre (Calificación sobre 7)
 Del 28 al 30 de noviembre (Calificación sobre 6)
 No revisión después del 30.
Propuesta de interfaz

También podría gustarte