Está en la página 1de 3

Rúbrica Corte 2

Minería de datos Alejandro Gonzalez Rubio y Andres Lopez

1. Conjunto de datos:
a) Este dataset representa una encuesta realizada a personas de 11 a 75 años de
edad. En esta se le preguntó a los encuestados si estos o sus allegados han tenido
COVID-19 y también todo tipo de preguntas acerca de los efectos del COVID en su
estado emocional.

b) En este dataset los atributos responden preguntas como la información básica del
encuestado, cuál es su estado de ánimo y preguntas relacionadas al COVID-19.

1. Edad numeric 11-75 Numeric


2. Genero {M, F} Nominal
3. DiscapacidadMental {0, 1} Nominal
4. TuvoCOVID-19 {0, 1} Nominal
5. ConviveCovid {0, 1} Nominal
6. PerdidaCovid {0, 1} Nominal
7. PerdidaEmpleo {0, 1} Nominal
8. Tristeza {0, 1, 2, 3} Nominal
9. Pesimismo {0, 1, 2, 3} Nominal
10. Insatisfaccion {0, 1, 2, 3} Nominal
11. SensacionFracaso {0, 1, 2, 3}
12. Culpa {0, 1, 2, 3} Nominal
13. Austodesprecio {0, 1, 2, 3} Nominal
14. Autoacusacion {0, 1, 2, 3} Nominal

c) Descripción de las características de los atributos:


En este dataset nos damos cuenta de que la mayoría de los atributos son de tipo nominal,
exceptuando el atributo de la edad. Esto nos permite trabajar de manera más organizada,
sobre todo al momento de analizar los datos sobre las personas encuestadas, así teniendo
una mejor lectura de los resultados de esta encuesta.

Descripción número de instancias:


El dataset cuenta con un total de 914 instancias que representan el mismo número de
personas encuestadas.
d) Algoritmo árbol de decisión J48:

Algoritmo de Redes Bayesianas:


Comparativo algoritmo Redes Bayesianas VS J48:

Metrica de Evaluación (%)

TP Rate FP Rate EXACTITUD ERROR


CCI ICI (WA) (WA) (MATRIZ) (MATRIZ)

J48 65,31% 34,69% 65,30% 36,50% 65,32% 34,68%

BAY 67,39% 32,61% 67,40% 30,10% 67,40% 32,60%

También podría gustarte