Está en la página 1de 2

Certamen Recuperativo de Minería de Datos

Profesor: Fredy Troncoso


Duración 1 hora y 20 minutos

Observación: para los cálculos se permite solo el uso de calculadora científica no programable.

1 PARTE 1

1.1 EXPLIQUE QUÉ ES EL PROCESO KDD. (5 PTS.)

1.2 EXPLIQUE QUÉ ES EL MÉTODO WRAPPER. (5 PTS.)

1.3 EXPLIQUE QUÉ ES EL ANÁLISIS DE COMPONENTES PRINCIPALES. (5 PTS.)

1.4 EN QUÉ SITUACIONES ES POSIBLE ELIMINAR UN ATRIBUTO DE LA BASE DE DATOS EN EL PROCESO DE


LIMPIEZA. (10 PTS.)

2 PARTE 2

Considere la siguiente base de datos:

Id Outlook Temperature Humidity Wind Play


1 sunny 85 85 false no
2 sunny 80 90 true no
3 overcast 83 78 yes
4 rain 70 96 false yes
5 rain 68 80 false yes
6 rain 53 70 true no
7 overcast 64 65 true yes
8 sunny 72 95 false no
9 sunny 69 70 false yes
10 rain 75 80 false yes
11 sunny 75 70 true yes
12 overcast 72 90 true yes
13 overcast 81 75 false yes
14 rain 71 80 true no
2.1 EXPLIQUE QUÉ ES EL MÉTODO DE IMPUTACIÓN HOT DECK E IMPUTE EL REGISTRO FALTANTE MEDIANTE
ESTE MÉTODO, EXPLICANDO CLARAMENTE COMO LO HIZO. (10 PTS.)

2.2 DETERMINE MEDIANTE EL MÉTODO DE LA MEDIA Y UNA DESVIACIÓN ESTÁNDAR SI EN LOS ATRIBUTOS
TEMPERATURE Y HUMIDITY EXISTEN DATOS FUERA DE RANGO. (15 PTS.)

2.3 APLIQUE TRANSFORMACIÓN LOGARÍTMICA AL ATRIBUTO HUMIDITY Y CONCLUYA RESPECTO A LOS DATOS
FUERA DE RANGO CON EL PUNTO ANTERIOR. (10 PTS.)

2.4 DETERMINE EL PODER PREDICTIVO DE LOS ATRIBUTOS OUTLOOK Y WIND MEDIANTE EL ÍNDICE DE GINI.
¿CUÁL DE ELLOS ELIMINARÍA DEL ANÁLISIS? (20 PTS.)

2.5 EXPLIQUE DOS FORMAS MEDIANTE LAS CUALES MEDIRÍA EL PODER PREDICTIVO DE LOS ATRIBUTOS
TEMPERATURE Y HUMIDITY. (10 PTS.)

2.6 TRANSFORME LA BASE DE DATOS A NUMÉRICA. (5 PTS.)

2.7 TRANSFORME LA BASE DE DATOS A CATEGÓRICA. (5 PTS.)

También podría gustarte