Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CUESTIONARIO
1. Según (Witten and Frank, 2016), ¿Qué es la minería de Datos? (8.2)
Proceso de extraer conocimiento útil y comprensible, previamente desconocido,
desde grandes cantidades de datos almacenados en distintos formatos.
2. Defina 3 escenarios de cada una de las siguientes disciplinas en las que se puede
aplicar minería de datos: Medicina, Banca y Deportes (8.3)
Medicina:
• Identificación de patrones novedosos para mejorar la supervivencia de
pacientes con cáncer.
• Predicción de tasas de éxito en trasplantes de órganos a pacientes para
desarrollar políticas de donantes/receptores en el tratamiento clínico.
• Genómica. Identificación de los diferentes genes del cromosoma humano.
Banca:
• Detección de patrones de uso fraudulento de tarjetas y transacciones de banca
en línea{online).
• Automatización de los procesos de concesión de préstamos para predecir, con
la mayor precisión posible, los morosos más probables.
• Estudio de concesión de tarjetas de crédito.
Deportes:
La Minería de Datos también tiene, curiosamente, numerosas y prácticas
aplicaciones en el mundo del deporte. En casi todos los deportes se encuentran
aplicaciones de minería. Una de las más conocidas en baloncesto, donde es clásica
la aplicación de la NBA (National Basketball Association) de Estados Unidos, que
desarrolló una aplicación de Minería de Datos para PC (Advanced Scout), que
permite descubrir patrones de comportamiento de interés para el desarrollo de los
partidos de la NBA.
Otro caso muy conocido es el equipo AC de Milán que desde hace bastantes años
utiliza un sistema inteligente para prevenir lesiones. El club posee aplicaciones de
redes neuronales para prevenir lesiones y optimizar el acondicionamiento de cada
atleta, de modo que pueda ayudar a seleccionar el fichaje de un posible jugador o a
alertar al médico del equipo de una posible lesión. El sistema de Minería de Datos
fue creado por la compañía Computer.
3. ¿Cuáles son las etapas del proceso KDD? (8.4)
• Selección de datos. En esta etapa se determinan las fuentes de datos y el tipo de
información que se ha de utilizar. Es la etapa donde los datos relevantes para el
análisis son extraídos desde las fuentes de datos
• Preprocesamiento. Esta etapa consiste en la preparación y limpieza de los datos
extraídos desde las distintas fuentes de datos en una forma manejable, necesaria
para las fases posteriores. En esta etapa se utilizan diversas estrategias para
manejar datos faltantes o ausentes, en blanco, datos inconsistentes o que están
fuera de rango, obteniéndose al final una estructura de datos adecuada para su
posterior transformación.
• Transformación. Consiste en el tratamiento preliminar de los datos,
transformación y generación de nuevas variables a partir de las ya existentes, con
una estructura de datos apropiada. Aquí se realizan operaciones de agregación o
normalización, consolidando los datos de una forma necesaria para la fase
siguiente.
• Minería de Datos. Es la fase de modelado propiamente dicho, en donde métodos
inteligentes son aplicados con el objetivo de extraer patrones previamente
desconocidos, válidos, nuevos, potencialmente útiles y comprensibles, y que están
contenidos u “ocultos" en los datos. Interpretación y Evaluación. Se identifican los
patrones obtenidos, que son realmente interesantes, basándose en algunas medidas,
y se realiza una evaluación de los resultados obtenidos.
4. ¿Cuáles son las etapas del proceso KDD en Base de Datos? (8.4)
El proceso de extracción/descubrimiento del conocimiento en bases de datos Fayyad
consta de las siguientes fases
• Selección de datos (Integración y recopilación)
• Preprocesamiento de datos (Preprocesamiento)
• Limpieza de datos
• Integración de datos
• Transformación y reducción de datos. Selección de la técnica de MD
• Interpretación/Evaluación de los patrones (Difusión y utilización del nuevo
conocimiento)
5. ¿Cuál es la diferencia entre KDD y Minería de datos? (8.4)
La Minería de Datos es una etapa particular del proceso KDD, donde la Minería de
Datos aplica algoritmos o técnicas específicos para la extracción de patrones de los
datos (Fayyad et al, 1996), La Minería de Datos es la etapa más importante del
KDD, que integra los procesos de aprendizaje y métodos estadísticos para la
obtención de hipótesis de patrones y modelos. De modo informal se asocia Minería
de Datos con KDD.