Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Identifique tres casos de éxito reales de áreas de aplicación y los problemas que
se han resuelto con Minería de Datos. Indique empresa, problema a resolver,
software, modelo o algoritmo, problema, resultados obtenidos, etc. (10 puntos).
Problema planteado: Cómo modificar el portal de compra online que usan los
talleres asociados para aumentar las ventas por este canal.
C) Goldcar
Solución: Por medio del análisis de los datos de las reservan se identifican
perfiles concretos que terminan en casos de reservas canceladas o clientes no
presentados, en función de la la procedencia, la temporada, antelación y otros
factores clave.
2. Explique 5 técnicas de minería de datos y en qué casos prácticos se puede aplicar
cada una de ellas (10 puntos).
A) Perceptron
Es un modelo concebido como un sistema capaz de realizar tareas de
clasificación de forma automática, a partir de un conjunto de ejemplo con
clases diferentes.
B) Perceptrón multicapa
Es una red neuronal artificial (RNA) formada por múltiples capas, de tal
manera que tiene capacidad para resolver problemas que no son
linealmente separables, lo cual es la principal limitación del perceptrón
(también llamado perceptrón simple). El perceptrón multicapa puede estar
totalmente o localmente conectado. En el primer caso cada salida de una
neurona de la capa "i" es entrada de todas las neuronas de la capa "i+1",
mientras que en el segundo cada neurona de la capa "i" es entrada de una
serie de neuronas (región) de la capa "i+1".
C) Mapa autoorganizado
B) Regresión lineal
Es la más utilizada para formar relaciones entre datos. Rápida y eficaz pero
insuficiente en espacios multidimensionales donde puedan relacionarse más
de 2 variables.
C) Árboles de decisión
A) Algoritmo ID3
B) Algoritmo C4.5
D) Modelos estadísticos
E) Agrupamiento o Clustering
A) Algoritmo K-means
K-means (medias) es un método de agrupamiento, que tiene como objetivo
la partición de un conjunto de n observaciones en k grupos en el que cada
observación pertenece al grupo cuyo valor medio es más cercano. Es un
método utilizado en minería de datos.
B) Algoritmo K-medoids
etapas en el proceso:
A) Selección de datos:
Consiste en buscar el objetivo y las herramientas del proceso de minería,
identificando los datos que han ser extraídos, buscando los atributos
apropiados de entrada y la información de salida para representar la tarea.
Esto quiere decir, primero se debe tener en cuenta lo que se saber lo que se
quiere obtener y cuáles son los datos que nos facilitarán esa información para
poder llegar a nuestra meta, antes de comenzar el proceso en tal.
B) Limpieza de datos.
En este paso se limpian los datos sucios, incluyendo los datos incompletos
(donde hay atributos o valores de atributos perdidos), el ruido (valores
incorrectos o inesperados) y datos inconsistentes (conteniendo valores y
atributos con nombres diferentes). Los datos sucios en algunos casos deben
ser eliminados ya que pueden contribuir a un análisis inexacto y resultados
incorrectos.
C) Integración de datos
D) Transformación de datos
E) Reducción de datos.
F) Minería de Datos.
H) Interpretación de resultados
Consiste en entender los resultados del análisis y sus implicaciones y puede llevar
a regresar a algunos de los pasos anteriores.
d) Entregue un informe del procedimiento que se siguió explicando cada paso (5 ptos) y el
código fuente del proyecto generado (5 ptos).