Está en la página 1de 4

MINERÍA DE DATOS

Profesor MIGUEL ANGEL CARRASCO


Email miguel.carrasco@uai.cl
Sigla TICS411
Sección 1
Semestre S-SEM. 2022/1
Créditos 6
Horas Presenciales 45
Horas Autonomas 135
Horas Totales 180
Unidad Académica PREGRADO SANTIAGO
Facultad de Origen Facultad de Ingeniería y Ciencias

Descripción de la Asignatura
En la actualidad, las empresas colectan y administran una gran cantidad de datos. Pero, ¿con qué fin? En
un principio, tener la mejor y más moderna infraestructura tecnológica, se veía como una forma de lograr una
ventaja estratégica, sin embargo, luego se demostró que no era muy efectivo, ya que la infraestructura tecnológica
hoy en día es un commodity que todas las empresas pueden y deben tener, por lo tanto, la infraestructura
tecnológica (por ejemplo computadores), no es algo exclusivo de una empresa, y no genera una ventaja estratégica
de negocio. El segundo paso entonces, fue la recolección de datos, ya que tener datos es tener información. Pero,
nuevamente se observa que todas las empresas colectan datos, y por lo tanto, tampoco es exclusivo y no le confiere
liderazgo en el mercado a una empresa. ��
Hoy en día, la forma de procesar los datos está logrando ventajas competitivas y estratégicas en la toma
de decisiones en cualquier organización. Esto impacta directamente tareas tales como el razonamiento bajo
incertidumbre, identificación de patrones de comportamiento, predicción de fenómenos, identificación de factores
más determinantes en un negocio, detección de tendencias, segmentación de grupos, etc.
Para abordar las tareas previas, se requiere de nuevas técnicas para analizar inteligentemente datos generados
en los negocios y convertirlos así en conocimiento valioso, actividad comúnmente conocida como “Minería de
Datos”, cuyo componente principal se basa en modelos y técnicas de análisis de datos.

Resultados de Aprendizaje
Al terminar el curso el alumno estará capacitado para: - Identificar las etapas claves de la Minería de datos -
Identificar y modelar las diferentes tareas de Minería de datos (ej, tareas predictivas, descriptivas, etc) - Analizar
y explorar datos estructurados - Aplicar técnicas y modelos de análisis automático de datos, del tipo descriptivo
y predictivo. - Evaluar y comparar diferentes técnicas y modelos.
Habilidad Resultados de Aprendizaje
1.1 Identifica las bases matemáticas, científicas o
1. Habilidad para identificar, formular y de ingeniería de un problema para establecer
resolver problemas de ingeniería complejos, requerimientos y obtener comportamientos
aplicando principios de matemáticas, específicos basados en las variables de entrada del
ingeniería y ciencias sistema y seleccionando modelos apropiados.

1.2 Aplica principios científicos y de ingeniería


para formular un modelo matemático y/o
estadístico de un sistema o proceso que satisface
con el nivel de exactitud requerida, identificando
los parámetros, variables y restricciones esenciales.

1.3 Obtiene soluciones analíticas o numéricas en


ecuaciones y/o modelos aplicando principios
matemáticos.

1.4 Analiza el modelo e interpreta sus resultados,


justificando la factibilidad de la solución obtenida.
2.1 Declara las necesidades y especificaciones en el
2. Habilidad de aplicar diseño en ingeniería
diseño de un sistema, componente o proceso,
para crear soluciones que cumplan con las
identificando restricciones o limitaciones y
necesidades especificadas, considerando
desarrollando criterios de aceptabilidad y
salud pública, seguridad, bienestar, así
evaluación.
como factores globales, culturales, sociales,
medio ambientales o económicos
2.2 Diseña un sistema, componente o proceso y
desarrolla, construye o modela una solución que
satisface las necesidades declaradas.

2.3 Analiza los resultados del diseño, considerando


falencias y enfoques alternativos para futuras
revisiones.
6.1 Recolecta datos desde variables apropiadas,
6. Habilidad para desarrollar y conducir
técnicas y herramientas que permitan obtener
experimentos apropiados, analizar e
resultados para una tarea específica.
interpretar datos, y obtener conclusiones
basadas en juicios ingenieriles
6.2 Diseña una metodología para llevar a cabo un
experimento, considerando los protocolos
necesarios para la obtención y medición de las
variables.

6.3 Utiliza herramientas estadísticas apropiadas


para analizar y validar datos, comparando los
resultados experimentales contra los teóricos e
interpretando las diferencias.

6.4 Utiliza efectivamente software de diseño,


simulación y/o análisis.
7.1 Utiliza información relevante para apoyar la
7. Habilidad de adquirir y aplicar nuevo
resolución de un problema de ingeniería,
conocimiento según la necesidad, usando
utilizando recursos técnicos y teóricos adecuados.
estrategias apropiadas de aprendizaje
Objetivos de Desarrollo Sustentable
Las metas de desarrollo sustentable de las Naciones Unidas son una hoja de ruta para formar y alcanzar un
mundo sostenible para todos los habitantes de este planeta, seres humanos incluidos. Consideran los desafíos
globales que enfrentamos, incluyendo los problemas ambientales, energéticos, sociales, sanitarios y de paz. La
FIC está comprometida con formar ingenieros que trabajen por el bien de la sociedad y el medioambiente.
En este curso se entregarán herramientas para cumplir con las siguientes metas:

Objetivos Nivel
TRABAJO decente y crecimiento Competencias
económico

INDUSTRIA, innovación, Competencias


infraestructura

Unidades de la Asignatura
1. Introducción a la Minería de datos
1.1. Conceptos en análisis de datos
1.2. El proceso de Minería de Datos
1.3. Tipos de problemas: descriptivos, predictivos o reconocimiento de patrones.
2. Modelamiento descriptivo
2.1. Introducción a los modelos descriptivos (aprendizaje no supervisado)
2.2. Clustering particional, basado en densidad, jerárquico y difuso (K-means, DB-SCAN, aglomerativo, C-
means)
2.3. Evaluación de clusters
3. Modelamiento predictivo
3.1. Introducción a los modelos predictivos (aprendizaje supervisado)
3.2. Clasificadores probabilisticos, algoritmos: Naive Bayes y Regresión Logística
3.3. Clasificacores discriminativos, algoritmos: K-Nearest neighboors, árboles de decisión, SVM
3.4. Evaluación de modelos predictivos: validación cruzada, Curvas ROC.
3.5. Técnicas de ensamblados.

Estrategias de enseñanza y aprendizaje


El desarrollo del curso se llevará a cabo mediante las siguientes actividades: - Clases expositivas: realizadas
por el profesor donde se revisarán los aspectos conceptuales, técnicas y modelos, y aspectos prácticos usando
ejemplos en Python o R. - Trabajos en clases: ejercicios semanales con diferentes técnicas computacionales
usando ejemplos en Python o R. - Proyecto semestral: realización de un proyecto semestral práctico (grupal)
que resuelva algún problema de minería de datos utilizando diversas herramientas computacionales.
Procedimiento de Evaluación
El curso considera un proyecto grupal y tareas. Este proyecto resolverá algún problema de minería de datos
utilizando diversas herramientas computacionales, y se divide en tareas parciales durante el semestre.

Reglamento
La UAI está preocupada de mantener un ambiente de trabajo y aprendizaje inclusivos, y por lo tanto no se
permitirá ninguna forma de discriminación. Cualquier tipo de discriminación por sexo, estado civil, embarazo,
raza, apariencia física, capacidad diferente, orientación sexual, identidad de género, edad, nacionalidad, religión
u otra característica legalmente protegida, está estrictamente prohibida.

Bibliografía
• Introduction to Data Mining. Tan, Steinbach, and Kumar (2005).
• Data Science for Business. Provost and Fawcett. (2013)
• Data Mining the textbook. Charu Aggarwal. (2015)
• Pattern Recognition and Machine Learning. Christopher Bishop. (2006)

Cronograma
El cronograma es esperado y puede sufrir modificaciones. - Semana 1: Introducción a la Minería de datos
- Semana 2: Modelamiento descriptivo => Introducción y clustering particional - Semana 3: Modelamiento
descriptivo => clustering basado en densidad - Semana 4: Modelamiento descriptivo => clustering jerárquico
- Semana 5: Modelamiento descriptivo => clustering difuso - Semana 6: Modelamiento descriptivo => Eval-
uación de clusters - Semana 7: Modelamiento predictivo => Introducción y clasificador discriminativo KNN -
Semana 8: Preguntas y respuestas sobre la primera entrega del informe - Semana 9: Modelamiento predictivo
=> Evaluación de modelos - Semana 10: Modelamiento predictivo => Clasificadores probabilisticos, Naive
Bayes - Semana 11: Modelamiento predictivo => Clasificadores probabilisticos, regresión logística - Semana 12:
Modelamiento predictivo => Clasificadores discriminativos, árboles de decisión - Semana 13: Modelamiento
predictivo => Clasificadores discriminativos, Support Vector Machine - Semana 14: Modelamiento predictivo
=> Clasificadores discriminativos, Redes Neuronales - Semana 15: Modelamiento predictivo => Técnicas de
ensamblados - Semana 16: Preguntas y respuestas sobre la segunda entrega del informe

También podría gustarte