Programa Analítico

Facultad de Ingeniería
Escuela de Ingeniería Industrial

Maestría en Ingeniería, énfasis en Ingeniería Industrial
MINERÍA DE DATOS
Código:
Pre-requisito: Ninguno
Intensidad horaria: 9 Horas semanales / 36 Horas de contacto
Horario de Clases: Viernes, 5:30 a 9:30 p.m., sábados 7:30 – 12:30
Créditos:
Validable:
Habilitable: No
Profesor: Carlos Hernán Fajardo Toro., Ph.D.
1. INTRODUCCIÓN
Para 2015, se calculaba que el 90% de los datos producidos por la humanidad se habían
generado en los dos años anteriores, indicando además que para 2025 aumentara
aproximadamente 10 veces.
Por otro parte, las características de los mercados son mucho más variables, en especial
porque los ciclos de vida de los productos son más cortos, y esto posiblemente debido a
la mayor participación de los consumidores en su opinión y concepción de los productos,
lo que contribuye a una mayor variedad de productos así como una tendencia hacia una
personalización en masa, mass customization, lo que obliga a tener que generar un
volumen de información cada vez más detallado y que absorba lo mejor posible la
variabilidad y que explique el comportamiento y gusto de los consumidores así como
procesos más ajustados para cumplir con estos requerimientos.
Lo anterior implica caracterizaciones de consumidores, pronósticos ajustados y procesos
con una alta flexibilidad que permitan adaptarse rápidamente a los entornos cambiantes
del mercado y, por tanto, permitan a las organizaciones ser competitivas implicado no solo
tecnificación de los procesos sino un aumento de las tecnologías de información que
soporten a los sistemas de información sobre los que se apoyan los procesos para poder
ser más eficiente y eficaces.
Debido a lo anterior, surge el Data Science o Ciencia de Datos como alternativa para el
manejo de este volumen de dados, ya sean estructurados y desestructurados, y donde los
que se busca es, a través de las distintas técnicas de minería de datos y demás
herramientas tanto estadísticas como de Inteligencia Artificial, lograr la reducción de los
niveles de incertidumbre, así como una definición, dentro de lo posible, de las
características del entorno.
2. OBJETIVO
El objetivo del curso es que los asistentes comprendan y vean la utilidad de la ciencia de
datos, los conceptos bajo los que se rige y las herramientas y métodos para llevar a cabo
la modelación necesaria.
3. CONTENIDOS
Noviembre 2 y 3
Repaso de conceptos estadísticos (9 Horas)
1. Exposición programa
2. Concepto de minería de Datos
3. Concepto de KDD – Knowledge Dyscovery in Database y su proceso
4. Concepto y pasos de construcción de un proyecto de Minería y Machine learning
5. Repaso de conceptos estadísticos:
a. Estadística descriptiva como paso inicial: tablas y gráficas, medidas de
tendencia central, medidas de dispersión, medidas de posición (percentiles,
decíles, cuartiles, aplicaciones), medidas de forma (distribuciones de
frecuencia más comunes).
b. Estadística inferencial: Nivel de riesgo, pruebas de hipótesis, modelos
lineales y regresión lineal, correlación, tipos de errores, test Chi-cuadrado,
análisis de regresión, estadística no paramétrica.
c. Conceptos de estadística multivariada – se expondrá mejor en los módulos
posteriores
Para esto se usaría software estadístico, preferiblemente y también la herramienta básica
de Excel.
Noviembre 9, 10 y 16 (13 horas)
El problema de pronosticar. Métodos de pronósticos
1. Métodos estadísticos para series de tiempo. Introducción. Uso en software.
2. Métodos de algoritmos de IA.
a. Redes neuronales
i. Concepto de aprendizaje supervisado y no supervisado
ii. Tipos de redes neuronales
iii. Manejo de las redes
3. Validación y manejo del error
Herramientas: R
Noviembre 17, 23 y 24 (13 horas)
Métodos de clasificación y series de tiempo
4. Métodos estadísticos multivariados para clasificación: Análisis de componentes
principales, Análisis de factorial, Análisis de conglomerados, Análisis
discriminante.
5. Algoritmos de clasificación en IA
a. Arboles de Decisión
b. Algoritmos Clustering
c. Self Organizing Maps
d. Support Vector Machines
6. Algoritmos de asociación
7. Visualización
Herramientas: R
4. METODOLOGIA
El curso se desarrollará aplicando los principios del Aprendizaje Activo. De esta forma, el
instructor asignará con anticipación los materiales de estudio y los ejercicios a desarrollar
antes de llegar a clase. Los estudiantes deben estudiar los materiales y resolver los
ejercicios antes de la sesión de clase. En la clase se resolverán dudas y se plantearán
nuevos ejercicios. En la clase además se desarrollarán actividades prácticas, individuales
y en grupo, que reforzarán el aprendizaje y ayudarán a construir las habilidades que cada
estudiante debe mejorar.
5. EVALUACION
 La evaluación se hará sobre pruebas cortas, ejercicios y talleres prácticos a ser

entregados por los alumnos.
 Las pruebas cortas se harán al principio de las clases y será sobre artículos y
lecturas asignadas. (50%)
 Talleres y ejercicios para entregar al final del curso o durante el mismo (30%)
 Trabajo de proyecto final sobre un proyecto KDD (20%)
6. REGLAS DE JUEGO
En clase el instructor explicará las políticas sobre:
 Asistencia
 Puntualidad
 Uso de celulares
 Evaluaciones
 Tutorías
7. BIBLIOGRAFIA
Dunkel, B., Soparkar, N., Szaro, J., & Uthurusamy, R. (1997). Systems for KDD : From
concepts to practice, 13.
Kros, J. F., Lin, M., & Brown, M. L. (2006). Effects of the neural network s-Sigmoid function
on KDD in the presence of imprecise data, 33, 3136–3149.
https://doi.org/10.1016/j.cor.2005.01.024
Lara, J. A., Lizcano, D., Aurora, M., & Pazos, J. (2014). Data preparation for KDD through
automatic reasoning based on description logic. Information Systems, 44, 54–72.
https://doi.org/10.1016/j.is.2014.03.002
Lti, H., Kolski, C., & Ben, M. (2015). Combination of cognitive and HCI modeling for the
design of KDD-based DSS used in dynamic situations, 78, 51–64.
https://doi.org/10.1016/j.dss.2015.07.003
Micheline Kamber;Jiawei Han. (2007). Data Mining: Concepts and Techniques.
Development. Morgan Kaufmann Publishers - Elsevier.
Oatley, G., Macintyre, J., Ewart, B., & Mugambi, E. (2002). SMART software for decision
makers KDD experience, 15, 323–333.
ROBERT NISBET;JOHN ELDER; GARY MINER. (2008). HANDBOOK OF STATISTICAL
ANALYSIS AND DATA MINING APPLICATIONS. Academic Press - Elsevier.
Ye, N. (2003). THE HANDBOOK OF DATA MINING (Vol. 34). London: LAWRENCE
ERLBAUM ASSOCIATES, PUBLISHERS.

Programa Analítico

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Programa Analítico

Cargado por

Copyright:

Formatos disponibles

Facultad de Ingeniería

Escuela de Ingeniería Industrial

 La evaluación se hará sobre pruebas cortas, ejercicios y talleres prácticos a ser

En clase el instructor explicará las políticas sobre:

También podría gustarte