UNIVERSIDAD NACIONAL DE INGENIERIA
CENTRO DE TECNOLOGIAS DE INFORMACION
Y COMUNICACIONES
CTIC
nepid-,
urso Libre de Invierno
INICIO
24
cal Se
Profesionales que deseansaprender los conceptos dela mineria de datos y
las técnicas para el/entendimiento y préparacién’de.datos. Se hace fuerte
incidencia en implementar/os cinco tipos de modelos dé’mineria de datos
(clasificacion,
regresién agrupamiento, asociacidn y secuenciacién)
aplicado a casos practicos:
al
® Certificado al
10% pronto pago ( 15 dias antes) o grupo de 2 personas
nombre de la UNI 40% para alumnos de post-grado y docentes universitarios
® Laboratorios especializados» 45% para alumnos de pre-grado.
® Material impreso-del curso.
® Coffee break.
® Herramientas de software
(Weka, Rapid |, Sq'Server 2008)
HORARIO: (|
Fechas: 24 y 25 de setiembre y
01 y 02 de octubre.
Dias: Sabados y domingos 2
Hora: 09:00 a 13:00 horas a
Informes
e
Inscripciones
i
jVacantes limitad CTIC t WN
CENTRO DE TECNOLOGIAS DE INFORMACION Y COMUNICACIONES UNI
Teléfonos: 4811070 anexo 590 (Srta. Fiorela) E-mail: capacitacion-ctic@uni.edu.pe
Horario de Atencién: Lunes a Viernes de 09:00 a 18:00 horas
NS Waa SOM =a Mie Mate RTUNIVERSIDAD NACIONAL DE INGENIERIA
CENTRO DE TECNOLOGIAS DE INFORMACION
Y COMUNICACIONES.
TEMARIO DEL CURSO
4. CONCEPTOS BASICOS (4 horas)
Fundamentos de andlisis de datos. Conceptos y conocimientos previos. Definicion de la
Mineria de Datos. Herramientas de software disponibles. Modelo de mineria de datos.
El proceso de la mineria de datos. Metodologias para la mineria de datos. CRISP-DM.
SEMMA. El proceso de la mineria de datos (CRISP).
2. USO BASICO DE LA HERRAMIENTA (2 horas)
Gestién de repositorios. Conexién a la base de datos y carga de datos. Operaciones
y procesos. Consultas y almacenamiento de datos.
3. ENTENDIMIENTO DE LOS DATOS (4 horas)
Entendimiento de los datos. Recoleccién de datos iniciales. Descripcién de los datos.
Estadisticas univariada y multivariada. Exploracin de los datos. Verificacién de la
calidad de los datos. Limpieza de datos. Datos perdidos. Valores extremos. Datos
con ruido. Datos mal clasificados. Datos inconsistentes. Integracion de datos.
‘Transformacion de datos. Reduccién de datos.Reduccién de instancias.
4. MODELO DE CLASIFICACION - ARBOLES DE DECISION (6 horas)
Métodos de Clasificacién. Induccién. Atributos y clase. Evaluacién de modelos de
clasificaci6n. Probabilidad de la clasificacién. Clasificador Naive Bayes. Arboles de
Decision. Informacién y entropia. Generacion del arbol de decision. Poda del arbol
Regresi6n Logistica. Discretizacin y numerizaci6n.
5. MODELO DE REGRESION - REDES NEURONALES (6 horas)
Modelos de Regresién. Evaluacién de modelos de regresién. MAPE. Neuronas
naturales y attificiales. Epocas, funcién de transferencia. Aprendizaje de la red
neuronal. Preparacion de datos. Red Perceptron. Red de retropropagacién. Andlisis
de las Redes Neuronales. Sub-ajuste y sobre-ajuste. Normalizacién de datos.
6. MODELOS DE AGRUPAMIENTO — K-MEANS Y ALGORITMO EM (4 horas)
Modelos de agrupamiento. Conceptos de agrupamiento. Medidas de distancias.
Tipos de agrupamiento. Componentes Principales. Modelos de Agrupamiento,
K-means. Jerarquico. Modelos de agrupamiento y modelos de clasificacién.
7. MODELOS DE ASOCIACION — ALGORITMO A PRIOR (4 horas)
Conceptos acerca de modelos de asociacién, entendiendo conceptos como: soporte,
confianza, itemset. Buscando itemsets frecuentes. Graficando las reglas de asociacion,
Generando reglas de asociacién. Prediccién. Ventas cruzadas. Canasta de mercado.
8. MODELOS DE SECUENCIACION (CLUSTERING SECUENCIAL) - 2 horas.
Generacién de secuencias. Diagramas de secuencia. Cadena de Markov. Matriz de
transicién de estados. Agrupamiento en matriz de transicién. Descomposicién del
agrupamiento. Aplicaciones