Está en la página 1de 30

Almacenes y Minería de

Datos
Curso 2019/2020

Presentación de la
Asignatura

Presentación de la asignatura
Profesorado

– Sergio Ilarri (silarri@unizar.es)


• Despacho D.0.09
– Jorge Bernad (jbernad@unizar.es)
• Despacho D.0.07
Horarios
• Horarios de clase (aula A.11):
– Jueves de 12 a 14. Aula A.11.
– Viernes de 13 a 14. Aula A.11.

• Horarios de prácticas (L0.04):


– Jueves de 8 a 11 (ver calendario posterior).

http://intraneteina.unizar.es/intraneteina/index.php?r=gestionHoras/view_ex
t&id=187
Horarios
• Horarios de tutoría:
– Consultar la versión actualizada (así como posibles incidencias
puntuales) en:
• http://intraneteina.unizar.es/intraneteina/index.php?r=tutorias
• Sergio Ilarri:
– Posibles incidencias: http://webdiis.unizar.es/~silarri/TEACHING/incidencias-
tutorias.html
• Jorge Bernad
– En ocasiones, aconsejable contactar previamente (email, etc.)
• Especialmente en caso de cambios de días (L por V, etc.)
Calendario de Prácticas
• Grupo único (L0.04):
– P1: 24/10/2019 (Jb, 8-11).
– P2: 7/11/2019 (Jb, 8-11)
– P3: 21/11/2019 (Jb, 8-11)
– P4: 5/12/2019 (Jb, 8-11)
– P5: 9/1/2020 (Jb, 8-11)
CALENDARIO A GOLPE DE VISTA
Tecnologías Específicas
Tecnologías Específicas
Asignaturas Más Relacionadas
• “Bases de Datos”, “Bases de Datos 2”:
– Complementariedad: OLTP vs. OLAP
• “Sistemas de Información”:
– Las empresas que manejan grandes cantidades de datos
suelen tener almacenes de datos
• “Sistemas de Ayuda a la Toma de Decisiones”:
– AMD  almacenamiento de datos y extracción de
información a partir de ellos
– SATD  diseño y explotación de sistemas que emplean la
información extraída para la consecución de los objetivos
empresariales
Visión Global (I)
• Analizar y diseñar almacenes de datos (bases de
datos) orientadas al análisis (On Line Analytical
Process –OLAP–)
• Aplicar técnicas básicas de aprendizaje automático
para realizar minería de datos y proporcionar
información útil para la toma de decisiones
• Posibles herramientas:
– Oracle
– Pentaho
– R, Weka, RapidMiner
Visión Global (II)
Reconciliación de diferentes fuentes de datos para el análisis
de la información de la empresa
“De moda”: Business Intelligence, Business Analytics, Big Data

La Web
Tabla de
dimensión
Tabla de Tabla de
dimensión dimensión
Tabla de
hechos
Tabla de
dimensión Tabla de
dimensión
Tabla de
dimensión

Minería de datos
Lo Más Interesante
Lo más interesante de la asignatura:
 Diseñar almacenes de datos
 Analizar casos de estudio (ventas, inventarios, pedidos,
clientes)
 Aplicar técnicas de minería de datos
 Conocer herramientas profesionales
 Posibles charlas invitadas
Programa (I)
• Introducción a los almacenes de datos
• Conceptos básicos
• Análisis de requerimientos de usuario
• Ciclo de vida
• El problema de la reconciliación de fuentes de datos
• Transacciones OLTP vs. OLAP
• Arquitectura de almacenes de datos
• Diseño conceptual, lógico y físico
• Procedimientos ETL
• Sistemas comerciales
Programa (II)
• Introducción a la minería de datos
Prácticas
• Diseñar e implementar un data mart
• Desarrollar mecanismos para
integrar datos
• Ejecutar consultas SQL analíticas
• Elaborar informes
• Analizar los datos
• Estudiar campos de aplicaciones de
la minería de datos
Resultados de Aprendizaje
• Describir los aspectos básicos de los almacenes de datos y
explicar los procesos necesarios para su diseño.
• Diseñar un almacén de datos de forma efectiva.
• Conocer los aspectos básicos de los almacenes de datos y
buscar información adicional sobre otros temas relacionados
avanzados.
• Comparar diversos diseños de almacenes de datos y elegir un
sistema comercial adecuado para su implantación.
• Conocer las técnicas básicas de aprendizaje automático
aplicado a la minería de datos.
• Utilizar las técnicas básicas en problemas reales.
Conferencias de Profesionales
Externos
• Charlas de otros años:
– Charla sobre DeepSee
(InterSystems Iberia, S.L.)
– Herramientas Oracle (Sergio
Campos, HP)
• No confirmadas, fechas por
determinar
• Si hubiera, consideradas como
parte de la materia del curso
Prácticas de Laboratorio
• En grupos
• 5 sesiones de prácticas de 3 horas
• Entregas parciales
• En principio, antes de la siguiente sesión
• Para la última práctica se fijará un plazo similar
• Seguimiento/entrevistas (siguiente sesión)
– Responsabilidad individual y colectiva 
intervención de todos, trabajo individual y en equipo
Evaluación (I)
• Trabajo práctico en el laboratorio (40%)
• Realización y defensa de trabajos/proyectos
prácticos (20%):
– Trabajo sobre un tema concreto
• Por ejemplo, aplicación de la minería de datos en cierta
área
• Prueba escrita: 40%
• Si no evaluación continua  prueba escrita +
prácticas/trabajo + examen de prácticas/trabajos
(consultar guía docente)
Evaluación (II)

40% 40%
Laboratorio
Trabajos
20% Examen

• Es necesario aprobar cada parte (mínimo 5


sobre 10) por separado
Evaluación (III)
• Entregables  incluir:
– Soluciones propuestas
– Justificación
– Valoración de alternativas
– Problemas, limitaciones, y dificultades encontradas
– Indagaciones propias y consulta de otra
documentación
– Opiniones personales y conclusiones
– Bibliografía adecuada
• Autonomía, curiosidad, indagación y análisis personal
Otros Aspectos
• Posible utilización de máquinas virtuales en las
prácticas
• Posible utilización de artículos en algunas clases
Algunas Direcciones Web Básicas
• Página de la asignatura en Moodle: https://moodle2.unizar.es/
– Transparencias
– Guiones de prácticas
– Enlaces
– …
• Guía docente de la asignatura:
https://sia.unizar.es/documentos/doa/guiadocente/2019/30253_es.pdf
• Página de Sergio Ilarri: http://webdiis.unizar.es/~silarri/
Sobre las Transparencias
• Son un apoyo
• Paulatinamente disponibles en el sitio web
después de ver ciertos temas/partes
– No necesariamente antes de la clase
correspondiente
– No necesariamente todas las proyectadas
• Tomad notas y consultad otras fuentes
recomendadas
Bibliografía: Ejemplos
• Transparencias, bibliografía comentada, enunciados de problemas, casos de estudio y guiones de
prácticas que los profesores de la asignatura pondrán a disposición del alumnado mediante la
plataforma Moodle 2 del Anillo Digital Docente (http://add.unizar.es).

• “The Data Warehouse Lifecycle Toolkit” (Second Edition), Ralph Kimball, John Wiley & Sons, 2008.
• “Multidimensional Databases and Data Warehousing”, Christian S. Jensen, Torben Bach Pedersen,
Christian Thomsen, Morgan & Claypool Publishers, 2010.
• “The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling”, Ralph Kimball, Margy
Ross, John Wiley & Sons, 2011.
• “Advanced Data Warehouse Design: From Conventional to Spatial and Temporal Applications”, Elzbieta
Malinowski, Esteban Zimányi, Springer, 2008.

• ”Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshiran, 7th Ed“An Introducction to
Statistical Learning”, Springer. Disponible en http://www-bcf.usc.edu/~gareth/ISL/
• “Data Mining: Practical Machine Learning Tools and Techniques”, Ian H. Whitten, [et. Al.], MK, 2011.
• “Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data”, Bing Liu, Springer, 2011.
• “Introduction to Data Mining and its Applications”, S. Sumathi, S. N. Sivanandam, Studies in
Computational Intelligence, volume 29, Springer, 2006.

Revisiones ACM Computing Reviews


Preguntas y Sugerencias
Fin

También podría gustarte