Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Universidad de Cuenca
Departamento de Ciencias de la Computación
victor.saquicela@ucuenca.edu.ec
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 1 / 43
Contenido
1 Integración de Datos
Motivación
Tipos de Integración
Evolución
Porque es Dura la Integración
Resumen
2 Fundamentos Teóricos
Formalización
Mapping
3 Recomendaciones
4 Lecturas
5 Referencias
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 2 / 43
Definición del Problema
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 3 / 43
Justificación
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 4 / 43
Base de Datos: Tenemos todo el control
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 5 / 43
Integración de Datos: Abstracción a muy alto nivel
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 6 / 43
Ejemplo de Aplicación
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 7 / 43
Ejemplo de Aplicación
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 8 / 43
Ejemplo de Aplicación
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 9 / 43
Tipos de Integración
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 10 / 43
Que es integración de datos: evolución
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 11 / 43
Que es integración de datos: evolución
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 12 / 43
Que es integración de datos: evolución
Sistemas Centralizados con arquitectura de 4 capas y multiples
almacenamientos distribuidos.
Integración centralizada: el esquema global es mapeado a diferentes
fuentes de datos heterogéneas, distribuidas y autónomas
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 13 / 43
Que es integración de datos: enfoques de integración
Sistemas decentralizados
Integración Peer-to-peer: integración de datos distribuidos sin un
esquema global centralizado
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 14 / 43
Variantes de la Integración de Datos
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 15 / 43
Integración de Datos Centralizada
Provee una vista unificada y transparente de una colección de datos
almacenados en multiples, autónomos y heterogéneas fuentes de
datos.
La vista unificada se logra a través de un global schema, enlazando
las fuentes de datos por medio de mapeos.
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 16 / 43
Data warehousing
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 17 / 43
Warehousing Vs. Virtual
Warehousing
Tipicamente más eficiente
No necesita manipular las fuentes en tiempo de ejecución
El procesamiento de consultas es tradicional
Virtual
Datos Up-to-date
Facilidad de configuración (esto es incremental)
Aplicable en contextos más amplios
En la práctica soluciones hı́bridas.
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 18 / 43
Integración de Datos Peer-to-peer
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 19 / 43
Integración de Información
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 20 / 43
Porque es Dura la Integración
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 21 / 43
Problemas de la Integración de Datos
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 22 / 43
Problemas de la Integración de Datos
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 23 / 43
Integración de Datos: Antes
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 24 / 43
Integración de Datos: Después
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 25 / 43
Sintaxis y Semántica en los Sistemas de Integración de
Datos
Definición
Un sistema de integración de datos I es una tripleta < G , S, M >, donde
G es un esquema global
S es el esquema de la fuente
M es el mapping entre S y G
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 26 / 43
Sintaxis y Semántica en los Sistemas de Integración de
Datos
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 27 / 43
Consultas a los Sistemas de Integración de Datos
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 28 / 43
Tipos de Mappings
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 29 / 43
Ejemplo: GAV vs. LAV
Esquema global
movie(Title, Year , Director )
european(Director )
review (Title, Critique)
Fuente 1
r 1(Title, Year , Director ) since 1960, european directors
Fuente 2
r 2(Title, Critique) since 1990
Consulta: Title y Critique de pelı́culas en 1998
{(t, r )}|movie(t, 1998, d), review (t, r )
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 30 / 43
GAV
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 31 / 43
GAV - Ejemplo
Esquema global
movie(Title, Year , Director )
european(Director )
review (Title, Critique)
GAV: para cada relación en el esquema global, M asocia una vista sobre
las fuentes:
∀t, y , d r 1(t, y , d) → movie(t, y , d)
∀t, y , d r 1(t, y , d) → european(d)
∀t, r r 2(t, r ) → review (t, r )
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 32 / 43
GAV - Ejemplo de procesamiento de una consulta
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 33 / 43
LAV
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 34 / 43
LAV - Ejemplo
Esquema global
movie(Title, Year , Director )
european(Director )
review (Title, Critique)
LAV: para cada relación en la fuente, M asocia una vista sobre el esquema
global:
r 1(t, y , d) → {(t, y , d)|movie(t, y , d), european(d), y ≥ 1960}
r 2(t, r ) → {(t, r )|movie(t, y , d), review (t, r ), y ≥ 1990}
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 35 / 43
LAV - Ejemplo de procesamiento de una consulta
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 36 / 43
GAV y LAV: comparación
GAV
La calidad depende de lo bién que estén compiladas las fuentes dentro
del esquema global a través de los mappings.
Si una fuente cambia o es agregada una nueva, el esquema global
necesita ser reconsiderado.
LAV
La calidad depende de lo bien que estén caracterizadas las fuentes
Alta modularidad y extensibilidad, si el esquema global esta bién
diseñado, cuando cambia una fuente, solo la esta definición es
afectada.
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 37 / 43
Integración: Datawarehouse
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 38 / 43
Integración: Adhoc
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 39 / 43
Integración: ESB + Tecnologı́as Semánticas
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 40 / 43
Lecturas
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 41 / 43
References
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 42 / 43
The End
Ing. Vı́ctor Saquicela (DCC) Visión General de la Integración December 12, 2019 43 / 43