Está en la página 1de 4

UNIVERSIDAD MODULAR ABIERTA

FACULTAD DE CIENCIAS ECONOMICAS


INTELIGENCIA DE NEGOCIOS II
CICLO 02-2018
ING. JOAN M. MEJIA
CONTROL DE LECTURA

TECNICAS DE MODELADO ETL


INDICACION.

Luego de leer el artículo: “Revisión sistemática y comparación de modelado de procesos


ETL en almacenes de datos”, proceda a resolver los siguientes numerales.

1. ¿Por qué son importantes los procesos ETL según el artículo leído?
Extraen datos de las fuentes de datos, hace cumplir estándares de calidad de datos,
para que los datos puedan ser utilizados por los desarrolladores en las aplicaciones
y los usuarios finales puedan tomar decisiones estratégicas. Es decir, los datos son
extraídos de los sistemas fuentes, los cuales pasan por una secuencia de
transformaciones antes de que se carguen en el AD.s
Los procesos ETL representan el 80% de los recursos de desarrollo de un proyecto
de AD. En este sentido, los procesos ETL son un componente clave de los ADs,
porque los datos incorrectos producirán decisiones incorrectas, por esto un
esquema correcto en la fase de diseño del AD es absolutamente necesario.

2. ¿Cuáles son las 6 tareas que integran un proceso ETL? Cree un esquema de
representación de dichas tareas.
definir los
datos de las
seleccionar los fuentes
(generalmente
datos para la provienen de
extracción diversas
fuentes
heterogéneas)

transformar unir las


las fuentes fuentes

seleccionar el
destino para la
carga unir los cargar los
atributos de las datos en el
fuentes de datos AD
con los atributos
del destino

3. ¿Cuántos y cuáles son los estudios primarios identificados y analizados en el


artículo?
Son 6 estudios primarios que se detallan a continuación:
A. Procedimiento de la revisión sistemática
B. Formulación de la pregunta
C. Selección de las fuentes
D. Selección de los estudios
E. Ejecución de la selección
F. Recogida y extracción de datos
4. Revisando la tabla V y la tabla VI del artículo, integre usted una tabla comparativa
de los estudios primarios y concluya sobre cuáles de las propuestas incluyen más
características, más actividades y cuales son entonces más completas, indique las 3
primeras propuestas y justifique su priorización.
Tabla V

Tabla VI

Tabla V Tabla VI

En la Tabla V se observa una comparación con De esta tabla podemos observar, que las
base a las características que presentan los propuestas de 13, 14, realizan una mayor
estudios primarios. A partir de ella se observa, especificación de actividades. Además, de
que la especificación de las actividades para tener una gran cantidad de actividades en
procesos ETL está presente en todos los común. La propuesta 16 es la que realiza la
estudios primarios. Sólo dos enfoques 13, 15, especificación más pobre de actividades. Por
utilizan estándares de desarrollo para sus otro lado, sólo las actividades de aggregation y
propuestas, específicamente UML. filter son tomadas en cuenta en todas las
propuestas de modelado.
A pesar de que las Ontologías permiten la
formulación de un exhaustivo y riguroso
esquema conceptual, y posibilitan una mejor
comunicación, reutilización e inferencia
computacional, sólo una de las propuestas 14
utiliza este marco de modelado.

Asignación: Individual

Fecha de entrega: 13 de septiembre

Modalidad de entrega: Espacio de tarea en plataforma Classroom

También podría gustarte