Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Gestión Demanda-Fases Proy-P2
Gestión Demanda-Fases Proy-P2
1 Introducción
3 CALIDAD DE DATOS
4 Conclusiones
5 Referencias
1. Introducción
7 Gobierno de Información
Explotación de Información
1
Fuentes de Datos Base de Datos y Modelo de Datos IBM Cognos
Aplicaciones Analytics
Empresariales 2
Extracción
de Datos ETL Exploración de Datos
3
Fuentes Selección
Datamarts Entrega de Información a Aplicativos
4
externas Transformación
Validación
Integración App Host App C/S
Actualización
Text Mining, Social Analytics
5
V. Explotación
VII. Implementación
Gestión de la demanda de usuarios en Business Intelligence
Fases del ciclo de vida de un Proyecto BI
Source OLTP
Data
Warehouse
Ejecución
Proyecto BI
2. III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
➢ Dimensionamiento del HW
➢ Mapeo de Datos
➢ Pruebas de Extracción
2. III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
➢ Dimensionamiento de HW
o Cuanto va a crecer el DW?
o Cantidad de reportes.
III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
2. III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
➢Diseño de Estrategia de programas ETL
o De dónde y cómo se van a obtener los datos?
OLTP ETL
ETL Data Cubo
Warehouse
ETL
External
Files
2. III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
➢Mapeo de Datos
o Identificar por cada Dimensión y Fact las fuentes de los datos y sus
características a tomar en cuenta en la extracción.
o Documento de Extracción.
2. III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
Estándares de Extracción
2. III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
➢ Automatización de Procesos
◦ En base a la periodicidad de la carga, se debe indicar:
◦ Calendariazación de Jobs.
2. III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
➢ Automatización de Procesos
◦ Log de Eventos – Limpieza de Datos
◦ Todo proceso debe tener un Log de Eventos indicando la complejidad del
Evento:
◦ En el mapeo, se consideró que el Ruc no debe ser cero y en caso que lo sea, se
va a colocar el valor por defecto de “RUC ERRADO”. Por lo tanto, en caso que el
Ruc sea cero, se muestra un mensaje de advertencia.
2. III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
➢ Automatización de Procesos
◦ Ejemplo: Malla Diaria del modelo comercial:
2. III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
EXTRACCION, TRANSFORMACION Y CARGA (ETL)
➢ Automatización de Procesos
◦ Ejemplo: Malla Histórica del modelo comercial:
2. III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
EXTRACCION, TRANSFORMACION Y CARGA (ETL)
➢ Pruebas de Extracción
◦ Se deben definir políticas para realizar las pruebas de
extracción. Por lo general, se realiza lo sgte:
◦ Se diseñan las Pruebas. Se toma la prueba de uno o dos meses y se realizan
las comparaciones con respecto a los reportes obtenidos del método actual
(que puede ser manual o automático).
◦ Se necesita que estipulen las políticas de análisis de diferencias en caso que
suceda.
◦ Se necesita que se defina los actores de la comprobación de las diferencias.
◦ Se cree un cronograma de pruebas.
2. III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
Cuadrante de Gartner –
Data Integration Tools
2. III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
Gartner - Plataforma de
integración empresarial como
servicio
Gartner define
la plataforma de
integración empresarial
como servicio (EiPaaS)
como una combinación de
funcionalidades de
tecnología
de integración en la nube
y que están diseñados
para apoyar las iniciativas
de integración de
clase empresarial.
https://www.informatica.com/solutions/power-cloud-analytics.html?cext=infasocial-youtube&Source=Social-youtube
2. III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
Data
Stage -
IBM
2. III. EXTRACCION, TRANSFORMACION Y CARGA (ETL)
Informatica – Power Center
Gestión de la demanda de usuarios en Business Intelligence
V. Explotación
VII. Implementación
3. IV. Calidad de Datos
➢Cantidad. En muchos casos, las empresas captan más datos de los que
realmente requieren. No obstante, esta situación es preferible a contar con
escasez de información.
Debe ser relevante/pertinente
➢Consideran la información histórica. Los informes tienden a reflejar la
Debe ser actualizada
actualidad, sin embargo, lo más recomendable es contar con datos históricos Debe ser oportuna
para verificar la evolución de un proceso durante períodos más largos. Debe ser rápida/económica
Debe ser de calidad
➢Precisión y completitud. Los datos de calidad deben ser precisos, limpios y
Debe ser objetiva/exacta
veraces. De ello depende el acierto de las decisiones tomadas.
Debe ser comparable/verificable
➢Comprensibles. Los datos deben expresar los criterios del negocio y deben Debe ser completa
ser mostrados de forma que puedan ser comprendidos por los usuarios. Debe ser aplicable
3. IV. Calidad de Datos
6 Gestión de Calidad de Datos
El Proceso de Aseguramiento de Calidad de Datos consta de la validación de la información en cada punto en
donde la información es transformada para tu utilización. Para una validación optima es necesario que el
negocio (Owner) provea de las reglas del negocio que gobiernan al dato.
Data
Definir Reglas
Presentación y
de Negocio
Reporte
3. IV. Calidad de Datos
Principales Procesos
6 Gestión de Calidad de Datos
El Proceso de Aseguramiento de Calidad de Datos consta de la validación de la información en cada punto en
donde la información es transformada para su utilización. Para una validación optima es necesario que el
negocio (Owner) provea de las reglas del negocio que gobiernan al dato.
Usuarios
2 Unidad
Reporting
Datos de Datos de
Entrada Salida
Datamarts
Datos 2 4
1 de App Datos en DWH 5
3
AQ Leyenda
User 1 Controles y
Owner
Puntos de Validación
Consistencia
Unicidad
Integridad
Usabilidad
3. IV. Calidad de Datos
Albattah, W. y Albahli, S. (2023). Big Data Analytics: Deep Content-Based Prediction with Sampling Perspective. Computer
Systems Science and Engineering, 45(1), 531–544. https://doi.org/10.32604/csse.2023.021548