Está en la página 1de 6

CAPAS DEL DATAWAREHOUSE

Ronald Smith Delgado Garcia

Juan David Pardo Salazar

Escuela de Ingeniería, CUN

30112: Business Intelligence

Ing. Helmer Muñoz

Septiembre de 2021
2

Tabla de contenido
1. INTRODUCCIÓN .......................................................................................................................... 3
2. CAPA DE FUENTE DE DATOS ....................................................................................................... 3
3. CAPA DE EXTRACCIÓN DE DATOS .............................................................................................. 3
4. ÁREA DE PRUEBAS ...................................................................................................................... 4
5. ETL ............................................................................................................................................... 4
6. ALMACENAMIENTO DE DATOS .................................................................................................. 4
7. LÓGICA DE DATOS ...................................................................................................................... 5
8. PRESENTACIÓN DE DATOS ......................................................................................................... 5
9. CAPA DE METADATOS ................................................................................................................ 5
10. CAPA DE OPERACIONES DEL SISTEMA ................................................................................... 5
BIBLIOGRAFIA ..................................................................................................................................... 6
3

1. INTRODUCCIÓN

Los abruptos cambios en los mercados generan una basta información que requiere de una
sistematización que usada de forma correcta pueda generar datos de valor para que las diferentes
empresas que compiten en el mercado tengan una adaptabilidad alta, el datawarehouse es la
tecnología que permite el manejo de la información y donde su principal objetivo es analizar y
optimizar la información proveniente de las diferentes fuentes de datos y a su vez esta
información convertirla en datos que tengan una alta relevancia para la toma de decisiones que
pueden significar un alto impacto en la organización.

Para dar claridad conceptual de datawarehouse daremos a conocer las diferentes capas que
contiene esta categoría.

2. CAPA DE FUENTE DE DATOS

Se refiere a todas aquellas fuentes de la empresa de donde provienen los datos a ingresar en el
DWH.

Ejemplo: CRM el cual nos permite tener acceso a la siguiente información:

• Personalizar información sobre tus clientes.


• Entender la experiencia del cliente y hábitos de compra.
• Obtener datos de tu flujo comercial.
• Integrar información de ventas, servicio al cliente y Marketing.

3. CAPA DE EXTRACCIÓN DE DATOS

En la etapa de extracción, cumplen la función de extraer los datos desde distintas fuentes. Es decir,
obtienen la “materia prima” que será procesada en las siguientes fases. Aparte de extraer, estas
herramientas también se encargan de aplicar un proceso de homogenización a los datos. De modo
que estos sean más fáciles de procesar en la siguiente etapa.

Ejemplo: Uno de los ejemplos más claros es la extracción de datos de las Redes Sociales las cuales
nos permiten obtener diferente información referente a sus usuarios, información tal como:

• Gustos
• Menciones
• Impresiones
• Uso de hashtags
• Clics en URL
• Análisis de palabras clave
• Nuevos seguidores
• Comentarios
4

4. ÁREA DE PRUEBAS

Aquí es donde los datos son depurados y transformados en un Datamart y datawarehouse. Tener
un área común facilita el proceso y la integración posterior de los datos.

Ejemplo: Un Datamart Dependiente el cual puede ser Talend Data Management Platform se crea a
partir de un almacén de datos empresariales existente. Es el enfoque de arriba abajo que empieza
almacenando todos los datos comerciales en una única ubicación y luego se extrae una porción
claramente definida de los datos cuando se necesita analizarlos, Pueden ser una visión lógica o un
subconjunto físico del almacén de datos:

• Visión lógica: una tabla/vista virtual separada lógicamente, aunque no físicamente del
almacén de datos.
• Subconjunto físico: extracción de datos que constituye una base de datos separada
físicamente del almacén de datos.

5. ETL

Aquí es donde los datos obtienen su inteligencia ya que se aplica la lógica para transformar los
datos de una naturaleza transaccional a una naturaleza analítica. En esta capa es también donde
se limpian los datos. La fase de diseño ETL es frecuentemente la fase que más se demora en un
proyecto de datawarehouse y habitualmente se utiliza una herramienta ETL en esta capa.

Ejemplo: informática PowerCenter Su función es convertir a los datos puros y brutos en


información útil y legible para los analistas y tomadores de decisiones. Tiene la capacidad de
captar enormes cantidades de datos desde distintas fuentes, adaptándose así a los requerimientos
de cada negocio.

Las principales características de informática PowerCenter son:

• Ofrece datos en tiempo real de manera precisa, permitiendo así los análisis oportunos y
sin pérdida de tiempo.
• Dispone de visualizaciones de datos de última generación. Sus gráficas completas y
amigables facilitan la gestión y la gobernanza de los metadatos.
• Provee de autoservicio en las áreas de negocio. Así, los tomadores de decisiones pueden
acceder a información fiable y certera.
• Permite la automatización de las transformaciones de datos. Esto mediante
transformaciones pre integradas, cómodas e intuitivas.
• Efectúa monitorización preventiva de manera constante mediante la configuración de
alertas.

6. ALMACENAMIENTO DE DATOS

Una vez depurados y transformados los datos, estos son almacenados en el data warehouse
propiamente dicho.

Ejemplo: Bases de datos relacionales típicas son las bases de datos centradas en filas que quizás
utilice a diario, por ejemplo, Microsoft SQL Server, SAP, Oracle e IBM DB2.
5

7. LÓGICA DE DATOS

En esta capa se almacenan las reglas de negocio que, aunque no tengan una afectación en la
transformación de los datos si van a afectar los informes, puesto que las reglas de negocio son
aquellas que de manera explícita o implícita cumplen con un comportamiento directamente
relacionado con la organización.

Es importante tener en cuenta que las reglas de negocio se derivan directamente del
comportamiento de la organización como ente social y económico, por lo que la información
presentada debe estar en concordancia con estas reglas para que la información pueda ser
aprovechada de la forma correcta.

8. PRESENTACIÓN DE DATOS

Esta capa se refiere a la información que llega a los usuarios, se puede referir a la forma final de la
presentación de información como pueden ser correos, reportes web, tablas, entre otros.

En esta capa se dan a conocer diferentes herramientas de generación de informes como pueden
ser Power BI, Google Data Studio, Agency Analytics, Vizia, entre otros, además, es usual utilizar
herramientas OLAP (On-Line Analytical Process) las cuales se encargan de analizar datos para
entregar información estratégica para la toma de decisiones.

9. CAPA DE METADATOS

En esta capa la información sobre los datos almacenados en el datawarehouse es almacenada, en


necesario recordar que los metadatos es la información que describe un elemento, estos
metadatos brindan principalmente información de estructura, localización y significado entre
otros , usualmente en esta capa se hace uso de herramientas de gestión o administración de
metadatos como pueden ser: Oracle Enterprise Metadata Management, Collibra, InfoSphere
Information Server, entre otras.

10. CAPA DE OPERACIONES DEL SISTEMA

Esta capa es la que muestra información acerca del funcionamiento general del sistema de
datawarehouse, el estado del ETL, rendimiento del sistema, historial de acceso de los usuarios.

Esta capa es importante para tener un punto de partida en cuanto aparezca un error en el sistema
como puede ser intentos de autenticación o conexión al sistema no autorizados, saturación en
bases de datos, errores en replicación o migración de datos, mala sincronización entre sistemas,
entre otras.
6

BIBLIOGRAFIA
A., S. (2007). An Overview of Data Warehouse, OLAP and Data Mining Technology. En Data
Warehousing and Data Mining Techniques for Cyber Security Vol 31. Boston.

Castilla, M., Lora, J., Vega, R., & Portilla, W. (2019). Análisis comparativo de herramientas para la
gestión de metadatos. Revista I+D en TIC Volumen 10 Número (1), 7-13.

Fatima, N. (23 de Mayo de 2019). Astera Software. Obtenido de Astera :


https://www.astera.com/es/type/blog/data-warehouse-architecture/

Mendez, A., Mártire, A., Britos, P., & Garcia-Martínez, R. (2003). Fundamentos de Data Warehouse
. En Reportes Técnicos en Ingeniería del Software. Vol. 5(1). (págs. 19-26). Buenos Aires .

Sierra, Y. (s.f.). MediaCloud. Obtenido de mdcloud: https://blog.mdcloud.es/dwh-ejemplos-


arquitectura-data-warehouse/

También podría gustarte