Está en la página 1de 6

UNIVERSIDAD TECNOLÓGICA ISRAEL

FORMATO DE ACTIVIDADES DE SEGUIMIENTO


BASES DE DATOS III
1

Estudiante(s):

María de Lourdes Vallejos


Andrea Reyes
Alexis Rosero
Daniel Quintana
Diego Pillajo

Fecha de entrega: 01/11/2019


Tema: Introducción a Data Warehouse
Paralelo: C

TAREA

 Resumen

DATA WAREHOUSE

El Data Warehouse es una tecnología para el manejo de la información construido sobre la


base de optimizar el uso y análisis de la misma utilizado por las organizaciones para
adaptarse a los vertiginosos cambios en los mercados. Su función esencial es ser la base de
un sistema de información gerencial, es decir, debe cumplir el rol de integrador de información
proveniente de fuentes funcionalmente distintas (Bases Corporativas, Bases propias, de
Sistemas Externos, etc.) y brindar una visión integrada de dicha información, especialmente
enfocada hacia la toma de decisiones por parte del personal jerárquico de la organización.

Ejemplo de una arquitectura del data warehouse con la explicación de sus componentes

Docente: Ing. Henry Recalde MSc.


UNIVERSIDAD TECNOLÓGICA ISRAEL
FORMATO DE ACTIVIDADES DE SEGUIMIENTO
BASES DE DATOS III
2

o OLTP (On-Line Transaction Processing)

Son aplicaciones que definen el comportamiento habitual de un entorno operacional de


gestión y ejecutan las operaciones del día a día. Algunas de las características más
comunes de este tipo de transacciones podrían ser: Transacciones rápidas, Gran nivel
de concurrencia, Modo de actualización on-line

o Consolidación

Es la parte del proceso de Data Warehouse que se encarga de producir el cambio de los
sistemas OLTP a las Bases de Datos OLAP.

o OLAP (On-Line Analytical Process)

Son aplicaciones que se encargan de analizar datos del negocio para generar
información táctica y estratégica que sirve de soporte para la toma de decisiones.

o Middleware

Es un software que reside físicamente en un Cliente y en un Servidor de


Comunicaciones, localizado.

La arquitectura de un data warehouse puede ser dividida en tres estructuras simplificadas:


básica, básica con un área de ensayo y básica con área de ensayo y data marts.

o Con una estructura básica, sistemas operativos y archivos planos proporcionan


datos en bruto que se almacenan junto con metadatos. Los usuarios finales pueden
acceder a ellos para su análisis, generación de informes y minería.

o Al añadir un área de ensayo que se puede colocar entre las fuentes de datos y el
almacén, ésta proporciona un lugar donde los datos se pueden limpiar antes de
entrar en el almacén. Es posible personalizar la arquitectura del almacén para
diferentes grupos dentro de la organización.

o Se puede hacer agregando data marts, que son sistemas diseñados para una línea
de negocio en particular. Se pueden tener data marts separados para ventas,
inventario y compras, por ejemplo, y los usuarios finales pueden acceder a datos de
uno o de todos los data marts del departamento

Docente: Ing. Henry Recalde MSc.


UNIVERSIDAD TECNOLÓGICA ISRAEL
FORMATO DE ACTIVIDADES DE SEGUIMIENTO
BASES DE DATOS III
3
 Desarrollo

 DATA MART Y OTRAS ARQUITECTURAS

o Data Mart: es un subconjunto de los datos guardados en un Data Warehouse,


destinado a satisfacer las necesidades de un segmento de negocio en particular.
Esta área de clasificación de datos enfoca la información, logrando un ajuste
máximo al propósito de los usuarios de la unidad de negocio. Su principal beneficio
es su aportación a la hora de evitar redundancias.

o Almacén de datos: un almacén de datos es el medio de conectar la base de datos


con las necesidades analíticas de la organización. Este repositorio está diseñado
para abarcar todos los recursos de datos de una organización. Su estructura facilita
la extracción de datos, su procesamiento y la posterior puesta a disposición del
usuario. Entre sus ventajas se encuentra el alimentar a los Data Marts, así como a
las capas de procesamiento y análisis de forma directa.

o Data Lake: este enfoque de almacenamiento explota la heterogeneidad de los datos


y sus fuentes, enriqueciendo las capacidades analíticas de los perfiles más
especializados de la organización. Se trata de un enfoque más fluido que el de un
almacén de datos tradicional en el que éstos conservan sus formatos y estructuras
originales. Su punto fuerte es una escalabilidad sin límites.

o Cubo de datos: esta aplicación logra situar los datos en matrices de tres o más
dimensiones, permitiendo una mayor visibilidad sobre todos sus atributos. El
beneficio de trabajar con data cubes es que los trabajadores del conocimiento
pueden apoyarse en ellos para crear volúmenes de datos que les permitan
profundizar en la información e impulsar el descubrimiento.

 DATA MART

Un Datamart es una base de datos departamental, especializada en el almacenamiento de


los datos de un área de negocio específica.

Docente: Ing. Henry Recalde MSc.


UNIVERSIDAD TECNOLÓGICA ISRAEL
FORMATO DE ACTIVIDADES DE SEGUIMIENTO
BASES DE DATOS III
4

Se caracteriza por disponer la estructura óptima de datos para analizar la información al


detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un
datamart puede ser alimentado desde los datos de un datawarehouse, o integrar por sí
mismo un compendio de distintas fuentes de información.

Por tanto, para crear el datamart de un área funcional de la empresa es preciso encontrar la
estructura óptima para el análisis de su información, estructura que puede estar montada
sobre una base de datos OLTP, como el propio datawarehouse, o sobre una base de datos
OLAP. La designación de una u otra dependerá de los datos, los requisitos y las
características específicas de cada departamento. De esta forma se pueden plantear dos
tipos de datamarts:

o Datamart OLAP

Se basan en los populares cubos OLAP, que se construyen agregando, según los
requisitos de cada área o departamento, las dimensiones y los indicadores necesarios
de cada cubo relacional. El modo de creación, explotación y mantenimiento de los cubos
OLAP es muy heterogéneo, en función de la herramienta final que se utilice.

o Datamart OLTP

Pueden basarse en un simple extracto del datawarehouse, no obstante, lo común es


introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las
operaciones más usuales) aprovechando las características particulares de cada área
de la empresa.

Los datamarts que están dotados con estas estructuras óptimas de análisis presentan las
siguientes ventajas:

o Poco volumen de datos


o Mayor rapidez de consulta
o Consultas SQL y/o MDX sencillas
o Validación directa de la información
o Facilidad para la historización de los datos

 CUBO DE DATOS

Un cubo OLAP o un cubo de datos, es una estructura de datos que supera las limitaciones
de las bases de datos relacionales y proporciona un análisis rápido de datos. Los cubos
pueden mostrar y sumar grandes cantidades de datos, a la vez que proporcionan a los
usuarios acceso mediante búsqueda a los puntos de datos. Es un subconjunto de datos de
la bodega que se almacena en una estructura multidimensional.

Docente: Ing. Henry Recalde MSc.


UNIVERSIDAD TECNOLÓGICA ISRAEL
FORMATO DE ACTIVIDADES DE SEGUIMIENTO
BASES DE DATOS III
5

Un principio clave del OLAP es que los usuarios deberían obtener tiempos de respuesta
consistentes para cada vista de datos que requieran. Dado que la información se colecta en
el nivel de detalle solamente, el resumen de la información es usualmente calculado por
adelantado. Estos valores precalculados son la base de las ganancias de desempeño del
OLAP.

Las características principales de una base de datos OLAP son:

o El acceso a los datos suele ser de solo lectura, siendo la acción más común sobre la
misma el realizar consultas sobre los datos habiendo muy pocas inserciones,
actualizaciones y eliminaciones sobre los mismos.

o Los datos se estructuran según las áreas del negocio, además los datos están
integrados de manera uniforme en toda la organización.

o El historial de los datos es a largo plazo; normalmente de 2 a 5 años.

o Para cargar las bases de datos OLAP con información, se utilizan los sistemas
operacionales existentes, utilizando para esto un proceso de extracción,
transformación y carga (ETL).

o En este modelo los datos son vistos como cubos los cuales consisten en categoría
descriptivas (dimensiones) y valores cuantitativos (medidas).

o Es un modelo multidimensional de datos, que simplifica a los usuarios realizar


consultas complejas, arreglar datos en un reporte, cambiar de datos resumidos a
datos detallados, etc.

Ejemplo del funcionamiento de un cubo de datos

Este cubo consta de 3 dimensiones

Docente: Ing. Henry Recalde MSc.


UNIVERSIDAD TECNOLÓGICA ISRAEL
FORMATO DE ACTIVIDADES DE SEGUIMIENTO
BASES DE DATOS III
6
o En la primera dimensión se encuentran Productos

o La segunda dimensión está representada por Ciudades

o La tercera dimensión está representado por el tiempo.

Para extraer la información del cubo en las 3 dimensiones establecidas se hace una
intersección de las 3 dimensiones para sacar cualquier valor estadístico.

 Referencias

Areas de Investigación (2010) Data Warehousing y Tecnología OLAP,


Recuperado de
http://gplsi.dlsi.ua.es/gplsi/areas.htm

Sinnexus (2008) Datawarehouse,


Recuperado de
https://www.sinnexus.com/business_intelligence/datawarehouse.aspx

PowerData (2017) Gestion de datos,


Recuperado de
https://blog.powerdata.es/el-valor-de-la-gestion-de-datos/diferencias-entre-data-mart-
data-lake-data-warehouse-y-data-cube

Rubinstein Jacobo, 2000. The Data Warehouse. Cambridge Technology Partners

David Friend, 1995. Introducción al procesamiento analítico on-line (OLAP). Chairman


Pilot Software Inc.

Docente: Ing. Henry Recalde MSc.

También podría gustarte