Está en la página 1de 4

Alumno: Valencia paredes jhimy kevin código: 2012218465

Filial: Ayacucho

ACTIVIDAD Nª01

Data warehouse

Un Data Warehouse es un gran almacén de datos e información que, además, recoge


todos aquellos que son realmente necesarios para la realización de análisis e informes
relacionado con el Business Intelligence (BI). Una parte fundamental en la toma de
decisiones de las grandes empresas a la hora de establecer objetivos, establecer
normativas y plantear riesgos.

Aunque su nombre provenga de la palabra almacén, sus labores van más allá del
almacenamiento, como ya hemos explicado. Es un sistema que se aloja en el servidor
de una compañía o en la nube y que recopila datos sobre las OLTP (Procesamiento de
Transacciones En Línea) y varias fuentes más de información para su posterior
selección y extracción de cara a un uso con fines analíticos.

Una arquitectura que se divide en 3 estructuras: básica, básica con zona de ensayo y
básica con zona de ensayo y con data marts. La primera proporciona datos brutos
junto con metadatos para facilitar su acceso; la segunda ofrece la posibilidad de
limpiar la información en función de la utilidad que se le vaya a dar; y la tercera ofrece
soluciones para diferentes líneas de negocio (inventario, ventas, compras, etc.).

En todos los casos, el data warehouse cumple la función de guardar la información de


interés para la empresa con fines prácticos y estratégicos. Sus estructuras determinan
el grado de usabilidad, aunque sobre todo ayudan a saber hasta qué punto es más
fácil orientarse a diferentes ramas de un mismo negocio en base a los datos
obtenidos.

Aunque la finalidad principal del Data Warehouse es almacenar la información ya


depurada para su posterior empleo a nivel empresarial, es una herramienta que facilita
la toma de decisiones dentro de una compañía, así como también mejora la calidad de
estas. Además, permite almacenar también consultas hechas anteriormente o análisis
ya realizados, además de una mayor rapidez a la hora de acceder a la información.
Por otra parte, es capaz de facilitar la comunicación entre departamentos en una
misma compañía.

Información, análisis, gestión y comunicación son los elementos donde influye


considerablemente.
Data mart

Dependiendo de la necesidad de la empresa y de los recursos disponibles para invertir


en una Solución de Inteligencia de Negocios, se puede optar por realizar la
implementación de un solo Datamart o de un Data Warehouse. El alcance se
determina por el grupo de usuarios objetivo y por la naturaleza de la información que
se desea visualizar. A menudo, un Datamart es creado y controlado por un único
departamento dentro de una organización.

Un Datamart almacenara la información proveniente de uno o más orígenes de datos


(bases de datos, archivos con datos, servicios de internet, etc.) y que ha sido
procesada por un ETL (proceso de Extracción, Transformación y Carga).

Debido a que el Datamart contiene información consolidada, se actualiza


periódicamente (diariamente, semanalmente y en algunos casos mensualmente). No
es información en línea.

Las Data Marts pueden ser dependientes o independientes del Data Warehouse.

Generalmente, los datos están estructurados en modelos estrellas o copo de nieve. El


modelo se define en base a la cantidad y calidad de Indicadores que se deseen
evaluar. Los departamentos de una empresa, por ejemplo, el departamento de ventas,
tienen necesidades particulares, pero siempre alineadas a las necesidades de la
organización, motivo por el cual la información también tiene un nivel de complejidad
distinto.

Data mart dependiente: se construye a partir de un Data Warehouse central,


identificando un subconjunto adecuado de datos y moviendo una copia del mismo, a
menudo en forma resumida.

Data mart Independiente: se crea a partir de fuentes externas, sin recurrir al Data
Warehouse central.

Data mart Hibrido: permite combinar las ventajas de los dos modelos anteriores,
integrando datos provenientes de un Data Warehouse central con otras fuentes
externas.
OLTP

Este sistema optimiza el acceso a los datos, facilitando las tareas de lectura, escritura
y análisis que se llevan a cabo de manera frecuente. Los procedimientos OLTP
estructuran estos datos según su nivel de aplicación (programa de gestión a medida,
CRM o ERP implantado…), además, no tienen por qué mantenerse uniformes en los
diferentes departamentos por la común falta de compatibilidad. Por último, se
caracterizan porque el historial de datos queda limitado a la actualidad o a los más
recientes.

De esta forma, los sistemas de dicha tecnología registran las interacciones


empresariales que se van produciendo a lo largo del funcionamiento diario de la
organización, admitiendo la consulta de datos para diferentes intervenciones.

OLAP

Las aplicaciones de OLTP se suelen utilizar para almacenar nuevos datos o actualizar
los ya existentes, y en sistemas con numerosos usuarios, con consultas y
actualizaciones frecuentes y que requieren tiempo de respuesta rápidos. Por ejemplo,
para administrar pagos recibidos de los clientes, de los proveedores, solicitud de
pedidos, movimientos en el inventario.

Una de las aplicaciones más comunes de los procedimientos OLTP es la de los


cajeros automáticos de las sucursales bancarias, que son una aplicación del
procesamiento de transacciones comerciales, además, también se utiliza en la banca
electrónica. Además, estos sistemas también se emplean en incontables aplicaciones
como en el procesamiento de pedidos, el comercio electrónico, en industria o en el
sistema de gestión de los supermercados.
CUBO OLAP

Para funcionar, las aplicaciones OLAP utilizan un tipo de base de datos que posee la
peculiaridad de ser multidimensional, denominada comúnmente Cubo OLAP.
Básicamente, el Cubo OLAP, que acuña su nombre por su característica
multidimensional, es una base de datos que posee diversas dimensiones, ampliando
las posibilidades que hasta el momento ofrecían las conocidas hojas de cálculo.

Hasta la llegada del término Cubo OLAP, que nació de la mano de Edgar F. Codd, de
la compañía EF Codd & Associates, sólo se utilizaban bases de datos relacionales
para el proceso de la información, con sistemas tales como el ROLAP.

Dimensiones terminología

Las dimensiones son el fundamento de la base de datos multidimensional su creación


es un trabajo importante que tendrá gran impacto en la facilidad de uso del cubo y su
rendimiento.

Las dimensiones son los ejes de análisis que pondrán manipular los usuarios para
interrogarlas cifras:

Construir ejes simples y ajustados al negocio permitirá a los usuarios encontrar


fácilmente la información.

Las dimensiones definen a menudo jerarquías que se usaran en el motor para


construir valores agregados:

Diseñar las jerarquías adecuadas y útiles permitirá al motor preparar los valores
agregados pertinentes.

Fact table

En las bases de datos, y más concretamente en un data warehouse, una tabla de


hechos es la tabla central de un esquema dimensional y contiene los valores de las
medidas de negocio o dicho de otra forma los indicadores de negocio.

medidas

En la construcción de cubos OLAP, las tablas de dimensiones son elementos que


contienen atributos (o campos) que se utilizan para restringir y agrupar los datos
almacenados en una tabla de hechos cuando se realizan consultas sobre dichos datos
en un entorno de almacén de datos o data mart.

También podría gustarte