Está en la página 1de 9

FACULTAD DE CIENCIAS EMPRESARIALES Y EDUCACION

ESCUELA ACADÉMICO PROFESIONAL DE ADMINISTRACION Y NEGOCIOS


INTERNACIONALES

Curso:

Sistema de Información Gerencial

Tema:

“DATA WAREHOUSE”

Profesor:

Elmer Trigozo Ruiz

INTEGRANTES:

Cindhy Medaly Guevara Garcia


Nicole Linarez Balverde
Florita Guerra Yalta
Marcelo Cucho Gonzales
Gary Marcelo Mirano Celis
Marcopolo Ushiñahua Fasanando

Ciclo:

VII

TARAPOTO – SAN MARTIN

2018
INTRODUCCION

El Data Warehouse es una tecnología para el manejo de la información construido


sobre la base de optimizar el uso y análisis de la misma utilizado por las
organizaciones para adaptarse a los vertiginosos cambios en los mercados. Su
función esencial es ser la base de un sistema de información gerencial, es decir,
debe cumplir el rol de integrador de información proveniente de fuentes
funcionalmente distintas (Bases Corporativas, Bases propias, de Sistemas
Externos, etc.) y brindar una visión integrada de dicha información, especialmente
enfocada hacia la toma de decisiones por parte del personal jerárquico de la
organización. Es un sitio donde se almacena de manera integrada toda la
información resultante de la operatoria diaria de la organización. Además, se
almacenan datos estratégicos y tácticos con el objetivo de obtener información
estratégica y táctica que pueden ser de gran ayuda para aplicar sobre las mismas
técnicas de análisis de datos encaminadas a obtener información oculta. Esta
información incluye movimientos que modifican el estado del negocio, cualquier
interacción que se tenga con los clientes y proveedores, y cualquier dato adicional
que ayude a comprender la evolución del negocio.
DATA WAREHOUSE
En general el concepto se originó un poco antes de a mediados de los años 80s,
en esencia, dicha tecnología pretende proporcionar un modelo de arquitectura
para el flujo de datos de los sistemas operacionales y los ambientes de
decisión. El término Data warehouse fue acuñado por primera vez por Bill Inmon,
y se traduce literalmente como almacén de datos. Un data warehouse es
una tecnología mediante la cual se agregan datos estructurados desde una o más
fuentes de datos de modo que puedan ser comparados y analizados para aportar
inteligencia de negocio. Los datos que se agregan al data warehouse suelen
contener información corporativa y datos derivados de los sistemas internos de la
empresa, junto a otras fuentes de datos externas. Un data warehouse está
diseñado para dar soporte a las decisiones de negocio permitiendo la
consolidación de datos, análisis y generación de informes con diferentes niveles
de agregación. Los datos se incorporan al data warehouse a través de procesos
de extracción, transformación y carga (ETL).Utiliza un diseño diferente al de las
bases de datos operacionales estándar. Estas últimas se optimizan manteniendo
una estricta exactitud de los datos mediante la actualización de datos en tiempo
real. Por el contrario, está diseñado para dar una visión de largo alcance de los
datos a través del tiempo.

La ventaja principal de este tipo de sistemas se basa en su concepto fundamental,


la estructura de la información. Este concepto significa el almacenamiento de
información homogénea y fiable, en una estructura basada en la consulta y el
tratamiento jerarquizado de la misma, y en un entorno diferenciado de los sistemas
operacionales. Según definió Bill Inmon, el Data Warehouse se caracteriza por
ser:

 Integrado: los datos almacenados en el datawarehouse deben integrarse en


una estructura consistente, por lo que las inconsistencias existentes entre los
diversos sistemas operacionales deben ser eliminadas. La información suele
estructurarse también en distintos niveles de detalle para adecuarse a las
distintas necesidades de los usuarios.
 Temático: sólo los datos necesarios para el proceso de generación del
conocimiento del negocio se integran desde el entorno operacional. Los datos
se organizan por temas para facilitar su acceso y entendimiento por parte de
los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser
consolidados en una única tabla del datawarehouse. De esta forma, las
peticiones de información sobre clientes serán más fáciles de responder dado
que toda la información reside en el mismo lugar.
 Histórico: el tiempo es parte implícita de la información contenida en un
datawarehouse. En los sistemas operacionales, los datos siempre reflejan el
estado de la actividad del negocio en el momento presente. Por el contrario, la
información almacenada en el datawarehouse sirve, entre otras cosas, para
realizar análisis de tendencias. Por lo tanto, el datawarehouse se carga con los
distintos valores que toma una variable en el tiempo para permitir
comparaciones.
 No volátil: el almacén de información de un datawarehouse existe para ser
leído, pero no modificado. La información es por tanto permanente, significando
la actualización del datawarehouse la incorporación de los últimos valores que
tomaron las distintas variables contenidas en él sin ningún tipo de acción sobre
lo que ya existía.

PRINCIPALES APORTACIONES DE UN DATA WAREHOUSE

 Proporciona una herramienta para la toma de decisiones en cualquier área


funcional, basándose en información integrada y global del negocio.
 Facilita la aplicación de técnicas estadísticas de análisis y modelización para
encontrar relaciones ocultas entre los datos del almacén; obteniendo un valor
añadido para el negocio de dicha información.
 Proporciona la capacidad de aprender de los datos del pasado y de predecir
situaciones futuras en diversos escenarios.
 Simplifica dentro de la empresa la implantación de sistemas de gestión
integral de la relación con el cliente.
 Supone una optimización tecnológica y económica en entornos de Centro de
Información, estadística o de generación de informes con retornos de la
inversión espectaculares.

EL DATA WAREHOUSE ES IMPORTANTE EN LA:

o Agilización del reporting: optimizar el tiempo necesario para la generación


de informes es uno de los primeros signos del trabajo con una data
warehouse. Ya no hace falta recurrir a diferentes fuentes para comprobar si
se actualizan los datos, o para mantener manualmente su actualización. Ya
no existe información perdida. Todo el mundo sabe que todos los datos, en
las mejores condiciones de calidad, están en el almacén central.
o Reducción de los tiempos de espera: procesos ineficaces, frustración y
desmotivación en la plantilla, tensiones entre departamentos... a veces a los
usuarios les falta tiempo para poder ocuparse de compartir determinada
información y, otras, el problema es que ni siquiera saben dónde encontrar
los datos que resuelven la consulta que deben gestionar. La implementación
de un almacén de datos puede ayudar a centralizar los datos y poner
información de calidad a disposición de todos los miembros de la
organización de forma más eficaz.
o Versión única de la verdad: cuántas veces no han aparecido discrepancias
entre informes procedentes de distintos departamentos, e incluso entre datos
e informes. ¿Cuál es la opción válida? ¿En cuál se puede confiar? Se
necesita mucho tiempo para resolver este tipo de conflictos que, de no
detectarse, conducen a errores de graves consecuencias. Sin embargo, al
entender qué es una data warehouse e implementar uno, se eliminan los
registros duplicados, desaparecen los errores e inconsistencias, y la
información que se emplea como base para el reporting es precisa, completa
y está actualizada.

LOS OBJETIVOS DEL DATA WAREHOUSE

 Hacer a la información de la organización accesible y consitente


 Controlar el acceso efectivo a los datos
 Generar información de manera flexible
 Servir de ayuda en la toma de decisiones

Para comprender el concepto de Data Warehouse, es importante considerar los


procesos que lo conforman. A continuación, se describen dichos procesos clave
en la gestión de un Data Warehouse:

 Extracción: obtención de información de las distintas fuentes tanto


internas como externas.
 Elaboración: filtrado, limpieza, depuración, homogeneización y
agrupación de la información.
 Carga: organización y actualización de los datos y los metadatos en la base
de datos.
 Explotación: extracción y análisis de la información en los distintos niveles
de agrupación.
IMPLEMENTACIÓN DE UN DATA WAREHOUSE

La estructura adoptada para el almacén de datos se debe realizar de tal modo que
satisfaga las necesidades de la empresa, dicha elección es clave en la efectividad
del Data Warehouse. Existen tres formas básicas de estructura del almacén:

 Data Warehouse central: La implementación consta de un solo nivel con un


solo almacén que soporta los requerimientos de información de toda la
empresa.
 Data Warehouse distribuido: Es una estructura de un solo nivel que se
particiona para distribuirlo a nivel departamental.
 Data Warehouse de dos niveles: Es una combinación de los anteriores que
soporta requerimientos de información tanto a nivel empresarial como
departamental.

ALGUNAS EMPRESAS QUE UTILZAN DATA WAREHOUSE

1. COOPERATIVA SAN MARTIN


2. PAYPAL
3. COCA_COCA COMPANY
4. VERIZON
5. FORD MOTOR COMPANY

DATA WAREHOUSE ETL


Se trata del proceso que permite a las organizaciones mover datos desde
múltiples fuentes, reformatearlos y cargarlos en otra base de con el objeto de
analizarlos. También pueden ser enviados a otro sistema operacional para apoyar
un proceso de negocio. En definitiva, el principal objetivo de este proceso
es facilitar el movimiento de los datos y la transformación de los mismos,
integrando los distintos sistemas y fuentes en la organización moderna.

FASES DE UN PROCESO ETL

Las distintas fases o secuencias de un proceso ETL son las siguientes:

 Extracción de los datos desde uno o varios sistemas fuente.


 Transformación de dichos datos, es decir, posibilidad de reformatear y limpiar
estos datos cuando sea necesario.
 Carga de dichos datos en otro lugar o base de datos, un data mart o un data
warehouse, con el objeto de analizarlos o apoyar un proceso de negocio.
¿QUÉ SISTEMAS SE PUEDEN INTEGRAR EN UN PROCESO ETL?

Los procesos ETL pueden incluir:

 Sistemas legacy: Se caracterizan, generalmente, por: ser cerrados, no permitir


cambios y tener un difícil acceso Son sistemas que procesan hacia dentro y,
por lo tanto, no permiten la agregación de una computadora que trabaje en
paralelo.

 Sistemas nuevos: Por el contrario, son abiertos, amplios e interconectados.

BENEFICIOS DE LOS PROCESOS ETL

A cualquier empresa u organización le beneficia poner en marcha un proceso ETL


para mover y transformar los datos que maneja por los siguientes motivos:

 Posibilita a los directivos tomar decisiones estratégicas basadas en el análisis


de los datos cargados en las bases nuevas y actualizadas: la dama mart o data
warehouse.

 Sirve para integrar sistemas, las organizaciones crecen de forma orgánica y


cada vez se van agregando más fuentes de datos. Esto provoca que comience
a surgir nuevas necesidades, como por ejemplo integrar los datos de
un banking on line con los datos antiguos de un sistema legacy.

 Poder tener una visión global de todos los datos consolidados en una data
warehouse. Por ejemplo, crear una estrategia de marketing basándose en el
análisis de los datos anteriores.

OLAP DATA WAREHOUSE


La herramienta OLAP (On-Line Analytical Processing) permiten navegar a través
de los datos almacenados en un modelo de datos dimensional para analizarlos
dinámicamente desde una perspectiva multidimensional, es decir, considerando
unas variables en relación con otras y no de forma independiente entre sí,
permitiendo enfocar el análisis desde distintos puntos de vista Esta visión
multidimensional de los datos puede visualizarse como un “cubo de Rubik”, que
puede girarse para examinarlo desde distintos puntos de vista, y del que se
pueden seleccionar distintas “rodajas” o “cubos” dependiendo de los aspectos de
interés para el análisis.

Es el método más utilizado para analizar y evaluar los datos de la data warehouse
en línea. Permite a los gerentes y analistas obtener una idea de la información.
Para analizar los datos se utilizan un conjunto de operaciones. Estas operaciones
se realizan mucho más fácilmente con software o programas OLAP, que suelen
incluir los programas data warehouse. Para los programas OLAP un tiempo de
respuesta es una medida de su eficacia. OLAP permite al usuario extraer y ver
con facilidad y de forma selectiva los datos desde diferentes puntos de vista.

Tradicionalmente, los sistemas OLAP se clasifican según las siguientes


categorías:

ROLAP
Típicamente, los datos son detallados, evitando las agregaciones y las tablas se
encuentran desnormalizadas. Los esquemas más comunes sobre los que se
trabaja son estrella o copo de nieve, aunque es posible trabajar sobre cualquier
base de datos relacional. La arquitectura está compuesta por un servidor de banco
de datos relacional y el motor OLAP se encuentra en un servidor dedicado. La
principal ventaja de esta arquitectura es que permite el análisis de una enorme
cantidad de datos.

MOLAP
Esta implementación OLAP almacena los datos en una base de datos
multidimensional. Para optimizar los tiempos de respuesta, el resumen de la
información es usualmente calculado por adelantado. Estos valores precalculados
o agregaciones son la base de las ganancias de desempeño de este sistema.
Algunos sistemas utilizan técnicas de compresión de datos para disminuir el
espacio de almacenamiento en disco debido a los valores precalculados.
HOLAP
Almacena algunos datos en un motor relacional y otros en una base de datos
multidimensional.
CONCLUSIÓN
Para que el Data Warehouse sea exitoso se necesita una limpieza continua,
transformación e integración de los datos. Además, requiere sistemas,
aplicaciones y almacenamiento específico. Es un trabajo constante que garantiza
el éxito de los datos en el diagnóstico y las soluciones de inteligencia de negocios
que serán implementadas en la compañía.

Finalmente, se puede decir que el principal beneficio del Data Warehouse para las
empresas es que tiene la propiedad de eliminar los datos que interfieren con el
análisis de la información y su entrega; sea cual sea el formato requerido, el Data
Warehouse facilita el proceso de gestión.

También podría gustarte