Está en la página 1de 11

Datawarehouse

Asignatura: Tecnología de información y comunicación II

Sección: 118 INF

Nombre del docente: Silvia Reyes Quezada

Nombre de los integrantes del grupo: Pedro Sierra Romero


Gonzalo Aguayo San Martín

Fecha de entrega: 12 Septiembre 2018


I. Introducción

El hombre, desde los orígenes de la civilización se ha interesado en la utilización de


la información, en el campo de batalla, en el proceso de edificación de las grandes
estructuras y para anticiparse a los eventos de la naturaleza; siempre ha requerido cada
vez más contar con mejores fuentes de información.

La Revolución de la información, ha provocado cambios fundamentales en la elaboración


y el uso de la información producidos a finales del siglo XX.

La información dispuesta en el periódico y hasta la información almacenada en las bases


de datos han permitido que la información esté al alcance de todos y la tecnología
asociada a todos estos logros de nuestra sociedad han conducido a que esta información
empiece a adquirir importancia estratégica. Gracias a que esa información se
interrelaciona como se ha estudiado en el tema de Data Warehouse.

Data Warehouse
2
II. Definición Datawarehouse

Como definición inicial para la compresión del término, Data Warehouse se traduce al
idioma español, como un almacén, depósito o bodega de datos, pero aplicando el término
a la vida cotidiana, tal como lo señala William Harvey Inmon, quien es considerado como
el padre de este concepto, “un Data Warehouse es un conjunto de datos integrados
orientados a una materia que varían con el tiempo y que no son transitorios, los cuales
soportan el proceso de toma de decisiones de una administración."

De acuerdo con algunas organizaciones, el Data Warehouse es una arquitectura. Para


otras, es un depósito consistente en datos (separados y que no interfieren con los
sistemas operativos y de producción existentes) que Ilena por completo los diferentes
requerimientos de acceso y reporte de datos. Para algunos otros, el Data Warehouse es
un proceso continuo que mezcla los datos de varias fuentes heterogéneas, incluyendo
datos históricos y adquiridos para soportar la constante necesidad de consultas
estructuradas y/o ad hoc, reportes analíticos y soporte de decisiones.

Así como hay gran divergencia para establecer una definición precisa de un Data
Warehouse, hay un claro consenso de que la tecnología del Data Warehouse es un
ingrediente esencial en el conjunto de soluciones para el soporte de decisiones en una
empresa.

Data Warehouse
3
III. Como Funciona

Hacer que la información de la organización sea accesible: los contenidos del Data
Warehouse son entendibles y navegables, y el acceso a ellos son caracterizado por el
rápido desempeño. Estos requerimientos no tienen fronteras y tampoco limites fijos.
Cuando hablamos de entendible significa, que los niveles de la información sean
correctos y obvios. Mientras que cuando hablamos de navegables, significa el reconocer
el destino en la pantalla y llegar a donde queramos con solo un clic. Rápido desempeño
significa, cero tiempos de espera.

Hacer que la información de la organización sea consistente: la información de una


parte de la organización puede hacerse coincidir con la información de la otra parte de la
organización. Si dos medidas de la organización tienen el mismo nombre, entonces
deben significar la misma cosa. Y a la inversa, si dos medidas no significan la misma
cosa, entonces son etiquetados diferentes. Información consistente significa, información
de alta calidad. Significa que toda la información es contabilizada y completada.

Ser información adaptable y elástica: el Data Warehouse está diseñado para cambios
continuos. Cuando se le hacen nuevas preguntas al Data Warehouse, los datos
existentes y las tecnologías no cambian ni se corrompen. Cuando se agregan datos
nuevos al Data Warehouse, los datos existentes y las tecnologías tampoco cambian ni
se corrompen.

Ser un seguro baluarte que protege los valores de la información: el Data


Warehouse no solamente controla el acceso efectivo a los datos, si no que da a los
dueños de la información gran visibilidad en el uso y abusos de los datos, aún después
de haber dejado el Data Warehouse.

Ser la fundación de la toma de decisiones: el Data Warehouse tiene los datos


correctos para soportar la toma de decisiones. Solo hay una salida verdadera del Data
Warehouse: las decisiones que son hechas después de que el Data Warehouse haya
presentado las evidencias. La original etiqueta que preside el Data Warehouse sigue
siendo la mejor descripción de lo que queremos construir, un sistema de soporte a las
decisiones

Data Warehouse
4
IV. Ventajas

 Permite consulta masiva.


 Transforma datos en información vital para la competitividad de las empresas,
define, transforma, distribuye y automatiza.
 Proporciona una herramienta para la toma de decisiones en cualquier área
funcional, basándose en información integrada y global del negocio.
 Facilita la aplicación de técnicas estadísticas de análisis y modelización para
encontrar relaciones ocultas entre los datos del almacén; obteniendo un valor
añadido para el negocio de dicha información.
 Permite aprovechar la infraestructura existente puesto que es capaz de ensamblar
varios tipos de datos en formatos que se pueden entender y usar a través de
variadas herramientas de consulta
 Es escalable, crece a medida que más datos sean necesarios y que las demandas
de la organización se incrementen.
 Propicia el empoderamiento de la organización.
 Proporciona la capacidad de aprender de los datos del pasado y de predecir
situaciones futuras en diversos escenarios.
 Simplifica dentro de la empresa la implantación de sistemas de gestión integral de
la relación con el cliente.
 Supone una optimización tecnológica y económica en entornos de Centro de
Información, estadística o de generación de informes con retornos de la inversión
espectaculares.

Data Warehouse
5
V. Desventajas

 Subestimación del recurso de carga de datos: Algunas veces subestimamos el


tiempo requerido para extraer, limpiar y cargar los datos en el almacén.
 Problemas ocultos con el sistema fuente: Algunas veces, los problemas ocultos
asociados con los sistemas fuente que alimentan el depósito de datos pueden
identificarse después de años de no haber sido detectados.
 Datos requeridos no capturados: En algunos casos, los sistemas fuente no
capturan los datos requeridos, lo que puede ser muy importante para el propósito
del depósito de datos.
 Mayores demandas del usuario final: Otra razón para aumentar las demandas es
que una vez que un almacén de datos está en línea, a menudo el número de
usuarios y las consultas aumentan junto con las solicitudes de respuestas a
consultas cada vez más complejas.
 Homogenización de datos: El concepto de depósito de datos se ocupa de la
similitud de formatos de datos entre diferentes fuentes de datos. Por lo tanto, da
como resultado perder algún valor importante de los datos.
 Alta demanda de recursos: El almacén de datos requiere grandes cantidades de
datos.
 Propiedad de los datos: Los datos confidenciales que son propiedad de un
departamento deben cargarse en el depósito de datos para fines de toma de
decisiones. Pero, en algún momento, esto resulta en renuencia de ese
departamento porque puede dudar en compartirlo con otros.
 Altos Mantenimientos: Los almacenes de datos son sistemas de alto
mantenimiento. Cualquier reorganización de los procesos de negocios y los
sistemas de origen puede afectar el almacén de datos y resulta en un alto costo
de mantenimiento.

Data Warehouse
6
VI. Aplicación

El Data Warehouse sigue el mismo ciclo de perfeccionamiento que todos los desarrollos
de software.

2° Modelizar 3° Localizar
datos datos

Proceso
1° Iterativo de 4°
construcción
Análisis de Localizar
especificaciones datos

7° Cargar y Construir Definir 5°


procedimientos
replicar data
Replicación
marts


Las fases del ciclo son las mismas, lo mismo que su secuencia, sólo existen variantes
únicas que se relacionan específicamente con el Data Warehouse para tareas dentro de
estas fases. La siguiente figura muestra el ciclo clásico de desarrollo de software:

Prueba
Planeación Diseño

Desarrollo Requerimientos Análisis Construcción

Data Warehouse
7
Planeación: La planeación es una fase importante de la implementación del Data
Warehouse. Las decisiones tomadas durante la fase de planeación tienen un impacto
significativo en el ámbito de implementación y en la magnitud del esfuerzo. Las decisiones
clave de planeación incluyen la selección de un enfoque de arriba hacia abajo (de Io
general a Io particular), de abajo hacia arriba (en sentido opuesto) o combinado; la
selección de la arquitectura apropiada de Data Warehouse; la selección adecuada del
ámbito de información, fuentes de datos y tamaño del meta modelo; y la estimación de
planes de programa y proyecto y justificaciones de presupuesto.

Requerimientos: Durante la fase de requerimientos se debe considerar una diversidad


de ellos. Los requerimientos son conducidos por el negocio y por la tecnología. La
cuidadosa selección y especificación de requerimientos en esta etapa proporciona un
proyecto cimentado que arroja resultados con rapidez.

Análisis: La fase de análisis es importante ya que determina la forma en que se cubrirán


los requerimientos. Esta fase se enfoca principalmente en la conversión de
especificaciones de requerimientos a especificaciones de meta modelo para el Data
Warehouse. Después, estas especificaciones se usan para generar extractores del Data
Warehouse y software de transformación, integración, resumen y adición.

Construcción: La fase de construcción resalta los diversos intercambios "construir en


comparación con comprar". Mediante la selección adecuada de componentes
suministrados por fabricantes, es posible construir una primera implementación del Data
Warehouse rápida y eficaz.

Despliegue: La fase de despliegue en el ciclo de desarrollo del Data Warehouse tiene


un componente único denominado comercialización de información. Esto reconoce que
la mercancía que suministra el Data Warehouse a sus usuarios finales (clientes) es la
propia información. Como un producto de mercancía, la información también debe
comercializarse como los bienes de consumo. La comercialización comprende la
capacidad de hacer énfasis en la disponibilidad, los beneficios y el empaque para hacerla
atractiva al usuario final.

Data Warehouse
8
VII. Ejemplos

MS SQL SERVER Business Inteligence es la solución para construir data warehouse del
manejador de base de datos de SQL SERVER.

EXCEL Business Inteligence: la hoja de cálculo de EXCEL de Microsoft permite la


construcción de cubos y almacenes de datos para realizar análisis de información por
medio de escenarios.

Oracle Data Warehoursing: Es la solución de Oracle para la creación de Data Warehouse.

 EJEMPLO ILUSTRADO

En la Figura se muestra un ejemplo hipotético de una data Warehouse estructurado para


un centro de producción industrial.

Se muestra sólo el detalle actual, no así los niveles de esquematización ni los archivos
de detalle más antiguos.

Además, se observa que hay tablas del mismo tipo divididas a través del tiempo. Por
ejemplo, para el histórico de la fabricación de las piezas, hay muchas tablas separadas
físicamente, representando cada una un trimestre diferente. La estructura de los datos es
consistente con la tabla de la elaboración de las piezas, aunque físicamente hay muchas
tablas que lógicamente incluyen el histórico.

Para los diferentes tipos de tablas hay diferentes unidades de tiempo que físicamente
dividen las unidades de información. El histórico de fabricación está dividido por
trimestres, el histórico de la orden de piezas está dividido por años y el histórico de cliente
es un archivo único, no dividido por el tiempo.

Así también, las diferentes tablas son vinculadas por medio de un identificador común,
piezas u órdenes de piezas (la representación de la interrelación en el ambiente de
depósito toma una forma muy diferente al de otros ambientes, tal como el ambiente
operacional).

Data Warehouse
9
Data Warehouse
10
VIII. Conclusión

Un data warehouse es un sistema que te permite una organización y un análisis completo


de gran información que se genere. Esto te permite el poder darle mantenimiento a la
información de manera más adecuada ya que en muchas ocasiones no se tiene un control
sobre toda la información que se pueda generar en una empresa y este sistema te permite
el control de un gran volumen de información.

Un data warehouse se crea al extraer los datos de diferentes bases de datos, esto
permite o tiene como beneficio el poder eliminar información redundante y puedes
también realizar resúmenes de información lo cual te beneficiara para la toma de
decisiones.

Los beneficios de contar con una data warehouse es que tendrás una herramienta que
te ayudara y te facilitara la toma de decisiones, ya que este sistema permite tener un
buen control sobre toda la información que necesitas para poder tomar esa
decisión, basándote en datos confiables y que tienes a la mano en cualquier momento.
Dado que tendrás información pasada de tu empresa y puedes saber por
datos probabilísticos como funcionara tu empresa en el futuro.

Data Warehouse
11

También podría gustarte