0% encontró este documento útil (0 votos)
197 vistas15 páginas

Importancia del Data Warehouse en Empresas

Este documento introduce el concepto de Data Warehouse y Red Privada Virtual (VPN). Explica que un Data Warehouse es un repositorio de datos fácilmente accesible de múltiples fuentes de datos transformadas para permitir nuevos análisis y tomar mejores decisiones. También describe las características clave de un Data Warehouse como ser integrado, temático, histórico y no volátil. Finalmente, destaca que un Data Warehouse hace que la información sea accesible, consistente y adaptable para mejorar la toma de decisiones en una organización. Por otro lado,
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
197 vistas15 páginas

Importancia del Data Warehouse en Empresas

Este documento introduce el concepto de Data Warehouse y Red Privada Virtual (VPN). Explica que un Data Warehouse es un repositorio de datos fácilmente accesible de múltiples fuentes de datos transformadas para permitir nuevos análisis y tomar mejores decisiones. También describe las características clave de un Data Warehouse como ser integrado, temático, histórico y no volátil. Finalmente, destaca que un Data Warehouse hace que la información sea accesible, consistente y adaptable para mejorar la toma de decisiones en una organización. Por otro lado,
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

INTRODUCCION

Las organizaciones y toda empresa siempre necesitara que su información este a su


alcance cuando mass lo necesite es por ello que existen el Data Warehouse o el Data
Mart, sistemas capaces de organizar la información importante de una empresa, de tal
forma que los empleados o los ejecutivos tengan en sus manos la información que
requieren, se puede decir que un Data Warehouse es una forma de sacar y guardar
información de forma segura, ya que esta no se perderá ni se dañara, pero esto no es todo
lo que un Data warehouse puede ofrecernos ya que nos dara una importante ayuda en la
toma de decisiones y otros campos de las empresas

Por otra parte también se tratara de explicar la importancia de La Real Virtual Private o
más conocida como VPN, una tecnología de red que ya es bastante usada en el mundo.

A continuación se extenderá la información sobre estas tecnologías, esperando que esta


sea de utilidad.

2
INDICE

CONTENIDO

INTRODUCCION....................................................................................................................................................2

DATA WAREHOUSE...............................................................................................................................................4

DATA MART........................................................................................................................................................10

Datamart OLAP...............................................................................................................................................11

Datamart OLTP...............................................................................................................................................11

RED PRIVADA VIRTUAL.......................................................................................................................................11

Administración de direcciones..................................................................................................................13

Codificación de datos.................................................................................................................................13

Administración de claves...........................................................................................................................13

Soporte a protocolos multiples.................................................................................................................13

Herramientas de una VPN:............................................................................................................................13

Ventajas de una VPN.....................................................................................................................................14

CONCLUSIONES..................................................................................................................................................14

BIBLIOGRAFIA.....................................................................................................................................................15

3
DATA WAREHOUSE

El primer paso para entender la importancia del Data Warehouse es preguntarse que es y
cual es su importancia. Así podemos decir que.

Es un repositorio de datos de muy fácil acceso, alimentado de numerosas fuentes,


transformadas en grupos de información sobre temas específicos de negocios, para
permitir nuevas consultas, análisis, reporteador y decisiones.

La importancia de este sistema es importante en cualquier organización, es por ello que


otra pregunta que uno se debe hacer acerca del Data Warehouse es ¿para qué sirve o a
que publico va dirigido?

Pues a continuación explicaremos de forma sencilla la importancia del mismo y sus


características en una organización o para un ejecutivo en cualquier empresa bien
estructurada.

Se tienen montañas de datos en la compañía, pero no podemos llegar a ellos


adecuadamente. Nada enloquece más a los ejecutivos que dos personas presentando el
mismo resultado de operación pero con diferentes números y los ejecutivos lo que buscan
es ver la información pero desde diferentes ángulos, mostrando únicamente lo que es
importante para tomar una decisión en la empresa, finalmente los ejecutivos saben que
hay datos que nunca serán confiables, por lo que prefieren que se eviten en los reportes
ejecutivos.

Uno de los valores más importantes de una organización es la información.

4
Estos valores normalmente son guardados por la organización de dos formas:

 Los sistemas operacionales de registros


 Y el Data Warehouse

El término Data warehouse fue acuñado por primera vez por Bill Inmon, y se traduce
literalmente como almacén de datos. No obstante, y como cabe suponer, es mucho
más que eso. Según definió el propio Bill Inmon, un data warehouse se caracteriza por
ser:

 Integrado: los datos almacenados en el data warehouse deben integrarse en una


estructura consistente, por lo que las inconsistencias existentes entre los diversos
sistemas operacionales deben ser eliminadas. La información suele estructurarse
también en distintos niveles de detalle para adecuarse a las distintas necesidades
de los usuarios.

 Temático: sólo los datos necesarios para el proceso de generación del


conocimiento del negocio se integran desde el entorno operacional. Los datos se
organizan por temas para facilitar su acceso y entendimiento por parte de los
usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser
consolidados en una única tabla del data warehouse. De esta forma, las peticiones
de información sobre clientes serán más fáciles de responder dado que toda la
información reside en el mismo lugar.

 Histórico: el tiempo es parte implícita de la información contenida en un data


warehouse. En los sistemas operacionales, los datos siempre reflejan el estado de
la actividad del negocio en el momento presente. Por el contrario, la información
almacenada en el data warehouse sirve, entre otras cosas, para realizar análisis de
tendencias. Por lo tanto, el data warehouse se carga con los distintos valores que
toma una variable en el tiempo para permitir comparaciones.

 No volátil: el almacén de información de un data warehouse existe para ser leído,


pero no modificado. La información es por tanto permanente, significando la
actualización del data warehouse la incorporación de los últimos valores que
tomaron las distintas variables contenidas en él sin ningún tipo de acción sobre lo
que ya existía.

Otra característica del data warehouse es que contiene metadatos, es decir, datos
sobre los datos. Los metadatos permiten saber la procedencia de la información, su
periodicidad de refresco, su fiabilidad, forma de cálculo... etc.

 Los metadatos serán los que permiten simplificar y automatizar la obtención de la


información desde los sistemas operacionales a los sistemas informacionales.

5
 Los objetivos que deben cumplir los metadatos, según el colectivo al que va
dirigido, son:

 Dar soporte al usuario final, ayudándole a acceder al data warehouse con su


propio lenguaje de negocio, indicando qué información hay y qué significado tiene.
Ayudar a construir consultas, informes y análisis, mediante herramientas de
Business Intelligence como DSS, EIS o CMI.

 Dar soporte a los responsables técnicos del data warehouse en aspectos de


auditoría, gestión de la información histórica, administración del data warehouse,
elaboración de programas de extracción de la información, especificación de las
interfaces para la realimentación a los sistemas operacionales de los resultados
obtenidos... etc.

Resumiendo esto podemos decir que el sistema operacional de registros es donde los
datos son depositados y el Data WareHouse es de donde se extraen esos datos, por otra
parte se puede decir que todas las características de un Data Warehouse son importantes
para el buen desempeño de la empresa

Se puede decir que un Data Warehouse es prácticamente indispensable en cualquier


empresa, por ello también es importante definir los objetivos que tiene el mismo.

 Hace que la información de la organización sea accesible: los contenidos del Data
WareHouse son entendibles y navegables, y el acceso a ellos son caracterizado por
el rápido desempeño. Estos requerimientos no tienen fronteras y tampoco limites
fijos. Cuando hablamos de entendible significa, que los niveles de la información
sean correctos y obvios. Y Navegables significa el reconocer el destino en la
pantalla y llegar a donde queramos con solo un clic. Rápido desempeño significa,
cero tiempo de espera. Todo lo demás es un compromiso y por consiguiente algo
que queremos mejorar.
 Hacer que la información de la organización sea consistente: la información de una
parte de la organización puede hacerse coincidir con la información de la otra
parte de la organización. Si dos medidas de la organización tienen el mismo
nombre, entonces deben significar la misma cosa. Y a la inversa, si dos medidas no
significan la misma cosa, entonces son etiquetados diferentes. Información
consistente significa, información de alta calidad. Significa que toda la información
es contabilizada y completada. Todo lo demás es un compromiso y por
consiguiente algo que queremos mejorar.
 Es información adaptable y elástica: el Data WareHouse esta diseñado para
cambios continuos. Cuando se le hacen nuevas preguntas al Data WareHouse, los

6
datos existentes y las tecnologías no cambian ni se corrompen. Cuando se agregan
datos nuevos al Data WareHouse, los datos existentes y las tecnologías tampoco
cambian ni se corrompen. El diseño de Data Marts separados que hacen al Data
WareHouse, deben ser distribuidos e incrementados. Todo lo demás es un
compromiso y por consiguiente algo que queremos mejorar.
 Es un seguro baluarte que protege los valores de la información: el Data
WareHouse no solamente controla el acceso efectivo a los datos, si no que da a los
dueños de la información gran visibilidad en el uso y abusos de los datos, aún
después de haber dejado el Data WareHouse. Todo lo demás es un compromiso y
por consiguiente algo que queremos mejorar.
 Es la fundación de la toma de decisiones: el Data WareHouse tiene los datos
correctos para soportar la toma de decisiones. Solo hay una salida verdadera del
Data WareHouse: las decisiones que son hechas después de que el Data
WareHouse haya presentado las evidencias. La original etiqueta que preside el
Data WareHouse sigue siendo la mejor descripción de lo que queremos construir:
un sistema de soporte a las decisiones.

Asi podemos decir que un Data Warehouse es básicamente una forma de conseguir datos
y de sacarlos de forma segura, ya que este nos permitirá ver de forma ordenada y sin
problemas la información que se requiere, y por otra parte nos permite guardar los
valores de información de forma que no se abuse de los datos obtenidos.

También es importante saber que un Data Warehouse posee unos elementos básicos que
todo ejecutivo de conocer, a continuación los desarrollaremos.

 Sistema fuente: sistemas operacionales de registros donde sus funciones son


capturar las transacciones del negocio. A los sistemas fuentes también se le conoce
como Legacy System.
 Área de trafico de datos: es un área de almacenamiento y grupo de procesos, que
limpian transforman, combinan, remover los duplicados, guardan, archivan y
preparan los datos fuente para ser usados en el Data WareHouse.
 Servidor de presentación: la maquina física objetivo en donde los datos del Data
WareHouse son organizados y almacenados para queries directos por los usuarios
finales, reportes y otras aplicaciones.
 Modelo dimensional: una disciplina especifica para el modelado de datos que es
una alternativa para los modelos de entidad – relación.
 Procesos de negocios: un coherente grupo de actividades de negocio que hacen
sentido a los usuarios del negocio del Data WareHouse.
 Data Mart: un subgrupo lógico del Data WareHouse completo.

7
 Data WareHouse: búsquedas fuentes de datos de la empresa. Y es la unión de
todos los data marts que la constituyen.
 Almacenamiento operacional de datos: es el punto de integración por los sistemas
operacionales. Es el acceso al soporte de decisiones por los ejecutivos.
 OLAP: actividad general de búsquedas para presentación de texto y números del
Data WareHouse, también un estilo dimensional especifico de búsquedas y
presentación de información y que es ejemplificada por vendedores de OLAP.
 ROLAP: un grupo de interfases de usuarios y aplicaciones que le dan a la base de
datos relacional un estilo dimensional.
 MOLAP: un grupo de interfases de usuarios, aplicaciones y propietarios de
tecnología de bases de datos que tienen un fuerte estilo dimensional.
 Aplicaciones para usuarios finales: una colección de herramientas que hacen los
queries, analizan y presentan la información objetivo para el soporte de las
necesidades del negocio.
 Herramientas de acceso a datos por usuarios finales: un cliente de Data
WareHouse.
 Ad Hoc Query Tool: un tipo especifico de herramientas de acceso a datos por
usuarios finales que invita al usuario a formas sus propios queries manipulando
directamente las tablas relacionales y sus uniones.
 Modelado de aplicaciones: un sofisticado tipo de cliente de Data WareHouse con
capacidades analíticas que transforma o digiere las salidas del Data WareHouse.
 Meta Data: toda la información en el ambiente del Data WareHouse que no son así
mismo los datos actuales.

Por último, destacar que para comprender íntegramente el concepto de


datawarehouse, es importante entender cuál es el proceso de construcción del mismo,
denominado ETL (Extracción, Transformación y Carga), a partir de los sistemas
operaciones de una compañía:

 Extracción: este es el primer paso de obtener la información hacia el ambiente del


Data WareHouse.
 Transformación: una vez que la información es extraída hacia el área de trafico de
datos, hay posibles paso de transformación como; limpieza de la información, tirar
la basura que no nos sirve, seleccionar únicamente los campos necesarios para el
Data WareHouse, combinar fuentes de datos, haciéndolas coincidir por los valores
de las llaves, creando nuevas llaves para cada registro de una dimensión.

8
 Carga: al final del proceso de transformación, los datos están en forma para ser
cargados.

Se tiene que tomar en cuenta por que una empresa también usa el Data Warehouse ya
que no siempre es requerido, por ende las razones básicas de porque una organización
implementa Data WareHouse son las siguientes:

Para realizar tareas en los servidores y discos, asociados a queries y reportes en servidores
y discos que no son utilizados por sistemas de proceso de transacciones.

Muchas de las empresas quieren instalar sistemas de procesos de transacciones para que
haya una alta probabilidad de que las transacciones sean completadas en un tiempo
razonable. Estos sistemas de procesos de transacciones hacen que las transacciones y
peticiones sean más rápidas en menores tiempos dado a que los queries y reportes
consumen mucho más de su límite permitido en los recursos de servidores y discos, por
tal motivo las empresas han implementado una arquitectura de Data WareHouse que
utiliza sus servidores y discos por separado para algunos de los queries y reportes.

Para utilizar modelos de datos o tecnologías de servidores que agilizan los queries y
reportes, y que no son apropiados para los procesos de transacciones.

Existen maneras de modelar los datos que usualmente agilizan los queries y reportes
(ejemplo: el esquema del modelo estrella) y que no son apropiados para los procesos de
transacciones porque la técnica de modelado bajaría el rendimiento y complicaría el
proceso de transacciones. También existen tecnologías que aceleran el proceso de queries
y reportes pero baja la velocidad en el proceso de transacciones (ejemplo: la indexación
de bitmaps) y tecnología de servidores que incrementan la velocidad en el proceso de
transacciones, pero que disminuyen la velocidad del proceso de queries y reportes
(ejemplo: La tecnología de recuperación de transacciones). Todo esto entonces esta en el
cómo se hacen los modelos de datos y que tecnología se utiliza, inclusive que productos se
adquieren para el impacto de los procesos de queries y reportes.

Para proveer un ambiente donde relativamente una muy poca cantidad de conocimiento
de los aspectos técnicos de tecnología de bases de datos es requerida para escribir y
mantener queries y reportes.

Frecuentemente un Data WareHouse puede ser instalado de manera que los queries y
reportes puedan ser escritos por personal sin tanto conocimiento técnico, lo que hace que
su mantenimiento y construcción se haga sin más complejidad.

9
Para proveer un repositorio del sistema de proceso de transacciones limpio que puede ser
reportado y que no necesariamente requiere que se arregle el sistema de proceso de
transacciones.

El Data WareHouse provee la oportunidad de limpiar los datos sin cambiar los sistemas de
proceso de transacciones, sin embargo algunas implementaciones de Data WareHouse
provee el significado para capturar las correcciones hechas a los datos del Data
WareHouse y alimenta las correcciones hacia el sistema de proceso de transacciones.
Muchas veces hace más sentido hacer las correcciones de esta manera que aplicar las
correcciones directamente al sistema de proceso de transacciones.

Para hacer los queries y reportes de datos básicamente más fácil de los múltiples procesos
de transacciones y de las fuentes externas y de los datos que deben ser almacenados
solamente para el propósito de hacer queries y reportes.

Desde hace mucho tiempo que las compañías necesitan reportes con información de
múltiples sistemas y han hecho extracciones de datos para después correrlos bajo la lógica
de búsqueda combinando la información de las extracciones con los reportes generados,
lo que en muchas ocasiones es una buena estrategia. Pero cuando se tienen muchos datos
y las búsquedas se vuelven muy pesadas y después limpiar la búsqueda, entonces lo
apropiado sería un Data WareHouse.

DATA MART

El Data Mart es Un Datamart es una base de datos departamental, especializada en el


almacenamiento de los datos de un área de negocio específica. Se caracteriza por
disponer la estructura óptima de datos para analizar la información al detalle desde todas
las perspectivas que afecten a los procesos de dicho departamento. Un datamart puede
ser alimentado desde los datos de un datawarehouse, o integrar por si mismo un
compendio de distintas fuentes de información.

Por tanto, para crear el datamart de un área funcional de la empresa es preciso encontrar
la estructura óptima para el análisis de su información, estructura que puede estar
montada sobre una base de datos OLTP, como el propio datawarehouse, o sobre una base
de datos OLAP. La designación de una u otra dependerá de los datos, los requisitos y las
características específicas de cada departamento. De esta forma se pueden plantear dos
tipos de datamarts:

10
DATAMART OLAP

Se basan en los populares cubos OLAP, que se construyen agregando, según los requisitos
de cada área o departamento, las dimensiones y los indicadores necesarios de cada cubo
relacional. El modo de creación, explotación y mantenimiento de los cubos OLAP es muy
heterogéneo, en función de la herramienta final que se utilice.

DATAMART OLTP

Pueden basarse en un simple extracto del datawarehouse, no obstante, lo común es


introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las
operaciones más usuales) aprovechando las características particulares de cada área de la
empresa. Las estructuras más comunes en este sentido son las tablas report, que vienen a
ser fact-tables reducidas (que agregan las dimensiones oportunas), y las vistas
materializadas, que se construyen con la misma estructura que las anteriores, pero con el
objetivo de explotar la reescritura de queries (aunque sólo es posibles en algunos SGBD
avanzados, como Oracle).

Los datamarts que están dotados con estas estructuras óptimas de análisis presentan las
siguientes ventajas:

 Poco volumen de datos


 Mayor rapidez de consulta
 Consultas SQL y/o MDX sencillas
 Validación directa de la información
 Facilidad para la historización de los datos

RED PRIVADA VIRTUAL

Una RED se extiende sobre un área geográfica amplia, a veces un país o un continente;
contiene una colección de máquinas dedicadas a ejecutar programas de usuario
( aplicaciones ).

En los últimos años las redes se han convertido en un factor crítico para cualquier
organización. Cada vez en mayor medida, las redes transmiten información vital, por tanto
dichas redes cumplen con atributos tales como seguridad, fiabilidad, alcance geográfico y
efectividad en costos.

Se ha demostrado en la actualidad que las redes reducen en tiempo y dinero los gastos de
las empresas, eso ha significado una gran ventaja para las organizaciones sobre todo las

11
que cuentas con oficinas remotas a varios kilómetros de distancia, pero tambien es cierto
que estas redes remotas han despertado la curiosidad de algunas personas que se dedican
a atacar los servidores y las redes para obtener información confidencial. Por tal motivo la
seguridad de las redes es de suma importancia, es por eso que escuchamos hablar tanto
de los famosos firewalls y las VPN

Una persona que desee integrarse a una red, debe saber antes que es una VPN o con que
objetivo existe, a continuación se explicara su importancia.

Cuando deseo enlazar mis oficinas centrales con alguna sucursal u oficina remota tengo
tres opciones:

 Modem: Las desventajas es el costo de la llamada, ya que el costo de esta llamada


sería por minuto conectado, ademas sería una llamada de larga distancia, a parte
no contaría con la calidad y velocidad adecuadas.
 Línea Privada: Tendría que tender mi cable ya sea de cobre o fibra óptica de un
punto a otro, en esta opción el costo es muy elevado porque si por ejemplo
necesito enlazar mi oficina central con una sucursal que se encuentra a 200
Kilómetros de distancia el costo sería por la renta mensual por Kilómetro. Sin
importar el uso.
 VPN: Los costos son bajos porque solo realizo llamadas locales, ademas de tener la
posibilidad de que mis datos viajen encriptados y seguros, con una buena calidad y
velocidad.

Con la información recaudada podemos preguntarnos ahora ¿Qué es una VPN?

Es una red privada que se extiende, mediante un proceso de encapsulación y en su caso


de encriptación, de los paquetes de datos a distintos puntos remotos mediante el uso de
unas infraestructuras públicas de transporte.

Los paquetes de datos de la red privada viajan por medio de un "túnel" definido en la red
pública.  
Las redes privadas virtuales crean un túnel o conducto de un sitio a otro para transferir
datos a esto se le conoce como encapsulación además los paquetes van encriptados de
forma que los datos son ilegibles para los extraños.
El servidor busca mediante un ruteador la dirección IP del cliente VPN y en la red de
transito se envian los datos sin problemas.
La siguiente pregunta es ¿que necesito para implantar una red VPN?
Por lo general cuando se desea implantar una VPN hay que asegurarse que esta
proporcione: 

12
 Identificación de usuario
 Administración de direcciones
 Codificación de datos
 Administración de claves
 Soporte a protocolos múltiples
 Identificación de usuario

La VPN debe ser capaz de verificar la identidad de los usuarios y restringir el acceso a la


VPN a aquellos usuarios que no estén autorizados. Así mismo, debe
proporcionar registros estadísticos que muestren quien acceso, que información y cuando.
Administración de direcciones
La VPN debe establecer una dirección del cliente en la red privada y debe cerciorarse que
las direcciones privadas se conserven así.
Codificación de datos

Los datos que se van a transmitir a traves de la red pública deben ser previamente
encriptados para que no puedan ser leídos por clientes no autorizados de la red.
Administración de claves

La VPN debe generar y renovar las claves de codificación para el cliente y el servidor.
Soporte a protocolos multiples

La VPN debe ser capaz de manejar los protocolos comunes que se utilizan en la red
pública. Estos incluyen el protocolo de internet(IP), el intercambio de paquete de
internet(IPX) entre otros.
Herramientas de una VPN:
 VPN Gateway
 Software
 Firewall
 Router
 VPN Gateway
 Dispositivos con un software y hardware especial para proveer de capacidad a la
VPN 

13
Esta sobre una plataforma PC o Workstation, el software desempeña todas
las funciones de la VPN.
Ventajas de una VPN
Dentro de las ventajas más significativas podremos mencionar la integridad,
confidencialidad y seguridad de los datos.
 Reducción de costos.
 Sencilla de usar.
 Sencilla instalación del cliente en cualquier PC Windows.
 Control de Acceso basado en políticas de la organización 
 Herramientas de diagnostico remoto.
 Los algoritmos de compresión optimizan el tráfico del cliente.
 Evita el alto costo de las actualizaciones y mantenimiento a las PC´s remotas.

CONCLUSIONES

Podemos concluir que la Data Warehouse, Data Mart y VPN representan una gran
solución para las empresas en cuanto a seguridad, confidencialidad e integridad de los
datos y prácticamente se ha vuelto un tema importante en las organizaciones, debido a
que reduce significativamente el tiempo en la búsqueda de la información requerida y en
el caso de las VPN el costo de la transferencia de datos de un lugar a otro.

Es así que el Data Warehouse hace la vida de una organización más simple y ordenada
logrando así mayor eficiencia en los distintos campos de acción de la misma

Podríamos decir que como único inconveniente que pudieran tener las VPN es que
primero se deben establecer correctamente las políticas de seguridad y de acceso porque
si esto no está bien definido pueden existir consecuencias serias.

BIBLIOGRAFIA

1. [Link]
2. [Link]
3. [Link]

14
4. [Link]
5. [Link]
6. [Link]

15

También podría gustarte