Está en la página 1de 4

�Qu� es un Data WareHouse?. . . .

Viene del Ingl�s Data = datos y WareHouse = almac�n, por eso, una data warehouse
es un almac�n de datos. Esta palabra se utiliza para hablar de un almac�n de datos
dise�ado para permitir las actividades de inteligencia de un negocio. En definitiva
sirve para ayudar analizar los datos recopilados por la empresa con el fin de
mejorar su rendimiento.

Un Data Warehouse o Almac�n de Datos, es una gran base de datos, normalmente


medida en gigabytes (miles de millones de caracteres) o terabytes (billones de
letras), que recoge informaci�n de m�ltiples fuentes, y que su actividad se centra
en la Toma de Decisiones, es decir, en el an�lisis de la informaci�n, en vez de su
captura.

Todo el mundo sabe hoy en d�a que la informaci�n es un potente activo del que se
pueden obtener importantes beneficios y ventajas competitivas para cualquier
organizaci�n. De hecho las empresas valoran los datos como un activo m�s de la
empresa. Estos datos pueden darnos informaci�n acerca de clientes, competidores,
etc. De ah� nacen las datas warehouses.

Los datos pueden provenir de los sistemas desarrollados internamente por la


empresa, de las aplicaciones compradas, o de los datos comprados a otras empresas o
fuentes de datos. Estos datos ayudan a los analistas para tomar decisiones en una
organizaci�n.

Es importante que la empresa cuente con un �nico DataWarehouse. As�, los miembros
de la organizaci�n podr�n acceder a una misma fuente de informaci�n organizada
seg�n convenciones determinadas por el management.

El t�rmino "Data WareHouse" fue acu�ado por primera vez por Bill Inmon en 1990.
De acuerdo con Inmon, una data warehouse es un conjunto de datos estructurados
orientados por temas, integrados, variables con el tiempo, y no vol�tiles empleados
para tomar decisiones.

- Orientados por temas: Colecci�n de informaci�n relacionada organizada alrededor


de un tema central. Cuando se habla de datawarehouse se hace referencia a un
sistema que esta organizado en base a temas o asignaturas especiales, que permite
entonces que los datos y la informaci�n de mismo tipo quede siempre conectada.
Ejemplos de temas pueden ser clientes, productos, campa�as, etc.

- Integrados: los datos se obtienen de fuentes diferentes, por ejemplo de los


diferentes departamentos de una organizaci�n, pero se deben aplicar t�cnicas de
integraci�n (agrupaci�n) de los datos. Los datos se organizan por temas para
facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo,
todos los datos sobre clientes pueden ser consolidados en una �nica tabla del
datawarehouse. De esta forma, las peticiones de informaci�n sobre clientes ser�n
m�s f�ciles de responder dado que toda la informaci�n reside en el mismo lugar.

- No vol�tiles: quiere decir que los datos no van a cambiar con el tiempo una vez
que se encuentran en el almac�n. El almac�n de informaci�n de un datawarehouse
existe para ser le�do, pero no modificado. La informaci�n ni se modifica ni se
elimina.

- Variables con el Tiempo: Los cambios producidos en los datos a lo largo del
tiempo quedan registrados para que los informes que se puedan generar reflejen esas
variaciones.
Otras formas que podemos encontrar de llamar a las data warehouse pueden ser: dw,
data wharehouse, data warhouse o simplemente almac�n de datos. Data Warehousing, es
el proceso que facilita la creaci�n y explotaci�n de un Data Warehouse.

Adem�s de una base de datos, en una data warehouse, se incluyen herramientas de


extracci�n, transporte, transformaci�n y carga de los datos (ETL), un procesamiento
anal�tico en l�nea (OLAP) para analizarlos, herramientas de an�lisis de clientes, y
otras aplicaciones que gestionan el proceso de recopilaci�n de datos y la entrega a
los usuarios como el data mining. Luego veremos algunas de estas aplicaciones.

Para Qu� Sirve una Data WareHouse


- Para tener un mayor conocimiento del negocio

- Para tomar mejores decisiones y en un tiempo menor.

- Para mejorar y ser m�s efectivos.

- Para no perder distancia con la competencia.

- En definitiva para aumentar los ingresos.

Las data warehouse son la base para los sistemas de gesti�n de relaciones con los
clientes, ya que pueden ser utilizados para la consolidaci�n de los datos del
cliente y la identificaci�n de �reas de satisfacci�n y/o frustraci�n del cliente.

Tambi�n se utilizan para la detecci�n de fraudes, an�lisis de reposicionamiento de


producto, el descubrimiento de centros de beneficio y gesti�n de activos
corporativos.

Veamos m�s casos concretos con ejemplos:

Para los minoristas, un almac�n de datos o data warehouse puede ayudar a


identificar las caracter�sticas demogr�ficas de los clientes, identificar los
patrones de compra y mejorar las respuestas de correo directo.

Para los bancos, puede ayudar en la detecci�n de fraude de tarjetas de cr�dito,


ayudar a identificar a los clientes m�s rentables, y poner de relieve los clientes
m�s fieles.

Las empresas de telecomunicaciones la utilizan para predecir qu� clientes tienen


m�s probabilidades de cambiar de compa��a y luego aplicarles incentivos especiales
para quedarse.

Las compa��as de seguros la utilizan para el an�lisis de las reclamaciones para


ver qu� procedimientos se reivindican y para identificar patrones de los clientes
de riesgo.

Los fabricantes pueden utilizarla para comparar los costos de cada una de sus
l�neas de productos en los �ltimos a�os, a determinar qu� factores producen
incrementos y ver qu� efecto tuvieron estos aumentos en los m�rgenes globales.

Ahora vamos hacer un breve recorrido por esas otras herramientas que toda data
warehouse debe tener. La mayor�a de los data warehouse tiene la siguiente
arquitectura:
Expliquemos los pasos ETL y de an�lisis.

Data Warehouse ETL

El proceso de extracci�n de datos de los sistemas de origen y ponerla en la data


warehouse se denomina com�nmente ETL.

ETL (Extract, Transform and Load) es un proceso responsable de la extracci�n de


datos de los sistemas de origen y de colocarlo en un almac�n de datos o data
warehouse. ETL implica las siguientes tareas:

Extracci�n de datos: Es lo primero que hace una herramienta ETL. Se trata de


obtener la informaci�n de las distintas fuentes de origen, tanto internas como
externas. Durante la extracci�n, se identifica los datos deseados y se extrae de
muchas fuentes diferentes, incluyendo los sistemas de bases de datos y
aplicaciones. Despu�s de la extracci�n de datos, tienen que ser transportados
f�sicamente al sistema de destino o a un sistema intermedio para su posterior
procesamiento y/o transformaci�n.

Transformaci�n: es el filtrado, limpieza, depuraci�n, homogeneizaci�n y agrupaci�n


de la informaci�n. Incluye la agrupaci�n de los datos de las diferentes fuentes.
La transformaci�n se produce mediante el uso de reglas o tablas de consulta o
mediante la combinaci�n de los datos con otros datos.

Carga: es el proceso de escribir los datos en la date warehouse. La fase de carga


es el momento en el cual los datos de la fase anterior (transformaci�n) son
cargados en el sistema de destino.

Dise�ar y mantener el proceso de ETL es a menudo considerada como una de las


partes m�s dif�ciles y que requieren m�s recursos de un proyecto de data warehouse.
La mayor�a de los programas de data warehouse utilizan herramientas ETL para
gestionar este proceso. El software ETL extrae datos, transforma los valores de los
datos inconsistentes, limpia los datos "malos", filtra los datos y carga los datos
en una data warehouse de destino.

Algunas de estas herramientas m�s utilizadas son:

-Oracle Warehouse Builder


-IBM Websphere DataStage
- Microsoft SQL Server Integration Services (SSIS)

Ya tenemos los datos correctamente, Ahora es el momento de analizarlos.

OLAP Data Warehouse

OLAP = On-Line Analytical Processing = Procesamiento anal�tico en l�nea. Es el


m�todo m�s utilizado para analizar y evaluar los datos de la data warehouse en
l�nea. Permite a los gerentes y analistas obtener una idea de la informaci�n . Para
analizar los datos se utilizan un conjunto de operaciones. Estas operaciones se
realizan mucho m�s f�cilmente con software o programas OLAP, que suelen incluir los
programas data warehouse. Para los programas OLAP un tiempo de respuesta es una
medida de su eficacia.

OLAP permite al usuario extraer y ver con facilidad y de forma selectiva los datos
desde diferentes puntos de vista.

Un ejemplo, un usuario puede solicitar que se analizaron los datos para mostrar
una hoja de c�lculo que muestra todos los productos una pelota de playa de una
empresa que se venden en Madrid en el mes de julio, comparar las cifras de ingresos
con los de los mismos productos en septiembre y luego ver una comparaci�n de otras
ventas de productos en Madrid en el mismo per�odo de tiempo.

Data Mining

Data Mining significa "miner�a del datos". En general, el data mining (a veces
descubrimiento de conocimiento) es el proceso de analizar los datos desde
diferentes perspectivas y resumirlos en informaci�n �til; informaci�n que puede ser
utilizada para aumentar los ingresos, reducir los costes, o ambos. El data mining
descubre patrones ocultos en los datos.

T�cnicamente, el datamining es el proceso de encontrar correlaciones entre los


patrones o de los campos en grandes bases de datos como en los de una data
warehouse.

Un ejemplo:
Una cadena de supermercados utiliza la capacidad de extracci�n de datos de Oracle
software para analizar los patrones de compra locales. Descubrieron que cuando los
hombres compran pa�ales los jueves y los s�bados, tambi�n tend�an a comprar
cerveza. Un an�lisis m�s detallado mostr� que estos compradores normalmente
hicieron su compra semanal los s�bados. Los jueves, sin embargo, s�lo han comprado
algunos art�culos. El minorista lleg� a la conclusi�n de que deber�a comprar
cerveza para tenerla disponible para el pr�ximo fin de semana. La cadena de
supermercados podr�a utilizar esta informaci�n recientemente descubierta de
diversas maneras para aumentar los ingresos. Por ejemplo, podr�an mover la
estanter�a de la cerveza m�s cerca de la de los pa�ales y los jueves no har�an
ninguna oferta para pa�ales y cerveza.

Diferencia entre OLAP y Data Mining

OLAP y Data Mining se utilizan para resolver diferentes tipos de problemas


anal�ticos.

Con OLAP se resumen los datos y se hacen pron�sticos. Por ejemplo, responde a
cuestiones operativas como "�Cu�l es el promedio de ventas de autom�viles, por
regi�n y por a�o?".

Data Mining descubre patrones ocultos en los datos y opera a un nivel detallado en
lugar de un nivel de resumen. Por ejemplo, en una industria de las
telecomunicaciones, donde la p�rdida de clientes es un factor clave, la miner�a de
datos podr�a responder a preguntas como: "�Qui�n es probable que cambie los
proveedores de servicios y cu�les son las razones para que cambien?"

También podría gustarte