Está en la página 1de 9

qwertyuiopasdfghjklzxcvbnmqw

ertyuiopasdfghjklzxcvbnmqwert
yuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopa
sdfghjklzxcvbnmqwertyuiopasdf
ghjklzxcvbnmqwertyuiopasdfghj
klzxcvbnmqwertyuiopasdfghjklz
xcvbnmqwertyuiopasdfghjklzxcv
bnmqwertyuiopasdfghjklzxcvbn
mqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwe
rtyuiopasdfghjklzxcvbnmqwerty
uiopasdfghjklzxcvbnmqwertyuio
pasdfghjklzxcvbnmqwertyuiopas
dfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmqwertyuiopasdfghjk



BUSINESS INTELLIGENCE

Datawarehouse

26/03/2014

Rodrigo Reyes



BUSINESS INTELLIGENCE.

Business Intelligence es la habilidad para transformar los datos en informacin, y
la informacin en conocimiento, de forma que se pueda optimizar el proceso de
toma de decisiones en los negocios.

Desde un punto de vista ms pragmtico, y asocindolo directamente con las
tecnologas de la informacin, podemos definir Business Intelligence como el
conjunto de metodologas, aplicaciones y tecnologas que permiten reunir, depurar
y transformar datos de los sistemas transaccionales e informacin desestructurada
(interna y externa a la compaa) en informacin estructurada, para su explotacin
directa (reporting, anlisis OLTP / OLAP, alertas...) o para su anlisis y conversin
en conocimiento, dando as soporte a la toma de decisiones sobre el negocio.

La inteligencia de negocio acta como un factor estratgico para una empresa u
organizacin, generando una potencial ventaja competitiva, que no es otra que
proporcionar informacin privilegiada para responder a los problemas de negocio:
entrada a nuevos mercados, promociones u ofertas de productos, eliminacin de
islas de informacin, control financiero, optimizacin de costes, planificacin de la
produccin, anlisis de perfiles de clientes, rentabilidad de un producto concreto,
etc...

Los sistemas y componentes del BI se diferencian de los sistemas operacionales
en que estn optimizados para preguntar y divulgar sobre datos. Esto significa
tpicamente que, en un datawarehouse, los datos estn des normalizados para
apoyar consultas de alto rendimiento, mientras que en los sistemas operacionales
suelen encontrarse normalizados para apoyar operaciones continuas de insercin,
modificacin y borrado de datos. En este sentido, los procesos ETL (extraccin,
transformacin y carga), que nutren los sistemas BI, tienen que traducir de uno o
varios sistemas operacionales normalizados e independientes a un nico sistema
desnormalizado, cuyos datos estn completamente integrados.


En definitiva, una solucin BI completa permite:
Observar qu est ocurriendo?, comprender por qu ocurre?, predecir qu
ocurrira?, colaborar qu debera hacer el equipo? y decidir qu camino se debe
seguir?


DATAWAREHOUSE.

Un Datawarehouse es una base de datos corporativa que se caracteriza por
integrar y depurar informacin de una o ms fuentes distintas, para luego
procesarla permitiendo su anlisis desde infinidad de perspectivas y con grandes
velocidades de respuesta. La creacin de un datawarehouse representa en la
mayora de las ocasiones el primer paso, desde el punto de vista tcnico, para
implantar una solucin completa y fiable de Business Intelligence.

La ventaja principal de este tipo de bases de datos radica en las estructuras en las
que se almacena la informacin (modelos de tablas en estrella, en copo de nieve,
cubos relacionales... etc.). Este tipo de persistencia de la informacin es
homognea y fiable, y permite la consulta y el tratamiento jerarquizado de la
misma (siempre en un entorno diferente a los sistemas operacionales). Un
datawarehouse se caracteriza por ser:

Integrado: los datos almacenados en el datawarehouse deben integrarse en
una estructura consistente, por lo que las inconsistencias existentes entre
los diversos sistemas operacionales deben ser eliminadas. La informacin
suele estructurarse tambin en distintos niveles de detalle para adecuarse a
las distintas necesidades de los usuarios.

Temtico: slo los datos necesarios para el proceso de generacin del
conocimiento del negocio se integran desde el entorno operacional. Los
datos se organizan por temas para facilitar su acceso y entendimiento por
parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes
pueden ser consolidados en una nica tabla del datawarehouse. De esta
forma, las peticiones de informacin sobre clientes sern ms fciles de
responder dado que toda la informacin reside en el mismo lugar.

Histrico: el tiempo es parte implcita de la informacin contenida en un
datawarehouse. En los sistemas operacionales, los datos siempre reflejan
el estado de la actividad del negocio en el momento presente. Por el
contrario, la informacin almacenada en el datawarehouse sirve, entre otras
cosas, para realizar anlisis de tendencias. Por lo tanto, el datawarehouse
se carga con los distintos valores que toma una variable en el tiempo para
permitir comparaciones.

No voltil: el almacn de informacin de un datawarehouse existe para ser
ledo, pero no modificado. La informacin es por tanto permanente,
significando la actualizacin del datawarehouse la incorporacin de los
ltimos valores que tomaron las distintas variables contenidas en l sin
ningn tipo de accin sobre lo que ya exista.

Otra caracterstica del datawarehouse es que contiene metadatos, es decir, datos
sobre los datos. Los metadatos permiten saber la procedencia de la informacin,
su periodicidad de refresco, su fiabilidad, forma de clculo... etc. Los metadatos
sern los que permiten simplificar y automatizar la obtencin de la informacin
desde los sistemas operacionales a los sistemas informacionales.

Para comprender ntegramente el concepto de datawarehouse, es importante
entender cul es el proceso de construccin del mismo, denominado ETL
(Extraccin: obtencin de informacin de las distintas fuentes tanto internas como
externas., transformacin: filtrado, limpieza, depuracin, homogeneizacin y
agrupacin de la informacin, carga: organizacin y actualizacin de los datos y
los metadatos en la base de datos.), a partir de los sistemas operaciones de una
compaa:

Una de las claves del xito en la construccin de un datawarehouse es el
desarrollo de forma gradual, seleccionando a un departamento usuario como piloto
y expandiendo progresivamente el almacn de datos a los dems usuarios. Por
ello es importante elegir este usuario inicial o piloto, siendo importante que sea un
departamento con pocos usuarios, en el que la necesidad de este tipo de sistemas
es muy alta y se pueda obtener y medir resultados a corto plazo.


DATAMART

Un Datamart es una base de datos departamental, especializada en el
almacenamiento de los datos de un rea de negocio especfica. Se caracteriza por
disponer la estructura ptima de datos para analizar la informacin al detalle
desde todas las perspectivas que afecten a los procesos de dicho departamento.
Un datamart puede ser alimentado desde los datos de un datawarehouse, o
integrar por s mismo un compendio de distintas fuentes de informacin.

Por tanto, para crear el datamart de un rea funcional de la empresa es preciso
encontrar la estructura ptima para el anlisis de su informacin, estructura que
puede estar montada sobre una base de datos OLTP, como el propio
datawarehouse, o sobre una base de datos OLAP. La designacin de una u otra
depender de los datos, los requisitos y las caractersticas especficas de cada
departamento.



OLAP - On-Line Analytical Processing

Los sistemas OLAP son bases de datos orientadas al procesamiento analtico.
Este anlisis suele implicar, generalmente, la lectura de grandes cantidades de
datos para llegar a extraer algn tipo de informacin til: tendencias de ventas,
patrones de comportamiento de los consumidores, elaboracin de informes
complejos etc.

El acceso a los datos suele ser de slo lectura. La accin ms comn es la
consulta, con muy pocas inserciones, actualizaciones o eliminaciones. Los datos
se estructuran segn las reas de negocio, y los formatos de los datos estn
integrados de manera uniforme en toda la organizacin, el historial de datos es a
largo plazo, normalmente de dos a cinco aos, las bases de datos OLAP se
suelen alimentar de informacin procedente de los sistemas operacionales
existentes, mediante un proceso de extraccin, transformacin y carga (ETL).

OLTP - On-Line Transactional Processing

Los sistemas OLTP son bases de datos orientadas al procesamiento de
transacciones. Una transaccin genera un proceso atmico (que debe ser validado
con un commit, o invalidado con un rollback), y que puede involucrar operaciones
de insercin, modificacin y borrado de datos. El proceso transaccional es tpico
de las bases de datos operacionales. El acceso a los datos est optimizado para
tareas frecuentes de lectura y escritura. (Por ejemplo, la enorme cantidad de
transacciones que tienen que soportar las BD de bancos o hipermercados
diariamente), los datos se estructuran segn el nivel aplicacin (programa de
gestin a medida, ERP o CRM implantado, sistema de informacin
departamental...), los formatos de los datos no son necesariamente uniformes en
los diferentes departamentos (es comn la falta de compatibilidad y la existencia
de islas de datos), el historial de datos suele limitarse a los datos actuales o
recientes.
DATAMINING

El datamining (minera de datos), es el conjunto de tcnicas y tecnologas que
permiten explorar grandes bases de datos, de manera automtica o
semiautomtica, con el objetivo de encontrar patrones repetitivos, tendencias o
reglas que expliquen el comportamiento de los datos en un determinado contexto.
Bsicamente, el datamining surge para intentar ayudar a comprender el contenido
de un repositorio de datos. Con este fin, hace uso de prcticas estadsticas y, en
algunos casos, de algoritmos de bsqueda prximos a la Inteligencia Artificial y a
las redes neuronales.

De forma general, los datos son la materia prima bruta. En el momento que el
usuario les atribuye algn significado especial pasan a convertirse en informacin.
Cuando los especialistas elaboran o encuentran un modelo, haciendo que la
interpretacin que surge entre la informacin y ese modelo represente un valor
agregado, entonces nos referimos al conocimiento. Aunque en datamining cada
caso concreto puede ser radicalmente distinto al anterior, el proceso comn a
todos ellos se suele componer de cuatro etapas principales.

Determinacin de los objetivos. Trata de la delimitacin de los objetivos que
el cliente desea bajo la orientacin del especialista en datamining.

Pre procesamiento de los datos. Se refiere a la seleccin, la limpieza, el
enriquecimiento, la reduccin y la transformacin de las bases de datos.
Esta etapa consume generalmente alrededor del setenta por ciento del
tiempo total de un proyecto de datamining.

Determinacin del modelo. Se comienza realizando unos anlisis
estadsticos de los datos, y despus se lleva a cabo una visualizacin
grfica de los mismos para tener una primera aproximacin. Segn los
objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse
algoritmos desarrollados en diferentes reas de la Inteligencia Artificial.

Anlisis de los resultados. Verifica si los resultados obtenidos son
coherentes y los coteja con los obtenidos por los anlisis estadsticos y de
visualizacin grfica. El cliente determina si son novedosos y si le aportan
un nuevo conocimiento que le permita considerar sus decisiones.

En resumen, el datamining se presenta como una tecnologa emergente, con
varias ventajas: por un lado, resulta un buen punto de encuentro entre los
investigadores y las personas de negocios; por otro, ahorra grandes cantidades de
dinero a una empresa y abre nuevas oportunidades de negocios. Adems, no hay
duda de que trabajar con esta tecnologa implica cuidar un sinnmero de detalles
debido a que el producto final involucra "toma de decisiones".


KPIs

Los KPI, Indicadores Clave de Desempeo, miden el nivel del desempeo de un
proceso, centrndose en el "cmo" e indicando el rendimiento de los procesos, de
forma que se pueda alcanzar el objetivo fijado.

Los indicadores clave de desempeo son mtricas financieras o no financieras,
utilizadas para cuantificar objetivos que reflejan el rendimiento de una
organizacin, y que generalmente se recogen en su plan estratgico. Estos
indicadores son utilizados en inteligencia de negocio para asistir o ayudar al
estado actual de un negocio a prescribir una lnea de accin futura.

El acto de monitorizar los indicadores clave de desempeo en tiempo real se
conoce como monitorizacin de actividad de negocio. Los indicadores de
rendimiento son frecuentemente utilizados para "valorar" actividades complicadas
de medir como los beneficios de desarrollos lderes, compromiso de empleados,
servicio o satisfaccin.

Los KPI suelen estar atados a la estrategia de la organizacin (ejemplificadas en
las tcnicas como la del cuadro de mando integral). Los KPI son "vehculos de
comunicacin"; permiten que los ejecutivos de alto nivel comuniquen la misin y
visin de la empresa a los niveles jerrquicos ms bajos, involucrando
directamente a todos los colaboradores en realizacin de los objetivos estratgicos
de la empresa. As los KPI tienen como objetivos principales: medir el nivel de
servicio, realizar un diagnstico de la situacin, comunicar e informar sobre la
situacin y los objetivos, motivar los equipos responsables del cumplimiento de los
objetivos reflejados en el KPI, progresar constantemente.

También podría gustarte