Está en la página 1de 4

SQL Server - Analysis Services

 
Página 1 de 3 

Resulta un hecho innegable que, en los últimos tiempos, el volumen de


datos que las organizaciones deben manejar ha aumentado
desmesuradamente. Analizar tal cantidad de datos, con el objetivo de
tomar decisiones estratégicas se ha convertido en un auténtico
problema. En el presente artículo realizaremos una introducción a los
cubos de datos en SQL Server 2008 Analysis Services, una potente
herramienta con la que podemos transformar ingentes cantidades de
datos en información de utilidad.
La masificación de datos en los sistemas de información de una
compañía, sin la adecuada organización ni estructuración, puede
acarrear efectos negativos tales como lentitud en el análisis de su
estado, o lo que es peor, la toma de decisiones estratégicas
inadecuadas, ya que el hecho de disponer de millones de registros
repartidos en múltiples orígenes de datos heterogéneos (bases de datos
SQL Server, Access, archivos de texto plano, Excel, etc.), no tiene por
qué ser en todos los casos sinónimo de un sistema que proporcione
información de calidad.
Para solventar este tipo de problemas, en SQL Server contamos, desde
hace ya algunas versiones, con los Servicios de Análisis (SQL Server
Analysis Services o SSAS) o herramientas de Inteligencia de Negocio
(Business Intelligence o BI), cuyo exponente principal, el cubo de datos,
permite generar información para analizar el estado de la empresa a
partir del conjunto de sus fuentes de datos.
 
Aspectos conceptuales
Desde una perspectiva conceptual, un cubo de datos es una pieza más
en el engranaje de un sistema de información denominado almacén de
datos (data warehouse). El cubo está dotado de una maquinaria interna
que le permite procesar elevados volúmenes de datos en un periodo
relativamente corto de tiempo, y cuyo objetivo es siempre la obtención
de un resultado numérico (importes de ventas, gastos, cantidad de
productos vendidos, etc.). Estos resultados pueden cambiar en función
de uno o varios filtros que apliquemos sobre el cubo. El tiempo de
respuesta es mínimo gracias a que el motor de procesamiento del cubo
realiza un cálculo previo de las posibles combinaciones de resultados
que el usuario puede solicitar. A los diferentes resultados numéricos
obtenidos se les denomina medidas, mientras que los elementos
utilizados para organizar/filtrar la información reciben el nombre
de dimensiones.
Representado gráficamente, un cubo de datos se mostraría como la
forma geométrica de la cual toma su nombre, particionado horizontal y
verticalmente en una serie de divisiones que dan lugar a múltiples
celdas o casillas, las cuales identifican cada uno de los posibles
resultados de las medidas, obtenidos por la intersección en cada celda
de las dimensiones que conforman el cubo. La siguiente figura muestra
dicha representación gráfica de un cubo, con información de ventas por
productos, empleados y monedas. En los lados del cubo se sitúan las
dimensiones, cuyo cruce produce los resultados numéricos en las celdas.

Observando la figura anterior, el lector puede pensar que el número de


dimensiones en un cubo está limitado a las que podemos representar a
través de dicha forma geométrica. Nada más lejos de la realidad, ya que
un cubo puede soportar una elevada cantidad de dimensiones, que
permiten cubrir sobradamente los requisitos de la información a
obtener.
Elementos principales en un almacén de datos
Como hemos mencionado anteriormente, un cubo de datos es una de las
piezas de una arquitectura más compleja: el almacén de datos, en cuyo
proceso de creación están involucrados diversos componentes, que
serán los encargados de tomar el dato original en bruto y pulirlo hasta
convertirlo en información lista para su análisis. A continuación, vemos
un diagrama con las fases de este proceso de transformación.
Descrito este proceso a grandes rasgos, en primer lugar, se realiza una
operación de extracción, transformación y carga (Extract, Transform &
Load o ETL) desde las fuentes de datos origen, situadas en el área
operacional, a una base de datos que se encuentra en el área de
integración, utilizando para ello paquetes de los Servicios de Integración
(SQL Server Integration Services o SSIS), los cuales realizarán también
tareas de depuración de datos.
A continuación, pasaríamos a la fase de construcción del cubo, que
desarrollaremos utilizando las herramientas de los servicios de análisis
(SSAS). Finalmente, llegaremos a la fase de acceso a los cubos por parte
de los usuarios finales, para lo que existen diversos productos tales
como Reporting Services (SSRS), Excel, etc.
 
Elementos físicos. Tablas de hechos y dimensiones
A nivel físico, para construir un cubo de datos necesitamos una base de
datos que contenga una tabla denominada tabla de hechos, cuya
estructura estará formada por una serie de campos,
denominados campos de medida, a partir de los cuales obtendremos los
resultados numéricos del cubo; y por otro lado, un conjunto de campos,
denominados campos de dimensión, que utilizaremos para unir con las
tablas de dimensiones, a fin de poder obtener resultados filtrados por las
diversas dimensiones de que conste el cubo.
El otro pilar fundamental para la creación de un cubo lo componen
las tablas de dimensiones. Para cada dimensión o categoría de
consulta/filtro que incorporemos a nuestro cubo necesitaremos una
tabla, que uniremos con la tabla de hechos por un campo clave. Esta
tabla de dimensiones actuará como catálogo de valores, también
denominados atributos, que usaremos de forma independiente o
combinados con otras dimensiones, para obtener resultados con un
mayor grado de precisión.

También podría gustarte