Está en la página 1de 5

Normalizar: la normalizacin es un proceso que se implementa para organizar

y garantizar la integridad y estructura de los datos. Su meta es eliminar datos


redundantes o duplicados en la base de datos y asegurar que las
dependencias tengan sentido. De esta manera, se hace ms fcil el
mantenimiento y la escalabilidad del sistema.
Desnormalizar : es un concepto que complementa a la normalizacin,
simplificando las bsquedas. Es el proceso de procurar optimizar el desempeo
de una base de datos por medio de agregar datos redundantes

Sin embargo, hay momentos donde normalizar no es lo ms apropiado, como


por ejemplo: Data Warehouse
Data warehause : es uno de varios modelos o escenarios donde el propsito
es proveer la informacin al usuario de la manera ms rpida posible, ya sea
para informes, estadsticas, mtricas, etc. En este modelo de base de datos, la
mejor opcin es desnormalizar. Otro propsito para desnormalizar es tener
datos histricos, en donde es necesario tener redundancia de datos
- Es un almacn de datos de muy fcil acceso, alimentando numerosas
fuentes, transformadas en grupos de informacin sobre temas
especficos del negocio, para permitir nuevas consultas, anlisis,
reportes ejecutivos y finalmente lo mas importante tomar decisiones

Procesos bsico del DW (ETL) :


Extraccin: este es el primer paso de obtener la informacin hacia el
ambiente del data warehouse
Transformacin : una vez la informacin es extraida hacia el rea de
trfico de datos, hay posibles paso de transformacin como ; limpieza de
informacin, tirar la basura que no nos sirve, seleccionar nicamente los
campos necesarios para el data warehouse, combinar fuente de datos,
hacindolas coincidir por los valores de las llaves, creando nuevas llaves
para cada registro de una dimensin
Carga : al final del proceso de transformacin, los datos estn en forma
para ser cargados
OLTP - On-Line Transactional Processing
Los sistemas OLTP son bases de datos orientadas al procesamiento de
transacciones. Una transaccin genera un proceso atmico (que debe ser
validado con un commit, o invalidado con un rollback), y que puede involucrar
operaciones de insercin, modificacin y borrado de datos. El proceso
transaccional es tpico de las bases de datos operacionales.
* El acceso a los daos est optimizado para tareas frecuentes de lectura y
escritura. (Por ejemplo, la enorme cantidad de transacciones que tienen que
soportar las BD de bancos o hipermercados diariamente).
* Los datos se estructuran segn el nivel aplicacin (programa de gestin
a medida, ERP o CRM implantado, sistema de informacin departamental...).
* Los formatos de los datos no son necesariamente uniformes en los
diferentes departamentos (es comn la falta de compatibilidad y la existencia
de islas de datos).
* El historial de datos suele limitarse a los datos actuales o recientes.

OLAP - On-Line Analytical Processing


Los sistemas OLAP son bases de datos orientadas al procesamiento analtico.
Este anlisis suele implicar, generalmente, la lectura de grandes cantidades de
datos para llegar a extraer algn tipo de informacin til: tendencias de ventas,
patrones de comportamiento de los consumidores, elaboracin de informes
complejos etc. Este sistema es tpico de los datamarts.
* El acceso a los datos suele ser de slo lectura. La accin ms comn es la
consulta, con muy pocas inserciones, actualizaciones o eliminaciones.
* Los datos se estructuran segn las reas de negocio, y los formatos de los
datos estn integrados de manera uniforme en toda la organizacin.
* El historial de datos es a largo plazo, normalmente de dos a cinco aos.
* Las bases de datos OLAP se suelen alimentar de informacin procedente de
los sistemas operacionales existentes, mediante un proceso de extraccin,
transformacin y carga (ETL).
Un Datamart : es una base de datos departamental, especializada en el
almacenamiento de los datos de un rea de negocio especfica. Se caracteriza
por disponer la estructura ptima de datos para analizar la informacin al
detalle desde todas las perspectivas que afecten a los procesos de dicho
departamento. Un datamart puede ser alimentado desde los datos de un
datawarehouse, o integrar por si mismo un compendio de distintas fuentes de
informacin.

Datamart OLAP
Se basan en los populares cubos OLAP, que se construyen agregando, segn
los requisitos de cada rea o departamento, las dimensiones y los indicadores
necesarios de cada cubo relacional. El modo de creacin, explotacin y
mantenimiento de los cubos OLAP es muy heterogneo, en funcin de la
herramienta final que se utilice.

Datamart OLTP
Pueden basarse en un simple extracto del datawarehouse, no obstante, lo
comn es introducir mejoras en su rendimiento (las agregaciones y los filtrados
suelen ser las operaciones ms usuales) aprovechando las caractersticas
particulares de cada rea de la empresa. Las estructuras ms comunes en este
sentido son las tablas report, que vienen a ser fact-tables reducidas (que
agregan las dimensiones oportunas), y las vistas materializadas, que se
construyen con la misma estructura que las anteriores, pero con el objetivo de
explotar la reescritura de queries (aunque slo es posibles en algunos SGBD
avanzados, como Oracle).
Cubo de datos
Los cubos OLAP son estructuras multidimensionales (cubos) que
permiten analizar bases de datos relacionales de gran volumen y variedad con
una gran agilidad y rapidez, reduciendo enormemente el tiempo y los recursos
empleados en el anlisis.

Existen distintos sistemas OLAP diferenciados entre s, bsicamente, por los


tipos de bases de datos sobre los que se construyen y que dan lugar, entre
otras y principalmente, a las siguientes categoras o sistemas:

Sistemas ROLAP: construidos sobre bases de datos relacionales que


emplean, principalmente, esquemas de copo de nieve o de estrella. Es
un sistema apto para analizar grandes volmenes de datos.

Sistemas MOLAP: en esta ocasin las bases de datos sobre las que
trabaja el motor OLAP son de tipo multidimensional. Presenta algunas
ventajas frente al modelo anterior, como la mejora de la rapidez en el
almacenamiento de datos, la optimizacin del rendimiento de la memoria
cach, o la eficiencia en la extraccin de datos (debido a la necesidad de
que estos estn previamente tratados o preestructurados); sin embargo,
tambin presenta algunas desventajas, entre otras el riesgo de
duplicidad en los datos analizados (especialmente cuando se trabaja con
cierto nmero de dimensiones), o la complejidad del proceso de carga
de los datos en las bases debido a lo que comentbamos hace un
momento (estos deben ser tratados o preestructurados en el momento
de cargarlos).

Sistemas HOLAP: combinan los sistemas ROLAP (relacionales) con los


MOLAP (multidimensionales). Se recomienda almacenar los datos ms
recientes en MOLAP para mejorar la rapidez de los anlisis, y los ms
antiguos o de menor uso en ROLAP, dada la facilidad que presenta para
su almacenamiento
Dll
Kimball
Hefesto
Hechos
Copo de nieve
Estrella

También podría gustarte