Está en la página 1de 8

1. BODEGA DE DATOS.

Una bodega de datos (Bodega de datos, DataWareHouse), es el sistema de información central de


datos orientado al dominio, no volátil, integrado y variante en el tiempo, procedente de diversos
sistemas de información que generan la materia prima a granel (SAP, CRM, ERP, OLTP).
La información en la bodega de datos sirve para realizar minería de datos (Data mining), utilizando
herramientas de procesamiento analítico en línea y análisis multidimensional (OLAP) y Sistemas
para el apoyo en la toma de decisiones (DSS).
Los almacenes de datos pueden estar conformados por centros de acopios intermedios o data marts
que se especializan en un área de la organización y son sistemas orientados a la consulta.
Una bodega de datos debe ser:
• Temático: Los datos se almacenan por su naturaleza (área, tema, dependencia, etc.) para facilitar
su entendimiento por parte de los usuarios finales.
• Integrado: Todas las dependencias de la organización envían su información en diferente nivel de
detalle, pero de forma tal que es altamente consistente.
• No volátil: La información es permanente, solo se realizan dos tipos de operaciones: Carga de los
objetos (información) y su consulta.
• Histórico: Está conformado por una serie de instantáneas de la situación de la organización para
realizar una línea base para el análisis y la realización de perfiles, comportamientos y predicciones
con respecto a la información almacenada.

2. ARQUITECTURA FUNCIONAL DE UN ALMACEN DE


DATOS

Herramientas de Minería de Datos: Ayudan a extraer información a partir de patrones, la


herramienta más común utilizada en la minería de datos es el proceso denominado Descubrimiento
de Conocimiento en Bases de datos (KDD).
Los cubos OLAP - ROLAP - MOLAP: Son cubos multidimensionales, y dependiendo del tipo de
almacenamiento de datos se pueden clasificar en ROLAP si sus datos son almacenados en un motor
relacional, o MOLAP en el caso en que se almacene en una base de datos multidimensional.

Operaciones de construcción de Cubos: Aquí se integran los datos del nivel OLTP y el nivel
OLAP, a nivel funcional se denomina ODS (OPERATIONAL DATA STORE) o Almacén Operacional
De Datos, el cual representa el contenedor de datos activos que ayudan al soporte de toma de
decisiones y a la operación.

Operaciones con Herramientas ETL OLAP: Aquí se encuentran las herramientas para la
realización de operaciones ETL y a nivel funcional constituyen la STAGING AREA (área temporal de
procesos) que corresponde a un área de almacenamiento que permite temporalmente la extracción,
transformación, limpieza y mapeo de los datos a cargar en la bodega de datos

Repositorio de Datos OLTP: Es el nivel inferior de la pirámide y corresponde a las bases de datos
de la organización con estructura orientada a las transacciones. Aquí se encuentran todos los datos
con los que se va a trabajar.

3. MINERÍA DE DATOS (DATA MINING)

Es un proceso de descubrimiento y análisis de relación de patrones y tendencias en grandes


volúmenes de datos para la generación de conocimiento.

Los sistemas de base de datos dan soporte a los procesos básicos de la organización, una vez
realizada esta labor la organización requiere información más allá de lo que ofrecen los reportes; de
esta necesidad, surgen herramientas para la toma de decisiones (DSS Decision Support
System), tales como: EIS, OLAP y otras herramientas de la minería de datos.
Las Herramientas OLAP (On Line Analytical Processing) actúan sobre sistemas de información
(transaccional o bodega de datos), permitiendo hacer agregaciones y combinaciones de datos
complejos para realizar análisis estratégico, basados en sistemas o interfaces multidimensionales
de forma matricial, permitiendo facilidades para manejar y transformar los datos que producen otros
datos (metadatos).

Las herramientas de minería de datos permiten extraer patrones, tendencias para predecir
comportamientos futuros.

4. ARQUITECTURA DE UNA BASE DE DATOS EN


INTELIGENCIA DE NEGOCIOS
4.1. Datos operacionales
Son los datos primitivos de los sistemas de información que son creados y actualizados
transaccionalmente.

4.2. Bodega de datos o DWH


Almacenan los datos primitivos cargados en el DWH con un mediano o alto grado de resumen para
generar datos derivados y apoyar la toma de decisiones.

4.3. Nivel departamental (Data Marts)


Tienen datos primitivos con un mediano grado de resumen, procedentes de sistemas de información
y fuentes de información. En los Data Marts: los usuarios son limitados (servidores dedicados), están
asignados a un área específica del negocio, tienen un propósito, y una función de apoyo a la
organización.

4.4. Nivel individual


Contienen pocos datos y son generados mediante algoritmos Heurísticos, procesos estadísticos de
la información de los almacenes de datos para la toma de decisiones (Regresiones, series
temporales, análisis discriminantes, métodos bayesianos, algoritmos genéticos, arboles de decisión y
redes neuronales en otros), realización de perfiles, comportamientos y predicciones.

La diferencia entre la arquitectura de una bodega de datos y una base de datos OLTP estándar, es
que en una estructura de bodega de datos las tablas están desnormalizadas entre variables y
dimensiones. Un sistema OLTP debe dar una respuesta a cada pregunta con respeto al
funcionamiento de la empresa.

4.5. Cubos Multidimencionales OLAP


Las herramientas especializadas como hojas de cálculos dinámicas, tablas dinámicas son utilizadas
para consultar un cubo permitiendo al usuario realizar operaciones (cruces, filtrados, organización,
totales), de forma más fácil.

4.5.1. Dimensiones
Un cubo está conformado por dimensiones que son atributos relativos a las variables, son las
perspectivas de análisis de las variables que forman parte de las dimensiones y son necesarias para
la presentación de los datos a los usuarios para cada uno de los registros de la tabla de hechos.

4.5.2. Modelos utilizados para construcción


* Esquema estrella (Star schema)
El Esquema de estrella es la arquitectura más simple en una bodega de datos, consiste en una tabla
de Variables (Hechos) rodeada por Dimensiones para poder utilizarla con una herramienta de
consultas OLAP.
La llave primaria de una tabla de hechos es el conjunto de atributos primos que corresponden a las
dimensiones.
* Esquema en copos de nieve (bola de nieve)
Las tablas de dimensiones representan las relaciones normalizadas (3NF) y forman parte de un
modelo relacional de base de datos.
El uso más común del esquema en bola de nieve es cuando las tablas de dimensiones son muy
grandes o complejas y es dependiente de otra dimensión y no de la tabla de hecho como tal.
* Esquema de constelación de hechos (fact constellation
schema)
Un modelo tipo constelación se realiza cuando existe más de una tabla de hecho y estas pueden
compartir sus dimensiones entre sí.
5. INTELIGENCIA DE NEGOCIOS.
Inteligencia de negocios o BI (del inglés business intelligence) es el conjunto de estrategias y
herramientas para la administración y creación de conocimiento mediante el análisis de la
información de una organización para facilitar la toma de decisiones empresariales, predicciones y
perfiles futuras.

En 1958 Hans Peter Luhn habla por primera vez sobre inteligencia de negocios, entendida como la
interrelación de hechos orientados al desarrollo de una meta. Anteriormente las empresas generaban
datos y con mucho esfuerzo generaban conocimientos sobre estos, debido a que no contaban con
recursos computacionales, dificultando el análisis de los datos por la carencia de herramientas que
permitieran la toma de decisiones a largo plazo y las decisiones a corto plazo se toman por intuición.

La inteligencia de negocios permite la toma de decisión en los niveles estratégicos, tácticos u


operativos, extrayendo datos para analizarlos, generar reportes y realizar análisis cruzados por
medio del análisis multidimensional.

Howard Dresner en 1985, puso el acrónimo de BI (Business Intelligence), como el conjunto de


métodos, herramientas y procedimientos para la toma de decisiones, basados en hechos.

En la actualidad BI, incluye una amplia gama de metodologías, aplicaciones y tecnologías, que
permiten extraer de diversas fuentes, plataformas y estructuras para transformarlas y analizarlas:
datos, transacciones e información son convertidas en conocimientos para soporte en la toma de
decisiones.

5.1. La implementación de un esquema de BI permite:


• Información correcta en el momento adecuado, almacenada en un único lugar y disponible en
tiempo real.
• Evaluación de distintos escenarios que permiten analizar situaciones que puedan afectar al
negocio.
• La información va mas allá de los reportes, incluyendo indicadores que me permitan medir el
desempeño del negocio.
• Permite agrupar información de diferentes áreas para establecer, modificar y ajustar políticas,
procesos y procedimientos.
• Gran capacidad de reacción ante amenaza y vulnerabilidades del negocio, actuando o
anticipándose a éstos.
• Capacidad de retroalimentación con respecto a hechos sucedidos para reevaluar políticas y
objetivos del negocio.

5.2. Selección de Indicadores:


Para generar el concepto de BI es importante entender cuál es el flujo de información en la empresa
y cuáles son los procesos involucrados en el requerimiento de información. Por eso es necesario
preguntarse:
• ¿Qué información se necesita?
• ¿Para qué se quiere la información?
• ¿A quien va dirigida la información?
5.3. ciclo:
5.4. Las 4 P de BI:
• PLAN: curso de acción conscientemente determinado
• POSICIÓN: un medio para ubicar a la organización (nicho, rentas, dominio)
• PATRÓN: es un modelo que implica consistencia
• PERSPECTIVA: una manera particular de percibir el mundo (concepto, cultura, ideología)

También podría gustarte