Está en la página 1de 17

Episodio 1

“Minería de Datos con Weka”

Introducción
Introducción a Bodega deDatos
Bodega de Datos
Ing. Alan Rodriguez Lopez
Bodega de Datos o Data Warehouse

Es donde se almacena
toda la información
obtenida de las diferentes
fuentes de información
de una empresa.
Bodega de Datos

Surgieron por dos razones:


Primero, la necesidad de proporcionar una fuente única de datos
limpia y consistente para propósitos de apoyo para la toma de
decisiones; segundo, la necesidad de hacerlo sin afectar a los
sistemas operacionales.
Importancia de la Bodega de Datos

Es uno de los elementos mas importante, ya


que es donde se concentran todos los datos
con un diseño especial para explotar la
información.
Composición

Se componen por fragmentos derivados del


Data Warehouse conocidos como Datamarts.
DATAMARTS

Esta herramienta se ocupa de almacenar


información de un departamento o grupo de
trabajo específico.
Modelo Básicos

A la hora de modelar el Data Mart o Data


Warehouse, se tiene los siguientes modelos
básicos:

• Modelo Estrella (Star)


• Modelo de Copo de Nieve
(Snowflake)
Modelo Estrella (Star)

Una tabla central, la tabla de hechos rodeada


de tablas de dimensión.
Modelo Copo de Nieve (SnowFlake)
Una tabla central rodeada de varias dimensiones, y dichas
dimensiones están partidas en diferentes tablas.
¿Para que?

Para Explotar la Información con diferentes propósitos.


• Generación de reportes
• Análisis de Información
• Minería de Datos
Arquitectura de Bodega de Datos
Arquitectura de Bodega de Datos
Análisis OLAP

OLAP ( On-Line Analytical Processing) Procesamiento analítico en


línea. Es el método más utilizado para analizar y evaluar los datos
de la Data Warehouse en línea.
Análisis OLAP
Un ejemplo, un usuario puede solicitar que se analizaron los datos para mostrar una hoja
de cálculo que muestra todos los productos una pelota de playa de una empresa que se
venden en Montero en el mes de julio, comparar las cifras de ingresos con los de los
mismos productos en septiembre y luego ver una comparación de otras ventas de
productos en Montero en el mismo período de tiempo.
Minería de Datos
Data Mining significa “Minería del Datos". Es el proceso de analizar los datos
desde diferentes perspectivas y resumirlos en información útil; información que
puede ser utilizada para aumentar los ingresos, reducir los costes, o ambos. El
Data Mining descubre patrones ocultos en los datos.
Diferencia entre OLAP y Data Mining

OLAP y Data Mining se utilizan para resolver diferentes tipos de


problemas analíticos.

Con OLAP se resumen los datos y se hacen pronósticos. Por


ejemplo, responde a cuestiones operativas como "¿Cuál es el
promedio de ventas de automóviles, por región y por año?".

Data Mining descubre patrones ocultos en los datos y opera a un


nivel detallado en lugar de un nivel de resumen. Por ejemplo, en
una industria de las telecomunicaciones, donde la pérdida de
clientes es un factor clave, la minería de datos podría responder a
preguntas como: "¿Quién es probable que cambie los proveedores
de servicios y cuáles son las razones para que cambien?"
ARL | UAGRM

También podría gustarte