Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Filial: Ayacucho
ACTIVIDAD Nª01
Data warehouse
Aunque su nombre provenga de la palabra almacén, sus labores van más allá del
almacenamiento, como ya hemos explicado. Es un sistema que se aloja en el servidor
de una compañía o en la nube y que recopila datos sobre las OLTP (Procesamiento de
Transacciones En Línea) y varias fuentes más de información para su posterior
selección y extracción de cara a un uso con fines analíticos.
Una arquitectura que se divide en 3 estructuras: básica, básica con zona de ensayo y
básica con zona de ensayo y con data marts. La primera proporciona datos brutos
junto con metadatos para facilitar su acceso; la segunda ofrece la posibilidad de
limpiar la información en función de la utilidad que se le vaya a dar; y la tercera ofrece
soluciones para diferentes líneas de negocio (inventario, ventas, compras, etc.).
Las Data Marts pueden ser dependientes o independientes del Data Warehouse.
Data mart Independiente: se crea a partir de fuentes externas, sin recurrir al Data
Warehouse central.
Data mart Hibrido: permite combinar las ventajas de los dos modelos anteriores,
integrando datos provenientes de un Data Warehouse central con otras fuentes
externas.
OLTP
Este sistema optimiza el acceso a los datos, facilitando las tareas de lectura, escritura
y análisis que se llevan a cabo de manera frecuente. Los procedimientos OLTP
estructuran estos datos según su nivel de aplicación (programa de gestión a medida,
CRM o ERP implantado…), además, no tienen por qué mantenerse uniformes en los
diferentes departamentos por la común falta de compatibilidad. Por último, se
caracterizan porque el historial de datos queda limitado a la actualidad o a los más
recientes.
OLAP
Las aplicaciones de OLTP se suelen utilizar para almacenar nuevos datos o actualizar
los ya existentes, y en sistemas con numerosos usuarios, con consultas y
actualizaciones frecuentes y que requieren tiempo de respuesta rápidos. Por ejemplo,
para administrar pagos recibidos de los clientes, de los proveedores, solicitud de
pedidos, movimientos en el inventario.
Para funcionar, las aplicaciones OLAP utilizan un tipo de base de datos que posee la
peculiaridad de ser multidimensional, denominada comúnmente Cubo OLAP.
Básicamente, el Cubo OLAP, que acuña su nombre por su característica
multidimensional, es una base de datos que posee diversas dimensiones, ampliando
las posibilidades que hasta el momento ofrecían las conocidas hojas de cálculo.
Hasta la llegada del término Cubo OLAP, que nació de la mano de Edgar F. Codd, de
la compañía EF Codd & Associates, sólo se utilizaban bases de datos relacionales
para el proceso de la información, con sistemas tales como el ROLAP.
Dimensiones terminología
Las dimensiones son los ejes de análisis que pondrán manipular los usuarios para
interrogarlas cifras:
Diseñar las jerarquías adecuadas y útiles permitirá al motor preparar los valores
agregados pertinentes.
Fact table
medidas