Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Dado que estos almacenamientos son de menor tamaño, son fáciles de crear,
mantener y son más flexibles. Su objetivo es proporcionar al usuario empresarial los
datos más relevantes en el menor tiempo posible. Esto evita que el usuario tenga que
esperar más tiempo para que se completen las consultas. También facilitan la síntesis
de datos. Los almacenes de datos almacenan una gama más amplia de datos, que no
se resumen, lo que dificulta la clasificación de grandes cantidades de datos y aumenta
los tiempos de consulta.
Los equipos que se ven obligados a localizar datos de múltiples fuentes a menudo
dependen de las hojas de cálculo para migrar estos datos y colaborar. Esto podría
generar confusión, errores humanos, conciliaciones complejas y múltiples fuentes de
verdad. Por lo tanto, estas herramientas se han vuelto cada vez más populares como
un lugar centralizado donde se organizan y recopilan los datos necesarios antes de que
se generen tableros, informes y visualizaciones.
La configuración de estos repositorios de datos puede ser un desafío para los equipos
de TI que ya tienen una gran carga de trabajo, ya que también necesitan administrar
esos repositorios de datos de manera continua y garantizar una seguridad sólida.
Trasladar estos repositorios a la nube ayuda a resolver las preocupaciones de los
equipos comerciales y de TI al migrar las tareas de seguridad y administración al
proveedor de servicios en la nube, lo que reduce la necesidad de intervención manual
y también reduce los costos operativos.
Hay 3 tipos de Data Marts que varían según su relación con el almacén de datos y las
fuentes de datos utilizadas para construirlos.
Dependiente
Independiente
Híbrido
a. Dependiente:
Estos son los tipos de Data Marts que se crean a partir de un almacén de datos
de una empresa existente. Es un enfoque de arriba hacia abajo que comienza
con el almacenamiento de todos los datos de la empresa en una sola ubicación
central y luego extrae una parte de los datos cuando es necesario para el
análisis.
Un Data Mart dependiente puede ser una vista lógica o una vista física de un
almacén de datos:
Vista lógica: esta es una tabla o vista virtual que está lógicamente, en lugar
de físicamente, separada del almacén.
Subconjunto físico : este es un extracto de datos almacenado en una base
de datos que está físicamente separada del almacén de datos.
b. Independiente:
c. Híbrido
Estas son las estructuras de almacenamiento que combinan datos de un
almacén de datos y otros sistemas de origen. Un Data Mart híbrido combina la
velocidad y el enfoque en el usuario final del enfoque de arriba hacia abajo
con las ventajas de la integración a nivel de organización de un enfoque de
abajo hacia arriba.
Un Data Mart se define como una versión más enfocada de un Data Warehouse.
Contiene un subconjunto más pequeño de datos integrales y necesarios para un solo
equipo o un grupo selecto de usuarios dentro de una organización. Por lo general, se
crea a partir de un almacén de datos existente a través de un procedimiento complejo
que aprovecha varias herramientas y tecnologías para construir y diseñar una base de
datos física, llenarla con datos y configurar protocolos de acceso y administración
sofisticados.
A pesar de ser un proceso desafiante, permite que una empresa descubra información
más enfocada más rápido que trabajar con un conjunto de datos de almacén de datos
más amplio. Por ejemplo, los equipos de marketing pueden beneficiarse de la creación
de un Data Mart a partir de un Data Warehouse existente, ya que sus actividades
generalmente se realizan de forma aislada del resto del negocio. Por lo tanto, el
equipo no necesita acceder a los datos completos de la empresa.
6. ¿Cuál es la estructura de los datos almacenados?
Los data marts normalmente almacenan datos transaccionales en filas y columnas, lo
que facilita el acceso, la organización y la comprensión de los datos. Dado que
almacenan datos históricos, facilitan que los analistas de datos comprendan las
tendencias de los datos.
Se crea una tabla de hechos en el medio y está rodeada por muchas tablas
de dimensiones asociadas. Las tablas de dimensiones no dependen unas
de otras, por lo tanto, este esquema requiere una menor cantidad de
uniones al ejecutar consultas. Esto facilita la consulta de datos, lo que hace
que Star Schema sea bueno para los analistas que necesitan acceder a
grandes conjuntos de datos.
En este paso, crea las tablas, los índices, los campos y los controles de
acceso
Paso 5: Administrar
Este es el último paso al construir un Data Mart e involucra las siguientes
tareas:
a. Controlar el acceso de los usuarios.
b. Refinar y optimizar el sistema de destino para mejorar su rendimiento.
c. Agregar nuevos datos al Data Mart y administrarlos.
d. Configurar los ajustes de recuperación y garantizar que el sistema esté
disponible incluso después de que ocurran desastres.
11. ¿Cuáles son las Mejores Prácticas para Implementar Data Marts?
Estas son algunas de las mejores prácticas para implementar Data Marts:
Es importante involucrar a todas las partes interesadas en la etapa de
diseño y planificación, ya que la implementación de Data Mart puede ser
un poco complicada.
La fuente debe estar estructurada por departamentos para lograr la
máxima eficiencia.
Este depósito de datos puede estar en una ubicación diferente, en
comparación con el almacén de datos. Por eso es importante asegurarse
de que tengan suficiente capacidad de red para hacer frente a los
volúmenes de datos necesarios para transferir datos al repositorio.
El costo de implementación debe presupuestar el tiempo que lleva
completar el proceso de carga. El tiempo de carga aumenta con el
aumento de la complejidad de las transformaciones.
Incluso si el depósito de datos se crea en el mismo hardware, es posible
que necesiten un software diferente para manejar las consultas de los
usuarios. El almacenamiento en disco y la potencia de procesamiento
adicional deben evaluarse para una respuesta más rápida del usuario.
El ciclo de implementación de dicho depósito de datos debe medirse en
períodos cortos de tiempo, es decir, en semanas en lugar de meses o años.
Los costos de software/hardware, implementación y redes de Data Mart
deben presupuestarse con precisión dentro de su plan.
Con una plataforma compartida basada en la nube para alojar y generar datos, el
análisis y el acceso se vuelven mucho más eficientes. Puede generar clústeres de datos
transitorios para análisis a corto plazo, o los clústeres de larga duración pueden unirse
para un trabajo más sostenido. Las tecnologías modernas también están separando el
almacenamiento de datos de la informática, lo que permite la máxima escalabilidad
para consultar datos.