Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Negocios.
Elaborado por:
Dr. Abimael Antonio Pineda.
1
Temas Semana 2
2. Arquitectura para el almacenamiento de datos, data
Warehouse.
2.1. Elementos
2.2. Tipos de métricas
2.3. Modelo conceptual de datos, MySQL y NoSQL
2.3.1. Modelo físico
2.3.2. Modelo lógico
Objetivos Semana 2
• Aprender sobre las arquitecturas para el almacenamiento
de datos.
• Identificar los elementos que conforman el data
Warehouse.
• Conocer los tipos de métricas que se utiliza par el
almacenamiento de datos.
• Distinguir la diferencia entre los diferentes modelos de
datos.
• Saber elegir entre las bases de datos MySQL y NoSQL.
2
2. Arquitectura para el almacenamiento de datos, data
Warehouse.
Un Data Warehouse es un lugar donde se almacenan los datos con fines de
archivamiento, análisis de efectos y seguridad. Por lo general, un Data Warehouse
es un único equipo o varios ordenadores (servidores) atados juntos para crear un
sistema gigante de computadoras.
Los datos pueden consistir en datos primarios o datos con formato y pueden ser de
diversos tipos de temas, incluyendo una organización de ventas, los salarios, los
datos operativos, resúmenes de los datos incluidos, los informes, copias de los
datos, los datos de los recursos humanos, los datos de los inventarios, los datos
externos y para proporcionar simulaciones, análisis, etc.
Además de ser una Depósito (Warehouse) para almacenar grandes cantidades de
datos, poseen sistemas que facilitan el acceso a los datos y su utilización en
operaciones de día a día.
Un Data Warehouse es importante ya que sirve como un sistema de apoyo a las
decisiones. Además, sirve para organizar la utilización de los datos para llegar a los
hechos, las tendencias o las relaciones que pueden ayudarles a tomar decisiones
efectivas o crear estrategias eficaces para lograr sus objetivos.
Otro tipo de Data Warehouse se llama “procesamiento analítico en línea”, este tipo
de Data Warehouse es más difícil de utilizar y agrega un paso adicional en el análisis
de los datos. Por lo general, requiere más medidas que hacen más lento el proceso
de datos y mucho más difícil el analizar algunas consultas.
Además de este modelo, uno de los modelos más comunes de almacenamiento de
datos incluye un Data Warehouse orientado al sujeto, variante en el tiempo, no
3
volátil e integrado. Orientado al sujeto se refiere a que los datos sean unidos y
organizados por las relaciones.
Variante en el tiempo significa que cualquier dato que se cambia en el Data
Warehouse puede ser rastreado. Por lo general, todos los cambios de datos son
marcados con un tiempo y con una fecha antes y después, de modo que se pueden
mostrar los cambios a lo largo de un período de tiempo.
No volátil, que los datos nunca sean eliminados o borrados. Esta es una gran
manera de proteger sus datos más importantes. Debido a que estos datos se
retienen, pueden seguir siendo utilizados en un análisis posterior.
Por último, los datos están integrados, lo que significa que en un Data Warehouse,
los datos son utilizados por toda la organización en lugar de sólo un departamento.
Además del término almacenamiento de datos, un término que se utiliza con
frecuencia es una base de “data mart”, data mart son más pequeños y menos
integrados almacenes de datos. Podrían ser sólo una base de datos sobre los
recursos humanos o de los registros de datos de ventas en una sola división.
Con las mejoras en la tecnología, así como las innovaciones en el uso de técnicas
de almacenamiento de datos, los Data Warehouse han cambiado a partir de bases
de datos operacionales sin conexión a una línea integrada de almacenamiento de
datos.
2.1. Elementos.
El almacén de datos se basa en un servidor RDBMS, que es un depósito de
información central rodeado de algunos componentes clave para que todo el
entorno sea funcional, manejable y accesible. Este almacén tiene cinco elementos
que lo componen:
• Base de datos del almacén de datos: La base de datos central es la base del
entorno de almacenamiento de datos. Esta base de datos se implementa en
la tecnología RDBMS.
• Herramientas de abastecimiento, adquisición, limpieza y transformación
(ETL): Estas herramientas se utilizan para realizar todas las conversiones,
resúmenes y todos los cambios necesarios para transformar los datos en un
formato unificado en el Data Warehouse.
• Metadatos: Los metadatos son datos sobre datos que definen el almacén de
datos. Se utiliza para construir, mantener y administrar el almacén de datos.
• Herramientas de consulta: Las herramientas de consulta permiten a los
usuarios interactuar con el sistema de almacenamiento de datos.
4
• Almacén de datos bus: El almacén de datos Bus determina el flujo de datos
en tu almacén. El flujo de datos en un almacén de datos se puede clasificar
como flujo de entrada, flujo ascendente, flujo descendente, flujo de salida y
metaflujo.
5
Debemos distinguir que:
Los modelos de datos definen cómo los datos se conectan entre sí y cómo se
procesan y almacenan dentro del sistema.
El primer modelo de datos fue el modelo de datos planos, donde todos los datos
utilizados se mantendrían en el mismo plano.
Código Postal
9063635
9345452
6345469
6654760
7754742
Los primeros modelos de datos no eran tan científicos, por lo tanto, eran propensos
a introducir muchas anomalías de duplicación y actualización.
6
Su enfoque principal es apoyar y ayudar a los sistemas de información mostrando
el formato y la definición de los diferentes datos involucrados.
Un modelo conceptual de datos identifica las relaciones de más alto nivel entre las
diferentes entidades.
7
responsable de una gran cantidad de trabajo que, en SQL, el sistema se encargaría
de forma automática.
Asimismo, las bases de datos NoSQL permiten ganar más rendimiento del sistema
mediante la eliminación de una gran cantidad de comprobaciones de integridad,
realizado por bases de datos relacionales, a partir del nivel de base de datos. Aquí
esto se compara a que, empleando transmisión manual, el usuario puede sacar más
rendimiento fuera del vehículo, frente a la automática.
Sin embargo, una de las más grandes ventajas de SQL es que, al igual que la
mayoría de los usuarios de vehículos de transmisión automática; la mayoría de los
sitios web, requieren más rapidez y menos experiencia.
8
¿CUÁNDO USAR NOSQL?
Las consideraciones físicas pueden hacer que el modelo de datos físicos sea
bastante diferente del modelo de datos lógicos.
Los pasos básicos para el diseño del modelo de datos físicos son los siguientes:
Para más detalles lee el artículo Cómo modelar datos en una base de datos.
Los pasos para diseñar el modelo de datos lógicos son los siguientes:
10
• Especifique claves primarias para todas las entidades.
• Encuentra las relaciones entre diferentes entidades.
• Encuentra todos los atributos para cada entidad.
• Resuelva las relaciones de muchos a muchos.
• Normalización.
Nombres de entidades ✓ ✓
Relaciones de entidades ✓ ✓
Atributos ✓
11
Teclas principales ✓ ✓
Foreign Keys ✓ ✓
Nombres de tabla ✓
Nombres de columnas ✓
Referencias bibliográficas.
Data Warehouse: Tipos, Arquitectura y Características. (s. f.). Tecnologias-
informacion.com/datawarehouse.html#:%7E:text=%C2%BFQu%C3%A9%2
0es%20un%20Data%20Warehouse,un%20sistema%20gigante%20de%20c
omputadoras.
de http://josepcurto.com/tag/indicador-clave/
informacion.com/modelos-datos.html
Vergara, A. (2016, 26 julio). SQL vs NoSQL ¿Cuál debo usar? Tech blog for
https://www.facilcloud.com/noticias/sql-vs-nosql-which-one-should-i-use/
12