Está en la página 1de 32

Almacenamiento de

datos
Unidad 7
Competencias

•Comprende el almacenamiento de datos para


su uso óptimo en el BI.
AGENDA

1.Repaso. ¿alguien recuerda?


2.Arquitectura BI - Datawarehouse.
3.Tipos de Datos y Backup’s.
4.Conclusiones.
5.Exposiciones de la Tarea del Lab. De la Sem. 6
--------------------
5. LABORATORIO SEM. 7
ARQUITECTURA BI -
DATAWAREHOUSE
INTRODUCCIÓN
●Los procesos efectivos de toma de decisiones en el mundo
empresarial, dependen en gran parte del contar con información
de calidad; especialmente en el mundo competitivo y
globalizado actual.

●La arquitectura para BI ha emergido para cumplir con esos


requisitos, con el almacenamiento de datos como la columna
vertebral de estos procesos.

Fuente.-Obtenido de: https://tienda.digital/2019/07/14/el-rol-del-almacenamiento-de-datos-en-su-arquitectura-de-inteligencia-empresarial/


Arquitectura de BI
●La arquitectura de inteligencia de negocios, es un término que se usa
para describir estándares y políticas para organizar datos, con la ayuda de
tecnologías basadas en la computación, que crean sistemas de
inteligencia empresarial utilizados para la visualización, el informe y el
análisis de datos en línea .

● Los puntos importantes a tratar son:


● El Almacenamiento de datos.
● La Organización.
● La Limpieza.
● La Extracción.
●Estas tareas deben realizarse en un Sistema de Depósito central o
“Almacén de datos-”, que será la base para BI.

Fuente.-Obtenido de: https://tienda.digital/2019/07/14/el-rol-del-almacenamiento-de-datos-en-su-arquitectura-de-inteligencia-empresarial/


Procesos de la
Arquitectura BI

●La Arquitectura BI o arquitectura de inteligencia empresarial es un


término que se usa para describir estándares y políticas para
organizar, almacenar, limpiar y extraer datos con la ayuda de
técnicas y tecnologías basadas en computadora que crean sistemas
de inteligencia empresarial utilizados para la visualización, el informe
y el análisis de datos en línea.

Fuente.-Obtenido de: https://tienda.digital/2019/07/14/el-rol-del-almacenamiento-de-datos-en-su-arquitectura-de-inteligencia-empresarial/


...Procesos de la
Arquitectura BI
Existen varios componentes y capas en los que se compone la
arquitectura de inteligencia empresarial. Un marco de
arquitectura de BI “sólido” contiene (“soporta”) los siguientes
procesos:
● Conjunto de datos.
● Integración de datos.
● Almacenamiento de datos.
● Análisis de los datos.
● Distribución de datos.
● Reacción basada en percepciones.
...Procesos de la Arquitectura BI

Fuente.-https://tienda.digital/2019/07/14/el-rol-del-almacenamiento-de-datos-en-su-arquitectura-de-inteligencia-empresarial/

*DWH= DATAWAREHOUSE= Repositorio unificado para todos los datos que


recogen los diversos sistemas de una empresa (puede ser físico o lógico).
Datawarehouse:

“Un Data Warehouse es una base de datos corporativa que se


caracteriza por integrar y depurar información de una o más
fuentes distintas, para luego procesarla permitiendo su análisis
desde infinidad de perspectivas y con grandes velocidades de
respuesta. La creación de un Data Warehouse representa en la
mayoría de las ocasiones el primer paso, desde el punto de vista
técnico, para implantar una solución completa y fiable de Business
Intelligence”. - Kimball R, Ross M. (2010)

Datamart:

Es un sub conjunto del DWH, usualmente dedicado a un tema del


negocio o área funcional de la empresa.
...Procesos de la Arquitectura BI
¿De dónde
1. Recopilación de datos: vienen los
datos?

● Se empieza con la recopilación de datos de diversas fuentes


de datos, como sistemas CRM, ERP, SCM, bases de datos,
archivos, API’s, de acuerdo a lo que trabaje la organización, asi
como a sus posibilidades.

● Las herramientas de BI ofrecen gran número de conectores de


datos, rápidos y sencillos, los cuales usan motores ETL inteligentes
(extracción y transformación de datos) en segundo plano.

● De esta forma, se facilita la comunicación entre departamentos y


sistemas dispersos; lo cual crea una cultura de toma de decisión
basada en información, aumentando la productividad.

Fuente.-Obtenido de: https://tienda.digital/2019/07/14/el-rol-del-almacenamiento-de-datos-en-su-arquitectura-de-inteligencia-empresarial/


2. Integración de datos:

• Dado que los datos provienen de sistemas dispersos y diferentes, el


siguiente paso es la extracción de datos, transformación y
carga en un almacén único de datos; este proceso se llama:
ETL (Extract-Transform-Load).

• Se debe considerar que la cantidad de datos, es cada vez mayor,


ETL es un servicio ideal.

• El Proceso de Integración de Datos es el siguiente:


a) Extracción: Los datos se obtienen de fuentes externas.
b) Transformación: Dichos datos son ajustados a la norma exigida,
a través de una depuración o limpieza; por ejemplo a través del
análisis dimensional.
c) Carga: En el nuevo Almacén de datos.

Fuente.-Obtenido de: https://tienda.digital/2019/07/14/el-rol-del-almacenamiento-de-datos-en-su-arquitectura-de-inteligencia-empresaria


2. ...Integración de datos:

PROCESO DE INTEGRACIÓN DE DATOS:


Fuente.-Obtenido de: https://tienda.digital/2019/07/14/el-rol-del-almacenamiento-de-datos-en-su-arquitectura-de-inteligencia-empresarial/


Métricas

*Fuente.- Obtenido de: https://www.youtube.com/watch?v=Tczd1j0--zs


https://www.youtube.com/watch?v=x2keCD2lCuk
3. Almacenamiento de datos:

• Objetivo:
❑ BI se centra principalmente en generar perspectivas comerciales, ya
sea en la eficiencia operativa o estratégica, como el posicionamiento
del producto y la fijación de precios, etc. El punto es lograr un
almacenamiento de datos que nos de una base para la inteligencia
empresarial.

• Resultado del Almacenamiento de Datos:


❑ El almacén de datos resume los datos en dimensiones y tablas
❑ La limpieza de datos, la administración de metadatos, la distribución
de datos, la administración de almacenamiento, la recuperación y la
planificación de copias de seguridad son procesos que se realizan en
el almacén de datos.

• Herramientas:
❑ Algunas de las herramientas son: Amazon Redshift, Datapine, entre
otras.

Fuente.-Obtenido de: https://tienda.digital/2019/07/14/el-rol-del-almacenamiento-de-datos-en-su-arquitectura-de-inteligencia-empresarial/


…3. Almacenamiento de datos:

●Actualmente, el almacenamiento de datos debe ser capaz de


soportar datos de la compañía en bases de datos internas o externas
provenientes de diversas fuentes, con un enfoque analítico en el que
la información sea “procesable” a través de las herramientas de BI en
línea. Esto conforma la “razón de ser” de la Arquitectura BI.

Fuente.-Obtenido de: https://tienda.digital/2019/07/14/el-rol-del-almacenamiento-de-datos-en-su-arquitectura-de-inteligencia-empresarial/


4. Análisis de Datos:

• Las interfaces de usuario de BI permiten crear consultas, crear


visualizaciones de datos, resúmenes y gráficos fácilmente con solo
unos clic. Sobre la base de esta facilidad, se motiva la creación de
tableros de control empresariales, y se genera información
procesable, necesaria para mejorar la eficiencia operativa y
estratégica de una empresa.

Fuente.-Obtenido de: https://tienda.digital/2019/07/14/el-rol-del-almacenamiento-de-datos-en-su-arquitectura-de-inteligencia-empresarial/


5. Distribución de Datos:

• La distribución de datos se presenta como uno de los procesos más


importantes cuando se trata de compartir información y comunicar
a las partes interesadas sobre aquello indispensable.

• Formas de Ejecutar la Distribución de Datos:

a) Informes: A través de correos electrónicos automáticos,


llevando informes actualizados automáticamente, con información y
frecuencia definidas.

b) Cuadro de Mandos: Una forma es compartir directamente un


cuadro de mandos en un entorno de visor seguro. Los usuarios no
pueden realizar ediciones ni cambiar el contenido, pero pueden usar
filtros asignados para manipular los datos e interactuar con el panel.
Otra forma es compartir a través de una URL pública que permita a
los usuarios acceder a los paneles, desde donde estén.

Fuente.-Obtenido de: https://tienda.digital/2019/07/14/el-rol-del-almacenamiento-de-datos-en-su-arquitectura-de-inteligencia-empresarial/


TIPOS DE DATOS Y
BACKUP’S
Tipos de
Almacenamiento

ARCHIVOS

ALMACENAMIENTO
BLOQUES

OBJETOS

Fuente.-Obtenido de: https://www.orbit.es/que-es-el-almacenamiento-de-objetos/


...Tipos de Almacenamiento

A) Almacenamiento en Archivos:

• Los datos se almacenan como una sola pieza de información,


dentro de una carpeta, tal como se organiza hojas de papel dentro
de un sobre de manila. Los datos almacenados en archivos se
organizan y se recuperan utilizando una cantidad limitada de
metadatos que le indican a la computadora exactamente dónde se
guarda el archivo; por eso, se le llama “almacenamiento
jerárquico”.
• Es el sistema de almacenamiento de datos más antiguo y más
utilizado; el problema es que las carpetas donde se guardan los
datos, tienen un límite. Los sistemas de almacenamiento basado
en archivos deben reforzarse agregando más sistemas, en lugar de
ampliarse agregando más capacidad.

Fuente.-Obtenido de: https://www.redhat.com/es/topics/data-storage/file-block-object-storage


B) Almacenamiento en Bloques:

• El almacenamiento en bloques divide los datos en bloques y los


almacena en partes separadas; cada bloque de datos recibe un
identificador único y el sistema de almacenamiento coloque los
datos más pequeños confirme convenga.

• Este tipo de almacenamiento se configura para desacoplar los datos


del entorno del usuario y distribuirlos en en múltiples entornos,
luego, cuando se necesite, el sistema de almacenamiento
subyacente vuelve a ensamblar los bloques de datos y los presenta
al usuario.

Fuente.-Obtenido de: https://www.redhat.com/es/topics/data-storage/file-block-object-storage


B) ...Almacenamiento en Bloques:

• Cada bloque se actualiza por cuenta propia y se puede particionar


para que se pueda acceder a él desde un sistema operativo
diferente, lo que le da al usuario la libertad total para configurar sus
datos. Es una forma eficiente de almacenar datos, funciona bien con
empresas que realizan grandes transacciones y/o manejan grandes
cantidades de datos; por tanto cuantos más datos necesite
almacenar, mejor será optar por el almacenamiento en bloques.

• Tiene algunas Desventajas: Suele ser costoso y con capacidad


limitada para manejar los metadatos, lo que significa que se debe
operar a nivel de la base de datos o de la aplicación, lo que agrega
trabajo al desarrollador.
C) Almacenamiento en Objetos:

• También se conoce como “almacenamiento basado en objetos”, es


una estructura plana en la que los archivos se dividen en partes y se
distribuyen entre el hardware, en un solo repositorio.

• Los volúmenes de almacenamiento de objetos funcionan como


unidades modulares: cada uno es un repositorio independiente que
posee los datos, un identificador único que permite encontrar el
objeto en un sistema distribuido y los metadatos que describen los
datos.

• Los metadatos incluyen detalles como: tiempo, privacidad o


seguridad y contingencias de acceso. Para recuperar los datos, el
sistema operativo de almacenamiento utiliza los metadatos y los
identificadores, lo que distribuye mejor la carga y permite a los
administradores aplicar mejores políticas de búsquedas.

Fuente.-Obtenido de: https://www.redhat.com/es/topics/data-storage/file-block-object-storage


C) ...Almacenamiento en Objetos:
• Este almacenamiento requiere una interfaz de programación de
aplicaciones (API) de HTTP sencilla que la mayoría de los clientes
utiliza en todos los idiomas. El almacenamiento de objetos es
rentable: solo paga por lo que usa y se puede escalar fácilmente, lo
que lo convierte en una opción estupenda para el almacenamiento
en nube pública.

• Desventajas: Los objetos no se pueden modificar, se debe escribir el


objeto completamente de una sola vez. El almacenamiento de
objetos tampoco funciona bien con las bases de datos tradicionales,
porque escribir objetos es un proceso lento y más complicado.

→ ”Dentro de las soluciones para actualizar la infraestructura TI


empresarial, el despliegue de recursos de almacenamiento de objetos
es muy atractivo para gestionar entornos de Big Data con datos no
estructurados. Y es que almacenar a la vez datos y metadatos facilita
mucho la aplicación de estrategias de analítica, Business Intelligence
e Inteligencia Artificial.”
FORMAS DE HACER BACKUP:

1) Backup COMPLETO:

• Es el proceso de copiar toda la data seleccionada como


imprescindible (o toda la data).

2) Backup PROGRESIVO o INCREMENTAL:

• Este tipo de backup exige un nivel de control mayor sobre las


distintas etapas del backup, ya que se considera los cambios
realizados; el proceso de backup progresivo detectará los archivos
que son los mismos con respecto al BK COMPLETO y procederá a
copiar solamente los nuevos o los actualizados.
• El backup progresivo representa entonces un ahorro de tiempo y
de espacio, ya que habrá menos archivos para ser respaldados.

Fuente.-Obtenido de: https://www.tecon.es/almacenamiento-vs-backup-cloud/


...FORMAS DE HACER BACKUP:

3) Backup DIFERENCIAL:

• Tiene la estructura básica del backup progresivo, pues también


hace copias de seguridad solo de los archivos actualizados o
nuevos. El cambio en este modelo de backup está en que todos los
archivos creados después del backup completo, siempre serán
copiados nuevamente.

Fuente.-Obtenido de: https://www.tecon.es/almacenamiento-vs-backup-cloud/


¿DÓNDE HACEMOS BACKUP?:
• Definimos donde será almacenado el BK. Los soportes más utilizados varían
con el paso de los años, por ejemplo: disquetes, CDs, DVD,s, cintas
magnéticas, discos Blu-Ray, discos rígidos externos, servicios de
almacenamiento en la nube, entre otros.
• Para decidir, responder: ¿por cuánto tiempo voy a guardar ese respaldo?
Según esto podremos definir el asunto. En la siguiente tabla se presenta un
estimado de la vida útil de distintos sistemas de almacenamiento:

Fuente.-Obtenido de: https://www.tecon.es/almacenamiento-vs-backup-cloud/


CONCLUSIONES:

¿A QUÉ CONCLUSIONES LLEGAMOS?


→ La Sgte. Semana es la PC2


BIBLIOGRAFÍA:

• https://tienda.digital/2019/07/14/el-rol-del-almacenamiento-
de-datos-en-su-arquitectura-de-inteligencia-empresarial
Gracias

También podría gustarte