ELECTIVA - Arquitectura de La Solución de BI

Universidad de Guayaquil
Facultad de Ciencias Matemáticas y Físicas

Carrera de Ingeniería en Sistemas Computacionales
Periodo Académico 2021-2022 CII
Docente: Ing. Pazmiño Moran Víctor Ebenezer
Curso: ISI-S-NO-6-5
Materia: Electiva III
Tema: Arquitectura de BI
➢ Integrantes:
➢ Avelino Cagua Allison Justine
➢ Sellan Cardenas Orlando Leonardo
➢ Mora Candelario Sheila Milena
➢ Sarango Torres Elsa Stefania
➢ Villena Sotomayor Katherin Melissa
ÍNDICE
▪ ARQUITECTURA DE LA SOLUCIÓN DE BI EN EL CENTRO DE EXCELENCIA
▪ MARCOS DE TRABAJO
▪ MODELOS DE DATOS
▪ MODELOS EMPRESARIALES
▪ MODELOS SEMÁNTICOS DE BI
▪ MODELO DE MACHINE LEARNING
▪ ALMACENAMIENTO DE DATOS
▪ MARCO DEL MOTOR DE REGLAS DE NEGOCIO
▪ ORÍGENES DE DATOS
▪ INGESTA DE DATOS
▪ MARCO DE INGESTA
▪ MARCO DE ORQUESTACIÓN
▪ ALMACENAMIENTO DE DATOS
▪ CONSUMO DE DATOS
Arquitectura de la Solución de BI en el Centro de Excelencia
El diseño de una plataforma de BI sólida es algo parecido a crear un

puente, este puente conecta los datos de origen transformados y
enriquecidos con los consumidores de datos.
En una organización de gran tamaño, una arquitectura de la solución

de BI puede constar de lo siguientes elementos:
• Orígenes de datos
• Ingesta de datos
• Preparación de datos o macrodatos
• Almacenamiento de datos
• Modelos semánticos de BI
• Informes
La plataforma debe admitir demandas específicas. En concreto, se

debe escalar y ejecutar para satisfacer las expectativas de los servicios
de negocio y los consumidores de datos.
Marco de Trabajo
Los marcos de procesos técnicos y empresariales
aumentan la reutilización del diseño y la lógica y ofrecen
un resultado coherente.
Ofrecen flexibilidad en la arquitectura, lo que aprovecha

muchas tecnologías, y optimizan y reducen la sobrecarga
de ingeniería a través de procesos repetibles.
Los marcos bien diseñados aumentan la visibilidad

del linaje de datos, el análisis de impacto, el
mantenimiento de la lógica de negocios, la
administración de la taxonomía y la optimización de
la gobernanza.
Modelo de Datos
Los modelos de datos proporcionan control sobre cómo se estructuran los

datos y cómo se accede a ellos. En el caso de servicios de negocio y
consumidores de datos, los modelos de datos son la interfaz de la plataforma
de BI.
Una plataforma de BI puede ofrecer tres tipos diferentes de modelos:
1. Modelos empresariales
2. Modelos semánticos de BI
3. Modelos de Machine Learning (ML)

Modelos empresariales
Los modelos empresariales proporcionan un origen de datos coherente y único para los informes
y BI. Se crean una vez y se comparten como estándar corporativo. Las directivas de gobernanza
garantizan la seguridad de los datos, por lo que el acceso a los conjuntos de datos confidenciales
(como información de clientes o datos financieros), se restringe en caso necesario. Adoptan
convenciones de nomenclatura que garantizan la coherencia, con lo que se afianza la credibilidad
de los datos y la calidad.
En una plataforma de BI en
la nube, los modelos
empresariales se pueden
implementar en un grupo de
Synapse SQL en Azure
Synapse
Modelos semánticos de BI
Los usuarios empresariales pueden crear

modelos independientes de menor escala,
Los desarrolladores de BI y los usuarios
o bien pueden ampliar los modelos
Representan una capa empresariales los compilan y mantienen.
semánticos de BI principales con orígenes
semántica en los modelos Los desarrolladores de BI crean modelos
externos o de departamento. Los modelos
semánticos de BI principales que obtienen
empresariales. semánticos de BI normalmente se centran
datos de los modelos empresariales.
en una sola área temática y a menudo son
ampliamente compartidos.
Las capacidades Representan Aceleran el Al igual que los

empresariales no estructuras Pueden aplicar rendimiento de las modelos
solo se habilitan intuitivas y fáciles permisos de datos consultas y empresariales, los
por datos, también de entender que específicos, que proporcionan un modelos semánticos
por modelos definen relaciones garanticen que las análisis interactivo de BI adoptan
semánticos de BI de datos y personas con gran capacidad convenciones de
que describen encapsulan reglas adecuadas tengan de respuesta, nomenclatura para
conceptos, de negocios como acceso a los datos incluso con varios garantizar la
relaciones, reglas y cálculos. correctos. terabytes de datos. coherencia
estándares.
entrenados pueden revelar patrones
Modelos de los compilan y mantienen los
dentro de los datos. En muchas
científicos de datos. Se
circunstancias, esos patrones pueden
Machine desarrollan principalmente a
usarse para hacer predicciones que
partir de orígenes sin
Learning procesar en el lago de datos.
pueden emplearse para enriquecer los
datos.
En una plataforma de BI
en la nube, se puede
usar Azure Machine
Learning para entrenar, Por ejemplo, el comportamiento de compra
implementar, se puede usar para predecir el abandono de
automatizar, administrar clientes o para segmentarlos. Los resultados
y realizar un seguimiento
de la predicción se pueden agregar a los
EJEMPLO
de los modelos de ML.
modelos empresariales para permitir el
análisis por segmento de clientes.
ALMACENAMIENTO DE DATOS
• El almacenamiento de datos refiere al uso de medios de grabación para conservar los datos utilizando PC y otros
dispositivos. Las formas más frecuentes de almacenamiento de datos son el almacenamiento de archivos,
Que es? el almacenamiento en bloque y el almacenamiento de objetos, cada uno de los cuales resulta adecuado para un
fin diferente.
• En el centro de una plataforma de BI se encuentra el almacenamiento de datos, que hospeda los modelos
empresariales. origen de datos autorizados, como sistema de registro y como centro de conectividad, que
Platafor
presenta modelos empresariales para informes
ma BI
• Data Lake Storage Gen2: Es un conjunto de funcionalidades dedicadas al análisis de macrodatos(gran cantidad de datos
complejos). Synapse Analytics pueden acceder a los datos almacenados en ADLS Gen2. Por lo tanto, en una plataforma de BI, es
Azure
una buena opción almacenar datos de origen sin procesar, datos semiprocesados o almacenados provisionalmente y datos listos
para producción.
PolyBase es
una función de
ALMACENAMIENTO DE DATOS virtualización

de datos para
SQL Server.
• Acceso compatible con Hadoop

• Rentabilidad
Característic
• Controlador optimizado
as
• Synapse Analytics: Es un servicio de análisis ilimitado que reúne la integración de datos, el almacenamiento de datos
empresariales y el análisis de big data. Le brinda la libertad de consultar datos en sus propios términos, utilizando opciones sin
servidor o dedicadas, a escala. Por lo tanto, con una experiencia unificada para ingerir, explorar, preparar, transformar,
Azure
administrar y entregar datos para las necesidades inmediatas de BI y aprendizaje automático.
• Integración de datos híbridos sin código

• Análisis de registros y telemetría
Característic • Opciones dedicadas y sin servidor
as
• por lo que resulta ideal para hospedar modelos empresariales que consten de tablas de dimensiones y de hechos. Las tablas se
pueden cargar eficazmente desde ADLS Gen2 mediante consultas sencillas de T-SQL de Polybase. Entonces tiene la potencia
de MPP para ejecutar análisis de alto rendimiento.
ORÍGENES DE DATOS
Un origen de datos es una combinación de un origen de datos y la información de conexión necesaria

para obtener acceso a dichos datos. Algunos ejemplos de orígenes de datos son SQL Server, Oracle
RDBMS, hojas de cálculo y archivos de texto.
Se basa principalmente en orígenes de datos de aplicación de línea de negocio, que suelen ser
bases de datos relacionales que almacenan datos específicos de cada tema para ventas, marketing,
finanzas, etc. Pueden estar establecidas en la nube o residir en el entorno local
Los repositorios de MDM (MASTER DATA MANAGEMENT.- es la metodología que permite

gestionar el conjunto de estos datos maestros de forma que no haya inconsistencias entre ellos) nos
permiten administrar los datos maestros para garantizar versiones de datos autoritativas,
estandarizadas y validadas.
Ingesta de datos
¿Que es la Ingesta de Datos?
La ingesta de datos es el proceso que se usa para cargar

registros de datos desde uno o varios orígenes a una tabla de
Azure Data Explorer. Una vez ingeridos, los datos están
disponibles para su consulta.
Periódicamente, y según los ritmos de la empresa, los datos se ingieren desde

los sistemas de origen y se cargan en el almacenamiento de datos. Podría ser
una vez al día o a intervalos más frecuentes.
La ingesta de datos se refiere a la extracción, transformación y carga de
datos. O, quizás al revés: extracción, carga y transformación de datos.
En Microsoft, usamos Azure Data Factory (ADF). Los servicios se usan para
programar y orquestar validaciones, transformaciones y cargas masivas de
datos de los sistemas de origen externos en nuestro lago de datos.
Todo esto se administra mediante marcos personalizados para procesar datos en
paralelo y a escala. Además, se lleva a cabo un registro completo para admitir la
solución de problemas, la supervisión del rendimiento y el desencadenamiento
de notificaciones de alerta cuando se cumplen determinadas condiciones.
Marco de ingesta
El marco depende de tablas de configuración

que almacenan información relacionada con
el origen y el destino de los datos tales como
Hemos desarrollado un marco de tipo de origen, servidor, base de datos, El marco de ingesta se diseñó para simplificar
ingesta como un conjunto de procedimientos esquema y detalles relacionados con las el proceso de control de los cambios de
y tablas de configuración. Admite un enfoque tablas. Este enfoque de diseño significa que esquema de origen ascendentes. Resulta fácil
controlado por datos para adquirir grandes no es necesario desarrollar canalizaciones actualizar los datos de configuración, manual
volúmenes de datos a alta velocidad y con específicas de Azure Data Factory ni paquetes o automáticamente, cuando se detectan
código mínimo. En resumen, este marco de SQL Server Integration Services (SSIS). En cambios en el esquema para adquirir los
simplifica el proceso de adquisición de datos su lugar, los procedimientos se escriben en el atributos recién agregados al sistema de
para cargar el almacenamiento de datos. lenguaje de nuestra elección para crear origen.
canalizaciones de Azure Data Factory que se
generan dinámicamente y se ejecutan en
tiempo de ejecución.
Marco de orquestación
Hemos desarrollado un marco de Estas tablas almacenan La inversión en el desarrollo

orquestación para poner en metadatos que describen las de este marco adaptable se
práctica y orquestar nuestras dependencias de canalización ha amortizado desde
canalizaciones de datos. Utiliza un
diseño controlado por datos que y cómo asignar los datos de entonces; ya no es necesario
depende de un conjunto de tablas origen a las estructuras de codificar de forma rígida
de configuración. datos de destino. cada movimiento de datos.
ALMACENAMIENTO
DE DATOS
• Microsoft ADLS Gen2
Almacena datos sin procesar junto con datos
almacenados provisionalmente y datos listos
para producción, también proporciona una
solución de lago de datos rentable y
altamente escalable para análisis de
macrodatos.
Estos datos se almacenan en una base de
datos relacional para ofrecer un almacén de
datos de alto rendimiento y altamente
escalable para los modelos empresariales,
con seguridad, gobernanza y capacidad de
administración tambien disponen una
configuración con permisos de acceso
específicos.
CONSUMO DE DATOS
Todos los servicios de negocios consumen datos
empresariales procedente de almacenamiento de datos
también tienen acceso a los datos directamente en el
lago de datos para realizar tareas de análisis ad hoc o de
ciencia de datos.
Los datos solo podrán ser vistos por personas que
tengan acceso a la información caso contrario no podrán
ver.
Los analistas de datos se conectan directamente a los
modelos semánticos de BI principales. Cuando los
modelos semánticos de BI principales contienen todos
los datos y la lógica que necesitan, usan conexiones
dinámicas para crear informes y paneles de Power BI.
Cuando tienen que ampliar los modelos con datos
departamentales, crean modelos compuestos de
Power BI. Si se necesitan informes de tipo de hoja de
cálculo, usan Excel para generar informes basados en
modelos semánticos de BI principales o modelos
semánticos de BI de departamento.

ELECTIVA - Arquitectura de La Solución de BI

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

ELECTIVA - Arquitectura de La Solución de BI

Cargado por

Copyright:

Formatos disponibles

Universidad de Guayaquil

Facultad de Ciencias Matemáticas y Físicas

▪ MODELO DE MACHINE LEARNING

▪ MARCO DEL MOTOR DE REGLAS DE NEGOCIO

El diseño de una plataforma de BI sólida es algo parecido a crear un

En una organización de gran tamaño, una arquitectura de la solución

La plataforma debe admitir demandas específicas. En concreto, se

Ofrecen flexibilidad en la arquitectura, lo que aprovecha

Los marcos bien diseñados aumentan la visibilidad

Los modelos de datos proporcionan control sobre cómo se estructuran los

Una plataforma de BI puede ofrecer tres tipos diferentes de modelos:

3. Modelos de Machine Learning (ML)

Los usuarios empresariales pueden crear

Las capacidades Representan Aceleran el Al igual que los

ALMACENAMIENTO DE DATOS virtualización

• Acceso compatible con Hadoop

• Integración de datos híbridos sin código

Un origen de datos es una combinación de un origen de datos y la información de conexión necesaria

Los repositorios de MDM (MASTER DATA MANAGEMENT.- es la metodología que permite

La ingesta de datos es el proceso que se usa para cargar

Periódicamente, y según los ritmos de la empresa, los datos se ingieren desde

El marco depende de tablas de configuración

Hemos desarrollado un marco de Estas tablas almacenan La inversión en el desarrollo

También podría gustarte