Ingeniería de Sistemas e Informática
Inteligencia de Negocios
Semana 01 – Sesión 2:
Arquitectura de SQL Server
Mtro. Ing. Jorge Martín Rodríguez Castro
Sabías que…
▪ SQL Server es una de las herramientas más utilizadas
en Business Intelligence (BI) debido a su capacidad
para integrar, almacenar y analizar grandes volúmenes
de datos.
Inicio
▪ A través de SQL Server Integration Services (SSIS),
SQL Server Analysis Services (SSAS) y SQL Server
Reporting Services (SSRS), SQL Server permite a las
empresas realizar procesos ETL (Extract, Transform,
Load), crear cubos para análisis avanzados y generar
informes interactivos.
▪ Esto convierte a SQL Server en una plataforma
poderosa para transformar datos crudos en información
valiosa para la toma de decisiones empresariales.
Logro de aprendizaje
▪ Al finalizar la sesión, el estudiante
desarrolla un flujo ETL básico haciendo
Utilidad
uso de herramientas que forman parte de
la arquitectura de SQL Server para la
carga de datos.
Utilidad académica o personal
▪ ¿Qué entiendes por limpieza y filtrado de datos?
▪ ¿Consideras necesario limpiar y filtrar datos antes de su
Utilidad
procesamiento?
Filtrar y preparar los datos de tal forma que se
constituyan en una fuente confiable para el análisis.
Imagen obtenida de: [Link]
Dudas de la sesión anterior
▪ Inteligencia de negocios.
▪ Propósito de BI.
Utilidad
▪ Datos, información y conocimiento.
Imagen obtenida de: [Link]
Contenido
Transformación
1 Arquitectura de SQL Server
2 SQL Server y BI
Transformación
1
Arquitectura de SQL Server
Arquitectura de SQL Server
▪ SQL Server, respecto a su
Transformación
funcionalidad, es parte de una
arquitectura cliente-servidor.
▪ El proceso inicia con la solicitud
de la aplicación cliente.
▪ SQL Server acepta, procesa y
responde la solicitud con datos
procesados.
Imagen obtenida de: [Link]
Arquitectura
interna de
SQL Server
Transformación
Imagen obtenida de: [Link]
SQL Server Network Interface
Esta capa hace posible que SQL Server
Transformación
se comunique con el entorno externo.
Protocolos soportados:
▪ Shared Memory: protocolo usado por
defecto para conexiones locales.
▪ TCP/IP: usado para conexiones locales
o remotas Usa por defecto el puerto 1433.
▪ Named Pipes: usado para conexiones a
través de una red de área local. Usa por defecto el puerto 445.
▪ TDS (Tabular Data Stream): Protocolo a nivel de aplicación usado por los
tres anteriores para transferir datos entre el cliente y el servidor.
Motor Relacional
Conocido como procesador de consultas. Encargado de ejecutar consultas, la
Transformación
gestión de tareas, memoria y buffers. Solicita datos al Motor de Almacenamiento y
procesa los resultados para retornarlos al usuario.
Componentes:
▪ Evaluador de comandos: evalúa la consulta en busca de errores sintácticos y
semánticos y genera un “árbol de consulta”.
▪ Optimizador: responsable de crear un plan de ejecución que sea el más
“económico posible”.
▪ Ejecutor de consultas: invoca a los métodos de acceso y usa el plan de
ejecución para extraer datos desde el motor de almacenamiento. Envía
resultados al usuario mediante la capa de protocolos.
Motor de Almacenamiento
Almacena los datos en el sistema de almacenamiento y los retorna cuando es
Transformación
requerido. Contiene un gestor de buffer y un administrador de transacciones que
interactúa con los archivos de datos y log, acorde con las consultas.
Organiza la base de datos en tres tipos de archivos:
▪ Archivo de datos primario (.mdf): solo existe uno por base de datos. Contiene,
además de datos, información sobre todos los demás archivos de datos de la
base de datos.
▪ Archivo de datos secundario (.ndf): contienen datos. Puede crearse más de
un archivo de datos secundario.
▪ Archivo de registro de transacciones (.ldf): importante para los procesos de
restauración.
¿Cómo se almacenan los datos?
Archivo de Datos Secundario (.ndf)
Transformación
Archivo de Datos Secundario (.ndf)
Archivo de Datos Primario (.mdf)
Log de Transacciones (.ldf)
Página Registro
8KB
Registro
Extent (64KB) - 8 páginas contiguas Registro
Registro
Página
8KB
Página de datos Cabecera de página
(info: tipo, número, espacio utilizado,
Cabecera
(96 bytes)
espacio libre, apuntadores a páginas)
Fila 1
Transformación
8KB Fila 2
Fila 3
(8192 bytes)
Fila 4
Cuerpo
Tipos de páginas: (8060
bytes)
Espacio disponible
• Páginas de datos. para futuros datos
• Páginas de índices.
• PFS (page free space)
• GAM/SGAM (global 4 3 2 1
Desplazamiento
110 101 92 83 de fila (36 bytes)
allocation map - extents)
• IAM (index allocation map)
Extents
Transformación
Extent
Tabla1 Tabla1 Tabla1 Tabla1 Tabla1 Tabla1 Tabla1 Tabla1
Uniforme
Extent
Mixto Tabla2 Tabla5 Indice2 Indice4 Tabla1 Indice2 Tabla1 Tabla5
Transformación
2
SQL Server y BI
SQL Server y BI
▪ El objetivo de BI es permitir el acceso a datos e información a
Transformación
los usuarios que toman decisiones de negocio con base en el
análisis.
▪ Un sistema de BI se caracteriza por:
▪ Escritura o carga constantes de un alto número de filas.
▪ Número de usuarios reducido.
▪ Gran cantidad de datos
almacenados en las bases
de datos.
Imagen obtenida de: [Link]
Herramientas y servicios de SQL
Server para BI
▪ Herramientas principales:
Transformación
▪ SQL Server Integration Services (SSIS)
▪ SQL Server Analysis Services (SSAS)
▪ SQL Server Reporting Services (SSRS)
▪ Herramientas complementarias:
▪ Power BI
▪ Azure Synapse Analytics.
▪ Azure Analysis Services.
Imagen obtenida de: [Link]
SQL Server Integration Services
(SSIS)
▪ Permite llevar a cabo procesos para extraer, transformar y cargar
Transformación
datos (ETL) desde diversas fuentes a un destino, como un Data
Warehouse.
▪ Se usa para limpiar, consolidar y preparar datos para su análisis.
▪ Características:
▪ Flujos de trabajo visuales para diseñar procesos ETL.
▪ Conexión con múltiples fuentes de datos (bases de datos, archivos planos,
servicios web, etc.)
▪ Transformaciones de datos avanzados (filtrado, agregación, uniones, etc.)
Proceso ETL
Transformación
Imagen obtenida de: [Link]
SQL Server Analysis Services (SSAS)
▪ Herramienta para el análisis de datos que permite crear
Transformación
modelos multidimensionales (OLAP) o tabulares para el análisis
avanzado y generación de reportes.
▪ Características:
▪ Soporte para modelos multidimensionales (cubos) y tabulares.
▪ Integración con herramientas de visualización, como Power BI.
▪ Lenguaje de consulta MDX (Multidimensional Expressions) y DAX
(Data Analysis Expressions)
SQL Server Reporting Services
(SSRS)
▪ Herramienta para la generación de informes que permite crear,
Transformación
publicar y gestionar informes empresariales.
▪ Puede generar reportes estáticos o interactivos basados en
datos almacenados en SQL Server u otras fuentes.
▪ Características:
▪ Diseño de informes mediante SQL Server Data Tools (SSDT)
▪ Exportación de informes a formatos como PDF, Excel , Word, etc.
▪ Integración con SharePoint y otros portales empresariales.
Power BI
▪ Plataforma de visualización de datos y análisis empresarial que
Transformación
permite crear paneles interactivos e informes.
▪ Utilizada para conectar, modelar y visualizar datos de manera
intuitiva.
▪ Características:
▪ Conexión con múltiples fuentes de datos.
▪ Visualizaciones interactivas y paneles personalizados.
▪ Compartir informes y paneles a través de la nube (Power BI Service)
Azure Synapse Analytics
▪ Servicio de análisis avanzados en la nube que combina
Transformación
almacenamiento de datos (Data Warehouse) y análisis de Big
Data.
▪ Características:
▪ Integración con SQL Server y otras herramientas de Microsoft.
▪ Soporte para consultas SQL y análisis de datos en tiempo real.
Azure Analysis Services
▪ Versión en la nube de SSAS para crear modelos de datos
Transformación
escalables.
▪ Se usa para implementar modelos tabulares en la nube.
▪ Características:
▪ Compatibilidad con modelos creados en SSAS.
▪ Integración con Power BI y otras herramientas de Microsoft.
Flujo de trabajo típico en BI con SQL
Server
Transformación
Limpieza, Con SASS se crean
Extracción de datos Con SSRS o
transformación y modelos
desde diversas Power BI se crean
carga de datos multidimensionales
fuentes, utilizando informes o paneles
en un Data o tabulares para
SSIS interactivos
Warehouse facilitar el análisis
Actividad práctica 1/3
ETL manual con SQL Server
▪ Objetivo: realizar el proceso ETL sobre un
Práctica
conjunto de datos contenidos en el archivo
Dispositivos Legales [Link] y
almacenarlos en una tabla nueva de nombre
tbDL2002 de una base de datos de SQL
Server.
▪ Herramientas: Ms Excel, T-SQL y SSMS.
Actividad práctica 2/3
Especificaciones para el ETL de los datos
Columna origen Descripción Acción Columna destino Tipo destino Transformaciones
FECHA_PUBLICACION Fecha de publicación Importar fechaPublicacion date Convertir tipo
OP Orden de publicación Importar numeroOrden int Separar y convertir tipo
Práctica
itemOrden tinyint Separar y convertir tipo
ENTIDAD Entidad que emite el dispositivo Importar entidad varchar(255)
DISPOSITIVO Tipificación del dispositivo Importar dispositivo varchar(255)
codigoTipo varchar(8) Abreviatura de tipificación (ver tabla)
NUMERO Número del dispositivo Importar numeroCompleto varchar(120)
numero int Extraer solo el número del dispositivo
SUMILLA Sumilla del dispositivo Importar sumilla varchar(2048)
LINK Enlace web del dispositivo Importar link varchar(250)
FECHA_CORTE Fecha de generación del dataset Ignorar
Actividad práctica 2/3
TIPIFICACIÓN ABREVIATURA TIPIFICACIÓN ABREVIATURA
LEY LEY RESOLUCION DE ALCALDIA RA
DECRETO SUPREMO DS AVISO AVI
RESOLUCION RES DECRETO DEC
Práctica
RESOLUCION MINISTERIAL RM DECRETO DE URGENCIA DU
RESOLUCION SUPREMA RS RESOLUCION DE CONCEJO RC
RESOLUCION DIRECTORAL RD CIRCULAR CIR
RESOLUCION JEFATURAL RJ INVESTIGACION INV
ANEXO ANX QUEJA QJA
FE DE ERRATA FERR CONVENIO CON
RESOLUCION VICE MINISTERIAL RVM RESOLUCION LEGISLATIVA RL
ACUERDO ACU PROYECTO PRO
RESOLUCION ADMINISTRATIVA RA VISITA VIS
SEPARATA ESPECIAL SE RECTIFICACION REC
ORDENANZA ORD DECRETO LEGISLATIVO DL
DECRETO DE ALCALDIA DA
Conclusiones y repaso
▪ ¿Qué es y cómo funciona la arquitectura cliente-servidor?
▪ ¿Qué componentes son parte de la arquitectura de SQL
Cierre
Server?
▪ ¿Qué es ETL?
▪ ¿Cuál es la finalidad de un proceso ETL?
Bibliografía
▪ Nin Guerrero, Jordi. (2019). Big data: análisis de datos en entornos masivos. Editorial
UOC. [Link]
▪ Curto Díaz, Josep - Autor; Braulio Gil, Núria - Autor. Customer analytics: mejorando la
inteligencia del cliente mediante los datos. Editorial UOC.
[Link]
▪ Rodríguez, José Ramon - Autor; González Farran, Xavier - Autor; Guitart, Isabel - Autor.
¿Cómo planificar un proyecto de inteligencia de negocio?. Editorial UOC.
[Link]
▪ Fernando Dávila Ladrón de Guevara - Autor. Hacia la inteligencia del negocio con
Excel 2003. Editorial Politécnico Grancolombiano. [Link]
bin/koha/[Link]?biblionumber=36910