Está en la página 1de 17

DP-203-Synapse DW

Instructor: Roger Rodriguez Samanez


Agenda

Lesson 01 – Introducción a Azure Synapse DW

Lesson 02 – Arquitectura

Lesson 03 – Principales Componentes

Lesson 04 – Precio y Rendimiento

Lesson 05 – Laboratorio
Arquitectura de Analítica de Datos
Precio - Rendimiento

$600 $564
$550

$152
$140

Líder en precio por desempeño $120 $103 $110


$100
$80
$60 $54 $51
$50 $47 $48
$40
$40 $33
$30
$20
$10
$0
Arquitectura

• El grupo de SQL dedicado (anteriormente


SQL DW) usa una arquitectura basada en nodos.
Las aplicaciones se conectan y emiten comandos
T-SQL a un nodo de control. El nodo de control
hospeda el motor de consultas distribuidas, que
optimiza las consultas para el procesamiento en
paralelo y, después, pasa las operaciones a los
nodos de ejecución para hacer su trabajo en
paralelo.
Data Warehouse Units – SQL Pool

¿Qué es un DWU?
Es una abstracción de :
• CPU
• Memoria
• IOPS
Polybase
• PolyBase permite que la instancia de SQL Server consulte datos con T-SQL directamente de
SQL Server, Oracle, Teradata, MongoDB, clústeres de Hadoop y Cosmos DB sin necesidad de
instalar de forma independiente software de conexión de cliente.
• Un caso de uso clave para la virtualización de datos con la característica de PolyBase es
permitir que los datos permanezcan en su ubicación y formato originales.
Distribución de Tablas

Hash
• Para el tipo de distribución hash se necesita elegir primero una columna,
por la cual se le indicará como deseamos que sea distribuida la data.
• Se recomienda de este tipo de distribución para tablas del tipo Fact Tables
Distribución de Tablas

Round Robin
• Todas la data es repartida aleatoriamente en todas las distribuciones
• Recomendado para base de datos staging
• Si no se indica el tipo de distribución en una tabla, será distribuidad por
Round Robin.
Distribución de Tablas

Replicadas
• Una tabla replicada proporciona el rendimiento de consultas más rápido
para tablas pequeñas.
• Una tabla que se replica tiene una copia completa de la tabla almacenada
en la caché de cada nodo de proceso.
Consideraciones

• 2 billones de tablas por base de datos.


• 1024 columnas por tabla
• Un máximo de 8 060 bytes por fila.
• Primar y Key, Foreign Key no son soportados
Tablas externas con Synapse SQL
• Una tabla externa apunta a datos ubicados en Hadoop, Azure Storage Blob
o Azure Data Lake Storage. Las tablas externas se usan para leer datos de
archivos de Azure Storage o escribir datos en ellos. Con Synapse SQL se
pueden usar tablas externas para leer datos externos mediante un grupo de
SQL dedicado o un grupo de SQL sin servidor.
© Copyright Microsoft Corporation. All rights reserved.
Gracias

También podría gustarte