Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sesión 4
Temario • Multi-cluster Warehouses
• Consumo de créditos
• Práctica sobre costos
Multi-cluster Warehouses
La demanda de las base de datos tradicionales es raramente estática
Concurrentes
3. No hay forma flexible de adaptarse:
Usuarios
Más en el mismo grupo tiene rendimientos
Mañana Tarde Noche
decrecientes
Multi-cluster Warehouses
Los Multi – Cluster Warehouses de Snowflake se adaptan a la concurrencia
Concurrentes
Usuarios
2. Alta capacidad con alta demanda
Mañana Tarde Noche
3. Completamente automatizados
Los Multi-cluster Warehouse
mejoran la simultaneidad
Los Multi-cluster Warehouse están diseñados específicamente para manejar problemas de cola y rendimiento
relacionados con un gran número de usuarios y / o consultas simultáneas. Además, los Multi-cluster
Warehouse pueden ayudar a automatizar este proceso si su número de usuarios / consultas tiende a fluctuar.
Al decidir si utilizar Multi-cluster Warehouse y la cantidad de warehouses que se utilizarán por almacén de
varios clústeres se debe tener en cuenta lo siguiente:
• Si está utilizando Snowflake Enterprise Edition (o una edición superior), todos sus warehouse deben
configurarse como almacenes de varios clústeres.
• A menos que tenga un requisito específico para ejecutar en modo Maximizado, los Multi-cluster
Warehouse deben configurarse para ejecutarse en modo Auto-scale, lo que permite a Snowflake iniciar y
detener warehouse automáticamente según sea necesario.
Los Multi-cluster Warehouse
mejoran la simultaneidad
Al elegir el número mínimo y máximo de warehouses para un Multi-cluster Warehouse tener en cuenta lo
siguiente:
Mínimo
Mantener el valor predeterminado de 1; esto asegura que los warehouses adicionales solo se inicien cuando
sea necesario. Sin embargo, si le preocupa la alta disponibilidad del warehouse, establecer el valor en un valor
superior a 1. Esto ayuda a garantizar la disponibilidad y la continuidad del Multi-cluster Warehouse en el caso
poco probable de que falle un warehouse.
Máximo
Establecer este valor lo más grande posible, teniendo en cuenta el tamaño del warehouse y los
correspondientes costos de crédito. Por ejemplo, un Multi-cluster Warehouse X-Large con un máximo de
almacenes = 10, se consumirán 160 créditos en una hora si los 10 almacenes funcionan continuamente
durante la hora.
¿Qué es un Multi-cluster Warehouse?
Además, los Multi-cluster Warehouse admiten las mismas propiedades y acciones que los
warehouse individuales, que incluyen:
Experiencias referentes:
Mi aplicación solo puede admitir un cierto nivel Para crear mi aplicación, necesito adquirir varias
de simultaneidad de usuarios debido al Data instancias de almacenamiento de datos para aislar
Warehouse subyacente, que solo permite entre numerosas cargas de trabajo y usuarios entre sí.
32 y 50 consultas de usuarios concurrentes. Esto se suma a los costos y la complejidad.
Hemos creado nuestras propias políticas de Durante las horas pico, los usuarios se sienten
programación en torno al Data Warehouse. frustrados porque sus requests se ponen en cola o
Usamos colas de queries para controlar y fallan por completo.
priorizar las consultas entrantes emitidas por
nuestros numerosos usuarios.
Multi-cluster Warehouses
Este concepto hace posible cambiar instantáneamente el tamaño de los almacenes virtuales o pausarlos por completo.
Snowflake es la única solución de almacenamiento de datos en la nube que permite que se ejecuten cargas de trabajo
simultáneas sin impactarse entre sí.
Multi-cluster Warehouses
No es necesario que los usuarios ajusten sus cargas de trabajo para adaptarse a los cuellos de botella del Data
Warehouse.
El Data Warehouse en sí mismo podría detectar cargas de trabajo crecientes y agregar recursos informáticos adicionales
según sea necesario o apagar / pausar los recursos computacionales cuando las actividades de la carga de trabajo
disminuyan nuevamente.
Imagine que su aplicación pudiera escalar desde el primer momento con un único almacén de datos (virtual) sin la
necesidad de aprovisionar almacenes de datos adicionales.
Un mundo sin scripts de programación ni queries en cola, un mundo en el que se puede aprovechar un servicio de
almacenamiento de datos inteligente que garantiza que todos los usuarios obtengan respuestas a sus preguntas
dentro del SLA de la aplicación.
Multi-cluster Warehouses
Auto Scaling: Snowflake inicia y detiene los clústeres según sea necesario
para administrar dinámicamente la carga de trabajo en el Warehouse.
Multi-cluster Warehouses
• Guarda toda la data en un solo lugar • Los DataMarts requieren ser copiados
Maximized (2 Horas)
En este ejemplo, un warehouse de varios clústeres de tamaño Medium con 3 warehouses se ejecuta en modo
Maximized durante 2 horas:
Auto-scale (2 Horas)
En este ejemplo, un warehouse de varios clústeres de tamaño Medium con 3 warehouses se ejecuta en modo
de Auto-Scale durante 2 horas:
Auto-scale (3 Horas)
En este ejemplo, un warehouse de varios clústeres de tamaño Medium con 3 warehouses se ejecuta en modo
de Auto-Scale durante 3 horas:
El warehouse 2 funciona de forma continua durante toda la segunda hora y 30 minutos en la tercera hora.
En este ejercicio, un warehouse de varios clústeres de tamaño Small con 3 warehouses se ejecuta en modo de
Auto-Scale durante 3 horas:
Maximized (3 Horas)
En este ejercicio, un warehouse de varios clústeres de tamaño Large con 3 warehouses se ejecuta en modo de
Maximized durante 3 horas:
En este ejercicio, un warehouse de varios clústeres de tamaño XSmall con 4 warehouses se ejecuta en modo de Auto-Scale durante 3 horas:
El tamaño del Multi-cluster Warehouse cambia de Small a Medium a las 2:30 horas.
El tamaño del Multi-cluster Warehouse cambia de Small a XSmall a las 2:30 horas.
• Autenticación
• Gestión de infraestructura
• Gestión de metadatos
• Análisis y optimización de consultas
• Control de acceso
Uso de Créditos de Cloud Services
De manera similar al uso del Virtual Data Warehouse, los créditos de Snowflake se
utilizan para pagar el uso de los servicios en la nube que exceden al 10% del uso diario
de los recursos informáticos.
El uso de los Cloud Services se cobra solo si el consumo diario de los Cloud Services
supera el 10% del uso diario de los recursos informáticos. El cargo se calcula diariamente
(en la zona horaria UTC). Esto asegura que el ajuste del 10% se aplique con precisión
cada día, al precio de crédito de ese día.
Uso de Créditos de Cloud Services
El ajuste del 10% para los Cloud Services se calcula diariamente (en la zona horaria UTC)
multiplicando el cálculo diario por un 10%.
Sobre la pregunta anterior, si se detienen las cargas de trabajo al minuto 10 con 24 segundos,
¿Cuánto sería el valor consumido en créditos para el plan Economy? Considerando los
intervalos en los que hace verificación
Sobre la pregunta anterior ¿Cuánto sería el valor consumido en créditos para el plan Estándar?
Considerando los intervalos en los que hace verificación
Costo total en dólares por 13TB de Data en AWS OHIO REGION (On Demand)
Costo total en dólares por 14 PetaBytes de Data en AWS OHIO REGION (On Demand)
Costo total en dólares por 400GB de Data AWS SYDNEY REGION (On Demand)
Costo total en dólares por 14 PetaBytes de Data en AWS SYDNEY REGION (On Demand)
Créditos totales consumidos y costo correspondiente para ejecutar el Virtual Warehouse (3X
LARGE) Se ejecuta durante 7 horas al día durante 28 días en un mes, en la región de AWS Sydney
Créditos totales consumidos y costo correspondiente para ejecutar el Virtual Warehouse (3X
LARGE) Se ejecuta durante 7 horas al día durante 28 días en un mes, en la región de AWS Sydney
Créditos totales consumidos y el costo correspondiente para ejecutar el almacén virtual (XSMALL) que se ejecutan
durante todo el mes de Setiembre con un SLA de mantenimiento único durante cada viernes de 1am a 3am
Encontrar queries su tipo de query que consuma la mayor cantidad de créditos de Cloud Services
Cómo averiguar de dónde proviene el uso de los
Cloud Services
Encontrar queries por un tipo de query en específico de servicio que consuma la mayor cantidad de créditos de Cloud
Services
Cómo averiguar de dónde proviene el uso de los
Cloud Services