Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Reflexiones sobre TERADATA, Oracle, Linux y todo lo que ocurre en la vida de un profesional de IT.
Uno de los conceptos más importantes en Teradata es el ‘skew factor‘ (que podríamos traducir algo así
como ‘factor de sesgo’) en la distribución de los datos de las tablas entre los AMP’s.
Por ello hay quien define el ‘skew factor‘ como la función inversa de la ‘Parallel Efficiency‘ (eficiencia
paralela): cuanto menor sea el ‘skew factor‘ mayor será la ‘Parallel Efficiency‘.
Por regla general se considera aceptable un ‘skew factor‘ menor o igual que 10, mientras que si el ‘skew
factor‘ es superior a 10 se recomienda revisar la definición del ‘primary index‘ para que el algoritmo ‘hash‘
distribuya los datos de la tabla de una forma más equitativa entre los AMP’s.
Otra cosa a tener en cuenta es que si la tabla es muy pequeña el ‘skew factor‘ deja de ser significativo.
@; ! ! #! # ./ 0 1"
Saludos.
Carlos.
Responder
CarlosAL dice:
18 abril \18\UTC 2014 en 11:00
Juan Pablo:
La documentación de Teradata da información acerca de cómo estimar el tamaño de una tabla en
función de su estructura (y del número de filas previsto, claro). Ello incluye conocer los tipos de
los datos de las columnas (y el tamaño medio de las columnas de longitud variable como los
VARCHARS), columnas “NULL” o “NOT NULL” y columnas comprimidas (“COMPRESS”) con
sus bits de presencia, “overhead” de las estructuras etc…
También influyen cosas como el número de AMPs del sistema, ya que una tabla colocará
cabeceras (“headers”) en cada uno de ellos.También habría que estimar el tamaño de los índices
secundarios, si los hubiera.
Yo utilizo una hoja excel que construí hace tiempo para una estimacón rápida de los tamaños.
Pero hay que saber que se trata siempre de estimaciones -muy aproximadas, eso sí-, no de
cálculos.
Saludos.
Carlos.
Responder
Carlos dice:
20 junio \20\UTC 2016 en 16:04
Buenas Carlos,
me podrías decir en que documentación de Teradata te indica como estimar el tamaño de una
tabla. Con la cantidad de documentación que hay a veces se pierde uno.
Gracias,
Carlos.
Responder
Blog de WordPress.com.