Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Conceptos Bsicos
Buenas Practicas
ndice
1. Introduccin
2. Conceptos bsicos Teradata
1.
2.
3.
Definicin Conceptos
Funcionalidades de desarrollo
Buenas Practicas
4. Integracin Teradata-PowerCenter
1.
2.
Definicin Push-Down
Buenas practicas Push-Down
1. Introduccin
2. Conceptos bsicos Teradata
1.
2.
3.
Definicin Conceptos
Funcionalidades de desarrollo
Buenas Practicas
4. Integracin Teradata-PowerCenter
1.
2.
Definicin Push-Down
Buenas practicas Push-Down
Que es Teradata?
Arquitectura Teradata
Sistema de almacenamiento
Escalabilidad
1. Introduccin
2. Conceptos bsicos Teradata
1.
2.
Definiciones
3.
Buenas Practicas
Definicin Conceptos
2.
Funcionalidades de desarrollo
3.
Buenas Practicas
4. Integracin Teradata-PowerCenter
1.
Definicin Push-Down
2.
10
ndices Primarios.
La distribucin de los datos en los distintos AMP se realizar aplicando una funcin de hashing a un
conjunto de campos preseleccionados. stos campos son los que conforman el ndice primario de
la tabla.
Este ndice es obligatorio y se define en el momento de creacin de la tabla.
Para medir su eficacia se utiliza el concepto skewfact, que nos indica el grado de dispersin de los
datos en los distintos AMP. Se debe buscar un ndice primario en el que el factor de Skew este lo
mas cercano a 0 posible, evitando en la medida de lo posible valores superiores a 6.
Es conveniente realizar una revisin detallada de los ndices primarios que se definen para cada
tabla con el objetivo de encontrar el ndice mas apropiado que permita una buena distribucin de los
datos.
Debido a que la eficiencia de Teradata radica en que realiza tareas en paralelo, una distribucin
homognea permite que la consulta se distribuya por todos los AMPs de manera equitativa,
evitando que se produzcan descompensaciones en la carga de trabajo, de modo que el rendimiento
del proceso aumenta y el tiempo de procesamiento disminuye.
11
Mximo
54
70140
Mnimo
37
2160
Como podemos observar, existe una descompensacin muy marcada en uno de los AMPs, lo que
disminuir la velocidad de procesamiento de los datos.
SFCN.TSFCNTMU_tam --> ndice: COD_PERSONA, COD_IDTRANS
n AMP
Mximo
38
4498
Mnimo
31
4177
12
Query
Tiempo de Respuesta
00:04:23
00:00:38
13
14
Longitud del
campo (Bytes)
Porcentaje de
Ocurrencia
12.50%
6.25%
4.17%
3.13%
2.50%
2.08%
1.79%
1.56%
> 12
< 1%
15
Longitud del
campo (Bytes)
Numero de
valores
compresibles
2-3
4-7
8 - 15
16 - 31
32 - 63
64 - 127
128 - 255
Es conveniente comentar que aquellos campos que formen parte del ndice
primario de la tabla, y los definidos como VARCHAR, no pueden ser
comprimidos.
Algunos ejemplos de valores a comprimir seran:
- Nulos.
- Cero.
- Valores por defecto
- Flags (marcadores / estados / controles )
- Espacios.
- Indicadores Binarios (V/F)
16
Recomendaciones de uso
17
20
Aadir Metadata
Extensin al objeto
21
Nomenclatura:
Tipologa:
Conectada:
Cach:
Reusable
:
22
Nomenclatura:
SQ_{NombreFuente}
Tipologa:
Activa
Conectada:
Cach:
Reusable:
Recomendaciones de uso
Filtrar todo lo posible los datos a tratar mediante las propiedades de la transformacin.
Conectar solamente los puertos que sean necesarios del Source Qualifier a las
siguientes transformaciones, stos sern los campos incluidos en la Select.
No es aconsejable cambiar la consulta de la propiedad SQL Query siempre que se pueda
realizar la consulta mediante el resto de propiedades de la transformacin. En caso de que
la consulta deba ser modificada, verificar que los puertos utilizados en la consulta
aparecen en el mismo orden que la transformacin ya que se podran intercambiar el valor
de unos campos por el de otros.
No quitar puertos del Source Qualifier, aunque no sean utilizados, de esta forma
facilitaremos la realizacin de futuros cambios.
23