Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Stephen Lam PS
Reino Unido
que puede ser usado para calcular de manera eficiente una amplia gama de matriz
algoritmos. La topología de este procesador de matriz puede ser descrito como dos
configuración de los conjuntos de procesadores de tal manera que el cálculo se puede realizar
iterativa.
1. Introducción
Entre arquitecturas de procesador de matriz, las matrices sistólicas que fueron introducidos por
Kung y Lciserson [1] crearon una marea investigación en la última década, y este impulso
concuerda con el modelo de la computación para muchos algoritmos matriz algebraicas, como
Un resultado el rendimiento del sistema a menudo se cierra para sus límites teóricos. En adición,
estas características de arco particularmente favorable para semiconductor muy gran escala
que deben cumplir los criterios de estrecha correspondencia entre los flujos de datos algorítmico
y la matriz de topología subyacente. Por lo tanto, una pregunta que hacer es si matriz común
topologías (es decir, lineal, malla, triangular, hexagonal, etc.) son apropiados para todas matriz
cálculo. En principio, la mayor parte de cálculo de matriz puede ser mapeado en arrays lineales
por algunos medios de separación y transformación. Sin embargo, la arrays arco resultante
tales como matrices triangulares son ideales para cierto cálculo, pero para aquellos de cálculo
veces hasta que se cumple la precisión numérica o una orden en particular es en el lugar. Por lo
tanto,
hay una gran necesidad de la topología de conjuntos sistólicos a ser más versátil y culpa
tolerante. En este documento, una topología de matriz para itcrative cálculo array será
nodos que están conectados entre sí lógicamente como dos capas intersticiales de arrays de malla,
778
terminología, que puede ser descrito como un gráfico de G (N (G), C (G)), donde N (G) es un
conjunto de
entre nodos vecinos más próximos. Para hacer las comparaciones posteriores con el
arrays sistólicos convencionales más fácil, las dimensiones de la TnFDSA son nxnx2 donde
{Ij, k} y {tx, ~, y} son dos conjuntos de índices que se utilizan para tratar un particular,
conexión y el nodo de la matriz, respectivamente. Con esta notación, N (G) y C (G) puede
ty = 0..1
~. "L ~ / 1 = ct + l si ct <n-1
L wnere J = 13 + 1 si ~ <n-1
~ 0 si ~ / ~ 1
{O = Ol
Nct'13'0 T a = 1..n-2 13 = ~. nI y TM 0 1 ..
Figura 1: La TnFDSA
Cada nodo de procesamiento, N, se divide en dos partes internas. Ellos son los
formación. Así, los datos se pueden pasar lateralmente a otros nodos vecinos en la misma
capa, así como el nodo en la capa adyacente vertical de malla. La complejidad de los circuitos
es despreciable.