Está en la página 1de 226

Modelo paramtrico de arquitectura para la generacin de primitivas computacionales.

Mara Teresa Signes Pont


Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
TESIS DOCTORAL
MODELO PARAMTRICO DE
ARQUITECTURA PARA LA
GENERACIN DE PRIMITIVAS
COMPUTACIONALE S
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
UNIVERSIDAD DE ALICANTE
i
TESIS DOCTORAL
MODELO PARAMTRICO DE
ARQUITECTURA PARA LA
GENERACIN DE PRIMITIVAS
COMPUTACIONALE S
Presentada por
Mara Teresa Signes Pont
Dirigida por
Dr. Juan Manuel Garca Chamizo
Departamento de Tecnologa Informtica y
Computacin
Mayo de 2005
i JHIVfcftSl'KfiJ'At.ACW-'r
! J JUNV 0 0 5
!j El Vl ALV-, 3 .:.. U _\
? NO.-n. . . . . *. . . . ! M'.'<m

Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
A Teresa
A Jos Toms
A la memoria de mis padres
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
AGRADECIMIENTOS
Me toca escribir ahora la pgina ms difcil de este documento. Cmo resumir en
unas pocas palabras las sensaciones, reflexiones, sentimientos, enormemente
diversos y tal vez contradictorios, que he podido acumular a lo largo de estos
aos? ...Pero, tal vez interese menos valorar los pormenores de un proceso largo y
complejo, como es la realizacin de una investigacin y la escritura de una tesis,
que apreciar un resultado, sobre todo cuando ste ha merecido la pena. Aadir,
adems, que este logro no es slo cosa de esta doctoranda.
Deseo expresar mi profundo agradecimiento al director de mi tesis, Dr Juan
Manuel Garca, por haber confiado en m y haberme guiado por el camino
correcto. Gracias, Juanma, por tu dedicacin, tu respaldo, tus mltiples
enseanzas y... por tu infinita paciencia.
A Jero, Higinio y Goyo, amigos y conocedores de las convoluciones: gracias
por vuestra valiosa ayuda en el trabajo cientfico, as como por el apoyo anmico
que me habis prestado.
No olvido la contribucin de mis compaeros del grupo de investigacin: Jorge,
Paco Flrez, Andrs, Javi, Joan Caries, Dani, Jos Lus, Toni, Paco Pujol, Mora,
Jos Garca, Antonio Soriano, Paco Maci, Vicente, Ana, Juan Antonio y
David, as como Andrs Almela y Anabel. A todos vosotros os agradezco
vuestras aportaciones y vuestra amabilidad.
A Jos Toms y a mi pequea Teresa, qu deciros? Sois mi vida!
Al final, pero sobre todo, a la memoria de mis padres.
vn
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
viii
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
RESUMEN
Esta investigacin est orientada a la mejora de prestaciones de los
computadores. Dentro de las posibles estrategias encaminadas a proporcionar
una respuesta, la lnea que se propone es la de buscar tcnicas operatorias
sistemticas que instrumenten, al nivel de primitivas, operaciones que las
arquitecturas convencionales proporcionan como de alto nivel. Ms
concretamente, el problema que se plantea es el de evaluar funciones con la
mxima especificidad, esto es, con el nivel de derivacin ms bajo posible.
Se aborda la bsqueda de las primitivas adoptando inicialmente la convolucin
de funciones como mtodo de evaluacin de stas. Se proporciona as una
solucin de partida de propsito general que tiene un alto grado de derivacin.
La solucin final se obtiene convirtiendo la convolucin en una operacin
recursiva que tiene la forma de suma ponderada. Desde el punto de vista de la
algoritmia de obtencin de los clculos, el mtodo consiste en obtener un nuevo
valor de la funcin en cada paso de la iteracin a partir del valor que tena en el
paso de iteracin precedente. Los factores de ponderacin son de gran
importancia: son caracterizadores de la funcin evaluada. Ello puede
interpretarse como que sus valores constituyen una expresin condensada de la
lgica relacional algebraica presente en la expresin explcita de las funciones
de partida.
IX
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Los criterios de utilizacin del paso de iteracin abren la va para la
incorporacin, de manera intrnseca, de paralizacin de la operatoria. Se puede
operar en el extremo de la secuencialidad estricta, con un paso de iteracin
bsico, o utilizar pasos mltiplos del paso bsico para obtener valores semilla de
iniciacin a partir de los cuales se lanzan hilos paralelos de clculo; esto ltimo
puede hacerse a varios niveles de profundidad.
Se ha aplicado este mtodo con xito en el caso de las rotaciones y de un grupo
de transformaciones configurables como rotaciones.
Se han mostrado tambin ejemplos de funciones cuya evaluacin no es
abordable a nivel de primitivas, adelantando de forma emprica, de momento, su
posible evaluacin con ms niveles de derivacin.

Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
RESUM
Aquesta investigaci est orientada cap a la millora de prestaciones dels
computadors. De totes les estratgies possibles encaminades a satisfer aquest
objectiu, la lnia seguida es la de buscar tcniques operatries sistemtiques que
instrumenten a nivell de primitives les operacions que les arquitectures
convencionals proporcionen com de alt nivell. Concretament, el problema
plantejat es el d'avaluar funcions amb la maxima especificitat, i ac significa
avaluar-es amb el nivell de derivado mes baix possible.
La busca de les primitives s'aborda fent servir inicialment la convoluci de
funcions com un mtode per a avaluar-es. Aix es proporciona una soluci de
partida que implica un nivell de derivado levt. La soluci final s'obt
convertint la convoluci en una operado recursiva que t forma de suma
ponderada. Des del punt de vista de algoritmia que permet Pobtenci dels
calculs, el mtode consisteix en obtenir un nou valor de la fund en cada pas de
la iterado, a partir del valor que tenia en el pas de la iterado precedent. Els
factors de ponderaci tnen gran importancia: son els que caracteritzen la funci
avaluada. La interpretado que pot fer-se d'ao s que els valors dels factors son
l'expressi condensada de la lgica relacional algebraica palesa en l'expressi
explcita de les funcions de partida.
xi
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Els criteris d'utilitzaci del pas d'iteraci obrin la via per a incorporar, de
manera intrnseca, la paralel-lelitzaci de l'operatria. Es pot operar seguint la
seqencialitat estricta, amb un pas d'iteraci basic, o utilitzant pasos mltiples
del basic per a calcular uns valors que iniciarn linies paral-leles de calcul.
Aquesta paralel-lelitzaci pot repetir-se formant un arbre cada vegada mes
profund.
Aquest mtode s'aplica amb xit en el cas de les rotacions i en un grup de
transformacions configurables com a rotacions.
Es mostren tamb exemples de funcions no avaluables directament per les
primitives i se'n proposa una soluci, emprica de moment, que involucra mes
nivells de derivado.
xu
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
ABSTRACT
This research is oriented to computer performance improvement. Among the
whole range of strategies that can lead to this objective, the proposal approach
deals with systematic operating technics which have the capability to implement
at the primitive level the same operations that conventional architectures
provide as high level ones. Particularly, the problem raised aims the maximum
specific function evaluation, which means achievement of the lowest level of
derivation possible.
The search of primitives is tackled by developing function evaluation by means
of convolution. This way, a general purpose starting point solution with a high
degree of derivation is provided. The final solution is obtained by converting
the convolution into a recursive operation shaped as a weighted sum. From an
algorithmic point of view, the calculation method consists in obtaining a newer
value at every iteration step by using a former calculated function value in a
previous iteration step. The weighting parameters are quite significant, as they
characterize the resulting function. This fact can be understood as if the whole
algebraic relational logic laying in the formal expression of starting point
functions was embedded in parameter values.
Criteria on using iteration step open paths for an intrinsic incorporation of
operation parallelization issues. This way, it is possible to operate in both
xni
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
extreme strict sequentially border way, using a basic iteration step, and in
multiple basic step way in order to obtain initialization seeds for which parallel
calculating threads can be run. This latter fact can be achieved by using multiple
depth levels.
The method proposed has been successfully used for performing rotations and
also for a set of transforms that can be configured as rotations.
Some function examples which cannot be evaluated at the primitive level are
also shown. For these cases an empiric solution has been suited that introduces
some principles for future research of derivative solution of the method.
xiv
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Tabla de contenidos
TABLA DE CONTENI DOS
CAPTULO 1
INTRODUCCIN 1
1 Motivacin y objetivos 1
2 Conocimiento actual y problemas abiertos 7
3 Formulacin del problema y propuesta de resolucin 33
CAPTULO 2
MTODO DE EVALUACIN RECURSIVA BASADO EN CONVOLUCIN
(CBRM) 37
1 Introduccin 37
2 Acerca de la convolucin 39
3 Fundamentacin terica del CBRM 42
4 Desarrollo formal del CBRM 53
5 Aplicacin del CBRM 59
6 Primitivas y derivadas 64
7 Conclusin 70
CAPTULO 3
ARQUITECTURAS CBRM 71
1 Introduccin 71
2 Arquitectura del procesador CBRM 72
3 Evaluacin de la arquitectura CBRM 79
4 Mejora de la arquitectura CBRM 91
5 Conclusin 102
XV
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
CAPTULO 4
CLCULO DE ROTACIONES MEDIANTE CBRM 103
1 Introduccin 103
2 Rotaciones en el plano 104
3 Aplicacin del CBRM a la transformada de Hough 108
4 Aplicacin del CBRM a la transformada de Fourier 119
5 Aplicacin del CBRM a otras transformadas 140
6 Conclusin 143
CAPTULO 5
SIMULACIN DE COMPORTAMIENTO DIFCILMENTE FORMALIZABLE 145
1 Introduccin 145
2 Aplicacin del CBRM a la simulacin de algunos procesos
computacionales biolgicos 147
3 Conclusin 162
CAPTULO 6
CONCLUSIONES 165
1 Aportaciones 165
2 Lneas de trabajo futuro 169
REFERENCIAS 173
XVI
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
LISTA DE FIGURAS xvii
LISTA DE TABLAS xix
Lista de Figuras
LISTA DE FIGURAS
Figura 2-1. Planteamiento formal del CBRM
Figura 2-2. Familia 1
Figura 2-3 Familia 2
Figura 2-4. Familia 3
Figura 2-5. Familia 4
Figura 2-6. Familia 5
Figura 2-7. Familia 6
Figura 2-8. Mapa bidimensional de localizacin de las familias de
funciones asociadas a la convolucin de constante por
potencial
Figura 3-1. Estructura general del procesador CBRM que presenta tres
mdulos principales
Figura 3-2. Esquema funcional del mdulo de clculo
Figura 3-3. Camino seguido por los datos
Figura 3-4a. Mdulo Tlu representado simblicamente e instanciado por
una ROM
Figura 3-4b. Mdulo Puntos representado simblicamente
Figura 3-4c. Instanciacin del mdulo Puntos por dos multiplexores
Figura 3-4d. Mdulo Counter representado simblicamente e instanciado
por un contador.
Figura 3-4e. Mdulo MEM representado
Figura 3-4f. Estructura del mdulo MEM
Figura 3-4g. Mdulo Prueba representado simblicamente
Figura 3-4h. Mdulo Prueba instanciado por puertas XOR.
Figura 3-4i. Mdulo Elemento recursivo representado simblicamente
xvu
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Lista de Figuras
Figura 3-4j. Mdulo Elemento recursivo instanciado por puertas XOR
Figura 3-4k. Mdulo MAC representado simblicamente
Figura 3-41. Mdulo de clculo CBRM representado simblicamente
Figura 4-1. Parametrizacin de rectas para la HT
Figura 5-1. Modelo bicompartimental de Pinsky y Rinzel
Figura 5-2a. Brote de muy baja frecuencia inducido por activacin
somtica (0,75-0,0-2,1)
Figura 5-2b. Brote de baja frecuencia inducido por activacin dendrtica
(0, 5-1,25-2,1)
Figura 5-2c. Picos de alta frecuencia en el soma con la mayor que en 5.2a
Figura 5-2d. Idnticas condiciones a las de 5.2c pero con mayor
acoplamiento(2,5-0,0-10,5)
Figura 5-2e. Estimulacin dendrtica y acoplamientos bajos (0,5-1,75-
1,425) produce espigueo complejo formado por picos
seguidos por brotes
Figura 5-3a. Simulacin por el CBRM del registro de la Figura 5.2a
Figura 5-3b. Simulacin por el CBRM del registro de la Figura 5.2b
Figura 5-3c. Simulacin por el CBRM del registro de la Figura 5.2c
Figura 5-3d. Simulacin por el CBRM del registro de la Figura 5.2d
Figura 5-3e. Simulacin por el CBRM del registro de la Figura 5.2e
Figura 5-4. Registros fisiolgicos de los estados V)(t), V
2
(t), V
3
(t), V
4
(t)
Figura 5-5. Simulacin de los estados Vi(t), V
2
(t), V
3
(t), V
4
(t)por una
memoria de Hopfield
Figura 5-6. Circuito que implementa el CPG modelado por la memoria de
Hopfield
Figura 5-7a. Simulacin por el CBRM de Vi(t)
Figura 5-7b. Simulacin por el CBRM de V
2
(t)
Figura 5-7c. Simulacin por el CBRM de V
3
(t)
Figura 5-7d. Simulacin por el CBRM de V
4
(t)
xvni
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Volver al ndice/Tornar a l'ndex
Lista de Tablas
LISTA DE TABLAS
Tabla 2-1. Tabla de equivalencia de algunas funciones usuales
Tabla 2-2. Descomposicin de algunas funciones usuales
Tabla 2-3. Comportamiento correspondiente a las familias de funciones
asociadas a la convolucin de constante por potencial
Tabla 3-1. Estructura de una tabla LUT con fragmentos de 2 bits
Tabla 3-2. Estimacin de la memoria ocupada por una LUT
Tabla 3-3. Estimacin del rea total ocupada por el mdulo de clculo
del CBRM
Tabla 3-4. Estimacin del tiempo de clculo del CBRM
Tabla 3-5 Estimaciones de tiempo del mdulo de clculo CBRM
implementado en la FPGA xcv300e-6bg352.XST de Xilinx
Tabla 3-6a. Estimacin del rea total ocupada por las implementaciones
con sumador secuencial y con reductores para = 16 bits
Tabla 3-6b. Estimacin del rea total ocupada por las implementaciones
con sumador secuencial y con reductores para = 32 bits
Tabla 3-6c. Estimacin del rea total ocupada por las implementaciones
con sumador secuencial y con reductores para = 64 bits
Tabla 3-7a. Estimacin del tiempo de clculo en las implementaciones
con sumador secuencial y con reductores para =16 bits
Tabla 3-7b. Estimacin del tiempo de clculo en las implementaciones
con sumador secuencial y con reductores para n- 32 bits
Tabla 3-7c. Estimacin del tiempo de clculo en las implementaciones
con sumador secuencial y con reductores para n= 64 bits
Tabla 3-8a. Estimacin del rea total ocupada por la implementacin con
datos particionados para =32 bits y n= 64 bits
Tabla 3-8b. Estimacin del tiempo de clculo en la implementacin con
datos particionados para n= 32 bits y = 64 bits
xix
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Lista de Tablas
Tabla 3-9. Estimacin del tiempo de clculo y del nmero de mdulos
en el clculo secuencial y paralelo
Tabla 3-10. Comparacin de ganancia en velocidad, productividad y
eficiencia entre el clculo secuencial y paralelo
Tabla 4-1. Algunas transformadas ortogonales
Tabla 4-2. Estimacin del rea ocupada por la implementacin CORDIC
Tabla 4-3. Estimacin del rea ocupada por la implementacin CBRM
Tabla 4-4. Tiempo de clculo del CBRM
Tabla 4-5. Estimacin del rea ocupada para el CORDIC paralelo
Tabla 4-6. Estimacin del tiempo de clculo para el CORDIC paralelo
Tabla 4-7a Estimacin del rea ocupada por el CBRM paralelo para
N=64 (Ni=2 y N2=32, tiempo de clculo mximo)
Tabla 4-7b Estimacin del rea ocupada por el CBRM paralelo para
N=64 (Ni=6, i e[ l , 6], rea ocupada mxima)
Tabla 4-8a Estimacin del tiempo de clculo del CBRM paralelo para
N=64 (Ni=2 y N2=32, tiempo de clculo mximo)
Tabla 4-8b Estimacin del tiempo de clculo del CBRM paralelo para
N=64 (Ni=6, i e[ l , 6], rea ocupada mxima)
Tabla 4-9. Comparacin entre arquitectura segmentada y CBRM en
ocupacin de rea y tiempo
Tabla 4-10. Camino crtico en el mdulo bsico del diseo basado en
aritmtica distribuida por bloques
Tabla 4-11. Comparacin del hardware necesario en las arquitecturas
CBRM y BDA
Tabla 4-12. Comparacin de las arquitecturas CBRM y BDA en trminos
de T
a
y x
t
Tabla 4-13. Comparacin de la arquitectura CBRM con otras propuestas
xx
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Volver al ndice/Tornar a l'ndex
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
Capitulo 1
iNTRODUCaN
1 Motivacin y objetivos
El procesamiento de informacin es un fenmeno ubicuo e inherente a la
dinmica de los sistemas. Se identifican distintos estilos de computar entre los
que destacan aqullos que han sido ideados por el ser humano para resolver
problemas concretos y los que caracterizan los sistemas naturales, fsico-
qumicos o biolgicos, como resultado de su interrelacin con el entorno.
El grado de consolidacin de las ideas y conceptos en disciplinas como la fsica y
las matemticas junto con el nivel de desarrollo tecnolgico alcanzados en el siglo
XX han propiciado la emergencia de la informtica^ que engloba en su cuerpo de
conocimiento cuestiones relacionados con el procesamiento de informacin. A
pesar de lo moderno de la disciplina como tal, la preocupacin por el tema, tanto a
nivel conceptual como de realizacin, no es nueva. Se sabe que en el ao 450
A.C., Scrates ya preguntaba a Anaxgoras por "...un procedimiento efectivo de
clculo...", entendindose la pregunta como una alusin a un sistema en el cual,
dadas unas entradas, se obtendra sistemticamente un resultado. Se tiene
constancia igualmente de un dispositivo antiguo que sistematiza el clculo: el
abaco, inventado por los egipcios en esa misma poca y perfeccionado en China a
principios del siglo segundo D.C. Su vigencia es tal que, en 1945, en un concurso
en el que competan un abaco y una calculadora, en lo que respecta a la velocidad
1
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
y a la exactitud de los clculos, gan el abaco [Cardona, 1996]. A lo largo de la
historia, la bsqueda de soluciones a problemas concretos de clculo ha
proseguido, cristalizando en implementaciones consonantes con la tecnologa del
momento, hasta que un volumen suficiente de conocimiento emprico ha acabado
generando mtodo. De la interrelacin entre el mtodo y las mltiples
resoluciones de los problemas concretos emerge una va enormemente productiva
que explica la situacin actual: los avances conseguidos y la velocidad a la que se
siguen produciendo.
La evolucin ocasionada por el refinamiento de los mtodos de clculo y de las
realizaciones propicia una diversificacin de los paradigmas de computacin,
todos ellos animados por un objetivo comn que es el de resolver cada vez
mejor lo que abordan. Desde la arquitectura de computadores, la nocin de
rendimiento es indisociable de la idea de bondad. Las CPUs convencionales
implementan primitivas como la suma y la multiplicacin, realizadas bit a bit de
forma secuencial por los circuitos electrnicos. Esta base fsica sostiene una
jerarqua de niveles de computacin que se materializan por lenguajes, cada vez
ms sofisticados, que van desde expresar las operaciones de forma muy
elemental, en trminos de transferencia de datos a registros o desde ellos
(ensamblador), hasta la expresin ms refinada representada por la forma
algebraica concisa que utiliza variables (lenguajes de alto nivel). Cada nivel de
abstraccin oculta detalles al nivel superior y, de la diversidad de realizaciones
de cada nivel, se desprenden ejecuciones ms o menos productivas de una
misma computacin. Existen tcnicas reconocidas de mejora del rendimiento
como son la segmentacin [Schwarz, 1996], [Beaumont-Smith et al, 1998] y la
anticipacin [Schmookler, 2001], [Lang, 2004], que aumentan la rapidez de
respuesta, o la comparticin que reduce la cantidad de recursos [Tan, 2003],
generalmente, un compromiso razonado entre todas ellas es el que acaba
proporcionando soluciones realistas.
2
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
Dentro de las posibles orientaciones encaminadas a proporcionar una respuesta, la
lnea que se propone es la de buscar mtodos de operar que instrumenten, al nivel
de primitivas y para procesadores de propsito general, operaciones que, por tener
cierta complejidad, han sido implementadas tradicionalmente como operaciones
de alto nivel. Con ello se prev una repercusin notable en la dinmica de
ejecucin de los clculos dado que, la obtencin de una potencia de clculo
equivalente deber requerir menor nmero de niveles. Asimismo, estas
arquitecturas tendrn presumiblemente implicaciones en la lnea de facilitar la
formulacin, el modelado y el clculo de problemas que actualmente se resuelven
con dificultad apreciable. Por poner un ejemplo, en la actualidad, la simulacin de
la respuesta en forma de trenes de pulsos de alta frecuencia que tienen las
neuronas biolgicas ante estmulos pulstiles, se realiza concibiendo la neurona
como un complejo circuito electrnico y generando la respuesta como la salida
funcional de dicho circuito. Pensar que la interaccin neuronal en un sistema
nervioso es, a su vez, una funcin compleja de la respuesta de cada neurona
sugiere que la tecnologa actual est lejos de la potencia de un sistema nervioso si
el planteamiento sigue siendo de sntesis funcional a partir de las primitivas
computacionales.
El planteamiento que aqu se hace recuerda en cierta medida, a los pasos seguidos
en computacin grfica, esto es, implementar al nivel ms bajo operaciones que
3
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
en el pasado se obtenan por sntesis de otras ms simples. Las ventajas son de
todos conocidas.
El objetivo de este trabajo es contribuir a la mejora del rendimiento de los
procesadores. Generalmente, las mejoras suelen producirse en los casos en que
la resolucin de un problema se hace de forma dedicada, a la medida de sus
caractersticas; ste es el principio sobre el que se basan los procesadores de
propsito especfico. En cambio, en los procesadores de propsito general, las
mejoras dependen de un equilibrio entre varias de sus prestaciones y, por tanto,
conseguir mejores rendimientos plantea un reto de mayor envergadura. Esta
investigacin se sita en la lnea de aumentar el rendimiento buscando al nivel
del hardware modos de operar capaces de implementar funciones que otras
arquitecturas proporcionan como de alto nivel y ello para propsito general.
Este objetivo general se desglosa en objetivos ms especficos que condicionan,
orientan y organizan el trabajo. A continuacin se enuncian estos objetivos.
Proponer una modelizacin de la operatoria que permita disear primitivas
computacionales implementables a nivel de hardware, cuya potencia
expresiva sea superior a la que proporcionan las primitivas habituales.
Generalmente las mquinas organizan la computacin siguiendo un
esquema de niveles ordenados jerrquicamente y cada nivel contiene
operaciones de mayor potencia que los niveles precedentes. La propuesta va
en la lnea de iniciar la jerarqua a partir de un nivel ms alto que el
habitual, que es el de las primitivas suma y multiplicacin, instrumentadas
por el hardware de la mquina. As, las primitivas que hay que disear para
ser implementadas por ese primer nivel de hardware debern proporcionar
operaciones ms sofisticadas que la suma y la multiplicacin.
4
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
Pasando al nivel de realizacin, disear una arquitectura que implemente el
modelo computacional propuesto y valorar su utilidad para la resolucin de
algunos problemas, proporcionando asistencia complementaria o alternativa
a la propuesta existente.
La memoria que sustenta este trabajo se organiza en seis captulos.
El captulo primero, de introduccin, est dedicado a expresar las motivaciones
que han llevado a la realizacin de la investigacin recogida en este documento, a
exponer los objetivos propuestos y a describir y analizar el conocimiento actual
en torno al tema tratado, finalizando con una definicin del problema planteado y
su propuesta de resolucin.
Siguiendo al captulo de introduccin, el captulo segundo desarrolla el Mtodo
de evaluacin Recursiva Basado en Convolucin (CBRM). Despus de revisar
algunas nociones de la teora de la medida y de la teora de representacin de
grupos se propone la convolucin de funciones como mtodo de evaluacin. El
objetivo de rendimiento computacional hace buscar una operatoria con menor
coste que el clculo directo de la convolucin. Para ello se regulariza la
convolucin sobre una operacin recursiva paramtrica que calcula los puntos de
5
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
las funciones por iteracin. Seguidamente, se definen las primitivas propias de
este tipo de operatoria como base para proponer un procesador.
El captulo 3 se ocupa del diseo y evaluacin de la arquitectura asociada al
Mtodo de valuacin Recursiva Basada en Convolucin (CBRM). Se describen
los mdulos funcionales de la arquitectura CBRM facilitndose para el mdulo de
clculo estimaciones del tiempo de clculo y del espacio ocupado, tanto en
unidades independientes de implementacin como a partir de la simulacin en
una plataforma de lgica reconfigurable. La posibilidad de introducir paralelismo
en algunas etapas de la arquitectura CBRM sugiere distintas vas de mejora de las
prestaciones. El captulo concluye con diversas propuestas de paralelizacin, con
el estudio correspondiente de rendimiento.
El captulo 4 trata algunas aplicaciones del CBRM. Se aborda en primer lugar la
evaluacin a nivel de primitivas de las rotaciones como funciones relativamente
sencillas pero pilares bsicos de un gran nmero de transformadas matemticas,
stas ltimas con presencia destacada en diversos mbitos de la ciencia y la
ingeniera. Se propone la transformada de Hough como ejemplo de funcin
basada en rotaciones y se realiza una comparacin entre el CBRM y otras
propuestas en relacin con el tiempo de clculo y el rea ocupada. Se estudian
igualmente las transformadas ortogonales con la propuesta de un patrn comn de
clculo, basado en rotaciones, para todas ellas. En este caso, acta como
paradigma la transformada de Fourier. Finaliza el captulo cuarto con el estudio
de la evaluacin de la transformada de Fourier por el CBRM y por otros mtodos,
facilitndose una comparacin en trminos de rea ocupada y de tiempo.
En el captulo 5, se aborda el problema de las funciones no valuables a nivel de
primitivas por el CBRM. Como ejemplo, se presentan algunos comportamientos
de difcil formalizacin proporcionados por subsistemas neuronales. Se adelanta
una solucin emprica cuyo propsito es hacer entrever la capacidad del CBRM
6
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
2 Conocimiento actual y problemas
abiertos
En primer lugar se revisan las aportaciones ms relevantes en la aritmtica del
computador donde aparecen principalmente dos orientaciones: por una parte, la
mejora en la implementacin de las operaciones primitivas bsicas habituales,
suma y multiplicacin y, por otra, la propuesta de evaluacin de funciones
desde el hardware de la mquina, basndose en dichas primitivas. En un
segundo tiempo, teniendo en cuenta los objetivos que se propone esta
investigacin, he considerado necesario estudiar el caso de algunas funciones
sofisticadas que se implementan como primitivas para procesadores
especializados en otros campos de la informtica. Aunque no nicos, los
principales campos tratados en relacin con esta cuestin y mencionados en esta
memoria son la morfologa matemtica dentro del anlisis de imagen y la
computacin grfica. Seguidamente, se hace una breve resea de los hitos
destacables en el campo de la computacin cuntica, teniendo en cuenta los
aspectos ms relacionados con el tema central de esta investigacin, que son los
mtodos y las arquitecturas dedicados a la evaluacin de funciones. Para
finalizar este apartado se mencionan los modelos computacionales ms
7
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
importantes utilizados en el campo de la neurociencia, ya que existe tambin la
motivacin de abordar en esta investigacin la reproduccin de las
funcionalidades que manifiesta el tejido vivo.
2.1 Aritmtica del computador
La norma IEEE-754 para coma flotante establece un esquema discreto para la
representacin de los nmeros reales en un computador [Cornea-Hasegan,
1999], [Schwarz,1999], [Schwarz,2003], [http://cch.loria.fr/documentation
/IEEE-754/index.html]. Dicha norma estructura la representacin del nmero
real en tres componentes: signo, mantisa y exponente y establece la precisin de
las operaciones bsicas que todo procesador debe implementar; estas
operaciones son la suma, la multiplicacin, la divisin y la raz cuadrada. Por
ser primitivas, la suma y la multiplicacin son las operaciones que se efectan
ms frecuentemente sobre operandos reales.
Para la suma, es habitual concentrar el esfuerzo de mejora en el tratamiento de
las mantisas debido a que es la parte que entraa ms complejidad ya que
requiere desplazamientos de normalizacin y alineamiento, complemento y
redondeo. El tratamiento del exponente se realiza en paralelo con el clculo
anterior y se reduce a desplazamientos y sumas de muy pocos bits [Obermann,
1997], Cada operacin se completa con una etapa de redondeo [Even, 2000],
[Parks, 2000]. La segmentacin es el mtodo ms comnmente empleado para
aumentar la cantidad de sumas por unidad de tiempo, pero esto no reduce
necesariamente el tiempo de latencia del algoritmo. La reduccin de la latencia
suele venir dada por la realizacin de operaciones en paralelo, casi siempre a
costa del empleo de hardware adicional [Quach y Flynn, 1990], [Quach y Flynn,
1992], [Kantabutra, 1993], [Dadda, 1996], [Bruguera2001]. Las propuestas ms
novedosas profundizan en el paralelismo y en el desarrollo de esquemas de
latencia variable aprovechando que no todos los componentes del sumador son
8
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
necesarios con determinados operandos de entrada, reducindose as la latencia
media [Beaumont-Smith et al. 1998], [Takagi y Horiyama, 1999], [Cheng et al,
2000], [Kalampukas et al, 2000], [Um y Kim, 2001].
La multiplicacin, consta de la suma de varios productos parciales desplazados,
cada uno de los cuales, en su forma ms sencilla, es un producto del
multiplicando por un dgito del multiplicador [Callaway y Schwarzlander, 1997 ],
[Stelling et al, 1998]. El algoritmo se realiza en tres etapas: generacin de los
productos parciales, reduccin el nmero de productos y suma final con
propagacin del acarreo. El aumento de prestaciones puede realizarse incidiendo
en cada una de las etapas mencionadas. La construccin de los productos
parciales puede realizarse mediante un conjunto de puertas AND que operan
sobre cada dgito del multiplicando y el multiplicador, de forma clsica o bien
utilizando algoritmos avanzados como el de Booth [Booth, 1951] o alguna de sus
variantes [Altwaijry y Flynn, 1995], [Goto, 1997], [Yeh y Jen, 2000]. Otros
autores proponen tcnicas de generacin de los productos parciales que obtienen
ventajas recodificando los operandos antes de la generacin [Law et al, 2000],
[Skin y Jeon, 2000], [Seidel, 2001]. Despus de la generacin de los productos
parciales, los multiplicadores de alto rendimiento no suman directamente, sino
que combinan los productos parciales, reduciendo su nmero hasta un nmero
total de dos, que se suman al final. La combinacin mencionada se realiza por
circuitos contadores [Wallace, 1964], [Dadda, 1965] o compresores [Weinberger,
1981], [Song y De Michelli, 1991], [Kwon et al, 2000], [Bickerstaff, 2001],
basados en elementos de suma sin acarreo [Bewick y Flynn, 1992], [Omondi,
1994], [Oklobdzija et al, 1996], [Choi et al., 1997], que son conectados entre s
formando una topologa determinada, por ejemplo, en rbol [Ta kagi et al, 1985].
En la suma final con propagacin de acarreo, los esquemas empleados son los
que ya se han mencionado en el prrafo dedicado a la suma, pudindose
emplear tambin algoritmos de suma entera.
9
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
El clculo de funciones es de enorme importancia para aplicaciones en reas
diversas de la ciencia y la ingeniera, entre las que destacan, por ejemplo, el
procesamiento digital de la seal, la computacin grfica y cientfica y las
aplicaciones para tiempo real. En la actualidad, los planteamientos relativos al
clculo de funciones son de dos tipos: los de propsito general, que pretenden
dar una respuesta global al problema: entre ellos, destaca el algoritmo CORDIC
(Coordinate dotation Digital Computer) [Voider, 1959], [Walther, 1971]
[Haviland, 1980], [Nakayama, 1989], como tcnica iterativa que slo requiere
operaciones de suma y desplazamiento y, por otra parte, las propuestas
especialmente pensadas para aumentar las prestaciones en el clculo de alguna
funcin o grupo de funciones en particular. Al respecto, se puede citar como
ejemplo la aritmtica asociada al sistema logartmico [Coleman, 2000],
[Chichyang, 2000] que mejora la eficiencia en el clculo de funciones como las
funciones trigonomtricas. Tambin existen algoritmos con menos peso
conceptual, especialmente pensados para el clculo de las funciones elementales
ms habituales (inversa, raz cuadrada, inversa de la raz cuadrada...). Cada uno
de estos algoritmos ha dado lugar a una gran variedad de implementaciones
hardware, con resultados altamente competitivos debido a los avances recientes
de la tecnologa VLSI [Koren, 1993], [Ercegovac et al, 2000a], [Ercegovac et
al, 2000b],
A continuacin se revisan los mtodos de clculo de funciones ms relevantes en
la actualidad.
Algoritmo CORDIC
Introducido por Voider en 1959 para la evaluacin de funciones trigonomtricas
y la conversin de coordenadas rectangulares a coordenadas polares, el
CORDIC fue generalizado y unificado por Walter en 1971 para obtener adems
funciones hiperblicas y lineales. Es el algoritmo ms comnmente empleado
en los coprocesadores clsicos (18087, HP35, M68881, M68882.,.). En los
10
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
ltimos aos, este algoritmo ha dado lugar a un intenso desarrollo de mltiples
implementaciones hardware para aplicaciones especficas, como procesamiento
digital de la seal y de la imagen [Ahmed, 1990], [Hu, 1992], lgebra matricial
[Cavallaro, 1988], [Cavallaro, 1991], [Ercegovac, 1994] robtica, aplicaciones
grficas y simulacin, que demandan alta velocidad y precisin. Existen
diferentes arquitecturas que implementan el algoritmo CORDIC. La arquitectura
deseable es, naturalmente, la que consigue el mejor compromiso en cuanto a
rea y velocidad para la aplicacin requerida.
La arquitectura COiD/C-iterativa es la que procesa con una cadencia igual al
producto del nmero de iteraciones por el tamao de los datos. El diseo bit-
paralelo, que traduce al hardware las tres ecuaciones del CORDIC, tiene un
nmero de entradas elevado y, por tanto, suele ser lento en las plataformas de
lgica reconfigurable. En cambio, el diseo bit-serie es mucho ms compacto y
rpido debido a que usa aritmtica serie: sta representa un tipo de
interconexin y una lgica simplificadas aunque tenga que utilizar tantos relojes
como precisin tienen los sumadores.
La arquitectura CORDIC-on line es la que procesa las iteraciones de forma
desarrollada, esto es, haciendo que haya un elemento de procesamiento por cada
iteracin [Wang, 1996]. Este modo aporta dos simplificaciones significativas,
que son la posibilidad de cablear los desplazamientos (uno fijado por cada
desplazador) y los ngulos (uno por cada sumador). Ello repercute en un ahorro
importante de memoria, haciendo que esta arquitectura resulte finalmente en
una cadena de sumadores-restadores interconectados. Este circuito enteramente
combinacional puede segmentarse fcilmente insertando registros entre los
sumadores. Este diseo puede transformarse en bit-serie reemplazando cada
sumador por un sumador serie, separndolos por registros de desplazamiento de
tantos bits como la precisin de los datos.
11
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
Conseguir altas prestaciones requiere disponer de varios procesadores bit-serie
procesando en paralelo o bien montar un cauce paralelo de procesadores
desarrollados.
En la ltima dcada, el algoritmo CORDIC ha motivado numerosos trabajos de
investigacin relativos a propuestas diversas (aumento del radix, tcnicas de
compensacin del factor de escala, aplicaciones del algoritmo tridimensional,
implementaciones para tarjetas de lgica reconfigurable..), que permiten cada
vez mejores prestaciones [Bruguera, 1993], [Antelo, 1996a], [Antelo, 1996b],
[Villalba, 1996], [Antelo, 1997a], [Antelo, 1997b], [Saz, 1998], [Villalba,
1998], [Antelo, 2000].
Sistema Logartmico
Frente a las limitaciones que impone la ejecucin en punto flotante, est la
propuesta de una aritmtica basada en la representacin logartmica de los
nmeros con el objetivo de aumentar la eficiencia en el clculo de las funciones
trigonomtricas [Das et al. 1995] y sus inversas. Otra ventaja de este sistema es
su precisin en las operaciones aritmticas: el error de la representacin es
menor que el del punto flotante as como el error de cuantizacin [Coleman,
1999]. El inconveniente del mtodo est en que la implementacin de la suma y
la resta precisa unos trminos auxiliares. stos pueden precalcularse y
almacenarse en una tabla look-up, a la que se ha de acceder, o calcularse
durante el proceso. El tamao de las tablas crece exponencialmente con el
tamao de la palabra. Se han propuesto diversas tcnicas de reduccin del
tamao de la tabla [Lewis, 1990], [Chen, 1998], [Coleman, 2000], se ha
recurrido a la aritmtica redundante [Arnold et al 1990], a la representacin
semi-logartmica [Muller, 1998] o tambin a la solucin hbrida, que consiste en
realizar la suma y la resta en punto flotante y la multiplicacin y la divisin en
sistema logartmico [Lai, 1993]. La ventaja del clculo es en cuanto a coste
[Chichyang, 2000]. El clculo, que consiste en evaluar iterativamente y de
12
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
Algoritmos para el clculo algunas funciones elementales
En este apartado se describen distintos algoritmos de clculo de funciones
elementales que cuentan en la actualidad con gran cantidad de propuestas de
implementacin hardware. Entre ellos destacan por su importancia aquellos que
tratan del clculo de la funcin inversa, seguidos por los de la raz cuadrada e
inversa de la raz cuadrada.
Las propuestas que tratan del clculo de la funcin inversa pueden separarse en
cinco grandes grupos: de recurrencia digital, iteracin funcional, de radix muy
alto, de acceso a tablas look-up y de latencia variable [Obermann y Flynn,
1997], [Kuhlmann y Pahi, 1998], aunque lo habitual es encontrar
combinaciones de dos o ms de ellas con el propsito de aunar ventajas.
La implementacin ms comn del clculo de la inversa utilizando recurrencia
digital [Ercegovac y Lang, 1994], [Lang, 2001] es la divisin SRT (Sweeny,
Robertson, Tocher) que presenta un buen compromiso entre rapidez de clculo
y coste en trminos de rea ocupada [Montuschi y Cimiera, 1993], [Montuschi
y Cimiera, 1994], [Harris et al, 1997], [Kornerup, 2003], [Me Can, 2003].
Los mtodos basados en iteracin funcional utilizan la aproximacin de
Newton-Raphson, [Flynn, 1970], [Schulte, 1994], la interpolacin polinmica o
el algoritmo de Goldschmidt [Ercegovac et al, 2000a]. El algoritmo de Newton-
13
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
Raphson es un mtodo iterativo con convergencia cuadrtica, que consiste en
buscar un valor inicial aproximado que se va refnando en cada iteracin por
multiplicacin por un factor que mide la proximidad entre la aproximacin
actual y el valor exacto. Si el valor inicial se elige suficientemente cerca del
valor exacto, se requieren menos iteraciones. Este requisito suele conseguirse
habirualmente empleando tablas.
En el acceso a tablas, como mtodo complementario a la iteracin funcional, la
tabla se utiliza para almacenar las semillas de inicio de las iteraciones, de forma
que se reduzca el nmero de iteraciones del algoritmo. Por ejemplo, el mtodo
propuesto por Wong y Goto [Wong, 1995] consiste justamente en hallar este
valor inicial direccionando la tabla de bsqueda por la mitad ms significativa
de los bits de la mantisa del nmero que hay que invertir. El mtodo de Ito,
Tagaki y Yajima [Ito, 1997] encuentra el valor inicial por aproximacin lineal,
buscando los dos coeficientes en una tabla direccionada por los m bits ms
significativos y, en vez de realizar una multiplicacin y una suma, propone una
modificacin que consiste en sustituir las dos operaciones por una nica
multiplicacin que se efecta sobre un operando modificado. Otras opciones
relevantes son las de Bail y Ercegovac [Bail y Bojanic, 2000], [Ercegovac et al,
2000b].
La aproximacin utilizando tablas particionadas simtricas se basa en el
desarrollo en serie de Taylor alrededor de un punto particionado en tres
porciones, con longitudes en bits diferentes [Schulte, 1997]. El desarrollo se
limita a los dos primeros trminos que son los que se almacenan en la tabla
bipartita. El primer trmino representa el valor de la funcin en la porcin ms
significativa del punto, mientras que el segundo trmino representa el valor de
la derivada de la funcin en la porcin menos significativa. La ventaja de este
mtodo en cuanto al ahorro de memoria se debe a que, en los trminos que hay
que almacenar, unos son el complemento a uno de otros. Esta aproximacin es
aplicable a muchas funciones (logaritmo, raz cuadrada, inversa,...) slo con
14
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
variar el intervalo inicial de definicin [Matula, 2001] y puede desarrollase para
tablas multipartitas [de Dinechin, 2001].
Los mtodos de interpolacin (polinmica, racional, basada en el desarrollo de
la funcin en serie de Taylor) precisan un clculo de coeficientes que puede
realizarse por mtodos distintos (Lagrange, Stirling, Tchebyshev,...). En este
sentido, la aproximacin polinmica es un caso particular de aproximacin
racional [Koren, 1990]. Incluye tres etapas: la reduccin del argumento a un
intervalo de aproximacin predeterminado, la evaluacin de la aproximacin
racional del argumento y la obtencin del resultado final. Los coeficientes de la
aproximacin se determinan de forma que minimicen el error relativo mximo
cometido en el intervalo. Si se particulariza para un polinomio de segundo
grado, la interpolacin se basa en los puntos extremos y el punto medio del
intervalo con la posibilidad de calcular los coeficientes durante la ejecucin, a
partir de los valores tabulados de puntos de la funcin, o bien de precalcularlos
y almacenarlos. La primera opcin es ms ventajosa en trminos de memoria
(un tercio menos) en detrimento del aumento de hardware y de tiempo de
ejecucin empleado en el clculo de los coeficientes. [Cao, 1997]. Existen
propuestas ms recientes que equilibran notablemente este compromiso [Cao,
2001].
Con respecto a los mtodos de radix alto, la propuesta es bastante amplia [Tenca
y Ercegovac, 1998], [Lang y Montuschi, 1999], [Montuschi y Lang, 2001],
[Matula, 2003], [Pineiro, 2003].
Entre los algoritmos de latencia variable destacan los trabajos de Williams y
Kuhlmann, [Williams et al, 1995], [Kuhlmann y Pahi, 1998]. Tambin pueden
encontrarse referencias a esta metodologa en la bibliografa reseada para otros
tipos de divisores, SRT y radix alto, que combinan ambos aspectos.
Los algoritmos para la obtencin de la raz cuadrada son similares a los
utilizados para obtener el cociente [Lang y Montuschi, 1999]. Sin embargo, la
15
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
repercusin en el rendimiento medio del sistema es menor que ste, por ser una
operacin, en general, menos frecuente.
La inversa de la raz cuadrada aparece con frecuencia en aplicaciones grficas y
multimedia y motiva igualmente cierta atencin en la lnea de los avances en las
operaciones de divisin y raz cuadrada [Takagi, 2001], [Lang, 2001], [Lang,
2003].
Como resulta patente despus de la presentacin de esta panormica, los avances
en aritmtica del computador se centran en mejorar las operaciones primitivas
computacionales habituales, suma y multiplicacin. Las operaciones que entraan
ms complejidad se relegan habitualmente a niveles ms altos, en los cuales el
tratamiento algortmico se hace ms especfico y, cada vez ms, las
implementaciones hardware dedicadas mejoran las ejecuciones de dichos
algoritmos.
2.2 Procesadores especializados
En la segunda parte dedicada a la revisin del conocimiento actual, se consideran
otros dos campos de la computacin: el tratamiento digital de imgenes y la
computacin grfica. Aunque no sean campos centrales al objeto de esta
investigacin en cuanto a objetivos ni contenidos, he considerado procedente
introducir aqu algunos ejemplos que pueden servir de soporte a las ideas que han
fundamentado los planteamientos de esta tesis.
Independientemente de lo especfico de las motivaciones y necesidades en cada
caso, en la morfologa matemtica aparecen ntidamente dos constantes: las
transformaciones geomtricas y la medicin [Serra, 1989], [Henk, 1998]. Las
transformaciones geomtricas tienen como finalidad normalizar los resultados de
la observacin realizada sobre los objetos. Se realizan en trminos de conjuntos
de elementos a fin de traducir una apreciacin morfolgica en otra cuantitativa.
16
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
La morfologa matemtica en el tratamiento digital de imgenes
La correcta formulacin de un problema requiere establecer una secuencia
jerarquizada de restricciones. El cuerpo terico de la morfologa matemtica
establece tres grados de restricciones: los principios de cuantificacin, los
criterios y los algoritmos. Cuatro principios controlan las transformaciones y las
mediciones: invarianza a traslaciones y a cambios de escala, principio de
conocimiento local y de semi-continuidad. El significado de los dos ltimos
principios tiene que ver con la robustez y estabilidad de la transformada
necesarias para la operatoria. Los dos primeros principios son ms especficos: la
invarianza a la traslacin restringe la metodologa al espacio eucldeo y a las
plantillas regulares de puntos. Siguiendo los principios, de menor a mayor
especificidad, estn los criterios y los algoritmos, respectivamente. Los criterios
se refieren a los requerimientos de un problema particular y los algoritmos
expresan con precisin las instrucciones a ejecutar para resolverlo.
En la morfologa matemtica, sobresale por su importancia la transformacin de
ganancia o prdida basada en consideraciones geomtricas fundamentales,
precursora de las operaciones de erosin y dilatacin [Matheron, 1967], [Serra,
1969], [Barrera, 1998]. Esta transformacin cuantifica genricamente las
17
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
caractersticas consideradas de inters en la imagen, cualquiera que sea su
procedencia, como el rea, las particiones y el recuento de partculas. Ello
precisa la definicin de un elemento estructurante, que no tiene porqu ser
nico, y que acta como "unidad". La transformacin que se obtiene de la
imagen inicial vara segn la configuracin que toma el elemento estructurante
[Gasteratos, 1998]
Las particularizaciones de la transformacin de ganancia o prdida en el plano
operativo conducen a la definicin de la dilatacin y la erosin, operaciones
duales, repetibles de forma iterativa. Las propiedades algebraicas de estas
operaciones tienen consecuencias tecnolgicas importantes [Hadwiger, 1957],
algunas de las cuales cito a continuacin. La propiedad distributiva de la erosin
(dilatacin) con respecto a la interseccin (unin) permite fijar una forma
ventajosa de mecanizarlas sobre los materiales en la industria. En cambio, la
erosin (dilatacin) no es distributiva con respecto a la unin (interseccin). De
ello se desprende la posibilidad de definir una familia de transformaciones
generadas por erosin (dilatacin), en la cual el parmetro indica el cambio de
escala con respecto al cual la transformacin es invariante (segundo principio).
El orden en la aplicacin de erosiones y dilataciones no es indiferente: es ms
severa la previa aplicacin de la erosin [D'Ornellas, 1998]. La aplicacin de la
suma de Minkovsky a la descomposicin del elemento estructurante en un
conjunto de elementos estructurantes ms simples o ms pertinentes, permite
realizar erosiones o dilataciones iterativas.
Cabe destacar que el elemento estructurante es crucial a la hora de realizar
operaciones morfolgicas sobre algn objeto, debido a su poder de condicionar
el resultado. Por consiguiente, su eleccin deber hacerse en funcin de los
aspectos estructurales del objeto que interesa poner en evidencia. Existira pues,
la necesidad de una teora que asociara con precisin la geometra de un
elemento estructurante con el significado morfolgico de la transformacin que
18
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
provoca. En su lugar, la heurstica, la experiencia y las recopilaciones de
trabajos realizadas dan unas directrices, a ttulo orientativo, de las caractersticas
que ste debe tener [Serra, 1965], [Serra, 1978]
Computacin grfica
La computacin grfica desarrolla gran diversidad de mtodos que, a su vez,
ocasionan aplicaciones de gran variedad. Por ello, no hay principios
fundamentales unificados. Por el contrario, cada mtodo desarrolla formalismo,
operatoria e implementaciones que le son propios.
En este apartado se consideran algunas aplicaciones que presentan mayor afinidad
con el tema que nos ocupa, en la medida en que realizan una computacin
especfica partiendo de primitivas no simples, coherentes con las caractersticas
del problema a resolver.
En muchas de las aplicaciones de computacin grfica es necesario generar
curvas y superficies suaves. Gran nmero de los objetos reales habituales son
inherentemente suaves: formas vivas, accidentes geogrficos, piezas mecnicas,...
de forma que el modelado geomtrico tiene gran relevancia [Gousseau, 2001],
[Apu, 2004].
Los modelos basados en curvas cbicas paramtricas como las polilneas y los
polgonos son aproximaciones por segmentos de curvas de y superficies,
respectivamente. A menos que las curvas o superficies que se aproximan tambin
sean lineales por segmentos, hay que crear y almacenar gran cantidad de
coordenadas de puntos extremos para lograr una precisin razonable.
Una representacin ms compacta, que ocupa menos espacio de
almacenamiento y ofrece mayor facilidad de manipulacin interactiva se basa
en el manejo de curvas suaves por segmentos. El mtodo general consiste en
emplear funciones que sean de un grado mayor que el de las funciones tratadas,
ya que los polinomios de menor grado no ofrecen mucha flexibilidad para
19
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
controlar la forma de la curva y que los polinomios de mayor grado pueden
introducir ondulaciones no deseadas. Los problemas de continuidad que afectan
a la unin suave de las curvas pueden resolverse por distintos mtodos: de
Hermite [Foley et al , 1995], de Bzier [Bezier, 1970], [Bezier, 1974], mtodo
que emplea B-splines uniformes [Battels, 1987] y no uniformes. Estos mtodos
tienen prestaciones diferentes en cuanto a diversos aspectos, como la
posibilidad de interpolar los puntos de control, que slo poseen los mtodos de
Hermite y Bzier; la facilidad de subdivisin, mxima en el mtodo de Bzier y
la continuidad, asegurada hasta la segunda derivada en el caso de las B-splines.
Las superficies bicbicas paramtricas constituyen una generalizacin de las
curvas cbicas paramtricas (Superficies de Hermite, Bzier, B-spline).
Las superficies cudricas son muy tiles en aplicaciones especializadas, como el
modelado molecular [Porter, 1979], [Max, 1979] y tambin se han integrado a los
sistemas de modelado de slidos.
El modelado geomtrico no es suficiente para representar el mundo real. Muchos
fenmenos naturales no encajan en estos modelos. Por ejemplo, la niebla est
formada por diminutas gotas de agua, pero no es oportuno usar un modelo en el
cual se coloque cada gota, ya que ste no representara correctamente nuestra
percepcin de la niebla. Existen tcnicas de modelado avanzado que imprimen
enormemente ms realismo al objeto estudiado. A continuacin se exponen en
trminos cualitativos algunas de ellas.
En fechas recientes, los modelos fractales han llamado mucho la atencin
[Voss, 1987], [Mandelbrot, 1982] y [Peitgen, 1986]. Cabe citar ejemplos
famosos como el copo de nieve de von Koch y los conjuntos fractales de Julia-
Fatou y de Mandelbrot. El calificativo fractal se refiere a aquellos objetos
generados por procesos infinitamente recursivos, aunque la comunidad
20
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
cientfica acepta como aproximaciones al caso ideal aquellos objetos cuyo
proceso es finito, pudiendo exhibir cambios imperceptibles despus de alcanzar
cierta etapa. La cualidad de dicho proceso es la autosimilitud. Hay que destacar
el trabajo de Fournier, Fusell y Carpenter [Fournier, 1982] que desarrollan un
mecanismo para generar una clase de montaas fractales con base en
subdivisiones recursivas y utilizan igualmente este patrn para modificar formas
bidimensionales.
El procesamiento de fractales requiere gran cantidad de recursos. Existen
mtodos que palian este inconveniente basados en la aplicacin de la generacin
de fractales por lnea de barrido, mejorados por Kajiya [Kajiya, 1983] y
Bouville [Bouville, 1985]
En cuanto a los modelos gramaticales, Smith [Smith, 1984] presenta un mtodo
desarrollado originalmente por Lindenmayer [Lindenmayer, 1968] para describir
la estructura de ciertas plantas, usando lenguajes gramaticales (gramticas L) de
grafos paralelos o grnales. Estos lenguajes se describen con una gramtica que
consiste en una coleccin de producciones que se aplican todas a la vez.
Estos grafos presentan autosimilitud ya que el patrn descrito por la palabra de la
-sima generacin est contenido en la palabra de la (n+l)-sima generacin.
La gramtica no tiene contenido geomtrico inherente, de manera que la
utilizacin de un modelo gramatical requiere una interpretacin tanto gramatical
como geomtrica del lenguaje. Las gramticas pueden enriquecerse
[Prusinkiewicz, 1988], para permitir llevar un registro de "edad" de la letra en una
palabra de modo que las letras viejas y jvenes se transformen de distinta manera.
Gran parte del trabajo se ha centrado en la obtencin de gramticas que
representen con precisin la biologa de plantas durante su desarrollo.
21
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
Ms all de cierto punto, una gramtica deja de ser manejable como descriptora
de plantas, se puede controlar el crecimiento aadiendo una pequea coleccin de
parmetros descritos en trminos biolgicos (brote, internodo, brote auxiliar,
ramificacin, brote apical...) [De Reffye et al., 1988]. Las producciones de la
gramtica no se aplican de forma determinista sino probabilstica.
De esta breve exposicin se desprenden algunas lneas de inters con respecto al
tema tratado en esta investigacin. Dentro del anlisis de imagen, la morfologa
matemtica proporciona un mtodo til para objetivar las observaciones
realizadas por observadores con distintos intereses, facilitando una tcnica de
medicin basadas en cuatro principios. Destacan dos operaciones primitivas, la
dilatacin y la erosin, que se efectan por medio del elemento estructurante. Los
modelos fractales y gramaticales ponen de manifiesto tcnicas de construccin
recursivas basadas en reglas de produccin e iniciadas por una semilla.
2.3 Computacin cuntica
La idea de computacin cuntica surge en los aos setenta a raz de la reflexin
llevada a cabo sobre las consecuencias que iba a tener la ley de Moore en el
campo de la computacin. La miniarurizacin de los circuitos y su
empaquetamiento cada vez mayor en los chips de silicio lleva a la consideracin
de que, en algn momento, estos elementos no sern mucho ms grandes que un
tomo. El problema que emerge entonces es que, a escala atmica, las leyes que
han de gobernar el comportamiento y las propiedades de los circuitos ya no
pueden ser las de la fsica clsica sino las de la fsica cuntica.
A la pregunta de si es posible construir un tipo nuevo de computador basado en
los principios de la fsica cuntica, R. Feynman contesta proponiendo un modelo
abstracto die mquina que muestra cmo un sistema cuntico puede producir
computacin. Asimismo, explica la capacidad e idoneidad de una mquina
22
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
cuntica para simular experimentos de la fsica cuntica [Feynman, 1982]. En
1985, D. Deutsch publica un artculo, en cierta medida similar al de Turing de
1936, en el que demuestra que cualquier proceso fsico puede en principio
modelarse en un computador cuntico [Deutsch, 1999], [Deutsch, 2000a],
[Deutsch, 2000b].
El bit es la unidad de informacin en la computacin que realizan los
computadores digitales. Su valor, que es 0 o 1, se materializa por el estado
macroscpico de un sistema fsico. En un computador cuntico, el qubit es la
unidad de informacin y no exhibe dos valores diferenciados debido al
fenmeno de interferencia cuntica que hace que la unidad pueda almacenar los
dos valores a la vez con cierta probabilidad. La consecuencia computacional
est en la posibilidad de realizar en un tiempo lineal, n, las operaciones que en
un computador clsico requieren tiempo exponencial 2
n
. En este sentido, Shor
aborda en 1994 el problema de la factorizacin de grandes nmeros [Shor,
1994].
La estructura de representacin en el computador cuntico es el vector de n-
qubits que tiene 2
n
componentes, cada una con su probabilidad. En el
procesamiento, el computador maneja directamente las amplitudes de las
probabilidades. La arquitectura del computador cuntico se basa en un conjunto
de cuatro operaciones primitivas materializadas por puertas y representables en
notacin matricial (matriz de operadores multiplicada por vector de amplitudes)
[Gottesman, 1999]. La primitiva bit-flip intercambia la probabilidad de los dos
estados mientras que \afase-flip cambia el signo entre ambas. La primitiva de
Hadamard establece un estado "a medio camino" entre otros dos. La primitiva
no-controlado realiza una negacin si el qu-bit de control es igual a 1 y no
realiza cambio en el caso contrario. La primitiva de Hadamard es la que hace de
puente entre los dos tipos de computacin, cuntica y digital, realizando a partir
de sus entradas una qu-funcin booleana con la que es posible construir las
funciones XOR, AND, etc..
23
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
Frente al potencial enorme que representa la superposicin cuntica para la
resolucin de problemas de computacin masiva, como la factorizacin de
grandes nmeros o la bsqueda en bases de datos, [Hogg, 1996], [Hogg, 2000a],
[Maurer, 2001], [Hogg, 2003], permanecen todava algunos obstculos que
impiden, por el momento, la construccin de computadores cunticos ms
importantes que los que existen, de pocos qu-bits. Las dificultades mayores
estn en la necesidad de prever la correccin de los errores debidos a la
decoherencia y en el propio diseo de arquitecturas capaces de instrumentar la
computacin cuntica. En efecto, los fenmenos cunticos son inestables,
conduciendo necesariamente a la decoherencia, esto es, al abandono de un
estado cuntico como resultado de la interaccin inevitable entre el estado y el
entorno. En 1995 se propone la teora de correccin del error, basada en la idea
de coherencia en fase, como un medio indirecto de extraer informacin y
reducir el error en un sistema cuntico sin tener que realizar medicin alguna
sobre l, evitando as su destruccin [Shor, 1995], [Laflamme, 1996],
[Aharonov, 1997]. Por otra parte, el qubit no puede ser construido a partir del
transistor ya que ste es un elemento que slo funciona en las computadoras
actuales; ms bien se deben utilizar partculas o sistemas de partculas que
manifiesten el fenmeno de la interferencia cuntica. En este sentido, se han
realizado algunos avances. La tcnica de los puntos cunticos consiste
bsicamente en un electrn atrapado dentro de un conjunto de tomos (jaula de
tomos), el cual, mediante un rayo lser de una frecuencia especfica, se traslada
de su estado no excitado ("cero") a su estado excitado ("uno") y viceversa. Si la
duracin de la exposicin al lser es igual a la mitad del tiempo requerido para
cambiar el nivel energtico del electrn, este adquiere un estado de
superposicin de sus dos valores posibles. [Steane, 2001]. La tcnica de las
molculas lquidas utiliza grupos de molculas en lugar de una partcula
elemental. Al ser sometidos a un campo magntico, los ncleos de las molculas
giran en una determinada direccin que puede ser utilizada para describir su
24
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
estado (giro hacia arriba "uno", giro hacia abajo "cero"). Mediante seales de
radiofrecuencia, el giro puede modificarse. As, el computador cuntico vendra
a estar representado por las molculas, y los qubits por los ncleos [Steffen,
2003].
En el campo del hardware cuntico, se cuenta con algunas realizaciones. La
construccin de una puerta lgica de 2 qu-bits basada en la resonancia
magntica nuclear, que puede ser adaptada para lograr los requerimientos de un
computador cuntico, fue llevada a cabo en 1997 por un equipo mixto de Los
lamos y del MIT. En marzo de 2000, tambin en Los Alamos, se anuncia el
desarrollo de un computador cuntico de 7 qu-bit que utiliza la resonancia
magntico-nuclear para manipular las partculas en los ncleos de los tomos de
las molculas de cido trans-crotnico, aplicndoles pulsos, a fin de forzar su
posicionamiento a la manera de la codificacin por bits en los computadores
digitales. En agosto de 2000 cientficos del Centro IBM-Almaden de
investigacin proponen un computador cuntico de 5 qu-bits capaz de resolver
un problema tpico en la criptografa, como es encontrar la periodicidad de una
determinada funcin.
Cabe pensar que el progreso en computacin cuntica plantear un problema de
seguridad en la informacin, ya que, los mtodos actuales de encriptacin son
realmente simples comparados con la potencia de la computacin cuntica para
desencriptar [Daemen, 2000], [Daemen, 2001].
En resumen, la computacin cuntica se encuentra en sus inicios, la tecnologa
debe avanzar hasta ser capaz de asegurar el funcionamiento correcto de
computadores de varias decenas de qu-bits para poder resolver problemas
reales. La investigacin ha de proseguir por la va de buscar mtodos para
vencer el gran obstculo que representa la decoherencia previo a plantearse el
diseo y realizacin de hardware eficaz as como la consecucin de algoritmos
25
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
cunticos potentes [Hogg, 1998a], [Hogg, 1998b], [Hogg, 1998c], [Jozsa,
1998], [Jozsa, 1999], [Wiseman, 2000], [Ho, 2000b], [Hogg, 2000c], [Janzing,
2001], [Van Dam, 2002].
2.4 Modelos computacionales en neurologa
En este apartado se hace un resumen del estado del conocimiento en el campo de
la neurologa, desde los primeros postulados que datan del siglo XIX hasta los
modelos computacionales ltimamente desarrollados. En cada caso se destaca el
enfoque utilizado por el modelo as como su alcance. Al final de esta exposicin
se hace una reflexin sobre los hitos y limitaciones de los modelos y operatorias
propios de este campo.
En 1889, S. Ramn y Cajal establece un postulado segn el cual la neurona, con
sus rboles dendrtico y axonal, es la unidad bsica funcional del sistema nervioso
[Ramn y Cajal, 1894]. Afirma que las dendritas y el soma son las reas
receptivas para las entradas procedentes de los terminales de otras neuronas y que
los impulsos de salida se transmiten unidireccionalmente, por el axn y mediante
conexiones axo-dendrticas, al rbol dendrtico de otras neuronas. Tambin recon
oce la estructura fina de las neuronas con dendritas, espinas y botones axnicos,
mediante observacin al microscopio ptico de neuronas teidas por el mtodo de
Golgi. Con respecto al procesamiento de la informacin, Ramn y Cajal slo
llega a formular la pregunta de qu sucede cuando varias entradas compiten entre
s, suponiendo errneamente que el soma decide la prioridad de paso.
Hasta 1940 aproximadamente, la tnica general en neurologa es ignorar la
morfologa dendrtica, llegando a representar la neurona por un punto y el axn
por una lnea. As, segn McCullogh y Pitts, la excitacin por sinapsis va desde
un terminal axnico hasta un soma [McCullogh, 1943]. Esta neurona estilizada o
neurona puntual es la base de modelos matemticos que tienen como propsito
26
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
explorar el comportamiento dinmico de grandes redes de neuronas
interconectadas. Hacen hincapi en la caracterstica todo o nada del disparo de la
neurona. La unidad funcional se representa como elemento digital, binario.
En 1952, el modelo de Hodgkin y Huxley de tres canales describe
matemticamente las diversas corrientes de membrana caracterizadas por la
tcnica de pinzamiento [Hodgkin, 1952]. Tiene por objeto estudiar la
contribucin de todas las corrientes inicas al comportamiento elctrico de la
neurona modelizada. La formulacin original del modelo consiste en cuatro
ecuaciones diferenciales acopladas, una para el potencial de membrana y tres
para las variables de estado que dependen del tiempo y del voltaje: dos para las
corrientes de Na
+
y una para la corriente de K
+
. A pesar de su utilidad para la
comprensin de fenmenos como el umbral de disparo, oscilaciones subumbral
y perodo refractario a partir de razonamiento fsico, este modelo biofsico es
complicado para el anlisis matemtico y acarrea un coste computacional
demasiado elevado. Se ha intentado simplificarlo dejando slo dos ecuaciones
diferenciales a fin de poder aplicarle el anlisis mediante plano de fase.
Adems, dicho modelo no aclara las cuestiones relativas a la importancia de las
sinapsis distribuidas que llegan al rbol dendrtico.
Alrededor de 1964, Rail aborda el problema decidiendo tratar por separado las
dificultades morfolgicas y elctricas [Rail, 1964], Despreciando en un primer
tiempo las no linealidades de la membrana, se centra en hallar la expresin
matemtica que describe la variacin de corriente y tensin segn el tiempo y el
espacio en un rbol dendrtico, morfolgicamente complejo, pero elctricamente
pasivo. Para ello desarrolla la teora de cable. En esta aproximacin, la ecuacin
diferencial de segundo orden del potencial en funcin del tiempo y el espacio
(ya propuesta por Hodgkin y Rushton) se resuelve con condiciones impuestas
por la estructura del rbol. Esta teora permite caracterizar las propiedades
entrada-salida de un rbol pasivo; es decir, calcular la tensin en cualquier
27
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
punto del rbol que sigue a una entrada de corriente en cualquier otro punto. Se
llega a poder estimar la amplitud y constante de tiempo del potencial en el punto
que interesa as como la atenuacin en el soma y la distancia entre ste y la
localizacin de la sinapsis, a partir de la forma del potencial postsinptico. De
ello se deduce que la atenuacin de la seal es distribuida y se rige por una
suma de exponenciales. Entonces, en principio al menos, cualquier entrada a
una dendrita distal produce una carga significativa en el soma. Conclusin
importante: la combinacin de propiedades elctricas por una parte y
morfologa especfica, por otra parte, de la membrana y del citoplasma
determinan el procesado de la seal en el rbol dendrtico. Se definen como
parmetros electrotnicos caractersticos del rbol dendrtico R
m
, C
m
, y R, que
representan la resistencia especfica de membrana, su capacitancia y la
resistencia especfica del citoplasma, respectivamente.
Ms tarde, y para superar la restriccin que se deriva de asumir que la membrana
es pasiva, Rail desarrolla un modelo compartimentai. En los ltimos aos esta
visin es la que ha cobrado mayor prestigio, tanto a nivel de clula como a nivel
de red, motivando avances como los conseguidos por los pioneros Rail y
Shepherd que modelizaron el bulbo olfatorio [Rail y Sheperd, 1968]. Cabe
destacar, entre otras, la aplicacin de tcnicas compartimentales para modelar la
difusin de los iones en distintas partes del rbol y para emular el comportamiento
oscilatorio observado en una porcin del hipocampo. Posteriormente, se ha
seguido avanzando hasta llegar a trabajos ms recientes que tratan sobre todo de
modelizaciones de conjuntos de clulas corticales [Suga, 1990], [Ekhorn, 1990],
[Harth, 1990].
Con la salvedad del tratamiento formal no binario, el modelo de FitzHugh y
Nagumo pertenece, por su carcter abstracto, a la perspectiva estructural
[FitzHugh, 1961] En l, las propiedades elctricas de la membrana de la
neurona se representan por dos variables (dos ecuaciones diferenciales
28
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
acopladas) y cada una de ellas satisface una ecuacin diferencial con no
linealidades polinmicas. La interpretacin cualitativa, facilitada por el plano de
fase, explica aspectos matemticos de las no linealidades de la membrana. Los
parmetros que definen este modelo no tienen interpretacin fsica directa.
Dentro de la perspectiva estructural pero con dos hiptesis adicionales referidas
al nmero de subsistemas (que deber ser grande) y a la imposibilidad de
distinguir los subsistemas, se llega a un enfoque de grandes poblaciones. Las no
linealidades, que aparecen como resultado de la interaccin entre partes de un
sistema, estn en el origen de propiedades emergentes que no son inherentes a
ninguna de las partes componentes. Esta teora constituye la base de un cuerpo
de conocimiento denominado Sistemas Complejos [Sol, 2003a]. La
complejidad no es necesariamente sinnimo de complicacin; lo que s exige es
abandonar la intuicin lineal de los fenmenos y reemplazarla por una visin
del mundo basada en la no linealidad [Bascompte, 1998], que requiere
tratamiento estadstico [Sol, 2001a], [Sol et al, 2003b]. En biologa son
numerosos los sistemas complejos: los millares de genes que unos a otros se
regulan entre s en el seno de las clulas; las redes de clulas y molculas que
median en la respuesta inmune [Sol et al, 2003c]; las mallas de los ecosistemas
repletas de especies en coevolucin [Alonso, 2000]; [Sol, 2001b], las colonias
de insectos sociales [Delgado, 1999] y, por fin, dentro del tema que nos ocupa,
los miles de millones de neuronas de las redes nerviosas subyacentes a la
conducta y al aprendizaje. Existen trabajos notables en todas estas ramas y cabe
destacar el trabajo seminal de R.V. Sol [Sol, 94] que desarrolla un modelo
basado en redes fluidas en el que se profundiza en las analogas entre un
hormiguero y un cerebro. En este modelo, cada hormiga pasa a ser una neurona
y las interacciones entre neuronas son las habituales en una red neuronal clsica.
El modelo cuenta con una propiedad adicional, peculiar de los hormigueros
reales, a saber, la activacin espontnea catica de los individuos. La
simulacin muestra la transferencia de informacin, entendida sta como la
29
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
capacidad de un sistema complejo para captar y procesar informacin, para
distintas densidades: A baja densidad, las fluctuaciones son muy irregulares; los
individuos, aunque se activen, no pueden propagar sus cambios. A grandes
densidades, las fluctuaciones del sistema se tornan peridicas. Entre ambas
existe una densidad crtica para la cual la informacin transmitida, en el sentido
de Shannon, se hace mxima. Estos autores postulan que una de las propiedades
de los sistemas complejos es su capacidad para interaccionar con su ambiente y
procesar la informacin recibida. No es que exista isomorfsmo entre el cerebro
y el hormiguero, ms bien se trata de entender que el mismo modelo puede
tener riqueza suficiente para dar cuenta de propiedades que ambos comparten.
Queda patente que, en los ltimos aos y gracias a los mtodos analticos y
computacionales cada vez ms eficientes, la neurologa ha consolidado una
enorme cantidad de conocimiento basada en datos experimentales, contrastados
por modelos hechos a su medida. Ello ha proporcionando un conocimiento
especfico de la neurona y de ciertos subconjuntos del crtex acorde con la
potencia de las operatorias y las arquitecturas propias, diseadas desde el
enfoque de la tecnologa bioqumica. Hay que destacar las aportaciones hechas
en investigacin bsica, celular y molecular, principalmente en la fisiologa de
la neurona o de los sistemas neuronales [Gao, 2003], [Hering, 2003], [Jackson,
2004]; en investigacin de funcionalidades emergentes que estn en el origen
del comportamiento y del conocimiento [Markowska, 2002], [Cain, 2002],
[Hyman, 2003], [Hamana, 2003], [Carlson, 2004] y en investigacin en torno a
la plasticidad y capacidad de reparacin del sistema nervioso [Ueki, 2003],
[Akazwa, 2004], [Strettoi, 2004]. Sin embargo, todo esto no ha sido suficiente
para alcanzar un grado suficiente de madurez en lo que respecta a la
comprensin de ciertas funcionalidades de alto nivel que resuelve el sistema
nervioso, como percepcin, aprendizaje, razonamiento, etc.. No se ha llegado,
por ejemplo, a entender el procesamiento de seales de forma sistemtica, a
definir cdigos neuronales, a explicar fenmenos como el de la consciencia y
30
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
2.5 Problemas abiertos
El anlisis del estado del conocimiento actual se ha llevado a cabo en tomo a las
cuatro cuestiones relevantes para este trabajo de investigacin, que son, las
primitivas computacionales habituales suma y multiplicacin y su intervencin en
la evaluacin de funciones habituales, enfocadas ambas desde la aritmtica del
computador; el anlisis de primitivas de alto nivel para procesadores especficos
en ramas de la informtica como el tratamiento digital de imgenes y la
computacin grfica; la computacin cuntica y, para terminar, los modelos y
operatorias empleados en neurociencias, que tratan de emular las funcionalidades
sofisticadas de los sistemas vivos. De este estudio se desprenden algunas
observaciones:
Cada tecnologa, electrnica o bioqumica, acaba consolidndose en una
operatoria y, en los campos tratados, aparece que el modelo de capas est
vigente.
Los planteamientos en cuanto a las primitivas a utilizar en los procesos de
evaluacin siguen dos directrices: primitivas muy sencillas (del tipo de la
suma y poco ms) para arquitecturas de propsito general; o primitivas
sofisticadas para arquitecturas especializadas (operaciones grficas, filtros de
imgenes, et c. ), independientemente de cul sea la complejidad de la
evaluacin a realizar.
31
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
Las distintas arquitecturas encontradas corresponden a particularizaciones de
la tecnologa, de la estructura de las capas o de la funcionalidad que
proporciona la capa.
De las diversas operatorias empleadas por los procesamientos especializados
expuestos, hay que destacar la recursividad y la parametrizacin como
recursos potentes de modelado; la iteracin de patrones simples, geomtricos
o gramaticales, con introduccin de una pequea coleccin de parmetros
controladores produce resultados espectaculares. Aparece el elemento
estructurante como "unidad" en los procesos de evaluacin de la morfologa
matemtica. La computacin cuntica y la computacin digital tienen como
nexo de unin la primitiva de Hadamard. sta se expresa en forma de suma
ponderada de dos estados produciendo un estado intermedio capaz de hacer
de puente entre ambas.
La neurociencia utiliza la informtica como herramienta de clculo,
recurriendo a sus tcnicas de simulacin y adaptndolas a su objeto de
estudio. La informtica se inspira a veces en lo vivo para proponer nuevos
paradigmas de computacin.
Estas observaciones apuntan en la direccin de una gran dependencia entre la
tecnologa por una parte, la arquitectura y la operatoria por otra, a la vez que
relacionan la sofsticacin de las primitivas con el carcter, general o
especfico, de las resoluciones.
32
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
3 Formulacin del problema y propuesta
de resolucin
Despus de revisar, en el apartado anterior, el estado actual del conocimiento en
cuanto a los aspectos relevantes del tema de estudio que motiva esta
investigacin, se pasa a definir el problema en trminos formales con el
propsito de explicitar el marco conceptual de diseo de soluciones as como de
establecer el soporte expresivo necesario.
Como ya se ha sealado en los objetivos, se va a abordar el problema de evaluar
una funcin cualquiera al nivel ms bajo posible.
La evaluacin de una funcin dada puede realizarse a diferentes niveles de
derivacin dependiendo de cules sean las primitivas del procesador e incluso,
para un procesador dado, la misma funcin puede ser evaluada a diferentes
niveles. Por ejemplo, la evaluacin de la bifurcacin se realiza para cualquier
unidad central de procesamiento (o equivalentemente, para cualquier conjunto
de primitivas) y, para una unidad central de procesamiento determinada, es
comn que la bifurcacin se evale a cualquier nivel de procesamiento, desde
los de ensamblador hasta los lenguajes de alto y muy alto nivel y los entornos
de desarrollo.
Si una arquitectura A se define por la terna A = ( , , ) , siendo
= \

,
2
,,
(1
} el dominio, esto es, el conjunto de funciones que evala,
= \

,
2
,,

j el conjunto de primitivas que incorpora su unidad central


de procesamiento
= {A,,
2
, , } la lgica de derivacin
33
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
entonces, cualquier funcin del dominio de la arquitectura podr obtenerse a
partir de las primitivas mediante la correspondiente derivacin:
3X
k
I , = eval(U,X
k
) Vi = \d
Por razones de escalabilidad de los sistemas, en un procesador dado, la
evaluacin de las funciones se organiza en niveles derivados D a partir del
elemental de las primitivas.
D = {D
l
,D
2
,.~,D
K
}
D , c A / / = l /!
J
J
Z>, = {eva/ ( I I A) }
El hecho de que los niveles derivados puedan no ser disjuntos se debe a que una
misma funcin es valuable por ms de una regla de derivacin a partir de ;
por tanto, la evaluacin de una funcin dada no tiene por qu ser nica
D
s
nD, ^>
3

e (D
s
D
t
), 3/t
y
, X
k
I S = eval(U,
}
) = evalTl, X
k
)
eval(Tl,j)&D
S
,eval(T,
k
) e D,
La ordenacin de los niveles derivados induce una clasificacin en los
elementos del conjunto de manera que una regla de derivacin podr
expresarse como una funcin de otras reglas de derivacin que intervienen en la
evaluacin de las funciones de los dominios inferiores
V
k
/eval(n,
k
) = j eDj
X
k
= q>(^, X
q
)/\fr,\ <r<q eval(U,X
r
) = , eD

l<i< j
34
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
All, , )resuelve el problema <=> 3D. c A / p e D ^
El subndice j de la expresin anterior indica el grado de derivacin que se
requiere en la arquitectura A para resolver p. Puede observarse que cuanto
menor sea j , menor ser la complejidad de la solucin al problema en trminos
de costes computacionales. En ese sentido, podr hablarse de que j expresa el
grado de especificidad de la arquitectura para la resolucin del problema.
La formulacin del problema planteado en esta investigacin, expresada en
trminos rigurosos es
encontrar una arquitectura A' de especificidad mxima para
resolver un problema determinado, p
Formalmente,
Si A'= ( ' , ' , ) / 3 ^ , e ' , 3S
h
, e >,, D
r
c , I = eval(n\
k
,) = S
h
.
y A"= (

, " , " ) / 3 ^ e ", 3S


h
e D
r
, D
r
c ' 7 = eval{YV\X
k
) = S
h

siendo A'i= A" entonces
A'es de especificidad mxima o / = min(7' ' ,7")
La expresin de A' deja abierta la posibilidad de resolver buscando la
arquitectura ms adecuada tanto por la va de las primitivas de la unidad central
de procesamiento como por la va de la lgica de derivacin, de manera que el
35
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Introduccin
campo de bsqueda de soluciones de inters sigue siendo extraordinariamente
amplio. Por esa razn, se ha determinado adoptar una tcnica de aproximacin
sucesiva a la eventual solucin estricta, abordando versiones cada vez ms
refinadas del problema.
En esta investigacin se propone abordar la bsqueda de conjuntos de
primitivas que constituyan para resolver un problema determinado, con la
caracterstica de que las primitivas estn inspiradas en la naturaleza formal de
las funciones a evaluar. Para ello, se propone inicialmente una metodologa de
evaluacin de funciones basada en la convolucin que proporciona una solucin
de partida, de propsito general y con alto grado de derivacin ya que las
primitivas utilizadas son las habituales, esto es, la suma y la multiplicacin. Una
segunda etapa de aproximacin a la resolucin del problema de la evaluacin,
en la lnea de ms especificidad, la constituye la induccin, a partir de la
convolucin, de una forma recursiva de primitiva, capaz de emular por
parametrizacin, la naturaleza formal de subconjuntos de estas funciones. La
investigacin se concreta en el diseo del procesador . Se trata de una unidad
aritmtica cuyas primitivas permiten calcular, funciones que otras arquitecturas
obtienen con niveles ms altos de derivacin. La operatoria aprovecha la forma
recursiva de la primitiva para evaluar iterativamente la funcin, logrando un
resultado final a partir de la combinacin de parciales. Esta tcnica ofrece la
posibilidad de fragmentar los parciales en bloques, favoreciendo la
segmentacin y un mayor nivel de paralelismo en el proceso de combinacin.
Los parciales pueden calcularse o figurar en tablas como datos precalculados
que hay que extraer, potenciando la realizacin de compromisos entre el tiempo
de clculo y el espacio ocupado.
36
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Volver al ndice/Tornar a l'ndex
Captulo 2
Capitulo 2
MTODO DE EVALUACIN
RE CURSIVA BASADO EN
CoNVOLuaN (CBRM)
1 Introduccin
La idea fundamental que anima este trabajo de investigacin es que, encontrar
formas de evaluar funciones con ms especificidad que la que se consigue con el
uso de las primitivas habituales, suma y multiplicacin, ayudar a reducir el
nmero de niveles de derivacin necesarios y, por tanto, a aumentar el
rendimiento. La propuesta de resolucin enunciada en el captulo primero
consiste en encontrar primitivas que cumplan con este cometido para el mayor
nmero de casos posibles. Con el fin de orientar esta bsqueda, se analizan
algunos resultados del anlisis matemtico referidos a la teora de la medida, que
centran y formalizan el procedimiento habitual de la medicin. Tambin se han
considerado los conceptos de la teora de la representacin de grupos, que
permiten asociar estructuras algebraicas distintas para regularizar elementos u
operaciones de una de las estructuras sobre sus homlogos en la otra. Esta
37
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
regularizacin facilita la resolucin de problemas tratndolos en la estructura
mejor entendida de las dos. De esta recopilacin se desprende que la convolucin
ocupa un lugar de inters dentro del marco de construccin de la medida producto
y, a lo largo de este captulo, se demuestra que la convolucin de dos funciones
representa la evaluacin de una de ellas tomando la otra como unidad. Llamar
evaluacin estructural a este tipo de evaluacin, porque se realiza por
comparacin con una referencia que tiene la misma naturaleza que el objeto
evaluado. La convolucin tiene un coste computacional notable. Tener que
realizar evaluaciones con gran especificidad y para un amplio nmero de
funciones aconseja la bsqueda de un tipo de operacin paramtrica, en la que
pequeos cambios en los parmetros puedan cubrir la gran variedad de casos. La
condicin relativa a la disminucin de los niveles de derivacin necesarios para
realizar la evaluacin puede abordarse por la va de reducir la diversidad de estos
mecanismos y de aumentar su potencia. Para ello, se ha optado por hacer
recursiva la operacin paramtrica por lo que, en cualquier caso, los mecanismos
de derivacin sern dos: inicializar e iterar. La evaluacin realizada por la
operacin recursiva recibe, en este trabajo, el calificativo de no estructural porque
se efecta sin necesidad de elemento de referencia. Por ltimo, entre la
convolucin y la operacin recursiva paramtrica se establece la correspondencia
pertinente, que hace que stas sean operaciones homologas. Ello permite evaluar
funciones por convolucin, pero con una operatoria que reduce notablemente el
coste computacional.
Este captulo se consagra enteramente a la exposicin del mtodo de evaluacin
recursiva basada en convolucin, CBRM, como solucin al problema planteado
en el captulo primero. Dado el carcter central que tiene la convolucin en este
trabajo de investigacin, he credo oportuno dedicar un prrafo a repasar la
historia y evolucin de esta operacin.
38
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
2 Acerca de la convolucin
La convolucin es conocida como un operador matemtico entre funciones,
muy presente tanto en el campo de las matemticas como en las ingenieras. Por
citar algunos ejemplos: en estadstica, la densidad de probabilidad de la suma de
dos variables aleatorias independientes es la convolucin de sus densidades
individuales; en ingeniera elctrica, la salida de un sistema lineal es la
convolucin de la entrada con la respuesta del sistema a un impulso [Dorf,
1989], [Katsukiko, 1993]; la morfologa matemtica adapta el concepto de
convolucin implementndola con operaciones lgicas en vez de aritmticas
[Gonzlez, 1996].
Tambin observamos convoluciones en fenmenos corrientes; muchos tipos de
"manchas" se describen como convoluciones: una fotografa desenfocada es la
convolucin de la imagen correcta con el crculo borroso formado por el
diafragma del iris; una sombra es la convolucin entre la forma de la fuente de
luz que crea la sombra y el objeto cuya sombra se est proyectando. El eco es
tambin una convolucin, entre el sonido original y una funcin que represente
los objetos variados que lo reflejan.
En la historia de las matemticas, la primera mencin explcita al producto de
convolucin aparece en una memoria de Tchebyshev [Tchebyshev,1890] a
propsito de cuestiones relativas al clculo de probabilidades y un repaso de los
acontecimientos previos que contribuyeron al desarrollo y maduracin de la
idea pone de manifiesto que, en poco ms de un siglo, la convolucin pasa de
ser una herramienta de clculo para la resolucin de ecuaciones en derivadas
parciales, a intervenir en la teora de la medida para contribuir finalmente al
establecimiento de postulados importantes en el dominio del lgebra,
concretamente en la teora de representacin de grupos.
39
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
Antes de 1820, las ecuaciones en derivadas parciales venan utilizndose por
Poisson, entre otros, para escribir las integrales de la ecuacin del calor o por
Fourier, para realizar la suma parcial de una serie sin advertir que, formalmente,
se efectuaba la regularizacin de una funcin sobre otra. El ejemplo ms clebre
de regularizacin mediante ncleos positivos es propuesto en 1902 por Fejr en
su tesis doctoral [Tandori, 1983] y, a partir de este momento, se convierte en el
procedimiento estndar que interviene en la mayor parte de los mtodos de
sumacin de las series de funciones. Sin embargo, estos trabajos, a causa sin
duda de la disimetra de los papeles desempeados por el ncleo y la funcin
reguladora, no ponan de manifiesto con claridad las propiedades algebraicas
del producto de convolucin.
A lo largo del siglo XIX, tiene lugar la formalizacin de la teora de la medida
en el campo del anlisis. La primera definicin de medida m(A), para un
conjunto arbitrario acotado A, /4cR
n
es establecida por Cantor en 1883. En
1887, Peano fija las condiciones que hacen que un conjunto sea medible y
adems demuestra que la medida es aditiva y que existe una relacin entre
medida e integracin, por medio de la integral de Riemann cuyo valor
representa precisamente la medida del espacio delimitado por la funcin
integrada, los bornes de integracin y el eje de las abscisas [Cohn, 1980]. Al
hacer extensiva la medida al producto de una familia de espacios de medida, la
integracin correspondiente puede resolverse mediante el clculo de integrales
unidimensionales, en un proceso iterativo cuya justificacin viene
proporcionada por el teorema de Fubini [Hawkins, 1975]. En este contexto
aparece el producto de convolucin, como una construccin de la medida, de
naturaleza probabilstica, basada en el experimento compuesto.
En 1913, Volterra evidencia por primera vez las propiedades algebraicas del
producto de convolucin que considera como una generalizacin, por paso de
finito a infinito, del producto de dos matrices [Volterra, 1913]. El giro definitivo
40
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
tiene lugar unos aos ms tarde, cuando Daniell relaciona la convolucin de dos
medidas cualesquiera sobre R con la transformada de Fourier de una medida del
mismo tipo [Daniell, 1929]; se seala entonces explcitamente que la
transformacin de Fourier hace pasar de la convolucin al producto ordinario.
Pero, desde el punto de vista de la teora de grupos, la importancia de la
convolucin no es reconocida plenamente hasta 1927, por H. Weyl [Weyl,
1927]. ste postula que, en un grupo compacto, la convolucin de funciones
desempea el papel de la multiplicacin en el lgebra de un grupo finito,
permitindole por tanto definir la representacin regular y, al mismo tiempo,
encontrar por regularizacin el equivalente del elemento unidad de un grupo
finito, marcando una tendencia caracterstica del siglo XX que es la
algebrizacin del anlisis.
En la actualidad, la convolucin es objeto de una intensa investigacin. Parte
del trabajo sigue la lnea terica, abordando el estudio de la operatoria bajo
condiciones nuevas [Seeger, 1996], [Bak, 1997], [Karasik, 1998], [Fernndez,
2001], [Cardon, 2002], [Eijndhoven, 2003], [Dettweiler, 2003], [Grabiner,
2004], buscando mtodos nuevos de clculo con propsitos diversos [Stalling,
1995], [Mdicis, 1995], [Berkner, 1999], [Sherstyuk, 1999], [Baeumer, 2003]
[Chechile, 2003] o centrados especficamente en la resolucin de ecuaciones
[Peszynska, 1996], [Capee, 1997], [Baesh, 1997], [Buegholz, 1999], [Oberlin,
2002], en la estimacin de medidas [Li, 2003], [Ma, 2003] y en el anlisis
armnico [Capelle, 1996], [Chu, 1999]. La lnea aplicada establece
correspondencias en contextos como la teora de control, el equilibrio en
sistemas econmicos, la probabilidad y la teora de procesos estocsticos, entre
otros [Parr, 2002], [Corazza, 2002], [Ye, 2002].
41
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
3 Fundamentacin terica del CBRM
"...En un grupo compacto, la convolucin de funciones desempea el papel de
la multiplicacin en el lgebra de un grupo finito, permitiendo por tanto definir
la representacin regular y, al mismo tiempo, encontrar por regularizacin el
equivalente del elemento unidad del grupo finito..." [Weyl, 1927].
Por lo que se sabe de la definicin bsica habitual de multiplicacin como suma
de sumandos iguales, el concepto de medida le es inherente: en efecto, cada
sumando representa la "referencia" que se toma para medir y el nmero de estas
referencias representa la medida. Al efectuar la multiplicacin, el resultado
representa tambin la misma medida pero en el caso particular de una referencia
igual al elemento unitario. Por tanto, el postulado de Weyl apunta hacia la
posibilidad de entender tambin la convolucin en trminos de una medida.
Por otra parte, Weyl utiliza la regularizacin para establecer equivalencias entre
estructuras y deducir de stas correspondencias tiles entre elementos y
operaciones de cada una de ellas.
En este apartado se desarrollan las nociones de la teora de la medida [Cohn,
1980], y de la teora de la representacin de grupos que fundamentan el
planteamiento del CBRM. Por una parte, el CBRM propone la convolucin
como forma de evaluar funciones, considerando que la convolucin entre dos
funciones representa la medida de una de ellas tomando la otra como unidad,
relacin equivalente a la que existe entre los dos elementos de un producto
habitual. Por otra parte, el CBRM establece una regularizacin de la
convolucin sobre una operacin recursiva paramtrica, que calcula por
iteraciones sucesivas y que permite satisfacer los objetivos sealados en cuanto
al coste computacional.
42
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
El concepto de medida tiene una larga historia de ms de 5000 aos, que surge
del manejo de longitudes, reas y volmenes y de la necesidad de su clculo
[Van Dalen, 1972], [Boyer, 1986]. Intuitivamente, calcular una medida consiste
en asociar un valor a una caracterstica de un objeto. El valor no es una cualidad
intrnseca del objeto evaluado, ya que, la accin de medir requiere
habitualmente la comparacin con un elemento de referencia, de naturaleza
idntica al objeto a evaluar, cuya eleccin es arbitraria. Por tanto, la existencia
del valor va ligada a la existencia de una estructura formal previa que permita
las comparaciones y la cuantifcacin de stas.
Concepto de medida
Desde el punto de vista formal, el problema de la medida se plantea en el marco
de un conjunto del que se quiere medir alguno de sus subconjuntos. La
estructura mnima que permite establecer una medida es la -lgebra [Nielsen,
1997].
Una -lgebra en es una coleccin A de subconjuntos de con las siguientes
propiedades
G A
Si X e A entonces X
e
e A
SiX, X
2
, ...., X
n
, A entonces [JX e A
=i
Si la tercera condicin slo se verifica para la uniones finitas, entonces A es un
lgebra.
El par (E, A) donde es un conjunto y A es una -lgebra sobre E, es un
espacio medible y conjuntos medibles son los elementos de A. Existe gran
43
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
cantidad de ejemplos de espacios medibles, de los cuales destacamos (E
, t>(E)), siendo p(E) la mayor -lgebra de E.
La medida entendida como una funcin de conjuntos. Ejemplos.
En un espacio medible, (E, A), se define una medida como:
: A [0, oo[
que satisface
[ ) = 0
es numerablemente aditiva, esto es, la medida de una unin numerable de
elementos disjuntos de A es igual a la suma de sus medidas individuales. Se
requiere que la unin sea tambin elemento de A.
La terna ( , A, ) se denomina espacio de medida.
Existen muchos ejemplos de medidas de las cuales pueden destacarse algunas:
La medida de contar:
se define en ( , ( ), ), por ( ) = nmero de elementos que tiene X,
siendo X un elemento de p(E).
La probabilidad:
se define en ( , p(N), ), por ( ) =

siendo Xun elemento de p(N) y p


n
una sucesin de nmeros reales no negativos. Si

=1, entonces la medida es


una probabilidad y si p
n
=1 para cada n, entonces se trata de la medida de contar
de los naturales.
La medida de Lebesgue:
44
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
representa una extensin de las nociones de longitud y rea. Dado un conjunto
abierto conteniendo intervalos disjuntos,X - / (a
k
,b
k
), la medida de
Lebesgue deXes

( X) = ^(b
k
-a
k
)
k
Si X' es un conjunto cerrado X'= [a,b\-2_j (a
k
,b
k
) , la medida de Lebesgue
es ^ ) ^ - a) ~Y
u
{b
k
- a
k
).
k
La medida de Haar:
es una manera de asignar un volumen invariante a los subconjuntos de grupos
topolgicos localmente compactos. Si G es un grupo topolgico localmente
compacto podemos considerar la -lgebra X generada por todos los
subconjuntos compactos de G. Si a es un elemento de G y S es un conjunto en
X, entonces el conjunto aS = {as/ s e Sj (donde la multiplicacin es la
operacin en G) est tambin en X. Una medida en X se llama invariante por
traslacin izquierda si ( ) = ( ) para todo a y S.
Se verifica que hay, salvo una constante multiplicativa, slo una medida
invariante por traslacin izquierda en X, que sea finita en todos los conjuntos
compactos. sta es la medida de Haar en G. (hay tambin una medida invariante
por traslacin derecha, esencialmente nica en X, pero las dos medidas no
necesitan coincidir). La medida de Haar en el grupo topolgico (R,+) que toma
el valor 1 en el intervalo [0, 1] es igual a la medida de Borel. Esto puede
generalizarse para (R
n
, +).
La medida expresada en trminos de integral. Ejemplos.
Si A = C
K
, siendo C
K
el conjunto de las funciones ; R R que cumplen
dos condiciones fundamentales, que son, anularse fuera de un intervalo que
45
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
depende de la funcin particular y ser continuas en R, entonces la funcin es
no negativa si (t) >0, VteR.
En este caso, la aplicacin lineal : C
K
* R, del espacio de las funciones
continuas con soporte compacto en el cuerpo R de los nmeros reales, tal que
() >0 para no negativa, es una medida.
Puesto que toda funcin continua de soporte compacto es integrable, una forma
de concretar el funcional asociado con la medida es por medio de una
integral, [Wheeden, 1977], en esta integral, la funcin ^representa la
"densidad" de la medida.
( , )= [
Se citan algunos ejemplos de medidas definidas en trminos de integrales:
La medida de Lebesgue [Bartle, 1995]
se construye a partir del funcional aplicando la integral de Riemann
{M ><P )= [< = l< P
dx
La medida delta de Dirac
Sea r un nmero real. La frmula
( , ) = ( )
define una medida T=5(/")> 1
u e s e
denomina delta de Dirac y que sirve para
establecer un modelo matemtico para un impulso.
La medida de Haar
Usando el enfoque general de la integracin de Lebesgue, se puede definir una
integral para todas las funciones medibles f. G > R (o C), llamada la integral
de Haar. Esta definicin es el primer paso del anlisis armnico.
46
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
Esta relacin establece una correspondencia biunvoca entre las clases de
funciones medibles sobre todo compacto y sus medidas asociadas, circunstancia
que se aprovecha para efectuar una identificacin formal de ambos objetos.
Cabe subrayar que, en este contexto, el concepto de medida no es una simple
generalizacin del concepto de funcin, sino una generalizacin de las clases de
funciones medibles sobre compactos.
Ampliacin del concepto de medida: la medida producto
Si se quiere construir una -lgebra y una medida en el producto

=
\\E de una familia de espacios de medida (E
t
A, ,) para i eN, es
necesario considerar la integracin del espacio de medida producto en relacin
con la integracin en los espacios factores. El teorema de la medida producto
resuelve la cuestin segn dos planteamientos, uno de carcter geomtrico y
otro de carcter probabilstico [Parthasaraty, 1980]. A continuacin se presentan
los dos planteamientos para i=2.
La versin geomtrica del teorema enuncia que dados dos espacios de medida
(E-i, A-i, ) y ( -, A2, ), existe una nica medida en A-i A2 tal que para
cada A e Ai y e A
2
( xB) = ,( )
2
( ) (2.2)
47
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
La aplicacin ms familiar e inmediata de esta idea es el clculo del rea de un
rectngulo. Se considera el plano real RxR como producto de dos rectas reales
R y el clculo de reas de figuras planas se obtiene a partir del clculo de
longitudes de segmentos 1112. As:
m
2
[a, b]x[c, d]) = m, ([a, b]) m, ([c, d])
de modo que la medida de Lebesgue del plano, m2, es en cierto sentido el
producto de dos copias de mi, siendo esta ltima la medida de Lebesgue de la
recta.
La segunda construccin es de naturaleza probabilstica. En este caso, el
teorema enuncia que partiendo de un espacio de medida ( , Ai //]), un espacio
medible (E2, A2) y una medida de transicin definida de A2 en [0, 00 [, se
construye una medida en A2 tal que para cada A e Ai y Be A2.
= \



Y adems, para cada C e A2
( >= JA(x,C
x
)dft
La formalizacin sera dual para (E2, A2 /2) como espacio de medida, ( , Ai)
espacio medible y medida de transicin definida de E2 x Ai en [0, 00 [.
La idea es la del experimento compuesto. Suponiendo un experimento en el que
se realizan dos observaciones, la primera x-i est en E-\ y la segunda X2 en E2.
La probabilidad de que la primera caiga en un conjunto A de Ai es /( ) y una
vez hecha la observacin x? , la probabilidad de que la segunda caiga en un
conjunto de A2 es 2( , ). Entonces, la probabilidad de que la observacin
(Xi, X2) caiga en A es:
( )=
2
(

, )
]
(
2

3
)
JA
48
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
/ * g(x) = l f(y)g(xy-
1
)dm(y) (
2

4
)
Comparando (2.1), (2.3) y (2.4), la convolucin as definida aparece como una
integral de medida en la cual una de las funciones acta como densidad de
medida mientras que la otra es la funcin a medir. La funciones f y g son
intercambiables.
Para las funciones discretas hay que formular la convolucin como sigue:
/ * g(m) = f(n)g(m - n) (
2

5
)

En (2.5) los papeles desempeados por las funciones f y g siguen siendo
idnticos e intercambiables pero la interpretacin de elemento unitario sustituye
a la de densidad de medida.
3.2 Teora de representacin de grupos
La teora de la representacin de grupos tiene por objeto la construccin de una
aplicacin entre un grupo y alguna otra estructura que permita establecer
correspondencias tiles entre elementos y operaciones, con el fin de trasladar
problemas hacia la estructura mejor entendida para resolverlos con ms
49
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
facilidad [Fulton, 1991]. Esta teora no es uniforme ya que depende del tipo de
grupo elegido (finito, compactos o localmente compactos, de Lie, ....) [Brocker,
1985] y de la estructura "blanco" (grupos de permutaciones, grupos de matrices
sobre algunos cuerpos o, ms generalmente, grupos de transformaciones
lineales invertibles de un espacio vectorial,...). Hay que destacar que muchos de
los resultados de la teora de representacin de grupos finitos son probados para
grupos topolgicos compactos o localmente compactos, haciendo un promedio
sobre el grupo [Simon, 1996]. Estas pruebas pueden transportarse a los grupos
infinitos si el promedio es sustituido por una integral conveniente. Un ejemplo
conocido lo constituyen los grupos localmente compactos, usando la medida de
Haar. La teora que resulta es una parte central del anlisis armnico que
generaliza las nociones de series de Fourier y transformadas de Fourier a una
transformacin de funciones definidas sobre grupos localmente compactos. Para
grupos compactos, se pueden conseguir armnicos extrayendo una
representacin irreducible de cada clase de equivalencia de representaciones.
Esta eleccin de armnicos goza de algunas de las propiedades tiles de la
transformada de Fourier clsica, como por ejemplo la de cambiar convoluciones
por productos escalares.
Representacin lineal: definicin y ejemplos.
Una representacin de un grupo finito G es un homomorfismo de grupo, p, de G
en el grupo lineal GL(V) donde V es un espacio vectorial de dimensin
definido por:
V(g, v) e Gx V,g.v = p(g)(v)
Algunos ejemplos de representaciones lineales habituales son:
Representacin trivial
50
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
Vs e G,p(s) = Id
v
Representacin regular
Dado un espacio vectorial de dimensin [ G I se considera una base
= {e
h
} con h s G. Para s e G se define p(s)e GL(V) por p(s)(eh) = e
s
/ que
corresponde a una permutacin de las coordenadas
Representacin suma
Dadas dos representaciones \ y sobre Vy W respectivamente, se define la
representacin 2 sobre GL(V, W) por
V(v, w) G GL(V, W),p
x
p
2
(g)(v + w) =
P l
(v) + p
2
(w)
Representacin producto
Dadas dos representaciones i y
2
sobre Vy W respectivamente, se define la
representacin
V
0wsobre G,(T, W) por
V / e G L ( F , f ) , p ^ ( g X / ) = p
2
( g ) o / o
y 0
1
( g -
1
)
Considerando la representacin regular, aparece que el nmero total de las
permutaciones de los vectores de la base es igual al nmero de elementos del
grupo G. As, cada elemento del grupo G se regulariza sobre un elemento de
GL(V), esto es, sobre una permutacin.
51
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
3.3 Planteamiento del CBRM
Despus de poner de manifiesto que la convolucin es una operacin entre dos
funciones que representa la evaluacin de una de ellas tomando la otra como
unidad, se conviene en dar a esta evaluacin el calificativo de estructural debido
a que se realiza por comparacin con una referencia de la misma naturaleza que
la funcin evaluada. La posibilidad de regularizar la convolucin sobre otra
operacin, como sugiere la teora de representacin, permite sustituir la
evaluacin estructural por esta segunda operacin, que recibir el nombre de
evaluacin no estructural, porque en este caso no se necesita comparacin con
ninguna referencia.
La razn de este planteamiento es crear el marco formal adecuado para evaluar
por convolucin pero con menor coste computacional del que sta ocasiona. La
evaluacin estructural de funciones del tipo h(k) = h(k)*5(k) se caracteriza
generalmente por un alto nivel de derivacin, debido a que el nmero de
operaciones primitivas, suma y multiplicacin, que hay que realizar crece con la
complejidad de la funcin h(k). Adems, la determinacin de la cascada de
operaciones a realizar requiere cierto empirismo ya que depende del mtodo de
clculo empleado. La diversidad de mtodos de clculo puede ocasionar, adems,
gran diversidad en los mecanismos de derivacin. Este tipo de evaluacin
aparece, por tanto, como poco sistemtico, casi con cierto carcter artesanal. La
evaluacin estructural del tipo h(k) =f(k)*g(k) tiene una complejidad 0(n
2
) con
respecto al nmero de puntos a calcular porque slo tiene el coste de
combinacin, aunque requiere el conocimiento previo de las funciones que
intervienen, f(k) y g(k). Sin embargo el coste sigue siendo alto debido a que la
secuencia de operaciones a realizar crece a medida que aumenta n. De estas
consideraciones se desprende que la mejora puede venir por la va de rebajar el
coste de combinacin, reutilizando los resultados previos de la convolucin en los
52
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
4 Desarrollo formal del CBRM
<Fx<F R x R x
eval
1
(F regularizacin G
<
Fig 2.1 Planteamiento formal del CBRM
Sea (Fel conjunto de funciones discretas de variable discreta definidas en R. Sea
la aplicacin eval:
inv
evaL
53
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
evah :TKT
(f, g) eval, (f,g)= e
V
al
l
(g,J) = f*g=g*f (2.6)
evalj define la convolucin como una operacin entre dos funciones discretas,
que representa la evaluacin de una de ellas tomando la otra como unidad
(expresin (2.5)).
Se puede demostrar que ( , *) es un grupo abeliano.
Sea el conjunto de funciones definidas de en R
F: R
i F
Se define <z de la manera siguiente:
Fe <^>3 (a, ) e R,3 G e tales que
F^aFi.j + fiGt.,
( , +, ) es un espacio vectorial sobre R para cada par (a, )
Se define la aplicacin eval
2
:
eval
2
:RxRx '
(a, , G) ewl
2
(a,fi,G)=F (2.7)
54
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
Se define ahora la aplicacin de (F (Fen R R x de la manera siguiente:
: Rx Rx
(f,g) ( , ) = ( , 0) (2-8)
tal que, Vy , [ c R , 3 i eN / f*g(y) = F = aF^+fiG,
Condicin necesaria para la regularizacin de la convolucin sobre la
frmula recursiva
La restriccin expresada en (2.8) de que todos los valores de una convolucin
encuentren igualacin con valores sucesivos de una funcin evaluada
iterativamente, F, es la condicin necesaria para regularizar la convolucin y, de
esta manera, poder contar con una evaluacin de tipo no estructural, basada en la
evaluacin estructural que proporciona la convolucin. Las condiciones bajo las
cuales se establece dicha igualdad son relevantes en cuanto al alcance de la
evaluacin no estructural inducida. A continuacin se detalla el desarrollo de
estas condiciones.
Sea el desarrollo formal de la convolucin de dos funciones, / y g, pertenecientes
& . Se realiza a partir de un punto inicial, x , del intervalo [ , [c R, con un paso
he R.
55
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
Los kprimeros valores de la convolution/*g son:
f*g(x) = f(x)g(x)
f*g(x + h) = f(x)g(x + h) + f(
X
+ h)g(h)
f
* g ( x
+
k
h )
=
f i
x M
X
+ m
+
f (
X +
h M
X
H k - m
+
+f{x+{k-\)h)g{x+h)+f(x + kh)g{x)
y
'
f*g(x + kh) = / ( * + ph)g(x + (k- p)h)
/7 = 0
Se puede modificar este desarrollo haciendo que aparezca la derivada de alguna
de las dos funciones. En (2.10) aparece la derivada de la funcin / entre
parntesis. Como las dos funciones son intercambiables en relacin con el papel
que desempean, se puede llegar a una expresin anloga a (2.10) en la que
aparece la derivada de la funcin g.
f*g(x) = f{x)g{x)
f*g(x + h) = f*g(x) + hg(x) / ( * + *>-/(*> + f
(x)g(x
+
h)
h
h
1 , ,^f{
X +
h)-f{x) r,

, ~,x
+ hg(x + h) - ^- ^ + f{x )g{x + 2h)
.f*g(x
+
kh) = f*g(x Hk-l)h)
+
hg
{
x )
f
(
x + kh)
-f}
x +
(
k
-V
h
.
.
+
hg(x
+
(k~l)h)
f(X + h)
-
f(X
hf(x Mx
+
kh) (
2

10
)
f*g(x + kh) = f* g(x + (k~ \)h)+h g{x + P h)f (x + (k- p)h)
+ f(x )g(x + kh)
p=k~\
p=0
56
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
La expresin obtenida en (2.10) ha de igualarse con la funcin recursiva dada
por la ecuacin (2.8), F = aF.i+ /?G,-./
Para ello se propone:
hacer 0
hacer h = 1
hacer / = k
As, se asimilan
f*g(
x +
kh) con F i
p= k - \
pG. con h 'Y
j
g{x + ph)f{x + {k-p)h) + f(x)g(x + kh)
p= 0
La interpretacin de la regularizacin propuesta es la siguiente:
El argumento inicial, e R, para el cual se evala la convolucin se
regulariza sobre el ndice inicial de la frmula recursiva, F, que es el cero.
Elegido el paso h e R con el cual se evala la convolucin, se regulariza
ste sobre el paso de la frmula recursiva, F, que es 1.
Con estas dos regularizaciones, el nmero de iteracin de la convolucin y
de la frmula recursiva coinciden, permitiendo confundir en todo lo que
sigue las expresiones f*g(k) y F
k
para simplificar la escritura.
El parmetro a que interviene explcitamente en (2.8) ha sido aadido a fin de
recoger la posibilidad de que, entre los factores que intervienen en la parte del
sumatorio, alguno pueda contener de forma implcita el trmino f*g(x + kh) y
dar lugar a factorizacin (ver Tablas 2.1 y 2.2).
Condicin suficiente para la regularizacin de la convolucin sobre la
frmula recursiva
57
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
La condicin suficiente para la regularizacin de la convolucin est
relacionada con la posibilidad de encontrar la inversa de la funcin . Ello
significa que, dada una forma recursiva del tipo (2.8), se pueda encontrar un par
de funciones/y gcuya convolucin tenga la forma (2.8).
Sea una funcin recursiva Y
h
del tipo (2.9).
Entonces Y cumple:
Jo

+
0
^^ ^+ ^
( 2

)
Y,=aY
t
_
x
+fiZ
t
_
x
Y
M
=aY
i+
,
Siendo , diferentes de cero y Z una funcin auxiliar
Sustituyendo el valor de Y en la ltima ecuacin de (2.11) por su valor, que
expresa la penltima ecuacin y remontando hasta la primera ecuacin aparece
el desarrollo de la convolucin de dos funciones/y g sin ms que identificar:
/ ( / ) = '
g ( 0 = &
( 212)
g ( 0) = r
0
Si a /?son iguales a cero, las ecuaciones (2.11) se simplifican. En estos casos,
las expresiones defy g son:
58
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
a=0 =
f(i) = () f(i) = S(i)
g(i) = pz
i
_
x
g() = a'g ( 0)
g(0) = Y
0
g(0) = Y
0
Por tanto, cualquier funcin desarrollada bajo la forma recursiva (2.11) puede
representar la convolucin de dos funciones/y g. En los casos descritos por las
ecuaciones (2.13), se tiene una convolucin trivial, ya que una de las funciones
que intervienen es la delta de Dirac.
Esta propuesta de regularizacin no es nica, como tampoco lo es la forma de
modificar el desarrollo (2.9), que conduce a la expresin (2.10). Otras
modificaciones pueden conducir a formas recursivas de la convolucin en las
que aparecen no slo el valor en la iteracin anterior sino otros valores
anteriores o incluso todos los valores anteriores a la iteracin considerada. No
se considera en este trabajo de investigacin ms que una de las posibles
regularizaciones de la convolucin, quedando las dems como lneas de
investigacin futuras.
5 Aplicacin del CBRM
Las bases establecidas en el apartado anterior permiten desarrollar un mtodo de
evaluacin no estructural, CBRM, vlido para un conjunto amplio de funciones,
que ha de culminar con la definicin de unas primitivas. Importa, para ello,
concretar la correspondencia entre las caractersticas de las funciones f, g y los
parmetros de regularizacin de la convolucin, a, , G. El desarrollo de la
convolucin dado por la ecuacin (2.10) puede simplificarse notablemente para
59
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
algunos tipos de funciones usuales, obtenindose un patrn de construccin de
la evaluacin no estructural muy sencillo, a la medida de esas funciones. Es
interesante considerar estos casos que, aunque correspondan a
particularizaciones del caso general, tienen gran utilidad por ser casos muy
frecuentes.
Cuando una de las dos funciones de la convolucin es del tipo potencial,
por ejemplo, f(x + kh) =K
x+kh
, la expresin recursiva (2.10) se transforma
en:
f*g(x + kh) = K
h
.fg(x +(k-l)h) + K
x
. g(x+kh)
que es la frmula recursiva (2.7) con a -
,
, = K
x
,G=g(x +kh)
Cuando una de las dos funciones es constante, por ejemplo f(x + kh) = M,
f'(x + kh) =0 y los trminos del sumatorio de la expresin (2.10) se anulan;
la frmula resultante es:
fgfx + kh) ~f*g(x+(k-l)h) +M g(x+kh)
que corresponde a a=\, =M,G = g(x +kh)
Cuando una de las dos funciones es lineal, por ejemplo f(x +kh)= p(x +kh),
los trminos del sumatorio de la expresin (2.10) son todos iguales a la
pendiente de la recta, esto es, aph. La expresin resultante es entonces:
f*g(x + kh) =.fg(x +(k-l)h) +ph [g(x)+g(x+h)+ + g(x+(k-l)h)]
k - \
que corresponde a a = 1, P =ph, G - ^ g(x + jh)
y=0
60
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
Estos tres casos permiten abordar de manera muy sencilla la evaluacin
recursiva de un gran nmero de funciones. De la aplicacin de las
simplificaciones anteriores se deriva la posibilidad de sistematizar la
evaluacin, construyendo una "tabla de equivalencia" que facilita
automticamente la frmula recursiva que corresponde a una evaluacin por
convolucin dada. Al consultar dicha tabla, se encuentran para cada par (f ,g)
los valores ( , , ) que corresponden. La Tabla 2.1 muestra estas
correspondencias para algunas funciones usuales. Por motivos de claridad y sin
prdida de generalidad, se han expresado las funciones considerando x=0 y h=l.
Se han elegido casos en los que, al menos una de las funciones que interviene en
la convolucin, es de las tres que proporcionan simplificacin (funcin
constante, lineal o potencial). De no ser as, se realiza la correspondencia
basndose en el caso general dado por la ecuacin (2.10).
61
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
*g(k)
f(k) = M )
f(k)=N
f(k)=qk
M )=a
k
g(k) cos k
g(k)=sen k
g(k)=Log k
g(k)=l/k
g(k) = S(k)
8(k)

qk
a
k
cos k
sen k
Logk
1/k
g(k) =M
M
a=l = G
k
=N
G
0
=MN
a=l fi=MG
k
=qk
G=0
a=a =1 G
k
=M
G
0
=M
a=l =
G
k
= cosk
G
0
=M
a=l =
G
k
= sen k
G
0
=0
= ; =
G
k
= Logk
Go=0
a=l =
G
k
= U(k-l)
G
0
=M
g(k) =pk
pk
a=l = G
k
=Nk
G
0
=0
a=J =
G
k
= qk(k-l)
2
G
0
=0
= =1 G
k
=pk
G
0
=0
= 1 =
G
k
=Zcos i
(0< i< k)
G
0
=0
= =
G
k
= sen i
(0 < i < k)
G
0
=0
a=p =
G
k
=Logk
G
0
=0
a= 1 =
^ /i
(0< i< k)
G
0
=p
g(k)=F*
K*
= =1 G
k
=N
G
0
=N
= =1 G
k
=qk
G
0
=0
= =1 G
k
=a
G=l
= =1
G
k
= cos k
G
0
=l
= = 1
G
k
= sen k
G
0
=0
a= =
G
k
= Logk
G
0
=0
= =
G
k
=i/(k-l)
G
0
=K
Tabla 2.1 Tabla de equivalencia de algunas funciones usuales
Recprocamente, se sistematiza la descomposicin de una funcin dada en
convolucin de otras dos. En la Tabla 2.2 se muestra la descomposicin de
algunas funciones usuales a partir de la forma recursiva que se les puede
asociar. Para dos de ellas, la funcin constante y la funcin potencial, la nica
descomposicin alcanzable es la descomposicin trivial.
62
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
Funciones
usuales
F(x + k h )
constante
M
lineal
m(x+kh)
exponencial
x + k h
inversa
l/(x+kh)
Raz-m-sima
^lx + k h
logaritmo
log(l+kh)
trigonomtrica
cos(x+ kh)
sen (x+kh)
hiperblica
cosh (x+kh)
senh (x+ kh)
Parmetros de la frmula recursiva
F
k
= aF
k
.,+ f i G
k
a
0
1
a
h
1
1
1
a = cos(h)
a = sen(h)
a=cosh(h)
a=senh(h)

1
h
0
-1
1
I
fi=-sen(h)
= cos(h)
= senh(h)
= cosh(h)
G
k
M
m
0
00
k=\
GO
00

,= ( * * * )
G
0
=cos /
G
k
= -sen (x +(k-l)h)
G
0
= sen /
G
k
= cos (x +(k-l)h)
G
0
=cosh /
G
k
= senh (x +(k-l)h)
G
0
= senh /
G
k
= cosh (x +(k-l)h)
Desc
conv
F
k
f(x+kh)
(x+kh)
1
(x+kh)
1
1
1
a
x +k
"
a
x +kh
a
x +kh
a
x +kh
omposicion en
olucin de dos
funciones
= f s( x + k h )
g ( x + k h )
g ( x ) = M
g ( x + k h ) = M
g ( x ) = m x
g ( x + k h ) = m h
g ( x ) = a*
g ( x + k h ) = a
x + k h
g ( x + k h ) =
00
-
k=\
g(x +kh)=
00
( * * )
k=\
g(x +kh)=
g(x )=cos X
g(x+kh))=
-fisen (x +(k-l)h)
g(x )= senx
g(x+kh) =
ficos(x +(k-l)h)
g(x )=cosh
g(x+kh)=
senh (x +(k-l)h)
g(x )= senh
g(x+kh) =
cosh (x +(k-l)h)
(*)= X[(k+1)" -k"J-h"/x "
+l
(**)= (1- )(1-2 ) (l-nm)x "^""
>/
"' f(k+l)"-k") h")]/n! m "
+/
(***) = (-1) "fk" - (k-l)"J h" /
Tabla 2.2 Descomposicin de algunas funciones usuales.
63
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
En las expresiones de F
k
de la Tabla 2.2, representa el primer valor para el cual
se calcula el valor de la funcin, h representa el paso de iteracin y & el nmero de
iteracin.
6 Primitivas y derivadas
En una metodologa de evaluacin, la propuesta de primitivas es una etapa
crucial. Conceptualmente, las primitivas son las operaciones bsicas de referencia
del proceso de evaluacin sobre las cuales se construyen los niveles de
derivacin.
En el contexto de la evaluacin no estructural, una primitiva

es una expresin
paramtrica del tipo


= af+ gdonde a,f, , gson nmeros reales.
Se define un nivel de derivacin fijando un valor inicial / =Fg e iterando la
primitiva

cuantas veces se quiera, de manera que en cada iteracin se obtiene


un valor F tal que
F,=aF

.,+fiG

.,
En esta derivacin a y se mantienen constantes y cada nuevo valor g = G
incorporado determina un nuevo valor F. Por tanto, se tiene
/ = 0 F
0
= 1 F, =aF
0
+ G
0
i = 2 F
2
=aF,+fiG,
64
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
El conjunto de valores F} obtenidos por clculo iterativo son puntos de la
funcin F evaluada, ordenados en el sentido creciente de las iteraciones i.
Asimismo, los valores incorporados *{ G \ son puntos de una funcin G llamada
funcin auxiliar, tambin ordenados en el sentido creciente de i.
Las funciones F son clasificables en familias. Una familia de funciones es un
conjunto de funciones que muestra un mismo comportamiento. ste viene
definido por los intervalos de pertenencia de a, y por G.
Los niveles de derivacin sucesivos se relacionan entre s por medio de la funcin
auxiliar. Suponiendo que en un nivel D de derivacin se ha evaluado una funcin
F, con los parmetros a, y la funcin auxiliar G, cualquier funcin H que se
pueda evaluar con los parmetros a', ' y la funcin auxiliar F se considerar de
nivel de derivacin D
n+
, Por tanto, al nivel de derivacin D+ le corresponden
funciones auxiliares calculadas en el nivel de derivacin anterior. Por convenio,
se puede proponer como nivel primero de derivacin D aquel en el cual las
funciones evaluadas son del tipo h(k) = h(k)*S(k) como, por ejemplo, la funcin
constante y la funcin potencial.
A continuacin se presenta un ejemplo de evaluacin no estructural que
corresponde al caso asociado a la convolucin de una funcin constante por una
funcin potencial (f(k) = a
k
, g(k) = M). Para este caso, la tabla de equivalencia da
los valores a= a, = 1 y G = M. Estudiando los intervalos de variacin de los
parmetros se ponen en evidencia distintos comportamientos que definen familias
de funciones. Posteriormente se realiza un mapa de localizacin de stas en el
cual los valores de a, y G actan como coordenadas (Fig.2.8). La Tabla 2.3
recoge la descripcin del comportamiento definitorio de cada familia.
65
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
Familia 1:
< - l
Se observa una
oscilacin divergente,
ms rpida para valores
ms negativos de a. La
amplitud es tambin
mayor para valores ms
negativos de }, pero la
influencia de /?G es ms
moderada que la de
a. (Fig.2.2)
Fig.2.2 Familia 1 ( =-1.2 , = -\2 )
Fg.2.3 Familia 2 (a = -0.9, G = -2.2)
Familia 2
- 1 < < 0
Se observa una
oscilacin convergente,
ms rpida para valores
de amas cerca de cero.
(Fig.2.3). El signo de
fija la convergencia en
torno a un valor que es
de su mismo signo. El
valor absoluto de
influye en la
amplitud de la oscilacin
y, por tanto, en el valor
de convergencia.
66
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
4 -
3,5
3
2,5
2
1,5
1 -
0,5
O^
.
- -*
'
h- O CO
co
CD CM
CM
uo
CM
CO
CM
Fig.2.4 Familia 3 ( = 0.8, = 0.7)
1,5 -
1 -
0,5 -
0
-0,5
-1 -
-1,5
-2
-2,5 J

Vt-
o

CO

CD
en
CM
-CM
m oo
Familias 3 y 4:
0 < <1
Se observa una
evolucin continua
convergente con asntota
horizontal, ms abrupta
cuanto ms se acerca a a
cero. fija la
direccin de la
evolucin, crecimiento o
decrecimiento, as como
el valor de la
convergencia. A valores
ms negativos le
corresponde un valor
ms negativo del valor
de convergencia y a
valores ms positivos un
valor ms positivo. El
cambio cualitativo entre
el crecimiento y el
decrecimiento tiene
lugar cuando se cumple
+ =1 (Fig.2.4 y
2.5)
Fig.2.5 Familia 4 (a = 0.8 G = -0.4)
67
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
4 0000000
1
35000000
30000000
25000000
20000000 -
15000000
10000000
5000000
<- t r~- o co
-

CD
/
/
/
/
J
_y
> CM in oo
*- CM CM CM
Fig 2.6 Familia 5 ( =1.8, = 0.3)
50 -,
0
-50
-100
-150 -
-200
-250
-300 -
-350
-400
-450 J
r- Tt - O (

^ > CM
^ ^ CM
-
-
in
CM
00
CM
Familias 5 y 6:
> 1
Se observa una
evolucin continua
divergente con asntota
vertical, ms abrupta
cuanto mayor es y
cuanto mayor es | \,
aunque ste influye de
forma ms moderada. El
parmetro fija la
direccin de la
evolucin, crecimiento o
decrecimiento El cambio
cualitativo de uno a otro
tiene lugar para
+a=\ (Fig.2.6 y 2.7)
Fig.2.7 Familia 6 ( =1.2, G = -1.6)
68
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
Familia 1
0G
Familia 2
+ =\
Fig 2.8 Mapa tridimensional de localizacin de las familias de funciones asociadas a la
convolucin de constante por potencial
Familias asociadas a la convolucin de una funcin constante por una funcin
potencial
Familia
1
2
3
4
5
6
Intervalos de pertenencia de
los parmetros
a e ] - ce , -1]
P Ge^
la e]-1,0]
PG s<K,
a e ] 0, 1 ]
a+P G > 1
a e ] 0, 1 ]
a+P G<\
a e] 1, + cc]
a+P G > 1
a e ] 1, + cc]
a+P G < 1
Comportamiento cualitativo
Oscilacin divergente
Oscilacin convergente
Crecimiento con saturacin
Decrecimiento con saturacin
Crecimiento con asntota vertical
Decrecimiento con asntota vertical
Tabla 2.3 Comportamiento correspondiente a las familias de funciones asociadas a la convolucin
de constante por potencial
69
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
Con este ejemplo, se ha puesto de manifiesto la relacin que existe entre los dos
tipos de evaluacin, estructural (convolucin) y no estructural (recursiva). Cada
evaluacin por convolucin se traduce a la evaluacin recursiva, por un
conjunto finito de familias de funciones. Cada familia representa un
comportamiento diferenciado y puede instanciarlo un nmero infinito de veces
por concrecin de los parmetros dentro del intervalo que corresponde. Al
ejemplo bidimensional que se acaba de tratar, le corresponden seis familias. Se
puede realizar un estudio similar para cualquier evaluacin por convolucin.
7 Conclusin
En este captulo se sientan las bases tericas de la resolucin del problema
formulado en la introduccin, que es la obtencin de primitivas capaces de
realizar a bajo nivel el clculo de funciones que habitualmente necesitan ms
niveles de derivacin. Como estrategia de evaluacin, se establece la
convolucin de funciones a la cual se asocia, por un proceso de regularizacin,
una operatoria recursiva que cumple el requerimiento de la disminucin de
niveles para un gran nmero de funciones. Las primitivas propuestas tienen una
forma paramtrica estndar muy sencilla y los rasgos diferenciadores de las
funciones que se calculan se deben a los valores concretos de los parmetros.
Las primitivas son, por tanto, valores numricos que actan como semilla en el
clculo iterativo de una funcin. Los niveles de derivacin sucesivos se
relacionan entre s por medio de la funcin auxiliar.
70
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Volver al ndice/Tornar a l'ndex
Captulo 3
Capitulo 3
ARQUITECTURAS CBRM
1 Introduccin
Este captulo aborda el diseo y evaluacin de arquitecturas que instrumentan el
mtodo recursivo de evaluacin basado en convolucin, CBRM. Consiste en
trasladar al plano de realizacin fsica la operacin recursiva que se ha propuesto.
Para ello, se disea un prototipo de procesador, facilitando una descripcin
funcional de sus mdulos principales. Se realiza la evaluacin del prototipo con
resultados o estimaciones concretas de las magnitudes ms significativas desde el
punto de vista arquitectural, como el tiempo de clculo y el rea utilizada. Para
realizar estimaciones de tiempo y rea fcilmente comparables con las de otras
propuestas se ha utilizado como unidad de medida un dispositivo elemental de
clculo, formado por una puerta XOR y una AND, que implementa un sumador
completo de un bit. Posteriormente, se han efectuado tambin mediciones en
dispositivos de lgica reconfigurable FPGA (Field P rogrammable Gate Array).
Descritos en lenguaje VHDL {Hardware Description Language), los circuitos
han sido simulados en la tarjeta. xcv300e-6bg352-XST de Xilinx, proporcionando
una estimacin de los tiempos de clculo y de los recursos hardware. Abordar los
aspectos de disipacin de potencia sera procedente en versiones de mayor
carcter aplicado, lo que excede el alcance de esta memoria. En su caso se
71
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
planteara una realizacin ASIC {Application Specific Integrated Circuit) del
procesador bsico.
El procesador CBRM tiene su techo de velocidad establecido por la operatoria
recursiva que realiza, que slo es capaz de proporcionar un punto por iteracin.
Esta limitacin es un inconveniente para aplicaciones que requieran mayor
rapidez y sugiere buscar mejoras. Las prestaciones aumentan incorporando
distintos grados de paralelismo; en el mdulo mismo y en las arquitecturas que
involucran varios mdulos interconectados. En todos los casos, se establecen
comparaciones de tiempo y rea y se opta por una solucin combinada y flexible
de clculo en serie y en paralelo, como solucin intermedia y adaptable a los
requerimientos del problema a tratar.
2 Arquitectura del procesador CBRM
En este apartado se va a proponer la arquitectura del procesador CBRM que
corresponde a la modalidad bsica de operatoria. Esta arquitectura consta de tres
mdulos principales: el de clculo, donde se realiza la operacin recursiva, el de
control, que se ocupa de gestionar la ejecucin del clculo y la memoria que
almacena los datos. Estas funciones pueden implementarse de formas muy
diversas. Puede resultar interesante concentrar todos los datos en una sola
memoria o bien, alternativamente, dotar tambin de memoria a los mdulos de
clculo y de control. Por otra parte, algunos datos pueden existir almacenados
permanentemente o calcularse, bien en lnea bien ex profeso en una etapa previa
de clculo. En la descripcin de los mdulos se mencionan las distintas
posibilidades, teniendo en cuenta que la evaluacin de la arquitectura depende
finalmente de la implementacin elegida.
72
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
2.1 Descripcin funcional de los mdulos
La figura 3.1 representa la estructura general del procesador CBRM que consta de
tres mdulos: el de clculo, el de control y la memoria.
0
G,
1
Memoria
'
4
af+P g
1
'
Clculo
I
1 r
Control
1
Resultado
Fig 3.1. Estructura general del procesador CBRM que presenta tres mdulos principales
Mdulo de clculo
El mdulo de clculo proporciona el resultado de la operacin recursiva. Al inicio
de la etapa de clculo de una funcin F, estn disponibles el valor inicial F o de la
funcin, as como los valores de los parmetros a, y la funcin auxiliar G que
caracterizan la primitiva que hay que usar. El resultado puede alcanzarse
mediante el clculo, que involucra dos multiplicaciones y una suma, o
73
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
permanecer precalculado. La figura 3.2 representa el esquema funcional del
mdulo de clculo que efecta la operacin recursiva.
F = a Fi-i + Gui donde
Fi es el valor, en la iteracin i, de la funcin que se calcula
F-i es el valor que tena la funcin en la iteracin anterior, i-1
a, son los parmetros propios de la primitiva que calcula la funcin F
Gi-i es el valor de la funcin auxiliar que se incorpora en la iteracin i
G,
C
i r i

'
1
Mult.
1 r

\ Sum
' i
'
Mult.
yr
F
Fig 3.2 Esquema funcional del mdulo de clculo
Mdulo de control
El mdulo de control gestiona la ejecucin del clculo mediante seales de
control. El control consiste en asegurar la correcta seleccin de los parmetros, la
captacin y el paso de argumentos al mdulo de clculo, en guiar la salida de
resultados y contar el nmero de iteraciones para marcar el final de la operacin.
74
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
Memoria de clculo
Contiene los parmetros a y , que estn generalmente relacionados con el paso
h, as como los puntos de la funcin auxiliar G La primitiva af+fig que hay que
emplear puede calcularse en lnea, por medio de dos multiplicaciones y una suma
o tambin permanecer precalculada. En este caso la operacin consiste en
direccionar la tabla por algunos bits particulares de los valores de F (que es la
funcin calculada) y de G que es la funcin auxiliar. Si F=fy G= g, slo har
falta un acceso para captar el valor, en cambio si fy g representan fragmentos de
F y G harn falta ms accesos para completar el valor del punto aF+P G.
Si se opta por una memoria nica, sta contendr todos los datos mencionados.
El camino seguido por los datos previo a la ejecucin del clculo es el siguiente
(Fig 3.3):
75
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
Inicializacin
Datos
introducidos
por el usuario
Datos de
control
Datos de
clculo
Clculo
Nombre de
la funcin F
a calcular
Intervalo/= [a, b]
Parmetros a,
funcin auxiliar
G
Paso h
b- a
Punto inicial
F
0
= a
k=0 Fo = a
k=l F^aFo+
Fig 3.3 Camino seguido por los datos
N puntos k
N
iteraciones k
2.2 Implementacin
En esta investigacin, el propsito de la implementacin es la realizacin de un
prototipo que sea capaz de mostrar el mtodo CBRM. Por tanto, no se plantea en
ningn momento que la implementacin elegida tenga que ser ptima y, menos
an, que el mtodo expuesto dependa de implementacin alguna. Por ello, slo se
han considerado los aspectos de diseo que conciernen a la posibilidad de
reutilizacin, al coste de desarrollo hardware, a la flexibilidad y a la limitacin en
el nmero y diversidad de los mdulos necesarios; cuestiones que importan en la
76
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
etapa de verificacin del prototipo. Adems, se ha centrado toda la atencin en la
implementacin del mdulo de clculo, considerado como la parte principal del
prototipo.
Se ha optado finalmente por no efectuar las dos multiplicaciones y la suma para
calcular los puntos de la funcin. En su lugar se tendrn los resultados disponibles
en una tabla LUT (Look-up tabl), de acceso paralelo, utilizando aritmtica
distribuida para su almacenamiento. Los resultados que figuran en la LUT son
instanciaciones de la primitiva af+fig, donde f y g son grupos de bits que
representan fragmentos de las funciones F y G, de manera que para obtener
cualquier punto aF+fiG, hay que realizar tantos accesos a la LUT como
fragmentos del tamao de/haya en F (igual al nmero de fragmentos del tamao
de g que hay en G) y recomponer posteriormente el valor a F + G mediante
una suma. Suponiendo que Fy G tienen un tamao de bits, si se considera una
fragmentacin en partes, los fragmentos tendrn un tamao de t = n/p bits. Por
tanto, el nmero de celdas de la LUT es 2
2
'. La tabla 3.1 muestra un ejemplo de
tabla LUT en la cual los fragmentos/y g son de dos bits (f= (f, /2) y g = ig, g)).
Cabe mencionar que uno de los bits de cada fragmento es el bit de signo que
corresponde al operando.
(fi, g) = (00)
(fn Ri) = (01)
(fug,) =(10)
(f,,gi) =(11)
{fl,g2)=(00)
0
-
a
-
(2,g2) = (01)
0

a
+
(2, ft) = (10)
0
-
-a
- -
(f2,g
2
)=(ll)
0

-a
- +
Tabla 3.1. Estructura de una tabla LUT con fragmentos de 2 bits
77
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
La suma de las instanciaciones af+ gextradas de la tabla puede realizarse de
forma secuencial. Por tanto, el mdulo de clculo consta de una tabla LUT y de
un sumador.
En la implementacin propuesta, para los valores de los argumentos, se ha
optado por una representacin en coma fija con la particin siguiente:
F y G tienen bits, de los cuales:
Signo = 1 bit, parte entera
n
/r, bits, parte fraccionaria
n
/~ - 1 bits. El rango
abarcado por esta representacin es:
- u - ---1) i -n - ---1)
[-2~
(
2 ,_22+2
2
]u[2"
(
2 , 2
2
- 2
2
]
Los valores de y /?que intervienen en los ejemplos presentados en esta
investigacin estn comprendidos entre 0 y 2. De ah que no haya bit de signo y
que slo haya 1 bit dedicado a la parte entera en la particin propuesta. En otros
supuestos, la particin sufrira las modificaciones pertinentes.
Parte entera = 1 bit, parte fraccionaria = '-1 bits
El rango abarcado es [2"
(
"'
_1)
,2 - 2"
(, ,
' "
, )
].
El tamao de las instanciaciones de las primitivas almacenadas en la LUT es
n"; stas se representan en complemento a dos para evitar las restas en el
momento de recomponer el resultado aF+ . Cabe precisar que, despus de
obtener el resultado, hay que pasarlo a una representacin signo-magnitud
necesaria para direccionar de nuevo la LUT.
Sin prdida de generalidad se plantea = ' = ".
78
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
3 Evaluacin de la arquitectura CBRM
En un dispositivo, los tiempos reales de clculo y el espacio ocupado dependen
de la tecnologa utilizada en las implementaciones. No obstante, se puede lograr
una primera aproximacin de los tiempos de ejecucin y del rea ocupada
independiente de la tecnologa haciendo una estimacin del circuito en trminos
de puertas lgicas. As, en un circuito, el nmero de puertas utilizadas
constituye una medida del rea ocupada y el retardo de una puerta representa la
unidad con la que se mide el tiempo de respuesta del circuito, entendido como
camino crtico. En esta investigacin, se considera como unidad de medida el
conjunto formado por dos puertas lgicas (una XOR y una AND) porque este
conjunto implementa una operacin elemental que es la suma completa de un
bit. T
t
, y T
a
son las unidades de tiempo y espacio, respectivamente, que
corresponden a este dispositivo de clculo elemental y que intervienen en la
estimacin de los bloques lgicos habituales. Una explicacin ms detallada de
este modelo se facilita en [Wong, 1994], [Ercegovac, 2000] y [Pineiro, 2002b].
Se presentan a continuacin estimaciones de espacio y tiempo realizadas para
bloques lgicos usuales, algunos de los cuales se encuentran en el prototipo
propuesto.En estas estimaciones, adems de T
t
, y X
a
, suelen intervenir otras
caractersticas como el tamao en bits y el nmero de entradas del bloque.
Tiempos
Tablas LUT: se estima un retardo de 3 x
t
para una tabla con entrada de 7 bits,
3.5 t
t
para entradas de 8 bits, 4 x
t
para entradas de 9 bits y 4.5 x
t
para entradas de
10-11 bits, 5 x
t
para entradas con ms de 11 bits.
79
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
M ultiplexor es: los multiplexores 2:1 y 3:1 tienen un retardo de 0,5 x
t
Registros: tienen un retardo de lx
t
Registros de desplazamiento: hasta 4 desplazamientos 0,5 x
t
; l,5-n-x
t
si el
nmero de desplazamientos est comprendido entre 5 y 16, y 3 , si est
comprendido entre 17 y 64.
Estructura de reduccin: para un contador 3:2 se asume un retardo de 2x
t
y para
un contador 4:2 el retardo es de 3 x
t
reas
Tablas LUT: 40 x
a
/Kbit para tablas direccionadas por 6 bits como mximo y 35
Xa/Kbit para direccionamientos entre 7 y 11 bits.
M ultiplexores: 0,25-k-n- x
a
siendo k el nmero de vectores de entrada y el
tamao de la palabra
Registro de bits: 0,5 x
a
Registros de desplazamiento: hasta 4 desplazamientos, 0,5-n- x
a
siendo el
tamao de la palabra; 2,5-n-x
a
si el nmero de desplazamientos est comprendido
entre 5 y 16, y 10,5 x
a
si est comprendido entre 17 y 64.
Estructura de reduccin: para un contador 3:2 se asume un retardo de 2x
a
y para
un contador 4:2, 4 x
a
3.1 Complejidad
Espacio ocupado
En la Tabla 3.2 se ha realizado una estimacin del rea que ocupa una LUT,
expresada en funcin de x
a
para distintos valores de t y de n. El espacio vara con
80
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3

16
32
64
t
1
2
4
8
1
2
4
8
1
2
4
8
LUT
Bytes
32
128
2 KB
512KB
64
256
4 KB
1 MB
128
512
8KB
2MB


10 ,
40 x
a
560 x
a
102400 x
a
20 x
a
80 x
a
1120x
a
204800 x
a
40 x
a
160x
a
2240 x
a
409600 x
a
Tabla 3.2 Estimacin de la memoria ocupada por una LUT
En base a los datos reflejados en la Tabla 3.2 se establece una estimacin del rea
total ocupada por el mdulo de clculo CBRM, expresada en trminos de x
a
para
distintos valores de y t. Para ello se suman las reas ocupadas por la LUT, por el
sumador y por el registro de desplazamiento (Tabla 3.3).
=l
t=2
t=4
=8
= 1 6
10
2
+161
3
+8
8
= 34t
a
40 T
a
+ 8-2-Ta +8x
a
= 64 Xa
560xa+4-4x
a
+8x
a
= 584 Xa
102400 Xa + 2-8-Xa +8x
a
= 102424 Xa
= 32
20x
a
+32-l-x
a
+16x
a
= 68x
a
80x
a
+16-2-Xa+16x
a
= 128 Xa
1120xa+8-4x
a
+16x
a
= 1168 x
a
204800 x
a
+ 4-8-Xa +16x
a
= 204848 x
a
= 64
40x
a
+64-l-x
a
+32x
a
= 136x
a
160x
a
+32-2-Xa +32x
a
= 256 Xa
2240 Xa + 16-4x
a
+32x
a
= 2336 x
a
409600 Xa +8-8-x
a
+32x
a
= 409696 Xa
Tabla 3.3 Estimacin del rea total ocupada por el mdulo de clculo del CBRM
81
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
Se observa que el rea total ocupada crece exponencialmente con t y linealmente
con n. El coste de rea viene motivado esencialmente por el tipo de crecimiento
exponencial de la LUT. A efectos de ocupacin de rea, interesa que los
fragmentos sean lo ms pequeos posible, cualquiera que sea el valor de n.
Tiempo de clculo
La Tabla 3.4 muestra una estimacin del tiempo de clculo expresado en funcin
de t
t
para distintos valores de y t. El tiempo de clculo es la suma del tiempo de
acceso a la LUT y del tiempo invertido por la suma secuencial.
=l
t=2
t=4
t=S
=16
3T
t
+16x
t
lg 16+7,5 ,
= 74,5 ,
3 , +8 , ^8+7, 5 ,
= 34,5 ,
4.5T
t
+4x
t
lg4+7,5Tt
= 20 ,
5 ,+2 ,1 2+7,5 ,
= 14,5 ,
= 32
3 ,+32 , lg 32 +15,5 ,
= 178,5 x
t
3 ,+16 , lg 16+15,5 ,
= 82,5 ,
4.5T
t
+8t
t
lg8+15,5T,
= 44 ,
5T
t
+4x,lg4+15,5T
t
= 28,5 ,
= 64
3
(
+64 , lg 64+31,5 ,
= 418,5 x
t
3 ,+32 , lg 32+31,5
(
= 194,5
(
4.5T,+16t
t
lg 16+31,5 ,
= lOOxt
5 ,+8 , Ig8+31,5T,
= 60,5 ,
Tabla 3.4 Estimacin del tiempo de clculo del CBRM
Se observa una disminucin clara del tiempo de clculo cuando crece el tamao t
de los fragmentos. La disminucin es ms acusada cuanto ms altos son los
valores de n. Ello se debe a la importancia relativa del segundo trmino de la
suma, correspondiente al tiempo del sumador, que es n/t-log2 nlt y que decrece
marcadamente cuando i aumenta. Los tiempos de acceso a la LUT son poco
relevantes; no dependen de n, slo de t pero son poco variables con ste.
Resumiendo: las estimaciones del rea ocupada y del tiempo de clculo
invertido ponen de manifiesto que el tamao creciente de los fragmentos
82
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
3.2 Simulacin del mdulo de clculo CBRM
Se ha sintetizado el circuito relativo al mdulo de clculo del prototipo CBRM en
la plataforma xcv300e-6bg352-XST de Xilinx, con el propsito de verificar el
funcionamiento del mtodo.
El mdulo de clculo descrito en VHDL consta de dos subcircuitos principales,
MEM y MAC cuyo cometido es, respectivamente, seleccionar las primitivas
parciales y sumarlas secuencialmente, siguiendo la Implementacinl. A su vez, el
mdulo MEM se desglosa en otros tres, Tlu, Puntos y Counter. Tlu representa
la LUT en la cual se almacenan las primitivas que actan como productos
parciales de una multiplicacin, Puntos selecciona los cuatro bits de
direccionamiento extrados de las entradas F G y Counter marca el paso de
extraccin. El mdulo MAC, que realiza la suma secuencial y los
desplazamientos de los productos parciales, se compone de dos mdulos
embebidos el uno en el otro: Prueba y Elemento recursivo. Prueba es un
sumador de 1 bit, Elemento recursivo es un sumador de bits construido por
repeticin de Prueba. Para terminar, MAC repite veces la estructura de
Elemento recursivo. Sincronizado con el reloj del sistema, el contador Counter
marca los accesos a LUT de 0 a 15. Cada acceso es recogido por el mdulo
Puntos para proporcionar los cuatro bits y que direccionan la LUT. A su salida
cada producto parcial extrado va al MAC donde es sumado y desplazado, hasta
completar las 15 sumas de que consta una iteracin. El resultado obtenido, que
est en complemento a dos, deber ser convertido a representacin signo
83
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
magnitud antes de realimentarse en el mdulo Puntos para iniciar la siguiente
iteracin, despus de poner el contador Counter a cero
En las figuras 3.4 a-1, se presenta un esquema del circuito de clculo CBRM
desglosado por mdulos. Para cada mdulo se muestran el smbolo y su
instanciacin.
addr<3:0>data<15:0> d<3:0 > pparcial<15 :0 >
Fig. 3.4a Mdulo Tlu representado simblicamente e instanciado por una ROM
p<3:0 > dreccion<3:0 >
puntodos<15 :0 >
puntouno<15 :0 >
Fig. 3.4b Mdulo Puntos representado simblicamente
84
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
lEriataTOi-
iBrtataMi-
[ S 5> -

liiriainlli}-
I Brian) H>-
I Brian) H -
I Brian! !')>-
liffl..riin> -
l aanri f r. i i ri i i l aj f r
flSSTlJBt-
iBriairiH-
I Brian) i fr.
iBrianfti?-
InriawUft-
IprianWS-
I ririairiyiS
Inri i ri l l ?-
I Brian) ri j -
JTirianjin-
l a r i mM-
| Brian) Hfr-
I nrinJij I )i
I Bri an)' 3?-
I Brian) Hi -
lBriairi'qS-
2 1>
jaam) i>
HaamW)
Fig.3.4c Instantiation del mdulo Puntos por dos multiplexores
85
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
elk
resetint
contador<3:0>
count<3:0>
resetint>
Fig.3.4d Mdulo Counter representado simblicamente e instancado por un contador
punt odos<15 : 0 >
punt ouno<15 : 0 >
cl k
reset i nt
cont ador <3: 0 >
pparcal <15 :0 >
Fig.3.4e Mdulo MEM representado simblicamente
CHUiCPt-
ti tl CH Wlf r
lliWJKlll-lS*- ln.jriLLijJi
Fig.3.4f Estructura del mdulo MEM
Fig.3.4g Mdulo Prueba representado simblicamente
86
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
_ 11 = 0 OC
- !
-0>
Fig.3.4h Mdulo Prueba instanciado por puertas XOR
ent1<15:0>
ent2<15:0>
las<16:0>
sal<16:0>
Fig.3.4i Mdulo Elemento recursivo representado simblicamente
'IL
l eiti(isa>-
tfr

3( 60)>
fedsa-
Fig.3.4j Mdulo Elemento recursivo instanciado por puertas XOR
87
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
e itraS l: 16D=-
e lirada!* 16D>
ei0ada316&-
sitiacB4- =16l
e HiadaS* 160-
ei03B7- =16&-
eitI3CB&=16D=-
!333[^16&-
413( 11-=160>
eitI33H-:16D:-
eiada15<160-
sal t ea 16D>
salHa3<1SiJ*
alB3316B>
alu5*- :15ft-
salU3S-=15B:-
alld3&<:16l]>
alJNIS IN
alld3&- =16l
alHa&-=16D>
alB1[ k160-
alfcB11^16D>
alkB12=16fl=-
3 3 3* 15 &-
3IH3H-:15D>
alBa1S^16Ib-
itrai
Fig.3.4k Mdulo MAC representado simblicamente
88
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
pi i t Kt e-=l SD>
pHt l | i >=1S&-

l t l i t
cotiacior-=3lt-
aluaQ-=3>3ri=-
aiidal-=2B3i}>
alU 32-=2o3l-
falHE3---2o3D>
al t a^ as gi l
alK&&c38BIJi-
alu35 -=333D:-
aikS-=2EBii>
ai03o-=2Sr;D:-
alKfi9<23SD>
3 3 *233&-
aiktal 1-=3SSD=-
andai2-=2sgrb-
i3Ha13-=333l-
ai aaH-=233&-
i3HCB15 23EIl-
3IHa1&2SStt-
Fig.3.41 Mdulo de clculo CBRM representado simblicamente
Las estimaciones de tiempo se han realizado con datos de precisin igual a 16
bits, arrojando los resultados que aparecen en la Tabla 3.5. Cada estimacin se
realiza midiendo el tiempo entre que la seal entra al mdulo por un pin de
entrada hasta que sale por un pin de salida; por consiguiente, ninguna estimacin
tiene porqu ser nica. El tiempo consta de la suma de dos contribuciones, la de la
lgica combinacional involucrada ms la de la lgica de encaminamiento, que
figuran en este orden en la tabla. El contador tiene un tiempo de offset que influye
en los mdulos MEM y CBRM y que se ha tenido en cuenta en los resultados.
89
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
Mdulo MEM
Counter 6,778 ns = 5,594 ns + 1,184 ns
Puntos 10,897 ns = 6,977 ns + 3,920 ns
Tlu 8,939 ns = 5,867 ns +3,072 ns
Total MEM = 26,229 ns = 15,085 ns + 11,144 ns
Mdulo MAC
Prueba 8,011 ns = 5,867 ns + 2,144 ns
El.recursivo 29,683 ns = 12,419 ns + 17,264 ns
Total MAC = 77,827 ns = 26,459 ns + 51,368 ns
Total CBRM -parcial = 51,951 ns = 18,655 ns + 33, 296 ns
Total CBRM = 104,056 ns = 26,229 ns + 77,827 ns
Tabla 3.5 Estimaciones de tiempo del mdulo de clculo CBRM implementado en la FPGA
xcv300e-6bg352-XST de Xilinx.
Los resultados que aparecen en la Tabla 3.5 ponen de manifiesto que:
El tiempo total empleado por el mdulo MEM depende linealmente del
tiempo correspondiente a los mdulos que lo integran. As es tambin la
dependencia de los tiempos que corresponden a la lgica combinacional y al
encaminamiento.
El tiempo empleado por la lgica combinacional del mdulo MAC crece
linealmente desde el nivel ms interior, Prueba, hasta el ms exterior MAC.
El tiempo de encaminamiento crece en el mismo sentido, pero con un
crecimiento rpido primero que tiende a moderarse.
Generalmente, se observa que el tiempo invertido por el encaminamiento es
inferior al que necesita la lgica combinacional, salvo que se trate de
estructuras embebidas.
El tiempo total de clculo del CBRM-parcial que aparece en la Tabla 3.5 debe
interpretarse como la suma de MEM ms El. Recursivo. Ello se debe a que
el dato extrado de la memoria tiene 16 bits obligando a una suma de 16 bits,
90
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
4 Mejora de la arquitectura CBRM
La arquitectura CBRM es paralelizable en algunas de sus etapas, sugiriendo
mejoras en sus prestaciones. Se consideran en este apartado la incorporacin de
distintos grados de paralelismo. Primero, se plantea la paralelizacin de la suma
en el mdulo de clculo. En un segundo tiempo, aprovechando la particin inicial
realizada por el tipo de representacin de los datos elegido, se propone la
paralelizacin de la ejecucin del clculo de un punto. Para finalizar, se considera
la paralelizacin del clculo de puntos de una funcin.
4.1 Incorporacin de paralelismo en la suma, en el
mdulo de clculo
En el mdulo de clculo descrito, la suma de los productos parciales se realiza
secuencialmente, como aparece en la Tabla 3.5. Esta operacin de sumas de
bits tiene una complejidad temporal proporcional a 0(n
2
). La realizacin de una
suma con estructura de reduccin rebaja la complejidad a 0(nlog2n) con el
consiguiente aumento de hardware. En este sentido existen abundantes referencias
en la literatura que proponen diversos algoritmos que utilizan circuitos contadores
[Wallace, 1964], [Dadda, 1965] o compresores [Weinberger, 1981], [Song y de
Michelli, 1991], [Known et al., 2000] basados en elementos de suma sin acarreo
91
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
[Bewick y Flynn, 1992], [Omondi, 1994], [Oklobdzija et al, 1996], [Choi et al.,
1997]. Estos elementos son conectados entre s formando una topologa
determinada, por ejemplo en rbol [Takagi et al, 1985]. Si los sumandos estn
divididos en fragmentos de tamao mayor que 1 bit, cabe tambin la posibilidad
de realizar la suma por bloques [Mora, 2001],
Las Tablas 3.6 a, b y c muestran la diferencia entre el rea ocupada por
implementaciones que emplean un sumador que opera secuencialmente o un
sumador con reductores. En esta ltima implementacin no intervienen los
registros de desplazamiento.
= 16
t=\
t=2
t=4
=8
Implementacin con sumador
secuencial
10

+161
3
+8
3
=34

40
3
+8 2
3
+8
3
=64
3
560 T
a
+ 44
3
+8 = 584
3
102400
3
+ 2-8-Ta +8T
S
= 102424 T
a
Implementacin con reductores 4:2
10x
a
+7x
a
+ 16-lT
a
=33i
a
40 Ta + 7 Ta + 8' 2t a = 63 Ta
560
3
+7
3
+ 44
3
= 583
3
102400 Ta +7 Ta + 28
3
= 102423 T
a
Tabla 3.6a Estimacin del rea total ocupada por las implementaciones con sumador secuencial y
con reductores para = 16 bits
92
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
= 32
t=\
t=2
t=4
=8
Implementation con sumador
secuencia!
20 +32 1

+16
8
= 68

80
3
+16- 2
3
+16
8
= 128
3
1120 Xa + 84
8
+16

= 1168 T
a
204800 ta + 4-8-Xa +16x
a
= 204848 T
a
Implementation con reductores 4:2
20 T
a
+15 Ta+ 32 1
0
= 67 T
a
8 0
3
+ 1 5
3
+ 16 2
3
=127
3
1 1 2 0
3
+1 5
3
+8 4
3
= 1167 Ta
204800 Ta+15 Ta +
4 8
3
= 204847 Ta
Tabla 3.6b Estimacin del rea total ocupada por las implementaciones con sumador secuencial y
con reductores para = 32 bits
n = 64
f=l
t=2
t=4
=8
Implementation con sumador
secuencial
40 T
a
+ 64-l-T
a
+32T
a
= 136 T
a
160 T
a
+ 32-2-Ta +32x
a
= 256 T
a
2240 T
a
+ 16 4
3
+32
8
= 2336 T
a
409600 Ta + 8-8-Ta +32x
a
= 409696 T
a
Implementation con reductores 4:2
40T
a
+3l Ta +64- l T
a
=135T
a
160 Ta + 31 Ta + 32-2
9
= 255 T
a
2240T
a
+3l Ta + 16-4
3
= 2335 Ta
409600 Ta+31 Ta +
88
3
= 409695
3
Tabla 3.6c Estimacin del rea total ocupada por las implementaciones con sumador secuencial y
con reductores para = 64 bits
Estas tablas ponen de manifiesto que la implementacin con reductores presenta
una ocupacin de rea equivalente a la de la implementacin con suma
secuencial.
93
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
Las Tablas 3.7 a, b y c muestran la diferencia entre los tiempos de clculo en
implementaciones que emplean un sumador que opera secuencialmente o un
sumador con elementos de reduccin.
=1 6
= l
= 2
= 4
t=8
Implementation con sumador secuencia!
3 , +16 , lg 16+7,5t
t
= 74,5 ,
3 , +8 , ^ 8 +7 , 5 = 34, 5 ,
4.5T,+4T
t
lg4+7,5T
t
= 20T
t
5
(
+2 , ^ 2+7, 5 , = 14, 5 ,
Implementation con reductores 4:2
3t
t
+3.3"u
t
+T, lg 16 = 16 ,
3 , +3. 3 , + , ^8 = 1 5 ,
4.5 ,+.3 3 ,+ , ^ 4 = 15,5 ,
5t
t
+3. 3x
t
+x, l g2 = 15 ,
Tabla 3.7a Estimacin del tiempo de clculo en las implementaciones con sumador secuencial
y con reductor para = 16 bits
=3 2
t=\
t = 2
t = A
= 8
Implementation con sumador
secuencial
3 , +32 , lg 32 +15,5 ,= 178,5 ,
3 , +16 , lg 16+15,5 , = 82,5 ,
4. 5 , +8 , ^8+15, 5 , = 44 ,
5
(
+4 , lg 4 +15,5 ,= 28,5 ,
Implementation conreductor 4:2
3 , +3. 4 , + , lg 32 = 20 ,
3 , +3. 4 , + , lg 16= 19 ,
4 . 5 , +3 . 4 , + , ^ 8 = 19,5 ,
5T,+3.4x
t
+ T, l g 4 = 19 ,
Tabla 3.7b Estimacin del tiempo de clculo en las implementaciones con sumador secuencial
y con reductor para = 32 bits
=6 4
t=\
t = 2
f=4
t=8
Implementation con sumador
secuencial
3 , +64 , lg 64+31,5 ,= 418,5 ,
3 , +32 , lg 32+31, 5t
t
= 194,5 ,
4.5 ,+-16 , lg 16+31,5 = 100 ,
5x
t
+-8 , lg 8+31,5x
t
= 60,5 ,
Implementation con reductor 4:2
3 ,+3.5 , + , lg 64 = 24 .
3T
t
+3. 5T
t
+T, l g32 = 23T
t
4. 5T
t
+3. 5T, +T, lg 16 =23, 5 ,
5 , +3. 5 , + , ^ 8 = 23 ,
Tabla 3.7c Estimacin del tiempo de clculo en las implementaciones con sumador secuencial
y con reductor para = 64 bits
94
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
Estas tablas ponen de manifiesto que la implementacin que utiliza reductores
invierte un tiempo de clculo prcticamente constante para cualquier tamao de
los fragmentos de un operando. Adems, el tiempo de clculo crece bastante
poco con el tamao del operando. Cabe observar que los tiempos en la
implementacin con reductores son mucho mejores que los de la
implementacin con sumador secuencial, sobre todo a medida que el tamao de
los fragmentos disminuye y a medida que aumenta el tamao de los operandos.
4.2 Incorporacin de paralelismo en el clculo de
un punto
La particin inicial de los operandos puede utilizarse para incorporar
paralelizacin a nivel de la ejecucin del clculo:
a) obteniendo el resultado del producto que corresponde a la parte entera de
F por la parte fraccionaria de amas la parte entera de G por la parte
fraccionaria de (mediante extracciones de la LUT)
b) sumndole al resultado anterior F (si la parte entera de a es igual a 1), G
(si la parte entera de /?es igual a l ) , F+G (si las partes enteras de y
/?son iguales a 1)
c) obteniendo el resultado del producto que corresponde a la parte
fraccionaria de F por la parte fraccionaria de a ms la parte fraccionaria
de G por la parte fraccionaria de (extracciones de la LUT)
Este planteamiento permite mayor flexibilidad, permitiendo tomar en
consideracin la parte a) solamente, para aplicaciones en las que pueda asumirse
el error debido a la eliminacin de la parte fraccionaria de F y G. Puede tambin
paralelizarse el clculo de las etapas a) y c). Por otra parte, la etapa b) no
95
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
interviene cuando a y estn comprendidos entre cero y uno, por tanto slo se
tomar en consideracin cuando sea necesario.
Las mejoras en rea ocupada y en tiempo de clculo dependen del supuesto en el
que se trabaja. En el supuesto a), la mejora puede cuantifcarse a partir de lo
establecido por el estudio anterior relativo a datos no particionados, con la
correccin del nmero de bits que corresponda. Como ejemplo, se trata el caso
del clculo paralelo de las partes a) y c), estudiando tambin la influencia del tipo
de particin de los operandos.
Clculo paralelo con operandos particionados
Se sustituye un operando de bits por dos operandos de

/~ bits y
n
/~ -1 bits. El
primero representa la parte entera y el segundo la parte fraccionaria. La
implementacin utiliza una tabla LUT compartida y duplica el sumador y los
elementos de reduccin que corresponden. Los resultados se muestran en las
Tablas 3.8 a-b.
t=\
t=2
t=4
=8
Implementacin con reductores 4:2
= 32particionado en \6y 15
10x
a
+2(7T
a
+16-lT
a
) = 56T
a
40
3
+2( 7
3
+8 2
3
) = 86
3
560 Ta +2(7 ta + 44
3
) = 606
8
102400 Ta+2(7 T
a
+ 28
3
) = 102446
3
Implementacin con reductores 4:2
- 64particionado en32y3\
20T
a
+2(15Ta+32-lT
a
)=114T
a
80Ta+2(15T
a
+ 16-2x
a
)= 174 Ta
1120Ta+2(15Ta+8-4Ta)= 1214 Ta
204800 Ta+2(15
3
+ 48
3
)= 204894 T
a
Tabla 3.8a Estimacin del rea ocupada por la implementacin con datos particionados, para = 32
y = 64
96
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
= l
= 2
= 4
=8
Implementation con reductores 4:2
=32particionado en \6y 15
3T,+3.3T
t
+T
t
lgl6= 16 ,
3x
t
+3.3T
t
+T
t
lg8 = 15 D
t
4.5T
t
+.3 3T
t
+T
t
lg4= 15,5 ,
5T
t
+3.3T,+ T, lg2= 15 t
t
Implementation conreductor 4:2
=64 particionado en 32 y 31
3T
t
+3.4T,+T
t
lg32 = 20x,
3T
t
+3.4x,+T,lg 16 = 19 ,
4.5T
t
+3.4x,+T
t
lg8 =19,5 ,
5x,+3.4T
t
+ T
t
l g4= 19 ,
Tabla 3.8b Estimacin del tiempo de clculo la implementation con datos particionados, para = 32
y = 64
Comparando la Tabla 3.8 a con las estimaciones homologas de la Tablas 3.6b-c,
se pone de manifiesto una disminucin apreciable del rea ocupada en la
implementation que particiona los operandos; la disminucin es tanto mayor
cuanto mayor es el tamao del fragmento. La comparacin de la Tabla 3.7b con
las Tablas 3.8b-c muestra tambin una disminucin de tiempo, pero no tan
apreciable ya que, como se ha mencionado anteriormente, la implementacin con
elementos de reduccin no presenta variaciones de tiempo espectaculares cuando
el tamao del operando vara, ni tampoco cuando vara el tamao del fragmento.
La particin propuesta para los operandos es aproximadamente de mitad y mitad
para las partes entera y fraccionaria del operando. Si una de las partes es de
tamao mayor que la otra, no se prevn cambios en el rea ocupada, ya que sta
se calcula como una suma de contribuciones de dos dispositivos, independiente de
su distribucin. El tiempo de clculo experimenta un ligero aumento, debido a la
parte del operando que presenta mayor nmero de bits, pero, tal y como ya se ha
observado, las variaciones del tamao del operando tienen poca repercusin en
los tiempos.
97
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
4.3 Incorporacin de paralelismo en el clculo de
puntos de una funcin
El clculo de puntos de una funcin puede efectuarse a travs del mismo
mdulo de clculo, adoptando la particin de datos que se estime oportuna. Si
es el tiempo de clculo de un punto, la utilizacin de un mismo mdulo para el
clculo de los puntos tiene como efecto la multiplicacin por un factor del
tiempo T. Para paliar este aumento lineal del tiempo se pueden proponer
arquitecturas que, aunque aumenten un poco el rea ocupada, son beneficiosas
para la disminucin del tiempo de clculo, de manera que permiten establecer un
compromiso segn los requerimientos del problema a resolver.
El problema es el siguiente: dada una funcin, calcular puntos en el intervalo
[a, b]. La introduccin de paralelismo a este caso consiste en establecer distintas
etapas que representan la profundidad de un rbol. Cada etapa de clculo divide
los subintervalos de [a, b] definidos en la etapa anterior en subintervalos ms
pequeos. Por tanto, al inicio de cada etapa, el nmero de mdulos que han de
actuar es igual al nmero de subintervalos definidos en la etapa anterior. En cada
etapa el clculo de los mdulos se realiza en paralelo.
SiN = NixN
2
x....xN
p
I
a
etapa: 1 m dulo calcula N, puntos
2
a
etapa: Ni mdulos calculan Ni N2 puntos (N
2
puntos por mdulo)
p-sima etapa: N
1
xN
2
x....xN
p
.
1
mdulos calculan = NiXN
2
x..xN
p
puntos (N
p
puntos por mdulo)
98
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
En la Tabla 3.9 se presentan los resultados en cuanto a tiempo de clculo y
nmero de mdulos necesarios para el clculo secuencial realizado por un solo
mdulo y el clculo paralelizado.
Clculo
secuencial
Calculo
paralelizado
Tiempo de clculo de puntos
TN = TN,N
2
-N
p
=TN,+TN
2
+ + TN
p
= T(N,+N
2
+ + N
P
)
Nmero de mdulos necesarios
1
1+ Ni + N,N
2
+ N, N
2
N
3
.+...+.N! N
2
N
3
... N
p
.i
Tabla 3.9 Estimacin del tiempo de clculo y del nmero de mdulos en el clculo secuencial y
paralelo
Se observa que en el clculo paralelizado, el tiempo depende de la
descomposicin N
l s
N2, , N
p
que se ha hecho de N. El valor de la suma
N1+N2+ + Np disminuye cuando aumenta p, que es el nmero de factores en
los que se descompone N. Por tanto, dado N, para mejorar el tiempo, hay que
realizar el mayor nmero posible de etapas. Por el contrario, el nmero de
mdulos necesarios decrece cuando disminuye p, es decir, cuando disminuye el
nmero de etapas. Adems, si se ordenan los nmeros N de forma que el mayor
sea Np, disminuye tambin el nmero de mdulos, dado que N
p
, no interviene en
la expresin.
Comparado con los resultados proporcionados por un mdulo nico, el clculo
paralelizado presenta la ganancia de velocidad, la productividad y la eficiencia
siguientes:
99
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
ganancia en velocidad:

",
# /
77V ,
T(N
l+
N
2
.... + N
D
)

1
' ^
2
"
pJ


1
P =
productividad:

l + N
{
+N
X
N
2
+ + N
l
N
2
N
p
_,
eficiencia:
En la primera etapa:
77V, ,
, =
""1
(
+

2
+

) ^

En la 2
a
etapa:
77V, TV,
, =
2 _ 2
' 2
T(N
l+
N
2
+ N
p
)
i
P
".
En la p-sima etapa
"-
1
r ( / V
I +
; V
2
+ -L
'
z ,
2 ' "
1
*,
100
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
La eficiencia media es:
E- '
p-\
La Tabla 3.10 recoge las medidas de ganancia en velocidad, productividad y
eficiencia del clculo realizado por un mdulo frente al clculo paralelizado.
Clculo
secuencial
Clculo
paralelizado
Ganancia en
velocidad
1
m
G = '

1
P roductividad

\ +

2
+ +

,
Eficiencia
100%
-\
F - '
-\
Tabla 3.10 Comparacin de ganancia en velocidad, productividad y eficiencia entre el clculo
secuencial y paralelizado
En la Tabla 3.10 se observa que el clculo de puntos llevado a cabo por un solo
mdulo tiene unas medidas de productividad y eficiencia ptimas. Sin embargo,
el clculo paralelizado obtiene una ganancia en velocidad superior a la del clculo
secuencial, modulable por la descomposicin de N. La productividad y eficiencia
son, en cambio, inferiores.
101
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
5 Conclusin
El presente captulo se ha dedicado al estudio de la arquitectura CBRM, con la
propuesta y evaluacin de un prototipo de procesador, del cual se han estudiado
las caractersticas del mdulo de clculo. Se han realizado estimaciones del
tiempo de clculo y del rea ocupada utilizando una medida de los recursos
hardware independiente de tecnologa, facilitando posteriormente medidas con
referencia explcita a una plataforma determinada. Se han realizado igualmente
algunas propuestas de mejora de prestaciones del mdulo de clculo con
incorporacin de paralelismo. Adems de considerar las mejoras obtenidas por la
paralelizacin de la suma, se ha planteado tambin el clculo pralelo El clculo de
un gran nmero de puntos tiene una limitacin inherente al CBRM que es la de
proporcionar un punto por iteracin. Se propone una arquitectura que consta de
varios mdulos interconectados, que incorpora etapas de clculo paralelo. Esta
propuesta presenta flexibilidad debido a la posibilidad de variar el nmero de
etapas y el nmero de mdulos por etapa. Se establecen las comparaciones en
cuanto a ganancia en velocidad, productividad y eficiencia de los dos tipos de
clculo en funcin de estos parmetros.
102
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Volver al ndice/Tornar a l'ndex
Captulo 4
Captulo 4
CLCULO DE ROTACIONES
MEDIANTE CBRM
1 Introduccin
El presente captulo y el siguiente estn dedicados a las aplicaciones. Debido a
su presencia en numerosos y muy diversos mbitos, las funciones
trigonomtricas e hiperblicas constituyen un caso de enorme inters aplicado.
As, es previsible que cualquier mejora en la operatoria de estas funciones
repercuta favorablemente en el rendimiento global de los clculos en los que
dichas funciones intervienen. La rotacin es una transformacin geomtrica,
formalizable a partir de la combinacin de las funciones trigonomtricas seno y
coseno, que sirve de base a algunas transformaciones muy utilizadas en
tratamiento digital de la seal y de la imagen como la transformada de Hough
[Bruguera, 1996], [Garca et al, 2003a], [Garca et al, 2003b], de Fourier [Frigo,
1998], [Frigo, 2000], [Randi, 2000] y la transformada del coseno [Snchez,
1997], [Dick, 1998]. En estos casos, el CBRM presenta una idoneidad particular
como mtodo de clculo debido a la posibilidad de evaluar simultneamente las
dos coordenadas caractersticas del punto que rota. El presente captulo est
dedicado a la clasificacin de algunas de estas transformadas con el fin de
103
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Calculo de rotaciones mediante CBRM
proponer un patrn comn de clculo para todas ellas, asumible por el CBRM.
Posteriormente, se efecta un anlisis comparativo de los resultados de clculo
de las transformadas de Hough y Fourier entre el CBRM y otros mtodos
conocidos.
2 Rotaciones en el plano
Seguidamente se analizan las ecuaciones de la rotacin bidimensional y se
expresan con el formalismo del CBRM
2.1 Ecuaciones
En el plano definido por un par de ejes ortogonales, (Ox, Oy), sea P (x, y) un
punto de una circunferencia de radio Ry el ngulo que forman OP y el eje
Ox
= Reos i (4.1)
y i = R sen
Sea el incremento de cada rotacin:
0i= 6>;_/ + , Vi
As,
eos i = cos(0i. + ) (4.2)
sen = sen ( . + )
planteando eos - a, sen =
desarrollando y sustituyendo (4.2) en (4.1) y reagrupando los trminos, se
obtiene:
104
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
x = .- .,
y = ayi- + - (
4

3
)
con la restriccin adicional a
2
+
2
-l
Las ecuaciones (4.3) expresan el valor de las coordenadas del punto rotado
despus de cada rotacin, en funcin de las coordenadas del punto anterior.
Si se definen las coordenadas del punto como dos funciones F y G, de forma
que cada funcin represente la proyeccin del punto sobre uno de los ejes:
F(x
i
,y
l
)=x

(4.4)
G(xi,y) =y
Sustituyendo (4.4) en (4.3), resulta:
F(xy} = a F(x.i, y
t
.i) - G(x
iA
y .i)
G(xy) = a G(Xi.i,yi-i) + ( ^, .,) (4.5)
con
La aplicacin del CBRM no hace intervenir explcitamente las coordenadas; en
su lugar se le asocia, como consecuencia de la regularizacin establecida, el
nmero de la iteracin en curso. El clculo de F y G se expresa entonces como
F
l
= aF
rl
- f i G
i
.
G = a G,., + fiFi
i - I
(4.6)
con
c^ + /f = \
Las ecuaciones (4.6) son valuables a partir de las primitivas encontradas, por
tanto, bajo el formato CBRM, la rotacin bidimensional corresponde a la
105
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
evaluacin cruzada de dos funciones, F y G, con una restriccin sobre sus
parmetros,
2.2 Funciones configurables a partir de rotaciones
El movimiento de rotacin es comn a muchas transformaciones matemticas;
por ello, la evaluacin de stas por el CBRM se basa en el esquema propuesto en
el apartado anterior.
Aadiendo a las ecuaciones (4.1) la coordenada para pasar de una
representacin bidimensional a otra tridimensional, se describe el movimiento
helicoidal. Haciendo R - A en la primera ecuacin y R = en la segunda, se
describe el movimiento elipsoidal, siendo A y los semi-ejes menor y mayor de
la elipse. Asimismo, la transformada de Hough, utilizada en el proceso de
segmentacin de la imagen, transforma un punto del plano cartesiano P (x,y) en
una curva en el dominio parametrizado ( , ) de Hough, mediante la
ecuacin = x -eos + y-senO, para ngulos pertenecientes al intervalo [ , [. Las
transformadas ortogonales pertenecen a una clase ms general de
transformaciones discretas para las que resulta menos inmediata la configuracin
como rotacin y, por tanto, menos evidente la aplicabilidad del CBRM.
J V - 1
m=0 (4.7)
La ecuacin (4.7) expresa una transformacin ortogonal genrica en la cual f(x),
0< x< y F(u), 0< u< son respectivamente la secuencia original y
106
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Transformada
Fourier
Hartley
Coseno
Walsh
Hadamard
Ncleo T( x ,u)
1 , - 2 inux .
exp( - )

. ,2TVUX .
cos ) + sen ( )

, , . ( 2x4- 1);
e( &) cos
27V
-1
__T~T S_lY'(x )bn-i-\(u)
/=0
i / i - l
J _ T T / _ j \ 6/ (^)i / ()
Observaciones
Ncleo trigonomtrico
Ncleo trigonomtrico
Ncleo trigonomtrico
e(0) = 1/V2
e(k) = \ 0 < <
Ncleo no trigonomtrico
b representa el i-simo bit del entero b
Ncleo no trigonomtrico
b representa el i-simo bit del entero b
Tabla 4.1 Algunas transformaciones ortogonales
El resto del captulo se dedica a desarrollar la aplicacin del CBRM al clculo de
algunas transformadas, realizando las modificaciones formales necesarias cuando
la aplicabilidad del CBRM no puede deducirse de forma sencilla. En todos los
casos se presentan otras propuestas de clculo a fin de comparar los resultados.
107
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
3 Aplicacin del CBRM a la
transformada de Hough
En este apartado se realiza un anlisis formal de la transformada de Hough para
la cual se propone la aplicacin del CBRM, como mtodo idneo de clculo.
Tambin se han seleccionado dos ejemplos en los cuales se incluyen
comparaciones entre los resultados proporcionados por el CBRM y por el
CORDIC. La primera propuesta es una implementacin segmentada
reconfigurable del CORDIC [Deng, 2001]. La segunda considera una aplicacin
paralela del mismo algoritmo [Bruguera, 1996]. Estas implementaciones, que se
discuten en [Garca et al, 2003b], comparan el CBRM y el CORDIC en cuanto a
rea ocupada y tiempo de clculo.
3.1 Transformada de Hough
Propuesta en 1962, la transformada de Hough (HT) es una herramienta
importante en la segmentacin de imgenes [Hough, 59]. Deteccin de curvas
[Muamar, 1991], reconocimiento de objetos [Haule, 1989], vectorizacin de
fotografas areas [da Silva, 1990], reconstruccin de imgenes 3D [Yamazava,
2000], inspeccin de la calidad industrial [Bariani, 1997], aplicaciones
biomdicas [Dong, 2001], [Tezmol, 2002], reconocimiento de qusares [Huang,
2000] y OCR [Sural, 2001], son algunos ejemplos de las mltiples utilidades de
esta transformada. La HT es enormemente atractiva debido a su robustez
aunque la gran cantidad de recursos espaciales y temporales que requiere la han
mantenido alejada de las aplicaciones de tiempo real. Los esfuerzos realizados
en investigacin han ido en la lnea de disear algoritmos rpidos o
arquitecturas ad-hoc. Los distintos algoritmos, basados en el clculo de
funciones son: lineal [Koshimizu, 1990], combinatorio [Ben-Tzvi, 1990],
108
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
El proceso de deteccin de primitivas geomtricas utilizando la HT puede
descomponerse en tres etapas: la creacin del contorno de la imagen utilizando
un detector de bordes, la aplicacin de la HT a cada punto de la imagen y la
votacin en el dominio de Hough por medio de la cual se realiza la extraccin
de las primitivas.
Fig 4.1. Parametrizacin de rectas para la HT.
Si la primitiva a detectar es la recta, desde el punto de vista geomtrico, la HT
transforma un punto del plano cartesiano P (x,y) en una curva en el dominio
( , ) de Hough (ver Fig.4.1). Recprocamente, a un punto del dominio de
Hough le corresponde una primitiva geomtrica del plano. El dominio de
Hough puede interpretarse como una rejilla de votacin en la que cada punto
P (x,y) del plano "vota" por el conjunto de lneas que intersectan en l y que
109
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
son representadas por puntos en la rejilla ( , ). Si disponemos de una imagen
digitalizada de tamao NxN y definimos el espacio parametrizado ( , ) cada
P (x ,y) se transformar en p = x-cos6 + y-sen9 . El espacio parametrizado se
discretiza en NQ niveles, entre 0 y y en niveles, entre p
m
i
n
y p
max
y la
transformada de Hough consiste en calcular los valores para todos los
ngulos del intervalo [ , [ y para cada pixel de la imagen digitalizada. El
clculo directo tiene una complejidad de 0(N ) y el total de operaciones a
realizar es de -NQ Si se considera el intervalo [ , [ como la unin de dos
subintervalos [ o, n/ 2[ u[ n/ 2, n[ , para cada pixel (xi,yj) de la imagen, la
transformada de Hough puede escribirse como:
(4.8)
(4.9)
pj(k) = xfcos0]

+yj-sene]

0<# < / 2
P ll(k) = yj-cosO/ -XfsenO^ /2< ^ <
Haciendo que
^ ^+
cos/ = cos(e^_\ + )
senOfc =sen(0j_i + )
cosA0 = a,senA9 =
Al sustituir (4.9) en (4.8) tenemos que:
P l(k) = a-P l(k-l) + pP n(k-y
p
II
(k) = p
II
(k) + p-p
I
(k-\)
( 4 1 0)
2 2
con a + =1
110
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Segn aparece en (4.10), las funciones (p)
k
y {pn)k son valuables por el
CBRM, con la peculiaridad de que lafuncin G = {p)k cuando se evala {pjj)t y
G = (pn)k cuando se evala {p)k\ inicializando (p)
0
y (pn)o con el valor de las
coordenadas de cada pixel de la imagen.
3.2 Comparacin CBRM - CORDIC segmentado
En este apartado se comparan los resultados de clculo de la HT obtenidos por
el CBRM y por una propuesta basada en el algoritmo CORDIC. En esta ltima
[Deng, 2001], el clculo se realiza con una representacin de los datos de 16
bits en punto fijo y con un CORDIC de 12 iteraciones, implementado en una
plataforma Xilinx XS4010XL-PC84 FPGA para prototipado rpido.
La tarjeta Xilinx XS4010XL-PC84 FPGA es un dispositivo de capacidad media
que funciona con una velocidad moderada. Posee 400 CLBs arreglados en una
matriz de 20 20, que equivale aproximadamente a 10000 puertas.
Para efectuar la comparacin, se han tenido en cuenta por una parte, la
evaluacin de la arquitectura CBRM descrita en el captulo 4 y por otra, las
caractersticas de la tarjeta Xilinx utilizada, teniendo encuenta que un CLB
(Bloque Lgico) consta de una LUT-3, dos LUT- 4 y dos cerrojos.
Comparacin
La implementacin CORDIC ocupa un 83% de rea, esto es, 333 CLBs de los
400 que cuenta la tarjeta XS4010XL A una frecuencia de reloj de 40 MHz, con
una complejidad computacional 0(N
2
) para una imagen N, una imagen de
128x128 pixels con 128 ngulos discretos ( = 1.40625) tarda 0.0262 s en
transformarse. La Tabla 4.2 presenta una estimacin del rea ocupada por el
CORDIC y la Tabla 4.3 presenta la estimacin del rea ocupada por el CBRM.
111
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
Estas estimaciones se han hecho en funcin de x
a
. La precisin de los datos es
de 16 bits. Se han considerado las dos implementaciones del CBRM,
recordando que en la implementacin 1 interviene un sumador secuencial y en
la implementacin 2 se sustituye ste por una estructura de reduccin de 4:2
antes de realizar la suma final. En ambas implementaciones el rea ocupada se
duplica teniendo en cuenta que se efectan dos evaluaciones cruzadas.
CORDIC
Segmentado
LUT-3
LUT-4
Cerrojos
Total
NCLBs=333
1-333=333
2-333=666
2-333=666
rea ocupada
333-2
3
-2
4
-40x
a
/Kbit=1665x
a
23332
4
2
4
40 x
a
/ Kbit =6660-T
a
2-333-0.5-2
4
-x
a
=5328-T
a
13653 x
a
Tabla 4.2 Estimacin del rea ocupada por la implementacin CORDIC
CBRM
P =\
1=1
t= A
=8
Implementation 1
2(10
8
+16-1
8
+8
8
) = 68
3
2(40 ta + 8-2
3
+8t
a
) = 128 T
a
2(560 Xa+ 4-4ia +8r
a
) = 1168 Ta
(102400 Ta+28
8
+8T
a
) - 204848 T
a
Implementation 2
2(10
3
+7
3
+ 16-lTa) = 66T
a
2(40Ta+7Ta+8-2x
a
)= 126 Ta
2(560 Ta +7 Ta + 44
3
) = 1166 Ta
2(102400 Ta +7 Ta + 28
3
= 204846
3
Tabla 4.3 Estimacin del rea ocupada por la implementacin CBRM
112
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
CBRM
t=l
t=2
t=4
t=8
Implementation 1
64-128-128-(3t
t
+16x,lg 16+7,5-c,)
=78,119 ms
64128-128(3 ,+8 , lg 8 +7,5x0
=36,176 ms
64-128-128-(4.5"c
t
+4-c, lg 4+7,5 ,)
=20,962 ms
64.128128(5 +2 , lg 2 +7,5t
t
)
=15,204 ms
Implementation 2
64-128-128-(3x,+3.3T
t
+T,lg 16)
=16,777 ms
64128-128(3
(
+3.3 ,+ , lg 8)
=15,728 ms
64-128-128-(3.5x
t
+3.3x,+ , lg 4)
=16,253 ms
64128128(5 ,+3.3 ,+ , lg 2)
=15,728 ms
Tabla 4.4 Tiempo de clculo del CBRM
La Tabla 4.4 pone de manifiesto que la implementation 2 del CBRM siempre
proporciona mejores resultados que los del CORDIC (0,0262 s).Para =4 y =8,
incluso la implementation 1 del CBRM es mejor que el CORDIC.
3.3 Comparacin CBRM - CORDIC paralelo
En este apartado se considera el clculo de la HT realizado por una
implementacin paralela del CORDIC [Bruguera, 1996]. El clculo de la HT de
una imagen con un procesador CORDIC nico requiere 1^12 ciclos,
113
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
asumiendo que en cada evaluacin se obtienen dos valores de p. El tiempo puede
reducirse por medio de la paralelizacin. Para ello existen tres aproximaciones
distintas: paralelizar los pxeles de la imagen, paralelizar el ngulo , o paralelizar
los dos simultneamente. La paralelizacin de los pxeles requiere
procesadores, a razn de uno por pixel y por ngulo y la transformacin se efecta
en el tiempo de una operacin CORDIC (n ciclos para radix-2, n/2 +n/4 para
radix mixto 2-4 y n/2 para radix-4, si es la precisin de los datos). Adems, de
la cantidad de recursos hardware que supone, esta aproximacin acarrea tambin
conflictos en el proceso de votacin ya que, los resultados obtenidos por los
procesadores que trabajan con el mismo ngulo#pueden votar el mismo elemento
en el espacio de Hough. La introduccin del paralelismo slo en los pxeles
requiere N
2
procesadores, uno por pixel. El nmero de operaciones CORDIC es
entonces de N/2 y tambin puede haber conflictos en el proceso de votacin. La
solucin que no produce conflictos es la paralelizacin de los ngulos. En este
caso, se necesita un procesador por ngulo en el cual son procesados
secuencialmente todos los pxeles de la imagen. El nmero total de procesadores
es de N/2 y el nmero de ciclos para la evaluacin de la transformada es N
2
+ la
latencia; se procesa un pixel por ciclo.
Comparacin
La implementacin considerada en [Bruguera, 1996] utiliza una precisin de 12
bits y un procesador CORDIC de 10 etapas (de estas 10 etapas, 6 son las etapas
estndar de las iteraciones, 1 es la de la compensacin del factor de escala y 3
para la realizacin del escalado). Cada etapa consta de dos registros, dos
multiplexores y dos sumadores/restadores. La etapa estndar necesita 24 bits
para cada ngulo almacenado en la ROM.
114
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
CORDIC paralelo
Registros
M ultiplexores
Sumadores/restadores
Tablas LUT
Total
Cantidad.
20-64
20-64
20-64
64-24
bits
-
Area ocupada
20-64-0.5-12 t
a
= 7880-t
a
20640.25212

= 7880
8
20-64-12-u
a
=
15760 t
a
10.64-24-40 i
a
/Kbit = 60 t
a
315 80 x
a
Tabla 4.5 Estimacin del rea ocupada por el CORDIC paralelo
La estimacin de tiempos es la que muestra la Tabla 4.6, asumiendo rf=lns.
CORDIC paralelo
Registros
M ultiplexores
Sumadores /restadores
Tablas LUT
Total
Cantidad
10
10
10
64
-
Tiempo
128-128101 , = 0,164 ms
128-128-10-0.5 , = 0,082 ms
128-128-10-lg 12 T
t
0,573 ms
64-3 t
t
= 192 ns
0.819 ms
Tabla 4.6 Estimacin del tiempo de clculo en el CORDIC paralelo
115
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
La paralelizacin por medio del CBRM consiste, segn la propuesta del captulo
3, en realizar el clculo con mdulos organizados en estructura de rbol. En
este caso, = 64 representa el nmero de incrementos A adentro del intervalo
[0, /2[, que es tambin el nmero de ngulos para los que hay que calcular
p, para cada uno de los 128 x 128 pxeles.
Calculo
paralelizado
Tiempo de clculo
=TN,+TN
2
+ + TN
P
= T(N,+N
2
+ + N
p
)
Nmero de mdulos necesarios
1+ N, + N,N
2
+ , N2N3.+...+.N, N
2
N
3
... Np_i
La descomposicin de en un producto NjN
2
N
p
permite definir la
profundidad del rbol y, adems, la distribucin de los mdulos por etapa incide
en las prestaciones de la arquitectura Para realizar la comparacin con la
propuesta CORDIC paralelo, se plantean dos descomposiciones de N, una que
maximiza el tiempo de clculo y la otra que maximiza el nmero de mdulos
del rbol. As, efectuar la comparacin con las peores condiciones del CBRM.
Descomposicin que maximiza el tiempo de clculo
= , N
2
con ! = 2 y N
2
= 32
Tiempo de clculo = (2 + 32)T = 34
Nmero de mdulos de clculo del rbol = 1+2 = 3
Descomposicin que maximiza el nmero de mdulos
= Ni xN
2
x N3XN
4
N5XN
6
con N = 2 para i e [1, 6]
Tiempo de clculo = (2+2+2+2+2+2)T = 12 , siendo el tiempo de clculo
de un valor.
Nmero de mdulos de clculo del rbol = 1+2+4+8+16+32 = 63
116
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Las Tablas 4.7a y b representan el rea total ocupada por el CBRM en los dos
supuestos, el que maximiza el tiempo, Ni = 2, N2= 32 y el que maximiza el rea
ocupada, N = 2 para i e [1,6].
= 16
t=\
t=2
/=4
=8
Implementation con sumador
secuencial
2x3x34x
a
=408x
a
2x 3 x 6 4 T
a
=384x
a
2 3 X 584 T
a
= 3504 ,
2 X 3x102424 x
a
= 614544 .
Implementation con reductores 4:2
2 3 3 3

= 198 T
a
2x3x63Ta=378T
a
2x3x583Ta=3498x
a
2 x 3 x 102423 x
a
= 614538 T
a
Tabla 4.7a Estimacin del rea ocupada por el CBRM paralelo para = 64
( Ni = 2 y N
2
= 32, tiempo de clculo mximo)
n = 16
/=1
=2
t=4
=8
Implementation con sumador
secuencial
2x63x34x
a
=4284T
a
2 x 63 64 Ta = 8064
3
2x63x584T
a
= 73584T
a
2 x 63 102424
3
= 12905424 T
a
Implementation con reductores 4:2
2 63 33
3
=4158
3
2x63x63Ta = 7938x
a
2x63x583Ta=73458T
a
2 X 63 102423 T
a
= 12905298 T
a
Tabla 4.7b Estimacin del rea ocupada por el CBRM paralelo para = 64
(N = 2 para i e [1,6], rea ocupada mxima)
Las Tablas 4.8a y b representan el tiempo de clculo de los 128 x 128 puntos,
en los dos supuestos: el que maximiza el tiempo, Ni = 2 , N
2
= 32 y el que
maximiza el rea ocupada, N = 2 para i e [1,6], asumiendo que T = lns.
117
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
=16
t=\
t = 2
t = A
t = 8
Implementation con sumador secuencia!
557056 x 74,5 = 0,041 ms
557056x34,5 = 0,019 ms
557056x20 = 0,011ms
557056 14,5 = 0,008 ms
Implementation con reductores 4:2
557056 16 = 0,009 ms
557056x15 =0,008 , ms
557056x15,5 =0,009 , ms
557056 X 15 = 0,008 , ms
Tabla 4.8a Estimacin del tiempo de clculo del CBRM paralelo para = 64
( ] = 2 y N
2
= 32, tiempo de clculo mximo)
=16
t=\
t = 2
t = 4
=8
Implementation con sumador secuencial
196608 X 74,5 =0,015 ms
196608 X 34,5 = 0,007 ms
196608X20= 0,004 ms
196608 X 14,5 = 0,003 ms
Implementation con reductores 4:2
196608X16 = 0,003 ms
196608 X 15 = 0,003 ms
196608X15,5 = 0,003 ms
196608 X 15 = 0,003 ms
Tabla 4.8b Estimacin del tiempo de clculo del CBRM paralelo en funcin de m para = 64
(N = 2 para i e [1, 6], rea ocupada mxima)
Comparando la Tabla 4.7b, que representa los peores resultados en cuanto a
rea ocupada del CBRM paralelo, con la Tabla 4.5, aparece que para valores de
t<4, la implementacin paralela del CBRM ocupa menos espacio que el
procesador CORDIC. El tiempo de clculo correspondiente que aparece en la
Tabla 4.8 b es entre 50 y 100 veces menor para el CBRM que para el CORDIC.
Comparando la Tabla 4.8 a, que representa los peores resultados en cuanto a
tiempo del CBRM paralelo, con la Tabla 4.6, aparece que en el peor caso del
CBRM, que se da para la implementacin con sumador secuencial y / =1, el
tiempo es 20 veces menor que en el CORDIC. La ocupacin de rea
correspondiente que aparece en la Tabla 4.7a es unas 10 veces menor en el
CBRM para t<$.
118
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
4 Aplicacin del CBRM a la
transformada de Fourier
En este apartado se realiza un anlisis formal de la transformada de Fourier para
la cual se propone la aplicacin del CBRM, como mtodo idneo de clculo. El
CBRM se aplica despus de organizar los clculos siguiendo el esquema de
doblamientos sucesivos. Se han seleccionado dos propuestas de clculo de la
transformada de Fourier a fin de compararlas con la implementacin por el
CBRM. La primera considera una implementacin basada en aritmtica
distribuida, con replicacin segmentada de las etapas, que se prueba en una
FPGA [Mintzer, 1996]. La segunda propuesta combina la convolucin cclica
119
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
con la aritmtica distribuida por bloques y utiliza la descomposicin de Cooley
y Tuckey [Chien, 2002].
4.1 Transformada de Fourier
A pesar de su evolucin hacia el dominio espacial, las tcnicas de mejora de la
imagen en el dominio frecuencial siguen motivando gran cantidad de
investigacin. En este sentido, la transformada de Fourier constituye una
herramienta de referencia obligada, til en procesos de filtrado [Chamberlain,
2002] [Peiming, 2001] y de reconstruccin de imgenes [Mozn, 1996].
Recientemente, se ha utilizado la transformada rpida de Fourier (FFT) en
modulacin (OFDM: Orthogonal Frequency Divisin Multiplexing), resultando
as una herramienta valiosa en el mbito de las comunicaciones [Chang, 2000]
[Hsiao, 2000].
El algoritmo ms general desarrollado para el clculo de la FFT es el de Cooley
y Tukey, de 1965, basado en el mtodo del doblamiento sucesivo [Cooley,
1965]. El proceso, que consiste en la descomposicin de la transformada de una
secuencia en mltiples transformadas sobre secuencias de menor tamao, es la
base de todos los algoritmos de la categora FFT y su principal aportacin
radica en la reduccin drstica de la complejidad computacional. As, la
computacin de una secuencia de elementos, que ocasiona, segn la
definicin, una complejidad algortmica de 0(N
2
), se reduce a 0(N log
2
N) con
el mtodo FFT.
Las variantes del algoritmo difieren entre s por las computaciones realizadas y
por la forma en que se almacenan los resultados intermedios [Swarztrauber,
1987]. Estas diferencias originan mejoras sustanciales de alguna prestacin,
como el ahorro de almacenamiento en memoria, en el caso de los algoritmos in-
place; la velocidad elevada en el caso de los algoritmos self-sorting, [Temperton
120
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Sea F(u) la transformada de Fourier discreta (DFT) de una funcin real
unidimensional/( ) de puntos. La transformada de Fourier es compleja y se
expresa en (4.11).
( )
.
( )
^
Desarrollo de la DFT basado en el esquema de doblamientos sucesivos
Por conveniencia se expresar la ecuacin (4.11) como sigue
121
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
F(u) = Yf(x)W"
N^
0
J 2M
(4.12)
donde W
N
= exp
N

Se supone que = 2" = 2M, donde es un entero positivo. La ecuacin (4.12)
puede expresarse entonces como
i i M- l i
F(u) = - ( Y f(2x)W"
{2x)
+ V / ( 2x + 1)PF;
( 2X+)
)
2 M M ^ (4.13)
como ^2
=
^2M ^
a
ecuacin queda en
i M- l i
i M- l
definiendo F
par
{u) = ^f(2x )W,
M
x =0
i M- l
parai/ ==0, 1,2, M-l, la ecuacin se reduce a
F(u) = i ( ^ (ii) + F,,
pa
,. () w
2
V )
2 (4.15)
Asimismo, como W^
+M
= W
u
M
yW^
M
M
= -W
u
se deduce que.
F ( + M) = i (F
par
(ii) - F ^ (u)^
2
"
M
)
2 (4.16)
122
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Aplicacin del CBRM
Se sigue con la transformada de Fourier de = 2
n
= 2Mpuntos. Se procede a
plantear el clculo simultneo pero separado de la parte real e imaginaria de la
transformada.
El nmero de parejas iniciales ser entonces de 2M y su estructura
/ ( * ) + f(x) eos 2
n
'
x
(parte real)
M
f(x) + f(x)sen2
n
~
x
(imaginaria).
M
123
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Calculo de rotaciones mediante CBRM
Sean R
ed par
(u), R
ed mpar
(u), I
ed par
(u), I
ec

impar
(u) las partes, real par e impar,
imaginaria par e impar, respectivamente, de los resultados parciales de la
transformada de Fourier, donde e es un indicador de la etapa de clculo y d el
nmero de orden dentro de la etapa.
Se tomar a
e
= cos(2"-
e
) y = sen{2
n
~
e
)
M M
I
a
etapa: Calcular las M transformadas iniciales de 2 puntos, en su parte real e
imaginaria.
R00
P
ar(u) = / ( 0 ) + , ( ) / ( 2"- ' ) l
0
0par(u) = -

(u)f(2"-> )
R0Hmpar(u) = I
01 impar
(u) = -

{u)f(2
n
'
2
+ 2""
1
)
f(r-
2
) + a
l
(u)f(2
n
'
2
+2
n
-
1
)
ROM-I imparfu)- ^
I m
.^fa)
=
f(2 + 2
2
... + 2
n
~
2
) + -

{ )/{2 + 2
2
+...2"-
2
+2"~
l
)
a
x
{u)f{2 + 2

... + 2
n
-
1
+2"-
1
)
(4.17)
En lo que sigue, en aras a la claridad, se omite el argumento u en las
expresiones del clculo.
2
a
etapa: Pasar de las M transformadas de 2 puntos a M /2 transformadas de 4
puntos
R 1,0 par
=
Ro.Opar + 02 Ro.l impar I 1,0par ~ I0,0par +
2
Ro, 1 impar
-
2
, impar + a21o.i impar
"1,1 impar ' -Ro,2par + (%2 Ro,3 impar il,impar 0,2par + fi2R0.3 impar
-
2
.3 impar + a
2
Io3 impar
124
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
R/.M /2- limparRo,M /2 Il,M /2-limparIo,M /2 par + fi2Ro,M /2+l impar ( 4- 1 )
par ^
- 2 , /2+1 impar
par'(X2 ^- , /2+l impar , r
+ Ct2l0,M/2+l impar
3
o
etapa: Pasar de las //2 transformadas de 4 puntos a M/4 transformadas de
8 puntos
R-2,0 par
=
R 1,0 par + CC3 RJ i
mpar
I2,0par ~ h,0 par +/ ? ? R,1 impar +
P 3 J-l,impar &3 1,1impar
K-2,1 impar K-1,2 par ' &3 K-1,3 impar J-2,1 impar ~ -K 1,2 par ^~y3 "-,3 impar +
~ 31 1.3 impar a
3
1 1.3 impar
(4.19)
R2M/4-1 imparR, /4 f,..,, ,. = / ) , , , , , +
^ ^
1
2M/4-hmpar ^-1,M/4 par ~
OC3 Rl,M/4+l impar ~ 3 Ii,M/4+l impar
A? Rl.M/4+l impar + &3 Il,M/4+l impar
-sima etapa: Pasar de las 2 transformadas de M puntos a una transformada
de N=2M puntos
R
=
Rn-l,0
=
Rn-2,0 par
+
0C
n
R
n
-2,1 impar 1
=
In-l,0
=
In-2,0 paA Rn-2.1impar ( 4 - 2 0 )
+ CC
n
n-2, 1 impar
P n -ln-2,1 impar
En realidad, estos clculos slo se llevan a cabo para la primera mitad de los
valores de u, u = 0, 1, M -\, ya que la segunda mitad precisa de los mismos
125
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Calculo de rotaciones mediante CBRM
clculos salvo la ltima etapa en la cual hay una modificacin en los signos.
Despus de una demostracin sencilla se llega a la expresin resultante (4.21):
R -Rn-1,0 - R-n-2, 0 par ~CC f-n-2,i
impar
+
n-2, 1 impar
para u = M , M +l, ,N-1
I In-l,0In-2,0 par ~ Rn
2,1 impar ~
&n n-2, 1 impar
(4.21)
La aplicacin del CBRM se pone de manifiesto reordenando las operaciones a
partir de la segunda etapa
I
a
etapa: ecuaciones (4.17)
2
a
etapa: 2 Mil operaciones
R 1,0 par - Ro.Opar + &2 Ro, 1 impar y2 0,1 impar
I 1,0par
=
I0,0par + Ro.l impar + (^2^0,1 impar
K-1,1 impar ~*-0,2par ' &2 K-0,3 impar ~ y20,3 impar
l,limpar~ -0,2par +
2
K-0,3 impar 3 impar
Ri , /2-limpar Ro,M2paA (X-2 Ro,M /2+ impar^2lo,M /2+l impar
Il,M /2-limpar
=
h,M /2par + / ?2^0, M/ 2+/ ^ar+ OC2I0M /2+I impar
3
a
etapa: 2 M/4 operaciones
R2,0 par
=
Rl,0par + &3 Rl,l impar -
3
, 1 impar
2,0par ~ 1,0 par
+
3

1,1 impar + a
3
Ii,i impar
R
2,M/4-l impar' =Ri ,M/4 par r
+ CC3 RlM/4+1
impar
fisli. M/4+1 impar
126
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
J-2M /4-1'impar Ri ,M /4 par , /4+l impar impar
n-sima etapa: 2x 2 operaciones
" ~K-n-l,0 ~K-n-2,0 par 'O K-n-2,1 impar ~ P n J-n-2,1 impar
1 ~ n-l,0~n-2,0 par'P n i^n-2,limpar < C
n
ln-2, 1 impar
" ~K-n-],0 ~~ K-n-2,0 par ~0L
n
Kn-2,1 impar < P n ^n-2,1 impar
' ~ ln-l,0~ln-2,0 par ~ P n K-n-2,impar ~0
n
ln-2, 1 impar
Se observa que, a partir de la 2
a
etapa, cualquier par R
ec
, I
ec
se calcula como una
rotacin, definida por los parmetros a
e
,

, seguida de una traslacin, definida


por el parmetro 1. En cada etapa, las rotaciones se realizan con un ngulo
distinto, propio de la etapa. Queda patente que los resultados de dos rotaciones
consecutivas (cuatro ecuaciones) en una etapa e, intervienen como argumentos en
una misma rotacin (dos ecuaciones) en la etapa siguiente e+\, por lo que se
produce, en cada etapa, una divisin por dos del nmero de ecuaciones, hasta
llegar al resultado final.
La operacin bsica del CBRM aplicada a este caso se realiza de la manera
descrita en el captulo 3, esto es, accediendo a una tabla LUT y efectuando la
suma de los productos parciales extrados. En este caso, las casillas de la tabla
LUT contienen combinaciones de los tres parmetros (a, , 1).
Coste computacional
El nmero de operaciones CBRM a realizar se establece por induccin. Se
cuentan tanto las operaciones que calculan las partes real como las que calculan la
127
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Calculo de rotaciones medante CBRM
parte imaginaria, para cada valor de u, considerando calculadas las parejas
iniciales
W=4, = 2, M=2
F(0): 1 suma
F(l): 2x3=6 operaciones CBRM
F(2): deducido de F(0), 1 suma
F(3): deducido de F(l), 2 1 = 2 operaciones CBRM (cambio de signo)
Total: 8 operaciones CBRM y 2 sumas.
7V=8, = 3, M=4
F(0): 3 sumas
F(l), F(2) y F(3) = 14 operaciones CBRM
F(4):3 sumas
F(5), F(6) y F(7) = 2x3 = 6 operaciones CBRM (cambio de signo)
Total: 20 operaciones CBRM y 6 sumas
7V=16, = 4, M=8
F(0): 7 sumas
F(l), F(2), F(3) F(7) = 30 operaciones CBRM
F(8): 7 sumas
F(9), ,F(15) = 2 7 = 14 operaciones CBRM (cambio de signo)
Total: 44 operaciones CBRM y 14 sumas
Continuando este razonamiento, se plantea la hiptesis siguiente:
operaciones CBRM( K) = 2x operaciones CBRM(-1) + 4
sumas() = 2 sumas (w-1)+ 2
Demostracin por induccin
Suponiendo que:
128
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Operaciones CBRM (1) = 0
Sumas (1) = 1
para n>\
el nmero de operaciones CBRM es
operaciones CBRM() = 2(2
n
-l) + (2
n
-2) = 2
n+1
+ 2
n
-4
y el nmero de sumas es
sumas ()= 2" - 2
entonces, para n+\ se tiene
operaciones CBRM(n+l) = 2
n+2
+ 2
n+
' -4
sumas(+l) = 2
n +l
- 2
A partir de estas expresiones, se comprueba que para n>\
Operaciones CBRM(+1) = 2 operacionesCBRM(w) + 4
sumas() = 2 X sumas (-1) + 2
con lo que queda demostrada la hiptesis planteada.
4.2 Comparacin CBRM- diseo con segmentacin
de etapas
Descripcin de la arquitectura segmentada
En esta propuesta [Mintzer, 1996], el clculo de las parejas iniciales se obtiene
utilizando aritmtica distribuida. La aritmtica distribuida es una modificacin a
nivel de bit de la multiplicacin por acumulacin escalada [White, 1989], cuyo
objetivo es ocultar dicha multiplicacin.
129
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
La arquitectura mnima se construye para una transformada de 16 puntos que
puede incrementarse hasta 8192 puntos replicando la etapa. Cada etapa consta de
cuatro registros paralelo-serie (P/S-R), dos acumuladores escalados (MAC) y dos
LUTs de 32x16 bits. Los valores de los senos y cosenos figuran en las tablas. En
cada etapa los valores de la LUT cubren un intervalo igual al incremento angular
de la etapa precedente que se divide a su vez en incrementos menores. Este diseo
con segmentacin de las etapas evita el crecimiento exponencial de la memoria
que es el mayor inconveniente para una implementacin en FPGA. Para una
transformada de 8192 puntos se requieren cuatro etapas. Se prueba este diseo en
una plataforma Xilinx XC 4025. El clculo de las parejas inicales se realiza en
320 ns para datos de 16 bits, a una frecuencia de reloj de 50 Hz, Sabiendo que el
nmero de mariposas es de N/2 log
2
N, el clculo total de la transformada de 16
puntos tarda 10,34 . Despus de una replicacin por cuatro, la transformada de
8192 puntos se realiza en 17 ms.
A fin de facilitar una comparacin con los resultados que proporciona el
CBRM, he realizado unas estimaciones del espacio ocupado y del tiempo de
clculo invertidos por la arquitectura segmentada para transformadas de 16,
8192 y 61K puntos, con datos de 16 bits.
Estimacin del rea ocupada y del tiempo de clculo en la arquitectura
segmentada
En este apartado la estimacin se realiza en base a las unidades x
a
y
(
Transformada de 16 puntos (una etapa)
Estimacin del rea ocupada
4 (P/S-R) = 4 0,5-16- x
a
= 32- x
a
2 (S/P-R) = 2x0,5-16-x
a
=16-x
a
2 (MAC) = 2x16-T
a
=-32t
a
2 LUTs 32x16 bits =40
8
130
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Total 120t
a
Estimacin del tiempo de clculo (camino crtico a travs de la etapa)
1 (P/S-R) = 1x
t
1 (MAC) = ig 8 , = 3x
t
1 LUTs 32x16 bits = 3.5x
t
16 accesos = 56 x
t
Total: N/2 log
2
N (1 ,+ 3 , + 56x
t
) = 12 60 x
t
= -720 ,
Transformada de 8192 puntos (4 etapas)
Estimacin del rea ocupada
I
a
etapa 120x
a
2
a
3
a
etapas
2 (P/S-R) = 2 0,5-16- x
a
= 16- x
a
2 shift registers (S-R) = 2 X 0,5-16- x
a
=-16x
a
2 (MAC) = 2x16-x
a
=-32x
a
2 LUTs 32x16 bits = 40x
a
4
a
etapa
2 (P/S-R) = 2 x 0,5-16- x
a
= 16- x
a
2 (S/P-R) = 2 0,5-16- x
a
= 16- x
a
2 (S-R) = 2x0,5-16-x
a
=-16x
a
2 (MAC) = 2x16-x
a
=-32x
a
2 LUTs 32x16 bits =40 x
a
2 registros =2 0,5-16- x
a
=- 16x
a
Total: 120x
a
+ 2 104 x
a
+ 136 x
a
= 46 4 x
a
Estimacin del tiempo de clculo (camino crtico a travs de 4 etapas)
etapa
1 (P/S-R) =1x
t
1 (MAC) = Ig 8 x
t
= 3x
t
1 LUTs 32x16 bits = 3.5x
t
16 accesos = 56 x,
56x
t
+ 4x
t
+1x
t
= 61 x
t
2
a
etapa
1 (P/S-R) =1x
t
1 (MAC) = Ig 64 x
t
= 6x,
1 LUTs 32x16 bits = 3.5x
t
x 16 accesos = 56 x
t
131
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
56 x
t
+ 6
(
+1 , = 63 ,
3
a
etapa
1 parallel-serial registers (P/S-R) = 1 x
t
1 scaled accumulators (MAC) = lg 512 x
t
= 9x
t
1 32x16 bits LUTs = 3.5
(
16 accesos = 56 x
t
56x
t
+ 9 ,+1 , = 66 ,
4
o
etapa
1 (P/S-R) =1 ,
1 (MAC) = lg 4096 , =12 ,
1 LUTs 32x16 bits = 3,5
(
16 accesos = 56
(
1 registro = 2 0,5
(
=-1 ,
56 , + 12 ,+1 ,+1 , = 70 ,
Total: ( ,/2 log
2
N,) 60+ (
2
/2 log
2
N
2
) 63+(
3
/2 log
2
N
3
) 66 , +(
4
/2 log
2
N
4
) 70 , =
12.61 + 192.63 + 2304 66 , + 24576 70 , = 1885200 ,
Transformada de 64 puntos
Estimacin del rea ocupada
I
a
etapa 120x
a
2
a
etapa 104x
a
3
a
etapa 104x
a
4
a
etapa 104x
a
5
a
etapa 136x
a
Total 568
3
Estimacin del tiempo de clculo (camino crtico a travs de 5 etapas)
Total: ( ,/2 log
2
N,) 60+ (N
2
/2 log
2
N
2
) 63+(N
3
/2 log
2
N
3
) 66+(N
4
/2 log
2
N
4
) 69 ,
+(N
5
/2 log
2
N
5
) 73 , =12.61 + 192.63 + 2304 66 , + 24576 69 , + 245760 73 ,
= 19825 740 x
t
Estimacin del rea ocupada y del tiempo de clculo en el CBRM
Las estimaciones se realizan para la implementacin 1 y la implementacin 2,
para datos de 16 bits utilizando la arquitectura el CBRM y dos sumadores
adicionales.
132
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
LUT: 40 T
a
/Kbit 16 bits 64 celdas
Sumador serie: 16 x
a
Estructura de reduccin 4:2+ sumador
Multiplexor: 0,25 2 16-x
a
= 8
Registro: 0,5-16-c
a
= 8
Registro de desplazamiento 0,5 16 x
a
:
Estimacin del tiempo de clculo del CBRM (camino crtico):
LUT: 3.5 , 16 accesos = 56 x
t
Sumador serie = 16 lg16 x
t
. = 64 x
t
Estructura de reduccin 4:2: 3 x
t
+ lg16
(
.= 7 ,
Multiplexor: 0,5
(
Registro: 1
(
Registro de desplazamiento: 0,5
(
Teniendo en cuenta que se evalan dos funciones a la vez de forma cruzada,
para cualquier nmero de puntos, el rea total ser el doble del rea que ocupa
la arquitectura CBRM. Hay que prever igualmente dos sumadores secuenciales
o dos estructuras de reduccin y suma para realizar las sumas adicionales. Para
el clculo de los tiempos se utilizan las ecuaciones relativas al nmero de
operaciones CBRM y de sumas establecidas en el apartado 4.1.
CBRM() = 2
n+1
+ 2
n
-4 (la mitad corresponde a la parte real y la otra mitad a la parte
imaginaria)
sumas()= 2" - 2 (la mitad corresponde a la parte real y la otra mitad a la parte
imaginaria)
Area total ocupada:
Implementation 1: 2 (40

+ 16

+ 2 8
8
+ 8 t
a
) = 168

Implementation!: 2 (40

+ 20

+ 2 8 x
a
+ 8 x
a
) = 176 t
a
= 40x
a
: 4 ^ +16^ =201,
= 8x
a
133
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
Transformada de 16 puntos:
Tiempo total:
Implementation 1: (2
4
+2
3
-2) X (56 , + 64 , + 2x 0,5 , +1x
t
+ 8 ,) + ( 2
3
- 1) 65 , =
3380 ,
Implementation 2: (2
4
+2
3
-2) X (56 , + 7 , + 2x 0,5 , +1 ,) + (2
3
- 1) 7 t
t
= 1479 ,
Transformada de 8192 puntos:
Tiempo total:
Implementation 1: (2
13
+2
12
-2) X (56 , + 64 , + 2x 0,5 , +1 ,+ 8 ,)+(2
12
- 1) 65 ,
= 186 335 5 ,
Implementation 2: (2
13
+2
12
-2) (56
(
+ 64 , + 2 0,5
(
+1 ,) + (2
12
- 1) 7 , = 82725 5

(
Transformada de 64 puntos:
Tiempo total:
Implementation 1: (2
16
+2
15
-2) X (56 , + 64 , + 2x 0,5t
t
+lT
t
+ 8
(
)+(2
16
- 1) 64 ,=
13238005 ,
Implementation 2: (2
16
+2
15
-4) (56
(
+ 64
4
+ 2 0,5
(
+ 1
(
) + (2
16
- 1) 7 , =
6 848245 ,
Arquitectura
segmentada.
CBRM
Impl. 1
Impl. 2
Transformada de 16
puntos
Area
120 Ta
168 t
a
176 Ta
Tiempo
0,7 10
3
,
3,38 10\
t
1,48
3
,
Transformada de 8192
puntos
Area
46 4
3
168 Ta
176 Ta
Tiempo
1,8 10 \
1,86 10" ,
0,83
6
,
Transformada de 64
puntos
Area
5 6 8
168 Ta
176 Ta
Tiempo
1,9 10
7
,
1,32 10
7
,
0,68 10
7
,
Tabla 4.9 Comparacin entre arquitectura segmentada y CBRM en ocupacin de espacio y tiempo
134
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
4.3 Comparacin CBRM-diseo basado en
aritmtica distribuida por bloques (BDA)
Descripcin de la propuesta BDA
Esta propuesta presenta el clculo de la transformada de Fourier de longitud
variable por medio del control de los parmetros de su arquitectura [Chien,
2002]. El elemento bsico procesa 16/32/64 puntos utilizando la
descomposicin de Cooley y Tuckey de radix 4. Cuando el nmero de puntos
aumenta, se plantea = N X.N2 y el procesamiento tiene lugar en una
combinacin de elementos dispuestos en filas y columnas. Desde el punto de
vista formal, los cuatro trminos de la descomposicin de Cooley y Tuckey se
plantean como una convolucin cclica que permite efectuar los clculos
mediante aritmtica distribuida basada en bloques. Esto consiste en particionar
la memoria en bloques para alojar en cada uno de ellos un grupo de coeficientes
que intervienen en las multiplicaciones que figuran en las expresiones. El orden
en que tengan que intervenir los coeficientes ser controlado por un rotador
externo, evitando as tener que guardar en el bloque todas las combinaciones de
los mismos elementos (tal y como ocurre en la aritmtica distribuida clsica).
Esta arquitectura consigue ahorro de memoria a cambio de un aumento del
135
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
tiempo de clculo y de un rotador aadido al circuito. Adems, en esta
propuesta, se sustituye la memoria ROM por memoria RAM, a fin de tener
flexibilidad a la hora de cambiar los contenidos de memoria cuando se quiere
cambiar el tamao de la transformada.
Siguiendo el orden del flujo de datos, la columna bsica consta de un buffer de
entrada, un procesador CORDIC que realiza las operaciones de multiplicacin
compleja del pre y postprocesamiento, seguido por un registro paralelo-serie
(P/S) y un rotador; cuatro memorias RAM y diecisis acumuladores
implementan la aritmtica de bloques. Al final hacen falta cuatro buffers que
reordenan los productos parciales para efectuar la operacin mnima de cuatro

puntos. La complejidad algortmica de esta propuesta es 0( xW
L
) , siendo
4M
el tamao de la transformada
M = 4 en este diseo
Wi la precisin de los datos.
Cuando se tiene una transformada larga (de ms de 64 puntos) el factor N se
sustituye por el producto N x N
2
en la expresin del coste.
En la Tabla 4.11 se presentan algunos resultados obtenidos realizando la
descripcin del circuito en Verilog HDL y la sntesis en Sinopsis.
Tiempo
por
columna
Camino
crtico
preprocesador
13,71 ns
17,7 ns
P /S RAM
12,45 ns
17,7 ns
Sum ador+ ACC
14,06 ns
17,7 ns
postprocesador
17,7 ns
17,7 ns
DFT4
puntos
10,35 ns
17,7 ns
Total
68,27 ns
88,5 ns
Tabla 4.10 Camino crtico en el mdulo bsico del diseo basado en aritmtica distribuida por bloques
136
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Comparacin
A fin de realizar la comparacin entre el CBRM y la arquitectura BDA, se
realiza una estimacin del rea ocupada comparando el hardware que interviene
en cada circuito, a nivel de dispositivos utilizados (Tabla 4.12). En la Tabla 4.13
la comparacin se realiza en trminos de x
t
y x
a
. Para el CBRM, se asume que la
LUT es una ROM de 64 celdas ya que los parmetros son tres (a, , 1); los
datos tienen una longitud de 16 bits en ambas propuestas.

16
64
512
4096
Dispositivos utilizados por la arquitectura BDA
5 buffers, procesador CORDIC, P/S-R,
un rotador, 4 RAMs 4x16 bits, 16 MAC
5 buffers, procesador CORDIC, P/S-R,
un rotador, 4 RAMs 16 xl6 bits, 16 MAC
9 buffers, procesador CORDIC, 2 P/S-R,
un rotador, 8 RAMs 8x16 bits, 32 MAC,
memoria de transposicin
9 buffers, procesador CORDIC, 2 P/S-R,
un rotador, 8 RAMs 16x16 bits, 32 MAC,
memoria de transposicin
Dispositivos utilizados por dos
mdulos CBRM calculando de
forma cruzada
4 MUX, 8 S-R, 4 MAC,
2 LUT 64x16 bits
2 sumadores
Tabla 4.11 Comparacin del hardware necesario en las arquitecturas CBRM y BDA
En la Tabla 4.11 no se consideran ni el rotador ni el procesador CORDIC de la
arquitectura BDA en el clculo del rea, ya que la referencia consultada no
precisa la estructura de ninguno de ellos.
Para estimar el tiempo medio de computacin, se utilizan las indicaciones del
autor, asumiendo que los tiempos de acceso a la ROM, del sumador y del
cerrojo son los que figuran en el captulo 3.

Tiempo medio de computacin: (
l
~xW
L
)(T
Rm
+ 2T
ADD
+ T
LATCH
)
137
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM

16
64
512
4096
Arquitectura BDA
Area
314
344 t
a
632 t
a
672 T
a
Tiempo
3,3 10
3
,
13,2 10
3
,
105,6 10
3
,
844,8 10
3
,
Arquitectura CBRM(dos mdulos calculando de
forma cruzada)
Implementation!
Area
168
8
Tiempo
3,38 10
3
,
14,235
3
,
116,36 10
3
,
921,515 10
3
,
Implementation!
Area
176
0
Tiempo
1,48 10
3
,
12,44 10
3
,
101,36 10
3
,
812,79 10
3
,
Tabla 4.12 Comparacin de las arquitecturas CBRM y BDA en trminos de x
a
y ,
Conclusin
Aparece claramente que la arquitectura BDA es ms costosa en cuanto a
ocupacin de rea que la arquitectura CBRM. Para los valores de considerados,
los tiempos de la BDA son ligeramente inferiores a los tiempos de la
implementacinl del CBRM, pero superiores a los de la implementacin 2 de
ste. Adems, la implementacin 2 es la que consigue menores aumentos de
tiempo cuando aumenta N.
Comparacin CBRM- otras propuestas
En la tabla 4.13 se reagrupan de forma resumida los costes hardware y de tiempo
de diversas propuestas facilitadas en [Chien, 2002], En todas ellas, TV representa el
nmero de puntos de la transformada. Las cuatro primeras referencias basan su
diseo en matrices sistlicas, la quinta en sumadores y las dems en aritmtica
distribuida. La ltima es el CBRM. El CBRM es la mejor propuesta en cuanto al
coste hardware; en cambio, el tiempo de clculo es proporcional al nmero de
138
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Chang and
Chen
Fang and Wu
Murthy and
Swamy
Chan and
Panchanathan
Chang and
Guo
Diseo DA
Diseo BDA
CBRM
M emoria
0
0
0
0
4N- 4
(RAM)
N
1
4
(ROM)
0-a
4
(ROM)
2xW
L
x
2
3
(ROM)
Sum.

2N+6


6N+7
il
4
N+4
4
2+2
Mult.

N+4


0
0
0
0
Reg-
de
desplaz.
6N
6N
ION
m
4N-2
5N
3N
2
Reg.
P /S
0
0
0
0
0

4
0
CORDIC
0
0
0
0
0
0
N

+ 4
4
0
Tiempo medio de
clculo
Nx
(2Tmult+2Tsum+Tcerrojo)
Nx
(2Tmult+2Tsum+Tcerrqjo)
Nx
(2Tmult+2Tsum+Tcerrojo)
Nx
(2Tmult+2Tsum+Tcerroj o)
N/2x
(Tsum+Tcerrojo+Tsum.red)
W
L
x
(TROM+2Tsum+Tcerrojo)
M WL / 4
(T
R
oM+2Tsura+Tcerrojo)
(3W/2-2)xW
L
T
ROM
+
(yV-l)W
L
xTsum
Tabla 4.13 Comparacin de la arquitecturas CBRM con otras propuestas
139
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
5 Aplicacin del CBRM a otras
trans formadas
La transformada de Fourier puede utilizarse para establecer un patrn de clculo
para otras transformadas. Para ello, se realizan pequeas transformaciones
matemticas que se exponen a continuacin.
Transformada de Hartley
Sea H(u) la transformada de Hartley discreta (HDT) de una funcin realf(x).
TT ! V"
1
' y/ w
2 m a
2nux .
H(u) = > f(x )(cos sen )
Nf (4.22)
H(u) es una funcin real cuyo clculo puede partirse en dos fragmentos, el que
corresponde al seno y el que corresponde al coseno, que se sumarn al final. El
desarrollo es idntico al de la DFT, aadiendo la etapa final que es la suma de los
fragmentos calculados. Llamando R(u) la parte del sumatorio que incluye al
coseno e I(u) la parte que incluye al seno:
H(u) = R(u)+I(u)
Transformada del coseno
Sea la transformada discreta del coseno (DCT) de una funcin rsdlf(x).
N- \
m
.
C(u) = e(k)Y f(x) cos(2x + 1)
y
2 (4.23)
140
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
C(u) es una funcin real cuyo clculo puede partirse en dos fragmentos y
recomponerse al final como una suma ponderada de stos. Los clculos se
organizan de la manerasiguiente:
f (x) COSZX + 1) = / (x) COS h )
2N 2N
Desarrollando el coseno de la suma se obtiene:
r
,
x
, 7TUX Tul TJUX Tul
N
/ (x)(cos eos sen sen )
2N IN
entonces la expresin de C(u) es
C(u) = e(k)y f(x)(cos cos sen sen )
tu

2 2
Para cada valor de u las cantidades COS[TU/2NJ y sen[mi/2N] permanecen
constantes y pueden salir fuera del sumatorio
Tul 7M _
Si eos = a, sen = p
2N " 2N "
N- \ N- l
C(u) = e{k){a
u
/ ( * ) cos +

f{x)sen - ^ )
x=o
x
=
0

Los fragmentos definidos pueden calcularse siguiendo el planteamiento de la
DFT, llamando R(u) e I(u) a los sumatorios que corresponden al coseno y al
seno, respectivamente. El resultado final para cada valor de u se obtiene
mediante la operacin de combinacin:
C(u) = a
u
R(u) + p
u
I(u)
141
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
En resumen, el CBRM se aplica fcilmente a la evaluacin de las transformadas
de la imagen que poseen ncleo trigonomtrico, utilizando un patrn nico de
organizacin de los clculos.
Para transformadas que no poseen ncleo trigonomtrico, el clculo puede
inspirarse en el de la DFT. Como ejemplo, se proponreel clculo de la
transformada de Walsh.
Transformada de Walsh
La transformada de Walsh de una funcin re&\f(x) unidimensional se expresa de
la manera siguiente:
W( u) = / W^rf (-1)"
(, ,
"
(,)
= V /=o (4.24)
Al igual que la DFT, esta transformada puede evaluarse ordenando el clculo a
partir del modelo de doblamientos sucesivos y aplicando posteriormente el
CBRM con la modificacin correspondiente, que consiste en igualar a 0 los
parmetros y a 1 los parmetros a de las ecuaciones (4.14)-(4.16), de manera
que los valores de W(u) resultan ser sumas algebraicas de las muestras f(x).
Se tratara de manera idntica la transformada de Hadamard.
142
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
6 Conclusin
El presente captulo se ha dedicado enteramente a la validacin del modelo
CBRM, objeto de estudio de este trabajo de investigacin. Para ello, se ha
procedido a acoplar el CBRM al clculo de las rotaciones, consideradas stas
como paradigmticas, por el alto nivel de derivacin que precisan en las
arquitecturas habituales as como por su presencia en reas importantes de la
ciencia y la ingeniera. En trminos prcticos se evala la bondad del modelo
CBRM comparndolo con otras propuestas en el clculo de las transformadas de
Hough y Fourier, que se basan en rotaciones.
En el caso de la transformada de Hough, el CBRM demuestra su bondad frente
al CORDIC, en sus versiones serie y paralela confirmando su mejor
comportamiento en el ahorro de rea y hardware as como en la velocidad.
En el caso de la transformada de Fourier, se han presentado esencialmente dos
propuestas frente a las cuales el CBRM consigue mejores prestaciones.
En una comparacin de corte ms general efectuada al final del captulo,
aparece que el comportamiento del CBRM es muy bueno en cuanto a relacin
rea-tiempo, y ello lo hace ser un buen candidato para el desarrollo de
dispositivos VLSI. El tiempo de clculo proporcional al nmero de puntos y a la
precisin puede mejorar sensiblemente mediante algn tipo de paralelizacin, a
cambio de un aumento de rea ocupada. Hay que destacar que el ahorro de rea
se debe sobre todo a la memoria que slo es proporcional al tamao de los
datos.
143
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Volver al ndice/Tornar a l'ndex
144
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
Capitulo 5
SIMULACIN DE COMPORTAMIENTO
DIFCILMENTE FORMALIZABLE
1 Introduccin
Entendemos que un comportamiento es difcilmente formalizable cuando resulta
difcil captar su esencia por medio del utillaje matemtico del que se dispone
habitualmente. Bajo este epgrafe caben los procesos artificiales no
suficientemente especificados y, sobre todo, los procesos naturales,
relacionados o no con la vida.
Tradicionalmente, la biologa ha recurrido a modelos biofsicos para explicar el
comportamiento del tejido vivo, con la limitacin de tener que relacionar
cualquier parmetro del modelo con su equivalente fsico [Hodgkin, 1952]. A la
hora de remedar las propiedades colectivas de un sistema biolgico, las redes
neuronales artificiales sustituyen el modelo biofsico, superando as el
inconveniente de la falta de genericidad inherente al modelado biofsico. Sin
embargo, a pesar de las numerosas analogas que se encuentran entre las redes y
los procesos computacionales propios de la biologa, existe en general una gran
dificultad para establecer relaciones entre el modelo y los resultados
experimentales obtenidos. Se tiene conocimiento de ciertas similitudes muy
145
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
localizadas, por ejemplo, entre las memorias asociativas y el hipocampo, sede
del aprendizaje [O'Keefe, 1979], tambin con el olfato [Gelperin, 1989] y el
procesamiento visual [Koch, 1985]. A pesar de ello, estos modelos no han sido
corroborados desde la neurofsiologa. Desde un planteamiento inverso, la
computacin artificial ha considerado en los ltimos tiempos la conveniencia de
copiar del mundo vivo algunas formas de procesar la informacin. Todo ello ha
dado lugar a una va de aportacin bilateral que ha cristalizado en una enorme
cantidad de conocimiento.
La propuesta de un enfoque CBRM para simular el comportamiento de sistemas
con estas caractersticas persigue el objetivo de una resolucin desde la
perspectiva funcional. Esta va es muy atractiva por su capacidad para
reproducir los comportamientos sofisticados de un sistema sin necesidad de
conocer los detalles estructurales que los provocan. As, un mdulo CBRM
puede representar una neurona, un conjunto de neuronas o una red de conjuntos
de neuronas, ya que no hay necesidad de establecer correspondencias entre
estructuras naturales y artificiales. Ms concretamente, el CBRM trata el
comportamiento difcil de formalizar como una funcin no abordable a nivel de
primitivas sino con un mayor nivel de derivacin.
En este captulo se aborda de manera emprica la evaluacin de funciones a
niveles ms altos que el nivel de las primitivas, como introduccin a lo que ser
un estudio en profundidad que se deja como lnea de trabajo futura. Se
presentan dos ejemplos pertenecientes al campo de la neurociencia. Primero, se
considera una simplificacin bottom-up del modelo de cable de Traub [Traub
1991], que presenta un modelo bicompartimental de la neurona (soma y
dendritas). La estimulacin de cada compartimento bajo diferentes condiciones
experimentales produce patrones de comportamiento diferenciados. Se pone en
evidencia la capacidad del CBRM para reproducir fielmente el espigueo
obtenido por la simulacin de las ecuaciones del modelo biofsico simplificado
en la zona CA3 del hipocampo, sede del aprendizaje. En segundo lugar, se
146
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
2 Aplicacin del CBRM a los procesos
computacionales biolgicos
En este apartado, los procesos computacionales biolgicos considerados son los
que se tienen lugar en el sistema nervioso.
En 1894 fueron establecidos por S. Ramn y Cajal los primeros principios de la
neurociencia. Sobre estos principios se han construido los distintos modelos
propuestos, desde el modelo ms simple en el que una neurona equivale a un
punto (soma) hasta los modelos ms completos que hacen intervenir todas las
dems estructuras nerviosas (axn, rbol dendrtico,...) Los registros
fisiolgicos obtenidos por medicin directa en el tejido nervioso son funciones
de difcil formalizacin matemtica, como evidencian los circuitos electrnicos
necesarios para simularlas con todo el detalle, por tanto, son buenos candidatos
para la simulacin por el CBRM. Los dos ejemplos que se van a tratar en este
apartado han sido resueltos previamente por modelo biofsico y por red
asociativa, respectivamente. Despus de facilitar en cada caso una breve
descripcin de las caractersticas del fenmeno estudiado as como del
fundamento del modelo utilizado, se aborda la resolucin desde el CBRM
comparando posteriormente los resultados.
147
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
2.1 Generacin de brotes inductores de espigas en la
regin CA3 del hipocampo
Descripcin y simulacin del modelo biofsico
La regin CA3 del hipocampo genera espigueo sincronizado en condiciones
experimentales diversas, habindose reducido previamente la inhibicin. Existe
gran cantidad de estudios experimentales basados en registros fisiolgicos
(Chamberlin et al. 1990), (Miles et al, 1988) y corroborados por modelos
matemticos, de las propiedades intrnsecas de las neuronas de la regin CA3
(Traub and Miles, 1991), (Traub et al. 1993). El modelo de Traub, o modelo de
cable compartimentai, establece una particin en 19 compartimentos de una
clula piramidal de CA3. Cada compartimento contiene hasta seis conductancias
inicas controladas por diez variables que representan el cierre o la apertura de
canales. La dinmica de estas variables se construye en coherencia con los datos
experimentales obtenidos en fisiologa. El modelo de Traub, enormemente
complejo, ha sido simplificado por Pinsky y Rinzel, (Pinky y Rinzel, 1994),
quedando en un modelo de dos compartimentos (soma y dendritas) con ocho
variables, que tiene la ventaja de poner en evidencia los aspectos esenciales del
modelo de Traub, con un manejo ms fcil de la dinmica celular y global, para
rangos amplios de valores de los parmetros. Este modelo es el que se analiza
aqu. El modelo simplificado segrega las corrientes ms rpidas de las ms lentas,
situando las primeras en el soma y las segundas en las dendritas, a la vez que
describe tres comportamientos prototpicos como respuesta a una estimulacin
somtica o dendrtica. Se trata, en todos los casos, de la produccin de espigueos,
de baja (8 a 20 Hz) o muy baja frecuencia (< 8 Hz). En este modelo las espigas
slo aparecen en un rango intermedio de conductancias de acoplamiento (estas
conductancias van ligadas al NMDA, N-metil D-aspartato y al AMP A), cuyos
extremos son una baja conductancia, responsable de desacoplar los
148
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
compartimentos o una alta conductancia, que significa que el soma y las dendritas
estn fuertemente acoplados, resultando un compartimento nico. Las corrientes
que generan el espigueo son posibles slo para valores moderados del
acoplamiento electrotnico.
La explicacin fisiolgica subyacente al fenmeno del espigueo es la siguiente:
en este sistema, el brote siempre viene inducido por un pico de sodio que procede
del soma. Cuando el acoplamiento entre compartimentos es moderado, este pico
repolariza parcialmente las dendritas retardando as el pico de calcio dendrtico.
Esta combinacin constituye el brote. En el mismo trabajo, Pinsky y Rinzel
abordan el estudio de una red de 100 neuronas de tipo bicompartimental, a fin de
examinar los fenmenos de sincronizacin y de saturacin. La estimulacin breve
de una sola clula del conjunto produce un brote sincronizado, siendo la sinapsis
del AMPA el mecanismo dominante de sincronizacin de las espigas. El nmero
de brotes aumenta con el nivel de NMDA, llegando al espigueo indefinido para
un nivel suficientemente alto de la conductancia NMDA. Existen dos factores
capaces de desincronizar las clulas cuando las sinapsis de AMPA estn
bloqueadas que son, por una parte, la heterogeneidad de las propiedades de las
clulas y por otra, la dinmica intrnseca de brotes caticos que las clulas
presentan.
La figura 5.1 representa un esquema del modelo bicompartimental de Pinsky y
Rinzel, en el cual se pueden observar las corrientes aplicadas y las corrientes
activas que entran y salen del soma y las dendritas.
149
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
syn
L
Ca
Fig 5.1 Modelo bicompartimental de Pinsky y Rinzel
Corrientes inicas:
El primer compartimento (soma) cuenta con dos corrientes dependientes de
voltaje que generan picos rpidos de sodio, I
Na
corriente entrante y una corriente
saliente rectificadora inducida por potasio I
K
-DR.
El segundo compartimento (dendritas) tiene una corriente entrante de calcio I
Ca
,
existen dos corrientes de potasio: I
K
_c y lK-AHp(posthiperpolarizacin).
Corriente sinptica:
Isyn
=
I NMDA + IAMPA
Corrientes de electrodo
150
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
El modelo biofsico se basa en las ecuaciones diferenciales siguientes, que
expresan el balance de las corrientes entre los dos compartimentos:
C V ' =
-heak(V
s
)-I
Na
(V
s
, h) -I
K
.
DR
(V
s>
n) + (g
c
/p)(V
d
-V
s
) + IJp
C
m
Vd
=
(5.1)
-heak(Vd) - lea (V
d
, h) ~I
K
-AHP (V
d
, q) - I
K
.
C
(V
d
, Ca, c)
IsyJO-p) + (gJ(l-p))(V
s
-V
d
) + I
d
/(l-p)
V
s
', V
d
'son las variaciones de V
s
, V
d
respectivamente
Ca concentracin de calcio
activacin rpida
q activacin lenta variable dependiente de la concentracin de Ca
c activacin rpida < 6 ms
s activacin rpida < 6 ms
h inactivacin rpida
proporcin de rea ocupada por el soma
Cm capacidad del cable
151
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
En las figuras 5.2 a-e se muestra la generacin de distintos comportamientos de
tipo espiga segn los valores de los tres parmetros
8
( /
2
), g
N
MDA(mS/cm
2
),
g
c
(mS/cm
2
). La escala vertical que aparece en la figura 5.2a equivale a 40 mV,
200 unidades de Ca para cualquier grfica; la escala horizontal que slo aparece
en la figura 5.2e representa 400 ms para la figura 5.2 a y 200 ms para las dems.
Todas las simulaciones han sido realizadas escribiendo un programa en
FORTRAN, ejecutado en una estacin de trabajo IBM RS6000 RISC. Las
ecuaciones diferenciales (5.1) se resuelven utilizando el mtodo de Runge-Kutta
con un paso de iteracin de 0,05 ms. El modelo de neurona presentado cuenta con
8 variables (frente a las 120 del modelo de Traub) y la relacin del tiempo de
ejecucin entre los dos modelos es de 0,09.
Fig. 5.2 a Brote de muy baja frecuencia inducido por activacin somtica (0,75-0,0-2,1)
152
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
Fig. 5.2 b Brote de baja frecuencia inducido por activacin dendrtica (-0,5-1,25-2,1)
;
I '
!
i M '
j.i ^/ t AiiLtdJ i IU11.1 i, i .u j i ! i
Fig 5.2 c Picos de alta frecuencia en el soma con I
s
mayor que en 5.2a (2,5-0,0-2,1)
I
\ i- ,
' ! , ,
V* '
i:
Fig 5.2d Idnticas condiciones a las de 5.2c pero con mayor acoplamiento (2,5-0,0-10,5)
153
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
JLU&l/ Lw i
Ww
Fig 5.2 e Estimulacin dendrtica y acoplamiento bajos (-0,5-1,75-1,425) produce espigueo complejo
formado por picos seguidos de brotes.
Simulacin CBRM
Las Figuras 5.3 a-e muestran los resultados obtenidos mediante simulacin por el
CBRM. En el eje de abscisas, se representa el nmero de la iteracin en curso y el
valor de las ordenadas depende del valor arbitrario del punto inicial, que
habitualmente se toma igual a 1. La bsqueda de los valores de los parmetros
que caracterizan la primitiva utilizada en cada caso desborda el alcance de este
trabajo de investigacin, quedando la presentacin de los ejemplos como
prembulo de una de las lneas de investigacin futuras.
154
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
1,2
1 -
0,8 -
0,6 -
0,4 -
0,2 -
C
1
) 50
A. Entrada somtica
-

1
'
100 150
1
200
'.

1
250
Fig 5.3 a
Simulacin por
el CBRM del
registro de la
Figura 5.2 a
1,2
1
0,8 1
0,6
0,4
0,2
0 L
0
4J
50
B. Entrada dendrtica
100 150 200 250
Fig 5.3 b
Simulacin por
el CBRM del
registro de la
Figura 5.2 b
155
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
Fig 5.3 c
Simulacin por
el CBRM del
registro de la
Figura 5.2 c
Fig 5.3d
Simulacin por
el CBRM del
registro de la
Figura 5.2 d
156
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
1,2
1
0,8
0,6
0,4
0,2
0
. Entrada dendritica, dbilmente acoplada
50 100 150 200 250
Fig 5.3e
Simulacin por
el CBRM del
registro de la
Figura 5.2 e
2.2 Generadores centrales de patrones neuronales
(CPGs)
Descripcin y simulacin por memoria de Hopfeld
Los CPGs son redes nerviosas que controlan los msculos involucrados en la
ejecucin de comportamientos rtmicos bien definidos, como respirar, andar,
nadar, masticar. Algunas de estas redes estn anatmicamente localizadas,
contienen un nmero reducido de neuronas y su salida consiste en patrones de
oscilaciones coherentes. Estas caractersticas hacen de los CPGs buenos
candidatos para el estudio de la relacin entre las propiedades de salida de una red
biolgica y la circuitera asociada.
Existe una amplia gama de estudios realizados sobre los comportamientos
rtmicos que ponen de manifiesto algunos principios generales de
funcionamiento:
157
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
Una salida rtmica puede aparecer incluso en ausencia de retroalimentacin
sensorial de los msculos y estructuras controlados por el CPG y en ausencia
de control por parte de los centros nerviosos de ms alto nivel (Grillner,
1975).
Algunos CPGs funcionan sin maracapasos, que es una neurona cuyos
disparos determinan el perodo de salida de la red. Un ejemplo de este caso es
el CPG que controla el movimiento natatorio de Tritonia Diomedea, que se
considera en este estudio.
El mismo conjunto de neuronas motoras puede estar involucrado en una gran
variedad de comportamientos rtmicos en un animal y ello sugiere que el
mismo CPG es capaz de producir distintos patrones de comportamientos
rtmicos.
La salida de los CPGs puede ser modulada por entradas externas como son la
retroalimentacin de los propioceptores y de los centros nerviosos de ms alto
nivel.
Se presenta en este estudio la simulacin del CPG que controla el movimiento
natatorio del molusco Tritonia diomedea por una memoria asociativa de tipo
Hopfeld.
El modelo consta de neuronas interconectadas. La salida de cada neurona V(t)
vara entre cero (estado de reposo) y uno (estado de mxima actividad). El estado
de la red viene especificado por la actividad de salida de todas sus neuronas y un
patrn de comportamiento se define por una secuencia temporal en la que aparece
un subconjunto de todos los estados de salida existentes.
Sin entrar en la descripcin detallada del ritmo natatorio de Tritonia diomedea,
cabe decir que su CPG consta de cuatro grupos de neuronas, VSI-A, VSI-B, C2 y
DSI. Las neuronas VSI son las que accionan las interneuronas de la zona ventral;
158
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
[
f 1 ^ . j * . I&.JUL l i l i l hUin.u
:
1 ".'fl.i.lJL I J
I 5 s
I ._ _
TIME
Fig 5.4 Registros fisiolgicos de los estados V,(t), V
2
(t), V
3
(t) y V
4
(t)
La simulacin por una memoria de Hopfeld del comportamiento del CPG no lo
reproduce exactamente, como se observa en la Fig 5.5. Sin embargo, el circuito
electrnico de simulacin tiene cierta complejidad (ver Fig 5.6). En l, las
neuronas se representan por amplificadores saturados, las conductancias
representan las conexiones entre pares de neuronas y se indica el peso sinptico
en cada una de ellas.
159
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
f.) > ?
J o
3
, O
C2
OSI
VSI

VSI

I
IR I
I 1 II
I
I I M11
I99H
TIME
Fig 5.5 Simulacin de los estados V^t), V
2
(t), V
3
(t) y V
4
(t) del CPG por una memoria de Hopfield
..V 4h~
- [ - J - - - j y ( u )
v
V,m !
1 1 ' ' '
! . VK
7 1q(uj>
SYNAP! IC: (.'!..)NNI.-.C i HM'r
NURONF
Fig 5.6 Circuito que implementa el CPG modelado por la memoria de Hopfield
160
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
1,2 -,
1 I
0,8 -j -
0,6 - | | |
0,4 1
0,2 j
o -lui
-0,2 11 I'
-0,4 -'
cs
^ \
C2
11 UUjMM,
ra|lto
Ir
ok i
- ^
c
- -
-
"
J c -^-
Fig 5.7 a Simulacin por el
CBRM de V, (t)
1,2
-0,4
DSI
Fig 5.7 b Simulacin por el
CBRM de V
2
(t)
161
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
Fig 5.7 c Simulacin por el
CBRM de V
3
(t)
Fig 5.7 d Simulacin por el
CBRM de V
4
(t)
3 Conclusin
El presente captulo contribuye a la validacin experimental del CBRM en el
mbito de lo que se ha denominado comportamiento difcilmente formalizable. A
diferencia del anterior, este captulo aborda empricamente la evaluacin de
funciones, ya no a nivel de primitivas, sino a niveles superiores de derivacin. A
162
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
partir de los resultados alentadores obtenidos en los casos considerados, el CBRM
aparece como una aportacin interesante en casos en los que el nico
conocimiento que se tiene de un comportamiento es una coleccin de puntos. Se
pone de manifiesto que el CBRM es capaz de remedar con apreciable fidelidad el
comportamiento de sistemas sin necesidad de conocer el detalle fino de su
estructura. Los subsistemas neuronales son un ejemplo de ello. La sistematizacin
de esta cuestin queda como lnea abierta de investigacin.
163
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Volver al ndice/Tornar a l'ndex
164
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 6
Capitulo 6
CONCLUSIONES
1 Aportaciones
Esta memoria recoge los resultados de una investigacin orientada a la mejora de
prestaciones de los computadores. La aportacin esencial consiste en utilizar
tcnicas iterativas de clculo del sucesor para poder obtener valores de funciones
al nivel de operacin de las primitivas del procesador o mediante muy pocos
niveles de procesamiento. Se pueden evaluar as funciones que requieren
habitualmente niveles muy elevados de derivacin, cuando el procesamiento
utilizado es el convencional, basado en las tcnicas de clculo polinmico que
resultan de considerar las estructuras algebraicas de los conjuntos de los nmeros.
El camino seguido por la investigacin se inicia con una revisin de la operatoria
habitual efectuada por los computadores, desde la perspectiva de la aritmtica del
procesador, centrada fundamentalmente en las primitivas suma y multiplicacin,
as como en los distintos algoritmos empleados en el clculo de funciones.
Asimismo se ha extendido la revisin a algunas primitivas que centran la
computacin en procesadores especializados, en ramas de la informtica como la
computacin grfica y el anlisis de imagen. Todas estas consideraciones han
puesto de manifiesto que los esfuerzos de la investigacin que se realiza para
mejorar el rendimiento en la computacin se vienen desarrollando segn dos vas:
165
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Conclusiones
por una parte, la bsqueda de primitivas nuevas para tratar casos particulares
concretos y, por otra, la mejora en el rendimiento de las primitivas habituales con
la finalidad de extender esta mejora a cualquier clculo derivado.
La convolucin de dos funciones expresa el resultado de evaluar una de ellas
tomando a la otra como referencia. A partir de esa nocin se ha obtenido una
expresin recursiva de la funcin de convolucin que permite calcular el valor
siguiente mediante una suma ponderada; esto es, mediante la suma de dos
multiplicaciones
Los factores de ponderacin utilizados en el proceso iterativo adquieren el papel
de caracterizacin de la funcin resultante lo cual, grosso modo, puede
interpretarse como que sus valores constituyen una expresin condensada de la
lgica relacional algebraica que se utiliza en la notacin explcita de la expresin
de las funciones.
Precisamente, es el establecimiento de los valores de los factores de ponderacin
el objetivo que se encomienda a la unidad de control que se convierte, de esta
manera, en una estructura realmente sencilla cuyo cometido, adems de cargar los
valores de ponderacin, es iniciar las operaciones y gobernar la iteracin.
Desde el punto de vista de la algoritmia que obtiene los clculos, el mtodo
consiste en obtener un nuevo valor de la funcin en cada paso de la iteracin a
partir del valor de la funcin obtenido en el paso de iteracin precedente. Esto
significa que se necesita establecer un valor de iniciacin de la iteracin y un paso
de iteracin. El mbito de aplicacin se ver potenciado por la necesidad de
obtener colecciones de valores de las funciones como, como por ejemplo,
mustreos temporales, barridos o representaciones de comportamientos en
intervalos.
166
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 6
Los criterios de utilizacin del paso de iteracin abren, por su parte, la va para la
incorporacin, de manera intrnseca, de paralizacin de la operatoria. Se puede,
pues, operar en el extremo de la secuencialidad estricta, con el paso bsico, el ms
grande que permita la granularidad del problema y calcular as un valor en cada
paso de iteracin partiendo del valor obtenido en la iteracin anterior. Utilizar un
paso de iteracin mltiplo del bsico permite obtener valores semilla de iniciacin
a partir de los cuales se pueden lanzar hilos paralelos de clculo. La paralelizacin
puede extenderse a varios niveles de profundidad, formando un rbol. En esto
puede haber una clave para derivar funciones ms complejas.
Seguidamente, se resume la aportacin realizada por esta tesis a lo largo de sus
seis captulos.
En el captulo primero, de introduccin, un breve repaso de la historia del
procesamiento de informacin pone de manifiesto que esta cuestin ha estado
presente, al menos de forma explcita, desde la Antigedad. La emergencia de la
informtica y su posterior desarrollo que se debe, tanto al refinamiento de los
mtodos como a la mejora constante de las realizaciones, persigue un objetivo
primordial: resolver cada vez mejor lo que se aborda. Esta tesis pretende aportar
su contribucin a este objetivo. Despus de realizar una revisin del estado del
conocimiento actual en torno a las cuestiones consideradas de inters, la
propuesta de esta investigacin, en aras a la mejora de prestaciones, va por la
lnea de disminuir el nivel de derivacin, propio de los procesadores
convencionales, en el clculo de funciones. Ello conlleva una propuesta de
primitivas nuevas que definen un procesador.
El captulo dos presenta el mtodo de evaluacin recursiva basado en
convolucin, CBRM. Este mtodo se fundamenta sobre dos ideas. Primero, que la
convolucin de dos funciones expresa el resultado de evaluar una de ellas
167
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Conclusiones
tomando a la otra como referencia. Segundo, que una operatoria distinta de la
habitual puede disminuir el nivel de derivacin que precisa el clculo de
convoluciones. Despus de justificar tericamente el papel que desempea la
convolucin, se desarrolla una operatoria recursiva que calcula las convoluciones
a nivel de primitivas, iterando una forma paramtrica. sta encierra, en el valor de
sus parmetros, las caractersticas de las funciones que intervienen en la
convolucin. Los intervalos de pertenencia de los parmetros definen
comportamientos diferenciados, poniendo de manifiesto la potencia del mtodo.
El captulo tres se dedica a la presentacin y evaluacin de la arquitectura del
procesador CBRM. El funcionamiento necesita establecer un valor de iniciacin
de la iteracin y fijar el valor del paso de iteracin. Se realizan las mediciones
pertinentes de tiempo de clculo y rea del mdulo de clculo del procesador
CBRM. Los criterios de utilizacin del paso de iteracin incorporan, de manera
intrnseca, la paralelizacin de la operatoria. En efecto, el paso bsico,
determinado por la granularidad del problema, permite operar en el extremo de la
secuencialidad estricta, y calcular as un valor en cada paso de iteracin partiendo
del valor obtenido en la iteracin anterior. Si se utiliza un paso mltiplo del bsico
se obtienen valores que inician hilos paralelos de clculo. La paralelizacin puede
extenderse a varios niveles de profundidad, formando un rbol. Se efectan
mediciones de eficiencia, productividad y ganancia en velocidad, dependiendo de
la distribucin de los clculos en los hilos paralelos.
El captulo cuatro corrobora la validez del CBRM exponiendo su aplicacin en el
caso de algunas transformadas muy utilizadas en muchos y muy diversos mbitos.
Las transformadas de Hough y el conjunto de transformadas ortogonales,
encabezado por la transformada de Fourier, constituyen un banco de pruebas
interesante. El estudio y comparacin que se realiza de la aplicacin del CBRM
frente a otras propuestas existentes aporta resultados alentadores, sobre todo en
168
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 6
cuanto a los tiempos de clculo. Adems, todas las transformadas consideradas
obedecen a un mismo patrn de clculo tratable por el CBRM. Ello induce a
pensar que este mtodo pueda ir en la lnea de la genericidad y la robustez.
El captulo cinco presenta, bajo el epgrafe de "Simulacin de comportamiento
difcilmente formalizable" dos ejemplos de funciones no tratables a nivel de
primitivas por el CBRM. Se anticipa para ellos una solucin emprica a modo de
introduccin de lo que ser el desarrollo posterior del mtodo en cuanto al
problema de los niveles de derivacin, parte que queda como lnea de trabajo
futuro.
El captulo seis, ltimo de este documento, repasa las aportaciones realizadas por
esta investigacin y propone unas lneas de trabajo futuro.
2 Lneas futuras
A partir de los hitos alcanzados por esta investigacin, el trabajo puede seguir
varios caminos.
Con respecto a seguir consolidando la fimdamentacin terica de la metodologa
se prevn posibilidades de desarrollo importantes en torno a las cuestiones
siguientes:
La definicin de los niveles de derivacin es necesaria para completar la
formalizacin del mtodo. Las funciones usuales tratadas en esta tesis son
resueltas a nivel de primitivas. Las funciones calificadas como difciles de
formalizar, de las cuales el captulo quinto muestra algunos ejemplos,
constituyen casos en los que han de intervenir ms niveles de derivacin.
169
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Conclusiones
Los parmetros a y as como la funcin auxiliar G de la formulacin
recursiva empleada definen tendencias comportamentales que caracterizan la
funcin F calculada. Falta avanzar en la sistematizacin de la correspondencia
entre los valores de los parmetros y los comportamientos.
El resultado alentador del CBRM en la aplicacin a las transformadas de
Hough y transformadas ortogonales deber orientar los esfuerzas en la
direccin de estudiar su aplicabilidad a otos grupos de funciones.
El uso de tablas es una opcin de implementacin reemplazable por cualquier
otra. Sin embargo, existe la posibilidad de considerar como lnea terica de
investigacin en aritmtica el hecho de descomponer y encerrar en un nmero
determinado de casillas de una tabla lo esencial de una funcin, que es su
comportamiento, materializado por un nmero fijo de combinaciones de los
parmetros. La evaluacin en s consistir siempre en un proceso muy
sencillo de clculo, como es la extraccin y suma de los contenidos de la
tabla.
La investigacin en la parte de arquitectura de computadores puede proseguir en
vistas a proponer innovaciones en cuanto a la esencia del clculo de funciones as
como a mejorar las prestaciones en rapidez de clculo, ahorro de espacio. Para
ello, se sugieren las siguientes lneas de desarrollo:
Las tablas LUT son memorias ROM y, por tanto, son dispositivos que
evolucionan con la tecnologa. As y todo, es interesante estudiar estrategias
para reducir su tamao de forma que se superen las dificultades del aumento
del tamao al aumentar la precisin de los datos.
Interesa sin duda pensar en la adecuacin del CBRM para tiempo real. La
idea es probablemente proseguir en la lnea de particionar los datos y realizar
170
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 6
las operaciones de extraccin y suma segn convenga en funcin del tiempo
disponible. Las restricciones de tiempo acarrearn seguramente mayor error.
171
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Volver al ndice/Tornar a l'ndex
172
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
Referencias
[Aharonov, 1997]
D.Aharonov y M. Ben-Or. Fault-tolerant computation with constant error.
Proceedings of the Twenty-Ninth Annual ACM Symposium on the Theory of
Computing, pp-176-188, 1997.
[Ahmed, 1990]
H.M. Ahmed. Directions in DSP P rocessors, IEEE Journal on Selected Areas i
Communications , vol. 8 n8 pp. 1420-1427, 1990.
[Akazawa et al, 2004]
Chihiro Akazawa, Hayami Tsuzuki, Yasuko Nakamura, Yo Sasaki, Kanae
Ohsaki, Shun Nakamura, Yoshihiro Arakawa, and Shinichi Kohsaka. The
Upregulated Expression of Sonic Hedgehog in M otor Neurons after Rat Facial
Nerve Axotomy J. Neurosci., Sep 2004.
[Alonso, 2000]
D.Alonso y R.V Sol.DivGame: a Cellular Automata model of rainforest
dynamics. Ecological Modelling 133, 131-141.
[Altwaijry, 1995]
H. Altwaijry y M. Flynn. P erformance/area trade-offs in Booth multipliers.
TSL-TR-95-684. Computer System laboratory. Stanford University, 1995.
[Andraka, 1998]
R. Andraka, A survey of CORDIC algorithms for FP GAs, Proceedings of the
ACM/SIGDA 6th International Symposium on Field Programmable Gate
Arrays, pp. 191-200, February 1998.
[Antelo et al, 1996]
E.Antelo,, J.D.Bruguera, T.Lang, J. Villaba. High Radix Cordic Rotation Based
on Selection by Rounding. Euro-Par, Vol. II: 155-164-1996.
[Antelo et al, 1997a]
173
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
E.Antelo, J.D.Bruguera, T.Lang,E.L.Zapata: High P erformance Rotation
Architectures Based on the Radix-4 CORDIC Algorithm. IEEE Transactions on
Computers 46(8): 855-870,1997.
[Antelo et al, 1997b]
E.Antelo, , J.D.Bruguera, T.Lang,E.L.Zapata. Error Analysis and Reduction for
Angle Calculation Using the CORDIC Algorithm. IEEE Transactions on
Computers 46(11): 1264-1271,1997.
[Antelo, 2000]
E.Antelo, T.Lang, J.D.Bruguera, Very-High Rada Circular CORDIC: Vectoring
and Unified Rotation/Vectoring. IEEE Transactions on Computers 49(7): 727-
739, 2000.
[Apu, 2004]
R. A. Apu; M. L. Gavrilova Adaptive mesh generation for real-time terrain
modeling. Proceedings of the twentieth annual symposium on Computational
geometry. 2004.
[Arnold et al 1990]
M.G. Arnold, T.A.Bailey, J.R. Cowles y J.J.Cupal. Redundant logarithmic
arithmetic. IEEE Trans, on Computers, vol 39. n 8 pp. 1077-1086. August
1990.
[Arnold, 2001]
M.G. Arnold y C. Walter. Unrestricted Faithful Rounding is Good Enough for
Some LNS Applications. Proceedings of the 15th IEEE Symposium on
Computer Arithmetic. June 2001.
[Arnold, 2002a]
M. Arnold. 21st Century Slide Rules with Logarithmic Arithmetic: High-Speed,
Low-Cost, Low-P ower Alternative to Fixed P oint Arithmetic. Online
Symposium for Electronics Engineers, February 2002. Available at:
http://www.osee.net.
[Arnold, 2002b]
M. Arnold, Improved Cotransformation For LNS Subtraction. IEEE
International Symposium en Circuits and Systems, Scottsdale, AZ, ISBN 0-
7803-7448-7, vol. II, pp. 752-755. May 2002.
[Arnold, 2003a]
M. Arnold, Iterative M ethods for Logarithmic Subtraction
174
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
IEEE International Conference on Application-Specific Systems, Architectures,
and Processors (ASAP'03) The Hague, The Netherlands. June 2003.
[Arnold, 2003b]
M. Arnold, J.Garcia y M. Schulte. The Interval Logarithmic Number System.
Proceedings of the 16th IEEE Symposium on Computer Arithmetic. June 2003.
[Baesch, 1997]
Baesch, A. and Steinmetz, N.: "Exceptional solutions of n-th order periodic linear
differential equations," Complex Variables, Vol. 34, pp. 7-17, 1997.
[Baeumer, 2003]
B. Baeumer. On the inversion of the convolution and Laplace transform Trans.
Amer. Math. Soc, Vol. 355 , pp.1201-1212, 2003.
[Ball y Bojanic, 2000]
S. Ball y R. Bojanik. Table Look-up M ethod for Evaluation of Functions.
Journal of Approximation Theory 107, 2000.
[Bariani et al. 1997]
M. Bariani, R. Cucchiara, P. Mello. Exploiting symbolic learning in visual
inspection. Proc. of IDA 97 4-6 1997, Lecture Notes in Computer Science, v.
1280, Springer, pp. 223-234 (ISBN 3-540-63346-4), 1997.
[Bak, 1997]
J.G.Bak, D. McMichael. Convolution of a measure with itself and a restriction
theorem. Proc. Amer. Math. Soc, Vol. 125, pp. 463-470, 1997.
[Barrera, 1998]
J. Barrera, CE. Ferreira y R.F. Hashimoto. Finding Optimal Sequential
Decompositions of Erosions and Dilations. Proceedings of ISMM'98.
[Bartels, 1987]
R. Bartels, J. Beatty y B.Barsky. An Introduction to Splines for Use in
Computer Graphics and geometric M odeling. Morgan Kaufmann. Los Alamos,
California. 1987.
[Bartle, 1995]
R.G. Bartle. The elements of integration and Lebesgue measure. Wiley classics
library edition. 1995.
[Bascompte, 1998]
175
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
J.Bascompte y R.V. Sol. Spatiotemporal patterns in nature
Trends in Ecology and Evolution 13, 173-174, 1998.
[Beaumont-Smith et al, 1998]
A. Beaumont-Smith, . Burgess, S.Lefrere. Reduced Latency IEEE Floating-
point Standard Adder Architectures. Proceedings of the 14
th
Symposium on
Computer Arithmetic, IEEE, 1998.
[Ben-Tzvi, 1990]
D.Ben-Tzvi y M. Sandler. A Combinatorial Hough Transform. J.P. Recognition
Letters, Vol 11, pp. 167-174, 1990.
[Berkner, 1999]
K.Berkner: Resolution of singularities of convolutions with the Gaussian kernel.
Proc. Amer. Math. Soc, Vol. 127, pp. 425-435, 1999.
[Bewick, 1992]
G.W. Bewick y M. Flynn. Binary multiplication using partially redundant
multipliers. TR CSL-TR-92-528. Computer System Laboratory, Stanford
University, 1992.
[Bewick, 1994]
G.W. Bewick. Fast Multiplication: Algorithm and Implementation. PhD Dept.
Of Electrical Engineering, Stanford University, 1994.
[Beziers, 1970]
P.Beziers. Emploi des machines Commande Numrique. Masson et Cie. Paris.
1970.
[Beziers, 1974]
P.Beziers. M athematical and P ractical P ossibilities on UNISURF. Barnhill y
Riesenfeld Editores. Computer Aided Geometric Design. Academic Press.
Nueva York, 1974.
[Bickerstaff, 2001]
K'A.C. Bickerstaff, E.E. Swartzlander Jr Analysis of Column Compression
M ultipliers Ptoceedings of the 15th IEEE Symposium on Computer Arithmetic.
June 2001.
[Booth, 1951]
A.D. Booth. A signed binary multiplication technique. Quarterly Journal of
Mechanics and Applied mathematics, vol.4, n 2, pp. 236-240, 1951.
176
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Bouville, 1985]
C. Bouville Bounding Ellipsoids for Ray Fractal Intersection. SIGGRAPH 85.
pp 45-52.
[Boyer, 1986]
C.B.Boyer "Historia de las matemticas" Alianza Univ. Textos, N94, 1986.
[Brocker, 1985]
Brocker, and Dieck, T. Representations of Compact Lie Groups . Sringer-
verlag, 1985.
[Bruguera, 1993]
J.D.Bruguera, E.Antelo, T.Lang, Design of a P ipelined Radix 4 CORDIC
P rocessor. Parallel Computing 19(7): 729-744, 1993.
[Bruguera et al, 1996]
J.D Brughera, N.Guil, T, Lang. CORDIC based parallel/pipelined architecture
for the the Hough Transform. Journal of VLSI Signal Processing, vol. 12, pp.
207-221, 1996.
[Bruguera, 2001]
J.D.Bruguera, T.Lang Usingthe Reverse-Carry Approach for Double Datapath
Floating-P oint Addition Proceedings of 15th Symposium on Computer
Arithmetic, IEEE 2001
[Bucgholz, 1999]
A.Buchholz. Norm of convolution by operator-valued functions on free groups.
Proc. Amer. Math. Soc, Vol. 127, pp. 1671-1682, 1999.
[Cain, 2003]
M. E. Cain, B. S. Kapp y C. B. Puryear. The Contribution of the Amygdala to
Conditioned Thalamic Arousal. J. Neurosciences. December 2002.
[Callaway, 1997]
T.A. Callaway, E.E. Schwartzlander.Power delay characteristics of CMOS
Multipliers. Proceedings of the 13
th
Symposium on Computer Arithmetic. IEEE,
1997.
[Cao, 1997]
J. Cao y . Wei, High performance Hardware for Function Generation
Proceedings of the 13
th
symp. on Computer Arithmetic (ARITH'97).
[Cao, 2001]
177
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
J. Cao, . Wei y J. Cheng. High performance Architectures for forElementary
Function Generation Proceedings of the 15
th
symp. on Computer Arithmetic.
June 2001.
[Cpek, 1997]
V. Cpek: Exact memory integral in Time-Convolution Generalized M aster
Equations: Argyres-Kelley projector. In: Zeitschrift fur Physik - Condensed
Matter, Vol. 104, pp. 323-331, 1997.
[Capelle, 1996]
J.Capelle. Convolution on homogeneous spaces. ISBN: 90-367-0686-6, 1996.
[Cardon,2002]
D.A. Cardon. Convolution operators and zeros of entire functions. Proc. Amer.
Math. Soc, Vol. 130, pp. 1725-1734, 2002.
[Cardona, 1996 ]
P. Cardona, Historia de la Informtica. Recopilacin. Mayo 1996.
http://www.mallorcaweb.net/mostel/index.html?http://www.mallorcaweb.net/m
ostel/historia.htm.
[Carlson, 2004]
.A. Carlson y M. Kawasaki. The Who's Who Signal in Electric Fish J.
Neuroscience, Septiembre 2004.
[Cavallaro, 1988]
J.R. Cavallaro y F.T Luk. CORDIC arithmetic for SVD processor. Journal of
Parallel and Distributed Computing , n5, pp.271-290, 1988.
[Cavallaro, 1991]
J.R Cavallaro y A.C. Lester. CORDIC processor array for the SVD of a complex
matrix . SVD and Signal processing II, Algorithms, Analysis and Applications. R.J.
Vaccado (editor), Elsevier Science Publishers, pp. 227-239, 1991.
[Cohn, 1980].
D.L. Cohn. Measure Theory. Birkhauser Boston-1980.
[Coleman, 1999]
J. N. Coleman and E. Chester A 32 Bit Logarithmic Number System P rocessor
and its P erformance Compared to Floating P oint. 14th IEEE Symposium on
Computer Arithmetic, pp. 142-152, Adelaide, Australia, April 1999.
[Coleman, 2000]
178
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
J.N.Coleman y E.I Chester. Arithmetic on the European logarithmic processor
IEEE Trans, on Computers., vol 49n 7 pp. 702-715. July 2000.
[Cornea-Hasegan, 1999]
M. Cornea-Hasegan y . Norin. 64 Floating-P oint Operations and the IEEE
Standard for Binary Floating-P oint Arithmetic. INTEL Technology Journal. 4th
quarter 1999.
[Corazza et al.,2002 ]
xG.E.Corazza, P. Salmi, A. Vanelli-Coralli y M. Villanti, M. Differential P ost
Detection Integration Techniqu in the Return Link of Satellite CDMA Systems,
IEEEISSSTA 2002 Conference, Czech Republic, 2002.
[Chamberlain, 2002]
Chamberlain, R;Lord, Real-time 2D floating-point fast Fourier
transforms for seeker simulation." E. Proceedings SPIE. Vol 4717, pp.15-
23 Technolologies for Synthetic Evironments: Hardware- in-the-loop
Testing VII, Robert Lee Murrer Ed. July 2002.
[Chan, 1993]
E. Chan and S. Panchanathan, A VLSI architecture for DFT, Proceedings of the
36
th
Midwest Symposium on Circuits and Systems, pp.292-295. Detroit
Michigan. USA, 1993.
[Chang, 1988]
L.W.Chang and M.Y. Chen A new systolic array for discrete Fourier
transform. IEEE Trans. On Acoustic, Speech and Sugnal Processing, vol.36
pp.1665-1666, 1988.
[Chang, 2000]
T.S. Chang, J.T. Guo and C.W. Jen. Hardware Efficient DFT Designs
with Cyclic Convolutions and Subex pression Sharing, IEEE Transactions
on CAS II- vol. 47, n9, pp.886-892, Sept.2000.
[Chang, 2000]
Chang, C.H., Wang, C.L Efficient VLSI architectures for fast
computation of the discrete Fourier transform and its inverse., IEEE
Transactions on Signal Processing,vol. 48, nl l , pp.3206-3216,
Nov.2000.
[Chang, 2001]
C.H. Chang, C.L. Wang,. A DHT-based FFT/IFFT P rocessor for VDSL
Transceivers, Proceedings ICASSP'2001, pp. 1213-1216.
179
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Chechile, 2003]
R.A.Chechile. M athematical tools for hazard function analysis. Journal of
Mathematical Psycology, Vol. 47, pp. 478-494, 2003.
[Chichyang, 2000]
C. Chichyang, C. Rui-Lin, Y. Chih-Huan. P ipelined computation of very-large
word length LNS addition/subtraction with polynomial hardware cost. IEEE
Trans, on Computers, vol 49. n 7 pp. 716-726. July 2000.
[Chen, 1998]
C. Chen and C. H. Yang, P ipelined Computation of LNS Addition/Subtraction
with Very Small Lookup Tables. Proceedings of the International Conference on
Computer Design pp. 292-297, Oct. 5-7, 1998.
[Cheng et al, 2000]
F. Cheng, S.H. Unger, M.Theobald. Self-Timed Carry-Lookahead Adders. IEEE
Transactions on Computers, vol 48 n 7. Julio 2000.
[Chien, 2002]
Chien-Chang Lin, Chih-Da Chien. A parametrized hardware design for the
variable length discrete Fourier transform. 15
l
International Conference on
VLSI Design (CAD Symposium) 2002.
[Choi et al, 1997],
J.R. Choi, L.H. Jang, S.W. Jung y J.H. Choi. Structured Design of a 288-Tap
FIR Filter by optimized P artial product Tree Compression. IEEE Journal of
Solid State Circuits, vol.32, n 3. 1997.
[Chu, 1999]
Chu, C-H. and Leung, C-W. Harmonic functions on homogeneous spaces.
Monatshefte Math., Vol. 128, pp. 227-235, 1999.
[Chua, 2000]
C. Chua y U. Neumann Hardware Accelerated Free Form Deformation
Eurographics/SIGGRAPH Graphics Hardware Workshop 2000, pp. 33-40,
August 2000.
[Chua, 2001]
C. Chua y U. Neumann A M odular Approach to Deformable M odeling and
Animation IEEE Computer Animation, pp. 184-191, November 2001.
[Chuang, 1995]
180
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
H.Y.H.Chuang y C.C.Li. A systolic processor for straight line detection by
modified HT IEEE Conf. on Computer Architecture for Pattern Analysis and
Image Database Management, pp. 300-304, 1995.
[Cooley, 1965]
J.W. Cooley, J.W.Tukey, An algorithm for the machine calculation of complex
Fourier series, Math. Comput. 19, 297-301 (1965).
[Dadda, 1965]
L.Dadda. Some Schemes for P arallel multipliers, Alta Frequenza, vol.45, n 3.
Marzo, 1996.
[Dadda, 1996]
L. Dadda y V. Piuri. P ipelined adders. IEEE Transactions on Computers, vol 45
n 3. March 1996.
[Daemen, 2000]
J. Daemen y V. Rijmen, The Block Cipher Rijndael, Smart Card Research and
Applications, LNCS 1820, J.-J. Quisquater and B. Schneier, Eds., Springer-
Verlag, 2000, pp. 288-296.
[Daemen, 2001]
J. Daemen y V. Rijmen, Rijndael, the advanced encryption standard, Dr.
Dobb's Journal, Vol.~26, No.~3, pp.~137-139. March 2001,
[da Fontura, 1989]
L.da Fontura y M.B. Sandler. A binary HT and its efficient implementation in a
systolic array architecture. J.P. Recognition Letters, Vol. 10, pp. 329-334, 89.
[Daniell, 1929]
P.J Daniell. Stieltjes-Volterra P roducts, Congr. Intern, des Math.Strasbourg,
920, pp 130-136. 1929.
[Das et al.1995 ]
D. Das et al. Implementation of four co functions on an LNS co-processor. IEEE
Trans, on Computers, vol 44. n 1 pp. 155-161-Jan. 1995
[Das, 1995]
D. Das, K. Mukhopadhyaya y . P. Sinha, Implementation of Four Common
Functions on an LNS Co-P rocessor, IEEE Transactions on Computers, vol. 44,
no. l, pp. 155-161, Jan. 1995.
[da Silva, 1990]
181
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
I. da Silva. Vectorization from aerial photographs applying the HT method.
Proc. SPIE, Vol 1395, Pt2, pp. 956-963, 1990.
[De Dinechin, 2001]
F. de Dinechin y A. Tisserand Some Improvements on M ultipartite Table
M ethods. Proceedings of the 15th IEEE Symposium on Computer Arithmetic.
June 2001.
[De Lange et al,1990]
A.A. DeLange, et al. Real time applicactions of the floating-point pipeline
CORDIC processor in massive-parallel pipelined DSP algorithms. Proc.
ICASSP-90pp. 1013-1016- 1990.
[Delgado, 1999]
J.Delgado y R.V.Sol. Task Fulfilment and Temporal P atterns of Activity in
Artificial Ant Colonies.LQctare Notes in Artificial Intelligence 1674, 606-615.
[De Mdicis, 1995]
A. De Mdicis, Leroux. Generalized Stirling numbers, convolution formulae
andp, q-analogues. Canad. J. Math. Vol. 47, pp. 474-499, 1995.
[Deng, 2001]
D.S. Dixon, y H.E1 Gindy. High speed P arametrizable HT using reconfigurable
hardware. Pan-Sydney Area Workshop and Visual Information Processing
(VIP), 2001.
[De Reffye et al., 1988]
P. De Reffye, C. Edelin, C. Franon. P lant Models Faithful to Botanical
Stuctures and Development. Pp. 51-158. SIGGRAPH, 1988.
[Dettweiler, 2003]
M.Dettweiler, S. Reiter. On the middle convolution Preprint
(math.AG/0305311), 2003.
[Deutsch, 1999]
D.Deutsch. Quantum theory of probability and decisions. Proceedings of the
Royal Society A455 3129-3197, 1999.
[Dick, 1998]
C. Dick. Minimum Mutiplicative Complex ity Implementation of the 2-D DCT
using Xilinx FP GAs Proceedings of SPIE's Photonics East'98 Configurable
computing: Technology and Applications pp. 190-201. Boston, MA USA
Nov. 1998.
182
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Deutsch, 2000a]
D.Deutsch, A.Eckert y R.Luppachini. M achines, logics and quantum physics.
Bulletin of Symbolic Logic 3. 3-Sept. 2000.
[Deutsch, 2000b]
D.Deutsch y P. Hayden. Information Flor in Entangled Quantum Systems.
Proceedings of the Royal Society A456 1759-1774. 2000.
[Dimitrov et al, 2001]
V. S. Dimitrov, J. Eskritt, L. Imbert, G. A. Jullien, W.C. Miller The Use of the
M ulti-Dimensional Logarithmic Number System in DSP Applications.
Proceedings of the 15th IEEE Symposium on Computer Arithmetic. June 2001.
[Dong, 2001]
F. Dong, G.J Clapworthy y M.Krokos. Volume Rendering of Fine Details
Within M edical Data. IEEE Visualization, San Diego, 2001.
[Dorf, 1989]
R.C. Dorf. Sistemas modernos de control. Addison-Wesley. Iberamericana
1989.
[D'Ornellas, 1998]
M.C. D'Ornellas y R. van den Boomgaard. Generic Algorithms for
M orphological Image Operators: A Case Study Using Watersheds.
Proceedings of ISMM'98.
[Eckorn et al., 1990]
R.Eckhorn, R. H.J. Reitboeck, M. Arndt y P.Dicke. Feature linking via
synchronization among distributed assemblies: Simulations of results from cat
visual cortex. Neural Comp. 293-307 -1990.
[Eijndhoven, 2003]
S.J.L.V.Eijndhoven, L.C.G.J.M Habets.Equivalence of Convolution Systems in
a Behavioral Framework. Mathematics of Control, Signals, and Systems, Vol.
16, pp. 175-206, 2003.
[Ercegovac et al, 2000a]
M. D.Ercegovac, L.Imbert, D.W.Matula, J.Muller. Improving Goldschmidt
Division, Square Root and Square Root Reciprocal. IEEE Trans, on
Computers., vol 49 n 7. Julio 2000.
[Ercegovac et al, 2000b]
183
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
M. Ercegovac, T.Lang, J. Muller, A Tisserand. Reciprocation, Square Root,
Inverse Square Root and Some Elementary Functions using Small M ultipliers.
IEEE Trans, on Computers., vol 49 n 7.July 2000.
[Ercegovac, 1994]
M.D.Ercegovac y T.Lang. Division and Square root: Digit-Recurrence,
Algorithms and Implementations. Kluwer Academic Pub., 1994.
[Even, 2000]
G. Even y P. Seidel. A comparison of Three Rounding Algorithms for IEEE
Floating-point M ultiplication. IEEE Transactions on Computers, vol 49 n 7.
July 2000.
[Fang, 1997]
W.H. Fang, and M.L. Wu An efficient unified systolic architecture for the
computation of discrete trigonometric transform. Proceedings ISCAS, pp.2092-
2095. 1997.
[Feynman, 1983]
R. Feynman. El carcter de la ley fsica. Bosch. Barcelona 1983.
[Fernndez et al, 2001]
C.Fernndez, A. Galbis, M.C. Gmez-Collado. Elliptic convolution operators
on non-quasianalytic classes. Arch. Math., Vol. 76, pp. 133-140, 2001.
[FitzHugh, 1961]
R. FitzHugh. Journal of Biophysiology n 1. pp.445-466.
[Flynn, 1970]
M.Flynn. On division by functional iteration. IEEE Transaction on computers,
vol.C-19, n8. Agosto, 1992.
[Foley et al., 1990]
J. Foley, A Van Dam, S. Feiner. Computer Graphics: P rinciples and P ractice,
Second Edition. Addison-Wesley, Reading, Massachussets.1990.
[Fournier, 1982]
A. Fournier, D. Fussell y L. Carpenter. Computer Rendering of Stochastic
M odels. CACM, 25(6). pp. 371-384. 1982.
[Frigo, 1998]
M. Frigo, S. G. Johnson FFTW: An Adpative Software Architecture for the FFT
Proceedings ICASSP Conference 1998, vol. 3, p. 1381.
184
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Frigo, 2000]
M. Frigo, S.G. Johnson The Fastest Fourier Transform in the West Technical
Report MIT-LCS-TR-728, Massachusetts Institute of Technology, September
1997.
[Fulton, 1991]
Fulton, W., Harris, J. Representation Theory. A first Course, Springer_verlag,
1991.
[Gao, 2003]
Y. Gao, E.Nikulina, W.Mellado y M.T. Filbin. Neurotrophins Elevate cAM P to
Reach a Threshold Required to Overcome Inhibition by M AG through
Extracellular Signal-Regulated Kinase-Dependent Inhibition of
P hosphodiesterase. J. Neurosci., December 2003.
[Garcia et al. 2003a]
J.M Garca Chamizo, M.T- Signes Pont, H. Mora Mora, G. de Miguel Casado.
P arametrized Architecture for Hough Transform Recursive Evaluation. Proc.
SMMSP 2003, Barcelona, Spain, 2003.
[Garcia et al. 2003b]
J.M Garca Chamizo, M.T- Signes Pont, H. Mora Mora, G. de Miguel Casado.
Hough Transform Recursive Evaluation Using Distributed Arithmetic.
Proceedings 12th IFIP International Conference on VLSI-SoC Systems, pp.
301-306, Darmstadt, Germany, 2003.
[Gasteratos, 1998]
A. Gasteratos, I. Andreadis y Ph. Tsalides Soft M orphological Structuring
Element Decomposition. Proceedings of ISMM'98.
[Gelperin, 1989]
A.Gelperin, D.W.Tank y G.Tesauro. Olfactory processing and associative
memory: cellular and modeling studies. Neural Models of Plasticity:
Theoretical and Empirical Approaches. Eds. J.Byrne and W.O.Berry. Academic
Press. New York, 1989.
[Gonzlez, 1996]
R.C Gonzlez y R.E Woods. Tratamiento digital de imgenes. Addison-
Wesley. Iberamericana. S.A. 1996.
[Gottesman, 1999]
D.Gottesman y I.L.Chuang. Quantum Teleportation is a universal
computational primitive. Nature, 402-392, 1999.
185
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Goto, 1997]
G.Goto. A 4.1 ns compact 54x54b M ultiplier Utilising Sign-Select Booth
Encoders. IEEE. J. Solid-State Circuits, vol.32, n 11. Noviembre, 1997.
[Gousseau, 2001]
Y.Gousseau y J.M. Morel. Are natural images of bounded variation. SIAM J.
on Mathematical Analysis, Vol.33 n 3 pp. 634-648.
[Grabiner, 2004]
S. Grabiner. Weak properties of weighted convolution algebras. Proc. Amer.
Math. Soc, Vol. 132, pp. 1675-1684, 2004.
[Hadwiger, 1957]
H. Hadwiger. Vorslesungen ber Inhalt. Oberfiche und Isoperimetrie.
Springer. Berlin. 1957.
[Hamana, 2003]
H. Hamana, J. Hirono, M. Kizumi, y T. Sato. Sensitivity-dependent
Hierarchical Receptor Codes for Odors Chem Senses; 28(2): 87 104. February
2003.
[Harris et al, 1997]
D.L.Harris, S.F.Oberman, A.M. Horowitz. SRT Division-Architectures and
Implementations IEEE 13
th
Symposium on Computer Arithmetic, 1997.
[Harth, 1990]
E.Harth, A.S.Pandya, K.P. Unnikrishnan, Optimization of cortical responses by
feedback modification and synthesis of sensory affrents. A modelf perception
and rem sleep. Concepts Neurosci. 1,53-68, 1990.
[Haule, 1989]
D.D. Haule, D.D y A.S. Object Recognition using fast adaptative HT. IEEE
Comp. Pacific Conf. On Communication, Compiler and Signal Processing, pp.
91-94, 1989.
[Haviland, 1980]
G.L Haviland y A.A. Tuszynski. A CORDIC arithmetic processor chip. IEEE
Trans, on Computers, vol C-29 n2 pp. 68-79- 1980.
[Hawkins, 1975].
T.Hawkins. Lebesque theory of integration. Chelsea.Pub.Co., 1975.
186
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Heijmans, 1998]
H. J.A.M. Heijmans y Jos B.T.M. Roerdink. M athematical M orphology and its
Applications to Image and Signal P rocessing. Computational Imaging and
Vision- Vol. 12. Kluwer Academic Publishers, Dordrecht Hardbound, ISBN 0-
7923-5133-9 May 1998.
[Hering, 2003]
H. Hering y M.Sheng. Activity-Dependent Redistribution and Essential Role of
Cortactin in Dendritic Spine M orphogenesis. J. of Neuroscience., December
2003.
[Hodgkin, 1952]
A.L.Hodgkin y A.F. Huxley. Journal of P hysiology.n\ 17- pp.500-544.
[Hogg, 1998a]
T. Hogg. Highly Structured Searches with Quantum Computers Physical
Review Letters, vol 80. 1998.
[Hogg, 1998b]
T. Hogg y M Yanik Local Search M ethods for Quantum Computers Xerox
PARC technical report. 1998.
[Hogg, 1998c]
T. Hogg A Framework for Structured Quantum Search Physica-D vol 120
pp.102-116. 1998.
[Hogg, 2000a]
T. Hogg y D. Portnov Quantum Optimization", Information Sciences, vol 128
pp.181-197. 2000.
[Hogg, 2000b]
T. Hogg Quantum Search Heuristics Physical Review A, vol 61. 2000.
[Hogg, 2000c]
T. Hogg Single-Step Quantum Search Using P roblem Structure, Intl. J. of
Modern Physics C, vol. 11. 2000.
[Hogg, 2003]
T. Hogg Adiabatic Quantum Computing for Random Satisfiability P roblems.
Physical Review A vol 67. 2003.
[Hougb.,59]
187
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
P.V.C. Hough, M achine Analysis of Bubble Chamber P ictures. International
Conference on High Energy Accelerators and Instrumentation, CERN, 1959.
[Hsiao, 2000]
S,.F.Hsiao, W.R Shiue, Design of low-cost and high throughput linear arrays
for DFT computations: algorithms, architectures and implementations., IEEE
Transactions on Circuits and Systems II, Vol 47(11), pp.1188-1203. Nov. 2000.
[Hu, 1992]
Y.H.Hu. CORDIC-based VLSI architectures for Digital Signal P rocessing.
IEEE Signal Processing Magazine, n 7 pp. 16-35- July 1992.
[Huang, 2000]
L.Y.Huang, Z.Hu y F.M. Sun. A New Automatic Quasar Recognition Technique
Based on P CA and the Hough Transform. ICPR 2000, pp. 2499-2502, 2000.
[Hyman et al, 2003]
J.M. Hyman, B.P. Wyble,V.Goyal, C.A. Rossi, y M.E. Hasselmo Stimulation in
Hippocampal Region CA in Behaving Rats Yields Long-Term P otentiation
when Delivered to the P eak of Theta and Long-Term Depression when
Delivered to the Trough J. Neuroscience, December 2003.
[Ito, 1997]
M. Ito y T. Naofumi. Efficient Inicial Approximation for M ultiplicative Division
and Square Root by a M ultiplication with operand M odification. IEEE
Transactions on Computers, vol 46, n4. April 1997.
[Jackson, 2004]
A C. Jackson, G.L. Yao y B.P. Bean Spontaneous Firing in Clock
Neurons. J. Neuroscience, Sept. 2004.
[Janzing, 2001]
D. Janzing y Th. Beth, Complexity measure for continuous-time quantum
algorithms, Phys. Rev. A 64 022301. 2001.
[Jozsa, 1998]
R. Jozsa, Quantum algorithms and the Fourier transform, Proceedings of. R.
Soc. Lond. A 454, 323-37. 1998.
[Jozsa, 1999]
R. Jozsa, Quantum effects in algorithms, Lecture Notes in Computer Science
1509, 103-12. 1999.
188
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Kajiya, 1983]
J. Kajiya New Techniques for Ray Tracing P rocedurally Defined Objects.
SIGGRAPH 83. pp 91-102.
[Kalampukas et al, 2000]
L.Kalampukas, D.Nikolos, C. Efstathiou High-Speed P arallel-P refix M odulo
2
n
-l Adders. IEEE Transactions on Computers, vol 48 n 7. Julio 2000.
[Karasik, 1998]
Y.B. Karasik. How to compute three-dimensional convolution and/or
correlation optically: a mathematica foundation. Journal of Modern Optics,
Vol. 45, pp. 817-823, 1998.
[Kantabutra, 1993]
V. Kantabutra. Designing optimum one-level carry-skip adders. IEEE
Transactions on Computers, vol 42 n 6. Junio 1993.
[Katsuhiko, 1993]
0. Katsuhiko Ingeniera de control moderna. (2
a
edicin). Prentice-Hall
Hispanoamericana. 1993.
[King, 2002]
King, J.A., Burgess, ., Hartley, T., Vargha-Khadem, F., & O'Keefe, J. (2002).
The human hippocampus and viewpoint dependence in spatial memory.
Hippocampus 12(6):811-20.
[Koch, 1985 ]
C. Koch, J. Marroquin y A.Yuille. Analogneuronal networks in early vision.
[Koren, 1990]
I.Koren, O.Zinati: Evaluating Elementary Functions in a Numerical
Coprocessor Based on Rational Approx imations. IEEE Transactions on
Computers 39(8): 1030-1037 1990.
[Koren, 1993]
1. Koren. Computer Arithmetic Algorithms. Cap. 9, pp. 163-180. Englewood
Cliffs, N.J.: Prentice Hall, 1993.
[Kornerup, 2003]
P. Kornerup Revisiting SRT Quotient Digit Selection Proceedings of the 16th
IEEE Symposium on Computer Arithmetic. June, 2003.
[Koshimizu, 1990]
189
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
H.Koshimizu y M. Numada. On fast Hough Transform method P LHT based on
piecewise-linear Hough function. J. System Computer in Japan, Vol 21 n5, pp.
62-73, 1990.
[Kuhlmann y Pahi, 1998]
M. Kuhlman y K.K.Pahi. Fast Low-P ower Architecture. Proceedings of
International Conference on Computer Design. IEEE 1998.
[Kwon et al, 2000]
O. Kwon, . Nowka y E.E. Shwarzlanger. A 16-bit MAC Design UsingFast 5:2
Compressors. IEEE Conference on Application-Specific Systtems,
Architectures and Processors.
[Laflamme, 1996]
R. Laflamme, C.Miquel y J.P.Paz. P erfect quantum error correction code.
Phys.Rev. Lett., 77: 198, 1996, arXive e-print quant-ph/9602019.
[Lai, 1991]
F. Lai y C.Wu, C. A hybrid number system processor with geometric an
complex arithmetic capabilities. IEEE Trans, on Computers, vol 40. n 8 pp.
952-962. August 1991.
[Lai, 1993]
F. Lai. The Efficient Implementation and Analysis of a Hybrid Number System
P rocessor. IEEE Transactions on Circuits and Systems-II: Analog and Digital
Signal Processsing, vol. 40, no. 6, pp. 382-392, 1993.
[Lang y Montuschi, 1999]
T. Lang y P.Montuschi . Very High Radix Square Root with P rescaling and
Rounding and a Combined Division/Square Root Unit. IEEE Transaction on
Computers, vol 48 n 8 Agosto 1999.
[Lang y Antelo, 2001]
T. Lang y Antelo Correctly Rounded Reciprocal Square-Root by Digit
Recurrence and Radix -4 Implementation. Proceedings of the 15th IEEE
Symposium on Computer Arithmetic. June 2001.
[Lang y Antelo, 2003]
T. Lang y Antelo Radix -4 Reciprocal Square-Root and Its Combination with
Division and Square Root IEEE Transaction on Computers Vol. 52, No. 9
Septiembre 2003.
[Lang y Bruguera, 2004]
190
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
T. Lang y J.D. Bruguera Floating-P oint Multiply-Add-Fused with Reduced
Latency ) IEEE Transaction on Computers Vol. 53, No. 8 Agosto 2004.
[Law et al., 2000]
C: Law, K. Yeo y S. Rofail. A redundant-binary partial-product generator
based on a five-bit recodingtechnique. International Journal of Electronics, vol.
87, n4, 2000.
[Lewis, 1990]
D.M. Lewis.^4 architecture for addition and subtraction of long-word length
numbers in the logarithmic number system. IEEE Trans, on Computers, vol 39.
n 11 pp. 1325-1336. Nov.1990.
[Li, 2003]
X. Li, M.Davison y C.Essex. Fractional Differential Equations and Stable
Distributions, Submitted to Journal of Applied Probability, 2003.
[Li et al. 1986 ]
H.F.Li, M.A. Lavin y R.J. Master. Fast Hough Transform: a hierarchical
approach. J. Computer Vision Graphics Image Processing, Vol.36, pp. 139-161,
1986.
[Lindenmayer, 1968]
A. Lindenmayer. Mathematical Models for Cellular Interactions in
Development, P arts I and II. J. Theor. Biol., 18. pp 280-315. 1968.
[Ma, 2003]
N.Y. Ma y R.P. King, R.P. The -fold convolution of generalized ex ponential-
sum distribution functions, Appl. Math. Comput. Vol. 142, pp. 23-33, 2003.
[Mc Cullogh, 1943]
W.S. Mac Cullogh y W. Pitts. Bull. Math. Biophys.5. 115-133.
[Me Cann y Pippenger, 2003]
M.McCann y . Pippenger. SRT Division Algorithms as Dynamical Systems.
Proceedings of the 16th IEEE Symposium on Computer Arithmetic. June 2003.
[Markowska, 2002]
A. L. Markowska y A. V. Savonenko. Effectiveness of Estrogen Replacement in
Restoration of Cognitive Function after Long-Term Estrogen Withdrawal in
AgingRats. J. Neurosciences December 2002.
[Mandelbrot, 1982]
191
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
. Mandelbrot. Tecnical correspondance. CACM, 25(8) pp.581-583.
[Matheron, 1967]
G. Matheron. Elements pour une thorie des milieux poreux, Masson. Paris.
1967.
[Matula, 2001]
D. W. Matula Improved Table Lookup Algorithms for P ostscaled Division .
Proceedings of the 15th IEEE Symposium on Computer Arithmetic, June, 2001
[Matula y Fit-Florea, 2003]
D. W. Matula y A. Fit-Florea. P rescaled Integer Division. Proceedings of the
16th IEEE Symposium on Computer Arithmetic, June, 2003.
[Maurer, 2001]
S. Maurer; T. Hogg y .A. Huberman Quantum P ortfolios Physical Review
Letters, vol 87. 2001.
[Max, 1979]
N.L.Max. ATOMLLL: ATOMS with Shading and Highlights. SIGGRAPHS 79,
pp. 165-173.
[Miel, 1993]
G. Miel Constant Geometry Fast Fourier Transforms on Array P rocessors
Transactions on Computers March 1993,Vol. 42, No. 3. pp 371-375.
[Mintzer, 1996 ]
Les Mintzer Large FFTs in a single FP GA, Proceedings of ICSPAT'96.
[Mora, 2001]
J.M Mora Pascual. Unidades Aritmticas en coma flotante para tiempo real.
Tesis Doctoral. Dept. Arquitectura y Tecnologa de Computadores. Universidad
de Alicante. 2001.
[Montuschi y Cimiera, 1993]
P. Montuschi y L. Cimiera. Reducing Iteration Time when result digit is zero
for 2 SRT division and square root with redundants remainders. IEEE
Transactions on Computers, vol 42 n 2 1993.
[Montuschi y Cimiera, 1994]
P. Montuschi y L. Cimiera. Over-Redundant digit sets and the design of digit-
by-digit units. IEEE Transactions on Computers, vol 43 n 3 1994.
192
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Montuschi y Lang, 2001]
P.Montuschi y T. Lang. Very High Radix Division with P rescaling and
Selection by Rounding IEEE Transaction on Computers, vol 50 n 1 Enero
2001.
[Muamar, 1991]
H.K Muamar y M. Nixon. Tristage Hough Transform for multiple ellipse
extraction. IEEE Proc. Part E: Computer and Digital Techniques, Vol 138 n 1,
1991.
[Muller, 1998]
J.M. Muller, A. Sherbyna y A.Tisserand. Semi-logarithmic number system.
IEEE Trans, on Computers, vol 47. n 2 pp. 145-151. Feb. 1998.
[Murthy, 1994]
N.R Murthy and M.N.S. Swamy. On the real-time computation of DFT and
DCT through systolic architectures. IEEE Trans, on Signal Processing, vol. 42,
n4,pp.988-991,1994.
[Nakayama, 1989]
Nakayama et al. A 6.7 M FLOP S floatig-point coprocessor with vector/matrix
instructions. IEEE Journal on Solid-State Circuits, vol 24 n 5 pp. 1324-1330 -
1989.
[Nielsen, 1997]
O.A.Nielsen. An introduction to integration and measure theory. John Wiley
and Sons Inc. 1997.
[Oberlin, 2002]
D.M. Oberlin. Some convolution inequalities and their applications, Trans.
Amer. Math. Soc, Vol. 354, pp. 2541-2556, 2002.
[Oberman y Flynn, 1997]
S.F. Oberman y M.J. Flynn. Division Algorithms and Implementations. IEEE
Transactions on Computers. 1997.
[Obermann et al., 1997]
S.F.Oberman, H Altwaijry, M.J. Flynn. The SNAP P roject: Design of Floating-
P oint Units. IEEE Proceedings of the 13
th
Symposium on Computer Arithmetic.
IEEE 1997.
[O'Keefe, 1979]
193
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
J. O'Keefe. A review of the hippocampal place cells. Progr. Neurobiol., 13, 419-
439.
[Oklobdzija et al, 1996]
V.G. Oklobdzija, D. Villeger, S.S. Liu. A method for speed optimizedpartial
product reduction and generation of fast parallel multipliers using an
algorithmic approach. IEEE Transactions on Computers. Vol. 45, n 3. March
1996.
[Omondi, 1994]
A.R. Omondi. Computer Arithmetic Systems. Prentice Hall. 1994.
[Paliouras, 2001]
V. Paliouras and T. Stouraitis. Low-P ower P roperties of the Logarithmic
Number System. Proceedings of the 15th IEEE Symposium on Computer
Arithmetic, Vail, pp. 229-236, June 2001.
[Paliouras, 2002]
V. Paliouras. Optimization Of LNS Operations For Embedded Signal
P rocessing Applications. IEEE International Symposium on Circuits and
Systems, Scottsdale, AZ, ISBN 0-7803-7448-7, vol. II, pp. 744 - 747, 28 May,
2002.
[Parks, 2000]
M. Parks. Number-Theoric Test Generation for Direct Rounding. IEEE
Transactions on Computers, vol 49 n 7 July 2000.
[Parr, 2002]
A.W. Parr, Compactly bounded convolutions of measures, Proc. Amer. Math.
Soc, Vol. 130, pp. 2661-2667, 2002.
[Parthasarathy, 1980]
K.R.Parthasarathy. Introduction to probability and measure.McMillan Press,
1980.
[Pease, 1968] An adaptation of the fast Fourier transform for parallel
processing. J of the ACM Marshall C. Pease., vol.l5,pp.252-264, 1968.
[Peiming, 2001]
Yan Peiming, Mo Yulong. Image restoration based on the discrete
fraction Fourier transform. Proceedings SPIE. Vol 4552, pp.280-285
Image Matching and Analysis. Bir Bhanu Ed. Sept.2001.
194
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Peitgeii, 1986]
H.O.Peitgen y P.H Richter.Tfte Beauty of Fractals .-Images of Complex Dynamic
System. Springer-Verlag, Berlin, 1986.
[Peszynska, 1996]
M. Peszynska. Finite element approximation of diffusion equations with
convolution terms. Math. Comp., Vol. 65, pp. 1019-1037, 1996.
[Pineiro, 2001]
J.A Pineiro. J.D.Bruguera y J.M.Muller. Faithful powering computation using
table look-up and a fused accumulation tree. Proc. of the 15th International
Symposium of Computer Arithmetic (ARITH'15), 2001.
[Pineiro, 2002a]
J.A. Pineiro, M. Ercegovac y J.D. Bruguera. High-Radix Logarithm with
selection Rounding. IEEE International Conference on Application-Specific
Systems, Architectures, and Processors (ASAP'02), p-101, July 2002.
[Pineiro, 2002b]
J.A. Pineiro, J.D. Bruguera. High-Speed Double precision Computation of
Reciprocal Division, Square Root and Inverse Square Root. IEEE Transactions
on Computers, vol.51, n 12, pp.1377-1388, 2002.
[Pineiro, 2003]
J.A Pieiro.M.D Ercegovac y J.D.Bruguera. High-Radix Iterative Algorithm for
P owering Computation. Proceedings of the 16th IEEE Symposium on
Computer Arithmetic. June 2003.
[Porter, 1979]
T.Porter. The shaded Surface Display of Large M olecules. SIGGRAPH
79.pp.234-36.
[Prusinkiewicz, 1988]
P. Prusinkiewicz, A. Lindenmayer y J. Hanan. Developmental Models of
Herbaceous Plants for Computer Imagery Purposes, pp.141-150. SIGGRAPH
1988.
[Quach y Flynn, 1990]
N.T.Quach, M.J. Flynn. An improved algorithm for high-speed floating-point
addition. TR CSL-TR-90-442. Computer System Laboratory, Stanford
University. 1990.
[Quach y Flynn, 1992]
N.T.Quach, M.J. Flynn. High-speed addition in CM OS. IEEE Transactions on
195
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
Computers. Vol. 41, n 12. December, 1992.
[Rabiner, 1975]
L.R Rabiner and B. Gold. Theory and application of digital signal processing.
Prentice -Hall, Englewood Cliffs, NJ, 1975.
[Rail, 1964]
W. Rail. Neural Theory and Modeling. R. Reiss Ed.pp.73-97. Stanford
University Press. 1964.
[Rail y Sheperd, 1968]
W. Rail y G. Sheperd. Journal of Neurophysiology n 31, pp.884-915.
[Ramn y Cajal, 1894]
S. Ramn y Cajal. New Ideas on the Strcture of the Nervous System in M an and
Vertebrates. Bradford Books. MIT Press. 1894.
[Randi, 2000]
T. Randi An Architectural P erformance Study of the Fast Fourier Transform on
vector IRAM . Technical report n UCB/CSD-00.1106 Computer Science
Division. University of California, Berkeley. June 2000.
[Sez et al. 1998]
E.Sez, . et al. FP GA implementation of a variable precision CORDIC
processo". 13
th
Conf. on Design of Circuits and Integrated Systems
(DCIS'98).pp. 604-609. Madrid.Nov. 1998.
[Snchez et al., 1997]
M. Snchez, J.Lpez, O, Plata, E.L.Zapata. An efficient Architecture for the in-
place Fast Cosine Transform. Proceedings of IEEE International Conference on
Application-Specific Systems, Architectures and Processors.pp 499-508.
Zurich. July 1997.
[Schmookler, 2001]
M.S. Schmookler y K.J Nowka. Leading zero anticipation and detection-a
comparison of methods. Proceedings of the 15th IEEE Symposium on
Computer Arithmetic, June 2001.
[Schulte, 1994]
M.J. Schulte y . Schwartzlander. Hardware Designs for Ex actly Rounded
Elementary Functions. IEEE Transactions on Computers, vol 43, n 8, pp 964-
972. August 1994.
196
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Schulte, 1997]
M.J.Schulte y J.E.Stine. Accurate function approximations by symmetric table
look-up and addition. 11
th
International Conference on application-specific,
systems, architecture and processors, 1997.
[Schwarz, 1996]
E.M. Schwarz. Rounding for Quadratically Converging Algorithm for Division
and Square Root. Proceedings of the 29th ASILOMAR, IEEE 1996.
[Schwarz, 1999]
E.M. Schwarz y C.A Krygovski. The S/390 GS Floating-P oint. IBM Journal of
Research and Development, vol 43 n 5/6. 1999.
[Schwarz, 2003]
E.M. Schwarz. P anel: Revisions to the IEEE 754 Standard for Floating-P oint
Arithmetic. Proceedings of the 16th IEEE Symposium on Computer Arithmetic
June, 2003.
[Seeger, 1996]
A. Seeger. Singular integral operators with rough convolution kernels. J. Amer.
Math. Soc, Vol. 9, pp. 95-105, 1996.
[Seidel, 2001]
P.M.Seidel, L.D.McFearin, D.W.Matula, Binary M ultiplication Radix-32 and
Radix-25 Proceedings of the 15th IEEE Symposium on Computer Arithmetic
June, 2001.
[Serra, 1965]
J. Serra. L 'analyse des textures par la gomtrie alatoire. Compte-rendu du
Comit Scientifique de l'IRSID.
[Serra, 1969]
J. Serra. Introduction la M orphologie M athmatique. Cahiers du Centre de
Morphologie Mathmatique.Booklet n 3. 160 pp. E.N.S.M.P.
[Serra, 1978]
J. Serra y R. Miles En matire d'introduction.. In "Buffon Symposium".
Lecture Notes in Biomathematics. Springer-Verlag, 1978.
[Serra, 1989]
J. Serra. Image Analysis and M athematical M orphology. Vol.1.Academic Press.
1989.
197
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Shin y Jeon, 2000]
. Shin y H. Jeon. High-speed complex -number s based on redundant binary
representation of partial products. International Journal of Electronics, vol. 87,
n 6. 2000.
[Shankar, 1990]
R.V.Shankar y . Asokan. A parallel implementation of the Hough Transform
method to detect lines and curves in pictures. IEEE 32th Midwest Symp. On
Circuits and Systems, pp. 321-324, 1990.
[Sherstyuk, 1999]
A. Sherstyuk. Kernel functions in convolution surfaces: a comparative analysis.
The Visual Computer, Vol. 15, pp. 171-182, 1999.
[Shor, 1994]
P.Shor. Algorithms for quantum computation: Discrete logarithms and
factoring. Proceedings of 35
th
Annual Symposium on Foundations of Computer
Science, 124. Los Alamos, CA, 1994. IEEE Press.
[Shor, 1995]
P.Shor. Scheme for reducing decoherence in quantum computer memory.
Phys.Rev. A, 52:2493-2496, 1995.
[Simon, 1996]
B. Simon. Representations of finite and compact groups. American
Mathematical society 1996.
[Smith, 1984]
A.R. Smith. P lants, Fractals and Formal Languages, pp. 1-10. SIGGRAPH 84.
[Sol,1994]
R.V. Sol y O Miramontes. Information at the edge of chaos in fluid neural
networL. Elsevier Science B.V., Amsterdam. 1994.
[Sol, 2001a]
R.V. Sol, Complex Systems: Chaos and Beyond SI AM review 43, 738-740-
2001 .
[Sol, 2001b]
R.V. Sol y J.M
a
Montoya. Complexity and Fragility in Ecological
AfeiworfeProceedings of the Royal Society of London 268, 2039-2045, 2001.
[Sol, 2003]
198
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
R.V. Sol y S. Valverde Information theory of complex networks
Networks: Structure, Dynamics and Function, Lecture Notes in Physics,
Springer-Verlag, 2003.
[Sol et al, 2003a]
R.V.Sol, B.Luque y S.Kauffman Order and chaos in random genetic networks
with multiple states International Journal of Bifurcations and Chaos 2003.
[Sol et al, 2003b]
R.V. Sol, J.M Montoya, R.Ferrer y J. Escoda Universality and evolution in
complex biological networks Trends in Ecology and Evolution 2003.
[Song, 1991]
P.Song, G. De Michelli. Circuit and Architecture Trade-Offs for High Speed
M ultiplication. IEEE J.Solid State Circuits, vol. 26, n 9, Septiembre, 1991.
[Stalling, 1995]
D. Stalling, H.C. Hege. Fast and Resolution IndependentLine Integral
Convolution , Proc. ACM SIGGRAPH, pp. 249-256, 1995.
[Steane, 2001]
A.M. Steane y D. M. Lucas Quantum Computing With Trapped Ions, Atoms and
Light. Fortschritte der Physik special issue . October 2001.
[Steffen et al., 2003]
M. Steffen; W. van Dam;T. Hogg; G. Breyta y I. Chuang Experimental
Implementation of an Adiabatic Quantum Optimization Algorithm Physical
Review Letters, vol 90, 2003.
[Stelling et al., 1998]
P.F. Stellin, C.U. Martel, V.G. Oklobdzija, R.ravi. OptimalCircuits for parallel
M ultipliers. IEEE Transaction on Computers, vol.47, n3. March, 1998.
[Strettoi, 2004]
Enrica Strettoi, Alan J. Mears y Anand Swaroop. Recruitment of the Rod
P athway by Cones in the Absence of Rods J. Neurosci., August 2004.
[Suga, 1990]
Suga, N. Cortical computational maps for auditory imaging. Neural Networks,
3,3-21-1990.
[Sural, 2001]
199
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
S.Sural y P.K.Das. A genetic algorithm for feature selection in a neuro-fuzzy
OCR system. Sixth International Conference on Document Analysis and
Recognition, pp. 987-991. Seattle, 2001.
[Swartzlander et al, 1993]
E.E. Swartzlander y DVS Chandra. Sign/logarithmic arithmetic for FFT
implementation. IEEE Trans, on Computers, vol 32. n 6 pp. 526-534. June
1983.
[Swarztrauber, 1987] Multiprocessor FFTs, P.N. Parallel Computing n5,
pp.197-210, 1987.
[Takagi et al, 1985]
. Takagi, H. Yasuura y S. Yajima. High-speed VLSI multiplication Algorithm
with a Redundant Binry Addition Tree. IEEE transaction on Computers, vol C-34
n9. Sept., 1985.
[Takagi y Horiyama, 1999]
N. Takagi y T. Horiyama. A High-Speed Reduced-Size Adder Under Left-to-
Right Arrival. IEEE Transactions on Computers, vol 48 n 1. January 1999.
[Takagi, 2001]
N. Takagi A Hardware Algorithm for Computing Reciprocal Square Root
Proceedings of the 15th IEEE Symposium on Computer Arithmetic. June, 2001.
[Tan, 2003]
D Tan; A. Danysh y M. Liebelt. Multiple-precision fix ed-point vector multiply-
accumulator using shared segmentation. Proceedings of the 16th IEEE
Symposium on Computer Arithmetic. June, 2003.
[Tandon, 1983]
Tandori, The life and works of Lipt Fejr, Functions, series, operators,
Colloq. Math. Soc. Jnos Bolyai 35 (Amsterdam-New York, 1983), 77-85.
[Tchebychev, 1890]
P. Tchebychev Sur deux thormes relatifs aux probabilits. Acta. Math., t
XIV,pp.305-315. 1890.
[Temperton, 1991]
C. Temperton, Self-sorting in-place fast Fourier transforms. SIAM J.Sci.Stat.
Comput, vol 12 n4, pp.808-823, 1991.
[Tenca y Ercegovac, 1998]
200
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
A.F.Tenka, M.D. Ercegovac. On the Design of the High-Radix On-Line
Division for Long P recision.
[Tezmol et al., 2002]
A.Tezmol, H. Sari-Sarraf, S. Mitra. Customized Hough Transform for Robust
Segmentation of Cervical Vertebrae from X-Ray Images. Fifth IEEE Southwest
Symposium on Image Analysis and Interpretation, Santa Fe, New Mexico, April
2002.
[Traub, 1991]
RD Traub y R.Miles R In: Neuronal networL of the hippocampus. Cambridge,
UK: Cambridge UP, 1991
[Ueki et al, 2003]
T. Ueki, M. Tanaka, . Yamashita, S. Mikawa, Z.Fu Qiu, N. J. Maragakis, R. F.
Hevner, N. Miura, H. Sugimura y . Sato. A Novel Secretory Factor,
Neurogenesis 1, P rovides Neurogenic Environmental Cues for Neural Stem
Cells in the Adult Hippocampus. J. Neuroscience December 2003.
[Um y Kim, 2001]
J.Um y T.Kim. An optimal Allocation of Carry-Save Adders in Arithmetic
Circuits. IEEE Transactions on Computers, vol 50 n 3. March 2001.
[Van Dalen, 1972]
D. Van Dalen y A.F. Monna. "Sets and Integration ". Wollers-Noordhoff, 1972.
[Van Dam, 2002]
W. van Dam, Quantum algorithms for weighing matrices and quadratic
residues, Algorithmica 34, 413-428. 2002.
[Villalba, 1995 ]
J. Villalba, J. Diseo de Arquitecturas CORDIC multidimensionales. Tesis
Doctoral Dept. de Arquitectura de Computadores. Universidad de Mlaga,
Nov.1995.
[Villaba,1996 et al]
J. Villalba, J., E. Antelo, J.D.Bruguera, E.L. Zapata. Unified CORDIC
architecture in redundant arithmetic. Technical report. Universidad de Santiago
de Compostela, Grupo de Investigacin de Arquitectura de Computadores.
December 1996.
[Villaba,1998]
201
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
J.Villalba, T.Lang, E.L. Zapata, P arallel compensation of scale factor for the
CORDIC algorithm. Journal of VLSI Signal Processing Systems for Signal,
Image and video technology, vol. 19 n 3, pp. 227-241, August 1998.
[Voider, 1959]
J.E. Voider. The CORDIC trigonometric computing technique. IRE Trans.
Elect. Comput, vol EC- 8 pp. 330-334. Sept. 1959.
[Volterra, 1913]
V. Volterra. Leons sur les fonctions de lignes. Gauthier- Villars, 1913.
[Voss, 1987]
R.Voss. Fractal in Nature. Characterization, M easurement and Simulation. En
Course Notes 15 for SIGGRAPH 87. Anaheim. California. 1987.
[Wallace, 1964]
C.S. Wallace. A Suggestion for a Fast M ultiplier. IEEE Trans. Computers,
vol.13, n 2. February, 1962.
[Walther, 1971]
J.S Walther. A unified algorithm for elementary functions. Proc. Spring. Joint.
Comput. Conf., pp379-385, 1971.
[Wang, 1996]
S.Wang y V.Piuri A unified view of CORDIC processor design. Application
Specific Processors, edited by Earl E. Schwarzlander, Jr, Ch.5, pp 121-160,
Kluwer. Academic Press, November 1996.
[Weinberger, 1981]
A Weinberger. 4:2 Carry-Save M odule. IBM Technical Disclosure Bull, vol.
23. January 1981.
[Weyl, 1927]
H. Weyl. y F.Peter. Die Vollstndigkeit der primitiven Darstellungen einer
geschlossen kontinuierlichen Gruppe. Math.Ann. t. XCVII. pp.737-755, 1927.
[Wheeden, 1977]
R.L. Wheeden,.A. Zygmund. M easure and Integral. Marcel Dekker, Inc. New
York. 1977.
[White, 1989]
S. A. White, Applications of Distributed Arithmetic to Digital Signal
P rocessing: Tutorial Review. IEEE ASSP Magazine, pp. 4-19, July 1989.
202
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
Williams et al, 1995]
T.E. Williams, M.A. Horowitz. A zero- overhead self-timed 160 ns 54-bit
CM OS divider. IEEE Solid-State Circuits, vol 26, n 11. Nov. 1995.
[Wiswman, 2000]
H.M. Wiseman y B.L. Hollis, Space-bounded computation: quantum is better
than classical, LANL Preprint quant-ph/0009054. 2000.
[Wissam, 1996]
Rabadi Wissam Iterative multiresolution algorithm for image
reconstruction from the magnitude of its Fourier transform. A. Texas
Instrument Inc.; University of Central florida. Optical Engineering
35(04), 1015-1034. Brian J. Thomson Ed. April. 1996.
[Wong, 1994]
W.F. Wong, E. Goto. Fast Hardware-Based Algorithms for Elementary Function
Computations Using Rectangular M ultiplier. IEEE Transaction on Computers,
vol. 43, no 4, pp. 278-294. 1994.
[Yamazava, 2000]
K.Yamazawa; Y.Yagi y M. Yachida. 3d Line Segment Reconstruction by Using
Hyperomni Vision and Omnidirectional Hough Transforming. ICP R00, Vol III:
487-490, 2000.
[Ye, 2002]
P.Ye, The Approximation Theorem of Convolution Operator in Ap Set-valued
Function Space, Acta Mathematicae Applicatae Snica, Vol. 18-3, pp. 495-500,
2002.
[Yeh, 2000]
W.Yeh y C. Jen. High-Speed Booth Encoded P arallel M ultiplier Design. IEEE
Transactions on Computers, vol.49, n 7. July 2000.
Enlaces
La norma IEEE-754: http://cch.loria.fr/documentation/IEEE-754/index.html
Online Symposium for Electronics Engineers: http://www.osee.net.
203
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Volver al ndice/Tornar a l'ndex

También podría gustarte