Documentos de Académico
Documentos de Profesional
Documentos de Cultura
,
2
,,
(1
} el dominio, esto es, el conjunto de funciones que evala,
= \
,
2
,,
e (D
s
D
t
), 3/t
y
, X
k
I S = eval(U,
}
) = evalTl, X
k
)
eval(Tl,j)&D
S
,eval(T,
k
) e D,
La ordenacin de los niveles derivados induce una clasificacin en los
elementos del conjunto de manera que una regla de derivacin podr
expresarse como una funcin de otras reglas de derivacin que intervienen en la
evaluacin de las funciones de los dominios inferiores
V
k
/eval(n,
k
) = j eDj
X
k
= q>(^, X
q
)/\fr,\ <r<q eval(U,X
r
) = , eD
l<i< j
34
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 1
All, , )resuelve el problema <=> 3D. c A / p e D ^
El subndice j de la expresin anterior indica el grado de derivacin que se
requiere en la arquitectura A para resolver p. Puede observarse que cuanto
menor sea j , menor ser la complejidad de la solucin al problema en trminos
de costes computacionales. En ese sentido, podr hablarse de que j expresa el
grado de especificidad de la arquitectura para la resolucin del problema.
La formulacin del problema planteado en esta investigacin, expresada en
trminos rigurosos es
encontrar una arquitectura A' de especificidad mxima para
resolver un problema determinado, p
Formalmente,
Si A'= ( ' , ' , ) / 3 ^ , e ' , 3S
h
, e >,, D
r
c , I = eval(n\
k
,) = S
h
.
y A"= (
( X) = ^(b
k
-a
k
)
k
Si X' es un conjunto cerrado X'= [a,b\-2_j (a
k
,b
k
) , la medida de Lebesgue
es ^ ) ^ - a) ~Y
u
{b
k
- a
k
).
k
La medida de Haar:
es una manera de asignar un volumen invariante a los subconjuntos de grupos
topolgicos localmente compactos. Si G es un grupo topolgico localmente
compacto podemos considerar la -lgebra X generada por todos los
subconjuntos compactos de G. Si a es un elemento de G y S es un conjunto en
X, entonces el conjunto aS = {as/ s e Sj (donde la multiplicacin es la
operacin en G) est tambin en X. Una medida en X se llama invariante por
traslacin izquierda si ( ) = ( ) para todo a y S.
Se verifica que hay, salvo una constante multiplicativa, slo una medida
invariante por traslacin izquierda en X, que sea finita en todos los conjuntos
compactos. sta es la medida de Haar en G. (hay tambin una medida invariante
por traslacin derecha, esencialmente nica en X, pero las dos medidas no
necesitan coincidir). La medida de Haar en el grupo topolgico (R,+) que toma
el valor 1 en el intervalo [0, 1] es igual a la medida de Borel. Esto puede
generalizarse para (R
n
, +).
La medida expresada en trminos de integral. Ejemplos.
Si A = C
K
, siendo C
K
el conjunto de las funciones ; R R que cumplen
dos condiciones fundamentales, que son, anularse fuera de un intervalo que
45
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
depende de la funcin particular y ser continuas en R, entonces la funcin es
no negativa si (t) >0, VteR.
En este caso, la aplicacin lineal : C
K
* R, del espacio de las funciones
continuas con soporte compacto en el cuerpo R de los nmeros reales, tal que
() >0 para no negativa, es una medida.
Puesto que toda funcin continua de soporte compacto es integrable, una forma
de concretar el funcional asociado con la medida es por medio de una
integral, [Wheeden, 1977], en esta integral, la funcin ^representa la
"densidad" de la medida.
( , )= [
Se citan algunos ejemplos de medidas definidas en trminos de integrales:
La medida de Lebesgue [Bartle, 1995]
se construye a partir del funcional aplicando la integral de Riemann
{M ><P )= [< = l< P
dx
La medida delta de Dirac
Sea r un nmero real. La frmula
( , ) = ( )
define una medida T=5(/")> 1
u e s e
denomina delta de Dirac y que sirve para
establecer un modelo matemtico para un impulso.
La medida de Haar
Usando el enfoque general de la integracin de Lebesgue, se puede definir una
integral para todas las funciones medibles f. G > R (o C), llamada la integral
de Haar. Esta definicin es el primer paso del anlisis armnico.
46
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
Esta relacin establece una correspondencia biunvoca entre las clases de
funciones medibles sobre todo compacto y sus medidas asociadas, circunstancia
que se aprovecha para efectuar una identificacin formal de ambos objetos.
Cabe subrayar que, en este contexto, el concepto de medida no es una simple
generalizacin del concepto de funcin, sino una generalizacin de las clases de
funciones medibles sobre compactos.
Ampliacin del concepto de medida: la medida producto
Si se quiere construir una -lgebra y una medida en el producto
=
\\E de una familia de espacios de medida (E
t
A, ,) para i eN, es
necesario considerar la integracin del espacio de medida producto en relacin
con la integracin en los espacios factores. El teorema de la medida producto
resuelve la cuestin segn dos planteamientos, uno de carcter geomtrico y
otro de carcter probabilstico [Parthasaraty, 1980]. A continuacin se presentan
los dos planteamientos para i=2.
La versin geomtrica del teorema enuncia que dados dos espacios de medida
(E-i, A-i, ) y ( -, A2, ), existe una nica medida en A-i A2 tal que para
cada A e Ai y e A
2
( xB) = ,( )
2
( ) (2.2)
47
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
La aplicacin ms familiar e inmediata de esta idea es el clculo del rea de un
rectngulo. Se considera el plano real RxR como producto de dos rectas reales
R y el clculo de reas de figuras planas se obtiene a partir del clculo de
longitudes de segmentos 1112. As:
m
2
[a, b]x[c, d]) = m, ([a, b]) m, ([c, d])
de modo que la medida de Lebesgue del plano, m2, es en cierto sentido el
producto de dos copias de mi, siendo esta ltima la medida de Lebesgue de la
recta.
La segunda construccin es de naturaleza probabilstica. En este caso, el
teorema enuncia que partiendo de un espacio de medida ( , Ai //]), un espacio
medible (E2, A2) y una medida de transicin definida de A2 en [0, 00 [, se
construye una medida en A2 tal que para cada A e Ai y Be A2.
= \
Y adems, para cada C e A2
( >= JA(x,C
x
)dft
La formalizacin sera dual para (E2, A2 /2) como espacio de medida, ( , Ai)
espacio medible y medida de transicin definida de E2 x Ai en [0, 00 [.
La idea es la del experimento compuesto. Suponiendo un experimento en el que
se realizan dos observaciones, la primera x-i est en E-\ y la segunda X2 en E2.
La probabilidad de que la primera caiga en un conjunto A de Ai es /( ) y una
vez hecha la observacin x? , la probabilidad de que la segunda caiga en un
conjunto de A2 es 2( , ). Entonces, la probabilidad de que la observacin
(Xi, X2) caiga en A es:
( )=
2
(
, )
]
(
2
3
)
JA
48
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
/ * g(x) = l f(y)g(xy-
1
)dm(y) (
2
4
)
Comparando (2.1), (2.3) y (2.4), la convolucin as definida aparece como una
integral de medida en la cual una de las funciones acta como densidad de
medida mientras que la otra es la funcin a medir. La funciones f y g son
intercambiables.
Para las funciones discretas hay que formular la convolucin como sigue:
/ * g(m) = f(n)g(m - n) (
2
5
)
En (2.5) los papeles desempeados por las funciones f y g siguen siendo
idnticos e intercambiables pero la interpretacin de elemento unitario sustituye
a la de densidad de medida.
3.2 Teora de representacin de grupos
La teora de la representacin de grupos tiene por objeto la construccin de una
aplicacin entre un grupo y alguna otra estructura que permita establecer
correspondencias tiles entre elementos y operaciones, con el fin de trasladar
problemas hacia la estructura mejor entendida para resolverlos con ms
49
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
facilidad [Fulton, 1991]. Esta teora no es uniforme ya que depende del tipo de
grupo elegido (finito, compactos o localmente compactos, de Lie, ....) [Brocker,
1985] y de la estructura "blanco" (grupos de permutaciones, grupos de matrices
sobre algunos cuerpos o, ms generalmente, grupos de transformaciones
lineales invertibles de un espacio vectorial,...). Hay que destacar que muchos de
los resultados de la teora de representacin de grupos finitos son probados para
grupos topolgicos compactos o localmente compactos, haciendo un promedio
sobre el grupo [Simon, 1996]. Estas pruebas pueden transportarse a los grupos
infinitos si el promedio es sustituido por una integral conveniente. Un ejemplo
conocido lo constituyen los grupos localmente compactos, usando la medida de
Haar. La teora que resulta es una parte central del anlisis armnico que
generaliza las nociones de series de Fourier y transformadas de Fourier a una
transformacin de funciones definidas sobre grupos localmente compactos. Para
grupos compactos, se pueden conseguir armnicos extrayendo una
representacin irreducible de cada clase de equivalencia de representaciones.
Esta eleccin de armnicos goza de algunas de las propiedades tiles de la
transformada de Fourier clsica, como por ejemplo la de cambiar convoluciones
por productos escalares.
Representacin lineal: definicin y ejemplos.
Una representacin de un grupo finito G es un homomorfismo de grupo, p, de G
en el grupo lineal GL(V) donde V es un espacio vectorial de dimensin
definido por:
V(g, v) e Gx V,g.v = p(g)(v)
Algunos ejemplos de representaciones lineales habituales son:
Representacin trivial
50
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
Vs e G,p(s) = Id
v
Representacin regular
Dado un espacio vectorial de dimensin [ G I se considera una base
= {e
h
} con h s G. Para s e G se define p(s)e GL(V) por p(s)(eh) = e
s
/ que
corresponde a una permutacin de las coordenadas
Representacin suma
Dadas dos representaciones \ y sobre Vy W respectivamente, se define la
representacin 2 sobre GL(V, W) por
V(v, w) G GL(V, W),p
x
p
2
(g)(v + w) =
P l
(v) + p
2
(w)
Representacin producto
Dadas dos representaciones i y
2
sobre Vy W respectivamente, se define la
representacin
V
0wsobre G,(T, W) por
V / e G L ( F , f ) , p ^ ( g X / ) = p
2
( g ) o / o
y 0
1
( g -
1
)
Considerando la representacin regular, aparece que el nmero total de las
permutaciones de los vectores de la base es igual al nmero de elementos del
grupo G. As, cada elemento del grupo G se regulariza sobre un elemento de
GL(V), esto es, sobre una permutacin.
51
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
3.3 Planteamiento del CBRM
Despus de poner de manifiesto que la convolucin es una operacin entre dos
funciones que representa la evaluacin de una de ellas tomando la otra como
unidad, se conviene en dar a esta evaluacin el calificativo de estructural debido
a que se realiza por comparacin con una referencia de la misma naturaleza que
la funcin evaluada. La posibilidad de regularizar la convolucin sobre otra
operacin, como sugiere la teora de representacin, permite sustituir la
evaluacin estructural por esta segunda operacin, que recibir el nombre de
evaluacin no estructural, porque en este caso no se necesita comparacin con
ninguna referencia.
La razn de este planteamiento es crear el marco formal adecuado para evaluar
por convolucin pero con menor coste computacional del que sta ocasiona. La
evaluacin estructural de funciones del tipo h(k) = h(k)*5(k) se caracteriza
generalmente por un alto nivel de derivacin, debido a que el nmero de
operaciones primitivas, suma y multiplicacin, que hay que realizar crece con la
complejidad de la funcin h(k). Adems, la determinacin de la cascada de
operaciones a realizar requiere cierto empirismo ya que depende del mtodo de
clculo empleado. La diversidad de mtodos de clculo puede ocasionar, adems,
gran diversidad en los mecanismos de derivacin. Este tipo de evaluacin
aparece, por tanto, como poco sistemtico, casi con cierto carcter artesanal. La
evaluacin estructural del tipo h(k) =f(k)*g(k) tiene una complejidad 0(n
2
) con
respecto al nmero de puntos a calcular porque slo tiene el coste de
combinacin, aunque requiere el conocimiento previo de las funciones que
intervienen, f(k) y g(k). Sin embargo el coste sigue siendo alto debido a que la
secuencia de operaciones a realizar crece a medida que aumenta n. De estas
consideraciones se desprende que la mejora puede venir por la va de rebajar el
coste de combinacin, reutilizando los resultados previos de la convolucin en los
52
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
4 Desarrollo formal del CBRM
<Fx<F R x R x
eval
1
(F regularizacin G
<
Fig 2.1 Planteamiento formal del CBRM
Sea (Fel conjunto de funciones discretas de variable discreta definidas en R. Sea
la aplicacin eval:
inv
evaL
53
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
evah :TKT
(f, g) eval, (f,g)= e
V
al
l
(g,J) = f*g=g*f (2.6)
evalj define la convolucin como una operacin entre dos funciones discretas,
que representa la evaluacin de una de ellas tomando la otra como unidad
(expresin (2.5)).
Se puede demostrar que ( , *) es un grupo abeliano.
Sea el conjunto de funciones definidas de en R
F: R
i F
Se define <z de la manera siguiente:
Fe <^>3 (a, ) e R,3 G e tales que
F^aFi.j + fiGt.,
( , +, ) es un espacio vectorial sobre R para cada par (a, )
Se define la aplicacin eval
2
:
eval
2
:RxRx '
(a, , G) ewl
2
(a,fi,G)=F (2.7)
54
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
Se define ahora la aplicacin de (F (Fen R R x de la manera siguiente:
: Rx Rx
(f,g) ( , ) = ( , 0) (2-8)
tal que, Vy , [ c R , 3 i eN / f*g(y) = F = aF^+fiG,
Condicin necesaria para la regularizacin de la convolucin sobre la
frmula recursiva
La restriccin expresada en (2.8) de que todos los valores de una convolucin
encuentren igualacin con valores sucesivos de una funcin evaluada
iterativamente, F, es la condicin necesaria para regularizar la convolucin y, de
esta manera, poder contar con una evaluacin de tipo no estructural, basada en la
evaluacin estructural que proporciona la convolucin. Las condiciones bajo las
cuales se establece dicha igualdad son relevantes en cuanto al alcance de la
evaluacin no estructural inducida. A continuacin se detalla el desarrollo de
estas condiciones.
Sea el desarrollo formal de la convolucin de dos funciones, / y g, pertenecientes
& . Se realiza a partir de un punto inicial, x , del intervalo [ , [c R, con un paso
he R.
55
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
Los kprimeros valores de la convolution/*g son:
f*g(x) = f(x)g(x)
f*g(x + h) = f(x)g(x + h) + f(
X
+ h)g(h)
f
* g ( x
+
k
h )
=
f i
x M
X
+ m
+
f (
X +
h M
X
H k - m
+
+f{x+{k-\)h)g{x+h)+f(x + kh)g{x)
y
'
f*g(x + kh) = / ( * + ph)g(x + (k- p)h)
/7 = 0
Se puede modificar este desarrollo haciendo que aparezca la derivada de alguna
de las dos funciones. En (2.10) aparece la derivada de la funcin / entre
parntesis. Como las dos funciones son intercambiables en relacin con el papel
que desempean, se puede llegar a una expresin anloga a (2.10) en la que
aparece la derivada de la funcin g.
f*g(x) = f{x)g{x)
f*g(x + h) = f*g(x) + hg(x) / ( * + *>-/(*> + f
(x)g(x
+
h)
h
h
1 , ,^f{
X +
h)-f{x) r,
, ~,x
+ hg(x + h) - ^- ^ + f{x )g{x + 2h)
.f*g(x
+
kh) = f*g(x Hk-l)h)
+
hg
{
x )
f
(
x + kh)
-f}
x +
(
k
-V
h
.
.
+
hg(x
+
(k~l)h)
f(X + h)
-
f(X
hf(x Mx
+
kh) (
2
10
)
f*g(x + kh) = f* g(x + (k~ \)h)+h g{x + P h)f (x + (k- p)h)
+ f(x )g(x + kh)
p=k~\
p=0
56
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
La expresin obtenida en (2.10) ha de igualarse con la funcin recursiva dada
por la ecuacin (2.8), F = aF.i+ /?G,-./
Para ello se propone:
hacer 0
hacer h = 1
hacer / = k
As, se asimilan
f*g(
x +
kh) con F i
p= k - \
pG. con h 'Y
j
g{x + ph)f{x + {k-p)h) + f(x)g(x + kh)
p= 0
La interpretacin de la regularizacin propuesta es la siguiente:
El argumento inicial, e R, para el cual se evala la convolucin se
regulariza sobre el ndice inicial de la frmula recursiva, F, que es el cero.
Elegido el paso h e R con el cual se evala la convolucin, se regulariza
ste sobre el paso de la frmula recursiva, F, que es 1.
Con estas dos regularizaciones, el nmero de iteracin de la convolucin y
de la frmula recursiva coinciden, permitiendo confundir en todo lo que
sigue las expresiones f*g(k) y F
k
para simplificar la escritura.
El parmetro a que interviene explcitamente en (2.8) ha sido aadido a fin de
recoger la posibilidad de que, entre los factores que intervienen en la parte del
sumatorio, alguno pueda contener de forma implcita el trmino f*g(x + kh) y
dar lugar a factorizacin (ver Tablas 2.1 y 2.2).
Condicin suficiente para la regularizacin de la convolucin sobre la
frmula recursiva
57
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
La condicin suficiente para la regularizacin de la convolucin est
relacionada con la posibilidad de encontrar la inversa de la funcin . Ello
significa que, dada una forma recursiva del tipo (2.8), se pueda encontrar un par
de funciones/y gcuya convolucin tenga la forma (2.8).
Sea una funcin recursiva Y
h
del tipo (2.9).
Entonces Y cumple:
Jo
+
0
^^ ^+ ^
( 2
)
Y,=aY
t
_
x
+fiZ
t
_
x
Y
M
=aY
i+
,
Siendo , diferentes de cero y Z una funcin auxiliar
Sustituyendo el valor de Y en la ltima ecuacin de (2.11) por su valor, que
expresa la penltima ecuacin y remontando hasta la primera ecuacin aparece
el desarrollo de la convolucin de dos funciones/y g sin ms que identificar:
/ ( / ) = '
g ( 0 = &
( 212)
g ( 0) = r
0
Si a /?son iguales a cero, las ecuaciones (2.11) se simplifican. En estos casos,
las expresiones defy g son:
58
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
a=0 =
f(i) = () f(i) = S(i)
g(i) = pz
i
_
x
g() = a'g ( 0)
g(0) = Y
0
g(0) = Y
0
Por tanto, cualquier funcin desarrollada bajo la forma recursiva (2.11) puede
representar la convolucin de dos funciones/y g. En los casos descritos por las
ecuaciones (2.13), se tiene una convolucin trivial, ya que una de las funciones
que intervienen es la delta de Dirac.
Esta propuesta de regularizacin no es nica, como tampoco lo es la forma de
modificar el desarrollo (2.9), que conduce a la expresin (2.10). Otras
modificaciones pueden conducir a formas recursivas de la convolucin en las
que aparecen no slo el valor en la iteracin anterior sino otros valores
anteriores o incluso todos los valores anteriores a la iteracin considerada. No
se considera en este trabajo de investigacin ms que una de las posibles
regularizaciones de la convolucin, quedando las dems como lneas de
investigacin futuras.
5 Aplicacin del CBRM
Las bases establecidas en el apartado anterior permiten desarrollar un mtodo de
evaluacin no estructural, CBRM, vlido para un conjunto amplio de funciones,
que ha de culminar con la definicin de unas primitivas. Importa, para ello,
concretar la correspondencia entre las caractersticas de las funciones f, g y los
parmetros de regularizacin de la convolucin, a, , G. El desarrollo de la
convolucin dado por la ecuacin (2.10) puede simplificarse notablemente para
59
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
algunos tipos de funciones usuales, obtenindose un patrn de construccin de
la evaluacin no estructural muy sencillo, a la medida de esas funciones. Es
interesante considerar estos casos que, aunque correspondan a
particularizaciones del caso general, tienen gran utilidad por ser casos muy
frecuentes.
Cuando una de las dos funciones de la convolucin es del tipo potencial,
por ejemplo, f(x + kh) =K
x+kh
, la expresin recursiva (2.10) se transforma
en:
f*g(x + kh) = K
h
.fg(x +(k-l)h) + K
x
. g(x+kh)
que es la frmula recursiva (2.7) con a -
,
, = K
x
,G=g(x +kh)
Cuando una de las dos funciones es constante, por ejemplo f(x + kh) = M,
f'(x + kh) =0 y los trminos del sumatorio de la expresin (2.10) se anulan;
la frmula resultante es:
fgfx + kh) ~f*g(x+(k-l)h) +M g(x+kh)
que corresponde a a=\, =M,G = g(x +kh)
Cuando una de las dos funciones es lineal, por ejemplo f(x +kh)= p(x +kh),
los trminos del sumatorio de la expresin (2.10) son todos iguales a la
pendiente de la recta, esto es, aph. La expresin resultante es entonces:
f*g(x + kh) =.fg(x +(k-l)h) +ph [g(x)+g(x+h)+ + g(x+(k-l)h)]
k - \
que corresponde a a = 1, P =ph, G - ^ g(x + jh)
y=0
60
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
Estos tres casos permiten abordar de manera muy sencilla la evaluacin
recursiva de un gran nmero de funciones. De la aplicacin de las
simplificaciones anteriores se deriva la posibilidad de sistematizar la
evaluacin, construyendo una "tabla de equivalencia" que facilita
automticamente la frmula recursiva que corresponde a una evaluacin por
convolucin dada. Al consultar dicha tabla, se encuentran para cada par (f ,g)
los valores ( , , ) que corresponden. La Tabla 2.1 muestra estas
correspondencias para algunas funciones usuales. Por motivos de claridad y sin
prdida de generalidad, se han expresado las funciones considerando x=0 y h=l.
Se han elegido casos en los que, al menos una de las funciones que interviene en
la convolucin, es de las tres que proporcionan simplificacin (funcin
constante, lineal o potencial). De no ser as, se realiza la correspondencia
basndose en el caso general dado por la ecuacin (2.10).
61
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
*g(k)
f(k) = M )
f(k)=N
f(k)=qk
M )=a
k
g(k) cos k
g(k)=sen k
g(k)=Log k
g(k)=l/k
g(k) = S(k)
8(k)
qk
a
k
cos k
sen k
Logk
1/k
g(k) =M
M
a=l = G
k
=N
G
0
=MN
a=l fi=MG
k
=qk
G=0
a=a =1 G
k
=M
G
0
=M
a=l =
G
k
= cosk
G
0
=M
a=l =
G
k
= sen k
G
0
=0
= ; =
G
k
= Logk
Go=0
a=l =
G
k
= U(k-l)
G
0
=M
g(k) =pk
pk
a=l = G
k
=Nk
G
0
=0
a=J =
G
k
= qk(k-l)
2
G
0
=0
= =1 G
k
=pk
G
0
=0
= 1 =
G
k
=Zcos i
(0< i< k)
G
0
=0
= =
G
k
= sen i
(0 < i < k)
G
0
=0
a=p =
G
k
=Logk
G
0
=0
a= 1 =
^ /i
(0< i< k)
G
0
=p
g(k)=F*
K*
= =1 G
k
=N
G
0
=N
= =1 G
k
=qk
G
0
=0
= =1 G
k
=a
G=l
= =1
G
k
= cos k
G
0
=l
= = 1
G
k
= sen k
G
0
=0
a= =
G
k
= Logk
G
0
=0
= =
G
k
=i/(k-l)
G
0
=K
Tabla 2.1 Tabla de equivalencia de algunas funciones usuales
Recprocamente, se sistematiza la descomposicin de una funcin dada en
convolucin de otras dos. En la Tabla 2.2 se muestra la descomposicin de
algunas funciones usuales a partir de la forma recursiva que se les puede
asociar. Para dos de ellas, la funcin constante y la funcin potencial, la nica
descomposicin alcanzable es la descomposicin trivial.
62
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
Funciones
usuales
F(x + k h )
constante
M
lineal
m(x+kh)
exponencial
x + k h
inversa
l/(x+kh)
Raz-m-sima
^lx + k h
logaritmo
log(l+kh)
trigonomtrica
cos(x+ kh)
sen (x+kh)
hiperblica
cosh (x+kh)
senh (x+ kh)
Parmetros de la frmula recursiva
F
k
= aF
k
.,+ f i G
k
a
0
1
a
h
1
1
1
a = cos(h)
a = sen(h)
a=cosh(h)
a=senh(h)
1
h
0
-1
1
I
fi=-sen(h)
= cos(h)
= senh(h)
= cosh(h)
G
k
M
m
0
00
k=\
GO
00
,= ( * * * )
G
0
=cos /
G
k
= -sen (x +(k-l)h)
G
0
= sen /
G
k
= cos (x +(k-l)h)
G
0
=cosh /
G
k
= senh (x +(k-l)h)
G
0
= senh /
G
k
= cosh (x +(k-l)h)
Desc
conv
F
k
f(x+kh)
(x+kh)
1
(x+kh)
1
1
1
a
x +k
"
a
x +kh
a
x +kh
a
x +kh
omposicion en
olucin de dos
funciones
= f s( x + k h )
g ( x + k h )
g ( x ) = M
g ( x + k h ) = M
g ( x ) = m x
g ( x + k h ) = m h
g ( x ) = a*
g ( x + k h ) = a
x + k h
g ( x + k h ) =
00
-
k=\
g(x +kh)=
00
( * * )
k=\
g(x +kh)=
g(x )=cos X
g(x+kh))=
-fisen (x +(k-l)h)
g(x )= senx
g(x+kh) =
ficos(x +(k-l)h)
g(x )=cosh
g(x+kh)=
senh (x +(k-l)h)
g(x )= senh
g(x+kh) =
cosh (x +(k-l)h)
(*)= X[(k+1)" -k"J-h"/x "
+l
(**)= (1- )(1-2 ) (l-nm)x "^""
>/
"' f(k+l)"-k") h")]/n! m "
+/
(***) = (-1) "fk" - (k-l)"J h" /
Tabla 2.2 Descomposicin de algunas funciones usuales.
63
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
En las expresiones de F
k
de la Tabla 2.2, representa el primer valor para el cual
se calcula el valor de la funcin, h representa el paso de iteracin y & el nmero de
iteracin.
6 Primitivas y derivadas
En una metodologa de evaluacin, la propuesta de primitivas es una etapa
crucial. Conceptualmente, las primitivas son las operaciones bsicas de referencia
del proceso de evaluacin sobre las cuales se construyen los niveles de
derivacin.
En el contexto de la evaluacin no estructural, una primitiva
es una expresin
paramtrica del tipo
= af+ gdonde a,f, , gson nmeros reales.
Se define un nivel de derivacin fijando un valor inicial / =Fg e iterando la
primitiva
.,+fiG
.,
En esta derivacin a y se mantienen constantes y cada nuevo valor g = G
incorporado determina un nuevo valor F. Por tanto, se tiene
/ = 0 F
0
= 1 F, =aF
0
+ G
0
i = 2 F
2
=aF,+fiG,
64
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
El conjunto de valores F} obtenidos por clculo iterativo son puntos de la
funcin F evaluada, ordenados en el sentido creciente de las iteraciones i.
Asimismo, los valores incorporados *{ G \ son puntos de una funcin G llamada
funcin auxiliar, tambin ordenados en el sentido creciente de i.
Las funciones F son clasificables en familias. Una familia de funciones es un
conjunto de funciones que muestra un mismo comportamiento. ste viene
definido por los intervalos de pertenencia de a, y por G.
Los niveles de derivacin sucesivos se relacionan entre s por medio de la funcin
auxiliar. Suponiendo que en un nivel D de derivacin se ha evaluado una funcin
F, con los parmetros a, y la funcin auxiliar G, cualquier funcin H que se
pueda evaluar con los parmetros a', ' y la funcin auxiliar F se considerar de
nivel de derivacin D
n+
, Por tanto, al nivel de derivacin D+ le corresponden
funciones auxiliares calculadas en el nivel de derivacin anterior. Por convenio,
se puede proponer como nivel primero de derivacin D aquel en el cual las
funciones evaluadas son del tipo h(k) = h(k)*S(k) como, por ejemplo, la funcin
constante y la funcin potencial.
A continuacin se presenta un ejemplo de evaluacin no estructural que
corresponde al caso asociado a la convolucin de una funcin constante por una
funcin potencial (f(k) = a
k
, g(k) = M). Para este caso, la tabla de equivalencia da
los valores a= a, = 1 y G = M. Estudiando los intervalos de variacin de los
parmetros se ponen en evidencia distintos comportamientos que definen familias
de funciones. Posteriormente se realiza un mapa de localizacin de stas en el
cual los valores de a, y G actan como coordenadas (Fig.2.8). La Tabla 2.3
recoge la descripcin del comportamiento definitorio de cada familia.
65
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
Familia 1:
< - l
Se observa una
oscilacin divergente,
ms rpida para valores
ms negativos de a. La
amplitud es tambin
mayor para valores ms
negativos de }, pero la
influencia de /?G es ms
moderada que la de
a. (Fig.2.2)
Fig.2.2 Familia 1 ( =-1.2 , = -\2 )
Fg.2.3 Familia 2 (a = -0.9, G = -2.2)
Familia 2
- 1 < < 0
Se observa una
oscilacin convergente,
ms rpida para valores
de amas cerca de cero.
(Fig.2.3). El signo de
fija la convergencia en
torno a un valor que es
de su mismo signo. El
valor absoluto de
influye en la
amplitud de la oscilacin
y, por tanto, en el valor
de convergencia.
66
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
4 -
3,5
3
2,5
2
1,5
1 -
0,5
O^
.
- -*
'
h- O CO
co
CD CM
CM
uo
CM
CO
CM
Fig.2.4 Familia 3 ( = 0.8, = 0.7)
1,5 -
1 -
0,5 -
0
-0,5
-1 -
-1,5
-2
-2,5 J
Vt-
o
CO
CD
en
CM
-CM
m oo
Familias 3 y 4:
0 < <1
Se observa una
evolucin continua
convergente con asntota
horizontal, ms abrupta
cuanto ms se acerca a a
cero. fija la
direccin de la
evolucin, crecimiento o
decrecimiento, as como
el valor de la
convergencia. A valores
ms negativos le
corresponde un valor
ms negativo del valor
de convergencia y a
valores ms positivos un
valor ms positivo. El
cambio cualitativo entre
el crecimiento y el
decrecimiento tiene
lugar cuando se cumple
+ =1 (Fig.2.4 y
2.5)
Fig.2.5 Familia 4 (a = 0.8 G = -0.4)
67
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
4 0000000
1
35000000
30000000
25000000
20000000 -
15000000
10000000
5000000
<- t r~- o co
-
CD
/
/
/
/
J
_y
> CM in oo
*- CM CM CM
Fig 2.6 Familia 5 ( =1.8, = 0.3)
50 -,
0
-50
-100
-150 -
-200
-250
-300 -
-350
-400
-450 J
r- Tt - O (
^ > CM
^ ^ CM
-
-
in
CM
00
CM
Familias 5 y 6:
> 1
Se observa una
evolucin continua
divergente con asntota
vertical, ms abrupta
cuanto mayor es y
cuanto mayor es | \,
aunque ste influye de
forma ms moderada. El
parmetro fija la
direccin de la
evolucin, crecimiento o
decrecimiento El cambio
cualitativo de uno a otro
tiene lugar para
+a=\ (Fig.2.6 y 2.7)
Fig.2.7 Familia 6 ( =1.2, G = -1.6)
68
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 2
Familia 1
0G
Familia 2
+ =\
Fig 2.8 Mapa tridimensional de localizacin de las familias de funciones asociadas a la
convolucin de constante por potencial
Familias asociadas a la convolucin de una funcin constante por una funcin
potencial
Familia
1
2
3
4
5
6
Intervalos de pertenencia de
los parmetros
a e ] - ce , -1]
P Ge^
la e]-1,0]
PG s<K,
a e ] 0, 1 ]
a+P G > 1
a e ] 0, 1 ]
a+P G<\
a e] 1, + cc]
a+P G > 1
a e ] 1, + cc]
a+P G < 1
Comportamiento cualitativo
Oscilacin divergente
Oscilacin convergente
Crecimiento con saturacin
Decrecimiento con saturacin
Crecimiento con asntota vertical
Decrecimiento con asntota vertical
Tabla 2.3 Comportamiento correspondiente a las familias de funciones asociadas a la convolucin
de constante por potencial
69
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Mtodo de evaluacin recursiva basado en convolucin
Con este ejemplo, se ha puesto de manifiesto la relacin que existe entre los dos
tipos de evaluacin, estructural (convolucin) y no estructural (recursiva). Cada
evaluacin por convolucin se traduce a la evaluacin recursiva, por un
conjunto finito de familias de funciones. Cada familia representa un
comportamiento diferenciado y puede instanciarlo un nmero infinito de veces
por concrecin de los parmetros dentro del intervalo que corresponde. Al
ejemplo bidimensional que se acaba de tratar, le corresponden seis familias. Se
puede realizar un estudio similar para cualquier evaluacin por convolucin.
7 Conclusin
En este captulo se sientan las bases tericas de la resolucin del problema
formulado en la introduccin, que es la obtencin de primitivas capaces de
realizar a bajo nivel el clculo de funciones que habitualmente necesitan ms
niveles de derivacin. Como estrategia de evaluacin, se establece la
convolucin de funciones a la cual se asocia, por un proceso de regularizacin,
una operatoria recursiva que cumple el requerimiento de la disminucin de
niveles para un gran nmero de funciones. Las primitivas propuestas tienen una
forma paramtrica estndar muy sencilla y los rasgos diferenciadores de las
funciones que se calculan se deben a los valores concretos de los parmetros.
Las primitivas son, por tanto, valores numricos que actan como semilla en el
clculo iterativo de una funcin. Los niveles de derivacin sucesivos se
relacionan entre s por medio de la funcin auxiliar.
70
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Volver al ndice/Tornar a l'ndex
Captulo 3
Capitulo 3
ARQUITECTURAS CBRM
1 Introduccin
Este captulo aborda el diseo y evaluacin de arquitecturas que instrumentan el
mtodo recursivo de evaluacin basado en convolucin, CBRM. Consiste en
trasladar al plano de realizacin fsica la operacin recursiva que se ha propuesto.
Para ello, se disea un prototipo de procesador, facilitando una descripcin
funcional de sus mdulos principales. Se realiza la evaluacin del prototipo con
resultados o estimaciones concretas de las magnitudes ms significativas desde el
punto de vista arquitectural, como el tiempo de clculo y el rea utilizada. Para
realizar estimaciones de tiempo y rea fcilmente comparables con las de otras
propuestas se ha utilizado como unidad de medida un dispositivo elemental de
clculo, formado por una puerta XOR y una AND, que implementa un sumador
completo de un bit. Posteriormente, se han efectuado tambin mediciones en
dispositivos de lgica reconfigurable FPGA (Field P rogrammable Gate Array).
Descritos en lenguaje VHDL {Hardware Description Language), los circuitos
han sido simulados en la tarjeta. xcv300e-6bg352-XST de Xilinx, proporcionando
una estimacin de los tiempos de clculo y de los recursos hardware. Abordar los
aspectos de disipacin de potencia sera procedente en versiones de mayor
carcter aplicado, lo que excede el alcance de esta memoria. En su caso se
71
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
planteara una realizacin ASIC {Application Specific Integrated Circuit) del
procesador bsico.
El procesador CBRM tiene su techo de velocidad establecido por la operatoria
recursiva que realiza, que slo es capaz de proporcionar un punto por iteracin.
Esta limitacin es un inconveniente para aplicaciones que requieran mayor
rapidez y sugiere buscar mejoras. Las prestaciones aumentan incorporando
distintos grados de paralelismo; en el mdulo mismo y en las arquitecturas que
involucran varios mdulos interconectados. En todos los casos, se establecen
comparaciones de tiempo y rea y se opta por una solucin combinada y flexible
de clculo en serie y en paralelo, como solucin intermedia y adaptable a los
requerimientos del problema a tratar.
2 Arquitectura del procesador CBRM
En este apartado se va a proponer la arquitectura del procesador CBRM que
corresponde a la modalidad bsica de operatoria. Esta arquitectura consta de tres
mdulos principales: el de clculo, donde se realiza la operacin recursiva, el de
control, que se ocupa de gestionar la ejecucin del clculo y la memoria que
almacena los datos. Estas funciones pueden implementarse de formas muy
diversas. Puede resultar interesante concentrar todos los datos en una sola
memoria o bien, alternativamente, dotar tambin de memoria a los mdulos de
clculo y de control. Por otra parte, algunos datos pueden existir almacenados
permanentemente o calcularse, bien en lnea bien ex profeso en una etapa previa
de clculo. En la descripcin de los mdulos se mencionan las distintas
posibilidades, teniendo en cuenta que la evaluacin de la arquitectura depende
finalmente de la implementacin elegida.
72
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
2.1 Descripcin funcional de los mdulos
La figura 3.1 representa la estructura general del procesador CBRM que consta de
tres mdulos: el de clculo, el de control y la memoria.
0
G,
1
Memoria
'
4
af+P g
1
'
Clculo
I
1 r
Control
1
Resultado
Fig 3.1. Estructura general del procesador CBRM que presenta tres mdulos principales
Mdulo de clculo
El mdulo de clculo proporciona el resultado de la operacin recursiva. Al inicio
de la etapa de clculo de una funcin F, estn disponibles el valor inicial F o de la
funcin, as como los valores de los parmetros a, y la funcin auxiliar G que
caracterizan la primitiva que hay que usar. El resultado puede alcanzarse
mediante el clculo, que involucra dos multiplicaciones y una suma, o
73
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
permanecer precalculado. La figura 3.2 representa el esquema funcional del
mdulo de clculo que efecta la operacin recursiva.
F = a Fi-i + Gui donde
Fi es el valor, en la iteracin i, de la funcin que se calcula
F-i es el valor que tena la funcin en la iteracin anterior, i-1
a, son los parmetros propios de la primitiva que calcula la funcin F
Gi-i es el valor de la funcin auxiliar que se incorpora en la iteracin i
G,
C
i r i
'
1
Mult.
1 r
\ Sum
' i
'
Mult.
yr
F
Fig 3.2 Esquema funcional del mdulo de clculo
Mdulo de control
El mdulo de control gestiona la ejecucin del clculo mediante seales de
control. El control consiste en asegurar la correcta seleccin de los parmetros, la
captacin y el paso de argumentos al mdulo de clculo, en guiar la salida de
resultados y contar el nmero de iteraciones para marcar el final de la operacin.
74
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
Memoria de clculo
Contiene los parmetros a y , que estn generalmente relacionados con el paso
h, as como los puntos de la funcin auxiliar G La primitiva af+fig que hay que
emplear puede calcularse en lnea, por medio de dos multiplicaciones y una suma
o tambin permanecer precalculada. En este caso la operacin consiste en
direccionar la tabla por algunos bits particulares de los valores de F (que es la
funcin calculada) y de G que es la funcin auxiliar. Si F=fy G= g, slo har
falta un acceso para captar el valor, en cambio si fy g representan fragmentos de
F y G harn falta ms accesos para completar el valor del punto aF+P G.
Si se opta por una memoria nica, sta contendr todos los datos mencionados.
El camino seguido por los datos previo a la ejecucin del clculo es el siguiente
(Fig 3.3):
75
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
Inicializacin
Datos
introducidos
por el usuario
Datos de
control
Datos de
clculo
Clculo
Nombre de
la funcin F
a calcular
Intervalo/= [a, b]
Parmetros a,
funcin auxiliar
G
Paso h
b- a
Punto inicial
F
0
= a
k=0 Fo = a
k=l F^aFo+
Fig 3.3 Camino seguido por los datos
N puntos k
N
iteraciones k
2.2 Implementacin
En esta investigacin, el propsito de la implementacin es la realizacin de un
prototipo que sea capaz de mostrar el mtodo CBRM. Por tanto, no se plantea en
ningn momento que la implementacin elegida tenga que ser ptima y, menos
an, que el mtodo expuesto dependa de implementacin alguna. Por ello, slo se
han considerado los aspectos de diseo que conciernen a la posibilidad de
reutilizacin, al coste de desarrollo hardware, a la flexibilidad y a la limitacin en
el nmero y diversidad de los mdulos necesarios; cuestiones que importan en la
76
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
etapa de verificacin del prototipo. Adems, se ha centrado toda la atencin en la
implementacin del mdulo de clculo, considerado como la parte principal del
prototipo.
Se ha optado finalmente por no efectuar las dos multiplicaciones y la suma para
calcular los puntos de la funcin. En su lugar se tendrn los resultados disponibles
en una tabla LUT (Look-up tabl), de acceso paralelo, utilizando aritmtica
distribuida para su almacenamiento. Los resultados que figuran en la LUT son
instanciaciones de la primitiva af+fig, donde f y g son grupos de bits que
representan fragmentos de las funciones F y G, de manera que para obtener
cualquier punto aF+fiG, hay que realizar tantos accesos a la LUT como
fragmentos del tamao de/haya en F (igual al nmero de fragmentos del tamao
de g que hay en G) y recomponer posteriormente el valor a F + G mediante
una suma. Suponiendo que Fy G tienen un tamao de bits, si se considera una
fragmentacin en partes, los fragmentos tendrn un tamao de t = n/p bits. Por
tanto, el nmero de celdas de la LUT es 2
2
'. La tabla 3.1 muestra un ejemplo de
tabla LUT en la cual los fragmentos/y g son de dos bits (f= (f, /2) y g = ig, g)).
Cabe mencionar que uno de los bits de cada fragmento es el bit de signo que
corresponde al operando.
(fi, g) = (00)
(fn Ri) = (01)
(fug,) =(10)
(f,,gi) =(11)
{fl,g2)=(00)
0
-
a
-
(2,g2) = (01)
0
a
+
(2, ft) = (10)
0
-
-a
- -
(f2,g
2
)=(ll)
0
-a
- +
Tabla 3.1. Estructura de una tabla LUT con fragmentos de 2 bits
77
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
La suma de las instanciaciones af+ gextradas de la tabla puede realizarse de
forma secuencial. Por tanto, el mdulo de clculo consta de una tabla LUT y de
un sumador.
En la implementacin propuesta, para los valores de los argumentos, se ha
optado por una representacin en coma fija con la particin siguiente:
F y G tienen bits, de los cuales:
Signo = 1 bit, parte entera
n
/r, bits, parte fraccionaria
n
/~ - 1 bits. El rango
abarcado por esta representacin es:
- u - ---1) i -n - ---1)
[-2~
(
2 ,_22+2
2
]u[2"
(
2 , 2
2
- 2
2
]
Los valores de y /?que intervienen en los ejemplos presentados en esta
investigacin estn comprendidos entre 0 y 2. De ah que no haya bit de signo y
que slo haya 1 bit dedicado a la parte entera en la particin propuesta. En otros
supuestos, la particin sufrira las modificaciones pertinentes.
Parte entera = 1 bit, parte fraccionaria = '-1 bits
El rango abarcado es [2"
(
"'
_1)
,2 - 2"
(, ,
' "
, )
].
El tamao de las instanciaciones de las primitivas almacenadas en la LUT es
n"; stas se representan en complemento a dos para evitar las restas en el
momento de recomponer el resultado aF+ . Cabe precisar que, despus de
obtener el resultado, hay que pasarlo a una representacin signo-magnitud
necesaria para direccionar de nuevo la LUT.
Sin prdida de generalidad se plantea = ' = ".
78
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
3 Evaluacin de la arquitectura CBRM
En un dispositivo, los tiempos reales de clculo y el espacio ocupado dependen
de la tecnologa utilizada en las implementaciones. No obstante, se puede lograr
una primera aproximacin de los tiempos de ejecucin y del rea ocupada
independiente de la tecnologa haciendo una estimacin del circuito en trminos
de puertas lgicas. As, en un circuito, el nmero de puertas utilizadas
constituye una medida del rea ocupada y el retardo de una puerta representa la
unidad con la que se mide el tiempo de respuesta del circuito, entendido como
camino crtico. En esta investigacin, se considera como unidad de medida el
conjunto formado por dos puertas lgicas (una XOR y una AND) porque este
conjunto implementa una operacin elemental que es la suma completa de un
bit. T
t
, y T
a
son las unidades de tiempo y espacio, respectivamente, que
corresponden a este dispositivo de clculo elemental y que intervienen en la
estimacin de los bloques lgicos habituales. Una explicacin ms detallada de
este modelo se facilita en [Wong, 1994], [Ercegovac, 2000] y [Pineiro, 2002b].
Se presentan a continuacin estimaciones de espacio y tiempo realizadas para
bloques lgicos usuales, algunos de los cuales se encuentran en el prototipo
propuesto.En estas estimaciones, adems de T
t
, y X
a
, suelen intervenir otras
caractersticas como el tamao en bits y el nmero de entradas del bloque.
Tiempos
Tablas LUT: se estima un retardo de 3 x
t
para una tabla con entrada de 7 bits,
3.5 t
t
para entradas de 8 bits, 4 x
t
para entradas de 9 bits y 4.5 x
t
para entradas de
10-11 bits, 5 x
t
para entradas con ms de 11 bits.
79
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
M ultiplexor es: los multiplexores 2:1 y 3:1 tienen un retardo de 0,5 x
t
Registros: tienen un retardo de lx
t
Registros de desplazamiento: hasta 4 desplazamientos 0,5 x
t
; l,5-n-x
t
si el
nmero de desplazamientos est comprendido entre 5 y 16, y 3 , si est
comprendido entre 17 y 64.
Estructura de reduccin: para un contador 3:2 se asume un retardo de 2x
t
y para
un contador 4:2 el retardo es de 3 x
t
reas
Tablas LUT: 40 x
a
/Kbit para tablas direccionadas por 6 bits como mximo y 35
Xa/Kbit para direccionamientos entre 7 y 11 bits.
M ultiplexores: 0,25-k-n- x
a
siendo k el nmero de vectores de entrada y el
tamao de la palabra
Registro de bits: 0,5 x
a
Registros de desplazamiento: hasta 4 desplazamientos, 0,5-n- x
a
siendo el
tamao de la palabra; 2,5-n-x
a
si el nmero de desplazamientos est comprendido
entre 5 y 16, y 10,5 x
a
si est comprendido entre 17 y 64.
Estructura de reduccin: para un contador 3:2 se asume un retardo de 2x
a
y para
un contador 4:2, 4 x
a
3.1 Complejidad
Espacio ocupado
En la Tabla 3.2 se ha realizado una estimacin del rea que ocupa una LUT,
expresada en funcin de x
a
para distintos valores de t y de n. El espacio vara con
80
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
16
32
64
t
1
2
4
8
1
2
4
8
1
2
4
8
LUT
Bytes
32
128
2 KB
512KB
64
256
4 KB
1 MB
128
512
8KB
2MB
10 ,
40 x
a
560 x
a
102400 x
a
20 x
a
80 x
a
1120x
a
204800 x
a
40 x
a
160x
a
2240 x
a
409600 x
a
Tabla 3.2 Estimacin de la memoria ocupada por una LUT
En base a los datos reflejados en la Tabla 3.2 se establece una estimacin del rea
total ocupada por el mdulo de clculo CBRM, expresada en trminos de x
a
para
distintos valores de y t. Para ello se suman las reas ocupadas por la LUT, por el
sumador y por el registro de desplazamiento (Tabla 3.3).
=l
t=2
t=4
=8
= 1 6
10
2
+161
3
+8
8
= 34t
a
40 T
a
+ 8-2-Ta +8x
a
= 64 Xa
560xa+4-4x
a
+8x
a
= 584 Xa
102400 Xa + 2-8-Xa +8x
a
= 102424 Xa
= 32
20x
a
+32-l-x
a
+16x
a
= 68x
a
80x
a
+16-2-Xa+16x
a
= 128 Xa
1120xa+8-4x
a
+16x
a
= 1168 x
a
204800 x
a
+ 4-8-Xa +16x
a
= 204848 x
a
= 64
40x
a
+64-l-x
a
+32x
a
= 136x
a
160x
a
+32-2-Xa +32x
a
= 256 Xa
2240 Xa + 16-4x
a
+32x
a
= 2336 x
a
409600 Xa +8-8-x
a
+32x
a
= 409696 Xa
Tabla 3.3 Estimacin del rea total ocupada por el mdulo de clculo del CBRM
81
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
Se observa que el rea total ocupada crece exponencialmente con t y linealmente
con n. El coste de rea viene motivado esencialmente por el tipo de crecimiento
exponencial de la LUT. A efectos de ocupacin de rea, interesa que los
fragmentos sean lo ms pequeos posible, cualquiera que sea el valor de n.
Tiempo de clculo
La Tabla 3.4 muestra una estimacin del tiempo de clculo expresado en funcin
de t
t
para distintos valores de y t. El tiempo de clculo es la suma del tiempo de
acceso a la LUT y del tiempo invertido por la suma secuencial.
=l
t=2
t=4
t=S
=16
3T
t
+16x
t
lg 16+7,5 ,
= 74,5 ,
3 , +8 , ^8+7, 5 ,
= 34,5 ,
4.5T
t
+4x
t
lg4+7,5Tt
= 20 ,
5 ,+2 ,1 2+7,5 ,
= 14,5 ,
= 32
3 ,+32 , lg 32 +15,5 ,
= 178,5 x
t
3 ,+16 , lg 16+15,5 ,
= 82,5 ,
4.5T
t
+8t
t
lg8+15,5T,
= 44 ,
5T
t
+4x,lg4+15,5T
t
= 28,5 ,
= 64
3
(
+64 , lg 64+31,5 ,
= 418,5 x
t
3 ,+32 , lg 32+31,5
(
= 194,5
(
4.5T,+16t
t
lg 16+31,5 ,
= lOOxt
5 ,+8 , Ig8+31,5T,
= 60,5 ,
Tabla 3.4 Estimacin del tiempo de clculo del CBRM
Se observa una disminucin clara del tiempo de clculo cuando crece el tamao t
de los fragmentos. La disminucin es ms acusada cuanto ms altos son los
valores de n. Ello se debe a la importancia relativa del segundo trmino de la
suma, correspondiente al tiempo del sumador, que es n/t-log2 nlt y que decrece
marcadamente cuando i aumenta. Los tiempos de acceso a la LUT son poco
relevantes; no dependen de n, slo de t pero son poco variables con ste.
Resumiendo: las estimaciones del rea ocupada y del tiempo de clculo
invertido ponen de manifiesto que el tamao creciente de los fragmentos
82
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
3.2 Simulacin del mdulo de clculo CBRM
Se ha sintetizado el circuito relativo al mdulo de clculo del prototipo CBRM en
la plataforma xcv300e-6bg352-XST de Xilinx, con el propsito de verificar el
funcionamiento del mtodo.
El mdulo de clculo descrito en VHDL consta de dos subcircuitos principales,
MEM y MAC cuyo cometido es, respectivamente, seleccionar las primitivas
parciales y sumarlas secuencialmente, siguiendo la Implementacinl. A su vez, el
mdulo MEM se desglosa en otros tres, Tlu, Puntos y Counter. Tlu representa
la LUT en la cual se almacenan las primitivas que actan como productos
parciales de una multiplicacin, Puntos selecciona los cuatro bits de
direccionamiento extrados de las entradas F G y Counter marca el paso de
extraccin. El mdulo MAC, que realiza la suma secuencial y los
desplazamientos de los productos parciales, se compone de dos mdulos
embebidos el uno en el otro: Prueba y Elemento recursivo. Prueba es un
sumador de 1 bit, Elemento recursivo es un sumador de bits construido por
repeticin de Prueba. Para terminar, MAC repite veces la estructura de
Elemento recursivo. Sincronizado con el reloj del sistema, el contador Counter
marca los accesos a LUT de 0 a 15. Cada acceso es recogido por el mdulo
Puntos para proporcionar los cuatro bits y que direccionan la LUT. A su salida
cada producto parcial extrado va al MAC donde es sumado y desplazado, hasta
completar las 15 sumas de que consta una iteracin. El resultado obtenido, que
est en complemento a dos, deber ser convertido a representacin signo
83
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
magnitud antes de realimentarse en el mdulo Puntos para iniciar la siguiente
iteracin, despus de poner el contador Counter a cero
En las figuras 3.4 a-1, se presenta un esquema del circuito de clculo CBRM
desglosado por mdulos. Para cada mdulo se muestran el smbolo y su
instanciacin.
addr<3:0>data<15:0> d<3:0 > pparcial<15 :0 >
Fig. 3.4a Mdulo Tlu representado simblicamente e instanciado por una ROM
p<3:0 > dreccion<3:0 >
puntodos<15 :0 >
puntouno<15 :0 >
Fig. 3.4b Mdulo Puntos representado simblicamente
84
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
lEriataTOi-
iBrtataMi-
[ S 5> -
liiriainlli}-
I Brian) H>-
I Brian) H -
I Brian! !')>-
liffl..riin> -
l aanri f r. i i ri i i l aj f r
flSSTlJBt-
iBriairiH-
I Brian) i fr.
iBrianfti?-
InriawUft-
IprianWS-
I ririairiyiS
Inri i ri l l ?-
I Brian) ri j -
JTirianjin-
l a r i mM-
| Brian) Hfr-
I nrinJij I )i
I Bri an)' 3?-
I Brian) Hi -
lBriairi'qS-
2 1>
jaam) i>
HaamW)
Fig.3.4c Instantiation del mdulo Puntos por dos multiplexores
85
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
elk
resetint
contador<3:0>
count<3:0>
resetint>
Fig.3.4d Mdulo Counter representado simblicamente e instancado por un contador
punt odos<15 : 0 >
punt ouno<15 : 0 >
cl k
reset i nt
cont ador <3: 0 >
pparcal <15 :0 >
Fig.3.4e Mdulo MEM representado simblicamente
CHUiCPt-
ti tl CH Wlf r
lliWJKlll-lS*- ln.jriLLijJi
Fig.3.4f Estructura del mdulo MEM
Fig.3.4g Mdulo Prueba representado simblicamente
86
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
_ 11 = 0 OC
- !
-0>
Fig.3.4h Mdulo Prueba instanciado por puertas XOR
ent1<15:0>
ent2<15:0>
las<16:0>
sal<16:0>
Fig.3.4i Mdulo Elemento recursivo representado simblicamente
'IL
l eiti(isa>-
tfr
3( 60)>
fedsa-
Fig.3.4j Mdulo Elemento recursivo instanciado por puertas XOR
87
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
e itraS l: 16D=-
e lirada!* 16D>
ei0ada316&-
sitiacB4- =16l
e HiadaS* 160-
ei03B7- =16&-
eitI3CB&=16D=-
!333[^16&-
413( 11-=160>
eitI33H-:16D:-
eiada15<160-
sal t ea 16D>
salHa3<1SiJ*
alB3316B>
alu5*- :15ft-
salU3S-=15B:-
alld3&<:16l]>
alJNIS IN
alld3&- =16l
alHa&-=16D>
alB1[ k160-
alfcB11^16D>
alkB12=16fl=-
3 3 3* 15 &-
3IH3H-:15D>
alBa1S^16Ib-
itrai
Fig.3.4k Mdulo MAC representado simblicamente
88
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
pi i t Kt e-=l SD>
pHt l | i >=1S&-
l t l i t
cotiacior-=3lt-
aluaQ-=3>3ri=-
aiidal-=2B3i}>
alU 32-=2o3l-
falHE3---2o3D>
al t a^ as gi l
alK&&c38BIJi-
alu35 -=333D:-
aikS-=2EBii>
ai03o-=2Sr;D:-
alKfi9<23SD>
3 3 *233&-
aiktal 1-=3SSD=-
andai2-=2sgrb-
i3Ha13-=333l-
ai aaH-=233&-
i3HCB15 23EIl-
3IHa1&2SStt-
Fig.3.41 Mdulo de clculo CBRM representado simblicamente
Las estimaciones de tiempo se han realizado con datos de precisin igual a 16
bits, arrojando los resultados que aparecen en la Tabla 3.5. Cada estimacin se
realiza midiendo el tiempo entre que la seal entra al mdulo por un pin de
entrada hasta que sale por un pin de salida; por consiguiente, ninguna estimacin
tiene porqu ser nica. El tiempo consta de la suma de dos contribuciones, la de la
lgica combinacional involucrada ms la de la lgica de encaminamiento, que
figuran en este orden en la tabla. El contador tiene un tiempo de offset que influye
en los mdulos MEM y CBRM y que se ha tenido en cuenta en los resultados.
89
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
Mdulo MEM
Counter 6,778 ns = 5,594 ns + 1,184 ns
Puntos 10,897 ns = 6,977 ns + 3,920 ns
Tlu 8,939 ns = 5,867 ns +3,072 ns
Total MEM = 26,229 ns = 15,085 ns + 11,144 ns
Mdulo MAC
Prueba 8,011 ns = 5,867 ns + 2,144 ns
El.recursivo 29,683 ns = 12,419 ns + 17,264 ns
Total MAC = 77,827 ns = 26,459 ns + 51,368 ns
Total CBRM -parcial = 51,951 ns = 18,655 ns + 33, 296 ns
Total CBRM = 104,056 ns = 26,229 ns + 77,827 ns
Tabla 3.5 Estimaciones de tiempo del mdulo de clculo CBRM implementado en la FPGA
xcv300e-6bg352-XST de Xilinx.
Los resultados que aparecen en la Tabla 3.5 ponen de manifiesto que:
El tiempo total empleado por el mdulo MEM depende linealmente del
tiempo correspondiente a los mdulos que lo integran. As es tambin la
dependencia de los tiempos que corresponden a la lgica combinacional y al
encaminamiento.
El tiempo empleado por la lgica combinacional del mdulo MAC crece
linealmente desde el nivel ms interior, Prueba, hasta el ms exterior MAC.
El tiempo de encaminamiento crece en el mismo sentido, pero con un
crecimiento rpido primero que tiende a moderarse.
Generalmente, se observa que el tiempo invertido por el encaminamiento es
inferior al que necesita la lgica combinacional, salvo que se trate de
estructuras embebidas.
El tiempo total de clculo del CBRM-parcial que aparece en la Tabla 3.5 debe
interpretarse como la suma de MEM ms El. Recursivo. Ello se debe a que
el dato extrado de la memoria tiene 16 bits obligando a una suma de 16 bits,
90
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
4 Mejora de la arquitectura CBRM
La arquitectura CBRM es paralelizable en algunas de sus etapas, sugiriendo
mejoras en sus prestaciones. Se consideran en este apartado la incorporacin de
distintos grados de paralelismo. Primero, se plantea la paralelizacin de la suma
en el mdulo de clculo. En un segundo tiempo, aprovechando la particin inicial
realizada por el tipo de representacin de los datos elegido, se propone la
paralelizacin de la ejecucin del clculo de un punto. Para finalizar, se considera
la paralelizacin del clculo de puntos de una funcin.
4.1 Incorporacin de paralelismo en la suma, en el
mdulo de clculo
En el mdulo de clculo descrito, la suma de los productos parciales se realiza
secuencialmente, como aparece en la Tabla 3.5. Esta operacin de sumas de
bits tiene una complejidad temporal proporcional a 0(n
2
). La realizacin de una
suma con estructura de reduccin rebaja la complejidad a 0(nlog2n) con el
consiguiente aumento de hardware. En este sentido existen abundantes referencias
en la literatura que proponen diversos algoritmos que utilizan circuitos contadores
[Wallace, 1964], [Dadda, 1965] o compresores [Weinberger, 1981], [Song y de
Michelli, 1991], [Known et al., 2000] basados en elementos de suma sin acarreo
91
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
[Bewick y Flynn, 1992], [Omondi, 1994], [Oklobdzija et al, 1996], [Choi et al.,
1997]. Estos elementos son conectados entre s formando una topologa
determinada, por ejemplo en rbol [Takagi et al, 1985]. Si los sumandos estn
divididos en fragmentos de tamao mayor que 1 bit, cabe tambin la posibilidad
de realizar la suma por bloques [Mora, 2001],
Las Tablas 3.6 a, b y c muestran la diferencia entre el rea ocupada por
implementaciones que emplean un sumador que opera secuencialmente o un
sumador con reductores. En esta ltima implementacin no intervienen los
registros de desplazamiento.
= 16
t=\
t=2
t=4
=8
Implementacin con sumador
secuencial
10
+161
3
+8
3
=34
40
3
+8 2
3
+8
3
=64
3
560 T
a
+ 44
3
+8 = 584
3
102400
3
+ 2-8-Ta +8T
S
= 102424 T
a
Implementacin con reductores 4:2
10x
a
+7x
a
+ 16-lT
a
=33i
a
40 Ta + 7 Ta + 8' 2t a = 63 Ta
560
3
+7
3
+ 44
3
= 583
3
102400 Ta +7 Ta + 28
3
= 102423 T
a
Tabla 3.6a Estimacin del rea total ocupada por las implementaciones con sumador secuencial y
con reductores para = 16 bits
92
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
= 32
t=\
t=2
t=4
=8
Implementation con sumador
secuencia!
20 +32 1
+16
8
= 68
80
3
+16- 2
3
+16
8
= 128
3
1120 Xa + 84
8
+16
= 1168 T
a
204800 ta + 4-8-Xa +16x
a
= 204848 T
a
Implementation con reductores 4:2
20 T
a
+15 Ta+ 32 1
0
= 67 T
a
8 0
3
+ 1 5
3
+ 16 2
3
=127
3
1 1 2 0
3
+1 5
3
+8 4
3
= 1167 Ta
204800 Ta+15 Ta +
4 8
3
= 204847 Ta
Tabla 3.6b Estimacin del rea total ocupada por las implementaciones con sumador secuencial y
con reductores para = 32 bits
n = 64
f=l
t=2
t=4
=8
Implementation con sumador
secuencial
40 T
a
+ 64-l-T
a
+32T
a
= 136 T
a
160 T
a
+ 32-2-Ta +32x
a
= 256 T
a
2240 T
a
+ 16 4
3
+32
8
= 2336 T
a
409600 Ta + 8-8-Ta +32x
a
= 409696 T
a
Implementation con reductores 4:2
40T
a
+3l Ta +64- l T
a
=135T
a
160 Ta + 31 Ta + 32-2
9
= 255 T
a
2240T
a
+3l Ta + 16-4
3
= 2335 Ta
409600 Ta+31 Ta +
88
3
= 409695
3
Tabla 3.6c Estimacin del rea total ocupada por las implementaciones con sumador secuencial y
con reductores para = 64 bits
Estas tablas ponen de manifiesto que la implementacin con reductores presenta
una ocupacin de rea equivalente a la de la implementacin con suma
secuencial.
93
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
Las Tablas 3.7 a, b y c muestran la diferencia entre los tiempos de clculo en
implementaciones que emplean un sumador que opera secuencialmente o un
sumador con elementos de reduccin.
=1 6
= l
= 2
= 4
t=8
Implementation con sumador secuencia!
3 , +16 , lg 16+7,5t
t
= 74,5 ,
3 , +8 , ^ 8 +7 , 5 = 34, 5 ,
4.5T,+4T
t
lg4+7,5T
t
= 20T
t
5
(
+2 , ^ 2+7, 5 , = 14, 5 ,
Implementation con reductores 4:2
3t
t
+3.3"u
t
+T, lg 16 = 16 ,
3 , +3. 3 , + , ^8 = 1 5 ,
4.5 ,+.3 3 ,+ , ^ 4 = 15,5 ,
5t
t
+3. 3x
t
+x, l g2 = 15 ,
Tabla 3.7a Estimacin del tiempo de clculo en las implementaciones con sumador secuencial
y con reductor para = 16 bits
=3 2
t=\
t = 2
t = A
= 8
Implementation con sumador
secuencial
3 , +32 , lg 32 +15,5 ,= 178,5 ,
3 , +16 , lg 16+15,5 , = 82,5 ,
4. 5 , +8 , ^8+15, 5 , = 44 ,
5
(
+4 , lg 4 +15,5 ,= 28,5 ,
Implementation conreductor 4:2
3 , +3. 4 , + , lg 32 = 20 ,
3 , +3. 4 , + , lg 16= 19 ,
4 . 5 , +3 . 4 , + , ^ 8 = 19,5 ,
5T,+3.4x
t
+ T, l g 4 = 19 ,
Tabla 3.7b Estimacin del tiempo de clculo en las implementaciones con sumador secuencial
y con reductor para = 32 bits
=6 4
t=\
t = 2
f=4
t=8
Implementation con sumador
secuencial
3 , +64 , lg 64+31,5 ,= 418,5 ,
3 , +32 , lg 32+31, 5t
t
= 194,5 ,
4.5 ,+-16 , lg 16+31,5 = 100 ,
5x
t
+-8 , lg 8+31,5x
t
= 60,5 ,
Implementation con reductor 4:2
3 ,+3.5 , + , lg 64 = 24 .
3T
t
+3. 5T
t
+T, l g32 = 23T
t
4. 5T
t
+3. 5T, +T, lg 16 =23, 5 ,
5 , +3. 5 , + , ^ 8 = 23 ,
Tabla 3.7c Estimacin del tiempo de clculo en las implementaciones con sumador secuencial
y con reductor para = 64 bits
94
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
Estas tablas ponen de manifiesto que la implementacin que utiliza reductores
invierte un tiempo de clculo prcticamente constante para cualquier tamao de
los fragmentos de un operando. Adems, el tiempo de clculo crece bastante
poco con el tamao del operando. Cabe observar que los tiempos en la
implementacin con reductores son mucho mejores que los de la
implementacin con sumador secuencial, sobre todo a medida que el tamao de
los fragmentos disminuye y a medida que aumenta el tamao de los operandos.
4.2 Incorporacin de paralelismo en el clculo de
un punto
La particin inicial de los operandos puede utilizarse para incorporar
paralelizacin a nivel de la ejecucin del clculo:
a) obteniendo el resultado del producto que corresponde a la parte entera de
F por la parte fraccionaria de amas la parte entera de G por la parte
fraccionaria de (mediante extracciones de la LUT)
b) sumndole al resultado anterior F (si la parte entera de a es igual a 1), G
(si la parte entera de /?es igual a l ) , F+G (si las partes enteras de y
/?son iguales a 1)
c) obteniendo el resultado del producto que corresponde a la parte
fraccionaria de F por la parte fraccionaria de a ms la parte fraccionaria
de G por la parte fraccionaria de (extracciones de la LUT)
Este planteamiento permite mayor flexibilidad, permitiendo tomar en
consideracin la parte a) solamente, para aplicaciones en las que pueda asumirse
el error debido a la eliminacin de la parte fraccionaria de F y G. Puede tambin
paralelizarse el clculo de las etapas a) y c). Por otra parte, la etapa b) no
95
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
interviene cuando a y estn comprendidos entre cero y uno, por tanto slo se
tomar en consideracin cuando sea necesario.
Las mejoras en rea ocupada y en tiempo de clculo dependen del supuesto en el
que se trabaja. En el supuesto a), la mejora puede cuantifcarse a partir de lo
establecido por el estudio anterior relativo a datos no particionados, con la
correccin del nmero de bits que corresponda. Como ejemplo, se trata el caso
del clculo paralelo de las partes a) y c), estudiando tambin la influencia del tipo
de particin de los operandos.
Clculo paralelo con operandos particionados
Se sustituye un operando de bits por dos operandos de
/~ bits y
n
/~ -1 bits. El
primero representa la parte entera y el segundo la parte fraccionaria. La
implementacin utiliza una tabla LUT compartida y duplica el sumador y los
elementos de reduccin que corresponden. Los resultados se muestran en las
Tablas 3.8 a-b.
t=\
t=2
t=4
=8
Implementacin con reductores 4:2
= 32particionado en \6y 15
10x
a
+2(7T
a
+16-lT
a
) = 56T
a
40
3
+2( 7
3
+8 2
3
) = 86
3
560 Ta +2(7 ta + 44
3
) = 606
8
102400 Ta+2(7 T
a
+ 28
3
) = 102446
3
Implementacin con reductores 4:2
- 64particionado en32y3\
20T
a
+2(15Ta+32-lT
a
)=114T
a
80Ta+2(15T
a
+ 16-2x
a
)= 174 Ta
1120Ta+2(15Ta+8-4Ta)= 1214 Ta
204800 Ta+2(15
3
+ 48
3
)= 204894 T
a
Tabla 3.8a Estimacin del rea ocupada por la implementacin con datos particionados, para = 32
y = 64
96
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
= l
= 2
= 4
=8
Implementation con reductores 4:2
=32particionado en \6y 15
3T,+3.3T
t
+T
t
lgl6= 16 ,
3x
t
+3.3T
t
+T
t
lg8 = 15 D
t
4.5T
t
+.3 3T
t
+T
t
lg4= 15,5 ,
5T
t
+3.3T,+ T, lg2= 15 t
t
Implementation conreductor 4:2
=64 particionado en 32 y 31
3T
t
+3.4T,+T
t
lg32 = 20x,
3T
t
+3.4x,+T,lg 16 = 19 ,
4.5T
t
+3.4x,+T
t
lg8 =19,5 ,
5x,+3.4T
t
+ T
t
l g4= 19 ,
Tabla 3.8b Estimacin del tiempo de clculo la implementation con datos particionados, para = 32
y = 64
Comparando la Tabla 3.8 a con las estimaciones homologas de la Tablas 3.6b-c,
se pone de manifiesto una disminucin apreciable del rea ocupada en la
implementation que particiona los operandos; la disminucin es tanto mayor
cuanto mayor es el tamao del fragmento. La comparacin de la Tabla 3.7b con
las Tablas 3.8b-c muestra tambin una disminucin de tiempo, pero no tan
apreciable ya que, como se ha mencionado anteriormente, la implementacin con
elementos de reduccin no presenta variaciones de tiempo espectaculares cuando
el tamao del operando vara, ni tampoco cuando vara el tamao del fragmento.
La particin propuesta para los operandos es aproximadamente de mitad y mitad
para las partes entera y fraccionaria del operando. Si una de las partes es de
tamao mayor que la otra, no se prevn cambios en el rea ocupada, ya que sta
se calcula como una suma de contribuciones de dos dispositivos, independiente de
su distribucin. El tiempo de clculo experimenta un ligero aumento, debido a la
parte del operando que presenta mayor nmero de bits, pero, tal y como ya se ha
observado, las variaciones del tamao del operando tienen poca repercusin en
los tiempos.
97
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
4.3 Incorporacin de paralelismo en el clculo de
puntos de una funcin
El clculo de puntos de una funcin puede efectuarse a travs del mismo
mdulo de clculo, adoptando la particin de datos que se estime oportuna. Si
es el tiempo de clculo de un punto, la utilizacin de un mismo mdulo para el
clculo de los puntos tiene como efecto la multiplicacin por un factor del
tiempo T. Para paliar este aumento lineal del tiempo se pueden proponer
arquitecturas que, aunque aumenten un poco el rea ocupada, son beneficiosas
para la disminucin del tiempo de clculo, de manera que permiten establecer un
compromiso segn los requerimientos del problema a resolver.
El problema es el siguiente: dada una funcin, calcular puntos en el intervalo
[a, b]. La introduccin de paralelismo a este caso consiste en establecer distintas
etapas que representan la profundidad de un rbol. Cada etapa de clculo divide
los subintervalos de [a, b] definidos en la etapa anterior en subintervalos ms
pequeos. Por tanto, al inicio de cada etapa, el nmero de mdulos que han de
actuar es igual al nmero de subintervalos definidos en la etapa anterior. En cada
etapa el clculo de los mdulos se realiza en paralelo.
SiN = NixN
2
x....xN
p
I
a
etapa: 1 m dulo calcula N, puntos
2
a
etapa: Ni mdulos calculan Ni N2 puntos (N
2
puntos por mdulo)
p-sima etapa: N
1
xN
2
x....xN
p
.
1
mdulos calculan = NiXN
2
x..xN
p
puntos (N
p
puntos por mdulo)
98
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
En la Tabla 3.9 se presentan los resultados en cuanto a tiempo de clculo y
nmero de mdulos necesarios para el clculo secuencial realizado por un solo
mdulo y el clculo paralelizado.
Clculo
secuencial
Calculo
paralelizado
Tiempo de clculo de puntos
TN = TN,N
2
-N
p
=TN,+TN
2
+ + TN
p
= T(N,+N
2
+ + N
P
)
Nmero de mdulos necesarios
1
1+ Ni + N,N
2
+ N, N
2
N
3
.+...+.N! N
2
N
3
... N
p
.i
Tabla 3.9 Estimacin del tiempo de clculo y del nmero de mdulos en el clculo secuencial y
paralelo
Se observa que en el clculo paralelizado, el tiempo depende de la
descomposicin N
l s
N2, , N
p
que se ha hecho de N. El valor de la suma
N1+N2+ + Np disminuye cuando aumenta p, que es el nmero de factores en
los que se descompone N. Por tanto, dado N, para mejorar el tiempo, hay que
realizar el mayor nmero posible de etapas. Por el contrario, el nmero de
mdulos necesarios decrece cuando disminuye p, es decir, cuando disminuye el
nmero de etapas. Adems, si se ordenan los nmeros N de forma que el mayor
sea Np, disminuye tambin el nmero de mdulos, dado que N
p
, no interviene en
la expresin.
Comparado con los resultados proporcionados por un mdulo nico, el clculo
paralelizado presenta la ganancia de velocidad, la productividad y la eficiencia
siguientes:
99
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
ganancia en velocidad:
",
# /
77V ,
T(N
l+
N
2
.... + N
D
)
1
' ^
2
"
pJ
1
P =
productividad:
l + N
{
+N
X
N
2
+ + N
l
N
2
N
p
_,
eficiencia:
En la primera etapa:
77V, ,
, =
""1
(
+
2
+
) ^
En la 2
a
etapa:
77V, TV,
, =
2 _ 2
' 2
T(N
l+
N
2
+ N
p
)
i
P
".
En la p-sima etapa
"-
1
r ( / V
I +
; V
2
+ -L
'
z ,
2 ' "
1
*,
100
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 3
La eficiencia media es:
E- '
p-\
La Tabla 3.10 recoge las medidas de ganancia en velocidad, productividad y
eficiencia del clculo realizado por un mdulo frente al clculo paralelizado.
Clculo
secuencial
Clculo
paralelizado
Ganancia en
velocidad
1
m
G = '
1
P roductividad
\ +
2
+ +
,
Eficiencia
100%
-\
F - '
-\
Tabla 3.10 Comparacin de ganancia en velocidad, productividad y eficiencia entre el clculo
secuencial y paralelizado
En la Tabla 3.10 se observa que el clculo de puntos llevado a cabo por un solo
mdulo tiene unas medidas de productividad y eficiencia ptimas. Sin embargo,
el clculo paralelizado obtiene una ganancia en velocidad superior a la del clculo
secuencial, modulable por la descomposicin de N. La productividad y eficiencia
son, en cambio, inferiores.
101
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Arquitecturas CBRM
5 Conclusin
El presente captulo se ha dedicado al estudio de la arquitectura CBRM, con la
propuesta y evaluacin de un prototipo de procesador, del cual se han estudiado
las caractersticas del mdulo de clculo. Se han realizado estimaciones del
tiempo de clculo y del rea ocupada utilizando una medida de los recursos
hardware independiente de tecnologa, facilitando posteriormente medidas con
referencia explcita a una plataforma determinada. Se han realizado igualmente
algunas propuestas de mejora de prestaciones del mdulo de clculo con
incorporacin de paralelismo. Adems de considerar las mejoras obtenidas por la
paralelizacin de la suma, se ha planteado tambin el clculo pralelo El clculo de
un gran nmero de puntos tiene una limitacin inherente al CBRM que es la de
proporcionar un punto por iteracin. Se propone una arquitectura que consta de
varios mdulos interconectados, que incorpora etapas de clculo paralelo. Esta
propuesta presenta flexibilidad debido a la posibilidad de variar el nmero de
etapas y el nmero de mdulos por etapa. Se establecen las comparaciones en
cuanto a ganancia en velocidad, productividad y eficiencia de los dos tipos de
clculo en funcin de estos parmetros.
102
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Volver al ndice/Tornar a l'ndex
Captulo 4
Captulo 4
CLCULO DE ROTACIONES
MEDIANTE CBRM
1 Introduccin
El presente captulo y el siguiente estn dedicados a las aplicaciones. Debido a
su presencia en numerosos y muy diversos mbitos, las funciones
trigonomtricas e hiperblicas constituyen un caso de enorme inters aplicado.
As, es previsible que cualquier mejora en la operatoria de estas funciones
repercuta favorablemente en el rendimiento global de los clculos en los que
dichas funciones intervienen. La rotacin es una transformacin geomtrica,
formalizable a partir de la combinacin de las funciones trigonomtricas seno y
coseno, que sirve de base a algunas transformaciones muy utilizadas en
tratamiento digital de la seal y de la imagen como la transformada de Hough
[Bruguera, 1996], [Garca et al, 2003a], [Garca et al, 2003b], de Fourier [Frigo,
1998], [Frigo, 2000], [Randi, 2000] y la transformada del coseno [Snchez,
1997], [Dick, 1998]. En estos casos, el CBRM presenta una idoneidad particular
como mtodo de clculo debido a la posibilidad de evaluar simultneamente las
dos coordenadas caractersticas del punto que rota. El presente captulo est
dedicado a la clasificacin de algunas de estas transformadas con el fin de
103
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Calculo de rotaciones mediante CBRM
proponer un patrn comn de clculo para todas ellas, asumible por el CBRM.
Posteriormente, se efecta un anlisis comparativo de los resultados de clculo
de las transformadas de Hough y Fourier entre el CBRM y otros mtodos
conocidos.
2 Rotaciones en el plano
Seguidamente se analizan las ecuaciones de la rotacin bidimensional y se
expresan con el formalismo del CBRM
2.1 Ecuaciones
En el plano definido por un par de ejes ortogonales, (Ox, Oy), sea P (x, y) un
punto de una circunferencia de radio Ry el ngulo que forman OP y el eje
Ox
= Reos i (4.1)
y i = R sen
Sea el incremento de cada rotacin:
0i= 6>;_/ + , Vi
As,
eos i = cos(0i. + ) (4.2)
sen = sen ( . + )
planteando eos - a, sen =
desarrollando y sustituyendo (4.2) en (4.1) y reagrupando los trminos, se
obtiene:
104
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
x = .- .,
y = ayi- + - (
4
3
)
con la restriccin adicional a
2
+
2
-l
Las ecuaciones (4.3) expresan el valor de las coordenadas del punto rotado
despus de cada rotacin, en funcin de las coordenadas del punto anterior.
Si se definen las coordenadas del punto como dos funciones F y G, de forma
que cada funcin represente la proyeccin del punto sobre uno de los ejes:
F(x
i
,y
l
)=x
(4.4)
G(xi,y) =y
Sustituyendo (4.4) en (4.3), resulta:
F(xy} = a F(x.i, y
t
.i) - G(x
iA
y .i)
G(xy) = a G(Xi.i,yi-i) + ( ^, .,) (4.5)
con
La aplicacin del CBRM no hace intervenir explcitamente las coordenadas; en
su lugar se le asocia, como consecuencia de la regularizacin establecida, el
nmero de la iteracin en curso. El clculo de F y G se expresa entonces como
F
l
= aF
rl
- f i G
i
.
G = a G,., + fiFi
i - I
(4.6)
con
c^ + /f = \
Las ecuaciones (4.6) son valuables a partir de las primitivas encontradas, por
tanto, bajo el formato CBRM, la rotacin bidimensional corresponde a la
105
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
evaluacin cruzada de dos funciones, F y G, con una restriccin sobre sus
parmetros,
2.2 Funciones configurables a partir de rotaciones
El movimiento de rotacin es comn a muchas transformaciones matemticas;
por ello, la evaluacin de stas por el CBRM se basa en el esquema propuesto en
el apartado anterior.
Aadiendo a las ecuaciones (4.1) la coordenada para pasar de una
representacin bidimensional a otra tridimensional, se describe el movimiento
helicoidal. Haciendo R - A en la primera ecuacin y R = en la segunda, se
describe el movimiento elipsoidal, siendo A y los semi-ejes menor y mayor de
la elipse. Asimismo, la transformada de Hough, utilizada en el proceso de
segmentacin de la imagen, transforma un punto del plano cartesiano P (x,y) en
una curva en el dominio parametrizado ( , ) de Hough, mediante la
ecuacin = x -eos + y-senO, para ngulos pertenecientes al intervalo [ , [. Las
transformadas ortogonales pertenecen a una clase ms general de
transformaciones discretas para las que resulta menos inmediata la configuracin
como rotacin y, por tanto, menos evidente la aplicabilidad del CBRM.
J V - 1
m=0 (4.7)
La ecuacin (4.7) expresa una transformacin ortogonal genrica en la cual f(x),
0< x< y F(u), 0< u< son respectivamente la secuencia original y
106
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Transformada
Fourier
Hartley
Coseno
Walsh
Hadamard
Ncleo T( x ,u)
1 , - 2 inux .
exp( - )
. ,2TVUX .
cos ) + sen ( )
, , . ( 2x4- 1);
e( &) cos
27V
-1
__T~T S_lY'(x )bn-i-\(u)
/=0
i / i - l
J _ T T / _ j \ 6/ (^)i / ()
Observaciones
Ncleo trigonomtrico
Ncleo trigonomtrico
Ncleo trigonomtrico
e(0) = 1/V2
e(k) = \ 0 < <
Ncleo no trigonomtrico
b representa el i-simo bit del entero b
Ncleo no trigonomtrico
b representa el i-simo bit del entero b
Tabla 4.1 Algunas transformaciones ortogonales
El resto del captulo se dedica a desarrollar la aplicacin del CBRM al clculo de
algunas transformadas, realizando las modificaciones formales necesarias cuando
la aplicabilidad del CBRM no puede deducirse de forma sencilla. En todos los
casos se presentan otras propuestas de clculo a fin de comparar los resultados.
107
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
3 Aplicacin del CBRM a la
transformada de Hough
En este apartado se realiza un anlisis formal de la transformada de Hough para
la cual se propone la aplicacin del CBRM, como mtodo idneo de clculo.
Tambin se han seleccionado dos ejemplos en los cuales se incluyen
comparaciones entre los resultados proporcionados por el CBRM y por el
CORDIC. La primera propuesta es una implementacin segmentada
reconfigurable del CORDIC [Deng, 2001]. La segunda considera una aplicacin
paralela del mismo algoritmo [Bruguera, 1996]. Estas implementaciones, que se
discuten en [Garca et al, 2003b], comparan el CBRM y el CORDIC en cuanto a
rea ocupada y tiempo de clculo.
3.1 Transformada de Hough
Propuesta en 1962, la transformada de Hough (HT) es una herramienta
importante en la segmentacin de imgenes [Hough, 59]. Deteccin de curvas
[Muamar, 1991], reconocimiento de objetos [Haule, 1989], vectorizacin de
fotografas areas [da Silva, 1990], reconstruccin de imgenes 3D [Yamazava,
2000], inspeccin de la calidad industrial [Bariani, 1997], aplicaciones
biomdicas [Dong, 2001], [Tezmol, 2002], reconocimiento de qusares [Huang,
2000] y OCR [Sural, 2001], son algunos ejemplos de las mltiples utilidades de
esta transformada. La HT es enormemente atractiva debido a su robustez
aunque la gran cantidad de recursos espaciales y temporales que requiere la han
mantenido alejada de las aplicaciones de tiempo real. Los esfuerzos realizados
en investigacin han ido en la lnea de disear algoritmos rpidos o
arquitecturas ad-hoc. Los distintos algoritmos, basados en el clculo de
funciones son: lineal [Koshimizu, 1990], combinatorio [Ben-Tzvi, 1990],
108
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
El proceso de deteccin de primitivas geomtricas utilizando la HT puede
descomponerse en tres etapas: la creacin del contorno de la imagen utilizando
un detector de bordes, la aplicacin de la HT a cada punto de la imagen y la
votacin en el dominio de Hough por medio de la cual se realiza la extraccin
de las primitivas.
Fig 4.1. Parametrizacin de rectas para la HT.
Si la primitiva a detectar es la recta, desde el punto de vista geomtrico, la HT
transforma un punto del plano cartesiano P (x,y) en una curva en el dominio
( , ) de Hough (ver Fig.4.1). Recprocamente, a un punto del dominio de
Hough le corresponde una primitiva geomtrica del plano. El dominio de
Hough puede interpretarse como una rejilla de votacin en la que cada punto
P (x,y) del plano "vota" por el conjunto de lneas que intersectan en l y que
109
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
son representadas por puntos en la rejilla ( , ). Si disponemos de una imagen
digitalizada de tamao NxN y definimos el espacio parametrizado ( , ) cada
P (x ,y) se transformar en p = x-cos6 + y-sen9 . El espacio parametrizado se
discretiza en NQ niveles, entre 0 y y en niveles, entre p
m
i
n
y p
max
y la
transformada de Hough consiste en calcular los valores para todos los
ngulos del intervalo [ , [ y para cada pixel de la imagen digitalizada. El
clculo directo tiene una complejidad de 0(N ) y el total de operaciones a
realizar es de -NQ Si se considera el intervalo [ , [ como la unin de dos
subintervalos [ o, n/ 2[ u[ n/ 2, n[ , para cada pixel (xi,yj) de la imagen, la
transformada de Hough puede escribirse como:
(4.8)
(4.9)
pj(k) = xfcos0]
+yj-sene]
0<# < / 2
P ll(k) = yj-cosO/ -XfsenO^ /2< ^ <
Haciendo que
^ ^+
cos/ = cos(e^_\ + )
senOfc =sen(0j_i + )
cosA0 = a,senA9 =
Al sustituir (4.9) en (4.8) tenemos que:
P l(k) = a-P l(k-l) + pP n(k-y
p
II
(k) = p
II
(k) + p-p
I
(k-\)
( 4 1 0)
2 2
con a + =1
110
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Segn aparece en (4.10), las funciones (p)
k
y {pn)k son valuables por el
CBRM, con la peculiaridad de que lafuncin G = {p)k cuando se evala {pjj)t y
G = (pn)k cuando se evala {p)k\ inicializando (p)
0
y (pn)o con el valor de las
coordenadas de cada pixel de la imagen.
3.2 Comparacin CBRM - CORDIC segmentado
En este apartado se comparan los resultados de clculo de la HT obtenidos por
el CBRM y por una propuesta basada en el algoritmo CORDIC. En esta ltima
[Deng, 2001], el clculo se realiza con una representacin de los datos de 16
bits en punto fijo y con un CORDIC de 12 iteraciones, implementado en una
plataforma Xilinx XS4010XL-PC84 FPGA para prototipado rpido.
La tarjeta Xilinx XS4010XL-PC84 FPGA es un dispositivo de capacidad media
que funciona con una velocidad moderada. Posee 400 CLBs arreglados en una
matriz de 20 20, que equivale aproximadamente a 10000 puertas.
Para efectuar la comparacin, se han tenido en cuenta por una parte, la
evaluacin de la arquitectura CBRM descrita en el captulo 4 y por otra, las
caractersticas de la tarjeta Xilinx utilizada, teniendo encuenta que un CLB
(Bloque Lgico) consta de una LUT-3, dos LUT- 4 y dos cerrojos.
Comparacin
La implementacin CORDIC ocupa un 83% de rea, esto es, 333 CLBs de los
400 que cuenta la tarjeta XS4010XL A una frecuencia de reloj de 40 MHz, con
una complejidad computacional 0(N
2
) para una imagen N, una imagen de
128x128 pixels con 128 ngulos discretos ( = 1.40625) tarda 0.0262 s en
transformarse. La Tabla 4.2 presenta una estimacin del rea ocupada por el
CORDIC y la Tabla 4.3 presenta la estimacin del rea ocupada por el CBRM.
111
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
Estas estimaciones se han hecho en funcin de x
a
. La precisin de los datos es
de 16 bits. Se han considerado las dos implementaciones del CBRM,
recordando que en la implementacin 1 interviene un sumador secuencial y en
la implementacin 2 se sustituye ste por una estructura de reduccin de 4:2
antes de realizar la suma final. En ambas implementaciones el rea ocupada se
duplica teniendo en cuenta que se efectan dos evaluaciones cruzadas.
CORDIC
Segmentado
LUT-3
LUT-4
Cerrojos
Total
NCLBs=333
1-333=333
2-333=666
2-333=666
rea ocupada
333-2
3
-2
4
-40x
a
/Kbit=1665x
a
23332
4
2
4
40 x
a
/ Kbit =6660-T
a
2-333-0.5-2
4
-x
a
=5328-T
a
13653 x
a
Tabla 4.2 Estimacin del rea ocupada por la implementacin CORDIC
CBRM
P =\
1=1
t= A
=8
Implementation 1
2(10
8
+16-1
8
+8
8
) = 68
3
2(40 ta + 8-2
3
+8t
a
) = 128 T
a
2(560 Xa+ 4-4ia +8r
a
) = 1168 Ta
(102400 Ta+28
8
+8T
a
) - 204848 T
a
Implementation 2
2(10
3
+7
3
+ 16-lTa) = 66T
a
2(40Ta+7Ta+8-2x
a
)= 126 Ta
2(560 Ta +7 Ta + 44
3
) = 1166 Ta
2(102400 Ta +7 Ta + 28
3
= 204846
3
Tabla 4.3 Estimacin del rea ocupada por la implementacin CBRM
112
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
CBRM
t=l
t=2
t=4
t=8
Implementation 1
64-128-128-(3t
t
+16x,lg 16+7,5-c,)
=78,119 ms
64128-128(3 ,+8 , lg 8 +7,5x0
=36,176 ms
64-128-128-(4.5"c
t
+4-c, lg 4+7,5 ,)
=20,962 ms
64.128128(5 +2 , lg 2 +7,5t
t
)
=15,204 ms
Implementation 2
64-128-128-(3x,+3.3T
t
+T,lg 16)
=16,777 ms
64128-128(3
(
+3.3 ,+ , lg 8)
=15,728 ms
64-128-128-(3.5x
t
+3.3x,+ , lg 4)
=16,253 ms
64128128(5 ,+3.3 ,+ , lg 2)
=15,728 ms
Tabla 4.4 Tiempo de clculo del CBRM
La Tabla 4.4 pone de manifiesto que la implementation 2 del CBRM siempre
proporciona mejores resultados que los del CORDIC (0,0262 s).Para =4 y =8,
incluso la implementation 1 del CBRM es mejor que el CORDIC.
3.3 Comparacin CBRM - CORDIC paralelo
En este apartado se considera el clculo de la HT realizado por una
implementacin paralela del CORDIC [Bruguera, 1996]. El clculo de la HT de
una imagen con un procesador CORDIC nico requiere 1^12 ciclos,
113
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
asumiendo que en cada evaluacin se obtienen dos valores de p. El tiempo puede
reducirse por medio de la paralelizacin. Para ello existen tres aproximaciones
distintas: paralelizar los pxeles de la imagen, paralelizar el ngulo , o paralelizar
los dos simultneamente. La paralelizacin de los pxeles requiere
procesadores, a razn de uno por pixel y por ngulo y la transformacin se efecta
en el tiempo de una operacin CORDIC (n ciclos para radix-2, n/2 +n/4 para
radix mixto 2-4 y n/2 para radix-4, si es la precisin de los datos). Adems, de
la cantidad de recursos hardware que supone, esta aproximacin acarrea tambin
conflictos en el proceso de votacin ya que, los resultados obtenidos por los
procesadores que trabajan con el mismo ngulo#pueden votar el mismo elemento
en el espacio de Hough. La introduccin del paralelismo slo en los pxeles
requiere N
2
procesadores, uno por pixel. El nmero de operaciones CORDIC es
entonces de N/2 y tambin puede haber conflictos en el proceso de votacin. La
solucin que no produce conflictos es la paralelizacin de los ngulos. En este
caso, se necesita un procesador por ngulo en el cual son procesados
secuencialmente todos los pxeles de la imagen. El nmero total de procesadores
es de N/2 y el nmero de ciclos para la evaluacin de la transformada es N
2
+ la
latencia; se procesa un pixel por ciclo.
Comparacin
La implementacin considerada en [Bruguera, 1996] utiliza una precisin de 12
bits y un procesador CORDIC de 10 etapas (de estas 10 etapas, 6 son las etapas
estndar de las iteraciones, 1 es la de la compensacin del factor de escala y 3
para la realizacin del escalado). Cada etapa consta de dos registros, dos
multiplexores y dos sumadores/restadores. La etapa estndar necesita 24 bits
para cada ngulo almacenado en la ROM.
114
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
CORDIC paralelo
Registros
M ultiplexores
Sumadores/restadores
Tablas LUT
Total
Cantidad.
20-64
20-64
20-64
64-24
bits
-
Area ocupada
20-64-0.5-12 t
a
= 7880-t
a
20640.25212
= 7880
8
20-64-12-u
a
=
15760 t
a
10.64-24-40 i
a
/Kbit = 60 t
a
315 80 x
a
Tabla 4.5 Estimacin del rea ocupada por el CORDIC paralelo
La estimacin de tiempos es la que muestra la Tabla 4.6, asumiendo rf=lns.
CORDIC paralelo
Registros
M ultiplexores
Sumadores /restadores
Tablas LUT
Total
Cantidad
10
10
10
64
-
Tiempo
128-128101 , = 0,164 ms
128-128-10-0.5 , = 0,082 ms
128-128-10-lg 12 T
t
0,573 ms
64-3 t
t
= 192 ns
0.819 ms
Tabla 4.6 Estimacin del tiempo de clculo en el CORDIC paralelo
115
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
La paralelizacin por medio del CBRM consiste, segn la propuesta del captulo
3, en realizar el clculo con mdulos organizados en estructura de rbol. En
este caso, = 64 representa el nmero de incrementos A adentro del intervalo
[0, /2[, que es tambin el nmero de ngulos para los que hay que calcular
p, para cada uno de los 128 x 128 pxeles.
Calculo
paralelizado
Tiempo de clculo
=TN,+TN
2
+ + TN
P
= T(N,+N
2
+ + N
p
)
Nmero de mdulos necesarios
1+ N, + N,N
2
+ , N2N3.+...+.N, N
2
N
3
... Np_i
La descomposicin de en un producto NjN
2
N
p
permite definir la
profundidad del rbol y, adems, la distribucin de los mdulos por etapa incide
en las prestaciones de la arquitectura Para realizar la comparacin con la
propuesta CORDIC paralelo, se plantean dos descomposiciones de N, una que
maximiza el tiempo de clculo y la otra que maximiza el nmero de mdulos
del rbol. As, efectuar la comparacin con las peores condiciones del CBRM.
Descomposicin que maximiza el tiempo de clculo
= , N
2
con ! = 2 y N
2
= 32
Tiempo de clculo = (2 + 32)T = 34
Nmero de mdulos de clculo del rbol = 1+2 = 3
Descomposicin que maximiza el nmero de mdulos
= Ni xN
2
x N3XN
4
N5XN
6
con N = 2 para i e [1, 6]
Tiempo de clculo = (2+2+2+2+2+2)T = 12 , siendo el tiempo de clculo
de un valor.
Nmero de mdulos de clculo del rbol = 1+2+4+8+16+32 = 63
116
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Las Tablas 4.7a y b representan el rea total ocupada por el CBRM en los dos
supuestos, el que maximiza el tiempo, Ni = 2, N2= 32 y el que maximiza el rea
ocupada, N = 2 para i e [1,6].
= 16
t=\
t=2
/=4
=8
Implementation con sumador
secuencial
2x3x34x
a
=408x
a
2x 3 x 6 4 T
a
=384x
a
2 3 X 584 T
a
= 3504 ,
2 X 3x102424 x
a
= 614544 .
Implementation con reductores 4:2
2 3 3 3
= 198 T
a
2x3x63Ta=378T
a
2x3x583Ta=3498x
a
2 x 3 x 102423 x
a
= 614538 T
a
Tabla 4.7a Estimacin del rea ocupada por el CBRM paralelo para = 64
( Ni = 2 y N
2
= 32, tiempo de clculo mximo)
n = 16
/=1
=2
t=4
=8
Implementation con sumador
secuencial
2x63x34x
a
=4284T
a
2 x 63 64 Ta = 8064
3
2x63x584T
a
= 73584T
a
2 x 63 102424
3
= 12905424 T
a
Implementation con reductores 4:2
2 63 33
3
=4158
3
2x63x63Ta = 7938x
a
2x63x583Ta=73458T
a
2 X 63 102423 T
a
= 12905298 T
a
Tabla 4.7b Estimacin del rea ocupada por el CBRM paralelo para = 64
(N = 2 para i e [1,6], rea ocupada mxima)
Las Tablas 4.8a y b representan el tiempo de clculo de los 128 x 128 puntos,
en los dos supuestos: el que maximiza el tiempo, Ni = 2 , N
2
= 32 y el que
maximiza el rea ocupada, N = 2 para i e [1,6], asumiendo que T = lns.
117
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
=16
t=\
t = 2
t = A
t = 8
Implementation con sumador secuencia!
557056 x 74,5 = 0,041 ms
557056x34,5 = 0,019 ms
557056x20 = 0,011ms
557056 14,5 = 0,008 ms
Implementation con reductores 4:2
557056 16 = 0,009 ms
557056x15 =0,008 , ms
557056x15,5 =0,009 , ms
557056 X 15 = 0,008 , ms
Tabla 4.8a Estimacin del tiempo de clculo del CBRM paralelo para = 64
( ] = 2 y N
2
= 32, tiempo de clculo mximo)
=16
t=\
t = 2
t = 4
=8
Implementation con sumador secuencial
196608 X 74,5 =0,015 ms
196608 X 34,5 = 0,007 ms
196608X20= 0,004 ms
196608 X 14,5 = 0,003 ms
Implementation con reductores 4:2
196608X16 = 0,003 ms
196608 X 15 = 0,003 ms
196608X15,5 = 0,003 ms
196608 X 15 = 0,003 ms
Tabla 4.8b Estimacin del tiempo de clculo del CBRM paralelo en funcin de m para = 64
(N = 2 para i e [1, 6], rea ocupada mxima)
Comparando la Tabla 4.7b, que representa los peores resultados en cuanto a
rea ocupada del CBRM paralelo, con la Tabla 4.5, aparece que para valores de
t<4, la implementacin paralela del CBRM ocupa menos espacio que el
procesador CORDIC. El tiempo de clculo correspondiente que aparece en la
Tabla 4.8 b es entre 50 y 100 veces menor para el CBRM que para el CORDIC.
Comparando la Tabla 4.8 a, que representa los peores resultados en cuanto a
tiempo del CBRM paralelo, con la Tabla 4.6, aparece que en el peor caso del
CBRM, que se da para la implementacin con sumador secuencial y / =1, el
tiempo es 20 veces menor que en el CORDIC. La ocupacin de rea
correspondiente que aparece en la Tabla 4.7a es unas 10 veces menor en el
CBRM para t<$.
118
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
4 Aplicacin del CBRM a la
transformada de Fourier
En este apartado se realiza un anlisis formal de la transformada de Fourier para
la cual se propone la aplicacin del CBRM, como mtodo idneo de clculo. El
CBRM se aplica despus de organizar los clculos siguiendo el esquema de
doblamientos sucesivos. Se han seleccionado dos propuestas de clculo de la
transformada de Fourier a fin de compararlas con la implementacin por el
CBRM. La primera considera una implementacin basada en aritmtica
distribuida, con replicacin segmentada de las etapas, que se prueba en una
FPGA [Mintzer, 1996]. La segunda propuesta combina la convolucin cclica
119
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
con la aritmtica distribuida por bloques y utiliza la descomposicin de Cooley
y Tuckey [Chien, 2002].
4.1 Transformada de Fourier
A pesar de su evolucin hacia el dominio espacial, las tcnicas de mejora de la
imagen en el dominio frecuencial siguen motivando gran cantidad de
investigacin. En este sentido, la transformada de Fourier constituye una
herramienta de referencia obligada, til en procesos de filtrado [Chamberlain,
2002] [Peiming, 2001] y de reconstruccin de imgenes [Mozn, 1996].
Recientemente, se ha utilizado la transformada rpida de Fourier (FFT) en
modulacin (OFDM: Orthogonal Frequency Divisin Multiplexing), resultando
as una herramienta valiosa en el mbito de las comunicaciones [Chang, 2000]
[Hsiao, 2000].
El algoritmo ms general desarrollado para el clculo de la FFT es el de Cooley
y Tukey, de 1965, basado en el mtodo del doblamiento sucesivo [Cooley,
1965]. El proceso, que consiste en la descomposicin de la transformada de una
secuencia en mltiples transformadas sobre secuencias de menor tamao, es la
base de todos los algoritmos de la categora FFT y su principal aportacin
radica en la reduccin drstica de la complejidad computacional. As, la
computacin de una secuencia de elementos, que ocasiona, segn la
definicin, una complejidad algortmica de 0(N
2
), se reduce a 0(N log
2
N) con
el mtodo FFT.
Las variantes del algoritmo difieren entre s por las computaciones realizadas y
por la forma en que se almacenan los resultados intermedios [Swarztrauber,
1987]. Estas diferencias originan mejoras sustanciales de alguna prestacin,
como el ahorro de almacenamiento en memoria, en el caso de los algoritmos in-
place; la velocidad elevada en el caso de los algoritmos self-sorting, [Temperton
120
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Sea F(u) la transformada de Fourier discreta (DFT) de una funcin real
unidimensional/( ) de puntos. La transformada de Fourier es compleja y se
expresa en (4.11).
( )
.
( )
^
Desarrollo de la DFT basado en el esquema de doblamientos sucesivos
Por conveniencia se expresar la ecuacin (4.11) como sigue
121
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
F(u) = Yf(x)W"
N^
0
J 2M
(4.12)
donde W
N
= exp
N
Se supone que = 2" = 2M, donde es un entero positivo. La ecuacin (4.12)
puede expresarse entonces como
i i M- l i
F(u) = - ( Y f(2x)W"
{2x)
+ V / ( 2x + 1)PF;
( 2X+)
)
2 M M ^ (4.13)
como ^2
=
^2M ^
a
ecuacin queda en
i M- l i
i M- l
definiendo F
par
{u) = ^f(2x )W,
M
x =0
i M- l
parai/ ==0, 1,2, M-l, la ecuacin se reduce a
F(u) = i ( ^ (ii) + F,,
pa
,. () w
2
V )
2 (4.15)
Asimismo, como W^
+M
= W
u
M
yW^
M
M
= -W
u
se deduce que.
F ( + M) = i (F
par
(ii) - F ^ (u)^
2
"
M
)
2 (4.16)
122
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Aplicacin del CBRM
Se sigue con la transformada de Fourier de = 2
n
= 2Mpuntos. Se procede a
plantear el clculo simultneo pero separado de la parte real e imaginaria de la
transformada.
El nmero de parejas iniciales ser entonces de 2M y su estructura
/ ( * ) + f(x) eos 2
n
'
x
(parte real)
M
f(x) + f(x)sen2
n
~
x
(imaginaria).
M
123
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Calculo de rotaciones mediante CBRM
Sean R
ed par
(u), R
ed mpar
(u), I
ed par
(u), I
ec
impar
(u) las partes, real par e impar,
imaginaria par e impar, respectivamente, de los resultados parciales de la
transformada de Fourier, donde e es un indicador de la etapa de clculo y d el
nmero de orden dentro de la etapa.
Se tomar a
e
= cos(2"-
e
) y = sen{2
n
~
e
)
M M
I
a
etapa: Calcular las M transformadas iniciales de 2 puntos, en su parte real e
imaginaria.
R00
P
ar(u) = / ( 0 ) + , ( ) / ( 2"- ' ) l
0
0par(u) = -
(u)f(2"-> )
R0Hmpar(u) = I
01 impar
(u) = -
{u)f(2
n
'
2
+ 2""
1
)
f(r-
2
) + a
l
(u)f(2
n
'
2
+2
n
-
1
)
ROM-I imparfu)- ^
I m
.^fa)
=
f(2 + 2
2
... + 2
n
~
2
) + -
{ )/{2 + 2
2
+...2"-
2
+2"~
l
)
a
x
{u)f{2 + 2
... + 2
n
-
1
+2"-
1
)
(4.17)
En lo que sigue, en aras a la claridad, se omite el argumento u en las
expresiones del clculo.
2
a
etapa: Pasar de las M transformadas de 2 puntos a M /2 transformadas de 4
puntos
R 1,0 par
=
Ro.Opar + 02 Ro.l impar I 1,0par ~ I0,0par +
2
Ro, 1 impar
-
2
, impar + a21o.i impar
"1,1 impar ' -Ro,2par + (%2 Ro,3 impar il,impar 0,2par + fi2R0.3 impar
-
2
.3 impar + a
2
Io3 impar
124
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
R/.M /2- limparRo,M /2 Il,M /2-limparIo,M /2 par + fi2Ro,M /2+l impar ( 4- 1 )
par ^
- 2 , /2+1 impar
par'(X2 ^- , /2+l impar , r
+ Ct2l0,M/2+l impar
3
o
etapa: Pasar de las //2 transformadas de 4 puntos a M/4 transformadas de
8 puntos
R-2,0 par
=
R 1,0 par + CC3 RJ i
mpar
I2,0par ~ h,0 par +/ ? ? R,1 impar +
P 3 J-l,impar &3 1,1impar
K-2,1 impar K-1,2 par ' &3 K-1,3 impar J-2,1 impar ~ -K 1,2 par ^~y3 "-,3 impar +
~ 31 1.3 impar a
3
1 1.3 impar
(4.19)
R2M/4-1 imparR, /4 f,..,, ,. = / ) , , , , , +
^ ^
1
2M/4-hmpar ^-1,M/4 par ~
OC3 Rl,M/4+l impar ~ 3 Ii,M/4+l impar
A? Rl.M/4+l impar + &3 Il,M/4+l impar
-sima etapa: Pasar de las 2 transformadas de M puntos a una transformada
de N=2M puntos
R
=
Rn-l,0
=
Rn-2,0 par
+
0C
n
R
n
-2,1 impar 1
=
In-l,0
=
In-2,0 paA Rn-2.1impar ( 4 - 2 0 )
+ CC
n
n-2, 1 impar
P n -ln-2,1 impar
En realidad, estos clculos slo se llevan a cabo para la primera mitad de los
valores de u, u = 0, 1, M -\, ya que la segunda mitad precisa de los mismos
125
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Calculo de rotaciones mediante CBRM
clculos salvo la ltima etapa en la cual hay una modificacin en los signos.
Despus de una demostracin sencilla se llega a la expresin resultante (4.21):
R -Rn-1,0 - R-n-2, 0 par ~CC f-n-2,i
impar
+
n-2, 1 impar
para u = M , M +l, ,N-1
I In-l,0In-2,0 par ~ Rn
2,1 impar ~
&n n-2, 1 impar
(4.21)
La aplicacin del CBRM se pone de manifiesto reordenando las operaciones a
partir de la segunda etapa
I
a
etapa: ecuaciones (4.17)
2
a
etapa: 2 Mil operaciones
R 1,0 par - Ro.Opar + &2 Ro, 1 impar y2 0,1 impar
I 1,0par
=
I0,0par + Ro.l impar + (^2^0,1 impar
K-1,1 impar ~*-0,2par ' &2 K-0,3 impar ~ y20,3 impar
l,limpar~ -0,2par +
2
K-0,3 impar 3 impar
Ri , /2-limpar Ro,M2paA (X-2 Ro,M /2+ impar^2lo,M /2+l impar
Il,M /2-limpar
=
h,M /2par + / ?2^0, M/ 2+/ ^ar+ OC2I0M /2+I impar
3
a
etapa: 2 M/4 operaciones
R2,0 par
=
Rl,0par + &3 Rl,l impar -
3
, 1 impar
2,0par ~ 1,0 par
+
3
1,1 impar + a
3
Ii,i impar
R
2,M/4-l impar' =Ri ,M/4 par r
+ CC3 RlM/4+1
impar
fisli. M/4+1 impar
126
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
J-2M /4-1'impar Ri ,M /4 par , /4+l impar impar
n-sima etapa: 2x 2 operaciones
" ~K-n-l,0 ~K-n-2,0 par 'O K-n-2,1 impar ~ P n J-n-2,1 impar
1 ~ n-l,0~n-2,0 par'P n i^n-2,limpar < C
n
ln-2, 1 impar
" ~K-n-],0 ~~ K-n-2,0 par ~0L
n
Kn-2,1 impar < P n ^n-2,1 impar
' ~ ln-l,0~ln-2,0 par ~ P n K-n-2,impar ~0
n
ln-2, 1 impar
Se observa que, a partir de la 2
a
etapa, cualquier par R
ec
, I
ec
se calcula como una
rotacin, definida por los parmetros a
e
,
+ 16
+ 2 8
8
+ 8 t
a
) = 168
Implementation!: 2 (40
+ 20
+ 2 8 x
a
+ 8 x
a
) = 176 t
a
= 40x
a
: 4 ^ +16^ =201,
= 8x
a
133
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
Transformada de 16 puntos:
Tiempo total:
Implementation 1: (2
4
+2
3
-2) X (56 , + 64 , + 2x 0,5 , +1x
t
+ 8 ,) + ( 2
3
- 1) 65 , =
3380 ,
Implementation 2: (2
4
+2
3
-2) X (56 , + 7 , + 2x 0,5 , +1 ,) + (2
3
- 1) 7 t
t
= 1479 ,
Transformada de 8192 puntos:
Tiempo total:
Implementation 1: (2
13
+2
12
-2) X (56 , + 64 , + 2x 0,5 , +1 ,+ 8 ,)+(2
12
- 1) 65 ,
= 186 335 5 ,
Implementation 2: (2
13
+2
12
-2) (56
(
+ 64 , + 2 0,5
(
+1 ,) + (2
12
- 1) 7 , = 82725 5
(
Transformada de 64 puntos:
Tiempo total:
Implementation 1: (2
16
+2
15
-2) X (56 , + 64 , + 2x 0,5t
t
+lT
t
+ 8
(
)+(2
16
- 1) 64 ,=
13238005 ,
Implementation 2: (2
16
+2
15
-4) (56
(
+ 64
4
+ 2 0,5
(
+ 1
(
) + (2
16
- 1) 7 , =
6 848245 ,
Arquitectura
segmentada.
CBRM
Impl. 1
Impl. 2
Transformada de 16
puntos
Area
120 Ta
168 t
a
176 Ta
Tiempo
0,7 10
3
,
3,38 10\
t
1,48
3
,
Transformada de 8192
puntos
Area
46 4
3
168 Ta
176 Ta
Tiempo
1,8 10 \
1,86 10" ,
0,83
6
,
Transformada de 64
puntos
Area
5 6 8
168 Ta
176 Ta
Tiempo
1,9 10
7
,
1,32 10
7
,
0,68 10
7
,
Tabla 4.9 Comparacin entre arquitectura segmentada y CBRM en ocupacin de espacio y tiempo
134
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
4.3 Comparacin CBRM-diseo basado en
aritmtica distribuida por bloques (BDA)
Descripcin de la propuesta BDA
Esta propuesta presenta el clculo de la transformada de Fourier de longitud
variable por medio del control de los parmetros de su arquitectura [Chien,
2002]. El elemento bsico procesa 16/32/64 puntos utilizando la
descomposicin de Cooley y Tuckey de radix 4. Cuando el nmero de puntos
aumenta, se plantea = N X.N2 y el procesamiento tiene lugar en una
combinacin de elementos dispuestos en filas y columnas. Desde el punto de
vista formal, los cuatro trminos de la descomposicin de Cooley y Tuckey se
plantean como una convolucin cclica que permite efectuar los clculos
mediante aritmtica distribuida basada en bloques. Esto consiste en particionar
la memoria en bloques para alojar en cada uno de ellos un grupo de coeficientes
que intervienen en las multiplicaciones que figuran en las expresiones. El orden
en que tengan que intervenir los coeficientes ser controlado por un rotador
externo, evitando as tener que guardar en el bloque todas las combinaciones de
los mismos elementos (tal y como ocurre en la aritmtica distribuida clsica).
Esta arquitectura consigue ahorro de memoria a cambio de un aumento del
135
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
tiempo de clculo y de un rotador aadido al circuito. Adems, en esta
propuesta, se sustituye la memoria ROM por memoria RAM, a fin de tener
flexibilidad a la hora de cambiar los contenidos de memoria cuando se quiere
cambiar el tamao de la transformada.
Siguiendo el orden del flujo de datos, la columna bsica consta de un buffer de
entrada, un procesador CORDIC que realiza las operaciones de multiplicacin
compleja del pre y postprocesamiento, seguido por un registro paralelo-serie
(P/S) y un rotador; cuatro memorias RAM y diecisis acumuladores
implementan la aritmtica de bloques. Al final hacen falta cuatro buffers que
reordenan los productos parciales para efectuar la operacin mnima de cuatro
puntos. La complejidad algortmica de esta propuesta es 0( xW
L
) , siendo
4M
el tamao de la transformada
M = 4 en este diseo
Wi la precisin de los datos.
Cuando se tiene una transformada larga (de ms de 64 puntos) el factor N se
sustituye por el producto N x N
2
en la expresin del coste.
En la Tabla 4.11 se presentan algunos resultados obtenidos realizando la
descripcin del circuito en Verilog HDL y la sntesis en Sinopsis.
Tiempo
por
columna
Camino
crtico
preprocesador
13,71 ns
17,7 ns
P /S RAM
12,45 ns
17,7 ns
Sum ador+ ACC
14,06 ns
17,7 ns
postprocesador
17,7 ns
17,7 ns
DFT4
puntos
10,35 ns
17,7 ns
Total
68,27 ns
88,5 ns
Tabla 4.10 Camino crtico en el mdulo bsico del diseo basado en aritmtica distribuida por bloques
136
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Comparacin
A fin de realizar la comparacin entre el CBRM y la arquitectura BDA, se
realiza una estimacin del rea ocupada comparando el hardware que interviene
en cada circuito, a nivel de dispositivos utilizados (Tabla 4.12). En la Tabla 4.13
la comparacin se realiza en trminos de x
t
y x
a
. Para el CBRM, se asume que la
LUT es una ROM de 64 celdas ya que los parmetros son tres (a, , 1); los
datos tienen una longitud de 16 bits en ambas propuestas.
16
64
512
4096
Dispositivos utilizados por la arquitectura BDA
5 buffers, procesador CORDIC, P/S-R,
un rotador, 4 RAMs 4x16 bits, 16 MAC
5 buffers, procesador CORDIC, P/S-R,
un rotador, 4 RAMs 16 xl6 bits, 16 MAC
9 buffers, procesador CORDIC, 2 P/S-R,
un rotador, 8 RAMs 8x16 bits, 32 MAC,
memoria de transposicin
9 buffers, procesador CORDIC, 2 P/S-R,
un rotador, 8 RAMs 16x16 bits, 32 MAC,
memoria de transposicin
Dispositivos utilizados por dos
mdulos CBRM calculando de
forma cruzada
4 MUX, 8 S-R, 4 MAC,
2 LUT 64x16 bits
2 sumadores
Tabla 4.11 Comparacin del hardware necesario en las arquitecturas CBRM y BDA
En la Tabla 4.11 no se consideran ni el rotador ni el procesador CORDIC de la
arquitectura BDA en el clculo del rea, ya que la referencia consultada no
precisa la estructura de ninguno de ellos.
Para estimar el tiempo medio de computacin, se utilizan las indicaciones del
autor, asumiendo que los tiempos de acceso a la ROM, del sumador y del
cerrojo son los que figuran en el captulo 3.
Tiempo medio de computacin: (
l
~xW
L
)(T
Rm
+ 2T
ADD
+ T
LATCH
)
137
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
16
64
512
4096
Arquitectura BDA
Area
314
344 t
a
632 t
a
672 T
a
Tiempo
3,3 10
3
,
13,2 10
3
,
105,6 10
3
,
844,8 10
3
,
Arquitectura CBRM(dos mdulos calculando de
forma cruzada)
Implementation!
Area
168
8
Tiempo
3,38 10
3
,
14,235
3
,
116,36 10
3
,
921,515 10
3
,
Implementation!
Area
176
0
Tiempo
1,48 10
3
,
12,44 10
3
,
101,36 10
3
,
812,79 10
3
,
Tabla 4.12 Comparacin de las arquitecturas CBRM y BDA en trminos de x
a
y ,
Conclusin
Aparece claramente que la arquitectura BDA es ms costosa en cuanto a
ocupacin de rea que la arquitectura CBRM. Para los valores de considerados,
los tiempos de la BDA son ligeramente inferiores a los tiempos de la
implementacinl del CBRM, pero superiores a los de la implementacin 2 de
ste. Adems, la implementacin 2 es la que consigue menores aumentos de
tiempo cuando aumenta N.
Comparacin CBRM- otras propuestas
En la tabla 4.13 se reagrupan de forma resumida los costes hardware y de tiempo
de diversas propuestas facilitadas en [Chien, 2002], En todas ellas, TV representa el
nmero de puntos de la transformada. Las cuatro primeras referencias basan su
diseo en matrices sistlicas, la quinta en sumadores y las dems en aritmtica
distribuida. La ltima es el CBRM. El CBRM es la mejor propuesta en cuanto al
coste hardware; en cambio, el tiempo de clculo es proporcional al nmero de
138
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
Chang and
Chen
Fang and Wu
Murthy and
Swamy
Chan and
Panchanathan
Chang and
Guo
Diseo DA
Diseo BDA
CBRM
M emoria
0
0
0
0
4N- 4
(RAM)
N
1
4
(ROM)
0-a
4
(ROM)
2xW
L
x
2
3
(ROM)
Sum.
2N+6
6N+7
il
4
N+4
4
2+2
Mult.
N+4
0
0
0
0
Reg-
de
desplaz.
6N
6N
ION
m
4N-2
5N
3N
2
Reg.
P /S
0
0
0
0
0
4
0
CORDIC
0
0
0
0
0
0
N
+ 4
4
0
Tiempo medio de
clculo
Nx
(2Tmult+2Tsum+Tcerrojo)
Nx
(2Tmult+2Tsum+Tcerrqjo)
Nx
(2Tmult+2Tsum+Tcerrojo)
Nx
(2Tmult+2Tsum+Tcerroj o)
N/2x
(Tsum+Tcerrojo+Tsum.red)
W
L
x
(TROM+2Tsum+Tcerrojo)
M WL / 4
(T
R
oM+2Tsura+Tcerrojo)
(3W/2-2)xW
L
T
ROM
+
(yV-l)W
L
xTsum
Tabla 4.13 Comparacin de la arquitecturas CBRM con otras propuestas
139
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
5 Aplicacin del CBRM a otras
trans formadas
La transformada de Fourier puede utilizarse para establecer un patrn de clculo
para otras transformadas. Para ello, se realizan pequeas transformaciones
matemticas que se exponen a continuacin.
Transformada de Hartley
Sea H(u) la transformada de Hartley discreta (HDT) de una funcin realf(x).
TT ! V"
1
' y/ w
2 m a
2nux .
H(u) = > f(x )(cos sen )
Nf (4.22)
H(u) es una funcin real cuyo clculo puede partirse en dos fragmentos, el que
corresponde al seno y el que corresponde al coseno, que se sumarn al final. El
desarrollo es idntico al de la DFT, aadiendo la etapa final que es la suma de los
fragmentos calculados. Llamando R(u) la parte del sumatorio que incluye al
coseno e I(u) la parte que incluye al seno:
H(u) = R(u)+I(u)
Transformada del coseno
Sea la transformada discreta del coseno (DCT) de una funcin rsdlf(x).
N- \
m
.
C(u) = e(k)Y f(x) cos(2x + 1)
y
2 (4.23)
140
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
C(u) es una funcin real cuyo clculo puede partirse en dos fragmentos y
recomponerse al final como una suma ponderada de stos. Los clculos se
organizan de la manerasiguiente:
f (x) COSZX + 1) = / (x) COS h )
2N 2N
Desarrollando el coseno de la suma se obtiene:
r
,
x
, 7TUX Tul TJUX Tul
N
/ (x)(cos eos sen sen )
2N IN
entonces la expresin de C(u) es
C(u) = e(k)y f(x)(cos cos sen sen )
tu
2 2
Para cada valor de u las cantidades COS[TU/2NJ y sen[mi/2N] permanecen
constantes y pueden salir fuera del sumatorio
Tul 7M _
Si eos = a, sen = p
2N " 2N "
N- \ N- l
C(u) = e{k){a
u
/ ( * ) cos +
f{x)sen - ^ )
x=o
x
=
0
Los fragmentos definidos pueden calcularse siguiendo el planteamiento de la
DFT, llamando R(u) e I(u) a los sumatorios que corresponden al coseno y al
seno, respectivamente. El resultado final para cada valor de u se obtiene
mediante la operacin de combinacin:
C(u) = a
u
R(u) + p
u
I(u)
141
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Clculo de rotaciones mediante CBRM
En resumen, el CBRM se aplica fcilmente a la evaluacin de las transformadas
de la imagen que poseen ncleo trigonomtrico, utilizando un patrn nico de
organizacin de los clculos.
Para transformadas que no poseen ncleo trigonomtrico, el clculo puede
inspirarse en el de la DFT. Como ejemplo, se proponreel clculo de la
transformada de Walsh.
Transformada de Walsh
La transformada de Walsh de una funcin re&\f(x) unidimensional se expresa de
la manera siguiente:
W( u) = / W^rf (-1)"
(, ,
"
(,)
= V /=o (4.24)
Al igual que la DFT, esta transformada puede evaluarse ordenando el clculo a
partir del modelo de doblamientos sucesivos y aplicando posteriormente el
CBRM con la modificacin correspondiente, que consiste en igualar a 0 los
parmetros y a 1 los parmetros a de las ecuaciones (4.14)-(4.16), de manera
que los valores de W(u) resultan ser sumas algebraicas de las muestras f(x).
Se tratara de manera idntica la transformada de Hadamard.
142
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 4
6 Conclusin
El presente captulo se ha dedicado enteramente a la validacin del modelo
CBRM, objeto de estudio de este trabajo de investigacin. Para ello, se ha
procedido a acoplar el CBRM al clculo de las rotaciones, consideradas stas
como paradigmticas, por el alto nivel de derivacin que precisan en las
arquitecturas habituales as como por su presencia en reas importantes de la
ciencia y la ingeniera. En trminos prcticos se evala la bondad del modelo
CBRM comparndolo con otras propuestas en el clculo de las transformadas de
Hough y Fourier, que se basan en rotaciones.
En el caso de la transformada de Hough, el CBRM demuestra su bondad frente
al CORDIC, en sus versiones serie y paralela confirmando su mejor
comportamiento en el ahorro de rea y hardware as como en la velocidad.
En el caso de la transformada de Fourier, se han presentado esencialmente dos
propuestas frente a las cuales el CBRM consigue mejores prestaciones.
En una comparacin de corte ms general efectuada al final del captulo,
aparece que el comportamiento del CBRM es muy bueno en cuanto a relacin
rea-tiempo, y ello lo hace ser un buen candidato para el desarrollo de
dispositivos VLSI. El tiempo de clculo proporcional al nmero de puntos y a la
precisin puede mejorar sensiblemente mediante algn tipo de paralelizacin, a
cambio de un aumento de rea ocupada. Hay que destacar que el ahorro de rea
se debe sobre todo a la memoria que slo es proporcional al tamao de los
datos.
143
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Volver al ndice/Tornar a l'ndex
144
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
Capitulo 5
SIMULACIN DE COMPORTAMIENTO
DIFCILMENTE FORMALIZABLE
1 Introduccin
Entendemos que un comportamiento es difcilmente formalizable cuando resulta
difcil captar su esencia por medio del utillaje matemtico del que se dispone
habitualmente. Bajo este epgrafe caben los procesos artificiales no
suficientemente especificados y, sobre todo, los procesos naturales,
relacionados o no con la vida.
Tradicionalmente, la biologa ha recurrido a modelos biofsicos para explicar el
comportamiento del tejido vivo, con la limitacin de tener que relacionar
cualquier parmetro del modelo con su equivalente fsico [Hodgkin, 1952]. A la
hora de remedar las propiedades colectivas de un sistema biolgico, las redes
neuronales artificiales sustituyen el modelo biofsico, superando as el
inconveniente de la falta de genericidad inherente al modelado biofsico. Sin
embargo, a pesar de las numerosas analogas que se encuentran entre las redes y
los procesos computacionales propios de la biologa, existe en general una gran
dificultad para establecer relaciones entre el modelo y los resultados
experimentales obtenidos. Se tiene conocimiento de ciertas similitudes muy
145
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
localizadas, por ejemplo, entre las memorias asociativas y el hipocampo, sede
del aprendizaje [O'Keefe, 1979], tambin con el olfato [Gelperin, 1989] y el
procesamiento visual [Koch, 1985]. A pesar de ello, estos modelos no han sido
corroborados desde la neurofsiologa. Desde un planteamiento inverso, la
computacin artificial ha considerado en los ltimos tiempos la conveniencia de
copiar del mundo vivo algunas formas de procesar la informacin. Todo ello ha
dado lugar a una va de aportacin bilateral que ha cristalizado en una enorme
cantidad de conocimiento.
La propuesta de un enfoque CBRM para simular el comportamiento de sistemas
con estas caractersticas persigue el objetivo de una resolucin desde la
perspectiva funcional. Esta va es muy atractiva por su capacidad para
reproducir los comportamientos sofisticados de un sistema sin necesidad de
conocer los detalles estructurales que los provocan. As, un mdulo CBRM
puede representar una neurona, un conjunto de neuronas o una red de conjuntos
de neuronas, ya que no hay necesidad de establecer correspondencias entre
estructuras naturales y artificiales. Ms concretamente, el CBRM trata el
comportamiento difcil de formalizar como una funcin no abordable a nivel de
primitivas sino con un mayor nivel de derivacin.
En este captulo se aborda de manera emprica la evaluacin de funciones a
niveles ms altos que el nivel de las primitivas, como introduccin a lo que ser
un estudio en profundidad que se deja como lnea de trabajo futura. Se
presentan dos ejemplos pertenecientes al campo de la neurociencia. Primero, se
considera una simplificacin bottom-up del modelo de cable de Traub [Traub
1991], que presenta un modelo bicompartimental de la neurona (soma y
dendritas). La estimulacin de cada compartimento bajo diferentes condiciones
experimentales produce patrones de comportamiento diferenciados. Se pone en
evidencia la capacidad del CBRM para reproducir fielmente el espigueo
obtenido por la simulacin de las ecuaciones del modelo biofsico simplificado
en la zona CA3 del hipocampo, sede del aprendizaje. En segundo lugar, se
146
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
2 Aplicacin del CBRM a los procesos
computacionales biolgicos
En este apartado, los procesos computacionales biolgicos considerados son los
que se tienen lugar en el sistema nervioso.
En 1894 fueron establecidos por S. Ramn y Cajal los primeros principios de la
neurociencia. Sobre estos principios se han construido los distintos modelos
propuestos, desde el modelo ms simple en el que una neurona equivale a un
punto (soma) hasta los modelos ms completos que hacen intervenir todas las
dems estructuras nerviosas (axn, rbol dendrtico,...) Los registros
fisiolgicos obtenidos por medicin directa en el tejido nervioso son funciones
de difcil formalizacin matemtica, como evidencian los circuitos electrnicos
necesarios para simularlas con todo el detalle, por tanto, son buenos candidatos
para la simulacin por el CBRM. Los dos ejemplos que se van a tratar en este
apartado han sido resueltos previamente por modelo biofsico y por red
asociativa, respectivamente. Despus de facilitar en cada caso una breve
descripcin de las caractersticas del fenmeno estudiado as como del
fundamento del modelo utilizado, se aborda la resolucin desde el CBRM
comparando posteriormente los resultados.
147
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
2.1 Generacin de brotes inductores de espigas en la
regin CA3 del hipocampo
Descripcin y simulacin del modelo biofsico
La regin CA3 del hipocampo genera espigueo sincronizado en condiciones
experimentales diversas, habindose reducido previamente la inhibicin. Existe
gran cantidad de estudios experimentales basados en registros fisiolgicos
(Chamberlin et al. 1990), (Miles et al, 1988) y corroborados por modelos
matemticos, de las propiedades intrnsecas de las neuronas de la regin CA3
(Traub and Miles, 1991), (Traub et al. 1993). El modelo de Traub, o modelo de
cable compartimentai, establece una particin en 19 compartimentos de una
clula piramidal de CA3. Cada compartimento contiene hasta seis conductancias
inicas controladas por diez variables que representan el cierre o la apertura de
canales. La dinmica de estas variables se construye en coherencia con los datos
experimentales obtenidos en fisiologa. El modelo de Traub, enormemente
complejo, ha sido simplificado por Pinsky y Rinzel, (Pinky y Rinzel, 1994),
quedando en un modelo de dos compartimentos (soma y dendritas) con ocho
variables, que tiene la ventaja de poner en evidencia los aspectos esenciales del
modelo de Traub, con un manejo ms fcil de la dinmica celular y global, para
rangos amplios de valores de los parmetros. Este modelo es el que se analiza
aqu. El modelo simplificado segrega las corrientes ms rpidas de las ms lentas,
situando las primeras en el soma y las segundas en las dendritas, a la vez que
describe tres comportamientos prototpicos como respuesta a una estimulacin
somtica o dendrtica. Se trata, en todos los casos, de la produccin de espigueos,
de baja (8 a 20 Hz) o muy baja frecuencia (< 8 Hz). En este modelo las espigas
slo aparecen en un rango intermedio de conductancias de acoplamiento (estas
conductancias van ligadas al NMDA, N-metil D-aspartato y al AMP A), cuyos
extremos son una baja conductancia, responsable de desacoplar los
148
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
compartimentos o una alta conductancia, que significa que el soma y las dendritas
estn fuertemente acoplados, resultando un compartimento nico. Las corrientes
que generan el espigueo son posibles slo para valores moderados del
acoplamiento electrotnico.
La explicacin fisiolgica subyacente al fenmeno del espigueo es la siguiente:
en este sistema, el brote siempre viene inducido por un pico de sodio que procede
del soma. Cuando el acoplamiento entre compartimentos es moderado, este pico
repolariza parcialmente las dendritas retardando as el pico de calcio dendrtico.
Esta combinacin constituye el brote. En el mismo trabajo, Pinsky y Rinzel
abordan el estudio de una red de 100 neuronas de tipo bicompartimental, a fin de
examinar los fenmenos de sincronizacin y de saturacin. La estimulacin breve
de una sola clula del conjunto produce un brote sincronizado, siendo la sinapsis
del AMPA el mecanismo dominante de sincronizacin de las espigas. El nmero
de brotes aumenta con el nivel de NMDA, llegando al espigueo indefinido para
un nivel suficientemente alto de la conductancia NMDA. Existen dos factores
capaces de desincronizar las clulas cuando las sinapsis de AMPA estn
bloqueadas que son, por una parte, la heterogeneidad de las propiedades de las
clulas y por otra, la dinmica intrnseca de brotes caticos que las clulas
presentan.
La figura 5.1 representa un esquema del modelo bicompartimental de Pinsky y
Rinzel, en el cual se pueden observar las corrientes aplicadas y las corrientes
activas que entran y salen del soma y las dendritas.
149
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
syn
L
Ca
Fig 5.1 Modelo bicompartimental de Pinsky y Rinzel
Corrientes inicas:
El primer compartimento (soma) cuenta con dos corrientes dependientes de
voltaje que generan picos rpidos de sodio, I
Na
corriente entrante y una corriente
saliente rectificadora inducida por potasio I
K
-DR.
El segundo compartimento (dendritas) tiene una corriente entrante de calcio I
Ca
,
existen dos corrientes de potasio: I
K
_c y lK-AHp(posthiperpolarizacin).
Corriente sinptica:
Isyn
=
I NMDA + IAMPA
Corrientes de electrodo
150
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
El modelo biofsico se basa en las ecuaciones diferenciales siguientes, que
expresan el balance de las corrientes entre los dos compartimentos:
C V ' =
-heak(V
s
)-I
Na
(V
s
, h) -I
K
.
DR
(V
s>
n) + (g
c
/p)(V
d
-V
s
) + IJp
C
m
Vd
=
(5.1)
-heak(Vd) - lea (V
d
, h) ~I
K
-AHP (V
d
, q) - I
K
.
C
(V
d
, Ca, c)
IsyJO-p) + (gJ(l-p))(V
s
-V
d
) + I
d
/(l-p)
V
s
', V
d
'son las variaciones de V
s
, V
d
respectivamente
Ca concentracin de calcio
activacin rpida
q activacin lenta variable dependiente de la concentracin de Ca
c activacin rpida < 6 ms
s activacin rpida < 6 ms
h inactivacin rpida
proporcin de rea ocupada por el soma
Cm capacidad del cable
151
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
En las figuras 5.2 a-e se muestra la generacin de distintos comportamientos de
tipo espiga segn los valores de los tres parmetros
8
( /
2
), g
N
MDA(mS/cm
2
),
g
c
(mS/cm
2
). La escala vertical que aparece en la figura 5.2a equivale a 40 mV,
200 unidades de Ca para cualquier grfica; la escala horizontal que slo aparece
en la figura 5.2e representa 400 ms para la figura 5.2 a y 200 ms para las dems.
Todas las simulaciones han sido realizadas escribiendo un programa en
FORTRAN, ejecutado en una estacin de trabajo IBM RS6000 RISC. Las
ecuaciones diferenciales (5.1) se resuelven utilizando el mtodo de Runge-Kutta
con un paso de iteracin de 0,05 ms. El modelo de neurona presentado cuenta con
8 variables (frente a las 120 del modelo de Traub) y la relacin del tiempo de
ejecucin entre los dos modelos es de 0,09.
Fig. 5.2 a Brote de muy baja frecuencia inducido por activacin somtica (0,75-0,0-2,1)
152
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
Fig. 5.2 b Brote de baja frecuencia inducido por activacin dendrtica (-0,5-1,25-2,1)
;
I '
!
i M '
j.i ^/ t AiiLtdJ i IU11.1 i, i .u j i ! i
Fig 5.2 c Picos de alta frecuencia en el soma con I
s
mayor que en 5.2a (2,5-0,0-2,1)
I
\ i- ,
' ! , ,
V* '
i:
Fig 5.2d Idnticas condiciones a las de 5.2c pero con mayor acoplamiento (2,5-0,0-10,5)
153
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
JLU&l/ Lw i
Ww
Fig 5.2 e Estimulacin dendrtica y acoplamiento bajos (-0,5-1,75-1,425) produce espigueo complejo
formado por picos seguidos de brotes.
Simulacin CBRM
Las Figuras 5.3 a-e muestran los resultados obtenidos mediante simulacin por el
CBRM. En el eje de abscisas, se representa el nmero de la iteracin en curso y el
valor de las ordenadas depende del valor arbitrario del punto inicial, que
habitualmente se toma igual a 1. La bsqueda de los valores de los parmetros
que caracterizan la primitiva utilizada en cada caso desborda el alcance de este
trabajo de investigacin, quedando la presentacin de los ejemplos como
prembulo de una de las lneas de investigacin futuras.
154
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
1,2
1 -
0,8 -
0,6 -
0,4 -
0,2 -
C
1
) 50
A. Entrada somtica
-
1
'
100 150
1
200
'.
1
250
Fig 5.3 a
Simulacin por
el CBRM del
registro de la
Figura 5.2 a
1,2
1
0,8 1
0,6
0,4
0,2
0 L
0
4J
50
B. Entrada dendrtica
100 150 200 250
Fig 5.3 b
Simulacin por
el CBRM del
registro de la
Figura 5.2 b
155
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
Fig 5.3 c
Simulacin por
el CBRM del
registro de la
Figura 5.2 c
Fig 5.3d
Simulacin por
el CBRM del
registro de la
Figura 5.2 d
156
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
1,2
1
0,8
0,6
0,4
0,2
0
. Entrada dendritica, dbilmente acoplada
50 100 150 200 250
Fig 5.3e
Simulacin por
el CBRM del
registro de la
Figura 5.2 e
2.2 Generadores centrales de patrones neuronales
(CPGs)
Descripcin y simulacin por memoria de Hopfeld
Los CPGs son redes nerviosas que controlan los msculos involucrados en la
ejecucin de comportamientos rtmicos bien definidos, como respirar, andar,
nadar, masticar. Algunas de estas redes estn anatmicamente localizadas,
contienen un nmero reducido de neuronas y su salida consiste en patrones de
oscilaciones coherentes. Estas caractersticas hacen de los CPGs buenos
candidatos para el estudio de la relacin entre las propiedades de salida de una red
biolgica y la circuitera asociada.
Existe una amplia gama de estudios realizados sobre los comportamientos
rtmicos que ponen de manifiesto algunos principios generales de
funcionamiento:
157
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
Una salida rtmica puede aparecer incluso en ausencia de retroalimentacin
sensorial de los msculos y estructuras controlados por el CPG y en ausencia
de control por parte de los centros nerviosos de ms alto nivel (Grillner,
1975).
Algunos CPGs funcionan sin maracapasos, que es una neurona cuyos
disparos determinan el perodo de salida de la red. Un ejemplo de este caso es
el CPG que controla el movimiento natatorio de Tritonia Diomedea, que se
considera en este estudio.
El mismo conjunto de neuronas motoras puede estar involucrado en una gran
variedad de comportamientos rtmicos en un animal y ello sugiere que el
mismo CPG es capaz de producir distintos patrones de comportamientos
rtmicos.
La salida de los CPGs puede ser modulada por entradas externas como son la
retroalimentacin de los propioceptores y de los centros nerviosos de ms alto
nivel.
Se presenta en este estudio la simulacin del CPG que controla el movimiento
natatorio del molusco Tritonia diomedea por una memoria asociativa de tipo
Hopfeld.
El modelo consta de neuronas interconectadas. La salida de cada neurona V(t)
vara entre cero (estado de reposo) y uno (estado de mxima actividad). El estado
de la red viene especificado por la actividad de salida de todas sus neuronas y un
patrn de comportamiento se define por una secuencia temporal en la que aparece
un subconjunto de todos los estados de salida existentes.
Sin entrar en la descripcin detallada del ritmo natatorio de Tritonia diomedea,
cabe decir que su CPG consta de cuatro grupos de neuronas, VSI-A, VSI-B, C2 y
DSI. Las neuronas VSI son las que accionan las interneuronas de la zona ventral;
158
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
[
f 1 ^ . j * . I&.JUL l i l i l hUin.u
:
1 ".'fl.i.lJL I J
I 5 s
I ._ _
TIME
Fig 5.4 Registros fisiolgicos de los estados V,(t), V
2
(t), V
3
(t) y V
4
(t)
La simulacin por una memoria de Hopfeld del comportamiento del CPG no lo
reproduce exactamente, como se observa en la Fig 5.5. Sin embargo, el circuito
electrnico de simulacin tiene cierta complejidad (ver Fig 5.6). En l, las
neuronas se representan por amplificadores saturados, las conductancias
representan las conexiones entre pares de neuronas y se indica el peso sinptico
en cada una de ellas.
159
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
f.) > ?
J o
3
, O
C2
OSI
VSI
VSI
I
IR I
I 1 II
I
I I M11
I99H
TIME
Fig 5.5 Simulacin de los estados V^t), V
2
(t), V
3
(t) y V
4
(t) del CPG por una memoria de Hopfield
..V 4h~
- [ - J - - - j y ( u )
v
V,m !
1 1 ' ' '
! . VK
7 1q(uj>
SYNAP! IC: (.'!..)NNI.-.C i HM'r
NURONF
Fig 5.6 Circuito que implementa el CPG modelado por la memoria de Hopfield
160
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
1,2 -,
1 I
0,8 -j -
0,6 - | | |
0,4 1
0,2 j
o -lui
-0,2 11 I'
-0,4 -'
cs
^ \
C2
11 UUjMM,
ra|lto
Ir
ok i
- ^
c
- -
-
"
J c -^-
Fig 5.7 a Simulacin por el
CBRM de V, (t)
1,2
-0,4
DSI
Fig 5.7 b Simulacin por el
CBRM de V
2
(t)
161
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Simulacin de comportamiento difcilmente formalizable
Fig 5.7 c Simulacin por el
CBRM de V
3
(t)
Fig 5.7 d Simulacin por el
CBRM de V
4
(t)
3 Conclusin
El presente captulo contribuye a la validacin experimental del CBRM en el
mbito de lo que se ha denominado comportamiento difcilmente formalizable. A
diferencia del anterior, este captulo aborda empricamente la evaluacin de
funciones, ya no a nivel de primitivas, sino a niveles superiores de derivacin. A
162
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 5
partir de los resultados alentadores obtenidos en los casos considerados, el CBRM
aparece como una aportacin interesante en casos en los que el nico
conocimiento que se tiene de un comportamiento es una coleccin de puntos. Se
pone de manifiesto que el CBRM es capaz de remedar con apreciable fidelidad el
comportamiento de sistemas sin necesidad de conocer el detalle fino de su
estructura. Los subsistemas neuronales son un ejemplo de ello. La sistematizacin
de esta cuestin queda como lnea abierta de investigacin.
163
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Volver al ndice/Tornar a l'ndex
164
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 6
Capitulo 6
CONCLUSIONES
1 Aportaciones
Esta memoria recoge los resultados de una investigacin orientada a la mejora de
prestaciones de los computadores. La aportacin esencial consiste en utilizar
tcnicas iterativas de clculo del sucesor para poder obtener valores de funciones
al nivel de operacin de las primitivas del procesador o mediante muy pocos
niveles de procesamiento. Se pueden evaluar as funciones que requieren
habitualmente niveles muy elevados de derivacin, cuando el procesamiento
utilizado es el convencional, basado en las tcnicas de clculo polinmico que
resultan de considerar las estructuras algebraicas de los conjuntos de los nmeros.
El camino seguido por la investigacin se inicia con una revisin de la operatoria
habitual efectuada por los computadores, desde la perspectiva de la aritmtica del
procesador, centrada fundamentalmente en las primitivas suma y multiplicacin,
as como en los distintos algoritmos empleados en el clculo de funciones.
Asimismo se ha extendido la revisin a algunas primitivas que centran la
computacin en procesadores especializados, en ramas de la informtica como la
computacin grfica y el anlisis de imagen. Todas estas consideraciones han
puesto de manifiesto que los esfuerzos de la investigacin que se realiza para
mejorar el rendimiento en la computacin se vienen desarrollando segn dos vas:
165
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Conclusiones
por una parte, la bsqueda de primitivas nuevas para tratar casos particulares
concretos y, por otra, la mejora en el rendimiento de las primitivas habituales con
la finalidad de extender esta mejora a cualquier clculo derivado.
La convolucin de dos funciones expresa el resultado de evaluar una de ellas
tomando a la otra como referencia. A partir de esa nocin se ha obtenido una
expresin recursiva de la funcin de convolucin que permite calcular el valor
siguiente mediante una suma ponderada; esto es, mediante la suma de dos
multiplicaciones
Los factores de ponderacin utilizados en el proceso iterativo adquieren el papel
de caracterizacin de la funcin resultante lo cual, grosso modo, puede
interpretarse como que sus valores constituyen una expresin condensada de la
lgica relacional algebraica que se utiliza en la notacin explcita de la expresin
de las funciones.
Precisamente, es el establecimiento de los valores de los factores de ponderacin
el objetivo que se encomienda a la unidad de control que se convierte, de esta
manera, en una estructura realmente sencilla cuyo cometido, adems de cargar los
valores de ponderacin, es iniciar las operaciones y gobernar la iteracin.
Desde el punto de vista de la algoritmia que obtiene los clculos, el mtodo
consiste en obtener un nuevo valor de la funcin en cada paso de la iteracin a
partir del valor de la funcin obtenido en el paso de iteracin precedente. Esto
significa que se necesita establecer un valor de iniciacin de la iteracin y un paso
de iteracin. El mbito de aplicacin se ver potenciado por la necesidad de
obtener colecciones de valores de las funciones como, como por ejemplo,
mustreos temporales, barridos o representaciones de comportamientos en
intervalos.
166
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 6
Los criterios de utilizacin del paso de iteracin abren, por su parte, la va para la
incorporacin, de manera intrnseca, de paralizacin de la operatoria. Se puede,
pues, operar en el extremo de la secuencialidad estricta, con el paso bsico, el ms
grande que permita la granularidad del problema y calcular as un valor en cada
paso de iteracin partiendo del valor obtenido en la iteracin anterior. Utilizar un
paso de iteracin mltiplo del bsico permite obtener valores semilla de iniciacin
a partir de los cuales se pueden lanzar hilos paralelos de clculo. La paralelizacin
puede extenderse a varios niveles de profundidad, formando un rbol. En esto
puede haber una clave para derivar funciones ms complejas.
Seguidamente, se resume la aportacin realizada por esta tesis a lo largo de sus
seis captulos.
En el captulo primero, de introduccin, un breve repaso de la historia del
procesamiento de informacin pone de manifiesto que esta cuestin ha estado
presente, al menos de forma explcita, desde la Antigedad. La emergencia de la
informtica y su posterior desarrollo que se debe, tanto al refinamiento de los
mtodos como a la mejora constante de las realizaciones, persigue un objetivo
primordial: resolver cada vez mejor lo que se aborda. Esta tesis pretende aportar
su contribucin a este objetivo. Despus de realizar una revisin del estado del
conocimiento actual en torno a las cuestiones consideradas de inters, la
propuesta de esta investigacin, en aras a la mejora de prestaciones, va por la
lnea de disminuir el nivel de derivacin, propio de los procesadores
convencionales, en el clculo de funciones. Ello conlleva una propuesta de
primitivas nuevas que definen un procesador.
El captulo dos presenta el mtodo de evaluacin recursiva basado en
convolucin, CBRM. Este mtodo se fundamenta sobre dos ideas. Primero, que la
convolucin de dos funciones expresa el resultado de evaluar una de ellas
167
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Conclusiones
tomando a la otra como referencia. Segundo, que una operatoria distinta de la
habitual puede disminuir el nivel de derivacin que precisa el clculo de
convoluciones. Despus de justificar tericamente el papel que desempea la
convolucin, se desarrolla una operatoria recursiva que calcula las convoluciones
a nivel de primitivas, iterando una forma paramtrica. sta encierra, en el valor de
sus parmetros, las caractersticas de las funciones que intervienen en la
convolucin. Los intervalos de pertenencia de los parmetros definen
comportamientos diferenciados, poniendo de manifiesto la potencia del mtodo.
El captulo tres se dedica a la presentacin y evaluacin de la arquitectura del
procesador CBRM. El funcionamiento necesita establecer un valor de iniciacin
de la iteracin y fijar el valor del paso de iteracin. Se realizan las mediciones
pertinentes de tiempo de clculo y rea del mdulo de clculo del procesador
CBRM. Los criterios de utilizacin del paso de iteracin incorporan, de manera
intrnseca, la paralelizacin de la operatoria. En efecto, el paso bsico,
determinado por la granularidad del problema, permite operar en el extremo de la
secuencialidad estricta, y calcular as un valor en cada paso de iteracin partiendo
del valor obtenido en la iteracin anterior. Si se utiliza un paso mltiplo del bsico
se obtienen valores que inician hilos paralelos de clculo. La paralelizacin puede
extenderse a varios niveles de profundidad, formando un rbol. Se efectan
mediciones de eficiencia, productividad y ganancia en velocidad, dependiendo de
la distribucin de los clculos en los hilos paralelos.
El captulo cuatro corrobora la validez del CBRM exponiendo su aplicacin en el
caso de algunas transformadas muy utilizadas en muchos y muy diversos mbitos.
Las transformadas de Hough y el conjunto de transformadas ortogonales,
encabezado por la transformada de Fourier, constituyen un banco de pruebas
interesante. El estudio y comparacin que se realiza de la aplicacin del CBRM
frente a otras propuestas existentes aporta resultados alentadores, sobre todo en
168
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 6
cuanto a los tiempos de clculo. Adems, todas las transformadas consideradas
obedecen a un mismo patrn de clculo tratable por el CBRM. Ello induce a
pensar que este mtodo pueda ir en la lnea de la genericidad y la robustez.
El captulo cinco presenta, bajo el epgrafe de "Simulacin de comportamiento
difcilmente formalizable" dos ejemplos de funciones no tratables a nivel de
primitivas por el CBRM. Se anticipa para ellos una solucin emprica a modo de
introduccin de lo que ser el desarrollo posterior del mtodo en cuanto al
problema de los niveles de derivacin, parte que queda como lnea de trabajo
futuro.
El captulo seis, ltimo de este documento, repasa las aportaciones realizadas por
esta investigacin y propone unas lneas de trabajo futuro.
2 Lneas futuras
A partir de los hitos alcanzados por esta investigacin, el trabajo puede seguir
varios caminos.
Con respecto a seguir consolidando la fimdamentacin terica de la metodologa
se prevn posibilidades de desarrollo importantes en torno a las cuestiones
siguientes:
La definicin de los niveles de derivacin es necesaria para completar la
formalizacin del mtodo. Las funciones usuales tratadas en esta tesis son
resueltas a nivel de primitivas. Las funciones calificadas como difciles de
formalizar, de las cuales el captulo quinto muestra algunos ejemplos,
constituyen casos en los que han de intervenir ms niveles de derivacin.
169
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Conclusiones
Los parmetros a y as como la funcin auxiliar G de la formulacin
recursiva empleada definen tendencias comportamentales que caracterizan la
funcin F calculada. Falta avanzar en la sistematizacin de la correspondencia
entre los valores de los parmetros y los comportamientos.
El resultado alentador del CBRM en la aplicacin a las transformadas de
Hough y transformadas ortogonales deber orientar los esfuerzas en la
direccin de estudiar su aplicabilidad a otos grupos de funciones.
El uso de tablas es una opcin de implementacin reemplazable por cualquier
otra. Sin embargo, existe la posibilidad de considerar como lnea terica de
investigacin en aritmtica el hecho de descomponer y encerrar en un nmero
determinado de casillas de una tabla lo esencial de una funcin, que es su
comportamiento, materializado por un nmero fijo de combinaciones de los
parmetros. La evaluacin en s consistir siempre en un proceso muy
sencillo de clculo, como es la extraccin y suma de los contenidos de la
tabla.
La investigacin en la parte de arquitectura de computadores puede proseguir en
vistas a proponer innovaciones en cuanto a la esencia del clculo de funciones as
como a mejorar las prestaciones en rapidez de clculo, ahorro de espacio. Para
ello, se sugieren las siguientes lneas de desarrollo:
Las tablas LUT son memorias ROM y, por tanto, son dispositivos que
evolucionan con la tecnologa. As y todo, es interesante estudiar estrategias
para reducir su tamao de forma que se superen las dificultades del aumento
del tamao al aumentar la precisin de los datos.
Interesa sin duda pensar en la adecuacin del CBRM para tiempo real. La
idea es probablemente proseguir en la lnea de particionar los datos y realizar
170
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Captulo 6
las operaciones de extraccin y suma segn convenga en funcin del tiempo
disponible. Las restricciones de tiempo acarrearn seguramente mayor error.
171
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Volver al ndice/Tornar a l'ndex
172
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
Referencias
[Aharonov, 1997]
D.Aharonov y M. Ben-Or. Fault-tolerant computation with constant error.
Proceedings of the Twenty-Ninth Annual ACM Symposium on the Theory of
Computing, pp-176-188, 1997.
[Ahmed, 1990]
H.M. Ahmed. Directions in DSP P rocessors, IEEE Journal on Selected Areas i
Communications , vol. 8 n8 pp. 1420-1427, 1990.
[Akazawa et al, 2004]
Chihiro Akazawa, Hayami Tsuzuki, Yasuko Nakamura, Yo Sasaki, Kanae
Ohsaki, Shun Nakamura, Yoshihiro Arakawa, and Shinichi Kohsaka. The
Upregulated Expression of Sonic Hedgehog in M otor Neurons after Rat Facial
Nerve Axotomy J. Neurosci., Sep 2004.
[Alonso, 2000]
D.Alonso y R.V Sol.DivGame: a Cellular Automata model of rainforest
dynamics. Ecological Modelling 133, 131-141.
[Altwaijry, 1995]
H. Altwaijry y M. Flynn. P erformance/area trade-offs in Booth multipliers.
TSL-TR-95-684. Computer System laboratory. Stanford University, 1995.
[Andraka, 1998]
R. Andraka, A survey of CORDIC algorithms for FP GAs, Proceedings of the
ACM/SIGDA 6th International Symposium on Field Programmable Gate
Arrays, pp. 191-200, February 1998.
[Antelo et al, 1996]
E.Antelo,, J.D.Bruguera, T.Lang, J. Villaba. High Radix Cordic Rotation Based
on Selection by Rounding. Euro-Par, Vol. II: 155-164-1996.
[Antelo et al, 1997a]
173
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
E.Antelo, J.D.Bruguera, T.Lang,E.L.Zapata: High P erformance Rotation
Architectures Based on the Radix-4 CORDIC Algorithm. IEEE Transactions on
Computers 46(8): 855-870,1997.
[Antelo et al, 1997b]
E.Antelo, , J.D.Bruguera, T.Lang,E.L.Zapata. Error Analysis and Reduction for
Angle Calculation Using the CORDIC Algorithm. IEEE Transactions on
Computers 46(11): 1264-1271,1997.
[Antelo, 2000]
E.Antelo, T.Lang, J.D.Bruguera, Very-High Rada Circular CORDIC: Vectoring
and Unified Rotation/Vectoring. IEEE Transactions on Computers 49(7): 727-
739, 2000.
[Apu, 2004]
R. A. Apu; M. L. Gavrilova Adaptive mesh generation for real-time terrain
modeling. Proceedings of the twentieth annual symposium on Computational
geometry. 2004.
[Arnold et al 1990]
M.G. Arnold, T.A.Bailey, J.R. Cowles y J.J.Cupal. Redundant logarithmic
arithmetic. IEEE Trans, on Computers, vol 39. n 8 pp. 1077-1086. August
1990.
[Arnold, 2001]
M.G. Arnold y C. Walter. Unrestricted Faithful Rounding is Good Enough for
Some LNS Applications. Proceedings of the 15th IEEE Symposium on
Computer Arithmetic. June 2001.
[Arnold, 2002a]
M. Arnold. 21st Century Slide Rules with Logarithmic Arithmetic: High-Speed,
Low-Cost, Low-P ower Alternative to Fixed P oint Arithmetic. Online
Symposium for Electronics Engineers, February 2002. Available at:
http://www.osee.net.
[Arnold, 2002b]
M. Arnold, Improved Cotransformation For LNS Subtraction. IEEE
International Symposium en Circuits and Systems, Scottsdale, AZ, ISBN 0-
7803-7448-7, vol. II, pp. 752-755. May 2002.
[Arnold, 2003a]
M. Arnold, Iterative M ethods for Logarithmic Subtraction
174
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
IEEE International Conference on Application-Specific Systems, Architectures,
and Processors (ASAP'03) The Hague, The Netherlands. June 2003.
[Arnold, 2003b]
M. Arnold, J.Garcia y M. Schulte. The Interval Logarithmic Number System.
Proceedings of the 16th IEEE Symposium on Computer Arithmetic. June 2003.
[Baesch, 1997]
Baesch, A. and Steinmetz, N.: "Exceptional solutions of n-th order periodic linear
differential equations," Complex Variables, Vol. 34, pp. 7-17, 1997.
[Baeumer, 2003]
B. Baeumer. On the inversion of the convolution and Laplace transform Trans.
Amer. Math. Soc, Vol. 355 , pp.1201-1212, 2003.
[Ball y Bojanic, 2000]
S. Ball y R. Bojanik. Table Look-up M ethod for Evaluation of Functions.
Journal of Approximation Theory 107, 2000.
[Bariani et al. 1997]
M. Bariani, R. Cucchiara, P. Mello. Exploiting symbolic learning in visual
inspection. Proc. of IDA 97 4-6 1997, Lecture Notes in Computer Science, v.
1280, Springer, pp. 223-234 (ISBN 3-540-63346-4), 1997.
[Bak, 1997]
J.G.Bak, D. McMichael. Convolution of a measure with itself and a restriction
theorem. Proc. Amer. Math. Soc, Vol. 125, pp. 463-470, 1997.
[Barrera, 1998]
J. Barrera, CE. Ferreira y R.F. Hashimoto. Finding Optimal Sequential
Decompositions of Erosions and Dilations. Proceedings of ISMM'98.
[Bartels, 1987]
R. Bartels, J. Beatty y B.Barsky. An Introduction to Splines for Use in
Computer Graphics and geometric M odeling. Morgan Kaufmann. Los Alamos,
California. 1987.
[Bartle, 1995]
R.G. Bartle. The elements of integration and Lebesgue measure. Wiley classics
library edition. 1995.
[Bascompte, 1998]
175
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
J.Bascompte y R.V. Sol. Spatiotemporal patterns in nature
Trends in Ecology and Evolution 13, 173-174, 1998.
[Beaumont-Smith et al, 1998]
A. Beaumont-Smith, . Burgess, S.Lefrere. Reduced Latency IEEE Floating-
point Standard Adder Architectures. Proceedings of the 14
th
Symposium on
Computer Arithmetic, IEEE, 1998.
[Ben-Tzvi, 1990]
D.Ben-Tzvi y M. Sandler. A Combinatorial Hough Transform. J.P. Recognition
Letters, Vol 11, pp. 167-174, 1990.
[Berkner, 1999]
K.Berkner: Resolution of singularities of convolutions with the Gaussian kernel.
Proc. Amer. Math. Soc, Vol. 127, pp. 425-435, 1999.
[Bewick, 1992]
G.W. Bewick y M. Flynn. Binary multiplication using partially redundant
multipliers. TR CSL-TR-92-528. Computer System Laboratory, Stanford
University, 1992.
[Bewick, 1994]
G.W. Bewick. Fast Multiplication: Algorithm and Implementation. PhD Dept.
Of Electrical Engineering, Stanford University, 1994.
[Beziers, 1970]
P.Beziers. Emploi des machines Commande Numrique. Masson et Cie. Paris.
1970.
[Beziers, 1974]
P.Beziers. M athematical and P ractical P ossibilities on UNISURF. Barnhill y
Riesenfeld Editores. Computer Aided Geometric Design. Academic Press.
Nueva York, 1974.
[Bickerstaff, 2001]
K'A.C. Bickerstaff, E.E. Swartzlander Jr Analysis of Column Compression
M ultipliers Ptoceedings of the 15th IEEE Symposium on Computer Arithmetic.
June 2001.
[Booth, 1951]
A.D. Booth. A signed binary multiplication technique. Quarterly Journal of
Mechanics and Applied mathematics, vol.4, n 2, pp. 236-240, 1951.
176
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Bouville, 1985]
C. Bouville Bounding Ellipsoids for Ray Fractal Intersection. SIGGRAPH 85.
pp 45-52.
[Boyer, 1986]
C.B.Boyer "Historia de las matemticas" Alianza Univ. Textos, N94, 1986.
[Brocker, 1985]
Brocker, and Dieck, T. Representations of Compact Lie Groups . Sringer-
verlag, 1985.
[Bruguera, 1993]
J.D.Bruguera, E.Antelo, T.Lang, Design of a P ipelined Radix 4 CORDIC
P rocessor. Parallel Computing 19(7): 729-744, 1993.
[Bruguera et al, 1996]
J.D Brughera, N.Guil, T, Lang. CORDIC based parallel/pipelined architecture
for the the Hough Transform. Journal of VLSI Signal Processing, vol. 12, pp.
207-221, 1996.
[Bruguera, 2001]
J.D.Bruguera, T.Lang Usingthe Reverse-Carry Approach for Double Datapath
Floating-P oint Addition Proceedings of 15th Symposium on Computer
Arithmetic, IEEE 2001
[Bucgholz, 1999]
A.Buchholz. Norm of convolution by operator-valued functions on free groups.
Proc. Amer. Math. Soc, Vol. 127, pp. 1671-1682, 1999.
[Cain, 2003]
M. E. Cain, B. S. Kapp y C. B. Puryear. The Contribution of the Amygdala to
Conditioned Thalamic Arousal. J. Neurosciences. December 2002.
[Callaway, 1997]
T.A. Callaway, E.E. Schwartzlander.Power delay characteristics of CMOS
Multipliers. Proceedings of the 13
th
Symposium on Computer Arithmetic. IEEE,
1997.
[Cao, 1997]
J. Cao y . Wei, High performance Hardware for Function Generation
Proceedings of the 13
th
symp. on Computer Arithmetic (ARITH'97).
[Cao, 2001]
177
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
J. Cao, . Wei y J. Cheng. High performance Architectures for forElementary
Function Generation Proceedings of the 15
th
symp. on Computer Arithmetic.
June 2001.
[Cpek, 1997]
V. Cpek: Exact memory integral in Time-Convolution Generalized M aster
Equations: Argyres-Kelley projector. In: Zeitschrift fur Physik - Condensed
Matter, Vol. 104, pp. 323-331, 1997.
[Capelle, 1996]
J.Capelle. Convolution on homogeneous spaces. ISBN: 90-367-0686-6, 1996.
[Cardon,2002]
D.A. Cardon. Convolution operators and zeros of entire functions. Proc. Amer.
Math. Soc, Vol. 130, pp. 1725-1734, 2002.
[Cardona, 1996 ]
P. Cardona, Historia de la Informtica. Recopilacin. Mayo 1996.
http://www.mallorcaweb.net/mostel/index.html?http://www.mallorcaweb.net/m
ostel/historia.htm.
[Carlson, 2004]
.A. Carlson y M. Kawasaki. The Who's Who Signal in Electric Fish J.
Neuroscience, Septiembre 2004.
[Cavallaro, 1988]
J.R. Cavallaro y F.T Luk. CORDIC arithmetic for SVD processor. Journal of
Parallel and Distributed Computing , n5, pp.271-290, 1988.
[Cavallaro, 1991]
J.R Cavallaro y A.C. Lester. CORDIC processor array for the SVD of a complex
matrix . SVD and Signal processing II, Algorithms, Analysis and Applications. R.J.
Vaccado (editor), Elsevier Science Publishers, pp. 227-239, 1991.
[Cohn, 1980].
D.L. Cohn. Measure Theory. Birkhauser Boston-1980.
[Coleman, 1999]
J. N. Coleman and E. Chester A 32 Bit Logarithmic Number System P rocessor
and its P erformance Compared to Floating P oint. 14th IEEE Symposium on
Computer Arithmetic, pp. 142-152, Adelaide, Australia, April 1999.
[Coleman, 2000]
178
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
J.N.Coleman y E.I Chester. Arithmetic on the European logarithmic processor
IEEE Trans, on Computers., vol 49n 7 pp. 702-715. July 2000.
[Cornea-Hasegan, 1999]
M. Cornea-Hasegan y . Norin. 64 Floating-P oint Operations and the IEEE
Standard for Binary Floating-P oint Arithmetic. INTEL Technology Journal. 4th
quarter 1999.
[Corazza et al.,2002 ]
xG.E.Corazza, P. Salmi, A. Vanelli-Coralli y M. Villanti, M. Differential P ost
Detection Integration Techniqu in the Return Link of Satellite CDMA Systems,
IEEEISSSTA 2002 Conference, Czech Republic, 2002.
[Chamberlain, 2002]
Chamberlain, R;Lord, Real-time 2D floating-point fast Fourier
transforms for seeker simulation." E. Proceedings SPIE. Vol 4717, pp.15-
23 Technolologies for Synthetic Evironments: Hardware- in-the-loop
Testing VII, Robert Lee Murrer Ed. July 2002.
[Chan, 1993]
E. Chan and S. Panchanathan, A VLSI architecture for DFT, Proceedings of the
36
th
Midwest Symposium on Circuits and Systems, pp.292-295. Detroit
Michigan. USA, 1993.
[Chang, 1988]
L.W.Chang and M.Y. Chen A new systolic array for discrete Fourier
transform. IEEE Trans. On Acoustic, Speech and Sugnal Processing, vol.36
pp.1665-1666, 1988.
[Chang, 2000]
T.S. Chang, J.T. Guo and C.W. Jen. Hardware Efficient DFT Designs
with Cyclic Convolutions and Subex pression Sharing, IEEE Transactions
on CAS II- vol. 47, n9, pp.886-892, Sept.2000.
[Chang, 2000]
Chang, C.H., Wang, C.L Efficient VLSI architectures for fast
computation of the discrete Fourier transform and its inverse., IEEE
Transactions on Signal Processing,vol. 48, nl l , pp.3206-3216,
Nov.2000.
[Chang, 2001]
C.H. Chang, C.L. Wang,. A DHT-based FFT/IFFT P rocessor for VDSL
Transceivers, Proceedings ICASSP'2001, pp. 1213-1216.
179
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Chechile, 2003]
R.A.Chechile. M athematical tools for hazard function analysis. Journal of
Mathematical Psycology, Vol. 47, pp. 478-494, 2003.
[Chichyang, 2000]
C. Chichyang, C. Rui-Lin, Y. Chih-Huan. P ipelined computation of very-large
word length LNS addition/subtraction with polynomial hardware cost. IEEE
Trans, on Computers, vol 49. n 7 pp. 716-726. July 2000.
[Chen, 1998]
C. Chen and C. H. Yang, P ipelined Computation of LNS Addition/Subtraction
with Very Small Lookup Tables. Proceedings of the International Conference on
Computer Design pp. 292-297, Oct. 5-7, 1998.
[Cheng et al, 2000]
F. Cheng, S.H. Unger, M.Theobald. Self-Timed Carry-Lookahead Adders. IEEE
Transactions on Computers, vol 48 n 7. Julio 2000.
[Chien, 2002]
Chien-Chang Lin, Chih-Da Chien. A parametrized hardware design for the
variable length discrete Fourier transform. 15
l
International Conference on
VLSI Design (CAD Symposium) 2002.
[Choi et al, 1997],
J.R. Choi, L.H. Jang, S.W. Jung y J.H. Choi. Structured Design of a 288-Tap
FIR Filter by optimized P artial product Tree Compression. IEEE Journal of
Solid State Circuits, vol.32, n 3. 1997.
[Chu, 1999]
Chu, C-H. and Leung, C-W. Harmonic functions on homogeneous spaces.
Monatshefte Math., Vol. 128, pp. 227-235, 1999.
[Chua, 2000]
C. Chua y U. Neumann Hardware Accelerated Free Form Deformation
Eurographics/SIGGRAPH Graphics Hardware Workshop 2000, pp. 33-40,
August 2000.
[Chua, 2001]
C. Chua y U. Neumann A M odular Approach to Deformable M odeling and
Animation IEEE Computer Animation, pp. 184-191, November 2001.
[Chuang, 1995]
180
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
H.Y.H.Chuang y C.C.Li. A systolic processor for straight line detection by
modified HT IEEE Conf. on Computer Architecture for Pattern Analysis and
Image Database Management, pp. 300-304, 1995.
[Cooley, 1965]
J.W. Cooley, J.W.Tukey, An algorithm for the machine calculation of complex
Fourier series, Math. Comput. 19, 297-301 (1965).
[Dadda, 1965]
L.Dadda. Some Schemes for P arallel multipliers, Alta Frequenza, vol.45, n 3.
Marzo, 1996.
[Dadda, 1996]
L. Dadda y V. Piuri. P ipelined adders. IEEE Transactions on Computers, vol 45
n 3. March 1996.
[Daemen, 2000]
J. Daemen y V. Rijmen, The Block Cipher Rijndael, Smart Card Research and
Applications, LNCS 1820, J.-J. Quisquater and B. Schneier, Eds., Springer-
Verlag, 2000, pp. 288-296.
[Daemen, 2001]
J. Daemen y V. Rijmen, Rijndael, the advanced encryption standard, Dr.
Dobb's Journal, Vol.~26, No.~3, pp.~137-139. March 2001,
[da Fontura, 1989]
L.da Fontura y M.B. Sandler. A binary HT and its efficient implementation in a
systolic array architecture. J.P. Recognition Letters, Vol. 10, pp. 329-334, 89.
[Daniell, 1929]
P.J Daniell. Stieltjes-Volterra P roducts, Congr. Intern, des Math.Strasbourg,
920, pp 130-136. 1929.
[Das et al.1995 ]
D. Das et al. Implementation of four co functions on an LNS co-processor. IEEE
Trans, on Computers, vol 44. n 1 pp. 155-161-Jan. 1995
[Das, 1995]
D. Das, K. Mukhopadhyaya y . P. Sinha, Implementation of Four Common
Functions on an LNS Co-P rocessor, IEEE Transactions on Computers, vol. 44,
no. l, pp. 155-161, Jan. 1995.
[da Silva, 1990]
181
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
I. da Silva. Vectorization from aerial photographs applying the HT method.
Proc. SPIE, Vol 1395, Pt2, pp. 956-963, 1990.
[De Dinechin, 2001]
F. de Dinechin y A. Tisserand Some Improvements on M ultipartite Table
M ethods. Proceedings of the 15th IEEE Symposium on Computer Arithmetic.
June 2001.
[De Lange et al,1990]
A.A. DeLange, et al. Real time applicactions of the floating-point pipeline
CORDIC processor in massive-parallel pipelined DSP algorithms. Proc.
ICASSP-90pp. 1013-1016- 1990.
[Delgado, 1999]
J.Delgado y R.V.Sol. Task Fulfilment and Temporal P atterns of Activity in
Artificial Ant Colonies.LQctare Notes in Artificial Intelligence 1674, 606-615.
[De Mdicis, 1995]
A. De Mdicis, Leroux. Generalized Stirling numbers, convolution formulae
andp, q-analogues. Canad. J. Math. Vol. 47, pp. 474-499, 1995.
[Deng, 2001]
D.S. Dixon, y H.E1 Gindy. High speed P arametrizable HT using reconfigurable
hardware. Pan-Sydney Area Workshop and Visual Information Processing
(VIP), 2001.
[De Reffye et al., 1988]
P. De Reffye, C. Edelin, C. Franon. P lant Models Faithful to Botanical
Stuctures and Development. Pp. 51-158. SIGGRAPH, 1988.
[Dettweiler, 2003]
M.Dettweiler, S. Reiter. On the middle convolution Preprint
(math.AG/0305311), 2003.
[Deutsch, 1999]
D.Deutsch. Quantum theory of probability and decisions. Proceedings of the
Royal Society A455 3129-3197, 1999.
[Dick, 1998]
C. Dick. Minimum Mutiplicative Complex ity Implementation of the 2-D DCT
using Xilinx FP GAs Proceedings of SPIE's Photonics East'98 Configurable
computing: Technology and Applications pp. 190-201. Boston, MA USA
Nov. 1998.
182
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Deutsch, 2000a]
D.Deutsch, A.Eckert y R.Luppachini. M achines, logics and quantum physics.
Bulletin of Symbolic Logic 3. 3-Sept. 2000.
[Deutsch, 2000b]
D.Deutsch y P. Hayden. Information Flor in Entangled Quantum Systems.
Proceedings of the Royal Society A456 1759-1774. 2000.
[Dimitrov et al, 2001]
V. S. Dimitrov, J. Eskritt, L. Imbert, G. A. Jullien, W.C. Miller The Use of the
M ulti-Dimensional Logarithmic Number System in DSP Applications.
Proceedings of the 15th IEEE Symposium on Computer Arithmetic. June 2001.
[Dong, 2001]
F. Dong, G.J Clapworthy y M.Krokos. Volume Rendering of Fine Details
Within M edical Data. IEEE Visualization, San Diego, 2001.
[Dorf, 1989]
R.C. Dorf. Sistemas modernos de control. Addison-Wesley. Iberamericana
1989.
[D'Ornellas, 1998]
M.C. D'Ornellas y R. van den Boomgaard. Generic Algorithms for
M orphological Image Operators: A Case Study Using Watersheds.
Proceedings of ISMM'98.
[Eckorn et al., 1990]
R.Eckhorn, R. H.J. Reitboeck, M. Arndt y P.Dicke. Feature linking via
synchronization among distributed assemblies: Simulations of results from cat
visual cortex. Neural Comp. 293-307 -1990.
[Eijndhoven, 2003]
S.J.L.V.Eijndhoven, L.C.G.J.M Habets.Equivalence of Convolution Systems in
a Behavioral Framework. Mathematics of Control, Signals, and Systems, Vol.
16, pp. 175-206, 2003.
[Ercegovac et al, 2000a]
M. D.Ercegovac, L.Imbert, D.W.Matula, J.Muller. Improving Goldschmidt
Division, Square Root and Square Root Reciprocal. IEEE Trans, on
Computers., vol 49 n 7. Julio 2000.
[Ercegovac et al, 2000b]
183
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
M. Ercegovac, T.Lang, J. Muller, A Tisserand. Reciprocation, Square Root,
Inverse Square Root and Some Elementary Functions using Small M ultipliers.
IEEE Trans, on Computers., vol 49 n 7.July 2000.
[Ercegovac, 1994]
M.D.Ercegovac y T.Lang. Division and Square root: Digit-Recurrence,
Algorithms and Implementations. Kluwer Academic Pub., 1994.
[Even, 2000]
G. Even y P. Seidel. A comparison of Three Rounding Algorithms for IEEE
Floating-point M ultiplication. IEEE Transactions on Computers, vol 49 n 7.
July 2000.
[Fang, 1997]
W.H. Fang, and M.L. Wu An efficient unified systolic architecture for the
computation of discrete trigonometric transform. Proceedings ISCAS, pp.2092-
2095. 1997.
[Feynman, 1983]
R. Feynman. El carcter de la ley fsica. Bosch. Barcelona 1983.
[Fernndez et al, 2001]
C.Fernndez, A. Galbis, M.C. Gmez-Collado. Elliptic convolution operators
on non-quasianalytic classes. Arch. Math., Vol. 76, pp. 133-140, 2001.
[FitzHugh, 1961]
R. FitzHugh. Journal of Biophysiology n 1. pp.445-466.
[Flynn, 1970]
M.Flynn. On division by functional iteration. IEEE Transaction on computers,
vol.C-19, n8. Agosto, 1992.
[Foley et al., 1990]
J. Foley, A Van Dam, S. Feiner. Computer Graphics: P rinciples and P ractice,
Second Edition. Addison-Wesley, Reading, Massachussets.1990.
[Fournier, 1982]
A. Fournier, D. Fussell y L. Carpenter. Computer Rendering of Stochastic
M odels. CACM, 25(6). pp. 371-384. 1982.
[Frigo, 1998]
M. Frigo, S. G. Johnson FFTW: An Adpative Software Architecture for the FFT
Proceedings ICASSP Conference 1998, vol. 3, p. 1381.
184
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Frigo, 2000]
M. Frigo, S.G. Johnson The Fastest Fourier Transform in the West Technical
Report MIT-LCS-TR-728, Massachusetts Institute of Technology, September
1997.
[Fulton, 1991]
Fulton, W., Harris, J. Representation Theory. A first Course, Springer_verlag,
1991.
[Gao, 2003]
Y. Gao, E.Nikulina, W.Mellado y M.T. Filbin. Neurotrophins Elevate cAM P to
Reach a Threshold Required to Overcome Inhibition by M AG through
Extracellular Signal-Regulated Kinase-Dependent Inhibition of
P hosphodiesterase. J. Neurosci., December 2003.
[Garcia et al. 2003a]
J.M Garca Chamizo, M.T- Signes Pont, H. Mora Mora, G. de Miguel Casado.
P arametrized Architecture for Hough Transform Recursive Evaluation. Proc.
SMMSP 2003, Barcelona, Spain, 2003.
[Garcia et al. 2003b]
J.M Garca Chamizo, M.T- Signes Pont, H. Mora Mora, G. de Miguel Casado.
Hough Transform Recursive Evaluation Using Distributed Arithmetic.
Proceedings 12th IFIP International Conference on VLSI-SoC Systems, pp.
301-306, Darmstadt, Germany, 2003.
[Gasteratos, 1998]
A. Gasteratos, I. Andreadis y Ph. Tsalides Soft M orphological Structuring
Element Decomposition. Proceedings of ISMM'98.
[Gelperin, 1989]
A.Gelperin, D.W.Tank y G.Tesauro. Olfactory processing and associative
memory: cellular and modeling studies. Neural Models of Plasticity:
Theoretical and Empirical Approaches. Eds. J.Byrne and W.O.Berry. Academic
Press. New York, 1989.
[Gonzlez, 1996]
R.C Gonzlez y R.E Woods. Tratamiento digital de imgenes. Addison-
Wesley. Iberamericana. S.A. 1996.
[Gottesman, 1999]
D.Gottesman y I.L.Chuang. Quantum Teleportation is a universal
computational primitive. Nature, 402-392, 1999.
185
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Goto, 1997]
G.Goto. A 4.1 ns compact 54x54b M ultiplier Utilising Sign-Select Booth
Encoders. IEEE. J. Solid-State Circuits, vol.32, n 11. Noviembre, 1997.
[Gousseau, 2001]
Y.Gousseau y J.M. Morel. Are natural images of bounded variation. SIAM J.
on Mathematical Analysis, Vol.33 n 3 pp. 634-648.
[Grabiner, 2004]
S. Grabiner. Weak properties of weighted convolution algebras. Proc. Amer.
Math. Soc, Vol. 132, pp. 1675-1684, 2004.
[Hadwiger, 1957]
H. Hadwiger. Vorslesungen ber Inhalt. Oberfiche und Isoperimetrie.
Springer. Berlin. 1957.
[Hamana, 2003]
H. Hamana, J. Hirono, M. Kizumi, y T. Sato. Sensitivity-dependent
Hierarchical Receptor Codes for Odors Chem Senses; 28(2): 87 104. February
2003.
[Harris et al, 1997]
D.L.Harris, S.F.Oberman, A.M. Horowitz. SRT Division-Architectures and
Implementations IEEE 13
th
Symposium on Computer Arithmetic, 1997.
[Harth, 1990]
E.Harth, A.S.Pandya, K.P. Unnikrishnan, Optimization of cortical responses by
feedback modification and synthesis of sensory affrents. A modelf perception
and rem sleep. Concepts Neurosci. 1,53-68, 1990.
[Haule, 1989]
D.D. Haule, D.D y A.S. Object Recognition using fast adaptative HT. IEEE
Comp. Pacific Conf. On Communication, Compiler and Signal Processing, pp.
91-94, 1989.
[Haviland, 1980]
G.L Haviland y A.A. Tuszynski. A CORDIC arithmetic processor chip. IEEE
Trans, on Computers, vol C-29 n2 pp. 68-79- 1980.
[Hawkins, 1975].
T.Hawkins. Lebesque theory of integration. Chelsea.Pub.Co., 1975.
186
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Heijmans, 1998]
H. J.A.M. Heijmans y Jos B.T.M. Roerdink. M athematical M orphology and its
Applications to Image and Signal P rocessing. Computational Imaging and
Vision- Vol. 12. Kluwer Academic Publishers, Dordrecht Hardbound, ISBN 0-
7923-5133-9 May 1998.
[Hering, 2003]
H. Hering y M.Sheng. Activity-Dependent Redistribution and Essential Role of
Cortactin in Dendritic Spine M orphogenesis. J. of Neuroscience., December
2003.
[Hodgkin, 1952]
A.L.Hodgkin y A.F. Huxley. Journal of P hysiology.n\ 17- pp.500-544.
[Hogg, 1998a]
T. Hogg. Highly Structured Searches with Quantum Computers Physical
Review Letters, vol 80. 1998.
[Hogg, 1998b]
T. Hogg y M Yanik Local Search M ethods for Quantum Computers Xerox
PARC technical report. 1998.
[Hogg, 1998c]
T. Hogg A Framework for Structured Quantum Search Physica-D vol 120
pp.102-116. 1998.
[Hogg, 2000a]
T. Hogg y D. Portnov Quantum Optimization", Information Sciences, vol 128
pp.181-197. 2000.
[Hogg, 2000b]
T. Hogg Quantum Search Heuristics Physical Review A, vol 61. 2000.
[Hogg, 2000c]
T. Hogg Single-Step Quantum Search Using P roblem Structure, Intl. J. of
Modern Physics C, vol. 11. 2000.
[Hogg, 2003]
T. Hogg Adiabatic Quantum Computing for Random Satisfiability P roblems.
Physical Review A vol 67. 2003.
[Hougb.,59]
187
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
P.V.C. Hough, M achine Analysis of Bubble Chamber P ictures. International
Conference on High Energy Accelerators and Instrumentation, CERN, 1959.
[Hsiao, 2000]
S,.F.Hsiao, W.R Shiue, Design of low-cost and high throughput linear arrays
for DFT computations: algorithms, architectures and implementations., IEEE
Transactions on Circuits and Systems II, Vol 47(11), pp.1188-1203. Nov. 2000.
[Hu, 1992]
Y.H.Hu. CORDIC-based VLSI architectures for Digital Signal P rocessing.
IEEE Signal Processing Magazine, n 7 pp. 16-35- July 1992.
[Huang, 2000]
L.Y.Huang, Z.Hu y F.M. Sun. A New Automatic Quasar Recognition Technique
Based on P CA and the Hough Transform. ICPR 2000, pp. 2499-2502, 2000.
[Hyman et al, 2003]
J.M. Hyman, B.P. Wyble,V.Goyal, C.A. Rossi, y M.E. Hasselmo Stimulation in
Hippocampal Region CA in Behaving Rats Yields Long-Term P otentiation
when Delivered to the P eak of Theta and Long-Term Depression when
Delivered to the Trough J. Neuroscience, December 2003.
[Ito, 1997]
M. Ito y T. Naofumi. Efficient Inicial Approximation for M ultiplicative Division
and Square Root by a M ultiplication with operand M odification. IEEE
Transactions on Computers, vol 46, n4. April 1997.
[Jackson, 2004]
A C. Jackson, G.L. Yao y B.P. Bean Spontaneous Firing in Clock
Neurons. J. Neuroscience, Sept. 2004.
[Janzing, 2001]
D. Janzing y Th. Beth, Complexity measure for continuous-time quantum
algorithms, Phys. Rev. A 64 022301. 2001.
[Jozsa, 1998]
R. Jozsa, Quantum algorithms and the Fourier transform, Proceedings of. R.
Soc. Lond. A 454, 323-37. 1998.
[Jozsa, 1999]
R. Jozsa, Quantum effects in algorithms, Lecture Notes in Computer Science
1509, 103-12. 1999.
188
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Kajiya, 1983]
J. Kajiya New Techniques for Ray Tracing P rocedurally Defined Objects.
SIGGRAPH 83. pp 91-102.
[Kalampukas et al, 2000]
L.Kalampukas, D.Nikolos, C. Efstathiou High-Speed P arallel-P refix M odulo
2
n
-l Adders. IEEE Transactions on Computers, vol 48 n 7. Julio 2000.
[Karasik, 1998]
Y.B. Karasik. How to compute three-dimensional convolution and/or
correlation optically: a mathematica foundation. Journal of Modern Optics,
Vol. 45, pp. 817-823, 1998.
[Kantabutra, 1993]
V. Kantabutra. Designing optimum one-level carry-skip adders. IEEE
Transactions on Computers, vol 42 n 6. Junio 1993.
[Katsuhiko, 1993]
0. Katsuhiko Ingeniera de control moderna. (2
a
edicin). Prentice-Hall
Hispanoamericana. 1993.
[King, 2002]
King, J.A., Burgess, ., Hartley, T., Vargha-Khadem, F., & O'Keefe, J. (2002).
The human hippocampus and viewpoint dependence in spatial memory.
Hippocampus 12(6):811-20.
[Koch, 1985 ]
C. Koch, J. Marroquin y A.Yuille. Analogneuronal networks in early vision.
[Koren, 1990]
I.Koren, O.Zinati: Evaluating Elementary Functions in a Numerical
Coprocessor Based on Rational Approx imations. IEEE Transactions on
Computers 39(8): 1030-1037 1990.
[Koren, 1993]
1. Koren. Computer Arithmetic Algorithms. Cap. 9, pp. 163-180. Englewood
Cliffs, N.J.: Prentice Hall, 1993.
[Kornerup, 2003]
P. Kornerup Revisiting SRT Quotient Digit Selection Proceedings of the 16th
IEEE Symposium on Computer Arithmetic. June, 2003.
[Koshimizu, 1990]
189
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
H.Koshimizu y M. Numada. On fast Hough Transform method P LHT based on
piecewise-linear Hough function. J. System Computer in Japan, Vol 21 n5, pp.
62-73, 1990.
[Kuhlmann y Pahi, 1998]
M. Kuhlman y K.K.Pahi. Fast Low-P ower Architecture. Proceedings of
International Conference on Computer Design. IEEE 1998.
[Kwon et al, 2000]
O. Kwon, . Nowka y E.E. Shwarzlanger. A 16-bit MAC Design UsingFast 5:2
Compressors. IEEE Conference on Application-Specific Systtems,
Architectures and Processors.
[Laflamme, 1996]
R. Laflamme, C.Miquel y J.P.Paz. P erfect quantum error correction code.
Phys.Rev. Lett., 77: 198, 1996, arXive e-print quant-ph/9602019.
[Lai, 1991]
F. Lai y C.Wu, C. A hybrid number system processor with geometric an
complex arithmetic capabilities. IEEE Trans, on Computers, vol 40. n 8 pp.
952-962. August 1991.
[Lai, 1993]
F. Lai. The Efficient Implementation and Analysis of a Hybrid Number System
P rocessor. IEEE Transactions on Circuits and Systems-II: Analog and Digital
Signal Processsing, vol. 40, no. 6, pp. 382-392, 1993.
[Lang y Montuschi, 1999]
T. Lang y P.Montuschi . Very High Radix Square Root with P rescaling and
Rounding and a Combined Division/Square Root Unit. IEEE Transaction on
Computers, vol 48 n 8 Agosto 1999.
[Lang y Antelo, 2001]
T. Lang y Antelo Correctly Rounded Reciprocal Square-Root by Digit
Recurrence and Radix -4 Implementation. Proceedings of the 15th IEEE
Symposium on Computer Arithmetic. June 2001.
[Lang y Antelo, 2003]
T. Lang y Antelo Radix -4 Reciprocal Square-Root and Its Combination with
Division and Square Root IEEE Transaction on Computers Vol. 52, No. 9
Septiembre 2003.
[Lang y Bruguera, 2004]
190
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
T. Lang y J.D. Bruguera Floating-P oint Multiply-Add-Fused with Reduced
Latency ) IEEE Transaction on Computers Vol. 53, No. 8 Agosto 2004.
[Law et al., 2000]
C: Law, K. Yeo y S. Rofail. A redundant-binary partial-product generator
based on a five-bit recodingtechnique. International Journal of Electronics, vol.
87, n4, 2000.
[Lewis, 1990]
D.M. Lewis.^4 architecture for addition and subtraction of long-word length
numbers in the logarithmic number system. IEEE Trans, on Computers, vol 39.
n 11 pp. 1325-1336. Nov.1990.
[Li, 2003]
X. Li, M.Davison y C.Essex. Fractional Differential Equations and Stable
Distributions, Submitted to Journal of Applied Probability, 2003.
[Li et al. 1986 ]
H.F.Li, M.A. Lavin y R.J. Master. Fast Hough Transform: a hierarchical
approach. J. Computer Vision Graphics Image Processing, Vol.36, pp. 139-161,
1986.
[Lindenmayer, 1968]
A. Lindenmayer. Mathematical Models for Cellular Interactions in
Development, P arts I and II. J. Theor. Biol., 18. pp 280-315. 1968.
[Ma, 2003]
N.Y. Ma y R.P. King, R.P. The -fold convolution of generalized ex ponential-
sum distribution functions, Appl. Math. Comput. Vol. 142, pp. 23-33, 2003.
[Mc Cullogh, 1943]
W.S. Mac Cullogh y W. Pitts. Bull. Math. Biophys.5. 115-133.
[Me Cann y Pippenger, 2003]
M.McCann y . Pippenger. SRT Division Algorithms as Dynamical Systems.
Proceedings of the 16th IEEE Symposium on Computer Arithmetic. June 2003.
[Markowska, 2002]
A. L. Markowska y A. V. Savonenko. Effectiveness of Estrogen Replacement in
Restoration of Cognitive Function after Long-Term Estrogen Withdrawal in
AgingRats. J. Neurosciences December 2002.
[Mandelbrot, 1982]
191
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
. Mandelbrot. Tecnical correspondance. CACM, 25(8) pp.581-583.
[Matheron, 1967]
G. Matheron. Elements pour une thorie des milieux poreux, Masson. Paris.
1967.
[Matula, 2001]
D. W. Matula Improved Table Lookup Algorithms for P ostscaled Division .
Proceedings of the 15th IEEE Symposium on Computer Arithmetic, June, 2001
[Matula y Fit-Florea, 2003]
D. W. Matula y A. Fit-Florea. P rescaled Integer Division. Proceedings of the
16th IEEE Symposium on Computer Arithmetic, June, 2003.
[Maurer, 2001]
S. Maurer; T. Hogg y .A. Huberman Quantum P ortfolios Physical Review
Letters, vol 87. 2001.
[Max, 1979]
N.L.Max. ATOMLLL: ATOMS with Shading and Highlights. SIGGRAPHS 79,
pp. 165-173.
[Miel, 1993]
G. Miel Constant Geometry Fast Fourier Transforms on Array P rocessors
Transactions on Computers March 1993,Vol. 42, No. 3. pp 371-375.
[Mintzer, 1996 ]
Les Mintzer Large FFTs in a single FP GA, Proceedings of ICSPAT'96.
[Mora, 2001]
J.M Mora Pascual. Unidades Aritmticas en coma flotante para tiempo real.
Tesis Doctoral. Dept. Arquitectura y Tecnologa de Computadores. Universidad
de Alicante. 2001.
[Montuschi y Cimiera, 1993]
P. Montuschi y L. Cimiera. Reducing Iteration Time when result digit is zero
for 2 SRT division and square root with redundants remainders. IEEE
Transactions on Computers, vol 42 n 2 1993.
[Montuschi y Cimiera, 1994]
P. Montuschi y L. Cimiera. Over-Redundant digit sets and the design of digit-
by-digit units. IEEE Transactions on Computers, vol 43 n 3 1994.
192
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Montuschi y Lang, 2001]
P.Montuschi y T. Lang. Very High Radix Division with P rescaling and
Selection by Rounding IEEE Transaction on Computers, vol 50 n 1 Enero
2001.
[Muamar, 1991]
H.K Muamar y M. Nixon. Tristage Hough Transform for multiple ellipse
extraction. IEEE Proc. Part E: Computer and Digital Techniques, Vol 138 n 1,
1991.
[Muller, 1998]
J.M. Muller, A. Sherbyna y A.Tisserand. Semi-logarithmic number system.
IEEE Trans, on Computers, vol 47. n 2 pp. 145-151. Feb. 1998.
[Murthy, 1994]
N.R Murthy and M.N.S. Swamy. On the real-time computation of DFT and
DCT through systolic architectures. IEEE Trans, on Signal Processing, vol. 42,
n4,pp.988-991,1994.
[Nakayama, 1989]
Nakayama et al. A 6.7 M FLOP S floatig-point coprocessor with vector/matrix
instructions. IEEE Journal on Solid-State Circuits, vol 24 n 5 pp. 1324-1330 -
1989.
[Nielsen, 1997]
O.A.Nielsen. An introduction to integration and measure theory. John Wiley
and Sons Inc. 1997.
[Oberlin, 2002]
D.M. Oberlin. Some convolution inequalities and their applications, Trans.
Amer. Math. Soc, Vol. 354, pp. 2541-2556, 2002.
[Oberman y Flynn, 1997]
S.F. Oberman y M.J. Flynn. Division Algorithms and Implementations. IEEE
Transactions on Computers. 1997.
[Obermann et al., 1997]
S.F.Oberman, H Altwaijry, M.J. Flynn. The SNAP P roject: Design of Floating-
P oint Units. IEEE Proceedings of the 13
th
Symposium on Computer Arithmetic.
IEEE 1997.
[O'Keefe, 1979]
193
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
J. O'Keefe. A review of the hippocampal place cells. Progr. Neurobiol., 13, 419-
439.
[Oklobdzija et al, 1996]
V.G. Oklobdzija, D. Villeger, S.S. Liu. A method for speed optimizedpartial
product reduction and generation of fast parallel multipliers using an
algorithmic approach. IEEE Transactions on Computers. Vol. 45, n 3. March
1996.
[Omondi, 1994]
A.R. Omondi. Computer Arithmetic Systems. Prentice Hall. 1994.
[Paliouras, 2001]
V. Paliouras and T. Stouraitis. Low-P ower P roperties of the Logarithmic
Number System. Proceedings of the 15th IEEE Symposium on Computer
Arithmetic, Vail, pp. 229-236, June 2001.
[Paliouras, 2002]
V. Paliouras. Optimization Of LNS Operations For Embedded Signal
P rocessing Applications. IEEE International Symposium on Circuits and
Systems, Scottsdale, AZ, ISBN 0-7803-7448-7, vol. II, pp. 744 - 747, 28 May,
2002.
[Parks, 2000]
M. Parks. Number-Theoric Test Generation for Direct Rounding. IEEE
Transactions on Computers, vol 49 n 7 July 2000.
[Parr, 2002]
A.W. Parr, Compactly bounded convolutions of measures, Proc. Amer. Math.
Soc, Vol. 130, pp. 2661-2667, 2002.
[Parthasarathy, 1980]
K.R.Parthasarathy. Introduction to probability and measure.McMillan Press,
1980.
[Pease, 1968] An adaptation of the fast Fourier transform for parallel
processing. J of the ACM Marshall C. Pease., vol.l5,pp.252-264, 1968.
[Peiming, 2001]
Yan Peiming, Mo Yulong. Image restoration based on the discrete
fraction Fourier transform. Proceedings SPIE. Vol 4552, pp.280-285
Image Matching and Analysis. Bir Bhanu Ed. Sept.2001.
194
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Peitgeii, 1986]
H.O.Peitgen y P.H Richter.Tfte Beauty of Fractals .-Images of Complex Dynamic
System. Springer-Verlag, Berlin, 1986.
[Peszynska, 1996]
M. Peszynska. Finite element approximation of diffusion equations with
convolution terms. Math. Comp., Vol. 65, pp. 1019-1037, 1996.
[Pineiro, 2001]
J.A Pineiro. J.D.Bruguera y J.M.Muller. Faithful powering computation using
table look-up and a fused accumulation tree. Proc. of the 15th International
Symposium of Computer Arithmetic (ARITH'15), 2001.
[Pineiro, 2002a]
J.A. Pineiro, M. Ercegovac y J.D. Bruguera. High-Radix Logarithm with
selection Rounding. IEEE International Conference on Application-Specific
Systems, Architectures, and Processors (ASAP'02), p-101, July 2002.
[Pineiro, 2002b]
J.A. Pineiro, J.D. Bruguera. High-Speed Double precision Computation of
Reciprocal Division, Square Root and Inverse Square Root. IEEE Transactions
on Computers, vol.51, n 12, pp.1377-1388, 2002.
[Pineiro, 2003]
J.A Pieiro.M.D Ercegovac y J.D.Bruguera. High-Radix Iterative Algorithm for
P owering Computation. Proceedings of the 16th IEEE Symposium on
Computer Arithmetic. June 2003.
[Porter, 1979]
T.Porter. The shaded Surface Display of Large M olecules. SIGGRAPH
79.pp.234-36.
[Prusinkiewicz, 1988]
P. Prusinkiewicz, A. Lindenmayer y J. Hanan. Developmental Models of
Herbaceous Plants for Computer Imagery Purposes, pp.141-150. SIGGRAPH
1988.
[Quach y Flynn, 1990]
N.T.Quach, M.J. Flynn. An improved algorithm for high-speed floating-point
addition. TR CSL-TR-90-442. Computer System Laboratory, Stanford
University. 1990.
[Quach y Flynn, 1992]
N.T.Quach, M.J. Flynn. High-speed addition in CM OS. IEEE Transactions on
195
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
Computers. Vol. 41, n 12. December, 1992.
[Rabiner, 1975]
L.R Rabiner and B. Gold. Theory and application of digital signal processing.
Prentice -Hall, Englewood Cliffs, NJ, 1975.
[Rail, 1964]
W. Rail. Neural Theory and Modeling. R. Reiss Ed.pp.73-97. Stanford
University Press. 1964.
[Rail y Sheperd, 1968]
W. Rail y G. Sheperd. Journal of Neurophysiology n 31, pp.884-915.
[Ramn y Cajal, 1894]
S. Ramn y Cajal. New Ideas on the Strcture of the Nervous System in M an and
Vertebrates. Bradford Books. MIT Press. 1894.
[Randi, 2000]
T. Randi An Architectural P erformance Study of the Fast Fourier Transform on
vector IRAM . Technical report n UCB/CSD-00.1106 Computer Science
Division. University of California, Berkeley. June 2000.
[Sez et al. 1998]
E.Sez, . et al. FP GA implementation of a variable precision CORDIC
processo". 13
th
Conf. on Design of Circuits and Integrated Systems
(DCIS'98).pp. 604-609. Madrid.Nov. 1998.
[Snchez et al., 1997]
M. Snchez, J.Lpez, O, Plata, E.L.Zapata. An efficient Architecture for the in-
place Fast Cosine Transform. Proceedings of IEEE International Conference on
Application-Specific Systems, Architectures and Processors.pp 499-508.
Zurich. July 1997.
[Schmookler, 2001]
M.S. Schmookler y K.J Nowka. Leading zero anticipation and detection-a
comparison of methods. Proceedings of the 15th IEEE Symposium on
Computer Arithmetic, June 2001.
[Schulte, 1994]
M.J. Schulte y . Schwartzlander. Hardware Designs for Ex actly Rounded
Elementary Functions. IEEE Transactions on Computers, vol 43, n 8, pp 964-
972. August 1994.
196
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Schulte, 1997]
M.J.Schulte y J.E.Stine. Accurate function approximations by symmetric table
look-up and addition. 11
th
International Conference on application-specific,
systems, architecture and processors, 1997.
[Schwarz, 1996]
E.M. Schwarz. Rounding for Quadratically Converging Algorithm for Division
and Square Root. Proceedings of the 29th ASILOMAR, IEEE 1996.
[Schwarz, 1999]
E.M. Schwarz y C.A Krygovski. The S/390 GS Floating-P oint. IBM Journal of
Research and Development, vol 43 n 5/6. 1999.
[Schwarz, 2003]
E.M. Schwarz. P anel: Revisions to the IEEE 754 Standard for Floating-P oint
Arithmetic. Proceedings of the 16th IEEE Symposium on Computer Arithmetic
June, 2003.
[Seeger, 1996]
A. Seeger. Singular integral operators with rough convolution kernels. J. Amer.
Math. Soc, Vol. 9, pp. 95-105, 1996.
[Seidel, 2001]
P.M.Seidel, L.D.McFearin, D.W.Matula, Binary M ultiplication Radix-32 and
Radix-25 Proceedings of the 15th IEEE Symposium on Computer Arithmetic
June, 2001.
[Serra, 1965]
J. Serra. L 'analyse des textures par la gomtrie alatoire. Compte-rendu du
Comit Scientifique de l'IRSID.
[Serra, 1969]
J. Serra. Introduction la M orphologie M athmatique. Cahiers du Centre de
Morphologie Mathmatique.Booklet n 3. 160 pp. E.N.S.M.P.
[Serra, 1978]
J. Serra y R. Miles En matire d'introduction.. In "Buffon Symposium".
Lecture Notes in Biomathematics. Springer-Verlag, 1978.
[Serra, 1989]
J. Serra. Image Analysis and M athematical M orphology. Vol.1.Academic Press.
1989.
197
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
[Shin y Jeon, 2000]
. Shin y H. Jeon. High-speed complex -number s based on redundant binary
representation of partial products. International Journal of Electronics, vol. 87,
n 6. 2000.
[Shankar, 1990]
R.V.Shankar y . Asokan. A parallel implementation of the Hough Transform
method to detect lines and curves in pictures. IEEE 32th Midwest Symp. On
Circuits and Systems, pp. 321-324, 1990.
[Sherstyuk, 1999]
A. Sherstyuk. Kernel functions in convolution surfaces: a comparative analysis.
The Visual Computer, Vol. 15, pp. 171-182, 1999.
[Shor, 1994]
P.Shor. Algorithms for quantum computation: Discrete logarithms and
factoring. Proceedings of 35
th
Annual Symposium on Foundations of Computer
Science, 124. Los Alamos, CA, 1994. IEEE Press.
[Shor, 1995]
P.Shor. Scheme for reducing decoherence in quantum computer memory.
Phys.Rev. A, 52:2493-2496, 1995.
[Simon, 1996]
B. Simon. Representations of finite and compact groups. American
Mathematical society 1996.
[Smith, 1984]
A.R. Smith. P lants, Fractals and Formal Languages, pp. 1-10. SIGGRAPH 84.
[Sol,1994]
R.V. Sol y O Miramontes. Information at the edge of chaos in fluid neural
networL. Elsevier Science B.V., Amsterdam. 1994.
[Sol, 2001a]
R.V. Sol, Complex Systems: Chaos and Beyond SI AM review 43, 738-740-
2001 .
[Sol, 2001b]
R.V. Sol y J.M
a
Montoya. Complexity and Fragility in Ecological
AfeiworfeProceedings of the Royal Society of London 268, 2039-2045, 2001.
[Sol, 2003]
198
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
R.V. Sol y S. Valverde Information theory of complex networks
Networks: Structure, Dynamics and Function, Lecture Notes in Physics,
Springer-Verlag, 2003.
[Sol et al, 2003a]
R.V.Sol, B.Luque y S.Kauffman Order and chaos in random genetic networks
with multiple states International Journal of Bifurcations and Chaos 2003.
[Sol et al, 2003b]
R.V. Sol, J.M Montoya, R.Ferrer y J. Escoda Universality and evolution in
complex biological networks Trends in Ecology and Evolution 2003.
[Song, 1991]
P.Song, G. De Michelli. Circuit and Architecture Trade-Offs for High Speed
M ultiplication. IEEE J.Solid State Circuits, vol. 26, n 9, Septiembre, 1991.
[Stalling, 1995]
D. Stalling, H.C. Hege. Fast and Resolution IndependentLine Integral
Convolution , Proc. ACM SIGGRAPH, pp. 249-256, 1995.
[Steane, 2001]
A.M. Steane y D. M. Lucas Quantum Computing With Trapped Ions, Atoms and
Light. Fortschritte der Physik special issue . October 2001.
[Steffen et al., 2003]
M. Steffen; W. van Dam;T. Hogg; G. Breyta y I. Chuang Experimental
Implementation of an Adiabatic Quantum Optimization Algorithm Physical
Review Letters, vol 90, 2003.
[Stelling et al., 1998]
P.F. Stellin, C.U. Martel, V.G. Oklobdzija, R.ravi. OptimalCircuits for parallel
M ultipliers. IEEE Transaction on Computers, vol.47, n3. March, 1998.
[Strettoi, 2004]
Enrica Strettoi, Alan J. Mears y Anand Swaroop. Recruitment of the Rod
P athway by Cones in the Absence of Rods J. Neurosci., August 2004.
[Suga, 1990]
Suga, N. Cortical computational maps for auditory imaging. Neural Networks,
3,3-21-1990.
[Sural, 2001]
199
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
S.Sural y P.K.Das. A genetic algorithm for feature selection in a neuro-fuzzy
OCR system. Sixth International Conference on Document Analysis and
Recognition, pp. 987-991. Seattle, 2001.
[Swartzlander et al, 1993]
E.E. Swartzlander y DVS Chandra. Sign/logarithmic arithmetic for FFT
implementation. IEEE Trans, on Computers, vol 32. n 6 pp. 526-534. June
1983.
[Swarztrauber, 1987] Multiprocessor FFTs, P.N. Parallel Computing n5,
pp.197-210, 1987.
[Takagi et al, 1985]
. Takagi, H. Yasuura y S. Yajima. High-speed VLSI multiplication Algorithm
with a Redundant Binry Addition Tree. IEEE transaction on Computers, vol C-34
n9. Sept., 1985.
[Takagi y Horiyama, 1999]
N. Takagi y T. Horiyama. A High-Speed Reduced-Size Adder Under Left-to-
Right Arrival. IEEE Transactions on Computers, vol 48 n 1. January 1999.
[Takagi, 2001]
N. Takagi A Hardware Algorithm for Computing Reciprocal Square Root
Proceedings of the 15th IEEE Symposium on Computer Arithmetic. June, 2001.
[Tan, 2003]
D Tan; A. Danysh y M. Liebelt. Multiple-precision fix ed-point vector multiply-
accumulator using shared segmentation. Proceedings of the 16th IEEE
Symposium on Computer Arithmetic. June, 2003.
[Tandon, 1983]
Tandori, The life and works of Lipt Fejr, Functions, series, operators,
Colloq. Math. Soc. Jnos Bolyai 35 (Amsterdam-New York, 1983), 77-85.
[Tchebychev, 1890]
P. Tchebychev Sur deux thormes relatifs aux probabilits. Acta. Math., t
XIV,pp.305-315. 1890.
[Temperton, 1991]
C. Temperton, Self-sorting in-place fast Fourier transforms. SIAM J.Sci.Stat.
Comput, vol 12 n4, pp.808-823, 1991.
[Tenca y Ercegovac, 1998]
200
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
A.F.Tenka, M.D. Ercegovac. On the Design of the High-Radix On-Line
Division for Long P recision.
[Tezmol et al., 2002]
A.Tezmol, H. Sari-Sarraf, S. Mitra. Customized Hough Transform for Robust
Segmentation of Cervical Vertebrae from X-Ray Images. Fifth IEEE Southwest
Symposium on Image Analysis and Interpretation, Santa Fe, New Mexico, April
2002.
[Traub, 1991]
RD Traub y R.Miles R In: Neuronal networL of the hippocampus. Cambridge,
UK: Cambridge UP, 1991
[Ueki et al, 2003]
T. Ueki, M. Tanaka, . Yamashita, S. Mikawa, Z.Fu Qiu, N. J. Maragakis, R. F.
Hevner, N. Miura, H. Sugimura y . Sato. A Novel Secretory Factor,
Neurogenesis 1, P rovides Neurogenic Environmental Cues for Neural Stem
Cells in the Adult Hippocampus. J. Neuroscience December 2003.
[Um y Kim, 2001]
J.Um y T.Kim. An optimal Allocation of Carry-Save Adders in Arithmetic
Circuits. IEEE Transactions on Computers, vol 50 n 3. March 2001.
[Van Dalen, 1972]
D. Van Dalen y A.F. Monna. "Sets and Integration ". Wollers-Noordhoff, 1972.
[Van Dam, 2002]
W. van Dam, Quantum algorithms for weighing matrices and quadratic
residues, Algorithmica 34, 413-428. 2002.
[Villalba, 1995 ]
J. Villalba, J. Diseo de Arquitecturas CORDIC multidimensionales. Tesis
Doctoral Dept. de Arquitectura de Computadores. Universidad de Mlaga,
Nov.1995.
[Villaba,1996 et al]
J. Villalba, J., E. Antelo, J.D.Bruguera, E.L. Zapata. Unified CORDIC
architecture in redundant arithmetic. Technical report. Universidad de Santiago
de Compostela, Grupo de Investigacin de Arquitectura de Computadores.
December 1996.
[Villaba,1998]
201
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
J.Villalba, T.Lang, E.L. Zapata, P arallel compensation of scale factor for the
CORDIC algorithm. Journal of VLSI Signal Processing Systems for Signal,
Image and video technology, vol. 19 n 3, pp. 227-241, August 1998.
[Voider, 1959]
J.E. Voider. The CORDIC trigonometric computing technique. IRE Trans.
Elect. Comput, vol EC- 8 pp. 330-334. Sept. 1959.
[Volterra, 1913]
V. Volterra. Leons sur les fonctions de lignes. Gauthier- Villars, 1913.
[Voss, 1987]
R.Voss. Fractal in Nature. Characterization, M easurement and Simulation. En
Course Notes 15 for SIGGRAPH 87. Anaheim. California. 1987.
[Wallace, 1964]
C.S. Wallace. A Suggestion for a Fast M ultiplier. IEEE Trans. Computers,
vol.13, n 2. February, 1962.
[Walther, 1971]
J.S Walther. A unified algorithm for elementary functions. Proc. Spring. Joint.
Comput. Conf., pp379-385, 1971.
[Wang, 1996]
S.Wang y V.Piuri A unified view of CORDIC processor design. Application
Specific Processors, edited by Earl E. Schwarzlander, Jr, Ch.5, pp 121-160,
Kluwer. Academic Press, November 1996.
[Weinberger, 1981]
A Weinberger. 4:2 Carry-Save M odule. IBM Technical Disclosure Bull, vol.
23. January 1981.
[Weyl, 1927]
H. Weyl. y F.Peter. Die Vollstndigkeit der primitiven Darstellungen einer
geschlossen kontinuierlichen Gruppe. Math.Ann. t. XCVII. pp.737-755, 1927.
[Wheeden, 1977]
R.L. Wheeden,.A. Zygmund. M easure and Integral. Marcel Dekker, Inc. New
York. 1977.
[White, 1989]
S. A. White, Applications of Distributed Arithmetic to Digital Signal
P rocessing: Tutorial Review. IEEE ASSP Magazine, pp. 4-19, July 1989.
202
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Referencias
Williams et al, 1995]
T.E. Williams, M.A. Horowitz. A zero- overhead self-timed 160 ns 54-bit
CM OS divider. IEEE Solid-State Circuits, vol 26, n 11. Nov. 1995.
[Wiswman, 2000]
H.M. Wiseman y B.L. Hollis, Space-bounded computation: quantum is better
than classical, LANL Preprint quant-ph/0009054. 2000.
[Wissam, 1996]
Rabadi Wissam Iterative multiresolution algorithm for image
reconstruction from the magnitude of its Fourier transform. A. Texas
Instrument Inc.; University of Central florida. Optical Engineering
35(04), 1015-1034. Brian J. Thomson Ed. April. 1996.
[Wong, 1994]
W.F. Wong, E. Goto. Fast Hardware-Based Algorithms for Elementary Function
Computations Using Rectangular M ultiplier. IEEE Transaction on Computers,
vol. 43, no 4, pp. 278-294. 1994.
[Yamazava, 2000]
K.Yamazawa; Y.Yagi y M. Yachida. 3d Line Segment Reconstruction by Using
Hyperomni Vision and Omnidirectional Hough Transforming. ICP R00, Vol III:
487-490, 2000.
[Ye, 2002]
P.Ye, The Approximation Theorem of Convolution Operator in Ap Set-valued
Function Space, Acta Mathematicae Applicatae Snica, Vol. 18-3, pp. 495-500,
2002.
[Yeh, 2000]
W.Yeh y C. Jen. High-Speed Booth Encoded P arallel M ultiplier Design. IEEE
Transactions on Computers, vol.49, n 7. July 2000.
Enlaces
La norma IEEE-754: http://cch.loria.fr/documentation/IEEE-754/index.html
Online Symposium for Electronics Engineers: http://www.osee.net.
203
Modelo paramtrico de arquitectura para la generacin de primitivas computacionales. Mara Teresa Signes Pont
Tesis doctoral de la Universidad de Alicante. Tesi doctoral de la Universitat d'Alacant. 2005
Volver al ndice/Tornar a l'ndex