Está en la página 1de 16

336 IEEE TRANSACTIONS ON VERY LARGE SCALE INTEGRATION (VLSI) SYSTEMS, VOL. 14, NO.

4, ABRIL DE 2006

Procesamiento de señal digital


tolerante a errores suaves y
energéticamente eficiente
Byonghyo Shim, Miembro, IEEE,y Naresh R. Shanbhag, Fellow, IEEE
Resumen:en este artículo, presentamos técnicas tolerantes a Manuscrito recibido el 17 de enero de 2005; revisado el 28 de septiembre de
errores blandos de eficiencia energética para sistemas de 2005. Este trabajo fue apoyado en parte por la Microelectronics Advanced
procesamiento de señal digital (DSP). La técnica propuesta, Research Corporation (MARCO) patrocinada por el Gigascale System
conocida como tolerancia a errores blandos algorítmicos (ASET), Research Center y en parte por la National Science Foundation bajo la
emplea estimadores de baja complejidad de un bloque DSP Subvención CCR 99-79381 y la Subvención CCR 00-85929.
principal para lograr un funcionamiento confiable en presencia de B. Shim estuvo con la Universidad de Illinois en Urbana-Champaign,
errores blandos. Se presentan tres técnicas distintas de ASET: Urbana, IL 61801 USA. Ahora está con Qualcomm Inc., San Diego, CA 92121
espacial, temporal y espacio-temporal. Para el filtrado selectivo de USA (correo electrónico: bshim@qualcomm.com).
frecuencia de respuesta de impulso finito (FIR), se muestra que las N. R. Shanbhag se encuentra en el Laboratorio Coordinado de Ciencias,
técnicas propuestas proporcionan robustez en presencia de tasas Departamento de Ingeniería Eléctrica e Informática, Universidad de Illinois en
de error suaves de hasta er = 10 2 y er = 10 3 en un escenario Urbana-Champaign, Urbana, IL 61801 USA (correo electrónico:
shanbhag@mail.icims.csl.uiuc.edu). Identificador de objeto digital
de alteración de un solo evento. La disipación de potencia de las
10.1109/TVLSI.2006.874359
técnicas propuestas oscila entre 1,1 X y 1,7 X (ASET espacial) y
1,05 X a 1,17 X (ASET espacio-temporal y temporal) cuando la reducción de la profundidad de canalización de las
relación señal-ruido deseada SNRdes = 25 dB. En comparación, la arquitecturas modernas. Se ha demostrado que la carga crítica
disipación de potencia de la técnica de redundancia modular triple que cambia el estado interno de una puerta lógica se acerca a
comúnmente empleada es de 2,9 X. fC en la tecnología de 0,13 m [13], mientras que la carga
Términos de índice:procesamiento de señal digital (DSP), generada debido a un golpe de partícula de neutrones puede ser
redundancia de precisión reducida (RPR) de baja potencia, de hasta fC [6]. De hecho, se informa que se espera que la
confiabilidad, tolerancia a errores suaves, redundancia modular tasa de error blando en los circuitos lógicos aumente nueve
triple (TMR).
órdenes de magnitud de 1992 a 2011 hasta el punto en que las
tasas de error suave en lógica serán iguales a las de las
estructuras de memoria desprotegidas [14]. Por estas razones,
I. ENNTRODUCCIÓN la Hoja de Ruta Tecnológica Internacional para
Semiconductores (ITRS) de 2003 [15] se refiere a la tolerancia

R Los tamaños de características y voltajes EDUCED en las


tecnologías modernas de procesos de semiconductores
al error como un desafío "transversal" para la próxima década.
La tolerancia a errores blandos es un problema importante que
han hecho que los sistemas actuales y futuros sean vulnerables debe abordarse a nivel de circuito, arquitectónico y algorítmico.
al ruido submicrónico profundo (DSM) [1], [3] y errores suaves En todos los casos, mejorar la robustez de los sistemas y
debido a impactos de partículas [4]–[17]. Los golpes de circuitos a los errores blandos introduce redundancia de alguna
partículas resultan en fallas de voltaje en los nodos del circuito, forma. Hacerlo da como resultado un área y una sobrecarga de
que luego pueden ser capturados por un elemento de enganche energía. Por lo tanto, existe una compensación fundamental
o cambiar un estado lógico. entre la eficiencia energética y la robustez [8].
Los errores blandos en las memorias semiconductoras han En este artículo, ampliamos nuestro trabajo anterior sobre la
sido una preocupación conocida durante muchos años. Se han tolerancia al ruido algorítmica (ANT) [23]–[26] para combatir
empleado códigos de corrección de errores (ECC) para el ruido DSM. Un sistema basado en ANT se compone de un
combatir los errores suaves en las memorias. Los errores bloque de control de errores(EC)que detecta y corrige errores
blandos en la lógica y los circuitos de ruta de datos no fueron en elbloque principal(M). Una suposición subyacente clave en
un problema en el pasado porque las fallas de voltaje inducidas nuestro trabajo anterior fue que el bloque de las CE está libre
por el impacto de partículas se enmascararon [14] a través de de errores. La justificación de esta suposición es el hecho de
los siguientes tres mecanismos: 1) atenuación de los pulsos de que los bloques EC son mucho más pequeños que el bloque
ruido a medida que se propaga a través de una cadena lógica principal y, por lo tanto, pueden diseñarse para ser robustos a la
(enmascaramiento eléctrico); 2) valores lógicos que anulan la fuente de ruido DSM como escalado de voltaje / frecuencia,
entrada ruidosa (enmascaramiento lógico); y 3) pulso de ruido variación de proceso, rebote de tierra, etc. Dado que esta
que falta la configuración del pestillo y la ventana de suposición ya no es válida en presencia de impactos de
sincronización de retención (enmascaramiento de la ventana de partículas, relajamos esta suposición en este documento.
cierre). Las principales contribuciones de este documento son
Sin embargo, estos mecanismos de enmascaramiento se dobles.
vuelven menos efectivos con la reducción del tamaño de las 1) Proponemos la tolerancia algorítmica a errores blandos
funciones, el aumento de la frecuencia del reloj y (ASET) como una técnica de baja potencia para mejorar la
BHAG: DSP SUAVE TOLERANTE A ERRORES DE EFICIENCIA ENERGÉTICA 337

robustez de los sistemas DSP a los errores blandos. Se (2)


proponen tres técnicas distintas de ASET: espacial,
espacio-temporal y temporal. Mostramos que la donde denota la salida libre de errores compuesta por una señal
sobrecarga de energía debida a ASET es un factor de al y ruido deseados, y es la señal de error suave.
menos X menor que el de la técnica de redundancia Suponiendo que la representación numérica del
modular triple (TMR) comúnmente empleada. complemento de un -bit 2, se puede representar como
2) Analizamos el rendimiento algorítmico de las técnicas
ASET propuestas. Específicamente, presentamos un
análisis de error cuadrático medio residual (rMSE) que se
puede emplear en el diseño de sistemas DSP basados en
(3)
ASET.
El resto de este documento está organizado de la siguiente
donde es el bit ésimo en la representación del complemento de
manera. Presentamos el modelo de error blando y revisamos el
2 de
trabajo anterior en la Sección II. En la Sección III, presentamos
. Definimos una variable flip, donde indica que el bit th
las técnicas ASET propuestas. En la sección IV se presenta el
de está volteado e indica lo contrario. La razón para emplear la
análisis de las técnicas ASET. Los resultados de la simulación
variable flip es que el error suave ocurre solo cuando la falla de
y los debates figuran en la sección V.
voltaje generada por un golpe de partícula se propaga a una
salida y es capturada por un pestillo (ver Fig. 1).
II. SOFT ERRORS Si la unidad de tiempo flip vectorat
En esta sección, primero discutimos el modelo de error se da, entonces la salida real se expresa como
blando que se empleará para estudiar la efectividad de las
1063-8210/$20.00 © 2006 IEEE
técnicas ASET propuestas, y luego revisamos el trabajo anterior
sobre computación confiable. En este artículo, restringimos
nuestra atención al modelo de trastorno de evento único (SEU)
[5], que se emplea comúnmente para estudiar la efectividad de (4)
los sistemas blandos tolerantes a errores.
donde es la operación XOR.

A. Modelo de error suave

Los errores blandos son causados por golpes de partículas


como neutrones de alta energía o partículas alfa. Una expresión
que considera la tasa de error suave (SER) [5] está dada por

(1)

donde es el área, es el flujo de partículas, es el período de


observación, es la carga crítica requerida para voltear el valor
lógico en un nodo y es la eficiencia de recolección. Se informa Figura 1. Ilustración de un evento de error suave en un bloque de multiplicación
que el SER típico para circuitos SRAM de 0,13 m es de 100 y acumulación (MAC). Los bloques dentro del cono de abanico del nodo
kFIT/Mbit [16], donde el fallo en el tiempo (FIT) se define golpeado por una partícula pueden tener salidas erróneas.
como el número de errores por cada mil millones de horas. A
medida que la tecnología escala, se reduce
proporcionalmente y también lo hace. Por lo tanto, la Lema 1: Si el vector flip es mutuamente independiente y se
probabilidad de que una partícula efectiva golpee en un nodo distribuye uniformemente, entonces la función de distribución
sigue siendo aproximadamente la misma. Sin embargo, el de probabilidad (pdf) de la señal de error suave está dada por
número de nodos por chip aumenta mientras que el período de
reloj y la profundidad de la tubería se reducen. Por lo tanto, la
(5)
tasa de error suave a nivel de chip aumentará [14].
En presencia de errores suaves, la salida de un sistema
si se distribuye uniformemente y
DSP se puede escribir como
IEEE TRANSACTIONS ON VERY LARGE SCALE INTEGRATION (VLSI) SYSTEMS, VOL. 14, NO. 4, ABRIL DE 2006

(6) sobrediseñando ligeramente el bloque M. Se ha demostrado


que la combinación de un bloque M y EC ligeramente
sobrediseñado es eficaz en presencia de errores aleatorios [23]–
si es cero media gaussiana con varianza , donde y es la
[25] siempre que el bloque CE esté libre de errores. Tenga en
probabilidad de suave
cuenta, sin embargo, que la técnica ANT no se puede aplicar
error en el bloque M. Tenga en cuenta que es distinto de , que
directamente al problema de error suave porque los impactos de
es la probabilidad de error suave de todo el sistema.
partículas también pueden ocurrir en el estimador.
Prueba: Véase el Apéndice A.
De (5) y (6), vemos que se centra alrededor de cero.
III. ASET
B. Obras anteriores
En esta sección, asumimos el modelo SEU donde cualquier
Las técnicas basadas en la redundancia se han empleado
nodo interno en el bloque o estimador M puede tener su estado
popularmente en sistemas informáticos tolerantes a fallos [17]–
lógico invertido en un período de reloj, excepto un nodo interno
[20]. La redundancia se introduce a través del recaluado [17],
en su mayoría. Asumimos que la unidad de detección y el
la replicación de código en software [18] o los sistemas de
bloque de memoria que almacenan el coeficiente de filtro y el
autocomprocomución [19]. TMR [20], [28] es una técnica bien
flujo de entrada están protegidos adecuadamente por la lógica
conocida y comúnmente empleada en sistemas basados en
de votación mayoritaria y ECC. Empleamos TMR como punto
servidores de alta gama [ver Fig. 2(a)]. TMR incluye tres
de referencia para la comparación. Como se mencionó, TMR
bloques M idénticos y emplea el voto por mayoría para detectar
puede detectar y corregir perfectamente las SEU. Por lo tanto,
y corregir errores. Dado que es poco probable que dos bloques
la relación señal-ruido de un sistema basado en TMR

M estén en error al mismo tiempo, TMR es efectivo para será igual al deseado. Sin embargo, para muchas aplicaciones,
reducir el impacto de los errores blandos. Aunque TMR es TMR puede no ser práctico debido a la complejidad 3X del
intuitivamente simple y fácil de implementar, tiene una gran sistema original.
área y penalización de potencia.
En los últimos años, la técnica ANT [23]–[25] ha surgido
A. Bienes espaciales (S-ASET)
como una opción atractiva para mejorar la robustez de los
sistemas de procesamiento de señales. Como se muestra en la La Fig. 3(a) muestra el diagrama de bloques de la técnica
Fig. 2 (b), los sistemas basados en ANT emplean un estimador ASET espacial propuesta (S-ASET). Además del bloque M,
de baja complejidad (típicamente menos del 10% de la hay dos estimadores E1 y E2 en el bloque EC. En esencia,
complejidad del bloque M) que calcula aproximadamente una S-ASET es el esquema de diversidad espacial basado en el
estimación de la salida del bloque M libre de errores. La estimador de bloques E1 y E2. El bloque M ejecuta la
salida del estimador se compara con . Si la métrica euclidiana mayoría de los cálculos, mientras que el bloque EC detecta y
es mayor que una preespecificada corrige errores. La Fig. 3(b) muestra el horario seguido de S-
Figura 2. Técnicas de tolerancia a errores/fallos: a) TMR y b) ANT. ASET. El bloque de decisión compara la salida del bloque M y
la salida del primer estimador.
Si es menor que , entonces se elige como salida. De lo contrario,
umbral , a continuación se utiliza como la salida final corregida un comparador adicional comprueba si las salidas de E1 y E2
. De lo contrario, se elige como la salida final. son iguales, es decir, . Si son iguales, se
A diferencia de TMR, las técnicas ANT introducen un error declara un error de bloque M, de lo contrario, se declara un
distinto de cero, pero pequeño y controlable, denominado ruido error del estimador. En caso de error de bloque M, elegimos
de estimación.
. Esto se debe a que la salida del estimador es una . De lo contrario, elegimos . El control de
aproximación de . Este error de estimación se puede controlar errores en S-ASET se puede resumir de la siguiente manera:
BHAG: DSP SUAVE TOLERANTE A ERRORES DE EFICIENCIA ENERGÉTICA 339

mayor parte del tiempo si los errores son poco frecuentes.


Como se ilustra en la Fig. 4 (a), un conjunto de corte de tubería

divide el funcionamiento del bloque EC en dos fases: 1) fase de


detección de errores y 2) fase de corrección de errores.
La Fig. 4(b) muestra el horario seguido de ST-ASET. En la
fase de detección de errores, el bloque EC compara la salida del
(7) bloque M y la salida E1. Si se detecta un error en el ciclo
ésimo, es decir,
Dónde , a continuación, se activa E2 y se activa un
y des Abajo es la distancia de Hamming entre la comparación se realiza en el ciclo th para determinar el
e bloque erróneo. Si , elegimos
Figura 3. S-ASET: (a) diagrama de bloques y (b) cronograma.

Figura 4. ST-ASET: (a) diagrama de bloques y (b) cronograma.


(8)

donde y son los bits ésimo de y , respectivamente, y denota la


operación or exclusiva. Como E1 y E2 tienen una . De lo contrario, elegimos . La regla de
complejidad que es inferior al 10% de la del bloque M, la decisión de ST-ASET se describe por
complejidad S-ASET es aproximadamente 1.2X del sistema
original, que es mucho menor que la complejidad de TMR.

B. Activos espacio-temporales (ST-ASET)


(9)
El esquema S-ASET necesita que ambos estimadores estén
En (9), el único escenario en el que se detecta el error pero no
activos en cada ciclo de reloj. La Fig. 4(a) muestra el diagrama
de bloques de la técnica espacio-temporal ASET (ST-ASET) se corrige es cuando el bloque principal está en error y E2
que reduce aún más la potencia. La idea clave en ST-ASET es también está en error en el siguiente ciclo. Sin embargo, esta
situación es poco probable cuando
emplear E1 (redundancia espacial) para monitorear un error y
E2 solo cuando ocurre un error pero en el siguiente ciclo de . Por lo tanto, el rendimiento del ST-ASET es similar al
reloj (redundancia temporal). Por lo tanto, E2 se apaga la del S-ASET.
IEEE TRANSACTIONS ON VERY LARGE SCALE INTEGRATION (VLSI) SYSTEMS, VOL. 14, NO. 4, ABRIL DE 2006

Activos temporales (T-ASSETS) insensible al ancho de banda, RPR se puede emplear para una
Cuando la tasa de error es muy pequeña, como en el caso de amplia gama de anchos de banda de filtro.
los eventos de error blando, la probabilidad de dos errores B) Predictor: Un estimador basado en predicciones [23]
consecutivos en el estimador se vuelve muy pequeña. Por lo emplea un predictor de avance de baja complejidad para
tanto, podemos utilizar un único estimador E1 tanto para la estimar la salida del filtro de corriente de las salidas
detección como para la corrección de errores, como se muestra pasadas del bloque M.
en Fig.5.La decisoria para el ASET(T-ASET) se describe en Las salidas consecutivas del bloque M están altamente
(10). En comparación con el ASET espacial o espacio- correlacionadas para los filtros de banda estrecha. Por lo tanto,
temporal, la reducción del área en el esquema T-ASET es un predictor -tap puede generar una estimación que
considerable. Como E1 necesita estar activo todo el tiempo se utilizará como salida corregida cuando se detecte un error.
para fines de detección de errores, la disipación de potencia del La salida de un predictor de avance -tap es
T-ASET es similar a la de la técnica ST-ASET

(12)

donde se obtiene a través de la ecuación de Wiener-Hopf


(10)
[27]. El predictorperforme bien para los filtros de banda de
cintura (el ancho de banda es inferior a , donde es la frecuencia
D. Estimador de muestreo) y en entornos con una frecuencia de errores
En esta subsección, revisamos dos algoritmos de estimación inferior a.
empleados en ASET para la detección y corrección de errores.
El papel del estimador es generar lo que está cerca de la salida IV. ASET PERFORMANCE ANALYSIS

del bloque M libre de errores con baja complejidad. En la Sección III, vimos que ASET implica calcular las
A) Redundancia de precisión reducida (RPR): un salidas del bloque M, los dos estimadores seguidos de
estimador RPR [25] emplea una réplica del bloque M con comparaciones entre estas salidas con respecto a un umbral.
unidades aritméticas de precisión reducidas. La salida del El global alcanzado por ASET es, por lo tanto,
estimador RPR está dada por una función de la frecuencia de error bruta y el umbral de
decisión
. En esta sección, investigamos esta relación entre el
,y .
(11) La salida no corregida y la salida corregida en
ASET se pueden escribir como
Dónde y son las versiones truncadas del M
coeficiente de filtro de bloque y entrada, respectivamente.
Cuando un error es de- (13)
Figura 5. T–ASET: (a) diagrama de bloques y (b) cronograma. (14)

donde es la señal de error suave residual.


detectado usando (8)–(10), se emplea como salida Con el fin de satisfacer una necesidad
final. La elección razonable de la precisión de la réplica puede específica deseada para satisfacer la
minimizar el ruido de cuantización, ya que la frecuencia de siguiente desigualdad:
error suele ser pequeña. Dado que el ruido de cuantización es
BHAG: DSP SUAVE TOLERANTE A ERRORES DE EFICIENCIA ENERGÉTICA 341

Prueba: Véase el Apéndice B.


(15) El teorema 2 indica que depende de lo siguiente: 1)
probabilidad bruta de error; 2) la eficacia del estimador
empleado; y 3) el umbral de decisión. De (16) y (21),
obtenemos la siguiente desigualdad:

(22)

B. RMSE óptimo
En esta subsección, descubrimos la probabilidad y la
potencia de ruido de cada evento en (22) y presentamos un
análisis detallado de rMSE. Empleamos el modelo de error
blando en la Sección II-A y asumimos además que el error de
estimación es uniforme en una región suficientemente
pequeña alrededor de cero.
Primero, en caso de evento DER, obtenemos trivialmente

ya que el caso ocurre con


Figura 6. Cuatro posibles decisiones en el esquema ANT y ASET.
alta probabilidad.

donde y son las potencias del ruido deseado del y


canal de señal, respectivamente, y es el poder de
.
La ecuación (15) se puede reescribir como

(16)
La ecuación (16) indica que el efecto sobre el rendimiento del
sistema es mínimo si la potencia de error blando residual es
mucho menor que la potencia de ruido del canal.
A. Análisis rMSE
La regla de decisión de ASET espacial en la Sección III-A da
como resultado cuatro posibles eventos de decisión como se
muestra en la Fig. 6. Sin pérdida de generalidad, nos centramos
en que el bloque M está en error con probabilidad. A
continuación, asumimos que y
son variables aleatorias que representan , respectivamente, con
el índice de tiempo caído debido a la conveniencia notacional.
El error suave puede pasar desapercibido si es lo
suficientemente pequeño, es decir, la métrica de distancia es
menor o igual que . Tal evento de error no detectado (UER)
aparece con una probabilidad dada por

(17)
IEEE TRANSACTIONS ON VERY LARGE SCALE INTEGRATION (VLSI) SYSTEMS, VOL. 14, NO. 4, ABRIL DE 2006

Prueba: Véase el Apéndice C. muestra en la Fig. 7. Cuando el , potencia de error


El resultado en el Lema 3 es consistente con nuestra blando residual aumenta abruptamente debido a un rápido
expectativa de que la probabilidad del evento UER
aumenta con el umbral. varía cuadráticamente con

aumento de . Mientras que, cuando , el poder de error


Prueba: Véase el Apéndice D. blando residual aumenta gradualmente debido al aumento
Como ejemplo, para el caso de un filtro FIR de 30 toques con moderado de . Si elegimos ser mayores que solo los
MDSP de 16 bits y estimador de réplica de 8 bits, la potencia eventos DER y UER contribuyen a la potencia del ruido
de error suave residual para diferentes valores del umbral se
BHAG: DSP SUAVE TOLERANTE A ERRORES DE EFICIENCIA ENERGÉTICA 343

como lo indica el Teorema 4. Por lo tanto, (21) puede emplea: 1) sin protección contra errores; 2) TMR; 3)
simplificarse a HORMIGA; y 4) técnicas ASET.
Generación e inyección de errores suaves: para emular el
entorno realista de trastorno de un solo evento, implementamos
(27) un multiplicador y acumulador (MAC) a nivel de puerta.
Además, al sustituir (23) en (28), obtenemos Cuando se produce un golpe de partícula, se invierte una salida
de nodo interno seleccionada al azar

(28)
Es interesante observar que los dos términos de (28)
representan la eficacia de la corrección y detección de errores,
respectivamente. En el caso de TMR, que es una forma extrema
de S-ASET, y, por lo tanto, .
Como se menciona en la sección III-B, el poder de error
blando residual de S-ASET en (28) no se aplica a ST-ASET y
T-ASET. Cuando se produce un error en dos unidades de
tiempo consecutivas, por ejemplo, en MDSP y en
E2,el control de errores en ST-ASET fallará. En el caso de T-
ASET, la detección de errores en el ciclo anterior prohíbe el
control de errores en el ciclo actual. Teniendo en cuenta estos
factores, los poderes de error blando residuales de ST-ASET y
T-ASET están dados por

(29)
donde , yes el Figura 8. Poder de error blando residual de ASET espacial, espacio-temporal
probabilidad de error en E1 y E2 para ST-ASET y para T- y temporal versus p .
ASET. Dado que es muy pequeño en general, el rendimiento
asintótico de ASET espacio-temporal y temporal son similares
al ASET espacial cuando . De hecho, como se muestra
en la Fig. 8, empleando la configuración de la Fig. 7, se
encuentra que el poder de error blando residual de ASET
espacio-temporal es cercano al de ASET espacial cuando
. En cualquier caso, como se observa claramente en
la Fig. 8, el poder de error blando residual de ASET es lo
suficientemente pequeño como para una amplia gama de lo que
permite alcanzar el rendimiento deseado.

V. DISCUSSION Y SIMULATION RESULTS


En esta sección, estudiamos el rendimiento y el ahorro de
energía de las técnicas ASET propuestas sobre el sistema
original (sin control de errores), ANT y TMR en el contexto del
filtrado selectivo de frecuencia. En todas las simulaciones,
empleamos el esquema RPR como estimador para ASET.
Primero describimos la configuración de la simulación y luego
presentamos los resultados de la simulación.
A. Configuración de simulación
La Fig. 9 ilustra el sistema que se está considerando. El
bloque M es un filtro que extrae una señal en presencia de otras
señales, fuente de ruido gaussiana blanca y señal de error
suave. Como se mencionó anteriormente, consideramos
cuatro casos. Estos son cuando el bloque M es un filtro FIR y
IEEE TRANSACTIONS ON VERY LARGE SCALE INTEGRATION (VLSI) SYSTEMS, VOL. 14, NO. 4, ABRIL DE 2006

Figura 9. Configuración de simulación para ASET: (a) filtro selectivo de Sin embargo, S-ASET mantiene el rendimiento algorítmico
frecuencia ASET y (b) respuesta de frecuencia de d [n] y h[n]. hasta proporcionar más de tres órdenes de
magnitud de mejora en la tolerancia a errores blandos sobre el
MDSP original sin control de errores.
y también lo son las salidas de todas las puertas en el cono de
Con el fin de observar la distribución del ruido residual
abanico de ese nodo. El golpe de partícula puede ocurrir en el
condicionada a la ocurrencia de errores, trazamos en
bloque M o en el estimador. Suponiendo que la probabilidad
de error en todo el sistema es , la probabilidad de error en el la Fig. 11 cuando
bloque M y cada estimador de ASET están dados por . Tenga en cuenta que es difícil distinguir la diferencia en
los esquemas ASET cuando . Observamos que la
distribución del esquema original sin control de errores es
(30) amplia en el rango
. Dado que ANT no puede corregir errores blandos
(31) perfectamente, también tiene una amplia distribución de ruido
residual. Sin embargo, el ruido residual de S-ASET se centra
donde y son las áreas del bloque M y esti- alrededor de 0. A pesar de que hay
mator, respectivamente. En el caso de S-ASET y ST-ASET,
y para T-ASET, dondey son las áreas
de E1 y E2,respectivamente.
Especificaciones del sistema: Cada señal utilizada en nuestra
simulación tiene un ancho de banda de con una banda de
protección de . Además, se agrega un ruido gaussiano con una
densidad espectral de potencia 30 dB por debajo del nivel de
señal en el receptor. Para extraer la señal deseada, se emplea un
filtro de paso bajo Parks-McClellan FIR [30].

Dónde
tener un margen de 0,5 dB para todas las técnicas excepto TMR. Figura 10. Rendimiento SNR de los esquemas ASET frente a P en el
Tenga en cuenta que TMR está diseñado sin ningún margen entorno SEU.
porque puede corregir perfectamente los errores bajo el
supuesto de SEU. El bloque M original puede proporcionar
esto con un filtro de 33 toques (30 toques en el caso de
TMR) junto con un multiplicador de 16 bits. El estimador de
réplica emplea un multiplicador de 8 bits con el mismo número
de toques que el bloque M.

B. Resultados de la simulación
La Fig. 10 muestra la salida s para todas las técnicas.
Vemos que el resultado final
para el sistema sin errores, el control Pa . Nota
dBif ra
caeseverely(22dB)as aumentos de
que la pérdida se vuelve significativa ( ) para ANT porque
el control de errores falla cuando se producen errores suaves en
el estimador. Todas las técnicas ASET mantienen los
enfoques hasta el cual el rendimiento de ST-ASET y T-
ASET comienza a caer en régimen de alto error.
BHAG: DSP SUAVE TOLERANTE A ERRORES DE EFICIENCIA ENERGÉTICA 345

Figura 11. Distribución del ruido residual de los esquemas ASET.

Errores de alta magnitud en ST-ASET y T-ASET, estos ocurren


raramente y, por lo tanto, el efecto de la potencia de ruido
residual en el rendimiento general es insignificante.
IEEE TRANSACTIONS ON VERY LARGE SCALE INTEGRATION (VLSI) SYSTEMS, VOL. 14, NO. 4, ABRIL DE 2006

Ahorro de energía La Fig. 12(a) muestra la precisión óptima del estimador de


réplica en función de . A medida que aumenta, el ruido de
Con el fin de evaluar el ahorro de energía de las técnicas
estimación debe reducirse para satisfacer el rendimiento

propuestas sobre la técnica TMR, se buscó la precisión de la deseado y, por lo tanto, la precisión de ASET aumenta. Dado
réplica para cada valor de . La precisión óptima que los ASET espacio-temporales y temporales no satisfacen
el cumplimiento de los requisitos del sistema está dado por los requisitos del sistema en alto
VI.CINCLUSIÓN
(34) En este documento, presentamos una categoría de datos para
la tolerancia a errores de baja para los sistemas de
procesamiento de señalesreferidos a ASET. El enfoque
BHAG: DSP SUAVE TOLERANTE A ERRORES DE EFICIENCIA ENERGÉTICA 347

propuesto emplea dos estimadores que trabajan en conjunto con Dónde


un bloque principal para detectar y corregir errores. El enfoque es
propuesto tiene una gran área y un poder de cabeza de la 2Xs
más grande que la tecnología populartmR. Este trabajo abre
nuevas áreas de investigación en las que las compensaciones
entre la tolerancia al error suave y la potencia pueden explorarse y
a nivel algorítmico. Por ejemplo, el trabajo futuro podría como
dirigirse hacia el estudio del impacto de la escala de voltaje y
(37
ASET en las tasas de error suaves. El bloque M podría ser
)
sobreescalado [25] para reducir aún más la potencia y los
estimadores podrían usarse para detectar y corregir los errores.
Nuestro trabajo reciente [32] ha demostrado que las tasas de
error suaves en la lógica combinacional son una función débil (no
de la tensión de alimentación. Por lo tanto, los sistemasASET
de baja tensión parecen ser prometedores. Otra dirección de (38
exploración sería extender la solución ASET a los procesadores )
de uso general. Dado que el estimador se puede realizar con una
unidad aritmética pequeña y eficiente en el consumo de energía, Obtener
la solución ASET combinada con la aplicación de
procesamiento de señales apropiada ecccaccaneffective
realizada por procesadores de propósito general.
(39
)
UNPPENDIX A PTECHODE LEMMA 1
De (6) y (4), la probabilidad de error suave se puede escribir

UNPPENDIX B PTECHODE THEOREM 2


Como se indica en la sección IV-B, hay cuatro posibles
acontecimientos en la detección de errores suaves. Por lo tanto,
el poder de error blando residual se puede escribir como

(40
)

es la probabilidad de error del bloque M.


A partir de la definición de valor esperado condicional [31],
tenemos
como

(36
)
IEEE TRANSACTIONS ON VERY LARGE SCALE INTEGRATION (VLSI) SYSTEMS, VOL. 14, NO. 4, ABRIL DE 2006

Tenga en cuenta que (50) es una expresión para la


manipulación, el numerador se puede reescribir
como

(51)
Por lo tanto, al sustituir (45), (46) y (47) en (40), obtenemos

UNPPENDIX C PTECHODE LEMMA 3 (52)

s ,

respectivame

nte.
donde el evento UER se produce sólo cuando . El
denominador está dado por [véase (5)]

en
BHAG: DSP SUAVE TOLERANTE A ERRORES DE EFICIENCIA ENERGÉTICA 349

UnPPENDIX D (60)

Caso 2)
Cuando el umbral disminuye y aumenta. Sin embargo, en
este caso, la probabilidad de falsas alarmas aumenta,
degradando así considerablemente el rendimiento. La
diferencia de potencia de ruido residual
está dada por

(61)
Caso 1) En primer lugar, la diferencia en el término de potencia de ruido
DER es
Cuando , no se produce un evento de falsa alarma
[consulte
(22)]. Por lo tanto, (21) en el teorema 2 se simplifica a (62)

donde es el aumento de la probabilidad de DER (disminución


(55) de UER)
dado por
donde indiquemos explícitamente la dependencia de . Del mismo modo, a partir de (23) y (24), la diferencia de
,y potencia de ruido UER está dada por

(57)
(58)

Desde (55), la diferencia entre y está


dado por

(64)

(59 (65)
)
Con (62), (63), (64), (65), (61) se puede reescribir como
y
IEEE TRANSACTIONS ON VERY LARGE SCALE INTEGRATION (VLSI) SYSTEMS, VOL. 14, NO. 4, ABRIL DE 2006

[16] R. Baumann, "The impact of technology scaling on soft error rate


performance and limits to the efficacy of error correction", en Dig. Int.
Electron Devices Meeting,2002, pp. 329–332.
[17] J.B. Nickel y A. K. Somani, "REESE: A method of soft error detection in
microprocessors", Dependable Syst. , págs. 401–410, 2001.
[18] I. Yen, E. L. Leiss y F.B. Bastani, "Exploiting redundancy to speed up
parallel systems", en Proc. Parallel Distributed Tech. , 1993, págs. 51-
60.
[19] L. Anghel, M. Nicolaidis y M. Alzaher-Noufal, "Self-checking circuits
Después de un poco de álgebra, el término correcto en (66) es
versus realistic faults in very deep submicron", Proc. IEEE VLSI Test
Symp. , págs. 55–63, 2000.
[20] L. Anghel, D. Alexandrescu y M. Nicolaidis, "Evaluation of a soft error
tolerance technique based on time and/or space redundancy", Integr.
Circuitos Syst. Des. , págs. 237–242, 2000.
[21] P. Mazumder, "An on-chip ECC for correcting soft errors in DRAM's
with trench capacitors", IEEE J. Solid-State Circuits. , vol. 27, núr. 11,
págs. 1623-1633, noviembre de 1992.
[22] T. Austin, "DIVA: A reliable substrate for deep submicron
microarchitecture design", en Proc. Int. Symp. Microarch. , 1999, págs.
196-207.
[23] R. Hegde y N. R. Shanbhag, "Soft digital signal processing", IEEE Trans.
Very Large Scale Integr. (VLSI) Syst. , vol. 9, núr. 6, págs. 813–823,
Del Caso 1) y el Caso 2), . diciembre de 2001.
[24] L. Wang y N. R. Shanbhag, "Low-power filtering via adaptive
REFERENCIAS errorcancellation", IEEE Trans. Signal Process. , vol. 51, núr. 2, págs.
575–583, febrero de 2003.
[1] K. L. Shepard y V. Narayanan, "Noise in deep submicron digital design",
[25] B. Shim, S. Sridhara y N. R. Shanbhag, "Low-Power digital signal
en Proc. IEEE/ACM Int. Conf. Comput.-Aided Des. , 1996, págs. 524-
processing via reduced precision redundancy", IEEE Trans. Very Large
531.
Scale Integr. Syst. , vol. 12, núr. 5, págs. 497-510, mayo de 2004.
[2] J. R. Srour y J.M. McGarrity, "Radiation effects on microelectronics in
[26] B. Shim, M. Zhang y N. Shanbhag, "A novel forward-backwardpredictor
space", Proc. IEEE,vol. 76, no. 11, pp. 1443–1469, noviembre de 1988.
based low-power DSP system", en Proc. IEEE Workshop Signal Process.
[3] V. De y S. Borkar, "Desafíos de tecnología y diseño para baja potencia y
Syst. Implementation (SiPS),2004, págs. 331–336.
alto rendimiento", en Proc. Int. Symp. Low-Power Electron. DES. , 1999,
[27] T. K. Moon y W.C.Striling, Métodos matemáticos y algoritmos para el
págs. 163-168.
procesamiento de señales. Englewood Cliffs, NJ: Prentice-Hall, 1999.
[4] T. Karnik y S. Vangal, "Selective node engineering for chip-level soft
[28] K. G. Shin y H. Kim, "A time redundancy approach to TMR failures using
error rate improvement", en Proc. Symp. VLSI Circuits,2002, pp. 132–
fault-state likelihoods", IEEE Trans. Computers,vol. 43, no. 10, pp. 1151–
135.
1162, octubre de 1994.
[5] P. Hazucha y C. Svensson, "Impact of CMOS technology scaling on the
[29] R.Hegde yN. R. Shanbhag, "Avoltage overscaled low-power digital filter
atmospheric neutron soft error rate", IEEE Trans. Sci. , vol. 47, núr. 6,
IC", IEEE J. Solid-State Circuits,vol. 39, no. 2, pp. 388–391, febrero.
págs. 2586–2594, diciembre de 2000.
2004.
[6] R.C. Baumann, "Soft errors in advanced semiconductor devices-Part I:
[30] A. V. Oppenheim y R.Schafer, Procesamiento de señales de tiempo
The three radiation sources", IEEE Trans. Device Mater. Reliab. , vol. 1,
discreto.
núme. 1, págs. 17–22, marzo de 2001.
Englewood Cliffs, NJ: Prentice-Hall, 1989.
[7] N. R. Shanbhag, K. Soumyanath y S. Martin, "Reliable low-power design
[31] A. Papoulis,Probabilidad, Variable aleatoria y Procesos estocásticos.
in the presence of deep submicron noise", en Proc. Int. Symp. Low-Power
Nueva York: McGraw-Hill, 1991.
Electron. DES. , 2000, págs. 295-302.
[32] M. Zhang y N. R. Shanbhag, "Soft error rate analysis (SERA)", en Proc.
[8] N. R. Shanbhag, "Reliable and efficient system-on-chip design", IEEE
IEEE/ACM Int. Conf. Comput.-Aided Des. , 2004, págs. 111-118.
Computer,vol. 37, no. 3, pp. 42–50, marzo de 2004.
[33] T. Calin, "Upset hardened memory design for submicron CMOS
[9] Y. Tsiatouhas, T. Haniotakis, D. Nikolos y C. Efstathiou, "Concurrent
technology", IEEE Trans. Sci. , vol. 43, núr. 6, págs. 2874–2878,
detection of soft errors based on current monitoring", en On-Line Testing
diciembre de 1996.
Workshop,2001, pp. 106–110.
[10] K. Zhang, S. Hareland, B. Senyk y J. Maiz, "Methods for reducing soft
errors in deep submicron integrated circuits", en Proc. Solid-State Integr.
Circuito Tecnológico. , 1998, págs. 516-519.
[11] J.M. Rabaey y M. Pedram,Metodologías de diseño de baja potencia.
Byonghyo Shim (M'97) recibió los títulos de B.S. y M.S.
Norwell, MA: Kluwer, 1996, pp. 160-200. en ingeniería de control e instrumentación de la
[12] L. W. Massengill, A. E. Baranski, D. Nort, J. Meng y B. L. Bhuva, Universidad Nacional de Seúl, Seúl, Corea, en 1995 y
"Analysis of single-event effects in combinational logic—Simulation 1997, respectivamente, y la maestría en matemáticas y el
of the AM2901 bitslice processor", IEEE Trans. Nucl. Sci. , vol. 47, doctorado en ingeniería eléctrica e informática de la
núr. 6, págs. 2609–2615, diciembre de 2000. Universidad de Illinois en Urbana-Champaign, Urbana,
[13] L. Wissel, S. Pheasant, R. Loughran y C. LeBlanc, "Managing soft en 2004 y 2005, respectivamente.
errors in ASICs", en Proc. Custom Integr. Circuitos Conf. , 2002, págs. De 1997 a 2000, estuvo en el Departamento de
85-88. Ingeniería Electrónica de la Academia de la Fuerza
[14] P. Shivakumar, "Modeling the effect of technology trend on the soft Aérea de Corea como Oficial e Instructor Académico a
error rate of combinational logic", en Proc. Int. Conf. Dependable Syst. Tiempo Completo. Tuvo un puesto de investigación de poco tiempo en el grupo
Netw. , 2002, págs. 389-398. DSP de LG Electronics y DSP R&D Center, Texas Instruments Incorporated,
[15] "La hoja de ruta de la tecnología internacional de 2003 para Dallas, TX, en 1997 y 2004, respectivamente. En enero de 2005, se unió a
semiconductores", Qualcomm Inc., San Diego, CA, donde actualmente es Ingeniero Senior
[En línea]. Disponible: http://public.itrs.net. trabajando en sistemas CDMA inalámbricos. Sus intereses de investigación
abarcan un amplio espectro de procesamiento de señales digitales, incluido el
BHAG: DSP SUAVE TOLERANTE A ERRORES DE EFICIENCIA ENERGÉTICA 351

procesamiento de señales para la comunicación, el procesamiento de señales


VLSI, el procesamiento de señales confiables y de baja potencia, y la
estimación y detección y la teoría de codificación.
El Dr. Shim recibió el Premio de Investigación M. E. Van Valkenburg 2005
del Departamento de Ingeniería Informática Eléctrica de la Universidad de
Illinois y el 10º Premio Samsung Humantech Paper en 2004. Es miembro de
Sigma Xi y Tau Beta Pi.

Naresh R. Shanbhag (F'06) recibió el ph.D. grado en


ingeniería eléctrica de la Universidad de Minnesota,
Minneapolis, en 1993. De 1993 a 1995, trabajó en
AT&T Bell
Laboratories, Murray Hill, NJ, donde fue el arquitecto
principal de chips para los chips transceptores de
51.84 Mb / s de AT&T sobre cableado de par trenzado
para modo de transferencia asíncrono (ATM)-LAN y
conjuntos de chips de línea de suscriptor digital
(VDSL) de muy alta velocidad. Desde agosto de
1995, ha estado en el Departamento de Ingeniería Eléctrica e Informática y en
el Laboratorio de Ciencias Coordinadas de la Universidad de Illinois en
Urbana-Champaign, Urbana, donde actualmente es profesor. Sus intereses de
investigación se encuentran en el diseño de circuitos y sistemas integrados para
comunicaciones de banda ancha, incluidas arquitecturas VLSI de baja potencia
/ alto rendimiento para codificación de control de errores, ecualización y diseño
de circuitos integrados digitales. Ha publicado más de 90 artículos de revistas
/ capítulos de libros / publicaciones de conferencias en esta área y posee 3
patentes estadounidenses. También es coautor de la monografía de
investigación Pipelined Adaptive Digital Filters (Kluwer, 1994).
El Dr. Shanbhag recibió el PREMIO IEEE Transactions on VLSI Best Paper
Award de 2001, el IEEE Leon K. Kirchmayer Best Paper Award de 1999, el
Xerox Faculty Award de 1999, el National Science Foundation CAREER
Award en 1996 y el Darlington Best Paper Award de 1994 de la IEEE Circuits
and Systems Society. De 1997 a 1999, fue profesor distinguido de la IEEE
Circuits and Systems Society. De 1997 a 1999 y de 1999 a 2002, se desempeñó
como editor asociado de IEEE T RANSACTIONS ON CIRCUITS AND
SYSTEMS:PART II y IEEE TRANSACTIONS ON VERY LARGE SCALE
INTEGRATION (VLSI) SYSTEMS,respectivamente. Ha servido en los comités
técnicos del programa de varias conferencias.

También podría gustarte