Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCCIÓN AL
ANÁLISIS ESTADÍSTICO DE
IMÁGENES DE
RESONANCIA MAGNÉTICA
FUNCIONAL
ÍNDICE
APÉNDICE
A.1 La transformada de Fourier discreta
A.2 El sistema de Haar
A.3. Bases de Wavelets regulares
A.4 Wavelet de descomposición y la Reconstrucción
A.5 Los Conceptos de representación con filtro
A.6 Localización de frecuencia
A.7 Los ejemplos de Wavelet y sus construcciones
A.8 Wavelet Dos-Dimensiones
A.9 Paquetes Wavelet
A.10 Traducción Invariante Wavelet Smoothing
Capítulo 1
PRELIMINARES SOBRE EL FMRI
(Imagen por resonancia magnética funcional)
Wi = γ ( B0 + G ⋅ ri )
Siendo:
Wi la frecuencia del protón en la posición ri.
G un vector que resume la amplitud y dirección del gradiente.
1.2 Relajación
La relajación describe la evolución de la magnetización en tres direcciones distintas.
1.-Tiempo de relajación longitudinal T1: la componente del vector de magnetización M es paralela al campo
magnético principal B0 denominado magnetización longitudinal (Mz). El proceso se recupera mediante la
magnetización original M0 se denomina relajación longitudinal y posee una constante de tiempo T1.
(
M z (t ) = M z (0) ⋅ 1 − e −t /T1 )
2.-Tiempo de relajación transversal T2: la componente del
vector de magnetización M que es perpendicular al campo magnético principal B0 se denomina magnetización
transversal (Mxy). El proceso mediante el cual decae hasta prácticamente cero se denomina relajación
transversal y posee una constante de tiempo T2.
M xy ( t ) = M xy ( t ) ⋅ e− t/ T2
En sistemas reales, se producen transferencias de spin entre los núcleos observados y el medio de
estudio. Esto permite la producción de transiciones prohibidas y transiciones de relajación desde un estado
excitado a uno de equilibrio (normal). También existe la transferencia de spin entre núcleos excitados para
dispersar la magnetización que no se encuentra en equilibrio
Si la fuerza del campo magnético aumenta, también lo hace BOLD. En los campos bajos, no hay
diferencia en los tiempos de relajación transversal de la sangre oxigenada y desoxigenada.
El primer nivel de oxigenación sanguínea depende del experimento de contraste, donde se demuestra
que después de la desoxigenación de la sangre, la susceptibilidad magnética de los vasos sanguíneos se
incrementa. El efecto de esto es doble:
Primero: los gradientes del campo local se generan.
Segundo: El tejido T*2 disminuye alrededor de los vasos sanguíneos.
Este cambio se estudia en BOLD-FMRI y es el tipo más común de la FMRI. El experimento de contraste
consigue que la sangre oxigenada que está en las proximidades de la neurona cambien y no se vean afectadas
por la señal de resonancia magnética
W ( x, y ) = γ B0 + γ Gx x + γ G y y
Siendo:
• El eje y corresponde a la fase de codificación.
• El eje x a la codificación de frecuencia.
• Bo: campo magnético estático.
• G: es un vector que resume la amplitud y la dirección de información del gradiente.
• Wi: es la frecuencia del protón en la posición de ri.
• γ: Gradiente
La señal obtenida en la fase de gradiente de codificación se coloca en el centro del espacio k. A medida
que se avanza en el eje y, la fase de codificación del gradiente aumenta. Cuando se aplican los gradientes Gx
se muestra una fila en el espacio k para una etapa determinada.
Este proceso se repite para cada fase, hasta completar una matriz de datos del espacio k. Los valores de
esta matriz son los cambios producidos en la frecuencia y en la fase del segmento elegido.
La densidad de núcleos de hidrógeno define la señal inducida en el receptor del sistema con un
{ }
ρ ( x, y ) cos 2π ( γ B0 + γ Gx x + γ G y y ) t + i sin 2π ( γ B0 + γ Gx x + γ G y y ) t dxdy
Siendo:
• El coseno la parte verdadera, o contribución a lo largo del eje x.
• El seno es la parte imaginaria o contribución a lo largo del eje y.
Cuando se recibe la señal, hay un modelo adicional que permite ignorar al campo estático Bo y por tanto la
señal que se almacena por el escáner en el tiempo t es:
{ }
I (t ) = ∫ ∫ ρ ( x, y ) cos 2π ( γ B0 + γ Gx x + γ G y y ) t + i sin 2π ( γ B0 + γ Gx x + γ G y y ) t dxdy
El centro del espacio k contiene la señal más fuerte y si se avanza hacia la periferia en cualquier
dirección, la señal se debilita. Esta señal en el centro del espacio elimina el resto de la señal grabada de tal
forma que en la transformada de Fourier de una imagen aparece la silueta del cerebro. La información sobre
los detalles finos de la imagen están contenidos en los bordes del espacio k, y esto se traduce en imágenes
borrosas reconstruidas del cerebro.
Transformada de Fourier: proceso matemático para determinar la intensidad y la fase de los distintos
componentes de las frecuencias en una señal que varía en tiempo (o en espacio).
Vóxel: es la unidad cúbica que compone un objeto tridimensional. Constituye la unidad mínima
procesable de una matriz tridimensional. Para crear una imagen en tres dimensiones, los vóxeles sufren una
transformación de opacidad. Esto es importante cuando se muestran detalles interiores de una imagen que
quedaría tapada por la capa exterior más opaca de los vóxeles.
1.2.1.2 ¿Cómo afecta los cambios de resolución y de calidad de imagen a los parámetros?
Al manipular el TR y el TE se introduce un efecto directo sobre ellos. En un contraste entre dos tipos
de tejidos diferentes, se definen A y B, con distintos valores de τ1 y τ 2* . El contraste entre estos dos tejidos
está dado por:
- Si t = 0, la curvas están muy juntas, no hay señal de los tejidos, y por tanto C AB = 0.
- Si t tiende a infinito, las curvas están muy juntas, y se reduce el efecto de T1.
Estos parámetros se utilizan para imágenes de diferentes pesos, que se ponderan por el resultado de un
experimento con tiempos de recuperación intermedios y TE pequeños.
En FMRI, la señal de proporción de ruido SNR es proporcional al producto del volumen de un vóxel:
N y NEX BW
Siendo:
• Ny el número de fase que codifica los pasos.
• NEX es el número de excitaciones.
• BW es el ancho de banda W.
Al aumentar el número de excitaciones, aumenta también la señal de proporción de ruido, aunque el aumento
no es lineal, porque sigue una ley de raíz cuadrada. Con un mayor ancho de banda:
o Se aumenta el ruido
o Se disminuye la señal de proporción de ruido.
La señal de proporción de ruido depende del:
o El volumen de un vóxel individual.
o El tiempo total de las señales.
Entonces se obtiene la señal de de ruido que es proporcional a:
plano, porque una desventaja de adquirir datos en espiral es no poder aplicar la transformada de Fourier,
porque los datos se obtienen antes de reconstruir la imagen.
La percepción de la aleatoriedad del diseño: es un factor adicional incluido en el modelo. Los diseños
de bloque tienen un alto grado de aleatoriedad porque alternan entre dos condiciones, abriendo así la
posibilidad de que los sujetos se adelanten a los estímulos, con la confusión en los efectos de interés.
El tiempo es el coste de conseguir un equilibrio entre los dos extremos del diseño semi aleatorio.
El diseño sem- aleatorio es la probabilidad de estar en la condición de tarea que cambia con el tiempo.
El ruido acústico se reduce ajustando la fecha de adquisición de la imagen, usando secuencias de pulsos
que generan menos ruido.
o La reducción pasiva del ruido: es reducir el ruido a través de dispositivos que amortiguan el
sonido.
o La reducción activa del ruido: es eliminar el ruido a través de la aplicación del inverso del
ruido original.
El enfoque se utiliza para adquirir imágenes y determinar si hay translación o rotación del cerebro en el
espacio de tres dimensiones, determinar en qué medida. Esta translación y rotación se utiliza para
modificar los parámetros de adquisición de imágenes para compensar el movimiento que haya ocurrido.
Las medidas de calidad definen la imagen y calculan el espacio k de los datos, porque el sistema no
proporciona imágenes para la reconstrucción de las medidas de calidad en tiempo real.
Cuando el sujeto no se mueve se utiliza la distancia de mínimos cuadrados y se estiman los parámetros
de movimiento que introducen sesgo debido a que las zonas de activación se tratan como valores extremos.
Para evitar este problema se usa la medida de la distancia más robusta.
llamada media de ancho máxima total (FWHM). Para una distribución Gauss, se define la media del ancho
máximo total como
2 2 log 2σ ≈ 2.36σ
Hay dos razones en FMRI para suavizar la relación.
1. El filtro suaviza la relación señal/ruido, al difuminar la señal medida en vóxeles vecinos. Si el
tamaño del filtro es pequeño, la señal de interés no se ve afectada negativamente.
2. Se suaviza la función filtro para mejorar la calidad de los datos en el análisis estadístico.
El problema de suavizar es que el tamaño del filtro no es el adecuado, o demasiado grande o
demasiado pequeño, y perjudica el análisis estadístico.
o Si es demasiado grande, la mayor región en la que la actividad se lleva a cabo suaviza la
activación y por no se detecta.
o Si es demasiado pequeño, la relación señal/ruido no se mejora, y degrada la resolución espacial.
El filtrado cambia la naturaleza de la correlación espacial entre vóxeles. Por esto, no todos los grupos
forman parte del pre-procesamiento.
A lo largo del tiempo los datos medidos en la señal de resonancia magnética evolucionan en cada
vóxel del cerebro. Existen diferentes fuentes de ruido en los datos FMRI. La señal de interés es una parte de lo
que se mide en el escáner de resonancia magnética y el cambio es similar a pequeñas escalas. Incluso después
del pre-procesamiento, existe variabilidad en los datos.
Hay correlación si se da la señal en el:
o Tiempo
o Espacio.
• La correlación temporal surge porque los estímulos se presentan de forma
continua o periódica, y la reacción a un estímulo en el tiempo t se ve afectada por el
estímulo en el tiempo t-1.
• La correlación espacial se produce por todos los vóxeles del cerebro de una
persona. La correlación se basa en un concepto de distancia más complejo, no en la simple
distancia física.
• Para comprender mejor el ruido FMRI se puede realizar un estudio con diferentes e
sujetos examinados, siendo la hipótesis nula del análisis estadístico el nivel de oxigeno en la
sangre. Los sujetos se escanearon en dos centros diferentes.
Primer escáner: Los datos se obtienen mediante eco planos.
Segundo escáner: Los datos se adquieren mediante una secuencia en espiral
En el análisis se consideran vóxeles con materia blanca o gris, con las dos siguientes observaciones:
1) La mayoría de los sujetos del estudio tienen una larga cola izquierda en la distribución del nivel
medio de vóxeles, siendo más frecuente la materia gris que la blanca. Además los datos están más dispersos
en la materia gris que en los blanca, especialmente los datos adquiridos a través de imágenes en espiral.
2) La distribución de la desviación estándar a un vóxel en la cola de la derecha, tiene menor
desviación media estándar en la sustancia blanca que en la gris.
Estos dos resultados indican que la sustancia blanca tiene menor variación entre vóxeles que la
materia gris. Los sujetos con un mayor movimiento de cabeza no seguían una distribución normal vóxel en la
materia gris.
1.4.3. Umbralización
La mayoría de los análisis realizan las pruebas vóxel a vóxel, lo que hace necesario en cada vóxel
tomar una decisión sobre si debe considerar activo o no ese vóxel.
Sólo se permite combinar imágenes de cerebros de diferentes personas, si la forma del espacio
común es igual. Los métodos de combinación de información se comparan con grupos independientes de
sujetos, en función del objetivo final de la inferencia.
Capítulo 2
ENFOQUES EN EL ANÁLISIS
ESTADÍSTICO DE FMRI
2.1. Análisis exploratorio de datos
Las imágenes de resonancia magnética funcional (FMRI) utilizan el análisis exploratorio de
datos (AED), porque los datos obtenidos del escáner se procesan de manera significativa antes de
mirar el cerebro.
Las características espaciales y temporales de los datos FMRI hacen difícil el análisis
exploratorio de los datos. Por eso se realiza un análisis estadístico preliminar antes del AED.
La función de respuesta hemodinámica (HRF) es el recorrido independiente del tiempo del
diseño experimental ya sea por: categorías o relacionado con el evento.
Los patrones de interés revelan la activación del análisis estadístico formal. El estudio del
análisis exploratorio de datos FMRI realiza un diagnóstico con herramientas gráficas para
conseguir:
o La hipótesis de la estructura de error.
o La independencia.
o La varianza constante
o El ajuste del modelo.
Al aplicar esto se identifican imágenes potencialmente problemáticas, ruidosas o con gran
cantidad de movimiento, donde el objetivo es comprobar si se incumplen los supuestos del modelo.
X task − X co ntrol
La activación se define en vóxel i como: ti =
se
dónde:
s 2
=
( ntask − 1) stask
2
+ ( ncontrol − 1) scontrol
2
ncontrol
• tamaño muestral asociado a las condiciones de control.
2
stask
• la varianza de la muestra de activación de la observación de la tarea.
2
•
s control varianza de la muestra de activación de la observación de la
condición de control.
Este análisis se realiza para cada vóxel y se traza el resultado en un mapa con distintos valores
del estadístico t. Se contrastan los diferentes valores de t mediante un contraste de hipótesis. Si hay
más de una condición de tarea se amplía este enfoque para generar un estadístico F en cada vóxel.
Así se comparan distintos niveles de actividad en todas las condiciones obteniéndose un mapa de F
en cada actividad.
Este análisis asegura la normalidad con:
1) Independencia de vóxeles. El análisis se realiza para cada vóxel individual y el
resultado de la prueba en cada punto de la imagen supone vóxeles independientes.
2) Independencia en el tiempo. El análisis de los puntos en el tiempo tanto dentro como
a través de los bloques es similar, si se suponen independientes las medidas recogidas en
diferentes puntos de tiempo.
3) El inicio de la respuesta inmediata hemodinámica es la presentación del estímulo y
se detiene cuando se detiene el estímulo. Si el estímulo está desactivado, la respuesta tiene
un descenso gradual.
Algunos datos no apoyan la hipótesis de normalidad y varianzas iguales. Por esto se
realizan algunas modificaciones que permite utilizar la prueba Welch. Esta prueba estadística
contrasta hipótesis en función de la media aritmética, cuando dada la heterogeneidad de las
varianzas, no es aplicable la prueba t de Student. Este modelo estadístico calcula los grados de
X ta sk − X co n tro l
tW i =
s ta2 sk s2
+ co n tro l
n ta sk n co n tro l
Para diferentes poblaciones esta prueba tiene una forma muy complicada. No siendo compatible la
hipótesis de normalidad. La relación señal/ruido aumenta con el aumento del tiempo. La estadística
no paramétrica abandona la hipótesis de normalidad.
o La correlación es positiva cuando existe una fuerte correlación entre la tarea de los bloques
y un alto nivel de actividad en el vóxel.
o La correlación es negativa cuando los vóxeles son inactivos.
n−2
La transformación de ri es: ti = ri . Siendo n el número total de imágenes.
1 − ri 2
Si el diseño no está equilibrado hay más bloque de tareas que bloques de control, aunque
los dos análisis coinciden aproximadamente.
intervalo del interestímulo es suficiente para que la respuesta hemodinámica vuelva al nivel de
referencia.
El rendimiento del ensayo promedio es una estimación de la HRF, de la que se obtienen una
estimación, utilizando técnicas paramétricas y no paramétricas.
Para una distribución Gamma de dos familias se define el modelo en el tiempo y en un vóxel como:
Donde:
- ai y bi son parámetros gamma que varían de un vóxel a otro
- Г(•) es la constante de normalización de la densidad de la función Gamma.
Se propone un modelo de Gauss para estimar los parámetros de la HRF y poder ofrecer un
vóxel. Definiendo dos características de la HRF:
o El retraso
o La dispersión.
La familia Gauss es independiente, mientras que la Poisson y la Gamma no lo son.
Se estudia un modelo general no lineal, en el subgrupo de vóxeles significativos por otro
método. Estos modelos tienen la siguiente forma:
y(s,t)=g(t,β )+ ∈ ( s , t )
Donde:
• S es el índice del vóxel con t índices.
• g(t,β) es cualquier parámetro relativo a la HRF.
A través de s y t, el vector sigue una distribución normal multivariante (Σ) con media cero y
matriz de covarianza desconocida, cuyos elementos deben ser estimados.
El parámetro β se calcula por el método de máxima verosimilitud. Si se separa la matriz de
varianza en piezas temporales y espaciales, cada uno de estas piezas tiene un AR(1), con la
siguiente estructura:
∑ = γ ( ∑ ⊗∑ )
2
2 S T
Donde
•
γ 22 es un término de varianza
• ⊗ es el producto Kronecker
• ∑ −1
S
y ∑ −1
T
se estiman y modelan por separado y luego se utilizan para construir
∑ −1
∑ −1
= 1/ γ 22 ( ∑ −S1 ⊗ ∑ T−1 )
a través de
( yi − Wiα )
siendo los estimadores de los coeficientes de Bayes en el nivel vóxel:
−1
siendo:
• La estimación de la covarianza de la población,
−1
( )
N N
α = ∑ Wi T Ω i−1Wi ∑ Wi T Ω i−1 yi − X i β i
i =1 i =1
( )∑
−1 N
N
∑ tr Ω X iT
2
σ = ∑ ni
∈
−1
∈ $ Ti + X
$ i∈
i =1 i =1
i i β yi
Para evitar el ensayo medio, se realiza la estimación de la HRF directamente a partir del
parámetro en un modelo lineal. Entonces la señal FMRI en un vóxel en el tiempo t se escribe como:
y (t ) = x1h1 (t ) + x2 h2 (t ) + ... + xk hk (t )+ ∈ ( t )
Donde:
• xi es una variable que representa el tipo de prueba.
• hi es la respuesta hemodinámica asociada con la matriz de covarianza. El vector h
es desconocido, entonces los métodos probabilístico estiman h sin asumir la forma
particular de las respuestas.
• La covarianza en el término de ruido no es conocida, y se estima por un
procedimiento de mínimos cuadrados ordinarios (MCO) donde se aprovechan las
estimaciones.
El método de ingresos se define:
1) Obtener los mínimos cuadrados ordinarios estimados de h:
h$ OLS = ( X T X ) X T y
−1
$
2) Calcular los residuos: e = y − X hOLS y utilizarlos para obtener una estimación de la
C (k ) = σ 2 λδ (k ) + (1 − λ ) ρ |k |
Para estimar los parámetros λ, ρ y σ2 se utilizan los residuos de los MCO. Entonces la matriz de
covarianza estimada es:
C ( 0) C (1) K C ( j)
C (1) C ( 0) K M
∑ε =
M M O M
C ( j) L C (1) C ( 0 )
Donde:
• j representa el mayor desfase considerado.
C (k )
• es la estimación de C(k).
La estimación final de la respuesta hemodinámica es:
( −1
)−1
h$ = X T ∑ ε X X T ∑ε y
Una vez definida esta estimación se realiza una extensión al modelo de respuesta en el
tiempo n, con (1 ≤ n ≤ N):
N ( 0, σ 2 )
Se tiene que estimar h con un modelo lineal, incorporándose al análisis dos postulados:
1. La HRF comienza y termina en cero. Esto se representa:
o Antes de que se presente un estímulo el sujeto está en un estado de reposo.
o Después de que el estímulo se apague la actividad vuelve al valor basal.
Primero se restablecen los puntos y después la HRF toma el cero, esto reduce a dos el número de
parámetros h que se deben estimar.
2. La HRF es suave y representa el comportamiento desde el inicio del estímulo hasta el
máximo, seguido de un descenso gradual en el tiempo hasta la línea base donde se
detiene el estímulo.
La distribución marginal de h no tiene una solución simple, por ello se obtiene la distribución a-
posteriori de h y se evalúa la media a-posteriori de h con el valor estimado de un parámetro de la
Gaussiana. Evitando así la complejidad computacional aunque no se aprovecha la fuerza del
paradigma Bayesiano.
presentación del estímulo. Esto se consigue con los coeficientes de correlación entre el recorrido
temporal de la respuesta observada y del tiempo de la respuesta ideal FMRI. Entonces se define la
serie de tiempo (t) como:
r ( t ) = x ( t ) + e1 ( t )
donde:
• x (t) es una respuesta ideal (sin demora)
• e1(t) es el ruido.
Esta serie de tiempo se lleva a cabo en una onda sinusoidal cuya frecuencia coincide con la
presentación del estímulo.
El modelo rezagado se define en el tiempo como sigue:
f ( t ) =ax ( t − ∆ t ) + e2 ( t )
siendo:
• a un factor de escala
• e2(t) el ruido.
Esto se define bajo la hipótesis de que e1(t) y e2(t) tienen media cero y están correlacionadas
entre sí y con x(t). Se define el coeficiente de correlación asociado a un retraso temporal en γ como:
rr , f (γ ) = arx , x (γ − ∆t )
siendo:
• rx,x(γ) la autocorrelación de x(t) que se hace máxima cuando γ = 0.
rx , x (γ − ∆t )
• se hace máxima si γ = ∆t .
Al calcular la correlación del retraso que maximiza la correlación se obtiene una estimación
de la respuesta hemodinámica. Entonces se dice que un vóxel se considera activo si la correlación
máxima es de 0,5.
La matriz de diseño X refleja los estímulos presentados en cada punto del tiempo, y tiene
varianza , constante o no constante o covarianza cero.
En el modelo lineal general, tiene las siguientes características:
o Cada vóxel y cada punto es independiente de los demás.
o σ 2 es constante,
Entonces las estimaciones de β se obtienen a través de los MCO.
La matriz de diseño incorpora diferentes tipos de covariables de interés, aquí los factores
que describen el diseño experimental son variables binarias del diseño de bloques. Se incluyen las
respuestas obtenidas en términos de los valores de la HRF en los tiempos donde se produce la
estimulación. En este recorrido puede ocurrir que la respuesta BOLD no se inicie inmediatamente a
la presentación del estímulo y que el análisis de la respuesta hemodinámica no alcance la línea de
regresión base.
Las covariables se definen como:
∞
x (t ) = ∫ h ( u ) s ( t − u )du
0
Donde:
h ( ⋅)
• es el modelo de la HRF.
El modelo lineal general proporciona un análisis general de los datos en el que se incluyen
comparaciones entre los distintos grupos. Mientras que el modelo lineal simple sigue la misma
suposición que el análisis de la prueba t.
Algunas suposiciones del modelo lineal general son:
1. Vóxeles independientes. No se usa información espacial, porque el análisis FMRI es
univariante aunque los datos son multivariantes. Aunque aplicar un modelo lineal multivariante es
imposible, porque el número de vóxeles es mayor que la longitud del recorrido del tiempo, esto
conlleva a problemas de identificación y estimación de los parámetros.
2. Puntos de tiempo independientes. Estos puntos son una hipótesis irreal, sin tener claro el
efecto que tiene la respuesta en t1, ni en las respuestas posteriores. Tampoco se sabe la cantidad de
respuestas en el tiempo t1 que se ven afectadas por la respuesta del pasado.
3. Varianza del error. Esta varianza en cada momento es la misma.
4. Matriz de diseño. Se debe aplicar el modelo de la matriz de diseño para cada vóxel en el
cerebro. Cómo las estimaciones de β difieren de un lugar a otro, se deben derivar de forma
independiente en cada vóxel.
( )
2 2
sgn β 1 β1 + β 2
≥τ
e
donde
• e es el error residual del ajuste del modelo anterior
• τ es el valor crítico de la prueba t.
Los procedimientos que se utilizan para estimar los parámetros del modelo lineal general
son complejos, sobre todo en el modelo de efectos mixtos, ya que son muy diversas y complejas la
metodologías desarrolladas para estimar la varianza. Se aplican entonces enfoques estadísticos
clásicos tales como la máxima verosimilitud restringida (REML).
Los datos FMRI se analizan de forma continua y según se adquieren en el escáner. La ventaja de
esto es que se obtienen los datos en tiempo real. Se puede transformar el modelo lineal original a
través del procedimiento de ortogonalización de Gram-Schmidt, de modo que la respuesta en el
vóxel i en el momento j sea:
Cartografía de Cerebros (ICBM), que desarrollaron un atlas probabilístico para las diferencias de
los individuos.
La transformación afín se aplica a las deformaciones de otros métodos. La deformación
inicial se refiere a la utilización de un modelo no lineal. Se considera el efecto que causa la
utilización de cada tipo de deformaciones en:
o El procedimiento estructural
o Las Imágenes funcionales.
Las imágenes estructurales observan los criterios de los diferentes tejidos de la imagen del cerebro
que esta segmenta por:
o Las imágenes funcionales.
o La amplitud
o Los patrones de activación tras el análisis estadístico pertinente.
Según el criterio anatómico no se encuentran diferencias entre los vóxeles que se clasifican
como materia gris después de la deformación de imágenes.
La mecánica de fluidos da una estimación del volumen de tejidos que esta cerca de la
plantilla del cerebro. La normalización usa puntos de referencia y transformaciones del cerebro
descritas por un conjunto de parámetros asociados a operaciones simples. Se utiliza también la
normalización de sistemas paramétricos exactos llamados normalización espacial octree (OSN).
Estos sistemas dividen las imágenes en octantes, donde cada octante es el primer nivel
donde se subdivide los octantes. En cada nivel, se calcula la imagen y el octante de interés
deformado por el octante objetivo. Cualquier octante vacío se retira de la cadena de procesamiento,
representando así la mitad de los vóxeles en una imagen típica. Cada volumen está dividido en 8
cubos iguales, donde X, Y y Z tienen el mismo número de vóxeles. Estas restricciones limitan el
uso de la normalización espacial octree. Una solución es la almohadilla de las imágenes. Si se tiene
un volumen de 64x64x20, se rellenan con ceros la dimensión z y se eliminan los octantes vacíos.
Se combinan diferentes tipos de información creando atlas más fiables y un procedimiento
de normalización. Con un método que utiliza:
o Referencias anatómicas
o Segmentación del cerebro
o Información que reduce la distancia entre una imagen y la imagen de destino.
Se identifican puntos de referencia de forma manual, con una inicialización del algoritmo
general. A raíz de la normalización inicial, el algoritmo se repite para perfeccionar la segmentación y
la intensidad de la información entre dos imágenes.
TT < 1 − (1 − α )
1/ k
Para una prueba con nivel de significación α, se propone el p-ésimo menor valor y se rechaza
la hipótesis nula si el valor del estadístico es menor que una constante que depende de K, R, y α. Se
utiliza un estadístico medio para los sujetos individuales:
k
Ti
TA = ∑
i =1 k
siendo Ti el valor del estadístico t para i.
Donde.
• La hipótesis nula se rechaza para valores grandes de TA.
• Los estadísticos se calculan para un gran número de vóxeles y temas.
• El p-valor cambia con la hipótesis nula si el mapa de activación se basa en un tema.
2) La estimación combinada
Para hacer mapas de grupo se utilizan procedimientos basándose en el modelo lineal general
asociado al análisis de los datos FMRI. Donde son relevantes dos modelos:
o El modelo de efectos fijos
o El modelo de efectos aleatorios.
Un modelo de efectos fijos se utiliza cuando los estudios son homogéneos:
yi = θ + ∈i
donde:
o Yi es el efecto observado en el sujeto i.
o θ es el promedio común.
o i es el error.
Estos efectos se observan en los estudios con media común θ y con términos de error
∑w y i i
θ como: θ$ = i =1
k
∑w i =1
i
θ$
TX =
1
∑wi
La hipótesis nula se rechaza para los valores grandes de Tx. Calculando el p-valor de Tx para cada
vóxel por separado. Este estadístico combina los efectos observados en un vóxel dado y no sobre el
valor del estadístico t o F que forman el mapa cerebral paramétrico.
Si los estudios son homogéneos,
o El modelo de efectos fijos requiere la variabilidad individual y las componentes de la
varianza.
o El modelo de efectos aleatorios tiene en cuenta los objetivos en ambos casos. Es el principal
modelo que usa para el análisis de datos FMRI.
yi = θi + ∈i
El modelo de efectos aleatorios en el contexto meta-análisis es:
θi = θ + ∈i
*
∑w *
i yi
θ$ = i =1
k
∑w
i =1
*
i
* 2
( 2 2
2
)
Donde wi = 1/ si + σ θ con si y σ θ estimación de las componentes de la varianza.
θ$
TR =
1/ ∑ wi*
o La hipótesis nula se rechaza para valores grandes de TR, es decir, cuando los vóxeles no se
activan.
Los errores estándar de θ$ proporcionan información sobre los efectos fijos que son menores
*
que los efectos aleatorios estimados θ$ con variabilidad entre sujetos. Por esto, el modelo de
efectos aleatorios requiere más esfuerzo que el modelo de efectos fijos.
•
Z11 = Y1T Y1 y Z 22 = Y2T Y2 las matrices de similitud
• Cuando las matrices difieren en gran medida, el coeficiente será cercano a cero.
• Utilizando RV y las matrices de similitud, se definen diferentes medidas de
distancia.
RV (Y1T , Y2T )
• Cuando p = q, en el caso de los estudios FMRI, se considera:
Se utiliza RV (Y1 , Y2 ) como una evaluación entre dos temas, mientras que RV (Y1 , Y2 ) se utiliza para
T T
Z11* *
Z 22
D (Y1* , Y2* ) = −
tr ( Z112* ) tr ( Z 222* )
* *
Siendo Z ii la matriz que resume Yi , después de las covariables de interés, la corrección
temporal y espacial en los datos del sujeto individual.
Eliminar cada sujeto del mapa actualiza la base de una muestra de tamaño n-1 en lugar del n
original y las medidas de discrepancia definen la diferencia entre el mapa de grupo completo y las
variaciones en los mapas. Las medidas de discrepancia se definen en los mapas binarios obtenidos
después de las pruebas de cada vóxel para la significación. Se incluye un recuento del número de
vóxeles significativos que se eliminan mediante la supresión de un tema, y el porcentaje de
coincidencia entre el mapa individual de un sujeto y el mapa de grupo.
El modelo de efectos aleatorios es un método muy robusto.
1) Porque los mapas de grupo creados por este método son escasos, ya que este modelo es un
enfoque conservador que combina la información que representan dos fuentes distintas de la
variación.
2) La cantidad exhibida por cualquier sujeto individual en el mapa de grupo con efectos
aleatorios es muy pequeño. La mayoría de estos métodos combinan mapas individuales que están en
TF y TR.
El p-valor esta influenciado por el comportamiento del sujeto en un modelo de efectos
aleatorios. El modelo de efectos fijos es más útil para un pequeño número de temas, mientras que el
enfoque de efectos aleatorios requiere tamaños de muestra más grande, aunque sea factible en los
estudios de FMRI. En consecuencia, los temas con los efectos aleatorios son más fuertes.
Capítulo 3
ENFOQUES DEL ANÁLISIS
ESTADÍSTICO MULTIVARIANTE
El enfoque multivariante realiza un análisis de datos FMRI con:
o El análisis de componentes multivariantes:
• Análisis de componentes principales (ACP)
• Análisis de componentes independientes (ACI)
o El análisis de correlación.
• Análisis de correlación canónica
• Análisis de correlación máximo.
El algoritmo ACI busca una combinación lineal de Xi, donde y = w X . Si w es una fila de
T
combinación lineal de variables latentes. Por el teorema central del límite, se sabe que y es más
normal que s y que z tiene un elemento distinto de cero. Para encontrar la primera componente
La aplicación del ACI implica estas dos etapas principales del pre-procesamiento:
1) Reducción de datos
2) Blanqueamiento.
ACP se utiliza para reducir la variabilidad de los datos y la razón de esto es que el número de
componentes necesarias no es muy grande y se utiliza un número más pequeño de puntos o vóxeles
en un estudio FMRI típico. El blanqueamiento transforma el espacio de búsqueda para que sea
ortogonal.
(∑
YX ∑−XX1 ∑XY −cj ∑YY ) bj = 0
−1
∑XY ∑YY ∑YX −λ ∑XX = 0
Siendo cj la raíz del mayor valor propio de:
∑YX ∑−XX1 ∑XY −λ ∑YY = 0
Si los valores propios son únicos, entonces los coeficientes de los vectores aj y bj son
combinaciones lineales de la correlación con otras variables aleatorias canónicas.
El análisis de correlación canónica transforma variables originales en una nueva escala que
revela la estructura de correlación entre los conjuntos.
Se supone que existe un pequeño número llamado fuentes de entrada que contribuyen a los
datos observados para que haya n vóxeles en total. Para ello se toman los datos observados en el
∂fi ∂ 2 fi
( )
yi ( t ) = fi s ( t ) + ∑
j ∂u j
uj + ∑
j , k ∂u j ∂vk
u j vk
Donde u ( t ) = s ( t ) − s ( t ) .
Este sistema se resuelve en un marco de redes neuronales, con un modelo lineal general.
Se definen los nodos de primer y segundo orden como:
o Los nodos de primer orden corresponden a las componentes de un ACP.
o Los nodos de segundo orden permiten relaciones entre componentes no aditivas.
El método en una tarea combina el movimiento y el procesamiento de color y se encuentran
dos componentes principales:
1. Sobre un efecto de movimiento
2. Sobre un efecto de procesamiento de color.
Estas componentes se localizan en regiones anatómicas adecuadas para los distintos tipos del
procesamiento. El nodo de segundo orden muestra los dos tipos de procesamiento.
ACP Funcional
Este análisis considera que los datos FMRI sean datos funcionales, es decir, que el recorrido
del tiempo vóxel sean funciones que evolucionen en el tiempo.
Esto se estima mediante el ajuste de funciones con una base establecida. Muchas técnicas
estadísticas tienen funciones equivalentes para el análisis de la varianza, en lugar de las
observaciones individuales. El ACP funcional se realiza si los datos de cada vóxel son una función
continua en el tiempo.
El análisis de componentes principales requiere dos pasos:
1) El suavizado (estimación) de la serie de tiempo. Donde cada serie del tiempo vóxel
se estima a través de una serie de funciones base. Aunque las aplicaciones toman la
decisión sobre la elección de una base de funciones y el valor del parámetro de
suavización. La diferencia de suavizado, se aplica si hay poca o ninguna relación entre el
ACP y ACP funcional.
2) El ACP en funciones estimadas se aplica en las funciones resultantes si se ha
estimado una serie de tiempo vóxel. Es decir, cada serie de tiempo vóxel expresa una
combinación lineal de un pequeño número de funciones de la base.
El ACP funcional tiene capacidad en estos tres estudios:
1. Memoria de trabajo (diseño de bloques)
2. Memoria episódica (diseño de bloques)
Núcleo ACP
La estructura del ACP no está correlacionada espacialmente pero si temporalmente. Por esto
se hace una modificación del procedimiento del ACP base, analizando en el primer tiempo una
variable de cada serie vóxel de la característica temporal. Entonces, los modelos basados en un
vóxel se someten a un análisis multivariante en el caso del núcleo de ACP.
El ACP funcional preserva los patrones temporales extraídos en el modelado pero esto no es
posible con el ACP ordinario debido a que las componentes están sin corregir.
Se definen los datos originales (tamaño muestral representado por n), los cursos de tiempo
vóxel de longitud T y los vectores X1, X2 ...., Xn. Ajustándose los modelos en cada vóxel
univariante, donde los datos resultantes son Z1, Z2,..., Zn.
La covarianza o la matriz de correlación para un par de series de tiempo es:
o 1 si están correlacionadas positivamente,
o -1 si están correlacionadas negativamente,
o 0 si no están correlacionadas.
El núcleo de ACP no introduce linealidad porque esta penalizado por los valores del
coeficiente de correlación que están lejos de 1.
Si Cov(Xi, Xj) es la matriz de covarianza ordinaria y Cor(Xi, Xj) la matriz de correlación,
entonces se define la matriz de covarianza por Cov* y en esta matriz se realiza el análisis de las
componentes principales:
(
Cov* ( X i , X j ) = Cov ( X i , X j ) ⋅ φ Cor ( X i , X j ) )
Que tiene las siguientes características:
• Los valores extremos no se tratan de forma simétrica.
• Las fuertes correlaciones negativas se dan cuando el recorrido del tiempo tiene
distintos patrones de comportamiento.
• Si la correlación entre Xi y Xj se acerca a -1, el recorrido de tiempo muestra la
reacción frente a los estímulos que se tratan como ortogonales.
Un factor de escala está determinado por el nivel de correlación del recorrido del tiempo.
El número de componentes que se necesitan determinar para el método núcleo del factor de
escala se estiman mediante métodos computacionalmente intensivos. Los métodos del núcleo
conservan sólo los vóxeles que tienen la señal más interesante.
La base de simulaciones del método del núcleo funciona lentamente si el paso de modelado
temporal se queda fuera. Se efectúa una reducción de la dimensión a través del análisis factorial,
con la creación de nuevas variables.
Siendo:
• N el tamaño del conjunto de formación.
∈( xj |θ )
• el costo de la función de error asociado a un determinado procedimiento.
• p (x) la densidad de probabilidad de x.
Las filas de s son imágenes independientes y las columnas de A son independientes del recorrido
del tiempo espacial y se estiman mediante el algoritmo ACI.
2) ACI temporal donde X es una matriz de dimensión n x T , A la matriz de mezcla n x n y s es la
matriz nxT con n componentes independientes. El recorrido temporal es independiente del
tiempo en las filas de la matriz s y sus imágenes son temporalmente independientes de las
columnas de A. Se sabe que n es mayor que T, si n es el número de vóxeles.
Estos dos enfoques dan resultados similares en términos del recorrido del tiempo y de los mapas
espaciales de activación. La elección de realizar el análisis en el dominio espacial o temporal se
toma al conocer las tareas realizadas con un experimento previo.
El índice de calidad clúster se introduce para localizar los grupos que son interesantes para un
examen más detenido. Esto se define con la diferencia entre la media de las similitudes entre
clústeres y entre los grupos medios.
o Un grupo es menos compacto y aislado si el valor del índice disminuye.
o Un grupo es ideal en un único punto si el índice vale 1.
Un magneto-encefalograma (MEG) es un estudio en todo el cerebro, si las mediciones del
cerebro están afectadas por las señales externas. En el estudio MEG las componentes más fiables se
detectan por el análisis que corresponde a las diferentes fuentes de movimiento que alteran la señal
de interés. Las componentes que no tienen ninguna interpretación inmediata no se pueden
investigar.
ACI regresión
En el ACI están las componentes con los efectos de interés sin especificación previa. En este
caso existe una similitud con la estructura del modelo general lineal:
X= Gβ +
Siendo:
• G la matriz de diseño
• los errores normales independientes e idénticamente distribuidos.
El ACI se define como:
X = A⋅ s
Siendo:
• A la matriz de mezcla
• s las componentes latentes independientes, para describir X=Gβ.
G es la matriz de mezcla dada por ACI y β se equipara con s pero β no se estima, sino que se
−1
obtiene de s = A X .
Este modelo ACI se deriva del ruido libre entonces no hay error residual y no se evalúa la
significación estadística evitando los dos problemas siguientes:
1) Se desechan algunas componentes independientes y se tratan como ruido aleatorio. Las
componentes eliminadas contienen características importantes por eso el modelo está mal
especificado.
2) Todas las componentes son independientes al grupo en dos clases. Una clase consta de las
componentes relacionadas con la tarea, las cuales se combinan en un único estadístico liberando los
grados de libertad para el error.
Los modelos híbridos de ACI tienen tareas relacionadas con la actividad de una imagen
estática y la tarea del tiempo relacionado. Además, el modelo lineal que se utiliza en el ACI híbrido
es simple, sin dependencias espaciales ni temporales en la respuesta.
Como alternativa se propone el enfoque unificado construido según el mismo principio que el
ACI híbrido. Este modelo divide las componentes de la señal y el ruido de subespacios, para crear
regresores del modelo lineal general.
Los regresores son las componentes que tienen mayor correlación en el paradigma. Las
entradas del modelo son el recorrido del tiempo y el resultado del análisis del modelo lineal general,
esto identifica las regiones que expresan las componentes independientes.
El error de tipo I de los dos enfoques se compara con los mejores resultados del modelo lineal
general cuando aumentan los niveles.
Enmascarar vóxeles de aire es una manera de reducir la dimensión de los datos, ya que el 50%
de una imagen se compone de vóxeles que están fuera del cerebro.
El análisis de resultados es la una única serie del recorrido del tiempo que es común al grupo y
a un conjunto de distintos mapas espaciales.
La comparación más formal utiliza estos enfoques para la concatenación de sabios que
describen el enfoque de la fila de concatenación racional.
o La concatenación racional ofrece una ventaja sobre los métodos con respecto a la
exactitud con que se estiman las fuentes y si el número de materias en una componente son
pequeñas.
o El método de la concatenación de sabios no se ve afectada por la presencia de
componentes únicos. Siendo el número de sujetos expresados por una componente un número
pequeño.
Un gran número de sujetos de las fuentes comunes se expresan a través de un promedio de
materias, cuando:
1) El número total de asignaturas es grande.
2) Existen componentes únicos.
3) Un elemento común expresa los sujetos que son objeto de la concatenación racional.
Esto es bastante robusto, salvo que el número de sujetos sea pequeño.
Aunque el método de la concatenación sabia no es un método factible para la inferencia de
grupo, porque es muy costoso computacionalmente.
Se define una medida de similitud para las componentes i y j tal que:
SM ( i, j ) = λ Rs ( i, j ) + (1 − λ ) Rt ( i, j )
Donde:
• Rs(i,j) es el coeficiente de correlación espacial entre las componentes si y sj.
• Rt(i,j) es la correlación temporal entre el recorrido de tiempo asociado a si y sj.
• λ es el peso comprendido entre 0 y 1, que controla el énfasis en la similitud espacial o
temporal.
La matriz de los valores de similitud se transforma en una matriz de diferencias a través de
DM = 1 − SM ( i, j ) que es la entrada al algoritmo cluster.
el segundo estudio. Esto corresponde a la presentación del estímulo para el campo visual izquierdo
y derecho.
X ≈ X ≈ UDV T .
Se definen WS y WT, dos matrices tales que S = UWS , T = VWT . La maximización de la función de
la entropía espacial y temporal de las señales, se define como:
hST = α hS + (1 − α ) hT
Esto permite ponderar cualquier componente espacial o temporal.
o El sACI sesgado sustituye la alta probabilidad de curtosis de una función de
distribución del ACI, por una distribución desigual de fuentes espaciales. Utilizando un
modelo de decaimiento exponencial. Este método mejora la extracción del recorrido del
tiempo y la identificación de las componentes espaciales
X Re X Im ARe
= sRe sIm
X Im − X Re AIm
La parte real e imaginaria están separadas en distintas matrices y se les aplica el algoritmo ACI
ordinario.
( sin ( wt ) , cos ( wt ) ,sin ( 3wt ) , cos ( 3wt ) ,sin ( 5wt ) , cos ( 5wt ) )
Con t = 1,..., T y T la longitud de la serie de tiempo en cada vóxel w = 2π/m, si m es la longitud de
un bloque, es la misma para el descanso que para las condiciones de trabajo.
La elección correcta de Y es la expansión de la serie de Fourier truncada de la onda cuadrada
que describe un diseño de bloques. Si la dimensión de Y es 6, hay 6 correlaciones canónicas que se
calculan, centrando el estudio en la mayor.
La mayor correlación canónica se asigna al centro del vóxel en cada barrio, donde se obtiene
un mapa estadístico de los valores de correlación.
Para completar el análisis se determinan los vóxeles que están activos, donde la mayor
correlación canónica mide la serie de tiempo vóxel en cada barrio. Si la correlación es grande, ese
barrio es similar al paradigma experimental y el vóxel central se declara activo.
Para determinar el estado de activación de los vóxeles se definen dos criterios adicionales:
forma y plazo de respuesta. Donde la forma capta la idea de que los vóxeles se activan en un
experimento del diseño por bloques.
El retardo de respuesta es la máxima demora permitida entre la presentación del estímulo y el
inicio de la respuesta hemodinámica. Normalmente existe un pequeño retraso, entre el estímulo y el
inicio de la respuesta medida en el cerebro. Los vóxeles no cumplen los criterios de forma y el
retraso elimina la consideración en el futuro.
Se utiliza una prueba estadística como función de todas las correlaciones canónicas. La razón
k
i =1
Capítulo 4
PROYECCIÓN EN BASES
FUNCIONALES.
FUNCIONES WAVELET
Las Wavelets son funciones matemáticas que se utilizan para filtrar series temporales y
analizar la variación del contenido espectral. Esta función ofrece una representación tiempo-
frecuencia más precisa para la señal no estacionaria que el análisis tradicional de Fourier.
Representando la evolución temporal del espectro de la señal se localizan en el tiempo la ocurrencia
de discontinuidades, impulsos y variaciones que escapan a los métodos habituales de análisis.
Las Wavelets tienen una aplicación en datos FMRI, creando mapas de activación con técnicas
de muestreo, para comprender mejor los datos, y el modelado. Utilizándose también en hipótesis
múltiples.
4.1 Wavelets
Las Wavelet se utilizan para los datos FMRI por las siguientes ventajas:
o Wavelet multiresolución modelan fenómenos a diferentes escalas.
o Se adaptan a características no estacionarias o locales.
La transforma Wavelet analiza señales periódicas y es reversible, es decir, permite pasar de
un dominio a otro, pero no conserva la información relativa al tiempo en el dominio de la frecuencia
y viceversa. La transformada Wavelet es reversible, pero las funciones Wavelet son de soporte
compacto, lo que permite localizar simultáneamente en tiempo y frecuencia. Esta transformada
filtra los datos y elimina el ruido, además es rápida computacionalmente, en comparación con la
transformada de Fourier.
La descomposición Wavelet puede ser unidimensional o multidimensional (espacio-temporal),
aunque en el análisis FMRI sólo se explota el análisis Wavelet temporal.
Las Wavelets se definen como una familia de funciones obtenidas por la translación y
escala: φ ( t ) dt = 1
∫
Entonces se definen:
1 t − 2jk 1 t − 2jk
Ψ j ,k ( t ) = ψ j , Φ j ,k ( t ) = φ j
2j 2 2j 2
Siendo:
• j = 1,2 ,..., J los índices de escala (dilatación)
• k = 1, 2, ... K los índices de localización (traducción).
Las Wavelets se expresan de diferente forma y familias, y se caracterizan por la suavidad y
por el número de momentos de fuga (Wavelet madre).
La traducción y dilatación de la Wavelet madre y padre es el rendimiento de un conjunto de
funciones base. En cada escala Sj los datos se descomponen en:
• Coeficientes de detalle dj,k
• Coeficientes de aproximación aj,k
Estos coeficientes se calculan mediante el producto interior de los datos. Los coeficients de
aproximación proporcionan un borrador de la función adicional a los detalles proporcionados por
las proyecciones de la función en las funciones wavelet asociadas a los niveles de resolución más
altos. Los datos originales se reconstruyen sin perder la aproximación a la escala más tosca, es
J
Los coeficientes de detalle suelen ser pequeños y tomar, en señales regulares, valores nulos..
Se deben ajustar los cambios bruscos e variación local de la señal, incluso si el número de
coeficientes es pequeño.. Se puede ampliar la dimensión de análisis wavelet considerando el
contexto espacio. Los coeficientes de detalle tienen en el análisis Wavelet las siguientes
aplicaciones:
Análisis de la variación local y asintótica de la función de correlación
Reflejar el índice de correlación entre coeficientes de diferentes escalas.
Los datos decaen exponencialmente si R no satisface R > 2H+1, donde 0 <H<1.
Siendo H el parámetro Hurst, una medida de la dependencia del rango en los datos. Para
obtener una estimación de H se usa la varianza muestral de los coeficientes de detalle en la escala j.
Siendo:
Se propone una Wavelet menos generalizada en el vóxel de nivel básico del modelo de
regresión lineal
Y = Xβ + ε
Donde:
• X es una matriz de factores de predicción
• ε es el ruido gaussiano fraccional con estructura de dependencia a
largo plazo.
Esta transformada tiene la matriz de varianza covarianza diagonal, facilitando así la inferencia.
Los parámetros del proceso de largo alcance se estiman con los parámetros del modelo
lineal. Este procedimiento es iterativo con:
o La estimación de las componentes de β.
o La estimación de los parámetros que caracterizan la estructura de error.
El ajuste de modelos Wavelets por mínimos cuadrados generalizadas proporciona robustez
frente a los cambios en los valores de la serie de parámetros de dependencia y controla el error tipo
I en las hipótesis del parámetro β de regresión en los niveles nominales.
Y = g f (VG ) + ∈
Donde:
• La distribución uniforme f (•) se calcula con una combinación lineal.
• VG son funciones parciales.
• g integra las funciones base, transformándolas desde el espacio de vértices al
espacio vóxel.
Las funciones base se definen en el mapa cortical en un plano del sistema de coordenadas de
dos dimensiones, con centro en (xj, yj) y se definen mediante una Gaussina circular:
2
− ( x − x j ) + ( y − y j )
2
bF = c1 exp
j
2 w2
Siendo:
• c1 una constante de normalización.
• w el ancho de la función de base de Gauss en la direcciones x e y.
( )
−1
Se estima β de la siguiente manera: β = A A + λ I
T
AT Y
Los vectores de los parámetros se deben estimar para cada Yi en una matriz del análisis
univariante o multivariante.
En un modelo lineal general se implementa un conjunto de funciones base que reflejan las
características temporales de la respuesta BOLD. Este conjunto base se denomina OSORU. Esta
función forma la base de la matriz del diseño del modelo lineal general.
La respuesta transitoria es la aparición de la corriente del estímulo. Donde existen tres
componentes transitorias que son:
o La componente de desplazamiento: respuesta transitoria similar a la terminación del
estímulo.
o La rampa: respuesta lineal para algunos estímulos y se caracteriza con la
recuperación de la señal a raíz de la disminución de la componente de inicio.
o El undershoot es la tercera componente transitoria.
En un experimento se cuentan las ráfagas de ruido repetidas en un diseño de bloques:
o Si la tasa de repetición es baja la respuesta es constante
o Si la tasa de repetición es alta, la respuesta es bifásica.
La incorporación de la base OSORU en el modelo lineal da flexibilidad porque los
coeficientes de regresión reflejan la importancia de cada componente al conjunto base.
La Wavelet ofrece flexibilidad pero no facilita la interpretación en el significado fisiológico,
porque no se estudia el modelo de respuesta hemodinámica sino que intenta entender la actividad de
la respuesta FMRI.
El Índice Wavelet (WI) caracteriza los patrones temporales entre dos extremos:
1 on + off
WI = , WI [0,1].
2 Mid + max ( on, off )
Siendo:
Capítulo 5
ANÁLISIS BAYESIANO
DE FMRI
El método Bayesiano es ideal para el análisis de datos FMRI, porque los datos se describen
de manera jerárquica en un modelo vóxel incorporado al modelo del objeto. Los modelos espacio-
temporales describen los datos FMRI y susceptibles de un análisis Bayesiano. Además, los enfoques
estadísticos incorporan a la función base la información anatómica incluso en el contexto no
Bayesiano. Las hipótesis frecuentistas no son fáciles de interpretar. Mientras que la probabilidad de
los efectos umbrales son una medida intuitiva. Existen diferentes fuentes de información sobre la
activación del cerebro, como son:
1. Diversos experimentos que provocan una activación constante.
2. La activación se localiza en vóxeles aislados individuales.
3. Las diferencias y la amplitud de la activación son iguales que las fluctuaciones de
un individuo en diferentes sesiones de escaneo.
4. La intensidad en reposo de la respuesta esta entorno al 2-5%.
5. Los parámetros que guían la respuesta hemodinámica varían de un vóxel a otro o
de una región del cerebro a otra.
Esta información a-priori se utiliza para construir distribuciones previas al análisis Bayesiano.
Donde:
• Ni es el entorno de vecinos del vóxel i.
• βij es la autocorrelación espacial entre el vóxel i y el vóxel j.
• pi es la autocorrelación temporal entre el punto t y el punto t-p en el vóxel i.
• εij tiene una distribución normal con media cero y varianza que depende del
vóxel, pero se fija en el tiempo.
El parámetro β acomoda la estacionariedad espacial y la no estacionariedad. El modelo Genovese,
expresa la especificación antes de asumir la independencia entre los parámetros, ε, β y .
La mitad de los períodos son uniformes con un rango de tiempo relajado que representa la
incertidumbre relativa en el máximo y en las caídas. Las ventajas del modelo Genovese son:
o La incorporación de la información espacial
o El permite la comparación de modelos.
El modelo HRF se define para los distintos diseños experimentales, mientras que el modelo
Genovese está destinado a experimentos del diseño de bloques. Como estos modelos son
complicados computacionalmente, se plantea una simplificación con el filtrado de la variación
temporal a gran escala. La aproximación de Bayes es una simplificación que acelera el cálculo.
•
( l1 , l2 ) = R ( −θ j )( i − µ j ) para
R (θ )
con una rotación del ángulo θ.
•
( a , d , r ,θ ) son los parámetros independientes del proceso en la ubicación µ
j j j j
j
θ j ∈ [ −π / 4, π / 4]
• es la orientación de la elipse.
Se calculan con a y d la inversa de rayos Gamma, y con r la inversa de Beta. Las a-priori
son independientes de µ. En la elección inicial del aspecto y la presentación del análisis, Hartvig
toma un modelo simple para la componente de tiempo :
TR ( i × TR − 6 )2
φt = ∑ π t −i exp −
2π 3 18
i
Donde:
Los datos a priori en el análisis Bayesiano son importantes para conocer la actividad real
que es homogénea y se produce en regiones que están conectadas espacialmente. Se consideran los
siguientes enfoques:
1) Se define una red previa múltiple, que es una jerarquía de la escala de vóxeles
individuales en la región de interés (ROI). Para pasar de una escala a otra, los vóxeles se reúnen en
regiones de tamaño 2P x 2P. Donde cada nivel del vóxel se trata en el siguiente nivel, porque los
vóxeles se agrupan en regiones 2x2 que cubren toda la región, en el siguiente nivel las regiones
donde se combinan en 4x4 cubriendo toda la región, y así sucesivamente.
2) Dentro de cada region se define la respuesta media del vóxel en esa region, como el valor
medio en el vóxel individual. El total toma la proporción de vóxeles activos en la región y es
uniforme.
Para un determinado nivel k, la probabilidad a-posteriori de que una región rk este activa es:
P ( Ark ) P ( Drk | Ark )
P ( Ark | Drk ) =
P ( Drk )
Donde:
• Ark es el evento de que la región rk es activa
Se pueden establecer un modelo Bayesiano con una estructura autorregresiva AR(p), con un
error basado en el modelo lineal general. Siendo el modelo a-priori, una normal con media cero y
varianza: α k ( S S ) .
−1 T −1
Donde:
• εk es la precisión espacial para la variable k y se considera independiente a-priori.
• S es la matriz del núcleo espacial.
Los parámetros autorregresivos a priori son independientes a través de distintos vóxeles si cada
uno tiene una distribución Gaussiana con media cero. Antes de incorporar la información espacial
se cuantifica el modelo a través de la matriz que utiliza el operador de Laplace.
5.3. Cálculo
Los supuestos del modelo se simplifican para:
o Hacer el cálculo computacional.
o Debilitar la atracción.
o Ampliar el poder del enfoque.
Aliviando así la carga computacional de diferentes formas.
La variación Bayes es una familia de técnicas que aproximan la integral y la densidad para
evitar la aplicación de la cadena de Markov y la simulación de Monte Carlo.
Se considera la densidad a-posteriori general, p(θ|y), siendo el logaritmo de la probabilidad
marginal p(y):
q (θ | y ) p ( y,θ )
log p ( y ) = ∫ q (θ | y ) log dθ
p (θ | y ) q (θ | y )
Entonces se define:
p ( y, θ ) q (θ | y )
F = ∫ q (θ | y ) log dθ y KL = ∫ q (θ | y ) log dθ
q (θ | y ) p (θ | y )
Por tanto:
p( y ) = F + KL
• KL es la distancia entre q(θ|y) y p(θ|y). Este parámetro no es negativo. Alcanza el valor
cero cuando q(θ|y) que coincide con la densidad a-posteriori.
• F es el límite inferior de la densidad de y, y es igual a p(y) cuando KL=0.
La técnica de Bayes maximiza F, si la densidad factoriza de forma explícita las densidades
a-posteriori conjugadas debido a la elección de las a-priori. Se simplifica el procedimiento de
inferencia Bayesiana, al romper el análisis en cada paso. Esto implica el cálculo de la densidad a-
posteriori o del supuesto de contemplar la posibiblidad de independencia en niveles de la jerarquía.
El segundo nivel de este análisis es el método del enfoque híbrido frecuentista y Bayesiano, donde
los primeros sujetos del análisis de alto nivel utilizan el modelo lineal general ordinario sin a-priori
e incorpora un sistema Bayesiano de segundo nivel. Para cada tema, el modelo Y=Xβ+, se aplica
∑σ i
−2
cβ i
varianza σ . Esta distribución combinada también es normal, con media:
2 i =1
i k y varianza:
∑ σ i−2
i =1
1
k
∑σ
i =1
i
−2 .
5.4. Conclusión
“En los últimos años las investigaciones de FMRI bajo la filosofía Bayesiana han
aumentado considerablemente. Estas técnicas tienen el objetivo de crear y dibujar la inferencia
“correcta” de los modelos espacio-temporales. También se ha avanzado en la capacidad
computacional y el desarrollo de nuevos estadísticos para manejar grandes y complejos conjuntos
de datos, que hacen que el procedimiento Bayesiano sea más factible.”
Capítulo 6
OTROS MÉTODOS DE ANÁLISIS
DE FMRI
Los métodos estadísticos específicos se usan para analizar los datos y crear mapas de los
parámetros del cerebro. Estos métodos indican que cada vóxel individual es dicotómico
(activo/inactivo) y probable en las regiones. La tarea clasifica cada vóxel según si:
o El estudio es significativamente activo
o No es un problema de multiplicidad.
Toda prueba estadística decide si el estudio es:
o Significativo
o No significativo
La tasa de error de la familia wise (FWER), es la probabilidad de tener un descubrimiento
falso sobre el conjunto de pruebas. La tasa de control de falso descubrimiento (FDR) es la
proporción de vóxeles declarados erróneamente activos, de entre todos los vóxeles activos.
Bonferroni controla el uso de múltiples pruebas para FWER, aunque este método es demasiado
conservador para el FMRI. Por ello Bonferroni se ajusta al nivel de significación /m,
Siendo:
• m el número de pruebas,
• es el nivel de importancia global,
Por la prudencia extrema del método de Bonferroni y la incapacidad de considerar las
características particulares de los datos FMRI, se necesitan otras técnicas que controlen el error.
El campo al azar y los umbrales de permutación consideran el máximo valor del estadístico
y minimizan el p-valor. Con esto se estudia la dependencia de los datos y se detectan los grupos de
actividad. El enfoque umbral del campo al azar se basa en la característica Euler del conjunto de
excursión. Este conjunto describe los vóxeles que están por encima del umbral especificado.
o Los umbrales altos de la característica Euler corresponden al número de máximos
locales.
o Los umbrales bajos de la característica Euler cuentan el número de grupos conectados
con el menor número de “hoyos”.
• Si el umbral es suficientemente grande, los agujeros desaparecen y solo quedan los grupos.
• Si el umbral aumenta al máximo del estadístico en el mapa, la característica Euler toma el
valor:
• 1 si el máximo está por encima del umbral
• 0 en caso contrario.
Los umbrales elevados de la característica Euler es una función indicador para los vóxeles
que están por encima del umbral. El análisis FMRI utiliza la teoría al azar, porque interpreta
fácilmente las diferentes cantidades.
Worsley describe la probabilidad aproximada de que el estadístico tmax este por encima del
umbral de t por:
D
P ( tmax ≥ 1) ≈ ∑ µd ( S ) pd ( t )
d =0
Donde:
• S es el espacio de búsqueda (cerebro).
• µd(S) es la dimensión intrínseca del volumen-d del espacio de búsqueda.
• pd(t) es la característica tridimensional de la densidad d de Euler, t(s) es el estadístico
calculado en el punto, s ε S.
• Para d = D se tiene la cantidad más importante, y los demás términos son
correcciones límites.
La característica Euler depende del tipo estadístico, mientras que el umbral trabaja de forma
individual para cada lugar al azar. Gauss considera que los campos al azar para X2, t, F son campos
aleatorios. El campo al azar se aplica en imágenes del cerebro realizando inferencia para imágenes
aleatorias.
del máximo creando una conexión con el campo al azar. El estadístico del máximo es el mayor
valor del vóxel en una imagen como resumen de la imagen como un todo.
Se consideran dos tipos de umbrales:
o Umbral único
o Prueba de grupo por encima del umbral.
El único límite de la prueba umbral de la imagen es un valor crítico determinado de forma
que:
o Si todos los vóxeles están por debajo de ese valor crítico, entonces la hipótesis nula
de la no activación no se puede rechazar.
o Si un vóxel es superior al umbral, entonces se puede rechazar.
La distribución del método se convierte en la máxima permutación de la imagen.Para un
nivel global fijo, la significación y el número de permutaciones N, se calcula el umbral critico
como c+1, donde c es N, (redondeando al entero más cercano). Esto representa el percentil 100(1-
) de la distribución de la permutación máxima. Entonces se rechaza la hipótesis nula, con un
vóxel que supera el umbral crítico basado en la distribución del máximo. Esta prueba controla el
error tipo I.
Se intenta descubrir y evaluar la importancia de los grupos vóxeles que están conectados
por encima de un umbral predeterminado. Considerando sólo activas las regiones contiguas con el
tamaño más grande. La distribución de la prueba por encima del umbral inicial, es la hipótesis nula,
que está determinada por los métodos de permutación. Este enfoque es muy potente, pero no se
realizan pruebas para los vóxeles individuales, sino para los grupos de vóxeles conectados.
La prueba de activación utiliza junto al umbral, la evaluación del grado de activación del
clúster si se utiliza el método de permutación, para valorar su significación. Para ello se combina la
intensidad del vóxel con la extensión del clúster al utilizar una variedad de funciones de
combinación sencillas.
Se define:
•
Pi I el p-valor de la intensidad máxima de la agrupación del vóxel i.
•
Pi S el p-valor para el tamaño del clúster i.
• Ti T = min ( Pi I , Pi S )
• Ti T = −2 ( log Pi I + log Pi S )
Por todo esto se propone un enfoque de permutación multinivel, donde:
I S
1) Se deriva el p-valor corregido para Pi y Pi por la técnica habitual de permutación.
2) Se repite el procedimiento para los estadísticos combinados.
3) Se define y evalúa la importancia de un meta-dato que combina y compara la
combinación de funciones individuales.
Este enfoque da más peso a unos u otros atributos de la prueba, ya sea por tamaño o
por intensidad, mientras se evalúa la significación del estadístico. Dado que el número de
permutaciones es grande, se hace imposible el numerar todos los resultados, y por ello se toma una
sub-muestra aleatoria de todas las permutaciones posibles. Teniendo en cuenta que la muestra tiene
que ser lo suficientemente grande para alcanzar el nivel de significación deseado.
Un polinomio de tercer grado se utiliza para ajustar HRF a la señal media, donde el
tratamiento de los coeficientes de la curva son los efectos aleatorios. Según la naturaleza de las
respuestas en un vóxel se presenta o no la característica de una respuesta BOLD. Cuando una región
del cerebro se activa, se produce un retraso en la respuesta hemodinámica en relación con el inicio
del estímulo. Una vez que se ha formado la respuesta, se crea un pico con una cantidad de tiempo
dependiendo de la persona y de la tarea. Si la estimulación no es continua, la respuesta se apaga,
volviendo a la línea de base. Entre el máximo alcanzado en el pico y el mínimo alcanzado en el
retorno de la línea base, existe una diferencia que debe ser grande para se considere que la
activación ha tenido lugar. Esto se calcula mediante los puntos y los valores críticos del polinomio
cúbico. La diferencia entre los coeficientes del polinomio, los puntos críticos y los valores tiene un efecto
relacionado con la respuesta BOLD. Los vóxeles se agrupan mediante un algoritmo en el método k
y los vóxeles que no muestran el comportamiento necesario se eliminan. Y sólo se mantienen las
agrupaciones de vóxeles que cumplen los criterios anteriores. El método se basa en el promedio de
las k (t+1) observaciones originales, aunque esto da lugar a pérdidas de datos, y sin hacer caso a las
diferencias entre las k repeticiones.
En los datos reales, la corrección de la multiplicidad detecta diferencias entre dos grupos de
sujetos en ROIs múltiples. Aunque este método no da buenos resultados para más de dos grupos de
sujetos. El análisis de correlación tradicional distingue entre vóxeles activos e inactivos en series
de tiempo de la correlación con una Wavelet especificada de antemano. Cada experimento FMRI se
repite dos veces en una misma sesión, con la correlación de cada vóxel la misma. Entonces los
vóxeles que son realmente activos muestran un alto nivel de coherencia. Se propone para ello el
siguiente criterio con dos etapas:
1) La correlación de la serie de tiempo esta por encima de un umbral determinado.
2)El vóxel es parte del grupo de vóxeles con una correlación por encima del umbral
Un vóxel activo muestra un comportamiento coherente y alcanza un elevado nivel de
correlación con cada repetición del experimento en una sola sesión. El proceso se repite al menos
dos veces en el mismo período de sesión para cada tema, al llevar a cabo un estudio de FMRI. Por
tanto estos sujetos están más tiempo en el escáner.
2) La corrección de Bonferroni.
3) Permutación de muestreo para el control de la FWER.
4) Sencillo control FDR.
5) Procedimiento de muestreo para el control de la FDR.
retorno de la inversión se define de forma individual para cada sujeto en el estudio, ya que
el esfuerzo consume mas tiempo. La proporción de vóxeles activos o el grado de actividad en el
retorno de la inversión, son características que se comparan a través de temas o grupos
experimentales mediante técnicas estadísticas estándar. El paso intermedio entre el análisis del
cerebro y el análisis ROI, es posible si se quitan las partes de la imagen que no son válidas para la
activación. La imagen se puede enmascarar en los vóxeles incluidos dentro del cerebro. Induciendo
un error en el análisis mediante los vóxeles pertinentes. Al reducir el número de vóxeles se afina la
inferencia y el poder adquirido. La primera estimación del número m0 de la hipótesis nula
verdadera, se basa en los ajustes de multiplicidad de m-m0 en lugar de m. Una hipótesis nula es falsa
cuando los p-valores son pequeños. Además bajo la hipótesis nula, el p-valor se distribuye
Uniforme [0,1]. Se busca la ruptura de la recta correspondiente a la uniformidad, por tanto se
encuentra la estimación de m0. , m 0. , basada en los p-valores más grandes. Los p-valores son
lineales y la pendiente de la recta es b=1/ ( m 0. + 1) . Para obtener una estimación de m0., se traza
una recta a través de los p-valores más grandes que pasan por el punto (m+1,1), con pendiente b$ y
m0. = 1/ b$ . La recta se ajusta utilizando los m-1 p-valores más grandes. La pendiente pasa por los
( ) ( )
puntos (m+1, 1) y i, p( i ) , Si = 1 − p(i ) / ( m + 1 − i ) , si Si ≥ S(i-1), hasta el primer k, Sk < Sk-1. Se
(
valores como una mixtura de la Beta(a, 1) y la Uniforme [0, 1]: f ( p | π , a ) = π + 1 − π ap
a −1
)
Con este modelo se estima la densidad representada en un histograma.
Capítulo 7
Implementación en código
MATLAB
7.1. Introducción
Según se ha descrito en capítulos anteriores, muchos métodos están disponibles para el
análisis estadístico de los datos de la fMRI, desde un modelo lineal simple para la respuesta y un
modelo global de primer orden autorregresivo de los errores temporales (SPM'99), a un modelo más
sofisticado no lineal para la respuesta con un modelo de estado espacio local de los errores
temporales (Purdon). La implementación de estos métodos, por ejemplo, en código Matlab debe
proporcionar un compromiso: rapidez, eficiencia, generalidad y validez. Los objetivos principales
son:
1) Reducir el sesgo en la estimación de los parámetros de un modelo autorregresivo de los
errores.
2) Combinar los resultados de series independientes a través de un sencillo modelo de efectos
aleatorios estimados por el algoritmo EM.
3) Modificar el algoritmo EM para reducir el sesgo y aumentar la velocidad de ejecución
4) Regulación espacial del efecto aleatorio para aumentar los grados de libertad.
5) Mejorar la ejecución general velocidad del código informático.
El resultado es un conjunto de cuatro funciones de MATLAB, conocidos colectivamente como
fmristat, que están disponibles libremente en la web en http://www.math.mcgill.ca/keith/fmristat.
o El primero, fmridesign, establece la matriz de diseño de un modelo lineal para el
estímulo externo convolucionado con una función de respuesta pre-especificada
hemodinámica (HRF).
o El segundo, fmrilm, ajusta el modelo lineal a una única prueba de los datos fMRI
permitiendo correlación espacial de los errores. También se puede estimar el retraso voxel-
racional de la HRF.
o El tercero, Multistat, combina la salida de los análisis por separado de fmrilm de
pruebas diferentes en un período de sesiones, sesiones diferentes sobre el mismo tema, así
como entre los sujetos dentro de una población, utilizando un tipo de análisis de efectos
aleatorios.
o El cuarto el umbral tstat fija el umbral de detección de pico y el tamaño del clúster
utilizando la teoría del campo al azar.
Se debe tener en cuenta que la normalización espacial registra imágenes de un atlas estándar,
mientras que las coordenadas Tailarach, sólo se realizan en la salida de cada período de sesiones, no
en los datos originales, ni la salida de cada carrera. Esto reduce la cantidad de normalización
considerablemente.
Se han propuesto varios modelos de h(t), un modelo sencillo es una función gamma a
diferencia de dos funciones gamma que modelan levemente la inclinación de la intensidad, después
de la respuesta hemódinamica, la inclinación se ha reducido a cero. Un ejemplo es la HRF está
disponible en SPM '96:
( t − d1 ) t (t − d2 )
a1 a2
t
h ( t ) = exp − − c exp −
d1 b1 d 2 b2
Siendo:
• T el tiempo en segundos
• d j = a jb j el tiempo máximo
La deriva puede ser eliminada, por un filtro alto, bajo o mediante la introducción de términos
variación de la frecuencia, como cosenos, polinomios o por un modelo lineal. La función de
transformación del coseno tiene pendiente cero en los extremos de la secuencia, por ello se utiliza la
función polinomica. Todo puede ser escrito como respuestas adicionales, xi , k +1 ,K , xi , m en el
instante i, y se agrega al modelo lineal. Por ejemplo, un polinomio con derivada de orden q se puede
eliminar mediante la adición a un modelo lineal xi ,k +1+ j = ti j , j = 0,1,K , q, m = k + 1 + q . Un error
aleatorio εi se añade para obtener los datos observados en fMRI, en el índice de tiempo i:
Yi = xi1β1 + K + xik β k + xi ,k +1β k +1 + K + xim β m + ε i = xi' β + ε i
1442443 144424443
respuesta FMRI deriva
Siendo:
• xi = ( xi1 ,K , xim ) '
Cor ( ε i , ε i −1 ) = ρ l
Esto se extiende a los modelos autorregresivos de orden p, denotado por AR(p), especificado
por:
ε i = α iε i −1 + α 2ε i − 2 + K + α pε i − p + ξi1
Siendo la estructura de autocorrelación más compleja, incluso en condiciones oscilatoria, así
como un descenso exponencial. Para tener en cuenta el ruido blanco del escáner, se ha ampliado el
modelo AR(1) para agregar un segundo término independiente de ruido blanco.
7.2.3 fMRIdesign
La función de MATLAB fmridesign toma como entrada el estímulo s(t) y los
parámetros de la función de respuesta hemódinamica (HRF(2)), calculan la respuesta x(t),
luego se toman muestras en distintos momentos de la adquisición producidos por un conjunto
diferente de regresores de la variable xi para cada sector. Este análisis utiliza regresores
adaptados a cada sector, mientras que SPM simplemente aumenta los regresores que incluyen
las covariables adicionales del modelo con pequeños cambios en el tiempo inducido por la
adquisición del corte secuencial.
fmridesign especifica una área, por regresor específico, mientras que SPM aumenta la
matriz de diseño incluyendo un regresor adicional que conserva el mismo diseño de la matriz
en todos los voxels.
Y 1 = Y1 , Y i =
(Yi − ρYi −1 )
1− ρ 2
X 1 = X1, X i =
( X i − ρ X i −1 )
1− ρ 2
Con i = 2,…, N, de modo que el modelo se convierte en
'
Y i = X i β + ξi
Siendo:
• ξi N ( 0, σ 2 ) de forma independiente.
σ 12
• σ2 =
(1 − ρ )
Designando la seudoinversa por +; el estimador de mínimos cuadrados en la fórmula anterior
es:
β = X +Y
Siendo:
• ( )
X = x1 ,K , xn ' es el diseño de la transformada de la matriz
• ( )
Y = y1 ,K , yn ' es la observación de la transformada del vector.
∑r
i =1
i
2
Y 1 = Y1 , Y i =
(Yi − ρYi −1 )
Sustituyendolo en: 1− ρ 2
X 1 = X1, X i =
( X i − ρ X i −1 )
1− ρ 2
Una estimación del sesgo ρ se debe a la correlación de los residuos inducidos por la
eliminación de una recta estimada a partir de las observaciones. Esto se debe a la varianza de la
matriz de los residuos es RVRσ2, que no es la misma que la matriz de varianzas de los errores Vσ2.
aproximadamente 1 , o alrededor de 0,1 para las ejecuciones típicas de n = 100 lecturas. Esto
n
es bastante grande en comparación con las correlaciones que oscilan entre 0 y 0,4. Ciertos métodos
de regularización reducen esta variación y alcanza este objetivo mediante un suavizado espacial. En
su lugar se propone el método más simple consistente en el suavizado espacial del sesgo (reducido)
E = cβ
con la desviación estándar estimada por:
+
S = cX σ
Para detectar el efecto, se contrasta que el efecto es cero mediante contraste de hipótesis de
ajuste. Esta prueba estadística se comprueba a partir del estadístico T:
T =E
S
que tiene una distribución t con ν grados de libertad, si no hay efectos cβ=0. Para detectar más de
uno efecto al mismo tiempo, es decir, si c es una matriz con rango k, el estadístico T se sustituirá
por un estadístico F definido por:
( )
−1
+
' + '
E C X C X E
F=
kσ
2
( )
Que se distingue según una F con k y ν grados de libertad, cuando no hay efectos.
7.3.5 Fmrilm
Los métodos descritos en esta sección se han implementado en la función fmrilm de
MATLAB (fMRI modelo lineal) para el modelo AR(p). Esto toma como entrada el diseño de
matrices y añade tendencias polinomionales con fmridesign. Las tendencias polinomionales no se
suavizan por la HRF, por lo que los términos constante para un descanso o una condición de base
que se supone que existen antes de la digitalización inicial. Para reducir el sesgo de ρ hay que
aplicar el método de mínimos cuadrados residuales no transformado. Los datos de la fRMI y el
diseño de la matriz se blanquea con ρ y la estimación final de β y σ serán calculados los efectos, E
sus errores estándar, siendo S, T y F los estadísticos de prueba. Estas medidas dan las respuestas
correctas, incluso si la matriz de diseño no tiene el rango completo. Se reducen cálculos con el uso
de la pseudoinversa.
El siguiente paso es combinar los efectos aleatorios y los errores estándar de pruebas
diferentes en la misma sesión. Se comienza por la combinación de ejecutar n*; la combinación de
períodos de sesiones y los temas es similar. Ej denota los efectos sobre cada j, donde E = c β , y Sj
+
denota su desviación estándar S j = c X j σ j , j = 1,…,n *. Se puede capturar con otro vector de
variables regresoras, denotado por zj. Y Ej es una variable aleatoria cuya esperanza es un modelo
lineal z 'j γ en las variables regresoras. Esto se realiza con el fin de ampliar nuestra inferencia a las
muestras aleatorias, en lugar de las exploraciones complementarias dentro del mismo recorrido,
suponiendo que el efecto tiene dos componentes de variabilidad:
E j = z 'jγ + η j
Siendo:
ηj una distribución normal con media cero y varianza S 2j + σ aleatoria
2
independientemente para
estimaciones de efects fijos usan pesos inversamente proporcionales a S 2j , siendo esta la base
o Si σ aleatoria
2
es desconocido, se puede estimar γ y σ aleatoria
2
queda aproximada por el
método de áxima verosimilitud restringida (REML) (Harville), una menor estimación sesgada
de la varianza se obtiene por máxima verosimilitud (ML).
Sin embargo, el hecho de que el error de varianzas indique que no existe una expresión
analítica para el REML o de estimadores ML, así que debemos recurrir a algoritmos iterativos. La
estabilidad es más importante que la velocidad de convergencia, ya que no es fácil supervisar el
algoritmo en cada voxel, por lo que se elige el algoritmo EM, que siempre produce estimaciones
positivas de componentes de varianza. Cuando el efecto aleatorio es pequeño, el algoritmo EM es
conocido por ser lento para converger y produce graves sesgos en sus estimaciones. Esto se debe a
que el algoritmo EM siempre devuelve una estimación positiva de σ aleatoria
2
aun cuando el valor real
2
es cero. Para superar esto, restamos S min = min j S 2j , lo que da un modelo equivalente para Ej con
varianza
(S 2
j − S min
2
) + (σ aleatoria
2
+ Smin
2
)
El algoritmo EM para estimar el parámetro desconocido
σ aleatoria
*2
= (σ aleatoria
2
+ Smin
2
)
Los valores de partida son las estimaciones de los mínimos cuadrados en el supuesto de que
Sj = 0. La convergencia es más rápida porque σ aleatoria
*2
está más lejos de cero. Finalmente restamos
2
S min para obtener σ aleatoria
*2
como estimador de σ aleatoria
2
que parece ser casi insesgada para los datos
simulados.
()
variable, resultando un bajo grado de libertad ν* de la varianza estimada Var γ$ . Si todas las
desviaciones estándar de Sj son iguales, entonces la varianza de cada efecto Ej se desconoce, pero se
puede demostrar que los grados de libertad es υ * = n* − p* , donde p* = rango ( Z ) y
( )
Z = z1 ,K , zn* . Si n* = 4 se obtiene un promedio de ν* = 3 grados de libertad. Esto es
especialmente grave para detectar máximos locales por el umbral del estadístico T, ya que el umbral
puede ser extremadamente alto, lo que es muy difícil de detectar con una señal de que está
realmente presente (Worsley). Teniendo en cuenta que la imagen de los efectos aleatorios de la
desviación típica es muy ruidosa (debido a los bajos grados de la libertad), es importante que
contenga la estructura anatómica. Esta misma estructura anatómicas es también evidente en la
imagen de los efectos fijos de la desviación estándar, σ 2fijo obtenida como:
∑υ S j
2
j
σ 2fijo = j
υ fixed
Donde:
o νj los grados de libertad de Sj
Teniendo en cuenta que la imagen de los efectos fijos de la desviación estándar tiene menos
ruido, por tener un alto grado de libertad procedente del gran número de exploraciones para cada
ejecución. Entonces se pueden utilizar los efectos fijos de la desviación estándar como una plantilla
para una mejor estimación de los efectos aleatorios de la desviación estándar. Para ver esto, se
considera la relación de los dos efectos con una estructura menos anatómica.
2
σ 2fijo + σ aleatoria
τ =
2
σ 2fijo
Por tanto, se puede reducir el ruido en τ2 por el suavizamiento espacial y luego se multiplica
de nuevo por los efectos fijos de la desviación estándar para obtener un estimador que mejore los
efectos aleatorios de la desviación estándar con un mayor grado de libertad:
σ aleatoria
2
= liso × σ 2fijo
σ 2fijo
2
Esto puede ser aplicado usado en lugar de σ aleatoria para obtener un mejor estimador de γ y su
desviación estándar. Teniendo en cuenta que sin suavizado da un análisis de los efectos puramente
aleatorios, mientras que si se utiliza un filtro de suavizado se amplia infinitamente, de modo que el
coeficiente de variación es 1 en todas partes, produciendo un análisis puramente de efectos fijos. La
cantidad deseada de alisado se puede determinar por el grado de libertad deseado.
υ ratio = υ * ⋅ 2 ratio + 1
wefecto
* *
Los grados de libertad de la desviación estándar S , denotada por υ% , se estima por:
1 1 1
= +
υ% υratio υ fijo
*
Finalmente, los efectos se definen por los contrastes en E * = bγ$ con una desviación
estándar:
()
S * = bVar γ$ b '
*
El estadístico T, T = E con υ * grados de libertad, entonces se puede utilizar para
S*
detectar ese efecto.
7.4.5 Multistat
El análisis de esta sección se hace con Multistat. Tomando como entrada la salida del efecto
Ej y la desviación estándar de imágenes Sj de fmrilm, junto con sus grados de libertad νj. Si las
imágenes de la desviación estándar no se calculan con Multistat se consideran 0 con νfijo = ∞.
El FWHM de la entrada de wefectos se d generalmente estimado por el FWHM de los datos
primarios. Por último, el FWHM suaviza la relación de la varianza wratio por ser elegido para dar por
lo menos 100 grados de libertad. La razón de varianza τ se facilita en 3D, entonces γ se obtiene por
mínimos cuadrados ponderados con pesos:
1
2
S 2j + σ aleatoria
En raras ocasiones, cerca de los artefactos del escáner fuera del cerebro, los pesos pueden ser
*
negativos. La producción es el grado de libertad υ% , el efecto E* y su desviación estándar S*, se
puede utilizar como entrada a espacios del Multistat.
CAPITULO 8
ALGUNAS REFERENCIAS
RECIENTES EN EL ANALÍSIS
ESTADÍSTICO FMRI.
TRATAMIENTO DE CASOS PRÁCTICOS.
8.1. Aplicación.
Ingo R. Keck, Ica aplicado a datos de EEG y fMRI (Tesis de la Universidad de Regensburg,
Alemania, 2007)
En esta tesis se utiliza el Modelo Lineal General (GLM), aplicado al análisis fMRI. Para ello se
analiza la evolución temporal de un vóxel:
r
x = ( x ( t1 ) ,K , x ( tn ) )
T
r r r
Sabiendo que el Modelo Lineal General es: x = Fb + e
Donde:
r
o b : coeficiente de regresión.
o
rF: fuentes de filtro.
o
e : errores de la distribución gaussiana.
La desventaja de este modelo es que hay que conocer la evolución temporal de la actividad para el
análisis. También se realiza un Análisis de Componentes Independientes (ICA) aplicado a fMRI,
r r r r
()
considerando el ICA x r = As r () espacial
Donde:
La ventaja de este modelo es que no hay que conocer la función de actividad para el análisis.
Se puede redefinir la formula del ICA espacial pero teniendo en cuenta el ruido que no se
puede ignorar en fMRI:
r r r r r r
() () ()
x r = As r + n r
8.2. Aplicación.
Meli, C. y García, S. Resonancia Magnética Funcional: Casos clínicos. (Departamento de
Neurología. Buenos Aires, 2002)
En este trabajo para el análisis de las imágenes funcionales se utiliza el programa MEDx
3,41 que realinean 500 imágenes para corregir posibles movimientos producidos por el paciente
durante la ejecución del paradigma. Después se le aplica un filtro espacial Gaussiano a la respuesta
hemodinámica de acuerdo con la función de los puntos de dispersión (PSF). Para la construcción de
los mapas estadísticos de Z se realiza un análisis estadístico paramétrico que incluye el test de “t” de
muestras no apareadas con un nivel de significación p<0,001. Para finalizar, se transforman los
datos al espacio del Atlas de Talairach and Tournoux de manera de estandarizar las coordenadas de
los mapas estadísticos. En este trabajo se estudian diferentes casos prácticos en los cuales la fMRI
es utilizada como una herramienta de gran aporte en aplicación clínica. Uno de ellos es: Un paciente
de 17 años, atropellado por un tren, ingresa con traumatismo de cráneo. Se le hace la resonancia
funcional 5 meses después del accidente, donde cumple con el criterio de MCS. Dos meses y medio
después del estudio fMRI, el paciente comienza a despertar. Y se obtienen resultados dentro del
rango normal, mostrando la resonancia una disminución de la dilatación ventricular.
8.3. Aplicación.
Campitelli, G. Recordar como habilidad experta: refutación de la hipótesis de los almacenes
de memoria. (Universidad Abierta Interamericana, 2008)
En este trabajo, se seleccionó una muestra de cinco ajedrecistas y siete no ajedrecistas que
participaron en una prueba de memoria de corto plazo en un scanner de resonancia magnética
funcional (fMRI). En cada bloque, se presentó una posición de una partida de ajedrez durante 2,5
segundos, seguido de una serie de 7 posiciones que se presentaron por 3 segundos con un intervalo
inter-estímulo de 1 segundo. La tarea consistió en decidir si cada posición de la serie era idéntica a
la primera. Se encontró que la activación cerebral de los no expertos fue muy superior a la de los
expertos y se concentró principalmente en los lóbulos frontal y parietal. Mientras, que la activación
de los expertos fue relativamente mayor en el lóbulo temporal. Este estudio demuestra que una
misma tarea se ejecuta en forma diferente de acuerdo al nivel de experiencia. Se utilizaron los
resultados de este estudio junto con otros de la psicología sobre la experiencia para demostrar que el
rendimiento en tareas de memoria en todas las personas depende del entrenamiento realizado.
8.4. Aplicación.
Vayá, M.I. Análisis de series temporales mediante ICA. (Biomedical Mining Group,
Universidad Politécnica de Valencia, 2009)
En este trabajo se investiga que la actividad cerebral aumentada el flujo sanguíneo en una
región del cerebro. Se utiliza un método que aporta información sobre conectividad funcional, y que
revela los factores ocultos bajo un conjunto de variables aleatorias, o señales. Además asume que
los datos de fMRI son mezclas lineales de fuentes independientes e intenta extraer señales que son
independientes de sus coeficientes de mezcla. Es un método motivado por los datos y esto implica
que estas fuentes independientes representan agrupaciones coherentes de activaciones de fMRI,
llamados mapas de componentes. Estos mapas son una representación de las redes funcionalmente
conectadas. Así se puede capturar la actividad coherente que no tiene porque seguir a la tarea
administrada por el estimulo.
Conclusión:
• ICA funciona bien con datos de fMRI
• ICA es una clase de análisis “sin-modelo” y dirigido por los datos para fMRI
• ICA presenta resultados interesantes para la interpretación clínica
• ICA puede ser una herramienta poderosa en la investigación del cerebro
8.5. Aplicación
Nardi, B. Capecci, I. Fabri, M. Polonara, G. Salvolini, U. Bellantuono, C. y Moltedo, A.
Estudio mediante imagen funcional de resonancia magnética (fMRI) de las activaciones emotivas
correlacionadas a la presentación de rostros extraños o del propio rostro en sujetos con
personalidad inward y outward. (Universidad Politécnica de la Marca Italia, 2008 ).
8.6. Aplicación
C. Chavarrías1, M. Benito1, P. Montesinos1, V. García-Vázquez2, J. Taylor3, E. Goiriena3, M.
Desco1. Adquisición de imágenes de resonancia magnética funcional (fMRI) en cerebro de rata.
técnicas rápidas de adquisición de imagen. Un ejemplo son las secuencias EPI, combinadas con
adquisiciones de Fourier parcial y antenas phased-array, que permiten adquirir en paralelo.
8.7. Aplicación
Sánchez, C.L. Aplicaciones Open Source en el ámbito de la Salud y Sanidad. (Coordinador
Técnico de la Plataforma para la Salud en Código Abierto. Proceso de Datos de la Delegación de
Innovación, Ciencia y Empresa, Junta de Andalucía. España.)
Se ha recopilado desde la Fundación de Salud, FeSALUD, un mapa global de
aplicaciones/framework libres, para poder construir diferentes redes y para comunicar y crear
sinergias que permitan saber qué se hace, cómo se hace y qué hay por hacer.
Niftilib: es un conjunto de librerias input/output para leer y escribir archivos en el formato
de datos nifti-1. El formato nifti-1 es un archivo binario para almacenar datos de imágenes médicas,
por ejemplo, imagen de resonancia magnética (MRI) y resonancia magnética funcional (fMRI) del
cerebro. Niftilib cuenta actualmente con C, Java, MATLAB, Python y bibliotecas.
FSL: Es la librería de software FMRIB (FSL) es una herramientas de análisis para el fMRI,
RM y DTI de datos de imágenes del cerebro. FSL está escrito principalmente por los miembros del
Analysis Group, FMRIB, Oxford, UK. FSL se ejecuta en Apple y PC (Linux y Windows), y es muy
fácil de instalar. La mayoría de las herramientas se puede ejecutar tanto desde la línea de comandos
y las interfaces gráficas.
Lipsia Permite el procesamiento de Imágenes de Leipzig y la inferencia estadística
algorítmica. Es una herramienta de software para procesamiento de imágenes de resonancia
magnética funcional (fMRI) de datos. Fue desarrollado en el transcurso de varios años en el Max-
Planck- Institute for Human Cognitive and Brain Sciences en Leipzig.
8.8. Aplicación
Quirós, A. Análisis Estadístico de imágenes de resonancia magnética funcional. (Tesis de
la Universidad Rey Juan Carlos, Albacete, 2010).
Este estudio aborda el análisis de imágenes de resonancia magnética funcional (fMRI). La
resonancia magnética funcional es una técnica no invasiva para obtener imágenes de actividad
cerebral en respuesta a periodos específicos de estimulación, acciones u operaciones del
conocimiento. Se obtiene una serie de imágenes en el tiempo en, al menos, dos condiciones
diferentes y las regiones activadas del cerebro se detectan observando las diferencias en la
magnetización sanguínea debida a la respuesta hemodinámica. El análisis de datos de fMRI
considera dos problemas principales: la detección de actividad cerebral y la estimación de la curva
de respuesta hemodinámica. Se proponen diferentes modelos espaciotemporales para tratar de dar
una solución a estos problemas. El paradigma bayesiano proporciona un marco adecuado para hacer
inferencia en modelos complejos y constituye, asimismo, una teoría rigurosa para combinar la
información previa con la experimental de forma natural.
8.9. Aplicación.
Mazzone, L. Yu, S. Blair, C. Un estudio de fMRI de circuitos frontoestriatales durante la
inhibición del parpadeo en personas con Síndrome de Tourette. (Instituto de Psiquiatria Interactiva.
Palmanova, Mallorca, 2008)
Los autores trataron de estudiar la actividad en los circuitos neurales que favorecen la
inhibición de un comportamiento motor semi-involuntario, parpadeo, en niños y adultos con
Síndrome de Tourette y en sujetos sanos de comparación. Con este objetivo se utilizó la resonancia
magnética funcional para explorar a 120 participantes (51 con síndrome de Tourette y 69 sujetos de
comparación) ya sea presentando un parpadeo normal o éxito inhibido del parpadeo. Los autores
compararon la señal dependiente del nivel de oxígeno en sangre durante estas dos condiciones en
los grupos de Tourette y de comparación. En relación a los sujetos de comparación, los pacientes
con síndrome de Tourette activaron con más fuerza la corteza frontal y el cuerpo estriado durante la
inhibición del parpadeo. La activación incrementó aun más con la edad, en la corteza prefrontal
dorsolateral e inferolateral y el núcleo caudado en el grupo Tourette que en los sujetos de
comparación. Además, el grupo Tourette activó más fuertemente el gyrus frontal medio, la
cingulada anterior dorsal y las cortezas temporales. La severidad de los síntomas de tic en el grupo
Tourette correlacionó inversamente con la activación en el putamen y la corteza prefrontal
inferolateral. Las conclusiones extraídas de este estudio son: La actividad frontoestriatal se
incrementa en personas con síndrome de Tourette durante la inhibición del parpadeo ocular. En esta
población la activación de circuitos frontoestriatales pueden ayudar a mantener un control regulador
sobre las conductas semi-involuntarias, ya sean tics o parpadeos.
APÉNDICE 1
LA TRANSFORMADA DE FOURIER
DISCRETA
La descomposición de Fourier representa funciones periódicas y definidas en [-π, π]. Está
descomposición se aplica a las funciones de cuadrado integrable.
El resultado de Fourier establece que cualquier f L2 [-, ] se puede expresar como una suma
infinita dilatada de las funciones seno y coseno:
∞
1
f ( x) = a0 + ∑ ( a j cos ( jx ) + b j sin ( jx ) )
2 j =1
Esta suma aumenta al infinito, pero la función se aproxima a la suma finita con el índice j del límite
superior de la suma. Esto define la serie truncada de Fourier:
J
1
S j ( x) = a0 + ∑ ( a j cos ( jx ) + b j sin ( jx ) )
2 j =1
x + π , -π ≤ x ≤ −π / 2
f ( x ) = x / 2, -π / 2 < x ≤ π / 2
x − π , π / 2 < x ≤ π
Como el límite de la suma de j es grande, se incluyen más términos en la reconstrucción. Para j ≥ 1,
los coeficientes de Fourier se calculan con el producto interior de la función f y de las funciones base:
π
1
aj =
π ∫ f ( x ) cos ( jx ) dx,
−π
j = 0,1,...,
π
1
bj =
π ∫ f ( x ) sin ( jx ) dx,
−π
j = 0,1,...,
APÉNDICE 2
EL SISTEMA DE HAAR
La extensión de análisis de Fourier al análisis Wavelet se hace a través de la base Haar. Por
ello la función de Haar es una función Wavelet.
La función Haar, se describe como:
1
1, 0 ≤ x< 2
1
ψ ( x ) = −1, ≤ x < 1
2
0, otro caso
La función Haar Ψ definida anteriormente se denomina Wavelet madre. Esta función da a luz a
toda una familia de Wavelet a través de dos operaciones:
o Dilataciones diádicas.
o Traducciones.
Siendo:
o j el índice de dilatación
o k el índice de la traducción.
Cada Wavelet nacida de una wavelet madre se define por estos dos índices de la siguiente
manera:
ψ ( x ) = 2 j /2ψ ( 2 j x − k ) , j, k ∈ Z
Teorema:
El conjunto (Ψj,k, j, k) ε Z constituye un sistema de ortonormal L2(R). Para establecer el teorema,
es necesario demostrar:
1. El conjunto es ortonormal.
2. Cualquier función f ε L2(R) se aproxima a una combinación lineal finita de Ψj,k's.
1) Comprobar que se satisfacen las propiedades de la Wavelet Haar:
∞
∫ ψ ( x )dx = 0,
−∞
j ,k j, k ∈ Z
sup pψ j , k = k 2− j , ( k + 1) 2− j
Si dos Wavelets tienen diferentes índices de dilatación, con supp Ψj,k una región con la
∫ f 2 ( x) → ∫ f 2 ( x)
−2 J1 −∞
Análisis Multiresolución
Se construye FJ como una aproximación de la función original y siendo la mejor aproximación
de FJ-1.
Cada función GJ se escribe como una combinación lineal de las funciones Ψj,k.
Por ello se define el espacio Vj con j ε Z:
{
V j = f ∈ L2 ( ℜ ) : f es una constante en k2− J , ( k + 1) 2− J , k ∈ Z }
Cada subespacio Vj está compuesto de funciones constantes en intervalos de doble longitud que
Vj-1.
j −1 j −1
Se define PJ f, la proyección de una función f en el espacio Vj: P f = P f + g
j
dando:
P j f = P j −1 f + ∑ ( f ,ψ j −1,k )ψ j −1,k
h∈Z
j∈Z j∈Z
Función de escalada
V j = span {φ j , k , k ∈ Z}
Representación Wavelet.
La proyección de L2(R) en una función del espacio Vj se hace en términos de su dilatación y
su traducción:
∞
P j f = ∑ c j , kφ j , k
k
con: c j , k = f , φ j , k = ∫
−∞
f ( x) φ j , k ( x) dx
{ }
Denotando φ ∈ V0 y φ ∈ V1 , con φ1,k , k ∈ Z base para V1, y se escribe en términos de
En Haar se obtiene que φ j , k ,ψ j ',k ' = 0, con j ≤ j' (j, j, k, k' ε Z), es decir, una función de escalada
y una wavelet ortonormal, siendo la función de escalada de menor resolución. Definiendo una
importante propiedad de multiresolución
V j = V j −1 ⊕ W j −1
Los coeficientes Wavelet se calculan con el producto interior, de la función
Wavelet: d j ,k = f ,ψ j ,k = ∫ f ( x) ψ j ,k ( x) dx .
ψ j ,k ( x) =
(φ j +1,2 k ( x) − φ j +1,2 k +1 ( x) )
2
La imagen se puede afinar sin aumentar la cantidad de información que se almacena utilizando
un número reducido de componentes para representar las grandes zonas homogéneas, dejando un
gran número de componentes con los que representa la acción de la imagen.
Pasar de una gruesa aproximación de la resolución a una fina o de una fina a una gruesa, se
denomina zoom-in zoom-out del análisis de multiresolución.
∞
Las propiedades hacen que la oscilación de una función onda, se convierta en una Wavelet. Si la
oscilación es rápida, se pueden representan detalles más finos en la señal.
(
Una madre wavelet Ψ se dilata a: ψ j , k ( x) = 2 ψ 2 x − k
j /2 j
)
Donde el punto x = 2-j K se localiza en Ψj,k(x).
APÉNDICE 3
BASES DE WAVELETS REGULARES
Existen muchas familias Wavelet: Stromberg, Meyer, Batle y Lemarie, Wang Chuil, Ingrid
Daubechies, entre otras. Con tantas familias wavelet entre las que escoger, es difícil elegir la más
idónea.
Una cualidad importante que debe poseer una base Wavelet es la ortonormalidad, es decir, la
independencia de los coeficientes empíricos.
Normalmente, los conjuntos de datos están limitados en una escala del intervalo [0,1] por lo que
es natural una Wavelet con soporte compacto.
APÉNDICE 4
WAVELETS DE DESCOMPOSICIÓN Y
LA RECONSTRUCCIÓN
El algoritmo de descomposición Haar expresa la función Wavelet y la ampliación de los
coeficientes de la función en cualquier nivel de resolución y en términos de los coeficientes de la
función de escalada en los niveles superiores.
El algoritmo de descomposición
Los espacios {cj,k j,k ε Z} y {dj,k j,k ε Z} representan la función de escalada y los coeficientes
Wavelet de una función f, respectivamente. Estos coeficientes se calculan de la siguiente manera:
La relación de dos escalas para cualquier función de escala en términos de niveles más altos
obtiene la ecuación:
φ j ,k ( x) = ∑ hL − 2 kφ j +1, L ( x)
L∈Z
El algoritmo de reconstrucción
El algoritmo de reconstrucción comienza con los coeficientes de bajo nivel y calculando los
de alto nivel. Este algoritmo comienza con un MRA con (Фj,K, KεZ) y {ψj,k, k ε Z} formando bases
ortonormales para Vj y WJ, respectivamente.
De Ф1,0 ε V1 se sabe que Ф1,0 es la combinación lineal de Фo,k (base para Vo) y Ψ0 (base para
Wo) y lo mismo para Ф1,1. Los coeficientes de las combinaciones lineales calculan los productos
interiores, de la unificación del tratamiento.
φ1,0 ( x) = ∑ ( a2 kφ0,k ( x) + b2 kψ 0,k ( x) ) φ1,1 ( x) = ∑ ( a2 k −1φ0,k ( x) + b2 k −1ψ 0,k ( x) )
k∈Z y k∈Z
APÉNDICE 5
LOS CONCEPTOS DE
REPRESENTACIÓN CON FILTRO
Se realiza un estudio para aplicar un filtro a una señal pura contaminada con ruido, intentando
aislar la señal pura o extraer el ruido. La señal f se representa por {fk}k Z., con f L2 (Z) y el filtro por
{ak}k € Z y se denota por A.
El filtrado de subbandas se aplica al algoritmo de descomposición por una operación de
muestreo aplicando ese filtro a una señal en los resultados de la señal con la mitad de longitud que la
señal original.
El proceso de filtrado consta de una convolución discreta de la secuencia de filtro con la señal,
aplicando el filtro de la señal A a la f tal que:
( Af )k = ∑ aL−2 k f L
L∈Z
La notación del operador habitual será: AB, f señala el resultado de la primera aplicación de un
filtro de B a la señal de f y luego aplica el filtro A del resultado intermedio.
La escala de coeficientes de la función en el inferior se obtiene mediante la aplicación del filtro
H a la señal: cj-1 = Hcj,
Los coeficientes de la función de escalada se obtiene en varias ocasiones con la aplicación del filtro H:
cj-m = Hm cj, y del nuevo filtro G por: Gk = (-1)k h1-k, k Z
Los coeficientes Wavelet en el nivel j-1 se obtienen en la escala de coeficientes de la función al
nivel j a través de este filtro de D j-1=Gcj. Uniendo los dos filtros, los coeficientes de Wavelet en un nivel
inferior pueden calcular la escala de coeficientes de la función al nivel j: D j-m = GHm-1 cj
Estos filtros se llaman filtros espejo en cuadratura de los procesadores de la señal. El filtro H es
conocido como filtro de paso bajo, mientras que G es un filtro de paso alto. Los filtros de paso bajo
corresponde al promedio de las operaciones, y el filtro de paso alto corresponde a la diferencia.
En las Wavelet Haar, una señal f = {fk}k € Z utiliza los elementos de la señal filtrada f`= Hf en el
filtro de Haar de la siguiente manera:
1
f k' = ( f 2 k + f 2 k −1 )
2
El filtro H se aplica a una señal de promedios ponderados localizados en la señal original. La
aplicación del filtro G en la señal cuyos elementos son contrastes de los elementos localizados en la señal
original.
APÉNDICE 6
LOCALIZACIÓN DE FRECUENCIA
La transformada de Fourier CONTINUA
El análisis de una función periódica definida en R se representa por:
∞
1
f(x)= a0 + ∑ ( a j cos( jx) + b j sin( jx) )
2 j =1
( G f ) (w) = ∫
α
b f (t )gα (t − b)e − iwt dt
−∞
En la transformada continua de Fourier, existe una inversa transformada de Gabor esto
repercute en la señal original de su transformada.
El centro de la ventana se define como:
∞
1
t* = ∫ tw (t )dt ,
2
2
w −∞
∫ ( t − t *) w (t )dt
2
∆w = 2
w −∞
Se vuelve a escribir la transformada de Fourier en términos de la anchura:
∞
( Gbα f ) (w) = 2 πα
(
e − ib (ξ − w) 1/4α
Gb f ) ( −b )
La anchura de la ventana en el dominio del tiempo es, 2√α, y la anchura de la ventana en el
dominio de la frecuencia es 1/√α.
La anchura y la altura relativa de la ventana se ajustan a la variable α, pero el área de la
ventana en dos dimensiones es constante en 2. Esta zona es óptima de acuerdo con el principio de
Incertidumbre, donde se establece que para todas las ventanas convenientemente elegidas de la
( )
función w, el principio de incertidumbre es ( 2δ w ) 2δ w ≥ 2 . Alcanzándose la igualdad si y sólo si
x −b
ψ ( a ,b ) ( x) = a −1/2ψ
a
Entonces la Transformación continua Wavelet se define, por F L2 (R)
∞
t −b
(Wψ f ) ( a, b ) = f ,ψ ( a,b) = a −1/2 ∫ f ( x)ψ
a
dt
−∞
ψ ( a ,b ) ( w) = a e −iwbψ (aw)
Se aplica la identidad de Parseval en el resultado anterior:
(W f ) ( a, b ) = 2πa ∫ f (w)e
ψ
iwb
ψ (aw)dw
Si es una función con centro w* y radio ∆ψ es una función de ventana. Será también una función
APÉNDICE 7
LOS EJEMPLOS DE WAVELETS Y SUS
CONSTRUCCIONES
WAVELET ORTOGONAL
Se describe el desarrollo de dos Wavelets ortogonales: la familia Battle-Lemarié y la familia
Daubechies.
El campo de Wavelet Battle-Lemarié forma las funciones B-splines. Donde el primer
miembro de la familia Battle-Lemarié es la función de escala igual a la constante spline por partes.
Este sistema Wavelets es la base de la función de escala ortonormal.
El segunda miembro de esta familia comienza con el spline lineal a trozos N2(x). Esta
función tiene una pequeña relación de dos escalas:
N2(x)=(1/2)N2 (2x +1)+N2(2x)+(1/2)N2(2x-1).
Esta función no es ortonormal, por lo que no es adecuada usarla en la construcción de un
sistema de Wavelet ortonormal. La función debe ser ortogonal por medio de una función de
escalada adecuada.
El desarrollo de la familia Battle-Lemarié comienza con la definición de una función de
escalada que genera un análisis de multiresolución.
La derivación de la familia Daubechies Wavelet representa un enfoque diferente. Comienza
con los filtros y luego se derivan los coeficientes de la función de filtro tanto la ampliación y la
Wavelet.
Para un soporte compacto (x), sólo un número finito de hk es distinto de cero. El
acercamiento de Daubechies a la construcción de Wavelet ortogonal con soporte compacto
comienza con la definición del polinomio trigonométrico periódico.
Wavelets Bio-ortogonales
Las Wavelet Bio-ortogonales trabajan con una clase más general de Wavelet, con soporte
compacto y simetría, pero no ortogonalidad. Las Wavelet bio-ortogonal fueron construidas por:
Tchamitchian, Cohen, Daubechies y Feauveau.
Se denomina Wavelet bio-ortogonal, cuando no es ortogonal, es decir, cuando dos análisis
multiresolución separados en L2(R) corresponden a una Wavelet bio-ortogonal, siendo una el doble
que la otra.
El primer análisis multiresolución se genera mediante la función de escala y el segundo se
genera por una función de escalamiento dual
Wavelet semi-ortogonal
El enfoque semi-ortogonal que ofrecen Chui y Wang y Auscher, permiten construir una
familia de bases de Wavelets ortogonales que conservan el apoyo compacto, la simetría y la
ortogonalidad entre niveles detallados.
Las Wavelet Wang Chui se basan en los cardinales B-splines, al igual que la Wavelet Battle-
Lemarié.
Se constituye una base de Riesz para el espacio Vj de la función donde todos los splines de
orden m-1 son de la familia Wavelet Battle-Lemarié, aunque la base de Chui-Wang no es ortogonal.
APÉNDICE 8
WAVELET DOS DIMENSIONES
En el análisis bidimensional se puede conseguir un método similar al unidimensional. Si la
señal bidimensional f(x, y) es el cuadrado integrable sobre el verdadero plano: f (x, y) L2(R).
Se puede construir fácilmente una base Wavelet para L2(R) con el producto simple Wavelet
unidimensional:
ψ j1 , j2 , k1 , k2 , ( x, y ) = ψ j1 , k1 , ( x) ⋅ψ j2 , k2 , ( y )
Esta fórmula es demasiado simple para reflejar todos los rasgos del análisis multiresolución.
Por ello se aplica el análisis unidimensional MRA para definir el espacio bidimensional Vo
como el producto de 2 espacios unidimensionales:
V0 = V0 ⊗ V0 = span { f ( x) g ( y ), f , g ,∈ V0 }
Para cualquier j, se define este conjunto de subespacios que tienen las propiedades de MRA, pero
trasladadas al caso bidimensional. Por lo que se define:
φ ( x, y ) = φ ( x)φ ( y ) y φ j ,k , k ( x, y ) = 2 j φ ( 2 j x − k1 , 2 j x − k2 )
1 2
{ }
El conjunto φ j , k1 , k2 , j , k1 , k2 ∈ Z constituye una base ortonormal para V0.
El caso bidimensional intenta encontrar los espacios complementarios que representan la
señal de detalle entre aproximaciones sucesivas. En el caso unidimensional, se define Wj como el
complemento ortogonal de Vj en Vj+1. El desglose de estos MRA se expresa de la siguiente manera:
V j +1 = V j +1 ⊗ V j +1 = V j ⊗ W j
El espacio de detalle Wj se compone de tres subespacios ortogonales. Una base de estos tres
espacios detalle son los productos correspondientes de sus componentes, definiéndose así las
Wavelet bidimensionales:
ψ 1 ( x, y ) = φ ( x)ψ ( y ); ψ 2 ( x, y ) = ψ ( x)φ ( y ); ψ 3 ( x, y ) = ψ ( x)ψ ( y )
{
Siendo la base ortonormal para L2(R2): ψ j , k1 ,k2 , m = 1, 2,3, k1 , k2 ∈ Z
m
}
La imagen de detalle asociada a cada una de estas tres orientaciones especial atención a los
bordes de la imagen en la dirección indicada. En concreto, la Wavelet Ψ1 corresponde a la dirección
horizontal, la Wavelet Ψ2 con la dirección vertical, y la Wavelet Ψ3 con la diagonal.
El algoritmo tridimensional consigue mediante la doble aplicación de la relación Wavelet
bidimensional, llegar a la relación de doble escala bidimensional:
φ j , k , k ( x, y ) =
1 2 ∑ ∑h
L1∈Z L2 ∈Z
h
L1 − 2 k1 L2 − 2 k2 φ j +1, L , L ( x, y )
1 2
da un resultado análogo bidimensional, relacionado con una función de escalada en cualquier nivel
de funciones de escalada y Wavelet.
Esto tiene una versión análoga de las fórmulas que se aplican a la descomposición y
reconstrucción de algoritmos para los coeficientes, representados en términos de paso alto y filtros
de paso bajo.
La descomposición es el resultado de un proceso de dos pasos.
1) Se considera la matriz de coeficientes de la función de escala en una señal bidimensional,
donde cada fila está pensada como una señal independiente.
2) El primer paso consiste en aplicar los filtros H y G para cada fila de la matriz. Los resultados
son dos matrices con el mismo número de filas, pero la mitad de columnas que la matriz
original.
3) Cada una de estas matrices es un conjunto de columnas unidimensionales. Los filtros H y G
se aplican a las columnas, dando cuatro matrices cuadradas, con la mitad de filas y la mitad de
columnas que la matriz original.
4)Cada matriz resultante corresponde a la función de escalada y a las tres Wavelet descritas
anteriormente. El CJ-1 de la matriz es la suavización de los coeficientes de expansión de niveles
más altos, y las matrices D1j-1, D2j-1, D3j-1 representan las componentes de detalle horizontal,
vertical y diagonal, respectivamente.
D1j+3 D3j+3
D1j+2 D3j+2
D1j+1 D1j+1 D2j+3
D3j+1
Cj D2j+1
Esto representa la descomposición de la señal en dos dimensiones
Un ejemplo muy común de una señal bidimensional es una imagen digital. Esto consiste en
una matriz donde los valores son los píxeles, que representan la escala de grises.
La descomposición Wavelet de una imagen comienza con los elementos originales. La
matriz de coeficientes de la función de escala es una descomposición que suaviza la imagen
original. Las otras tres matrices constituyen imágenes de detalle.
APÉNDICE 9
PAQUETES WAVELET
Funciones de los paquetes Wavelet
Los Paquetes Wavelet, son una generalización de bases Wavelet, con bases que forman una
combinación lineal de funciones Wavelet. Estas bases tienen propiedades de normalidad y suavidad
correspondientes a funciones Wavelet. Mediante el uso de paquetes Wavelet se construye cualquier
aplicación donde se eligen funciones base.
Una función de paquetes wavelet es una función con tres índices: wmj,k(t). Donde j y k son
los índices enteros de dilatación y las operaciones de traducción respectivamente:
wmj ,k ( x) = 2 j / 2 wm ( 2 j x − k )
φ ( x ) = w0 ( x )
ψ ( x) = w1 ( x)
Las funciones de paquetes Wavelet para m = 2,3 ... se definen como:
w2 m ( x) = ∑ hk w1,mk ( x) y w2 m +1 ( x) = ∑ (−1) k h− k +1w1,mk ( x)
k k
Estos paquetes calculan bases alternativas de los mismos espacios que se estudio la
dilatación y traducción de las funciones de escala y Wavelet. Se observa que el conjunto { wm0,k, k
Z, m = 0, 1, …} forma una base ortonormal de L2(R) sin ajustar el índice de dilatación. Otra base
ortonormal posible para Vj es el conjunto de funciones de paquetes wavelet
{w
m
0, k , 0 ≤ m ≤ 2 j , k ∈ Z}
U 2 ji
)
mi , 2 ji (mi + 1) = [ 0, ∞ )
i =1
Se demuestra que la base wavelet tienen una cubierta como: (m0, j0) = (0,0), y, a
continuación, se establece que m1 = m2 = ... = 1 y dejar ji = i, para, i = 1,2 .... Esto es válido para la
base de Haar, estos resultados se utilizan para las funciones Wavelet y sus subespacios asociados Vj
y WJ para j ε Z.
Los paquetes Wavelet ofrecen una gran variedad en los conjuntos de funciones de base. La
agrupación de todas las bases se llama biblioteca de bases. Para elegir un buen paquete Wavelet útil
en la práctica, se elige una buena forma de adaptación donde se consigue que el conjunto más
adecuado de funciones de base representen una función determinada.
APÉNDICE 10
Bibliografía:
2. Lazar, N.A. (2008). The statistical analysis of functional MRI data. Serie:
Statistics for Biology and Health. Springer Science+Business Media.
5. Friston, K.J. Ashburner, J. Kiebel, S.J. Nichols, T.E. y Penny, W.D. (2007) The
Analysis of Functional Brain Images. Statistical Parametric Mapping.
11. Berger, G. (1985). Statistical Decision Theory and Bayesian Analysis. Springer-
Verlag.
12. Ingo R. Keck, (2007) Ica aplicado a datos de EEG y fMRI. Tesis de la
Universidad de Regensburg, Alemania.
15. Vayá, M.I. Análisis de series temporales mediante ICA. (Biomedical Mining
Group, Universidad Politécnica de Valencia).
22. Radiological Society of North America, Inc. (2010). RMN funcional (RMNf) –
Cerebro. http://www.radiologyinfo.org/sp/info.cfm?pg=fmribrain
25. García, H. y Ramírez, J.F. Método Basado en Redes Neuronales Wavelet para
Eliminar Ruido en Espectros Estelares. Instituto Tecnológico de Apizaco,
Mexico. http://www.lsi.us.es/redmidas/CEDI07/[11].pdf.