Introducción Al Análisis Estadístico de Imágenes de Resonancia Magnética Funcional

INTRODUCCIÓN AL ANÁLISIS ESTADÍSITICO DE IMÁGENES DE RESONANCIA MÁGNETICA FUNCIONAL
INTRODUCCIÓN AL
ANÁLISIS ESTADÍSTICO DE
IMÁGENES DE
RESONANCIA MAGNÉTICA
FUNCIONAL
Línea de investigación realizada por:
Rosa María Espejo Montes
Tutora de la línea de investigación:
María Dolores Ruiz Medina
Facultad de Ciencias – Universidad de Granada
Rosa María Espejo Montes Página 1 de 118

ÍNDICE
1. PRELMINARES SOBRE EL FMRI

PARTE I: Elementos básicos de las FMRI
1.1.1. Las imágenes de resonancia magnética
1.1.2. Relajación
1.1.3. Resonancia magnética para FMRI
1.1.4. Datos de la imagen
PARTE II: Diseño experimental para FMRI.
1.2.1. Cuestiones del diseño de la imagen
1.2.1.1 Descripción de los parámetros
1.2.1.2 ¿Cómo afecta los cambios de resolución y de calidad de imagen a los parámetros?
1.2.1.3. Llenado en el espacio k
1.2.2. Cuestiones estadísticas del diseño
1.2.2.1 Diseño experimentales comunes
1.2.3. Cuestiones adicionales.
PARTE III: Análisis de las fuentes de variación externa.
1.3.1. Fuentes de ruido
1.3.2. Manipular el ambiente del escáner con el tratamiento del ruido
1.3.3 Procesamiento de datos FMRI
1.3.4 Evaluar el Estudio de los Efectos de pre-procesamiento
PARTE IV: Procesamiento de datos FMRI.
1.4.1. Características de los datos
1.4.2. Detección o estimación
1.4.3. Umbralización
1.4.3.1. ¿Es el criterio de derecho un vóxel de activación?
1.4.3.2 Fiabilidad y reproducibilidad de la activación
1.4.4 Múltiples temas
1.4.4.1 Coherencia a través de temas
1.4.5. El análisis regional frente al Whole Brain
1.4.6. Resumen de los retos de estadística
2. ENFOQUES EN EL ANÁLISIS ESTADÍSTICO DE FMRI

2.1. Análisis exploratorio de datos
2.2. Los diseños de bloque
2.3. Diseños relacionados con el Análisis Base
2.3.1 Enfoques paramétricas para la estimación de la función de respuestas hemodinámicas.
2.3.2. Enfoques no paramétricos para la estimación de la función de la respuesta
hemodinámica
2.3.3. Métodos para estimar el retraso de la respuesta hemodinámica
2.4. El modelo lineal general
2.4.1 Aplicación de algunas cuestiones
2.5. Métodos de combinación de materias
2.5.1 La pregunta anatómica
2.5.2. La cuestión estadística
3. ENFOQUES DEL ANÁLISIS ESTADÍSTICO MULTIVARIANTE

3.1 Descripción de los métodos
3.1.1 Análisis de Componentes Principales

3.1.2 Análisis de Componentes Independientes

3.1.3 Análisis de correlación canónica
3.2 Los análisis multivariados
3.2.1 Componentes Principales
3.2.2 Componentes independientes
3.2.3 Correlación canónica
4. PROYECCIÓN EN BASES FUNCIONALES. FUNCIONES WAVELETS

4.1 Wavelets
4.1.1 Creación de mapas de activación con Wavelets
4.1.2 Wavelets para modelado
4.1.3 Muestreo Wavelet
4.1.4 Evaluación de Métodos de Wavelet
4.2 Funciones Base formado por la anatomía y fisiología
5. ANÁLISIS BAYESIANO DE FMRI

5.1. Todos los Modelos Bayes
5.2 Datos a priori en FMRI
5.3. Cálculo
5.4. Conclusión
6. OTROS MÉTODOS DE ANÁLISIS DE FMRI

6.1. Cluster umbrales.
6.2 Teoría de Campos Al Azar.
6.3. Umbrales obtenidos a través de permutación
6.4 Control de la tasa de falsos descubiertos
6.5 Método AD HOC
6.6. Procedimientos basados en series de tiempo FMRI y en HRF
6.7 Otras técnicas
6.8 Evaluación de los métodos
6.9 Otros problemas
6.10 Conclusión.
7. IMPLEMENTACIÓN EN CÓDIGO MATLAB

7.1 Introducción.
7.2 El diseño del modelo estadístico
7.2.1 El modelo de la señal
7.2.2. Modelización del ruido
7.2.3. fMRIdesign
7.3. El análisis de los modelos lineales de una única prueba
7.3.1. Estimación de los parámetros de la señal
7.3.2. Estimación de parámetros del ruido
7.3.3. Blas reducción y regularización de las autocorrrelaciones
7.4 Inferencia para los efectos.
7.5. FMRILM
7.6. La combinación de múltiples pasadas, sesiones o subproyectos
7.6.1 El modelo de efectos aleatorios
7.6.2 Estimación de los parámetros
7.6.3. Regularización de la varianza de efectos aleatorios

7.6.4. Estimación de los grados de libertad

7.6.5. Multistat
7.7. Detección de las regiones activadas
7.8. Una ilustración empírica
8. ALGUNAS REFERENCIAS RECIENTES EN EL ANÁLISIS ESTADÍSTICO

FMRI. TRATAMIENTO DE CASOS PRÁCTICOS.
8.1. Ica aplicado a datos EEG y fMRI.
8.2 Resonancia magnética funcional: Casos clínicos.
8.3 Recordar como habilidad experta: refutación de la hipótesis de los almacenes de memoria.
8.4 Análisis de series temporales mediante ICA.
8.5. Estudio mediante imágenes funcionales de resonancia magnética de ls actividades emotivas
correlacionadas a la presentación de rostros extraños o del propio rostro en sujetos con personalidad inward y
outward.
8.6. Adquisición de imágenes de resonancia magnética funcional en cerebros de rata.
8.7 Aplicaciones Open Source en el ámbito de la Salud y Sanidad.
8.8. Análisis Estadístico de imágenes de resonancia magnética funcional.
8.9. Un estudio fMRI de circuitos frontoestriatales durante la inhibición del parpadeo en personas
con Sindrome de Towrette.
APÉNDICE
A.1 La transformada de Fourier discreta
A.2 El sistema de Haar
A.3. Bases de Wavelets regulares
A.4 Wavelet de descomposición y la Reconstrucción
A.5 Los Conceptos de representación con filtro
A.6 Localización de frecuencia
A.7 Los ejemplos de Wavelet y sus construcciones
A.8 Wavelet Dos-Dimensiones
A.9 Paquetes Wavelet
A.10 Traducción Invariante Wavelet Smoothing

Capítulo 1
PRELIMINARES SOBRE EL FMRI
(Imagen por resonancia magnética funcional)
La imagen por resonancia magnética funcional (FMRI) es un procedimiento clínico y de

investigación que muestra en imágenes las regiones cerebrales que ejecutan una tarea determinada. El
procedimiento se realiza en el mismo resonador utilizado para los exámenes de diagnóstico, pero con
modificaciones del software y del hardware.
PARTE I: Elementos básicos de las FMRI

1.1 Las imágenes de resonancia magnética
La frecuencia de resonancia: es una técnica que utiliza el fenómeno de la resonancia magnética para
obtener información sobre la estructura y composición del cuerpo a analizar. Esta información se procesa por
ordenador y transforma en imágenes lo que se ha analizado.
Los equipos de imagen de resonancia magnética (IRM) son máquinas de gran precisión que obtienen
información sobre la distribución de los átomos en el cuerpo humano utilizando el fenómeno de resonancia
magnética (RM).
El elemento principal del equipo es un imán que genera un campo magnético constante de gran
intensidad. Este campo alinea los momentos magnéticos de los núcleos atómicos en dos direcciones:
Paralela o de baja energía: Los vectores apuntan en la misma dirección.
Anti-paralela o de alta energía: Los vectores apuntan en direcciones opuestas.
La frecuencia de resonancia de los núcleos está determinada por:
La intensidad del campo
El momento magnético del núcleo
También se determina la proporción de núcleos que se encuentran en cada uno de los estados. Esta proporción
está gobernada por las leyes de la estadística de Maxwell-Boltzmann. La gran cantidad de núcleos presentes en
un pequeño volumen hace que esta pequeña diferencia estadística sea detectada.
Debido al estado de los núcleos, algunos de los que se encuentran en el estado de baja energía
cambian al estado de alta energía y en un corto periodo de tiempo, remitiendo energía.
El imán principal genera una señal que ocasiona una RM, la cual se detecta, y tiene el mismo valor
en todas las partes del cuerpo, no existiendo así información de dónde se produce la resonancia.
Para resolver este problema se añaden las llamadas bobinas de gradiente. Donde cada bobina genera
un campo magnético con cierta intensidad que se controla con una frecuencia. Estos campos magnéticos
alteran el campo magnético presente y por ello, la frecuencia de resonancia de los núcleos.
Utilizando tres bobinas ortogonales se asigna a cada región del espacio una frecuencia de resonancia
diferente, que cuando produce resonancia en una frecuencia determinada se puede determinar la región del
espacio de la que proviene. Para ello se utilizan diferentes frecuencias para las bobinas, quedando la

información codificada en espacio de fase. Esta información se transformada en posiciones espaciales

utilizando la transformada de Fourier discreta.
La RM tiene cierta ventaja en los procesos de absorción y reemisión de energía si aplica pulsos de
radiofrecuencia de manera adecuada, e identifica de forma única el lugar del espacio que se está visualizado.
Esto se consigue con pequeñas perturbaciones en el campo magnético.
Se selecciona una porción del cerebro y se aplica un gradiente de magnitud Gz en z, a este segmento
se le denomina Z1. Todos los protones están afectados por el gradiente en el segmento a la misma velocidad, y
coinciden con la frecuencia de oscilación del pulso de radio frecuencia. Los núcleos son demasiado rápidos o
demasiado lentos, y no absorben la energía de radio frecuencia.
Para ello se utiliza el plano transversal, donde se elige el tramo que hay que codificar en (x, y), y se
aplica un gradiente en x, y en y. Un gradiente en la codificación del campo Gy aumenta a medida que se
avanza en la fila inferior de la matriz. Una frecuencia de codificación de gradiente Gx, aumenta al avanzar de
izquierda a derecha en la columna de la matriz. La matriz se define por el segmento, y cada elemento se
distingue porque en cada lugar hay una fase y frecuencia distinta.
La localización en el campo considera una versión ampliada de la base de Larmor:
Wi = γ ( B0 + G ⋅ ri )
Siendo:
Wi la frecuencia del protón en la posición ri.
G un vector que resume la amplitud y dirección del gradiente.
1.2 Relajación
La relajación describe la evolución de la magnetización en tres direcciones distintas.
1.-Tiempo de relajación longitudinal T1: la componente del vector de magnetización M es paralela al campo
magnético principal B0 denominado magnetización longitudinal (Mz). El proceso se recupera mediante la
magnetización original M0 se denomina relajación longitudinal y posee una constante de tiempo T1.
(
M z (t ) = M z (0) ⋅ 1 − e −t /T1 )
2.-Tiempo de relajación transversal T2: la componente del
vector de magnetización M que es perpendicular al campo magnético principal B0 se denomina magnetización
transversal (Mxy). El proceso mediante el cual decae hasta prácticamente cero se denomina relajación
transversal y posee una constante de tiempo T2.
M xy ( t ) = M xy ( t ) ⋅ e− t/ T2
Si τ 2 <τ1 la pérdida de coherencia de fase ocurre antes de alcanzar el equilibrio.

*
3.- Tiempo de relajación del decaimiento de inducción libre (FID) T :Cuando 2 el pulso de
radiofrecuencia está desactivado, la estructura comienza a desaparecer.
En sistemas reales, se producen transferencias de spin entre los núcleos observados y el medio de
estudio. Esto permite la producción de transiciones prohibidas y transiciones de relajación desde un estado
excitado a uno de equilibrio (normal). También existe la transferencia de spin entre núcleos excitados para
dispersar la magnetización que no se encuentra en equilibrio

T1 es la componente de relajación que ocurre en la dirección del campo magnético ambiente.. T1 se

denomina la relajación de la red de spin. Este es el tiempo requerido para que el vector de magnetización M
recupere un valor igual al 63% de magnitud inicial. Su valor varía según la densidad de campo magnético B.
T2 es la verdadera componente de relajación hacia las condiciones de equilibrio, perpendicular al
campo magnético ambiente. Por ello, la relajación está dominada por interacciones entre los núcleos spinning
excitados. T2 se denomina relajación transversal o spin-spin. Este proceso sigue un decaimiento exponencial
y define el tiempo requerido para la magnetización transversal el vector que alcanza el 37% de la magnitud
original después de su excitación inicial.
A diferencia de T1, T2 es menos susceptible a variaciones en la intensidad del campo B.
1.3 Resonancia magnética para FMRI

Cuando el cerebro se activa como respuesta a un determinado estímulo, aumentan el flujo sanguíneo
de las regiones que participan en dicha acción. Al mismo tiempo las neuronas activas requieren más oxígeno
que las neuronas inactivas, por tanto hay un aumento en los niveles de oxígeno.
Los cambios en la proporción de sangre oxigenada a desoxigenada se miden a través de la respuesta
hemodinámica, su estimación y caracterización constituyen el principal objetivo de la investigación FMRI.
Si no hay estimulación, la función de respuesta hemodinámica (HRF) comienza a decaer lentamente, hasta
volver al nivel base. Si decae por debajo de ese nivel se observa antes de la recuperación completa.
Las propiedades magnéticas son diferentes para la sangre oxigenada y desoxigenada. El nivel de
oxigeno en la sangre (BOLD) afecta a la señal de resonancia magnética medida.
La susceptibilidad magnética es una medida de la intensidad de la magnetización de una sustancia
cuando se coloca en un campo magnético externo. El efecto de esta introducción es la decadencia de la
magnetización transversal, relacionada con τ 2 y τ 2 .

*
Si la fuerza del campo magnético aumenta, también lo hace BOLD. En los campos bajos, no hay
diferencia en los tiempos de relajación transversal de la sangre oxigenada y desoxigenada.
El primer nivel de oxigenación sanguínea depende del experimento de contraste, donde se demuestra
que después de la desoxigenación de la sangre, la susceptibilidad magnética de los vasos sanguíneos se
incrementa. El efecto de esto es doble:
Primero: los gradientes del campo local se generan.
Segundo: El tejido T*2 disminuye alrededor de los vasos sanguíneos.
Este cambio se estudia en BOLD-FMRI y es el tipo más común de la FMRI. El experimento de contraste
consigue que la sangre oxigenada que está en las proximidades de la neurona cambien y no se vean afectadas
por la señal de resonancia magnética
1.4 Datos de la imagen

Los datos que se recogen en el espacio de Fourier, son conocidos en el espacio k de FMRI. En
general, el análisis estadístico se realiza en el espacio de la imagen, aunque se hace un pre-procesamiento en
el espacio k.
La ecuación de Larmor define la relación entre la frecuencia de Larmor y la fuerza del campo
magnético. La frecuencia de Larmor del momento magnético es directamente proporcional a la fuerza del
campo magnético.

La frecuencia de Larmor es la frecuencia a la que la RM de un núcleo puede excitarse y detectarse.

Varía según la fuerza del campo magnético y dentro de la escala de RF.
La ecuación de Larmor para (x, y) es:
W ( x, y ) = γ B0 + γ Gx x + γ G y y
Siendo:
• El eje y corresponde a la fase de codificación.
• El eje x a la codificación de frecuencia.
• Bo: campo magnético estático.
• G: es un vector que resume la amplitud y la dirección de información del gradiente.
• Wi: es la frecuencia del protón en la posición de ri.
• γ: Gradiente
La señal obtenida en la fase de gradiente de codificación se coloca en el centro del espacio k. A medida
que se avanza en el eje y, la fase de codificación del gradiente aumenta. Cuando se aplican los gradientes Gx
se muestra una fila en el espacio k para una etapa determinada.
Este proceso se repite para cada fase, hasta completar una matriz de datos del espacio k. Los valores de
esta matriz son los cambios producidos en la frecuencia y en la fase del segmento elegido.
La densidad de núcleos de hidrógeno define la señal inducida en el receptor del sistema con un
vector de magnitud ρ ( x, y ) siendo el tamaño de la unidad elemental ( dx dy ) y la fase se denota por

ϕ ( x, y, t ) = 2π w ( x, y ) T . La contribución de una posición en particular a la señal es:
{ }
ρ ( x, y ) cos  2π ( γ B0 + γ Gx x + γ G y y ) t  + i sin  2π ( γ B0 + γ Gx x + γ G y y ) t  dxdy
Siendo:
• El coseno la parte verdadera, o contribución a lo largo del eje x.
• El seno es la parte imaginaria o contribución a lo largo del eje y.
Cuando se recibe la señal, hay un modelo adicional que permite ignorar al campo estático Bo y por tanto la
señal que se almacena por el escáner en el tiempo t es:
{ }
I (t ) = ∫ ∫ ρ ( x, y ) cos  2π ( γ B0 + γ Gx x + γ G y y ) t  + i sin  2π ( γ B0 + γ Gx x + γ G y y ) t  dxdy
El centro del espacio k contiene la señal más fuerte y si se avanza hacia la periferia en cualquier
dirección, la señal se debilita. Esta señal en el centro del espacio elimina el resto de la señal grabada de tal
forma que en la transformada de Fourier de una imagen aparece la silueta del cerebro. La información sobre
los detalles finos de la imagen están contenidos en los bordes del espacio k, y esto se traduce en imágenes
borrosas reconstruidas del cerebro.
PARTE II: DISEÑO EXPERIMENTAL PARA FMRI

1.2.1. Cuestiones del diseño de la imagen
1.2.1.1. Descripción de los parámetros
Los parámetros se adquieren en uno de los cuatro planos de la imagen:
• Los cortes axiales son perpendiculares al eje longitudinal del cuerpo.

• La coronal o frontal son rebanadas paralelas a la parte frontal del cuerpo.

• Las cortes sagitales se obtienen en paralelo a la línea media del cuerpo.
• Un tramo oblicuo esr la inclinación de cualquiera de los tres puntos de vista estándar.
Definición de los parámetros:

Adquisición: proceso de medir y almacenar los datos de la imagen.
B ó Bo: símbolo convencional para el campo magnético de radiofrecuencia
Brecha de corte, es el espacio entre cortes consecutivos. Se tiene que dejar un espacio entre cortes,
porque los pulsos de radiofrecuencia son imperfectos y existen interferencias entre cortes si no existe un vacío
intermedio.
Bobina: bobina o antena colocada dentro de la abertura central del imán para detectar la señal RM.
También se emplea para la excitación.
Bobina de superficie: bobina de RF, diseñada para mejorar la resolución de la imagen, limitando la
extensión espacial de la excitación o detección.
Campo de visión (FOV): es el tamaño físico de la imagen, es decir, la región específica que muestra la
imagen.
Cohesión o coherencia: mantiene una relación constante de las fases entre los objetos giratorios.
Excitación: transferencia de energía al sistema de spin, si los núcleos están en un estado de energía
superior.
Fenómeno de decaimiento de inducción libre (FID): es la señal recibida en el tiempo t=0 .

Gauss: es la unidad de la fuerza del campo magnético.
Giro o spin: propiedad de los núcleos con un número impar de protones y/o neutrones.
Núcleo: componente con carga positiva de un átomo, que consiste en protones y neutrones.
Parámetros extrínsecos son los parámetros de la recogida de datos.
Precesión: giro del eje de rotación de un cuerpo en movimiento giratorio en torno a la línea direccional
de una fuerza aplicada, si el movimiento se describe como un cono.
Pulso de radiofrecuencia: radiación electromagnética por debajo de la infrarroja.
Relajación longitudinal: regreso a la magnetización longitudinal después de la excitación mediante el
intercambio de energía entre el spin de los núcleos y el medio.
Resonancia: intercambio de energía entre dos sistemas a una determinada frecuencia en particular.
Resonancia magnética: absorción o emisión de energía electromagnética por los núcleos de un campo
magnético (estático) después de su excitación mediante una radiación apropiada (RF). La frecuencia de
resonancia se obtiene por la ecuación de Larmor.
Tamaño de la matriz de adquisición es el tamaño de la cuadrícula que divide el campo de visión para
cada sector. El campo de visión y el tamaño de la matriz de adquisición determinan las dos dimensiones de un
vóxel en el plano.
Tiempo de adquisición (TA): período necesario para compilar los datos de la imagen, sin contar con el
tiempo de reconstrucción.
Tiempo de eco (TE): periodo entre el pulso de 90º y el próximo pulso.
Tiempo de repetición (TR): período entre el comienzo de una secuencia de impulsos y el comienzo de
la secuencia siguiente.

Transformada de Fourier: proceso matemático para determinar la intensidad y la fase de los distintos
componentes de las frecuencias en una señal que varía en tiempo (o en espacio).
Vóxel: es la unidad cúbica que compone un objeto tridimensional. Constituye la unidad mínima
procesable de una matriz tridimensional. Para crear una imagen en tres dimensiones, los vóxeles sufren una
transformación de opacidad. Esto es importante cuando se muestran detalles interiores de una imagen que
quedaría tapada por la capa exterior más opaca de los vóxeles.
En el TR si el pulso se apaga la magnetización en el plano transversal comienza a decaer, con una

recuperación simultánea de la magnetización en la dirección z.
En el momento t = T, se aplica el siguiente pulso M z (TR ) = M 0 1 − e ( −TR /T1

)
Al aplicar el segundo pulso en el tiempo t=2TR, la recuperación no puede ser completa. Cada pulso
sucesivo en el sistema se inicia con menos magnetización total. A medida que aumenta TR, la energía de
radiofrecuencia tiende a disiparse, acercándose a la magnetización inicial al comienzo de cada pulso.
Después de tiempos de repetición sucesivos (TRS) la señal sigue siendo un fenómeno de decaimiento
de inducción libre se mide la señal inmediatamente después del pulso de radio frecuencia.
El tiempo eco desintegra el fenómeno de decaimiento de inducción libre en el plano transversal con
−t
T 2*
rapidez T*2 de acuerdo a la función exponencial e . Al tomar la medida antes de la desintegración, la
señal medida es la magnetización inicial. Después de un tiempo eco la señal es ligeramente más pequeña.
Si los procesos de relajación T1 y T2 ocurren simultáneamente, entonces la señal es proporcional a
M 0 (1 − e −TR /T1 ) e −TE /T2 .

*
Se puede cambiar la señal de resonancia magnética al modificar el tiempo de repetición y el tiempo

eco. En términos generales, el tiempo de repetición está relacionado con T1, y el tiempo eco con los efectos
T*2 (o T2).
1.2.1.2 ¿Cómo afecta los cambios de resolución y de calidad de imagen a los parámetros?
Al manipular el TR y el TE se introduce un efecto directo sobre ellos. En un contraste entre dos tipos
de tejidos diferentes, se definen A y B, con distintos valores de τ1 y τ 2* . El contraste entre estos dos tejidos
está dado por:
cAB = M0 A (1− e−TR/T1A ) e−TE/T2 A − M0B (1− e−TR/T1B ) e−TE/T2 B

* *
- Si T1 A > T1B el tejido A tiene mayor tiempo de recuperación que el tejido B.
- Si t = 0, la curvas están muy juntas, no hay señal de los tejidos, y por tanto C AB = 0.
- Si t tiende a infinito, las curvas están muy juntas, y se reduce el efecto de T1.
Estos parámetros se utilizan para imágenes de diferentes pesos, que se ponderan por el resultado de un
experimento con tiempos de recuperación intermedios y TE pequeños.
En FMRI, la señal de proporción de ruido SNR es proporcional al producto del volumen de un vóxel:
N y NEX BW

Siendo:
• Ny el número de fase que codifica los pasos.
• NEX es el número de excitaciones.
• BW es el ancho de banda W.
Al aumentar el número de excitaciones, aumenta también la señal de proporción de ruido, aunque el aumento
no es lineal, porque sigue una ley de raíz cuadrada. Con un mayor ancho de banda:
o Se aumenta el ruido
o Se disminuye la señal de proporción de ruido.
La señal de proporción de ruido depende del:
o El volumen de un vóxel individual.
o El tiempo total de las señales.
Entonces se obtiene la señal de de ruido que es proporcional a:
( FOVX / N X )( FOVY ) ∆Z NEX / NY BW

Así se demuestra la relación entre la resolución de la imagen y la relación señal/ruido.
• Al aumentar el número de pasos en la codificación, disminuye la señal de ruido.
• Al aumentar el campo de visión, aumenta la señal de ruido.
• Al aumentar el grosor del corte aumenta la relación señal/ruido, pero disminuye la resolución.
1.2.1.3 Llenado en el espacio k

El diseño FMRI adquiere secuencias del pulso mediante dos tipos de datos para FMRI:
o Eco planos (EPI)
o Las imágenes espirales.
Los eco planos son el movimiento de gradientes a través del espacio k, es la técnica de resonancia
magnética de imágenes más rápida, ya que un solo eco plano llena todos los espacios k después de un solo
pulso de radio frecuencia.
El programa ampliado de inmunización blip, es una fase del gradiente de codificación en el primer eco
del borde del espacio k. En ese eco plano, la fase de gradiente de codificación se activa cuando el gradiente es
cero.
Una ventaja de los ecos planos blip, es que el gradiente de la fase se codifica de forma continua, y la
trayectoria resultante a través del espacio k es rectilínea. Esto facilita la transformada de Fourier para obtener
una imagen.
Todos los espacios se llenan después de un pulso de radio frecuencia, por eso los datos se adquieren
rápidamente, antes de la decadencia de T2 y de T*2.
Los datos EPI manifiestan los cambios en las interfaces entre el seno y el tejido cerebral. El tiempo del
eco plano da lugar a distorsiones geométricas, como la rotura de la distorsión en el plano (x, y).
Las imágenes en espiral, es una técnica de adquisición de imágenes. Estas imágenes difieren de EPI en
la utilización de gradientes para recorrer el espacio. Las imágenes en espiral utilizan gradientes sinusoidales
que inducen a un camino en espiral a través del espacio K.
Las imágenes en espiral induce menos presión sobre el gradiente, ya que las muestras continuas del
espacio k, no cambian con la ida y vuelta como EPI. Entonces, la imagen en espiral es más rápida que un eco

plano, porque una desventaja de adquirir datos en espiral es no poder aplicar la transformada de Fourier,
porque los datos se obtienen antes de reconstruir la imagen.
1.2.2. Cuestiones estadísticas del diseño

1.2.2.1 Diseño experimentales comunes
Existen dos enfoques para el diseño de experimentos de resonancia magnética funcional, según la
presentación del estímulo.
1) El diseño de bloques: Es la forma tradicional de diseñar un experimento.
2) los potenciales relacionados o ERP: son los eventos relacionados con el diseño del estudio
de la neurología funcional.
Según la limitación de resolución, los experimentos FMRI utilizan diseños simples de bloques, donde
se alternan períodos de descanso, con períodos de trabajo.
Los diseños vagón utilizan el diseño de bloques realizado en la presentación de los estímulos que tienen
lugar en bloques de longitud fija.
Los diseños de bloque son de gran alcance para la localización de vóxeles cuando el nivel de actividad
es diferente en la tarea frente a las condiciones de control. En un diseño de bloques el estímulo no es
constante para la duración de los bloques de tareas, lo que significa que la respuesta hemodinámica no vuelve
a la línea base durante este tiempo. Solo vuelve a la desintegración de referencia cuando se desactiva la
presentación del estímulo, durante los bloques de control.
Se comparan tres líneas base:
1) La línea base de descanso. El sujeto se encuentra en el escáner pero no presenta ningún
estímulo. (Es la condición de control por defecto).
2) La línea base pasiva. Los estímulos se presentan al igual que en la condición de tarea, pero
los sujetos no son incluidos para su procesamiento.
3) La tarea de referencia presenta una tarea bien definida.
Las tres líneas bases son las condiciones de reposo, escucha pasiva, y tonos de seguimiento, donde se
le presenta a los sujetos presentan un triplete de tonos y se juzga si el tono final es un tono elevado. En
general, se detecta una mayor activación en el estado de descanso y una menor activación en línea base
pasiva.
El diseño relacionado es la única prueba de resonancia magnética funcional, que aleja el bloque en las
condiciones experimentales. Estos estímulos, presentan un intervalo separado de interestímulos (ISI), que se
fija dentro de un experimento.
La presentación del estímulo depende de:
o La respuesta del sujeto: una respuesta correcta lleva a una cuestión más difícil en la siguiente
prueba.
o Los estudios pueden ser a su propio ritmo cuando el sujeto controla si se presentan los
estímulos.
o La respuesta puede ser al azar.
El diseño de estudios relacionados ISI puede ser fijo o aleatorio. Los estudios con ISI constante permite
desarrollar la respuesta hemodinámica.

La percepción de la aleatoriedad del diseño: es un factor adicional incluido en el modelo. Los diseños
de bloque tienen un alto grado de aleatoriedad porque alternan entre dos condiciones, abriendo así la
posibilidad de que los sujetos se adelanten a los estímulos, con la confusión en los efectos de interés.
El tiempo es el coste de conseguir un equilibrio entre los dos extremos del diseño semi aleatorio.
El diseño sem- aleatorio es la probabilidad de estar en la condición de tarea que cambia con el tiempo.
1.2.3. Cuestiones adicionales.

El diseño de bloques de experimentos de la FMRI adquieren datos dentro de bloques e identifica la
activación pero no el resultado de la tarea.
1) El estímulo se presenta al inicio de un TR produciendo un sesgo. Esto ocurre al cambiar la duración
de la condición fija en un estudio del diseño de bloques, lo cual afecta a la relación entre la presentación del
estímulo y el TR, porque la presentación del estímulo se traslada al inicio del TR. Así se demuestra que los
tamaños del efecto son mayores en la condición de no cambiar donde el estímulo se desvincula del TR.
2) La activación transitoria en el diseño de bloques se encuentra en el conjunto de regiones activas en
la transición entre bloques.
El diseño de la prueba eficaz y óptima se utiliza en estudios relacionados con el evento. Buscar un
diseño óptimo consiste en una exploración del espacio de la configuración experimental. La secuencia es la
condición de presentar el estímulo en cada momento.
La estimación eficiente de la curva de respuesta hemodinámica se usa en el diseño de la reducción
de tiempo de exploración sin pérdida de señal. Escogiendo una secuencia de eventos relacionados con los
ensayos de forma arbitraria, eligiendo la que tenga mejor estimación de eficiencia. No hay ninguna garantía
de que la mejor secuencia entre un conjunto de secuencias generadas aleatoriamente sea óptima. Por ello se
utiliza el cambio longitudinal de las secuencias de los registros, para encontrar las secuencias del estímulo con
un coste pequeño.
Para identificar la secuencia específica que se utiliza en el estudio del evento M, se considera la
fórmula
r
sk = ∑ ci sk − r +i −1
i =1
Siendo:
ci los que establecen los coeficientes.
•
• SK es el siguiente valor en la secuencia
• r es el orden de los turnos.
La base de estímulos de la generación de eventos relacionados con los diseños a través de m-
secuencias son los resultados, en la estimación, de los diseños generados aleatoriamente, especialmente
durante los períodos más cortos de secuencia. Así las m-secuencias están cerca de obtener el límite teórico
superior de la estimación de la eficiencia y tienen baja previsibilidad y un poder de detección bajo. El
problema de estas secuencias es que no hay flexibilidad en el diseño, ya que se restringe la longitud y el tipo
de secuencia permitido aunque la clase de secuencia aceptable es grande.
Se propone el uso de un algoritmo genético para realizar la búsqueda en el espacio de diseño. Los
algoritmos genéticos comienzan con un conjunto inicial de diseños y desarrollan nuevos diseños a través de
tres pasos:

o La selección de los diseños es similar a la selección natural seleccionando los mejores, y

creando descendientes de ellos. Transmitiendo las mejores características de los diseños.
o Los patrones de cruce intercambian el material, o las secuencias a partir de una letra elegida
al azar.
o La mutación de un elemento del diseño es alzar.
Estos procesos se repiten hasta que un modelo adecuado es identificable.
PARTE III: ANÁLISIS DE LAS FUENTES DE VARIACIÓN

EXTERNA
1.3.1. Fuentes de ruido
En el escáner, el sujeto debe estar completamente inmóvil. Si se mueve crea una confusión en la señal
denominada ruido. La fuente más importante de ruido en los datos FMRI es el movimiento de cabeza.
Existen diferentes tipos de ruido en las FMRI como son:
El ruido relacionado con los sujetos experimentales.
El ruido térmico es la parte interna de la resonancia magnética, donde se reflejan los cambios de los
electrones en el tejido de la muestra y de las componentes electrónicas del escáner. Este ruido aumenta con la
fuerza del campo magnético principal.
El ruido del sistema lo causa la no homogeneidad del campo magnético y la falta de estabilidad en el
campo gradiente. El ruido se de manera gradual en la señal, mientras que en el transcurso del experimento se
da de manera gradual la intensidad de la señal en un vóxel y los cambios son sistemáticos.
El ruido térmico y el ruido del sistema son esenciales incluso si el objeto estudiado es el llamado
fantasma inerte. Además estos ruidos están relacionados con las propiedades del escáner.
El ruido fisiológico es el ruido inducido por la respiración y el latido del corazón. La respiración
conduce un mayor volumen de sangre dentro del cráneo, esto hace que se expanda provocando cambios
sistemáticos en el campo magnético, los cuales afectan directamente a la señal de resonancia magnética.
El ruido acústico se produce por cuatro fuentes en el entorno de la resonancia magnética. Estas son:
o Las corrientes de gradiente
o Los pulsos de radiofrecuencia
o La selección del corte
o Ruido de fondo de aire acondicionado y la ventilación.
La fuente de ruido más importante es la corriente del gradiente. El gradiente aumenta el ruido acústico
con la fuerza del campo magnético principal. Además el efecto del ruido acústico puede ser directo o
indirecto.
Los efectos directos confunden la tarea experimental usando estímulos auditivos.
1.3.2. Manipular el ambiente del escáner con el tratamiento del ruido

Existen dos enfoques principales para manejar el ruido en los datos de la FMRI
1) Evitar el ruido mediante la manipulación adecuada del ambiente. Aunque no todo sea ruido.
2) Estimación y grabación de las distintas fuentes de ruido de la señal.
Controlar el ruido y las tareas son los objetivos principales cuando se manipula el ambiente del escanear.

El ruido acústico se reduce ajustando la fecha de adquisición de la imagen, usando secuencias de pulsos
que generan menos ruido.
o La reducción pasiva del ruido: es reducir el ruido a través de dispositivos que amortiguan el
sonido.
o La reducción activa del ruido: es eliminar el ruido a través de la aplicación del inverso del
ruido original.
1.3.3 Procesamiento de datos FMRI

No se puede eliminar todo el ruido de una imagen aunque se controle el ambiente. Por ello se realiza un
pre-procesamiento de los datos, antes del análisis estadístico.
El programa de inmunización a través de la trayectoria del espacio k cambia de dirección en las líneas
alternativas para los procedimientos que están en la misma dirección. En este caso, se alinean los datos
correctamente para corregir posibles pérdidas en los gradientes.
Si no se reajustan las líneas aparecen en la imagen reconstruida los fantasmas, que son el paso de
imágenes del cerebro que aparecen en el aire fuera de la cabeza. Estos fantasmas eliminan el momento de la
reversión de la línea en el espacio de la imagen.
En la mayoría de los análisis, los datos componen distintas muestras en cada vóxel en el mismo tiempo.
Pero cuando los cortes se adquieren de forma secuencial, hay un retraso en el movimiento, por tanto se toman
muestras de diferentes vóxeles en distintos intervalos de tiempo.
La corrección mejora el número medio de vóxeles activos detectados en el análisis estadístico
posterior y es una parte del pre-procesamiento ajustada al escáner. Para ello se aplica la corrección de la
media y el algoritmo de eliminar la tendencia.
La función spline en un conjunto de términos que aumentan el número de vóxeles activos detectados.
El algoritmo automatizado escoge el procedimiento más adecuado en cada vóxel, encontrando los
vóxeles que no benefician la eliminación de la tendencia.
Las translaciones y rotaciones se estiman para minimizar la distancia entre el escáner y el objetivo.
Esto se hace para dos dimensiones o tres, usando una gran variedad de procedimientos de optimización y
medidas de distancia diferentes. Estas medidas son los mínimos cuadrados y la mínima diferencia absoluta
entre la imagen y el objetivo, obteniendo así los valores de la translación y la rotación que minimiza la
distancia entre la imagen y el objetivo.
La estimación de la translación y los parámetros de rotación se utilizan en la corrección para
desplazar la imagen hacia el objetivo, mediante los esquemas de interpolación de polinomios de diferentes
órdenes e interpolación lineal.
La interpolación de Fourier realiza la corrección del movimiento de los datos en el espacio k, sin
interpolación.
o Se consiguen las translaciones en el espacio k.
o No se consiguen las rotaciones, ni en el espacio k, ni en el espacio de la imagen.
Para pasar la matriz de dos dimensiones a tres, se desarrollo un algoritmo para la rotación de
imágenes.
Se utiliza el método del descenso, el método distancia de mínimos cuadrados y el método de
descenso de gradientes para estimar y corregir imágenes.

El enfoque se utiliza para adquirir imágenes y determinar si hay translación o rotación del cerebro en el
espacio de tres dimensiones, determinar en qué medida. Esta translación y rotación se utiliza para
modificar los parámetros de adquisición de imágenes para compensar el movimiento que haya ocurrido.
Las medidas de calidad definen la imagen y calculan el espacio k de los datos, porque el sistema no
proporciona imágenes para la reconstrucción de las medidas de calidad en tiempo real.
Cuando el sujeto no se mueve se utiliza la distancia de mínimos cuadrados y se estiman los parámetros
de movimiento que introducen sesgo debido a que las zonas de activación se tratan como valores extremos.
Para evitar este problema se usa la medida de la distancia más robusta.
Corrección de Ruido fisiológicos

La estimación del ruido fisiológico se realiza en los datos espaciales. La actividad fisiológica controla
los datos funcionales absorbidos, esto permite que los datos se sincronicen y faciliten el pre-procesamiento.
1) Los datos espaciales se sincronizan con el movimiento fisiológico, para determinar cada punto del
muestreo del ciclo respiratorio.
2) El modelo se estima en una serie de Fourier truncada de orden bajo, donde se refleja la suavidad en
las variaciones dentro de un ciclo fisiológico.
A partir de la estimación se eliminan los efectos de la fase y la magnitud de los datos medidos.
La corrección del ruido fisiológico reduce las desviaciones estándar en cada vóxel y aumenta la
detección de las activaciones de bajo nivel al reducir la variabilidad del vóxel. Los efectos fisiológicos no
están relacionados con la activación.
La relación señal/ruido proporciona un ajuste equivocado del modelo de la serie de Fourier. Para
corregir el ruido fisiológico se usa la estimación de los efectos fisiológicos en los cambios de la magnitud
donde la fluctuación muestra los vóxeles fisiológicos.
La corrección fisiológica tiene dos consideraciones fundamentales como son:
- Calcular la relación entre los datos fisiológicos y los datos FMRI.
- El efecto fisiológico de la señal tiene lugar después de cierto retraso.
Se calcula la correlación en el retraso con un modelo simple. Determinándose así el desfase en el que
los datos fisiológicos son altamente correlacionados con los datos FMRI.
El tiempo de retraso es la correlación entre el corazón y los datos FMRI, y:
o Las correlaciones son cíclicas, con período igual al tiempo de repetición.
o La correlación más fuerte se produce entre la respiración y la señal que ocurre sin ningún
retraso.
Todo esto se tiene en cuenta para eliminar el ruido fisiológico.
En un modelo de regresión simple las variables independientes introducen efectos de la respiración
cardiaca y la fase del espacio k de las variables dependientes. Para ello se ajusta un modelo al desfase del
espacio k, que refleje los efectos del ritmo cardíaco y de la respiración. Los residuos de estos modelos lo dan
los datos FMRI corregidos de los diversos efectos fisiológicos.
Aunque no se elimina el ruido específico de muchos grupos se suaviza la parte del pre-procesamiento
de los datos FMRI. Para suavizar los datos, el método más común es el filtro de Gauss a través de una medida

llamada media de ancho máxima total (FWHM). Para una distribución Gauss, se define la media del ancho
máximo total como
2 2 log 2σ ≈ 2.36σ
Hay dos razones en FMRI para suavizar la relación.
1. El filtro suaviza la relación señal/ruido, al difuminar la señal medida en vóxeles vecinos. Si el
tamaño del filtro es pequeño, la señal de interés no se ve afectada negativamente.
2. Se suaviza la función filtro para mejorar la calidad de los datos en el análisis estadístico.
El problema de suavizar es que el tamaño del filtro no es el adecuado, o demasiado grande o
demasiado pequeño, y perjudica el análisis estadístico.
o Si es demasiado grande, la mayor región en la que la actividad se lleva a cabo suaviza la
activación y por no se detecta.
o Si es demasiado pequeño, la relación señal/ruido no se mejora, y degrada la resolución espacial.
El filtrado cambia la naturaleza de la correlación espacial entre vóxeles. Por esto, no todos los grupos
forman parte del pre-procesamiento.
Evaluar el estudio de los efectos de pre-procesamiento

El paradigma de la predicción no paramétrica: evalúa los efectos del pre-procesamiento: la activación,
la influencia y la reproducibilidad (NPAIRS).
El paradigma no paramétrico utiliza la validación de información cruzada, dividiendo el conjunto de
datos FMRI en dos partes iguales, una mitad se destina a la estimación de los parámetros en un modelo, que
luego se utilizan en la predicción en la segunda mitad.
La reproducibilidad compara el resultado final del análisis estadístico con los conjuntos de formación.
Para evaluar el valor añadido en cada nivel del procesamiento se necesita en un análisis estadístico de la
exactitud de la predicción y la reproducibilidad de cada procesamiento.
En la predicción no paramétrica se utiliza la corriente óptima del pre-procesamiento para determinar
qué medidas del pre-procesamiento se llevan a cabo y en que medida se decide cada tema por separado. Por
tanto, las corrientes de transformación individual son una ventaja para aplicar el pre-procesamiento en todos
los sujetos del estudio.
Se evalúa la eficacia de las medidas de pre-procesamiento, ampliando el análisis de varianza
(ANOVA) al análisis de la varianza visual, (VANOVA). Este análisis de la varianza visual ofrece la
variabilidad del conjunto de datos FMRI después de cada paso del pre-procesamiento de modo que el efecto
se puede aislar y entender.
PARTE IV: PROCESAMIENTO DE DATOS FMRI

1.4.1. Características de los datos
Los datos adquiridos por los distintos procedimientos se caracterizan porque son:
o Abundantes.
o Ruidosos.
Están altamente correlacionados, tanto:
o Espacial.
o Temporalmente.

A lo largo del tiempo los datos medidos en la señal de resonancia magnética evolucionan en cada
vóxel del cerebro. Existen diferentes fuentes de ruido en los datos FMRI. La señal de interés es una parte de lo
que se mide en el escáner de resonancia magnética y el cambio es similar a pequeñas escalas. Incluso después
del pre-procesamiento, existe variabilidad en los datos.
Hay correlación si se da la señal en el:
o Tiempo
o Espacio.
• La correlación temporal surge porque los estímulos se presentan de forma
continua o periódica, y la reacción a un estímulo en el tiempo t se ve afectada por el
estímulo en el tiempo t-1.
• La correlación espacial se produce por todos los vóxeles del cerebro de una
persona. La correlación se basa en un concepto de distancia más complejo, no en la simple
distancia física.
• Para comprender mejor el ruido FMRI se puede realizar un estudio con diferentes e
sujetos examinados, siendo la hipótesis nula del análisis estadístico el nivel de oxigeno en la
sangre. Los sujetos se escanearon en dos centros diferentes.
Primer escáner: Los datos se obtienen mediante eco planos.
Segundo escáner: Los datos se adquieren mediante una secuencia en espiral
En el análisis se consideran vóxeles con materia blanca o gris, con las dos siguientes observaciones:
1) La mayoría de los sujetos del estudio tienen una larga cola izquierda en la distribución del nivel
medio de vóxeles, siendo más frecuente la materia gris que la blanca. Además los datos están más dispersos
en la materia gris que en los blanca, especialmente los datos adquiridos a través de imágenes en espiral.
2) La distribución de la desviación estándar a un vóxel en la cola de la derecha, tiene menor
desviación media estándar en la sustancia blanca que en la gris.
Estos dos resultados indican que la sustancia blanca tiene menor variación entre vóxeles que la
materia gris. Los sujetos con un mayor movimiento de cabeza no seguían una distribución normal vóxel en la
materia gris.
1.4.2. Detección o estimación

El mapa paramétrico estadístico se utiliza para detectar la actividad del cerebro, si el análisis es no
paramétrico el mapa se denomina mapa no paramétrico estadístico.
Estos mapas son una representación gráfica del resultado del análisis estadístico en cada vóxel del
cerebro. Para ello se necesita una combinación de:
o Modelos estadísticos.
o Pruebas estadísticas.
o Correcciones para pruebas múltiples (problema umbral).
1.4.3. Umbralización
La mayoría de los análisis realizan las pruebas vóxel a vóxel, lo que hace necesario en cada vóxel
tomar una decisión sobre si debe considerar activo o no ese vóxel.

1.4.3.1. ¿Es el criterio de derecho un vóxel de activación?

Al designar los vóxeles activos, se obtienen como inactivos el resto de los vóxeles. La aplicación de
los umbrales puede ser engañosa en el sentido vóxel ya que;
o los que están por debajo del umbral, no muestran un mapa de la activación.
o Los que están por encima del umbral, si muestran un mapa de la activación.
La diferencia entre estos dos vóxeles es mínima.
Un mapa de activación es un objeto estático, que resume la totalidad de un experimento a lo largo
del tiempo en una única decisión sí-no (activo-inactivo). Cuando las diferentes regiones se activan se pierde:
o La actividad del cerebro.
o La información del tiempo.
1.4.3.2 Fiabilidad y reproducitibilidad de la activación

La coherencia de la activación de los vóxeles individuales es un elemento importante en el umbral.
Si la respuesta a un estímulo determinado es que los vóxeles del cerebro de un individuo se activen, entonces
la búsqueda de vóxeles activos tiene el significado de que un estímulo se ha producido.
El volumen de activación es el número total de vóxeles detectados como activos Se debe evitar la
correlación entre cambios en:
Los niveles de la señal
Los niveles de ruido
El rendimiento del número de vóxeles activos de los ensayos de exploración.
Esto último ocurre por falta de diferencias significativas entre sesiones separadas en el tiempo. Esta
falta de fiabilidad de la activación indica que el objetivo es difícil de alcanzar y por tanto el enfoque del
análisis a un nivel vóxel es erróneo. Un análisis estadístico muestra las diferencias a través de los contrastes
del modelo lineal.
Los mapas funcionales detallados se dan en el análisis estadístico afirmando que la respuesta es
consistente a través de las pruebas separadas en el tiempo.
Un factor se complica de diferentes formas por:
o La facilidad de producción.
o La coherencia entre los sujetos, dentro o entre los períodos de los sesiones.
o La coherencia entre los centros de la imagen en escáneres diferentes.
Adicionalmente a la condición de activación de un vóxel, la característica de la respuesta BOLD
examina la fiabilidad en los ensayos repetidos.
1.4.4 Múltiples objetivos

Los experimentos incluyen un pequeño número de temas u objetivos, dado que en los estudios el
número es mayor que uno, y la tendencia de los grupos es más grande. Además, las conclusiones sobre el
comportamiento del grupo de sujetos no se pueden extrapolar a la población de la cual se tomaron las
muestras de los sujetos, o comparar con grupos de sujetos.

Sólo se permite combinar imágenes de cerebros de diferentes personas, si la forma del espacio
común es igual. Los métodos de combinación de información se comparan con grupos independientes de
sujetos, en función del objetivo final de la inferencia.
1.4.4.1 Coherencia a través de temas

La fiabilidad de la activación es un ajuste importante del:
o Modelo general.
o Mapas estadísticos.
o La coherencia entre los sujetos.
Las fuente de variabilidad debida a los diferentes temas u objetivos originan cambios importantes de
mayor magnitud que los asociados a los diferentes instantes de tiempo en la medición efectada por el
escáner. Se evalúa la variabilidad entre sujetos, así como la causa que origina dicha variabilidad.
Los estadísticos estudian las complicaciones que surgen en el ajuste de la neuroimagen. La respuesta
hemodinámica está por debajo de lo que se observa en los datos. La digitalización explora la variabilidad
dentro de una sesión baja. Se pueden encontrar diferencias significativas en los sujetos que se exploran
durante diferentes meses en distintas ocasiones. La respuesta hemodinámica y las sesiones del escáner a través
del tema no son estables en el tiempo.
1.4.5. El análisis regional frente al Whole Brain

Los datos FMRI analizan una región para cada función con distintos modelos o formas para la HRF
en diferentes partes del cerebro. Cuando las tareas y regiones son diferentes en el cerebro, no es probable que
un modelo sea el apropiado para todos los vóxeles. La mayor actividad del cerebro ocurre en la materia gris.
Los análisis dentro de la materia gris se razonan, de acuerdo a la región donde se ubica. Las desventajas
asociadas a estos métodos surgen esencialmente dado el hecho de que no se tiene una idea clara sobre los
modelos cuando las nuevas tareas experimentales se están explorando. El proceso una división del cerebro
en gris/blanco. Se define entonces el ROI como el proceso dentro de la materia gris en regiones específicas
de interés. Un modelo de la región específica se ajusta de forma intensa para todo el cerebro, sobre todo si la
selección del modelo es parte del procedimiento. Si el modelo es el adecuado en cada región o en cada vóxel
el análisis del umbral se complica porque no se aplica a un único punto de corte y la interpretación del mapa
resultante es más difícil.
Las ventajas de un análisis de todo el cerebro son las siguientes.
o Adaptar un modelo único a todo el cerebro, incluso si se trata de seleccionar un modelo.
o Al no tener que segmentar el cerebro en una partición diferente el ROI ahorra tiempo y
esfuerzo, lo que permite un enfoque más detallado sobre el análisis estadístico adecuado.
o 3) El umbral se aplica a todo el cerebro y el mapa activo/inactivo no es fácil de interpretar.
Es común tener dos enfoques representados en un análisis, aunque este análisis se lleva a cabo mediante un
modelo simple junto con un análisis de varios ROI. El estudio se centra en los aspectos más particulares del
comportamiento.

1.4.6. Resumen de los retos de estadística

Los vóxeles simples y simplistas se estudian al considerar la incorporación de la información
espacial y temporal obtenida en los estudios anteriores de los modelos más realistas. A los datos FMRI se le
aplica una representación según diferentes puntos de vista y se compara con un enfoque más estadístico,
involucrando:
o La selección y elección del modelo,
o La visualización de gran parte de conjuntos de datos tridimensionales
o El análisis Bayesiano frecuentista.

Capítulo 2
ENFOQUES EN EL ANÁLISIS
ESTADÍSTICO DE FMRI
2.1. Análisis exploratorio de datos
Las imágenes de resonancia magnética funcional (FMRI) utilizan el análisis exploratorio de
datos (AED), porque los datos obtenidos del escáner se procesan de manera significativa antes de
mirar el cerebro.
Las características espaciales y temporales de los datos FMRI hacen difícil el análisis
exploratorio de los datos. Por eso se realiza un análisis estadístico preliminar antes del AED.
La función de respuesta hemodinámica (HRF) es el recorrido independiente del tiempo del
diseño experimental ya sea por: categorías o relacionado con el evento.
Los patrones de interés revelan la activación del análisis estadístico formal. El estudio del
análisis exploratorio de datos FMRI realiza un diagnóstico con herramientas gráficas para
conseguir:
o La hipótesis de la estructura de error.
o La independencia.
o La varianza constante
o El ajuste del modelo.
Al aplicar esto se identifican imágenes potencialmente problemáticas, ruidosas o con gran
cantidad de movimiento, donde el objetivo es comprobar si se incumplen los supuestos del modelo.
2.2. Los diseños de bloque.

En este diseño el período fijo se alterna en blanco y negro. Comenzando y terminando el
experimento con un período fijo.
Para ello se siguen dos patrones:
o Para responder a los vóxeles activo.
o Para no responder a vóxeles inactivos.
Estos vóxeles utilizan formas sencillas para continuar con el análisis de datos en un vóxel
base. Esto se simplifica al considerar la tarea de interés. También se simplifica si se ignora el
aspecto temporal de los datos y se calcula el valor del estadístico t. Con él se comparan los bloques
de control en los niveles medios de activación durante la lectura de estos bloques en cada vóxel.
X task − X co ntrol
La activación se define en vóxel i como: ti =
se
dónde:

• X task es el nivel medio de activación en el vóxel i en el tiempo en el cual la tarea se

lleva a cabo.
• X co ntrol es el nivel medio de activación en el vóxel i en el tiempo en el cual el sujeto

esta en reposo o realizando el control.
• se es el error estándar de la diferencia.
Para calcular este error se usa la estimación combinada con la varianza.
s 2
=
( ntask − 1) stask
2
+ ( ncontrol − 1) scontrol
2
De tal manera que: p

ntask + ncontrol − 2
1 1
Con: se = s p +
ntask ncontrol
Siendo:
n task ,
• tamaño muestral asociado a la tarea.
ncontrol
• tamaño muestral asociado a las condiciones de control.
2
stask
• la varianza de la muestra de activación de la observación de la tarea.
2
•
s control varianza de la muestra de activación de la observación de la
condición de control.
Este análisis se realiza para cada vóxel y se traza el resultado en un mapa con distintos valores
del estadístico t. Se contrastan los diferentes valores de t mediante un contraste de hipótesis. Si hay
más de una condición de tarea se amplía este enfoque para generar un estadístico F en cada vóxel.
Así se comparan distintos niveles de actividad en todas las condiciones obteniéndose un mapa de F
en cada actividad.
Este análisis asegura la normalidad con:
1) Independencia de vóxeles. El análisis se realiza para cada vóxel individual y el
resultado de la prueba en cada punto de la imagen supone vóxeles independientes.
2) Independencia en el tiempo. El análisis de los puntos en el tiempo tanto dentro como
a través de los bloques es similar, si se suponen independientes las medidas recogidas en
diferentes puntos de tiempo.
3) El inicio de la respuesta inmediata hemodinámica es la presentación del estímulo y
se detiene cuando se detiene el estímulo. Si el estímulo está desactivado, la respuesta tiene
un descenso gradual.
Algunos datos no apoyan la hipótesis de normalidad y varianzas iguales. Por esto se
realizan algunas modificaciones que permite utilizar la prueba Welch. Esta prueba estadística
contrasta hipótesis en función de la media aritmética, cuando dada la heterogeneidad de las
varianzas, no es aplicable la prueba t de Student. Este modelo estadístico calcula los grados de

libertad, disminuyendo el error por la no homogeneidad de las varianzas.La prueba Welch se

expresa como:
X ta sk − X co n tro l
tW i =
s ta2 sk s2
+ co n tro l
n ta sk n co n tro l
Para diferentes poblaciones esta prueba tiene una forma muy complicada. No siendo compatible la
hipótesis de normalidad. La relación señal/ruido aumenta con el aumento del tiempo. La estadística
no paramétrica abandona la hipótesis de normalidad.
La evolución en el tiempo de aparición o la predicción de respuesta hemodinámica es el

análisis de correlación de la prueba t con información temporal de los datos al realizar un análisis
relacionado con el vóxel en el recorrido de la activación. Se calcula el vóxel i como ri = r ( S , X i ) .

Donde:
• S es el patrón que describe el diseño de bloques del estímulo de presentación, tomando
los valores 0 y 1.
• Xi es el curso de tiempo de activación del vóxel i.
• r es el coeficiente de correlación de Pearson.
o La correlación es positiva cuando existe una fuerte correlación entre la tarea de los bloques
y un alto nivel de actividad en el vóxel.
o La correlación es negativa cuando los vóxeles son inactivos.
Si el número de imágenes en la condición de tarea es igual al número de imágenes en la

condición de control, los dos análisis coinciden.
n−2
La transformación de ri es: ti = ri . Siendo n el número total de imágenes.
1 − ri 2
Si el diseño no está equilibrado hay más bloque de tareas que bloques de control, aunque
los dos análisis coinciden aproximadamente.
2.3. Diseños relacionados con el Análisis Base

La función de respuesta hemodinámica (HRF) identifica la actividad interesante y permite
investigar la aparición de la respuesta en el comportamiento del cerebro según la reacción a un
estímulo. Existen dos herramientas principales para el análisis de diseños base que son.
o Un ensayo promedio es el análisis de la prueba t para los diseños de bloque.
o El análisis de eventos relacionados con FMRI y la estimación de la función HRF.
Un ensayo promedio es la media simple de la unión de los distintos tipos de ensayos,
ordenándolos en un experimento según el tipo y el recorrido del tiempo para cada FMRI.
Así se obtiene una respuesta significativa cuando los ensayos están separados con poco
tiempo de diferencia (2 segundos). Entonces el ensayo promedio no se utiliza solo cuando el

intervalo del interestímulo es suficiente para que la respuesta hemodinámica vuelva al nivel de
referencia.
El rendimiento del ensayo promedio es una estimación de la HRF, de la que se obtienen una
estimación, utilizando técnicas paramétricas y no paramétricas.
2.3.1 Enfoques paramétricas para la estimación de la función de respuestas

hemodinámicas.
El enfoque paramétrico de la estimación de la HRF se basa en una familia de distribuciones
estadísticas que modela la forma de la curva de la respuesta BOLD. Utilizando la distribución de
Poisson y la Gamma.
La distribución de Poisson se caracteriza porque:
o Tiene un parámetro que describe la HRF.
o Es discreta
o La respuesta BOLD evoluciona en el tiempo continuamente.
o Es menos flexible que la Gamma.
Para una distribución Gamma de dos familias se define el modelo en el tiempo y en un vóxel como:
h ( t , i ) = bi ( tbi ) exp ( − tbi ) / Γ ( ai )

ai −1
Donde:
- ai y bi son parámetros gamma que varían de un vóxel a otro
- Г(•) es la constante de normalización de la densidad de la función Gamma.
Algunas de las características de la distribución Gamma son:

o La curva aumenta lentamente hasta un máximo, donde empieza a disminuir hasta el
valor basal.
o La familia de rayos Gamma es flexible a través de la elección de los parámetros que
cubren una amplia gama de funciones y sólo algunas se aproximan a la respuesta BOLD.
o Se describen las características macroscópicas de la respuesta BOLD.
Se propone un modelo de Gauss para estimar los parámetros de la HRF y poder ofrecer un
vóxel. Definiendo dos características de la HRF:
o El retraso
o La dispersión.
La familia Gauss es independiente, mientras que la Poisson y la Gamma no lo son.
Se estudia un modelo general no lineal, en el subgrupo de vóxeles significativos por otro
método. Estos modelos tienen la siguiente forma:
y(s,t)=g(t,β )+ ∈ ( s , t )
Donde:
• S es el índice del vóxel con t índices.
• g(t,β) es cualquier parámetro relativo a la HRF.

A través de s y t, el vector sigue una distribución normal multivariante (Σ) con media cero y
matriz de covarianza desconocida, cuyos elementos deben ser estimados.
El parámetro β se calcula por el método de máxima verosimilitud. Si se separa la matriz de
varianza en piezas temporales y espaciales, cada uno de estas piezas tiene un AR(1), con la
siguiente estructura:
∑ = γ ( ∑ ⊗∑ )
2
2 S T
Donde
•
γ 22 es un término de varianza
• ⊗ es el producto Kronecker
• ∑ −1
S
y ∑ −1
T
se estiman y modelan por separado y luego se utilizan para construir
∑ −1
∑ −1
= 1/ γ 22 ( ∑ −S1 ⊗ ∑ T−1 )
a través de
2.3.2. Enfoques no paramétricos para la estimación de la función de la respuesta

hemodinámica
Los enfoques no paramétricos utilizan las funciones base para evitar que las familias de las
distribuciones se adapten a la forma de la curva de respuesta.
La función de respuesta hemodinámica se modeliza mediante el enfoque Bayesiano en el
temporal, utilizando la aproximación basada en spline cúbicos, con nudos determinados por los
puntos críticos de la curva.
El tiempo medio de la curva es la media de la respuesta en cada momento correspondiente
en el bloque. Para estas curvas se adapta un polinomio cúbico simple, que recoge las características
de la respuesta hemodinámica, sin fijar la forma paramétrica.
Un efecto aleatorio de regresión polinómica representa las desviaciones de los vóxeles a la
media global. Este modelo incorpora efectos fijos a las covariables de la región del cerebro en la que
se encuentra el vóxel, es decir:
yi = Wiα + X i βi + ∈i
Para i = 1, ..., N vóxeles, donde:
• yi es la evolución en el tiempo medio para el vóxel i.
• Wi es la matriz de diseño de efectos fijos
• Xi es la matriz de diseño de efectos aleatorios. Xi -> N(0, 1)
• α, βi son parámetros desconocidos.
En este modelo, los parámetros que definen los efectos aleatorios estiman mediante un
enfoque empírico Bayesiano, a partir de la siguiente expresión:
−1
β i =  X iT (σ ∈2 Ωi ) X i + ∑ −β1  X iT (σ ∈2 Ωi )
−1 −1
 
( yi − Wiα )
siendo los estimadores de los coeficientes de Bayes en el nivel vóxel:

−1
∑ β | yi =  X iT (σ ∈2Ωi ) X i + ∑ −β1 

−1
Entonces el coeficiente de efectos fijos se estima por la probabilidad marginal máxima:

N
1
∑β βi +∑ β
T
∑β = i yi
N i =1
siendo:
• La estimación de la covarianza de la población,
−1
  
( )
N N
α =  ∑ Wi T Ω i−1Wi   ∑ Wi T Ω i−1 yi − X i β i 
 i =1   i =1
• El factor de escala o término de error,

σ ∈2
( )∑
−1 N
 N 
∑ tr Ω X iT 
2
σ =  ∑ ni 
∈
−1
∈ $ Ti + X
$ i∈
 i =1  i =1
i i β yi 
Donde ni son el número de puntos del tiempo observado en el vóxel i
Para evitar el ensayo medio, se realiza la estimación de la HRF directamente a partir del
parámetro en un modelo lineal. Entonces la señal FMRI en un vóxel en el tiempo t se escribe como:
y (t ) = x1h1 (t ) + x2 h2 (t ) + ... + xk hk (t )+ ∈ ( t )
Donde:
• xi es una variable que representa el tipo de prueba.
• hi es la respuesta hemodinámica asociada con la matriz de covarianza. El vector h
es desconocido, entonces los métodos probabilístico estiman h sin asumir la forma
particular de las respuestas.
• La covarianza en el término de ruido no es conocida, y se estima por un
procedimiento de mínimos cuadrados ordinarios (MCO) donde se aprovechan las
estimaciones.
El método de ingresos se define:
1) Obtener los mínimos cuadrados ordinarios estimados de h:
h$ OLS = ( X T X ) X T y
−1
$
2) Calcular los residuos: e = y − X hOLS y utilizarlos para obtener una estimación de la
matriz de covarianza desconocida del error.

3) Realizar hipótesis sobre el proceso de ruido; asumiendo un modelo Gaussiano,
correlacionado, con dinámica autorregresiva.
En la matriz de covarianza en el retraso se define una componente k:
C (k ) = σ 2  λδ (k ) + (1 − λ ) ρ |k | 
Para estimar los parámetros λ, ρ y σ2 se utilizan los residuos de los MCO. Entonces la matriz de
covarianza estimada es:

 C ( 0) C (1) K C ( j)
 
 C (1) C ( 0) K M 
∑ε =  
M M O M 
 
C ( j) L C (1) C ( 0 ) 
Donde:
• j representa el mayor desfase considerado.
C (k )
• es la estimación de C(k).
La estimación final de la respuesta hemodinámica es:
( −1
)−1
h$ = X T ∑ ε X X T ∑ε y
Una vez definida esta estimación se realiza una extensión al modelo de respuesta en el
tiempo n, con (1 ≤ n ≤ N):
yn = h0 xn + h1xn−1 + ... + hk xn−k + λ1d1,n + ... + λM dM ,n +∈n

Donde:
• n=K+1,...N, son los h elementos que conforman la respuesta hemodinámica, es
decir, el objeto de estimación.
• Los elementos d son los efectos molestos, como el desvío de la señal.
• Las componentes son independientes e idénticamente distribuidas en
N ( 0, σ 2 )
Se tiene que estimar h con un modelo lineal, incorporándose al análisis dos postulados:
1. La HRF comienza y termina en cero. Esto se representa:
o Antes de que se presente un estímulo el sujeto está en un estado de reposo.
o Después de que el estímulo se apague la actividad vuelve al valor basal.
Primero se restablecen los puntos y después la HRF toma el cero, esto reduce a dos el número de
parámetros h que se deben estimar.
2. La HRF es suave y representa el comportamiento desde el inicio del estímulo hasta el
máximo, seguido de un descenso gradual en el tiempo hasta la línea base donde se
detiene el estímulo.
La distribución marginal de h no tiene una solución simple, por ello se obtiene la distribución a-
posteriori de h y se evalúa la media a-posteriori de h con el valor estimado de un parámetro de la
Gaussiana. Evitando así la complejidad computacional aunque no se aprovecha la fuerza del
paradigma Bayesiano.
2.3.3. Métodos para estimar el retraso de la respuesta hemodinámica

La duración del retraso en la respuesta del nivel de oxigeno en la sangre es de interés
intrínseco. Las razones de la variación de esa demora se deben a diferentes fuentes de ruido FMRI.
Los principales objetivos de este análisis estadístico se relacionan con la detección de los
vóxeles:que son activados por el estímulo y estimar el retraso en la respuesta relativa a la

presentación del estímulo. Esto se consigue con los coeficientes de correlación entre el recorrido
temporal de la respuesta observada y del tiempo de la respuesta ideal FMRI. Entonces se define la
serie de tiempo (t) como:
r ( t ) = x ( t ) + e1 ( t )
donde:
• x (t) es una respuesta ideal (sin demora)
• e1(t) es el ruido.
Esta serie de tiempo se lleva a cabo en una onda sinusoidal cuya frecuencia coincide con la
presentación del estímulo.
El modelo rezagado se define en el tiempo como sigue:
f ( t ) =ax ( t − ∆ t ) + e2 ( t )
siendo:
• a un factor de escala
• e2(t) el ruido.
Esto se define bajo la hipótesis de que e1(t) y e2(t) tienen media cero y están correlacionadas
entre sí y con x(t). Se define el coeficiente de correlación asociado a un retraso temporal en γ como:
rr , f (γ ) = arx , x (γ − ∆t )
siendo:
• rx,x(γ) la autocorrelación de x(t) que se hace máxima cuando γ = 0.
rx , x (γ − ∆t )
• se hace máxima si γ = ∆t .
Al calcular la correlación del retraso que maximiza la correlación se obtiene una estimación
de la respuesta hemodinámica. Entonces se dice que un vóxel se considera activo si la correlación
máxima es de 0,5.
Los vóxeles activos son sometidos a análisis, y se clasifican como:

o Positivo: si la señal aumenta con la aparición del estímulo.
o Negativo: si la señal disminuye con la aparición del estímulo.
Finalmente se ve que no existen diferencias significativas en el estadístico del retraso medio
entre los dos tipos de vóxeles. Al realizar un análisis de un subgrupo de sujetos, cuyos vóxeles se
hallan espacialmente distribuidos según un modelo estadístico, existen retrasos positivos y
negativos que difieren y dependen de la configuración del estímulo. El retraso medio de la
respuesta es distinto según el área visual, significa que el cerebro reacciona de distinta forma a los
mismos estímulos. En la estimación de la demora se observan varios inconvenientes:
o La complejidad computacional.
o La falta de errores teóricos estándar.
Para corregir estos inconvenientes se usa un modelo lineal. Entonces se define el modelo lineal de
la respuesta FMRI en el tiempo i como:
Yi ≈ x0 (ti ) w0 (γ ) β + x1 (ti ) w1 (γ ) β + ∈i

Con el método de los momentos se obtienen los estimadores de γ y de β. El modelo de señal

en un vóxel se define como:
y = X ∆t β + ∈
Donde ∆t es el retraso en el inicio de la respuesta tras la estimulación, si los errores son
independientes e idénticamente distribuidos con media cero.
La característica principal de este método es la utilización de una función de ponderación w
que modifica los errores. (Como el retraso es desconocido, se repite para cada ∆t).
2.4. El modelo lineal general
El modelo lineal general se escribe con la siguiente forma matricial: y = X β + ∈

Donde:
• y es la respuesta.
• X la matriz de factores predictivos.
• β los coeficientes desconocidos.
• el error con una distribución normal de media cero y varianza σ2.
La matriz de diseño X refleja los estímulos presentados en cada punto del tiempo, y tiene
varianza , constante o no constante o covarianza cero.
En el modelo lineal general, tiene las siguientes características:
o Cada vóxel y cada punto es independiente de los demás.
o σ 2 es constante,
Entonces las estimaciones de β se obtienen a través de los MCO.
La matriz de diseño incorpora diferentes tipos de covariables de interés, aquí los factores
que describen el diseño experimental son variables binarias del diseño de bloques. Se incluyen las
respuestas obtenidas en términos de los valores de la HRF en los tiempos donde se produce la
estimulación. En este recorrido puede ocurrir que la respuesta BOLD no se inicie inmediatamente a
la presentación del estímulo y que el análisis de la respuesta hemodinámica no alcance la línea de
regresión base.
Las covariables se definen como:
∞
x (t ) = ∫ h ( u ) s ( t − u )du
0
Donde:
h ( ⋅)
• es el modelo de la HRF.
• s (t − ⋅) es la serie de tiempo del estímulo.
• x(ti) es el valor de la covariable en el análisis

• ti es el momento de la adquisición de la imagen.

El modelo lineal general proporciona un análisis general de los datos en el que se incluyen
comparaciones entre los distintos grupos. Mientras que el modelo lineal simple sigue la misma
suposición que el análisis de la prueba t.
Algunas suposiciones del modelo lineal general son:
1. Vóxeles independientes. No se usa información espacial, porque el análisis FMRI es
univariante aunque los datos son multivariantes. Aunque aplicar un modelo lineal multivariante es
imposible, porque el número de vóxeles es mayor que la longitud del recorrido del tiempo, esto
conlleva a problemas de identificación y estimación de los parámetros.
2. Puntos de tiempo independientes. Estos puntos son una hipótesis irreal, sin tener claro el
efecto que tiene la respuesta en t1, ni en las respuestas posteriores. Tampoco se sabe la cantidad de
respuestas en el tiempo t1 que se ven afectadas por la respuesta del pasado.
3. Varianza del error. Esta varianza en cada momento es la misma.
4. Matriz de diseño. Se debe aplicar el modelo de la matriz de diseño para cada vóxel en el
cerebro. Cómo las estimaciones de β difieren de un lugar a otro, se deben derivar de forma
independiente en cada vóxel.
2.4.1 Aplicación de algunas cuestiones

El modelo básico incluye los términos que representan la respuesta hemodinámica, con una
convolución de la HRF con el estímulo temporal.Esto se consigue con la incorporación de la
primera derivada temporal de la HRF convolucionada con un factor predictivo adicional en el
modelo. Siendo e1 el modelo para un vóxel único en el tiempo t:
ϑ xi
yi = β 0 + β1 xi + β 2 + ∈i
ϑi
Donde β1 es el efecto de interés que se prueba mediante la prueba t. Este efecto se compara con los
efectos asociados a la derivada temporal, es decir, esta prueba es:
( )
2 2
sgn β 1 β1 + β 2
≥τ
e
donde
• e es el error residual del ajuste del modelo anterior
• τ es el valor crítico de la prueba t.
Si existe un retraso en el inicio de la respuesta hemodinámica, esta prueba supera la prueba

t, por tanto el modelo se incluye en la HRF. Esto aumenta el retraso del término derivada para
capturar las características importantes al disminuir los datos. Al añadir indicadores de participación
en el grupo, se estudian las diferencias entre los grupos experimentales. Como es usual, los
términos incluidos en el modelo se denominan efectos fijos o aleatorios. El análisis FMRI conlleva
el tratamiento de efectos aleatorios, mientras que el efecto de la manipulación experimental
conduce al análisis de efectos fijos. Por tanto, el modelo general es un modelo de efectos mixtos.

Los procedimientos que se utilizan para estimar los parámetros del modelo lineal general
son complejos, sobre todo en el modelo de efectos mixtos, ya que son muy diversas y complejas la
metodologías desarrolladas para estimar la varianza. Se aplican entonces enfoques estadísticos
clásicos tales como la máxima verosimilitud restringida (REML).
Los datos FMRI se analizan de forma continua y según se adquieren en el escáner. La ventaja de
esto es que se obtienen los datos en tiempo real. Se puede transformar el modelo lineal original a
través del procedimiento de ortogonalización de Gram-Schmidt, de modo que la respuesta en el
vóxel i en el momento j sea:
yij = α i1φ1 ( t j ) + ... + α kpφ p ( t j ) + ∈ij

siendo términos ortogonales en la predicción original. Aunque los coeficientes de los parámetros
αj se calculan en el tiempo j sobre la base del tiempo j-1. Este método actualiza la estimación de los
parámetros y la prueba de los estadísticos en cada punto del tiempo, para continuar con el transcurso
del experimento. Entonces se realiza en cada momento el mapa estadístico de los parámetros de
activación evaluando al mismo tiempo el efecto de adquisición de los datos adicionales.
2.5. Métodos de combinación de materias

El análisis de la combinación de sujetos se define en el estudio FMRI mediante el modelo
lineal general. En este caso, para combinar los mapas de estadísticos múltiples se abordan dos
cuestiones:
1) Encontrar un espacio común en el que se examinen los mapas, ya que cada cerebro es
diferente en tamaño y forma. Se pueden combinar imágenes de diferentes temas en un
único mapa, según la variación individual en la anatomía.
2) Se debe encontrar una forma estadística óptima de procesamiento de los datos de los
sujetos en el estudio, es decir, se debe determinar un análisis estadístico que contemple
la naturaleza de los datos con propiedades como: eficiencia computacional y velocidad.
2.5.1 La pregunta anatómica

Para crear un mapa que resuma el grupo de activación en patrones comunes de la actividad
se requiere una deformación del sistema de coordenadas para todas las imágenes del cerebro. Esto
se utiliza en el procesamiento de imágenes antes o junto al análisis.
La transformación es un sistema estándar de coordenadas Talairach, es decir, un atlas
detallado de un cerebro humano muerto. Así se pueden transformar imágenes de sujetos en espacios
de coordenadas. El espacio Talairach desplaza los datos y los vóxeles que cambian de tamaño. Este
sistema y la deformación del cerebro de cada individuo proporciona un método para manejar el
aspecto anatómico del mapa de grupo.
Otro atlas es el Instituto Neurológico de Montreal (MNI). A diferencia del anterior, este
atlas se basa cerebros vivos. Se aprobó una plantilla basada en el Consorcio Internacional de

Cartografía de Cerebros (ICBM), que desarrollaron un atlas probabilístico para las diferencias de
los individuos.
La transformación afín se aplica a las deformaciones de otros métodos. La deformación
inicial se refiere a la utilización de un modelo no lineal. Se considera el efecto que causa la
utilización de cada tipo de deformaciones en:
o El procedimiento estructural
o Las Imágenes funcionales.
Las imágenes estructurales observan los criterios de los diferentes tejidos de la imagen del cerebro
que esta segmenta por:
o Las imágenes funcionales.
o La amplitud
o Los patrones de activación tras el análisis estadístico pertinente.
Según el criterio anatómico no se encuentran diferencias entre los vóxeles que se clasifican
como materia gris después de la deformación de imágenes.
La mecánica de fluidos da una estimación del volumen de tejidos que esta cerca de la
plantilla del cerebro. La normalización usa puntos de referencia y transformaciones del cerebro
descritas por un conjunto de parámetros asociados a operaciones simples. Se utiliza también la
normalización de sistemas paramétricos exactos llamados normalización espacial octree (OSN).
Estos sistemas dividen las imágenes en octantes, donde cada octante es el primer nivel
donde se subdivide los octantes. En cada nivel, se calcula la imagen y el octante de interés
deformado por el octante objetivo. Cualquier octante vacío se retira de la cadena de procesamiento,
representando así la mitad de los vóxeles en una imagen típica. Cada volumen está dividido en 8
cubos iguales, donde X, Y y Z tienen el mismo número de vóxeles. Estas restricciones limitan el
uso de la normalización espacial octree. Una solución es la almohadilla de las imágenes. Si se tiene
un volumen de 64x64x20, se rellenan con ceros la dimensión z y se eliminan los octantes vacíos.
Se combinan diferentes tipos de información creando atlas más fiables y un procedimiento
de normalización. Con un método que utiliza:
o Referencias anatómicas
o Segmentación del cerebro
o Información que reduce la distancia entre una imagen y la imagen de destino.
Se identifican puntos de referencia de forma manual, con una inicialización del algoritmo
general. A raíz de la normalización inicial, el algoritmo se repite para perfeccionar la segmentación y
la intensidad de la información entre dos imágenes.
2.5.2. La cuestión estadística

Cuando se normaliza el sujeto se utilizan técnicas estadísticas para combinar información
procedente de fuentes independientes, donde cada sujeto es una fuente independiente. Entonces los
métodos de procesamiento de imágenes utilizan diferentes técnicas para crear un mapa de grupo de
los distintos temas.

Para crear estos mapas se distinguen dos tipos de procedimientos

1) La combinación de las pruebas
Está compuesta por los métodos que se aplican en cada prueba estadística donde la FMRI son
los individuos de los mapas estadísticos paramétricos obtenidos para cada tema. Se creó un mapa
estadístico de grupo para cada vóxel, reflejando los resultados de estos métodos mediante el cálculo
de una función estadística de prueba. Las funciones calculadas se basan en los valores del
estadístico de prueba, denominados p-valor.
k
El p-valor de Fisher se expresa: TF = −2∑

i =1
log pi
Siendo: k el número de pruebas independientes de la hipótesis nula y Pi el p-valor asociado a la

prueba i.
El estadístico TF se calcula en cada vóxel de forma independiente y se distribuye como una
Χ 2 con 2k grados de libertad bajo la hipótesis nula. Por tanto, se rechaza la hipótesis nula con
valores grandes de TF.
o El p-valor mínimo de k es:

TT = m i n 1≤ i ≤ k p i
TT < 1 − (1 − α )
1/ k
o La hipótesis nula se rechazada en un vóxel si:
Para una prueba con nivel de significación α, se propone el p-ésimo menor valor y se rechaza
la hipótesis nula si el valor del estadístico es menor que una constante que depende de K, R, y α. Se
utiliza un estadístico medio para los sujetos individuales:
k
Ti
TA = ∑
i =1 k
siendo Ti el valor del estadístico t para i.
Donde.
• La hipótesis nula se rechaza para valores grandes de TA.
• Los estadísticos se calculan para un gran número de vóxeles y temas.
• El p-valor cambia con la hipótesis nula si el mapa de activación se basa en un tema.
2) La estimación combinada
Para hacer mapas de grupo se utilizan procedimientos basándose en el modelo lineal general
asociado al análisis de los datos FMRI. Donde son relevantes dos modelos:
o El modelo de efectos fijos
o El modelo de efectos aleatorios.
Un modelo de efectos fijos se utiliza cuando los estudios son homogéneos:
yi = θ + ∈i
donde:
o Yi es el efecto observado en el sujeto i.
o θ es el promedio común.
o i es el error.

Estos efectos se observan en los estudios con media común θ y con términos de error
independientes, es decir, ∈i N ( 0, Vi ) . Aunque es probable que no se verifique la hipótesis de

normalidad.
El peso wi es inversamente proporcional a la diferencia en el estudio de i, por tanto se estima
k
∑w y i i
θ como: θ$ = i =1
k
∑w i =1
i
La varianza se estima como 1 ∑w i según una distribución normal. Entonces, la hipótesis

de que la media común θ, sea cero, se contrasta a partir de los valores del estadístico
θ$
TX =
1
∑wi
La hipótesis nula se rechaza para los valores grandes de Tx. Calculando el p-valor de Tx para cada
vóxel por separado. Este estadístico combina los efectos observados en un vóxel dado y no sobre el
valor del estadístico t o F que forman el mapa cerebral paramétrico.
Si los estudios son homogéneos,
o El modelo de efectos fijos requiere la variabilidad individual y las componentes de la
varianza.
o El modelo de efectos aleatorios tiene en cuenta los objetivos en ambos casos. Es el principal
modelo que usa para el análisis de datos FMRI.
yi = θi + ∈i
El modelo de efectos aleatorios en el contexto meta-análisis es:
θi = θ + ∈i
Por lo general se supone que ∈i N ( 0, Vi ) , ∈i N ( 0, σ 2 ) y todos los ∈i son
independientes uno de otro.

El promedio común tiene dos fuentes de variabilidad para el modelo de efectos fijos:
o El efecto sujeto en torno a su media
o El efecto medio alrededor de la media común general.
Se define un estimador de la media general común a partir de la media ponderada de yi:
k
*
∑w *
i yi
θ$ = i =1
k
∑w
i =1
*
i
* 2
( 2 2
2
)
Donde wi = 1/ si + σ θ con si y σ θ estimación de las componentes de la varianza.
Entonces se define un estadístico para el modelo de efectos fijos:

θ$
TR =
1/ ∑ wi*
o La hipótesis nula se rechaza para valores grandes de TR, es decir, cuando los vóxeles no se
activan.
Los errores estándar de θ$ proporcionan información sobre los efectos fijos que son menores
*
que los efectos aleatorios estimados θ$ con variabilidad entre sujetos. Por esto, el modelo de
efectos aleatorios requiere más esfuerzo que el modelo de efectos fijos.
Si σ θ es cero, los dos modelos coinciden, y el modelo de efectos fijos se considera un

2
escenario óptimo frente al modelo de efectos aleatorios.

En el análisis estadístico de datos FMRI, el suavizmiento de los datos se obtiene de la
combinación de mapas de múltiples temas. Mediante un filtro que se extiende a las regiones de
activación, se permite entonces una superposición de regiones homólogas de activación. Se explora
la efectividad de la aplicación de diferentes tamaños de filtro como la combinación de mapas de
distintos temas. Se encuentran así diferentes resultados según el tamaño del filtro utilizado en las
imágenes individuales. Cuando se realiza sin suavizar el mapa de grupo, recoge la activación que se
encuentra en una o dos regiones aisladas, con un pequeño número de vóxeles.
Un bajo nivel de suavizamiento tiene varios efectos:
1) Las regiones discretas se combinan.
2) La activación en una parte del cerebro se ve reflejada en la activación en el otro
hemisferio.
3) La intensidad de la activación en la región aumenta al descubierto.
La elección del tamaño del filtro se realiza mediante la etapa de pre-procesamiento del
análisis de grupo. Tanto los modelos de efectos fijos como los modelos de efectos aleatorios, tienen
una media común que no procede de imágenes de la muestra. Para estos casos no se desprecia el p-
valor.
El estadístico TF es sensible a las zonas frontera de los estudios, ya que se necesita una
homogeneidad suficiente para la mejora el rendimiento. Por ello se propuso un método que evalúa
la hipótesis de homogeneidad basada en medidas de distancia. Se comienza con el cálculo del
coeficiente RV entre las matrices de dos temas Y1 de dimensión p x n e Y2 de dimensión q x n. Se
calcula el coeficiente RV definido como:
tr ( Z11Z 22 )
RV (Y1 , Y2 ) =
tr ( Z11Z 11 ) tr ( Z 22 Z 22 )
Siendo:
•
Z11 = Y1T Y1 y Z 22 = Y2T Y2 las matrices de similitud
• Esto es una extensión multivariante del coeficiente de correlación.

• Cuando las dos matrices son similares, el valor del coeficiente RV esta cerca de 1.

• Cuando las matrices difieren en gran medida, el coeficiente será cercano a cero.
• Utilizando RV y las matrices de similitud, se definen diferentes medidas de
distancia.
RV (Y1T , Y2T )
• Cuando p = q, en el caso de los estudios FMRI, se considera:
Se utiliza RV (Y1 , Y2 ) como una evaluación entre dos temas, mientras que RV (Y1 , Y2 ) se utiliza para
T T
evaluar la similitud, la atención se centra en:

1) La similitud de los sitios de activación del cerebro, independiente de la evolución
temporal de la respuesta hemodinámica.
2) La similitud del tiempo recorrido en las FMRI, independiente de la distribución
espacial de la actividad.
El coeficiente RV usa covariables al introducir el problema en un marco general del modelo
lineal. Si X es la matriz de regresores, la extensión reemplaza Y1 e Y2 por XTY1 y XTY1,
respectivamente. Se introducen también dos correcciones, para la correlación espacial y temporal.
Se calcula el coeficiente RV en los datos transformados, mediante el uso de la distancia:
Z11* *
Z 22
D (Y1* , Y2* ) = −
tr ( Z112* ) tr ( Z 222* )
* *
Siendo Z ii la matriz que resume Yi , después de las covariables de interés, la corrección
temporal y espacial en los datos del sujeto individual.
Eliminar cada sujeto del mapa actualiza la base de una muestra de tamaño n-1 en lugar del n
original y las medidas de discrepancia definen la diferencia entre el mapa de grupo completo y las
variaciones en los mapas. Las medidas de discrepancia se definen en los mapas binarios obtenidos
después de las pruebas de cada vóxel para la significación. Se incluye un recuento del número de
vóxeles significativos que se eliminan mediante la supresión de un tema, y el porcentaje de
coincidencia entre el mapa individual de un sujeto y el mapa de grupo.
El modelo de efectos aleatorios es un método muy robusto.
1) Porque los mapas de grupo creados por este método son escasos, ya que este modelo es un
enfoque conservador que combina la información que representan dos fuentes distintas de la
variación.
2) La cantidad exhibida por cualquier sujeto individual en el mapa de grupo con efectos
aleatorios es muy pequeño. La mayoría de estos métodos combinan mapas individuales que están en
TF y TR.
El p-valor esta influenciado por el comportamiento del sujeto en un modelo de efectos
aleatorios. El modelo de efectos fijos es más útil para un pequeño número de temas, mientras que el
enfoque de efectos aleatorios requiere tamaños de muestra más grande, aunque sea factible en los
estudios de FMRI. En consecuencia, los temas con los efectos aleatorios son más fuertes.

Capítulo 3
ENFOQUES DEL ANÁLISIS
ESTADÍSTICO MULTIVARIANTE
El enfoque multivariante realiza un análisis de datos FMRI con:
o El análisis de componentes multivariantes:
• Análisis de componentes principales (ACP)
• Análisis de componentes independientes (ACI)
o El análisis de correlación.
• Análisis de correlación canónica
• Análisis de correlación máximo.
3.1 Descripción de los métodos

3.1.1 Análisis de Componentes Principales
El análisis de componentes principales (ACP) es una herramienta multivariante. El objetivo
de este análisis es: Encontrar combinaciones lineales de las variables originales que describan la
estructura de dependencia de los datos.
Para ello se extrae una muestra aleatoria multivariante de vectores X1, X2,..., Xp con media µ y
matriz de varianzas Σ, con rango r ≤ p, y el estimador de la matriz de co-varianza de la muestra, S.
T
La primera componente principal es la combinación lineal de a1 X con la máxima varianza
T
de la muestra, entre todos los coeficientes de longitud 1 ( a1 a1 =1).
T
La segunda componente principal es la combinación lineal de a2 X con la máxima varianza
T
limitada por a2 a2 =1 y a1T a2 =0. La segunda componente es el vector propio con el segundo mayor
valor propio de S y la varianza de la muestra de esta componente es el valor propio.

La primera componente principal explica la mayor proporción de la variación en la muestra.
La segunda componente principal explica una menor proporción que la primera y así
sucesivamente. Es decir, cada componente sucesiva explica una menor parte de la variación total de
la muestra.
3.1.2 Análisis de Componentes Independientes

El análisis de componentes independientes (ACI) es una técnica multivariante que busca
combinaciones lineales de los datos originales que no son normales pero si independientes.
Este análisis es parecido al de ACP, pero con las siguientes diferencias:

1) El ACP se basa en la covarianza de los datos, mientras que el ACI utiliza la

información disponible en los momentos de orden superior.
2) La reducción de la dimensión es un objetivo del ACP pero no del ACI.
El modelo libre de ruido es un enfoque del ACI para el vector aleatorio X. La estimación de
este modelo es: X = A ⋅ s

Siendo:
• s las variables latentes independientes.
• A una matriz de mezcla que define cómo las variables latentes se combinan para
formar el vector observado X.
• Entonces se tiene que estimar los parámetros s y A.
E l modelo del ruido libre es identificable si:
1) Las componentes independientes no son normales.
2) La dimensión de los datos en X es tan grande como el número de componentes
independientes.
3) La matriz A tiene un rango de columna completo.
El supuesto de no-normalidad se utiliza para las componentes. La matriz de mezcla es
ortogonal, entonces la densidad conjunta de las componentes de X tiene una simetría normal.
La estimación de A se basa en la maximización de la no-normalidad de las componentes
independientes que se derivan de diferentes medidas.
El algoritmo ACI busca una combinación lineal de Xi, donde y = w X . Si w es una fila de
T
A-1, e y es una componente independiente.
Si se define z como z = A w , entonces se demuestra que y = z s de modo que y sea una

T T
combinación lineal de variables latentes. Por el teorema central del límite, se sabe que y es más
normal que s y que z tiene un elemento distinto de cero. Para encontrar la primera componente
independiente se busca el vector w que maximiza la no normalidad de y = w X .

T
La aplicación del ACI implica estas dos etapas principales del pre-procesamiento:
1) Reducción de datos
2) Blanqueamiento.
ACP se utiliza para reducir la variabilidad de los datos y la razón de esto es que el número de
componentes necesarias no es muy grande y se utiliza un número más pequeño de puntos o vóxeles
en un estudio FMRI típico. El blanqueamiento transforma el espacio de búsqueda para que sea
ortogonal.
3.1.3 Análisis de correlación canónica

El análisis de correlación canónica (CCA) es una forma de cuantificar la correlación entre los
conjuntos de variables.

Se definen dos vectores aleatorios X e Y, entonces el análisis de correlación canónica busca la

T T
combinación lineal de a1 X y b1 Y que maximiza la correlación (a
T
1 X , b1T Y ) . Siendo estos
vectores aleatorios el primer par de variables canónicas.

T T
Se busca la combinación lineal de a1 X , b1 Y que maximiza la correlación que restringe el
primer par de variables canónicas y esto proporciona el segundo par de variables canónicas. El
procedimiento se repite con cada par sucesivo de variables canónicas hasta k, porque k es la menor
dimensión de X e Y.
La matriz de covarianza de X e Y es Σ, entonces los coeficientes de la pareja j, son:
(∑XY
−1
∑YY ∑YX −cj ∑XX ) aj = 0
(∑
YX ∑−XX1 ∑XY −cj ∑YY ) bj = 0
−1
∑XY ∑YY ∑YX −λ ∑XX = 0
Siendo cj la raíz del mayor valor propio de:
∑YX ∑−XX1 ∑XY −λ ∑YY = 0
Si los valores propios son únicos, entonces los coeficientes de los vectores aj y bj son
combinaciones lineales de la correlación con otras variables aleatorias canónicas.
El análisis de correlación canónica transforma variables originales en una nueva escala que
revela la estructura de correlación entre los conjuntos.
3.2 Los análisis multivariados

Los análisis multivariados tienen la característica de que los datos FMRI se describen en
dos formas equivalentes:
o Teniendo en cuenta la evolución temporal de cada vóxel.
o Considerando el nivel de activación en el cerebro en cada momento.
Esta distinción se hace para saber si el análisis multivariante se centra en la estructura
temporal o espacial de los datos.
3.2.1 Componentes Principales
La investigación sobre el ACP se realiza en la tomografía por emisión de positrones (PET),
en lugar de la FMRI. Realizando el análisis de componentes principales en la serie de tiempo vóxel.
Este uso del ACP da información sobre la conectividad funcional en los datos. Por ello se
definen los siguientes tipos de ACP:
Análisis de Componentes Principales no lineal

El ACP no lineal busca la combinación lineal a través de los datos que explican la
variabilidad de la mayoría de los datos inexplicados. El tiempo detecta la dirección ortogonal y lo
sustituye por una curva.
En lugar de buscar una combinación lineal de las variables originales se busca una función
general que minimice la distancia media de los puntos de la curva.

Se supone que existe un pequeño número llamado fuentes de entrada que contribuyen a los
datos observados para que haya n vóxeles en total. Para ello se toman los datos observados en el
vóxel i donde la función es yi = f i  s ( t )  .
La expansión de Taylor de segundo orden en torno a los valores esperados s ( t ) proporciona
∂fi ∂ 2 fi
( )
yi ( t ) = fi s ( t ) + ∑
j ∂u j
uj + ∑
j , k ∂u j ∂vk
u j vk
Donde u ( t ) = s ( t ) − s ( t ) .
Este sistema se resuelve en un marco de redes neuronales, con un modelo lineal general.
Se definen los nodos de primer y segundo orden como:
o Los nodos de primer orden corresponden a las componentes de un ACP.
o Los nodos de segundo orden permiten relaciones entre componentes no aditivas.
El método en una tarea combina el movimiento y el procesamiento de color y se encuentran
dos componentes principales:
1. Sobre un efecto de movimiento
2. Sobre un efecto de procesamiento de color.
Estas componentes se localizan en regiones anatómicas adecuadas para los distintos tipos del
procesamiento. El nodo de segundo orden muestra los dos tipos de procesamiento.
ACP Funcional
Este análisis considera que los datos FMRI sean datos funcionales, es decir, que el recorrido
del tiempo vóxel sean funciones que evolucionen en el tiempo.
Esto se estima mediante el ajuste de funciones con una base establecida. Muchas técnicas
estadísticas tienen funciones equivalentes para el análisis de la varianza, en lugar de las
observaciones individuales. El ACP funcional se realiza si los datos de cada vóxel son una función
continua en el tiempo.
El análisis de componentes principales requiere dos pasos:
1) El suavizado (estimación) de la serie de tiempo. Donde cada serie del tiempo vóxel
se estima a través de una serie de funciones base. Aunque las aplicaciones toman la
decisión sobre la elección de una base de funciones y el valor del parámetro de
suavización. La diferencia de suavizado, se aplica si hay poca o ninguna relación entre el
ACP y ACP funcional.
2) El ACP en funciones estimadas se aplica en las funciones resultantes si se ha
estimado una serie de tiempo vóxel. Es decir, cada serie de tiempo vóxel expresa una
combinación lineal de un pequeño número de funciones de la base.
El ACP funcional tiene capacidad en estos tres estudios:
1. Memoria de trabajo (diseño de bloques)
2. Memoria episódica (diseño de bloques)

3. Eventos relacionados con el diseño.

En los tres casos, la primera componente captura las características importantes del ACP
funcional, es decir, las señales de interés.
El ACP ordinario selecciona la segunda componente, si la primera refleja el ruido. La mayor
parte de la varianza se explica en este enfoque funcional, aunque el número de componentes en el
ACP ordinario no esta claro.
Núcleo ACP
La estructura del ACP no está correlacionada espacialmente pero si temporalmente. Por esto
se hace una modificación del procedimiento del ACP base, analizando en el primer tiempo una
variable de cada serie vóxel de la característica temporal. Entonces, los modelos basados en un
vóxel se someten a un análisis multivariante en el caso del núcleo de ACP.
El ACP funcional preserva los patrones temporales extraídos en el modelado pero esto no es
posible con el ACP ordinario debido a que las componentes están sin corregir.
Se definen los datos originales (tamaño muestral representado por n), los cursos de tiempo
vóxel de longitud T y los vectores X1, X2 ...., Xn. Ajustándose los modelos en cada vóxel
univariante, donde los datos resultantes son Z1, Z2,..., Zn.
La covarianza o la matriz de correlación para un par de series de tiempo es:
o 1 si están correlacionadas positivamente,
o -1 si están correlacionadas negativamente,
o 0 si no están correlacionadas.
El núcleo de ACP no introduce linealidad porque esta penalizado por los valores del
coeficiente de correlación que están lejos de 1.
Si Cov(Xi, Xj) es la matriz de covarianza ordinaria y Cor(Xi, Xj) la matriz de correlación,
entonces se define la matriz de covarianza por Cov* y en esta matriz se realiza el análisis de las
componentes principales:
(
Cov* ( X i , X j ) = Cov ( X i , X j ) ⋅ φ Cor ( X i , X j ) )
Que tiene las siguientes características:
• Los valores extremos no se tratan de forma simétrica.
• Las fuertes correlaciones negativas se dan cuando el recorrido del tiempo tiene
distintos patrones de comportamiento.
• Si la correlación entre Xi y Xj se acerca a -1, el recorrido de tiempo muestra la
reacción frente a los estímulos que se tratan como ortogonales.
Un factor de escala está determinado por el nivel de correlación del recorrido del tiempo.
El número de componentes que se necesitan determinar para el método núcleo del factor de
escala se estiman mediante métodos computacionalmente intensivos. Los métodos del núcleo
conservan sólo los vóxeles que tienen la señal más interesante.

La base de simulaciones del método del núcleo funciona lentamente si el paso de modelado
temporal se queda fuera. Se efectúa una reducción de la dimensión a través del análisis factorial,
con la creación de nuevas variables.
Escoger el número de Componentes Principales

Para decidir el número de componentes en un ACP se utiliza una técnica de reducción de
dimensiones, con un pequeño número de componentes principales. Pero hay veces que no conviene
que el ACP tenga un número pequeño de componentes porque hay una parte de las componentes
donde la señal es muy importante.Para elegir el número de componentes principales se toma un
criterio generalizado para el error. Donde los x datos de un modelo con parámetros θ, definen la
formación y generalización de errores tales como:
N
1
E (θ ) =
N
∑∈ ( x
j =1
j | θ ) y G (θ ) = ∫ d ( x ) p ( x ) ∈ ( x | θ )
Siendo:
• N el tamaño del conjunto de formación.
∈( xj |θ )
• el costo de la función de error asociado a un determinado procedimiento.
• p (x) la densidad de probabilidad de x.
Si se reduce al mínimo el error de generalización se obtiene G(x) del número de

componentes principales. Siempre que se estime G(x) de alguna de estas formas:
dim (θ )
1) Forma analítica: basada en la relación de G = E + para realizar una formación de
N
gran tamaño.
2) Forma empírica obtenida directamente de los ensayos que se hacen en una fracción en
particular.
La fórmula explícita usa el logaritmo negativo de la verosimilitud como la función de costos y
los supuestos de normalidad en los datos.
3.2.2 Componentes independientes (ACI)

El análisis de las componentes independientes (ACI) es el método multivariante más popular
para los datos FMRI.
Para un recorrido de tiempo de longitud T con n vóxeles, se define:
1) ACI espacial, donde X es una matriz de dimensión T x n, siendo las señales los n vóxeles y T los
casos en cada señal. El método se define como sigue:
X = A⋅ s
Siendo:
• A una matriz de mezcla T x T
• s una matriz T x n que contiene T componentes independientes.

Las filas de s son imágenes independientes y las columnas de A son independientes del recorrido
del tiempo espacial y se estiman mediante el algoritmo ACI.
2) ACI temporal donde X es una matriz de dimensión n x T , A la matriz de mezcla n x n y s es la
matriz nxT con n componentes independientes. El recorrido temporal es independiente del
tiempo en las filas de la matriz s y sus imágenes son temporalmente independientes de las
columnas de A. Se sabe que n es mayor que T, si n es el número de vóxeles.
Estos dos enfoques dan resultados similares en términos del recorrido del tiempo y de los mapas
espaciales de activación. La elección de realizar el análisis en el dominio espacial o temporal se
toma al conocer las tareas realizadas con un experimento previo.
Validar los resultados de ACI

El análisis de componentes independientes consiste en un conjunto algoritmos diferentes
que separan la señal en sus fuentes independientes. Este análisis tiene el inconveniente de que los
distintos algoritmos inducen a distintas componentes y por tanto a diferentes interpretaciones de los
mismos datos. Además, la mayoría de los algoritmos tienen un elemento estocástico que da distintos
resultados.
Para validar este análisis se examinan algoritmos utilizados en el ACI espacial; Infomax y
punto fijo. Estos algoritmos minimizan la información de la componente s, en componentes más
independientes.
1) Infomax. Es la entropía de salida de una red neuronal con muchas salidas, si el número de
componentes se adapta al máximo. Estas salidas son funciones no lineales que se adecuan para la
aplicación de los datos FMRI.
2) El algoritmo de punto fijo utiliza la entropía diferencial normalizada (negentropía).
La negentropía es una medida de no-normalidad y al maximizarla se encuentran direcciones de
máxima no-normalidad en los datos. Se utiliza para estimar las componentes independientes de una
en una o simultáneamente.Los datos simulados y los datos reales de las funciones visuales se
utilizan para identificar las componentes que reflejan la verdad.
La reproducibilidad estadística y la coherencia de los resultados son distintas formas de
validar. Las técnicas de cálculo y gráficas se utilizan para evaluar:
o La fiabilidad algorítmica indica la coherencia del algoritmo que converge a la
misma solución.
o La fiabilidad estadística evalúa la importancia de la producción.
La visualización actúa en la evaluación porque los resultados de cada carrera se agrupan. La
hipótesis del modelo es ver que si un grupo fiable corresponde a una componente real.
Una componente real se representa por un pequeño grupo unido y aislado de categorías. Los
puntos que no corresponden a las verdaderas componentes independientes se reparten por el
espacio y no pertenece a ningún grupo en particular.

El índice de calidad clúster se introduce para localizar los grupos que son interesantes para un
examen más detenido. Esto se define con la diferencia entre la media de las similitudes entre
clústeres y entre los grupos medios.
o Un grupo es menos compacto y aislado si el valor del índice disminuye.
o Un grupo es ideal en un único punto si el índice vale 1.
Un magneto-encefalograma (MEG) es un estudio en todo el cerebro, si las mediciones del
cerebro están afectadas por las señales externas. En el estudio MEG las componentes más fiables se
detectan por el análisis que corresponde a las diferentes fuentes de movimiento que alteran la señal
de interés. Las componentes que no tienen ninguna interpretación inmediata no se pueden
investigar.
ACI regresión
En el ACI están las componentes con los efectos de interés sin especificación previa. En este
caso existe una similitud con la estructura del modelo general lineal:
X= Gβ +
Siendo:
• G la matriz de diseño
• los errores normales independientes e idénticamente distribuidos.
El ACI se define como:
X = A⋅ s
Siendo:
• A la matriz de mezcla
• s las componentes latentes independientes, para describir X=Gβ.
G es la matriz de mezcla dada por ACI y β se equipara con s pero β no se estima, sino que se
−1
obtiene de s = A X .
Este modelo ACI se deriva del ruido libre entonces no hay error residual y no se evalúa la
significación estadística evitando los dos problemas siguientes:
1) Se desechan algunas componentes independientes y se tratan como ruido aleatorio. Las
componentes eliminadas contienen características importantes por eso el modelo está mal
especificado.
2) Todas las componentes son independientes al grupo en dos clases. Una clase consta de las
componentes relacionadas con la tarea, las cuales se combinan en un único estadístico liberando los
grados de libertad para el error.
Los modelos híbridos de ACI tienen tareas relacionadas con la actividad de una imagen
estática y la tarea del tiempo relacionado. Además, el modelo lineal que se utiliza en el ACI híbrido
es simple, sin dependencias espaciales ni temporales en la respuesta.

Como alternativa se propone el enfoque unificado construido según el mismo principio que el
ACI híbrido. Este modelo divide las componentes de la señal y el ruido de subespacios, para crear
regresores del modelo lineal general.
Los regresores son las componentes que tienen mayor correlación en el paradigma. Las
entradas del modelo son el recorrido del tiempo y el resultado del análisis del modelo lineal general,
esto identifica las regiones que expresan las componentes independientes.
El error de tipo I de los dos enfoques se compara con los mejores resultados del modelo lineal
general cuando aumentan los niveles.
Grupo de Análisis con el ACI

La combinación de los resultados individuales de los sujetos en un mapa de grupo presenta
algunos problemas estadísticos. Uno de ellos es el aspecto computacional porque una gran cantidad
de datos están involucrados para crear un mapa de grupo.
Una parte importante del procedimiento es la reducción de datos y existen diferentes medidas
como son:
1) El pre-procesamiento se realiza en los sujetos individuales donde se necesita la limpieza de
los datos.
2) Los datos se traducen en coordenadas Talairach reduciendo la dimensión inicial del ACP
con el número de puntos de tiempo en las imágenes, manteniendo en gran parte la variabilidad que
sea posible.
Un conjunto reducido de datos se concatenan en la matriz n x (k x l), donde
o n es el número de vóxeles de cada imagen.
o k es el número de temas.
o l el número de puntos de tiempo después de reducir el ACP en la dimensión
temporal.
La reducción de la segunda dimensión se realiza en la matriz de datos combinados, donde se utiliza
un el criterio de información bayesiana (BIC) con un determinado número de fuentes agrupadas en
los datos.
El ACP usa los datos agregados que reducen la dimensión y el ACI realiza la reducción con
los datos concatenados. Se reconstruyen los mapas espaciales en el grupo.
La matriz de mezcla en ACI se separa a través de diferentes temas. Esta separabilidad
implica que el recorrido del tiempo es diferente para las distintas materias. Es decir, los diferentes
temas tienen diferentes tiempos de activación.
Se propuso una extensión del ACI individual a la del grupo. Con los datos concatenados de
los sujetos individuales, se definen una matriz n x (l1 + l2 +...+ lK).
Donde:
• n es el número de puntos de tiempo para cada materia en el transcurso de la prueba
• li es el número de vóxeles para el tema i después de enmascarar el aire.

Enmascarar vóxeles de aire es una manera de reducir la dimensión de los datos, ya que el 50%
de una imagen se compone de vóxeles que están fuera del cerebro.
El análisis de resultados es la una única serie del recorrido del tiempo que es común al grupo y
a un conjunto de distintos mapas espaciales.
La comparación más formal utiliza estos enfoques para la concatenación de sabios que
describen el enfoque de la fila de concatenación racional.
o La concatenación racional ofrece una ventaja sobre los métodos con respecto a la
exactitud con que se estiman las fuentes y si el número de materias en una componente son
pequeñas.
o El método de la concatenación de sabios no se ve afectada por la presencia de
componentes únicos. Siendo el número de sujetos expresados por una componente un número
pequeño.
Un gran número de sujetos de las fuentes comunes se expresan a través de un promedio de
materias, cuando:
1) El número total de asignaturas es grande.
2) Existen componentes únicos.
3) Un elemento común expresa los sujetos que son objeto de la concatenación racional.
Esto es bastante robusto, salvo que el número de sujetos sea pequeño.
Aunque el método de la concatenación sabia no es un método factible para la inferencia de
grupo, porque es muy costoso computacionalmente.
Se define una medida de similitud para las componentes i y j tal que:
SM ( i, j ) = λ Rs ( i, j ) + (1 − λ ) Rt ( i, j )
Donde:
• Rs(i,j) es el coeficiente de correlación espacial entre las componentes si y sj.
• Rt(i,j) es la correlación temporal entre el recorrido de tiempo asociado a si y sj.
• λ es el peso comprendido entre 0 y 1, que controla el énfasis en la similitud espacial o
temporal.
La matriz de los valores de similitud se transforma en una matriz de diferencias a través de
DM = 1 − SM ( i, j ) que es la entrada al algoritmo cluster.
La aplicación inicial de este método utiliza un algoritmo del agrupamiento jerárquico

supervisado, que une las componentes entre etiquetas de manera diferente. Se crea un nuevo grupo
cuando las distancias están por debajo del valor del umbral y el clúster es un representante del
grupo de sujetos con tamaño mínimo.
Las principales características de la auto-organización de ACI ponen a prueba los estudios
reales de la estimulación visual. Estos experimentos detectan las componentes relacionadas con el
paradigma, una en el recorrido del tiempo en el primer estudio y dos en la evolución del tiempo en

el segundo estudio. Esto corresponde a la presentación del estímulo para el campo visual izquierdo
y derecho.
Modificaciones a los planteamientos básicos del ACI

En este análisis se introducen nuevos métodos del ACI:
o ACI espacio-temporal (o stlCA)
Este análisis realiza en ACI una modificación de la dimensión espacial o temporal. La falta de
restricciones en el conjunto de imágenes significa que tACI produce componentes que no tienen. Por
eso se propone un procedimiento stACI independiente que maximiza el espacio y el tiempo de forma
simultánea, sin conseguir la independencia individual. Este enfoque reconoce la existencia de una
pequeña dependencia espacial o temporal en las fuentes.
o ACI sesgado
Este análisis está motivado por las imágenes originales con características espaciales
localizadas en el fondo homogéneo. La función de densidad describe esa fuente en una distribución
sesgada.
En total hay tres variantes del ACI: stACI, sACI sesgado, y stlCA sesgado. Siendo n el
número de vóxeles en la imagen, T la longitud de la evolución en el tiempo y k la dimensión de la
descomposición, que es un número más pequeño que n o T. Entonces estos tres métodos trabajan
con una reducción de la dimensión de los datos.
Se denomina X al resultado de aplicar un ACP preliminar a los datos originales, X. Es decir,
X ≈ X ≈ UDV T .
Para el procedimiento stACI el supuesto subyace en que:
o Cada imagen en U es una combinación lineal de k espacios independientes de

imágenes S.
o Cada recorrido de tiempo en V es una combinación lineal de k secuencias

independientes T.
Se definen WS y WT, dos matrices tales que S = UWS , T = VWT . La maximización de la función de
la entropía espacial y temporal de las señales, se define como:
hST = α hS + (1 − α ) hT
Esto permite ponderar cualquier componente espacial o temporal.
o El sACI sesgado sustituye la alta probabilidad de curtosis de una función de
distribución del ACI, por una distribución desigual de fuentes espaciales. Utilizando un
modelo de decaimiento exponencial. Este método mejora la extracción del recorrido del
tiempo y la identificación de las componentes espaciales

o El stACI sesgado combina los anteriores procedimientos maximizando la función

de entropía ponderada sustituyendo hs por el modelo de distribución desigual. Este método
mejora aún más que el sACI sesgado tanto espacial como temporalmente.
Se utilizan valores reales y nuevos algoritmos para manejar los datos complejos, con una
organización adecuada de los datos, si el recorrido del tiempo y las imágenes son:
 X Re X Im   ARe 
  =    sRe sIm 
 X Im − X Re   AIm 
La parte real e imaginaria están separadas en distintas matrices y se les aplica el algoritmo ACI
ordinario.
3.2.3 correlación canónica

El análisis de correlación canónica (CCA) de los datos FMRI usa los experimentos del
diseño de bloques. Donde X toma el valor local de 9 vóxeles:
o El vóxel de interés
o Ocho vóxeles adyacentes en la misma sección.
Se toma como base la función sinusoidal donde se incluyen seis elementos:
( sin ( wt ) , cos ( wt ) ,sin ( 3wt ) , cos ( 3wt ) ,sin ( 5wt ) , cos ( 5wt ) )
Con t = 1,..., T y T la longitud de la serie de tiempo en cada vóxel w = 2π/m, si m es la longitud de
un bloque, es la misma para el descanso que para las condiciones de trabajo.
La elección correcta de Y es la expansión de la serie de Fourier truncada de la onda cuadrada
que describe un diseño de bloques. Si la dimensión de Y es 6, hay 6 correlaciones canónicas que se
calculan, centrando el estudio en la mayor.
La mayor correlación canónica se asigna al centro del vóxel en cada barrio, donde se obtiene
un mapa estadístico de los valores de correlación.
Para completar el análisis se determinan los vóxeles que están activos, donde la mayor
correlación canónica mide la serie de tiempo vóxel en cada barrio. Si la correlación es grande, ese
barrio es similar al paradigma experimental y el vóxel central se declara activo.
Para determinar el estado de activación de los vóxeles se definen dos criterios adicionales:
forma y plazo de respuesta. Donde la forma capta la idea de que los vóxeles se activan en un
experimento del diseño por bloques.
El retardo de respuesta es la máxima demora permitida entre la presentación del estímulo y el
inicio de la respuesta hemodinámica. Normalmente existe un pequeño retraso, entre el estímulo y el
inicio de la respuesta medida en el cerebro. Los vóxeles no cumplen los criterios de forma y el
retraso elimina la consideración en el futuro.
Se utiliza una prueba estadística como función de todas las correlaciones canónicas. La razón
k
de probabilidades de la correlación canónica es la Lambda Wilks: Λ =∏ (1 − ri )

2
i =1

Donde r1 ≥ r2 ≥ K ≥ rk son las correlaciones canónicas calculadas sobre la muestra.

Se realiza un análisis no paramétrico, con independencia temporal en las observaciones del
vóxel. Para realizar este análisis se recoge un conjunto de datos denominados datos nulos en los que
el sujeto está en reposo dentro del escáner con los ojos cerrados.
La convergencia de la función de distribución se basa en muestras independientes pero los
vóxeles en el cerebro no son independientes, porque se selecciona un subconjunto de vóxeles de
datos nulos independientes, para los vóxeles que están lejos uno del otro.
Análisis de correlación máximo

Los modelos de correlación máxima (MCM) están relacionados con la CCA. Alrededor de
cada vóxel se crean cinco nuevas series de tiempo:
o X1(t) el curso temporal del vóxel centro.
o X2(t) la media de los vóxeles a la izquierda y a la derecha del centro.
o X3(t) el promedio de los vóxeles en la esquina superior izquierda e inferior derecha.
o X4(t) la media de los vóxeles por encima y por debajo del centro.
o X5(t) la media de los vóxeles en la parte superior derecha y la esquina inferior
izquierda
Estos cinco cursos se combinan de forma lineal a través de los pesos w1, w2, w3, w4, w5, no
negativos. Cuya suma es 1 y siendo w1 el peso más grande. También se calcula la correlación de
esta evolución en el tiempo espacial con:
o La convolución del estímulo (diseño de bloques)
o La diferencia de los modelos gama para calcular HRF.
Estos modelos corrigen algunos parámetros e imponen restricciones a los demás, al realizar la
optimización sobre el peso wi y dos de los parámetros del modelo de diferencias gammas son:
o La demora en la respuesta hemodinámica
o El tamaño.
Estos parámetros estiman la solución del problema de optimización para obtener el filtro
óptimo espacial y del modelo de respuesta hemodinámica.
También se propone un uso exploratorio del CCA para detectar por separado la dirección
temporal y espacial de la autocorrelación máxima. La motivación de este enfoque es la doble
observación en el dominio del tiempo, donde los vóxeles exhiben auto-correlación.
Los vóxeles inactivos son propensos a ser ruido blanco en el espacio del dominio y los vóxeles
activos aparecen en grupos y son propensos a ser falsos.
Por tanto el CCA:
o Para el análisis temporal.
• X es un recorrido del tiempo.
• Y es el supuesto que el tiempo pasó por un retraso de 1.
o Para el análisis espacial.

• X se toma como un vóxel.

• Y se toma como la suma de sus cuatro vecinos inmediatos adyacentes.
En comparación con las versiones espaciales y temporales; el CCA y el ACI, son métodos
computacionalmente eficientes que encuentran direcciones de interés.
La interpretación de las componentes es un problema en los métodos multivariantes, como el
ACP o el Análisis factorial. A pesar de ello, se pueden interpretar dos o tres componentes
temporales y espaciales, relacionadas con:
o El diseño experimental.
o La estructura del cerebro.
Entonces, las componentes no tienen un significado evidente asociado.

Capítulo 4
PROYECCIÓN EN BASES
FUNCIONALES.
FUNCIONES WAVELET
Las Wavelets son funciones matemáticas que se utilizan para filtrar series temporales y
analizar la variación del contenido espectral. Esta función ofrece una representación tiempo-
frecuencia más precisa para la señal no estacionaria que el análisis tradicional de Fourier.
Representando la evolución temporal del espectro de la señal se localizan en el tiempo la ocurrencia
de discontinuidades, impulsos y variaciones que escapan a los métodos habituales de análisis.
Las Wavelets tienen una aplicación en datos FMRI, creando mapas de activación con técnicas
de muestreo, para comprender mejor los datos, y el modelado. Utilizándose también en hipótesis
múltiples.
4.1 Wavelets
Las Wavelet se utilizan para los datos FMRI por las siguientes ventajas:
o Wavelet multiresolución modelan fenómenos a diferentes escalas.
o Se adaptan a características no estacionarias o locales.
La transforma Wavelet analiza señales periódicas y es reversible, es decir, permite pasar de
un dominio a otro, pero no conserva la información relativa al tiempo en el dominio de la frecuencia
y viceversa. La transformada Wavelet es reversible, pero las funciones Wavelet son de soporte
compacto, lo que permite localizar simultáneamente en tiempo y frecuencia. Esta transformada
filtra los datos y elimina el ruido, además es rápida computacionalmente, en comparación con la
transformada de Fourier.
La descomposición Wavelet puede ser unidimensional o multidimensional (espacio-temporal),
aunque en el análisis FMRI sólo se explota el análisis Wavelet temporal.
Las Wavelets se definen como una familia de funciones obtenidas por la translación y
dilatación de una Wavelet madre Ψ con: ∫ψ ( t ) dt = 0 y la Wavelet padre o función de
escala: φ ( t ) dt = 1
∫
Entonces se definen:

1  t − 2jk  1  t − 2jk 
Ψ j ,k ( t ) = ψ j , Φ j ,k ( t ) = φ j 
2j  2  2j  2 
Siendo:
• j = 1,2 ,..., J los índices de escala (dilatación)
• k = 1, 2, ... K los índices de localización (traducción).
Las Wavelets se expresan de diferente forma y familias, y se caracterizan por la suavidad y
por el número de momentos de fuga (Wavelet madre).
La traducción y dilatación de la Wavelet madre y padre es el rendimiento de un conjunto de
funciones base. En cada escala Sj los datos se descomponen en:
• Coeficientes de detalle dj,k
• Coeficientes de aproximación aj,k
Estos coeficientes se calculan mediante el producto interior de los datos. Los coeficients de
aproximación proporcionan un borrador de la función adicional a los detalles proporcionados por
las proyecciones de la función en las funciones wavelet asociadas a los niveles de resolución más
altos. Los datos originales se reconstruyen sin perder la aproximación a la escala más tosca, es
J
decir, X = ∑∑ d j ,kψ j ,k + ∑ aJ ,kφJ ,k .

j =1 k k
Los coeficientes de detalle suelen ser pequeños y tomar, en señales regulares, valores nulos..
Se deben ajustar los cambios bruscos e variación local de la señal, incluso si el número de
coeficientes es pequeño.. Se puede ampliar la dimensión de análisis wavelet considerando el
contexto espacio. Los coeficientes de detalle tienen en el análisis Wavelet las siguientes
aplicaciones:
Análisis de la variación local y asintótica de la función de correlación
Reflejar el índice de correlación entre coeficientes de diferentes escalas.
Los datos decaen exponencialmente si R no satisface R > 2H+1, donde 0 <H<1.
Siendo H el parámetro Hurst, una medida de la dependencia del rango en los datos. Para
obtener una estimación de H se usa la varianza muestral de los coeficientes de detalle en la escala j.
4.1.1 Creación de mapas de activación con Wavelets

El ruido en una imagen es normal e independiente e idénticamente distribuido (IID). Entonces
los coeficientes del ruido Wavelet también son normales e IID.
Este método se realiza en dos pasos.
1) La transformada Wavelet en cada nivel se somete a una prueba de importancia, utilizando
la hipótesis nula:
Kj 2
 d j ,k 
∑ 
k =1  σ 
 Χ2 K j
Siendo:

• K el número de coeficientes en el nivel j de la descomposición Wavelet.

• σ2 la varianza común
2) Si no se rechaza la hipótesis nula en un nivel determinado, ese nivel no se investiga más.

Si se rechaza la hipótesis nula en la primera fase, en la segunda los coeficientes se someten a
una hipótesis individual.
Un mapa de activación se construye al aplicar la transformada Wavelet inversa a los
coeficientes que satisfacen las hipótesis anteriores
Al realizar el análisis en el dominio Wavelet se descartan algunos coeficientes en la primera
etapa. También aparece la falta de interpretabilidad al no detectar los efectos en el espacio de la
imagen original. Por tanto, se divide el procedimiento en dos partes:
o Aproximación, realizada en el dominio Wavelet.
o Detección, realizada en el dominio espacial.
El marco integrado define los vínculos entre los dos dominios. Esta restricción limita la solución
prevista.
Las regiones de activación son las regiones del modelo lineal de menor amplitud.
Se definen dos valores umbral en el dominio Wavelet y Espacial, que controlan la tasa de
error tipo I y las diferencias entre:
Primer Umbral. La reconstrucción no elaborada. Se aplica a los coeficientes estandarizados
Wavelet y a los datos reconstruidos en el espacio de la imagen.
Segundo Umbral. La reconstrucción umbral. Se aplica a los valores estandarizados en el
espacio de la imagen.
4.1.2 Wavelets para la modelización.

Las Wavelet modelan la estructura temporal de los datos en lugar de la estructura espacial.
Se denominan auto-propiedades a la dependencia de largo plazo que se blanquea al aplicar la
transformada Wavelet discreta.
Los modelos de dependencia a largo plazo que son susceptibles a la representación Wavelet
son:
o El ruido fraccional Gaussiano. Modelo en la serie de tiempo de descanso de datos
FMRII.
o Los modelos ARIMA.
Se propone una Wavelet menos generalizada en el vóxel de nivel básico del modelo de
regresión lineal
Y = Xβ + ε
Donde:
• X es una matriz de factores de predicción
• ε es el ruido gaussiano fraccional con estructura de dependencia a
largo plazo.

Este modelo se desplaza al dominio Wavelet con la transformada Wavelet discreta,

Yw = Xwβ + w.
Esta transformada tiene la matriz de varianza covarianza diagonal, facilitando así la inferencia.
Los parámetros del proceso de largo alcance se estiman con los parámetros del modelo
lineal. Este procedimiento es iterativo con:
o La estimación de las componentes de β.
o La estimación de los parámetros que caracterizan la estructura de error.
El ajuste de modelos Wavelets por mínimos cuadrados generalizadas proporciona robustez
frente a los cambios en los valores de la serie de parámetros de dependencia y controla el error tipo
I en las hipótesis del parámetro β de regresión en los niveles nominales.
4.1.3 Método del muestreo Wavelet

Las Wavelets FMRI usan el muestreo para obtener inferencias para detener la activación. Este
muestreo se realiza en datos originales y residuales y este método utiliza la característica del
blanqueamiento de la transformada Wavelet discreta.
1) La transformada Wavelet discreta de la serie FMRI se ajusta para tener media cero.
2) Los coeficientes de cada nivel de detalle se muestrean sin reemplazo para obtener una
permutación de los coeficientes Wavelet.
3) Se ejecuta la transformada Wavelet inversa de los coeficientes permutados para obtener
una evolución en el tiempo.
No se puede limitar la permutación o volver a muestrear las componentes de la serie, porque
se destruye la estructura de correlación. Por ello se realiza el muestreo conservando la estructura de
los primeros datos.
La activación de los datos se adquieren en:
o Bloques
o Eventos relacionados con el paradigma
o Imanes de fuerza del campo
El muestreo depende de la falta de correlación entre los coeficientes de detalle del mismo
nivel. Si los datos originales están correlacionados y el recorrido del tiempo no es largo, entonces la
aplicación de la transformada Wavelet permite un blanqueamiento de las correlaciones, bajo
condiciones apropiadas.
El procedimiento del muestreo Wavelet preserva el orden espacial y temporal presente en la
estructura de los datos originales.
1) El muestreo aplica la misma escala para cada sector y para cada punto del tiempo.
2) La serie de tiempo se permuta para cada vóxel temporal.
Este análisis Wavelet tiene los siguientes inconvenientes:
o La elección de la familia Wavelet.
o El orden de la Wavelet.

o El número de momentos de caída

o El muestreo en direcciones de forma conjunta o independiente.
o Los efectos del borde.
Por esto se realiza la transformación al dominio Wavelet, para obtener elementos
intercambiables que se vuelvan a muestrear y preservar la estructura de los datos originales.
También se puede transformar en el dominio de Fourier, donde cada componente es independiente.
Se estudian las variaciones del muestreo de Fourier y del Wavelet:
o Fourier: guarda la estructura de autocorrelación espacial y temporal de los datos
simulados.
o Wavelet: guarda la estructura temporal y sólo la primera la estructura espacial.
Además detecta zonas más grandes de activación en la serie de datos reales.
Se debe comparar el sesgo con los umbrales obtenidos por los siguientes métodos de muestreo:
o Pre-blanqueamiento de un modelo autorregresivo.
o Muestreo Wavelet.
o Muestreo de Fourier.
4.1.4 Evaluación de Métodos de Wavelet

Las técnicas involucradas en el dominio Wavelet para el análisis de datos FMRI se exploran
en:
o Diferentes familias
o Órdenes
o Niveles en un equipo generado por fantasmas.
Los fantasmas permite manipular características de los datos como:
o El alcance y fuerza de la activación
o La cantidad de ruido
o El efecto de suavización
En este tipo de datos se realizan las siguientes comparaciones:
1) Considerar la capacidad de recuperación del patrón de activación cuando se añaden ciertas
cantidades de ruido sin suavizar.
o La prueba t se deteriora cuando se añade más ruido en niveles altos.
o La imagen de recuperación está formada por vóxeles aislados.
o Las Wavelets funcionan mejor en presencia de ruido y sin suavizar.
o La suavización mejora la calidad de las imágenes.
2) Se busca el receptor del funcionamiento característico (ROC) de la curva. El área que queda
bajo ROC es una forma de evaluar la calidad de los métodos. Este criterio usa el método
Wavelet para superar la prueba t, sin importar:
o El grado.
o El nivel de activación.

o La cantidad de ruido añadido a los datos.

Suavizar los datos del área bajo la curva ROC es similar para las bajas y altas cantidades de ruido.
Pero sin suavizar las diferencias son más evidentes.
Se consideran tres algoritmos para solucionar el problema de thresholding de coeficientes
Wavelet asociados a la:
o Contracción frecuentista con el control de la tasa de descubrimiento falso (FRD).
o Contracción frecuentista con pruebas recursivas.
o Contracción Bayesiana.
Los tres algoritmos identifican un subconjunto de coeficientes Wavelet que contienen la señal
importante. Estos algoritmos se comparan con datos simulados y reales.
o Los datos reales son datos en reposo.
o Los datos nulos se utilizan para controlar el error tipo I.
Los coeficientes que sobrepasan el umbral reconstruyen la imagen del cerebro a través de la
transformada Wavelet inversa.
La sensibilidad evalúa el área que queda bajo la curva ROC utilizando datos simulados.
o El criterio de contracción Bayesiana es más sensible aunque la ventaja es leve.
o FDR es más sensible que el thresholding recursiva excepto en pequeñas amplitudes
o Si la amplitud de la señal aumenta, la sensibilidad de los algoritmos aumenta.
Para un nivel de descomposición fijo y un nivel de significación , la fracción de falsos
positivos en los datos nulos disminuye cuando el número de momentos de fuga aumenta.
4.2 Funciones Base formado por la anatomía y fisiología

Las Wavelet ofrecen un conjunto de funciones base que modelan los datos que dirigen la
anatomía del cerebro.
Para crear funciones base se utiliza la información fisiológica del análisis de datos FMRI, con
o Imágenes anatómicas
o Imágenes funcionales.
La imagen anatómica reconstruye la superficie cortical en la representación llama aplanada.
Se denota por Y la observación funcional en el espacio vóxel. Los vértices de la materia gris (VG),
reconstruyen el mapa para estimar una distribución uniforme que mejore la explicación en los datos
observados. Tal que:
Y = g  f (VG )  + ∈
Donde:
• La distribución uniforme f (•) se calcula con una combinación lineal.
• VG son funciones parciales.
• g integra las funciones base, transformándolas desde el espacio de vértices al
espacio vóxel.

Las funciones base se definen en el mapa cortical en un plano del sistema de coordenadas de
dos dimensiones, con centro en (xj, yj) y se definen mediante una Gaussina circular:
  2

− ( x − x j ) + ( y − y j )  
2
  
bF = c1 exp 
j

 2 w2 
 
Siendo:
• c1 una constante de normalización.
• w el ancho de la función de base de Gauss en la direcciones x e y.
Estas funciones se utilizan para modelar los datos funcionales en Y, y si el número de

vóxeles funcionales es nv, el modelo lineal es:
Y = Aβ + ∈
( )
−1
Se estima β de la siguiente manera: β = A A + λ I
T
AT Y
Los vectores de los parámetros se deben estimar para cada Yi en una matriz del análisis
univariante o multivariante.
En un modelo lineal general se implementa un conjunto de funciones base que reflejan las
características temporales de la respuesta BOLD. Este conjunto base se denomina OSORU. Esta
función forma la base de la matriz del diseño del modelo lineal general.
La respuesta transitoria es la aparición de la corriente del estímulo. Donde existen tres
componentes transitorias que son:
o La componente de desplazamiento: respuesta transitoria similar a la terminación del
estímulo.
o La rampa: respuesta lineal para algunos estímulos y se caracteriza con la
recuperación de la señal a raíz de la disminución de la componente de inicio.
o El undershoot es la tercera componente transitoria.
En un experimento se cuentan las ráfagas de ruido repetidas en un diseño de bloques:
o Si la tasa de repetición es baja la respuesta es constante
o Si la tasa de repetición es alta, la respuesta es bifásica.
La incorporación de la base OSORU en el modelo lineal da flexibilidad porque los
coeficientes de regresión reflejan la importancia de cada componente al conjunto base.
La Wavelet ofrece flexibilidad pero no facilita la interpretación en el significado fisiológico,
porque no se estudia el modelo de respuesta hemodinámica sino que intenta entender la actividad de
la respuesta FMRI.
El Índice Wavelet (WI) caracteriza los patrones temporales entre dos extremos:
1 on + off 
WI =   , WI [0,1].
2  Mid + max ( on, off ) 
Siendo:

• On y Off parámetros estimados mediante las componentes del modelo lineal.

• Mid la magnitud de la componente sostenida por más de la mitad de los
coeficientes de la componente rampa.
Los valores grandes de WI indican que el inicio y el fin son de tamaño comparable, además
de indicar la relación con el punto medio en la respuesta fásica.
Los datos con ruido impulsivo, encuentran una base OSORU con más actividad en las áreas
pertinentes corticales. Una sola componente equivale a una prueba del estadístico t.

Capítulo 5
ANÁLISIS BAYESIANO
DE FMRI
El método Bayesiano es ideal para el análisis de datos FMRI, porque los datos se describen
de manera jerárquica en un modelo vóxel incorporado al modelo del objeto. Los modelos espacio-
temporales describen los datos FMRI y susceptibles de un análisis Bayesiano. Además, los enfoques
estadísticos incorporan a la función base la información anatómica incluso en el contexto no
Bayesiano. Las hipótesis frecuentistas no son fáciles de interpretar. Mientras que la probabilidad de
los efectos umbrales son una medida intuitiva. Existen diferentes fuentes de información sobre la
activación del cerebro, como son:
1. Diversos experimentos que provocan una activación constante.
2. La activación se localiza en vóxeles aislados individuales.
3. Las diferencias y la amplitud de la activación son iguales que las fluctuaciones de
un individuo en diferentes sesiones de escaneo.
4. La intensidad en reposo de la respuesta esta entorno al 2-5%.
5. Los parámetros que guían la respuesta hemodinámica varían de un vóxel a otro o
de una región del cerebro a otra.
Esta información a-priori se utiliza para construir distribuciones previas al análisis Bayesiano.
5.1. Todos los Modelos Bayes

El primer modelo Bayesiano de datos FMRI se denomina Genovese y propone un modelo
que evita problemas del cálculo. Eligiendo el análisis previo más conveniente en lugar del análisis
que ofrece un resumen de la información previa evitando así realizar Bayes.
En este modelo cada vóxel del modelo Genovese observa la señal en el tiempo t como:
Y ( t ) = µ + d ( t ) + a ( t; µ , γ ,θ ) + σ ∈ ( t )
Donde:
o µ: es la señal de referencia para el vóxel o tiempo medio en ausencia de activación y
ruido.
• d(t) es la derivada de la señal medida en el tiempo. Modelizado por un spline,
donde el número de nudos es pequeños o grandes según si la ubicación es
aleatoria o fija. Si el número de nudos es desconocido esto da lugar a una
distribución de Poisson.
a ( t; µ , γ ,θ )
• es el perfil de activación que capta la respuesta hemodinámica.

• θ determina la forma de la respuesta ante la presentación de un estímulo

individual.
• γ determina la amplitud del cambio de señal respecto al valor basal.
• Estos parámetros siguen una distribución Gamma.
∈ (t )
• es el ruido blanco.
Este modelo estudia cuando aumenta o disminuye la monotonía de la tarea. La distribución
del método Bayesiano obtiene parámetros manipulables. Los métodos Bayesianos se utilizan para
probar la linealidad de la respuesta hemodinámica. En comparación con el modelo HRF, el enfoque
Genovese es más flexible y permite que las funciones no alcancen el post-estímulo presente en
algunos vóxeles. Este modelo procesa los datos de un individuo en solo unas horas, pero introduce
una componente de ruido espacio-temporal. El proceso de ruido se descompone en dos partes:
1) No estacionaria determinista.. Elimina el ruido a través de un filtro de paso y no se
considera en el modelo
2) Estacionarios de corta variación en la escala estocástica. Elimina el ruido como una
normal multivariante, con media cero y matriz de varianza-covarianza Σ.
Woolrich utiliza familias con un modelo autorregresivo espacio temporal especificado
simultáneamente (STSAR), con combinación temporal fija AR(1) y variación temporal AR. Es decir,
el modelo tiene una variación de pequeña escala en el vóxel i y en el tiempo T tal que:
P
sit = ∑ βij s j ,t −1 + ∑ α pi si,t − p + ∈it
j∈Ni p =1
Donde:
• Ni es el entorno de vecinos del vóxel i.
• βij es la autocorrelación espacial entre el vóxel i y el vóxel j.
• pi es la autocorrelación temporal entre el punto t y el punto t-p en el vóxel i.
• εij tiene una distribución normal con media cero y varianza que depende del
vóxel, pero se fija en el tiempo.
El parámetro β acomoda la estacionariedad espacial y la no estacionariedad. El modelo Genovese,
expresa la especificación antes de asumir la independencia entre los parámetros, ε, β y .
La mitad de los períodos son uniformes con un rango de tiempo relajado que representa la
incertidumbre relativa en el máximo y en las caídas. Las ventajas del modelo Genovese son:
o La incorporación de la información espacial
o El permite la comparación de modelos.
El modelo HRF se define para los distintos diseños experimentales, mientras que el modelo
Genovese está destinado a experimentos del diseño de bloques. Como estos modelos son
complicados computacionalmente, se plantea una simplificación con el filtrado de la variación
temporal a gran escala. La aproximación de Bayes es una simplificación que acelera el cálculo.

El análisis Bayesiano de datos FMRI presenta un modelo diferente denominado Hartvig,

que utiliza el punto marcado por el proceso que describe el patrón de la activación espacial.
Entonces se expresa el modelo general para la señal medida en el vóxel en el tiempo t como sigue:
Yit = ( Ai ( X ) + ηi ) φt + ∈it
Donde:
• η y ε son procesos Gaussianos.
• A(X) es el nivel de activación con parámetros marcados por el proceso en el punto X.
• es la variación temporal en relación con la respuesta BOLD.
El punto Xj es el centro de activación de la ubicación µj. El punto de marcado describe la
magnitud y la forma del centro. Si el proceso del punto de marcado es (X1, X2,…, Xn), entonces el
patrón de activación Ai(X), es una suma de funciones Gaussianas:
n
Ai ( X ) = ∑ h ( i; X j )
j =1
 π log 2  l12 l22  

Donde: h ( i ; X j ) = a j exp  −  +
d j  rj / (1 − rj ) (1 − rj ) / rj


  
Siendo
•
( l1 , l2 ) = R ( −θ j )( i − µ j ) para
R (θ )
con una rotación del ángulo θ.
•
( a , d , r ,θ ) son los parámetros independientes del proceso en la ubicación µ
j j j j
j
o aj es la altura de la densidad normal en el centro de µj

o dj es la zona del contorno de la elipse a media altura
o rj ε (0,1) es la medida de excentricidad de la elipse
θ j ∈ [ −π / 4, π / 4]
• es la orientación de la elipse.
Se calculan con a y d la inversa de rayos Gamma, y con r la inversa de Beta. Las a-priori
son independientes de µ. En la elección inicial del aspecto y la presentación del análisis, Hartvig
toma un modelo simple para la componente de tiempo :
TR  ( i × TR − 6 )2 
φt = ∑ π t −i exp  − 
2π 3  18 
i
 
Donde:
Π T = 1, durante los períodos de estimulación

• 
Π T = 0, en otro caso
Al insertar un punto en el modelo, los pasos son reversibles, es decir, se puede eliminar un
punto existente, o se pueden producir cambios en la posición o en las marcas de dicho punto.
5.2 Datos a priori en FMRI

Los datos a priori en el análisis Bayesiano son importantes para conocer la actividad real
que es homogénea y se produce en regiones que están conectadas espacialmente. Se consideran los
siguientes enfoques:
1) Se define una red previa múltiple, que es una jerarquía de la escala de vóxeles
individuales en la región de interés (ROI). Para pasar de una escala a otra, los vóxeles se reúnen en
regiones de tamaño 2P x 2P. Donde cada nivel del vóxel se trata en el siguiente nivel, porque los
vóxeles se agrupan en regiones 2x2 que cubren toda la región, en el siguiente nivel las regiones
donde se combinan en 4x4 cubriendo toda la región, y así sucesivamente.
2) Dentro de cada region se define la respuesta media del vóxel en esa region, como el valor
medio en el vóxel individual. El total toma la proporción de vóxeles activos en la región y es
uniforme.
Para un determinado nivel k, la probabilidad a-posteriori de que una región rk este activa es:
P ( Ark ) P ( Drk | Ark )
P ( Ark | Drk ) =
P ( Drk )
Donde:
• Ark es el evento de que la región rk es activa
• Drk es la media de la respuesta en la región rk
Se pueden establecer un modelo Bayesiano con una estructura autorregresiva AR(p), con un
error basado en el modelo lineal general. Siendo el modelo a-priori, una normal con media cero y
varianza: α k ( S S ) .
−1 T −1
Donde:
• εk es la precisión espacial para la variable k y se considera independiente a-priori.
• S es la matriz del núcleo espacial.
Los parámetros autorregresivos a priori son independientes a través de distintos vóxeles si cada
uno tiene una distribución Gaussiana con media cero. Antes de incorporar la información espacial
se cuantifica el modelo a través de la matriz que utiliza el operador de Laplace.
5.3. Cálculo
Los supuestos del modelo se simplifican para:
o Hacer el cálculo computacional.
o Debilitar la atracción.
o Ampliar el poder del enfoque.
Aliviando así la carga computacional de diferentes formas.
La variación Bayes es una familia de técnicas que aproximan la integral y la densidad para
evitar la aplicación de la cadena de Markov y la simulación de Monte Carlo.
Se considera la densidad a-posteriori general, p(θ|y), siendo el logaritmo de la probabilidad
marginal p(y):

log p ( y ) = ∫ q (θ | y ) log p ( y )dθ

Si q(θ|y) es una densidad arbitraria. Se utiliza la densidad condicional para obtener:
 q (θ | y ) p ( y,θ ) 
log p ( y ) = ∫ q (θ | y ) log   dθ
 p (θ | y ) q (θ | y ) 
Entonces se define:
 p ( y, θ )   q (θ | y ) 
F = ∫ q (θ | y ) log   dθ y KL = ∫ q (θ | y ) log   dθ
 q (θ | y )   p (θ | y ) 
Por tanto:
p( y ) = F + KL
• KL es la distancia entre q(θ|y) y p(θ|y). Este parámetro no es negativo. Alcanza el valor
cero cuando q(θ|y) que coincide con la densidad a-posteriori.
• F es el límite inferior de la densidad de y, y es igual a p(y) cuando KL=0.
La técnica de Bayes maximiza F, si la densidad factoriza de forma explícita las densidades
a-posteriori conjugadas debido a la elección de las a-priori. Se simplifica el procedimiento de
inferencia Bayesiana, al romper el análisis en cada paso. Esto implica el cálculo de la densidad a-
posteriori o del supuesto de contemplar la posibiblidad de independencia en niveles de la jerarquía.
El segundo nivel de este análisis es el método del enfoque híbrido frecuentista y Bayesiano, donde
los primeros sujetos del análisis de alto nivel utilizan el modelo lineal general ordinario sin a-priori
e incorpora un sistema Bayesiano de segundo nivel. Para cada tema, el modelo Y=Xβ+, se aplica
en condiciones de mínimos cuadrados generalizados para obtener la estimación del parámetro β .

Se define un efecto de interés dado por cβ, si c es un vector de pesos cuya suma es cero y que define
los contrastes. Bajo el supuesto de normalidad, la probabilidad del contraste de cβi es normal con
k
∑σ i
−2
cβ i
varianza σ . Esta distribución combinada también es normal, con media:
2 i =1
i k y varianza:
∑ σ i−2
i =1
1
k
∑σ
i =1
i
−2 .
Woolrich sugiere un enfoque donde la diferencia principal es la elección de la técnica

mientras que Neumann y Lohmann usan el marco conjugado.
Evaluar las integrales es una tarea complicada por ello se utiliza una aproximación rígida y
lenta de la Cadena de Markov y del enfoque Monte Carlo. Los resúmenes del análisis del primer
nivel hace un análisis frecuentista o Bayesiano, que se utiliza como entrada a los niveles más altos
de la jerarquía.
5.4. Conclusión

“En los últimos años las investigaciones de FMRI bajo la filosofía Bayesiana han
aumentado considerablemente. Estas técnicas tienen el objetivo de crear y dibujar la inferencia
“correcta” de los modelos espacio-temporales. También se ha avanzado en la capacidad
computacional y el desarrollo de nuevos estadísticos para manejar grandes y complejos conjuntos
de datos, que hacen que el procedimiento Bayesiano sea más factible.”

Capítulo 6
OTROS MÉTODOS DE ANÁLISIS
DE FMRI
Los métodos estadísticos específicos se usan para analizar los datos y crear mapas de los
parámetros del cerebro. Estos métodos indican que cada vóxel individual es dicotómico
(activo/inactivo) y probable en las regiones. La tarea clasifica cada vóxel según si:
o El estudio es significativamente activo
o No es un problema de multiplicidad.
Toda prueba estadística decide si el estudio es:
o Significativo
o No significativo
La tasa de error de la familia wise (FWER), es la probabilidad de tener un descubrimiento
falso sobre el conjunto de pruebas. La tasa de control de falso descubrimiento (FDR) es la
proporción de vóxeles declarados erróneamente activos, de entre todos los vóxeles activos.
Bonferroni controla el uso de múltiples pruebas para FWER, aunque este método es demasiado
conservador para el FMRI. Por ello Bonferroni se ajusta al nivel de significación /m,
Siendo:
• m el número de pruebas,
•  es el nivel de importancia global,
Por la prudencia extrema del método de Bonferroni y la incapacidad de considerar las
características particulares de los datos FMRI, se necesitan otras técnicas que controlen el error.
6.1. Cluster umbrales.

Se observa que la activación se reparte entre varios vóxeles contiguos. Se consideran
vóxeles aislados aquellos que tienden a ser ignorados. Un mapa no contiene activación nula ya que
los vóxeles individuales no alcanzan la significación suficiente para generar cuadrículas de valores
uniformes en [0,1]. Si un valor está por debajo de 0.05 se declara sensible y senencuentra para cada
simulación:
o El número total de grupos
o El tamaño de las agrupaciones
o Número total de píxeles
Se define el problema umbral con los elementos que determinan la probabilidad de
descubrir un falso:

1) El criterio para rechazar la hipótesis nula para un vóxel dado el nivel , se

denomina C().
2) El tamaño de un grupo contiguo de vóxeles activos. Se considera activo a un vóxel
que cruza el valor C(), para formar un grupo contiguo de tamaño S.
Cuando estas condiciones no se cumplan simultáneamente, no se alcanza la significación. Si
el tamaño del umbral clúster se ha fijado en S, no es posible encontrar grupos activos inferiores a S.
Si C() es fijo:
o S aumenta
o La probabilidad de detectar los falsos positivos disminuye.
Al combinar dos umbrales C(), el grupo S:
o Pierde la capacidad de detectar pequeñas zonas de activación.
o Se gana en la detección de áreas más grandes.
El método se basa en simulaciones empíricas para encontrar el número de grupos con un
tamaño determinado, para:
o Un nivel de significación de un vóxel.
o La situación nula de ningún vóxel activo.
A partir de los mapas simulados se calcula la probabilidad de encontrar un vóxel de falsos
positivos, en una base vóxel en función de S y . La correlación induce en la base de datos
simulados un filtro de guassiano de diferentes anchuras:
o Una pequeña cantidad de suavizado representa menos correlación.
o Una gran cantidad de suavizado representa más correlación.
Se implementa una técnica umbral en FMRI con AFNI, que calcula y especifica la cantidad
de suavizado adecuado para un conjunto de datos en el cálculo umbral para un vóxel, con un nivel
de significación general y un umbral particular S. Si es fijo el aumento del tamaño del racimo
entonces la probabilidad de cada vóxel en el grupo de falsos positivos disminuye a cero. Las
cantidades más grandes de correlación espacial tienen una disminución más lenta. Los vóxeles se
correlacionan y se agrupan. Si un vóxel es un falso positivo, entonces sus vecinos de agrupación
también pueden ser así. Al disminuir el análisis de correspondencias, el efecto y los grupos que
componen un vóxel es casi independiente.
6.2 Teoría de Campos Al Azar.

El método umbral de grupo se utiliza en:
o La teoría de campos al azar
o Problema del error FMRI
o Umbrales de permutación
o El tema de la próxima meta
o Detección de grupos contiguos de vóxel activos.

El campo al azar y los umbrales de permutación consideran el máximo valor del estadístico
y minimizan el p-valor. Con esto se estudia la dependencia de los datos y se detectan los grupos de
actividad. El enfoque umbral del campo al azar se basa en la característica Euler del conjunto de
excursión. Este conjunto describe los vóxeles que están por encima del umbral especificado.
o Los umbrales altos de la característica Euler corresponden al número de máximos
locales.
o Los umbrales bajos de la característica Euler cuentan el número de grupos conectados
con el menor número de “hoyos”.
• Si el umbral es suficientemente grande, los agujeros desaparecen y solo quedan los grupos.
• Si el umbral aumenta al máximo del estadístico en el mapa, la característica Euler toma el
valor:
• 1 si el máximo está por encima del umbral
• 0 en caso contrario.
Los umbrales elevados de la característica Euler es una función indicador para los vóxeles
que están por encima del umbral. El análisis FMRI utiliza la teoría al azar, porque interpreta
fácilmente las diferentes cantidades.
Worsley describe la probabilidad aproximada de que el estadístico tmax este por encima del
umbral de t por:
D
P ( tmax ≥ 1) ≈ ∑ µd ( S ) pd ( t )
d =0
Donde:
• S es el espacio de búsqueda (cerebro).
• µd(S) es la dimensión intrínseca del volumen-d del espacio de búsqueda.
• pd(t) es la característica tridimensional de la densidad d de Euler, t(s) es el estadístico
calculado en el punto, s ε S.
• Para d = D se tiene la cantidad más importante, y los demás términos son
correcciones límites.
La característica Euler depende del tipo estadístico, mientras que el umbral trabaja de forma
individual para cada lugar al azar. Gauss considera que los campos al azar para X2, t, F son campos
aleatorios. El campo al azar se aplica en imágenes del cerebro realizando inferencia para imágenes
aleatorias.
6.3. Umbrales obtenidos a través de permutación

Estos umbrales obtienen imágenes lisas y uniformes, así como un umbral suficientemente
alto. El método de permutación obtiene umbrales basados en el intercambio de la hipótesis nula. En
cada permutación se calcula el valor del estadístico y se compara con el valor observado del
estadístico. Al controlar las múltiples pruebas se obtiene un umbral considerando que las
permutaciones se realizan en el plano de la imagen. Este cálculo se realiza a través del estadístico

del máximo creando una conexión con el campo al azar. El estadístico del máximo es el mayor
valor del vóxel en una imagen como resumen de la imagen como un todo.
Se consideran dos tipos de umbrales:
o Umbral único
o Prueba de grupo por encima del umbral.
El único límite de la prueba umbral de la imagen es un valor crítico determinado de forma
que:
o Si todos los vóxeles están por debajo de ese valor crítico, entonces la hipótesis nula
de la no activación no se puede rechazar.
o Si un vóxel es superior al umbral, entonces se puede rechazar.
La distribución del método se convierte en la máxima permutación de la imagen.Para un
nivel global fijo, la significación  y el número de permutaciones N, se calcula el umbral critico
como c+1, donde c es N, (redondeando al entero más cercano). Esto representa el percentil 100(1-
) de la distribución de la permutación máxima. Entonces se rechaza la hipótesis nula, con un
vóxel que supera el umbral crítico basado en la distribución del máximo. Esta prueba controla el
error tipo I.
Se intenta descubrir y evaluar la importancia de los grupos vóxeles que están conectados
por encima de un umbral predeterminado. Considerando sólo activas las regiones contiguas con el
tamaño más grande. La distribución de la prueba por encima del umbral inicial, es la hipótesis nula,
que está determinada por los métodos de permutación. Este enfoque es muy potente, pero no se
realizan pruebas para los vóxeles individuales, sino para los grupos de vóxeles conectados.
La prueba de activación utiliza junto al umbral, la evaluación del grado de activación del
clúster si se utiliza el método de permutación, para valorar su significación. Para ello se combina la
intensidad del vóxel con la extensión del clúster al utilizar una variedad de funciones de
combinación sencillas.
Se define:
•
Pi I el p-valor de la intensidad máxima de la agrupación del vóxel i.
•
Pi S el p-valor para el tamaño del clúster i.
Entonces se define la combinación de estos efectos de la siguiente manera:
• Ti T = min ( Pi I , Pi S )
• Ti T = −2 ( log Pi I + log Pi S )
Por todo esto se propone un enfoque de permutación multinivel, donde:
I S
1) Se deriva el p-valor corregido para Pi y Pi por la técnica habitual de permutación.
2) Se repite el procedimiento para los estadísticos combinados.
3) Se define y evalúa la importancia de un meta-dato que combina y compara la
combinación de funciones individuales.

Este enfoque da más peso a unos u otros atributos de la prueba, ya sea por tamaño o
por intensidad, mientras se evalúa la significación del estadístico. Dado que el número de
permutaciones es grande, se hace imposible el numerar todos los resultados, y por ello se toma una
sub-muestra aleatoria de todas las permutaciones posibles. Teniendo en cuenta que la muestra tiene
que ser lo suficientemente grande para alcanzar el nivel de significación deseado.
6.4 Control de la tasa de falsos positivos

Se controla la corrección de Bonferroni para:
o La tasa de error de la familia-wise
o La probabilidad de error de identificar un valor nulo único.
En FMRI, no se controla la tasa de la familia-wise, pero si la situación de activación.
Bonferroni como estadístico consevador induce una falta de potencia del análisis estadístico lo que
contribuye a la inadecuación del ajuste de la multiplicidad.
La tasa de falsos descubiertos (FDR) expresa la proporción de falsos declarados entre los
declarados significativos. Esta tasa es potente, intuitiva y facilita la implementación del
procedimiento con una aplicación en el análisis de grandes conjuntos de datos.
Este procedimiento define el seguimiento del control de la tasa de falsos descubiertos en el
nivel q, según los supuestos débiles:
p(1) ≤ p( 2) ≤ L ≤ p( m −1) ≤ p( m )
1) Para los m p-valores en orden creciente
La hipótesis correspondiente a p(i) se denota por H(i).
2) Sea r el más grande i de tal manera que:
i
p( i ) ≤ q
m
3) Rechazar la hipótesis nula H(1), H(2),…, H(r)
Si no se rechaza la hipótesis nula, el criterio de la segunda fase del
procedimiento no se cumple para i, siendo la tasa de descubrimiento cero. En
este contexto se interpreta el parámetro q como la proporción de falsos
descubiertos que están dispuestos a tolerar. En los datos FMRI se encuentran los
valores conservadores de q, incluso con valores pequeños de q. El valor q es una
adaptación de los niveles de activación en el mapa estadístico FMRI. Para un
mismo valor q existen distintos valores umbrales equivalentes en la escala del
estadístico. Por ello se necesita establecer un umbral que proporcione mejores
resultados a todas las materias.
6.5 Método AD HOC

El método conocido como el AD HOC umbral se basa en la necesidad de decidir que
vóxeles son realmente activos. El método es simple y establece un umbral arbitrario en el
estadístico según lo que se ve adecuado.

Este método es insuficiente, si el umbral arbitrario se justifica a posteriori, por una

apelación a la corrección de Bonferroni o al control FDR entre otros métodos.
6.6. Procedimientos basados en series de tiempo FMRI y en HRF

Para detectar las zonas de activación el mapa umbral se recurre a la serie de tiempo FMRI y
a la estimación HRF. Utilizando los procedimientos característicos del recorrido de tiempo que
distingue a los vóxeles que tienen un comportamiento indicado por la actividad. Un enfoque utiliza
el análisis de la varianza para detectar los vóxeles que exhiben un patrón coherente a la respuesta
del estímulo en los eventos relacionados en el estudio. Un vóxel muestra una respuesta a un
estímulo repetido, si un número medio de pruebas reducen la señal, entonces la varianza evoluciona
en el tiempo para las pruebas de vóxeles no activas, ya que el patrón de respuesta es al azar. Este
método se compara con la variación de puntos de tiempo con algunas diferencias entre los puntos de
tiempo en cada vóxel, donde los vóxeles y los puntos de tiempo se tratan como independientes.
Bajo la hipótesis nula de no activación y el modelo ANOVA, se observa que estas dos cantidades
siguen una distribución F.
Al crear un mapa M, se recurren a métodos umbrales como en la teoría del campo al azar.
Pero se aprovecha las distintas características del recorrido de los vóxeles activos y no activos. Se
evita el enfoque estándar umbral al explorar las características de las respuesta FMRI. La serie del
tiempo vóxel se agrupa para identificar los distintos grupos de interés. En las agrupaciones de
interés los vóxeles se muestran las características de la respuesta activa en el estímulo, reduciendo
el número de vóxeles en el estudio. Para reducir los vóxeles se utiliza:
o La eliminación del recorrido del tiempo que estadísticamente no es diferente del ruido
blanco.
o La eliminación de los vóxeles que no están en el tejido de la materia gris del cerebro.
Después de esto, se aplica el algoritmo clúster difuso, siendo dos elementos esenciales de este
algoritmo:
o El número de agrupaciones que se debe determinar.
o El índice de la falta de claridad, mide la fuerza de la partición.
Los valores de este índice indican:
o Si son altos, una participación borrosa.
o Si son pequeños, una participación nítida.
Se propone un enfoque con una estimación simultánea y se clasifica la respuesta
hemodinámica en un evento relacionado con el estudio FMRI. La clasificación de la curva de
repuesta crea un mapa de activación. El primer paso consiste en k repeticiones del experimento y si
el estimulo está presente durante un segundo seguido de t, entonces:
o Antes del promedio hay k (t+1) observaciones.
o Después del promedio hay t+1 observaciones.

Un polinomio de tercer grado se utiliza para ajustar HRF a la señal media, donde el
tratamiento de los coeficientes de la curva son los efectos aleatorios. Según la naturaleza de las
respuestas en un vóxel se presenta o no la característica de una respuesta BOLD. Cuando una región
del cerebro se activa, se produce un retraso en la respuesta hemodinámica en relación con el inicio
del estímulo. Una vez que se ha formado la respuesta, se crea un pico con una cantidad de tiempo
dependiendo de la persona y de la tarea. Si la estimulación no es continua, la respuesta se apaga,
volviendo a la línea de base. Entre el máximo alcanzado en el pico y el mínimo alcanzado en el
retorno de la línea base, existe una diferencia que debe ser grande para se considere que la
activación ha tenido lugar. Esto se calcula mediante los puntos y los valores críticos del polinomio
cúbico. La diferencia entre los coeficientes del polinomio, los puntos críticos y los valores tiene un efecto
relacionado con la respuesta BOLD. Los vóxeles se agrupan mediante un algoritmo en el método k
y los vóxeles que no muestran el comportamiento necesario se eliminan. Y sólo se mantienen las
agrupaciones de vóxeles que cumplen los criterios anteriores. El método se basa en el promedio de
las k (t+1) observaciones originales, aunque esto da lugar a pérdidas de datos, y sin hacer caso a las
diferencias entre las k repeticiones.
6.7 Otras técnicas

La región de interés (ROI) se desarrolla para comparar el análisis ROI múltiple a través de
grupos experimentales de sujetos. En cada retorno de la inversión de cada grupo experimental, se
calcula la combinación lineal de la media y la mediana, λ x + (1 − λ ) med ( x ) para:

• λ>0
• x los datos observados en el retorno de la inversión.
La elección de λ se realiza a través de los métodos de arranque y son diferentes para
cada retorno de la inversión y para cada grupo experimental, como resultado de un
procedimiento de adaptación. Para comparar dos grupos de sujetos en un determinado
retorno de la inversión se comparan los valores de la combinación lineal, con la ampliación
de la muestra colectiva de la desviación estándar. El problema de utilizar múltiples pruebas
a través de ROI se resuelve utilizando distintos métodos de permutación en relación al paso
de los procedimientos. Para la etapa del enfoque descendente, el estadístico en el rendimiento de
la inversión K, se ordena de mayor a menor. En comparación con su distribución, el valor
observado es extremo, y rechaza la hipótesis nula de la diferencia en el rendimiento de la inversión
correspondiente. Este procedimiento se repite para los n-1 estadísticos siguientes, con regiones de
rechazo más grandes, hasta que no se pueda rechazar la hipótesis inicial. La prueba estadística de
adaptación no asume la misma distribución de las observaciones en todos los ROIs y en todos los
grupos experimentales. En los datos simulados y reales, se toma λ solo una vez para cada retorno de
la inversión, aunque λ toma distintos valores por grupo. La simulación muestra que el estadístico se
adapta a la distribución de los datos, cambiando λ a medida que varía la distribución de los datos.

En los datos reales, la corrección de la multiplicidad detecta diferencias entre dos grupos de
sujetos en ROIs múltiples. Aunque este método no da buenos resultados para más de dos grupos de
sujetos. El análisis de correlación tradicional distingue entre vóxeles activos e inactivos en series
de tiempo de la correlación con una Wavelet especificada de antemano. Cada experimento FMRI se
repite dos veces en una misma sesión, con la correlación de cada vóxel la misma. Entonces los
vóxeles que son realmente activos muestran un alto nivel de coherencia. Se propone para ello el
siguiente criterio con dos etapas:
1) La correlación de la serie de tiempo esta por encima de un umbral determinado.
2)El vóxel es parte del grupo de vóxeles con una correlación por encima del umbral
Un vóxel activo muestra un comportamiento coherente y alcanza un elevado nivel de
correlación con cada repetición del experimento en una sola sesión. El proceso se repite al menos
dos veces en el mismo período de sesión para cada tema, al llevar a cabo un estudio de FMRI. Por
tanto estos sujetos están más tiempo en el escáner.
6.8 Evaluación de los métodos

Las técnicas que controlan el error familia-wise (FWER) se comparan con un estudio que
abarca:
o La permutación de los métodos de muestreo.
o Los campos al azar.
o Bonforreni.
Se aplica a las imágenes Gaussianas y considerando el estadístico T.
Se elige el enfoque umbral basado en la inclusión de métodos que explican las
dependencias espaciales de los datos, para encontrar el umbral de significación que es menor para
los métodos de permutación. Las diferencias entre los distintos métodos son más pronunciadas en
estudios con pocos grados de libertad. Cada procedimiento umbral determina los umbrales más
bajos por el método de permutación que conduce a vóxeles activos. Los umbrales del campo al azar
implican que los vóxeles menos activos se encuentran en los experimentos donde no se detecta
actividad. Estos umbrales son conservadores a menos que:
o Los datos se suavicen.
o El grado de libertad del mapa sea grande.
Un estudio se considera comparativo con los siguientes tipos de error:
o Error simple, error tipo I.
o Error familia-wise
o Tasa de falso descubiertos.
Un conjunto de datos simulados diseñan un experimento simple, con varias estructuras de
correlación que ponen a prueba los diversos métodos umbral. Se puede comparar cinco métodos de
umbralización:
1) Sin ajustar a la multiplicidad.

2) La corrección de Bonferroni.
3) Permutación de muestreo para el control de la FWER.
4) Sencillo control FDR.
5) Procedimiento de muestreo para el control de la FDR.
El modelo se ajusta a la mayor potencia para detectar si la activación es cierta, con un

número elevado de fasos descubrimientos. Cada vóxel de la imagen simulada incluye el aire fuera
del cerebro, declarándose activo al menos una vez, si los tiempos son múltiples en el transcurso de
las simulaciones. Los vóxeles se correlacionan si hay poca posibilidad de utilizar un enfoque de
permutación que controla la tasa de error por FWER o por FDR. La fuerza de la permutación,
basada en umbrales, existe cuando una fuerte correlación espacial se hace evidente en el muestreo.
Para controlar FWER y FDR es mejor desempeñar versiones simples con mayor poder para detectar
la activación.
Los resultados de la simulación se aplican a las técnicas umbrales del experimento. Una
pequeña diferencia se encuentra entre el procedimiento simple para el control del error y el
muestreo que incorpora dependencia espacial. El procedimiento FDR descubre más vóxeles activos
que el procedimiento FWER, porque FDR impone criterios menos estrictos.
Se suele comparar los métodos umbral:
o Control de FWER a través de la teoría de campo al azar.
o El control de FDR.
o Umbral Bayesiano asociado a la posibilidad a-posteriori.
El método del campo aleatorio produce menos error tipo I y tiene pequeños errores estándar
de la estimación. Con esto se llega a la conclusión de que ningún método determina a los demás,
entonces la elección de la técnica umbral depende del error tipo I y II.
1) El procedimiento de control FDR es preferible al procedimiento de control FWER,
porque es más poderoso y porque el control es más relevante e interesante.
2) La carga adicional de los cálculos del método de permutación no compensa, excepto
que exista una razón a priori para creer que hay un fuerte correlación entre los datos.
6.9 Otros problemas

Existe una alternativa al análisis del cerebro, el análisis de las regiones predefinidas de
interés. El rendimiento de la inversión es el área del cerebro que se define por:
o La anatomía
o La función
o Ambos.
En este caso, el enfoque a priori es un retorno de la inversión, en particular, y el
problema de múltiples pruebas se reduce al concentrarse en esas zonas. Aunque el número
de vóxeles en un retorno de la inversión es menor que el número en toda la imagen, el

retorno de la inversión se define de forma individual para cada sujeto en el estudio, ya que
el esfuerzo consume mas tiempo. La proporción de vóxeles activos o el grado de actividad en el
retorno de la inversión, son características que se comparan a través de temas o grupos
experimentales mediante técnicas estadísticas estándar. El paso intermedio entre el análisis del
cerebro y el análisis ROI, es posible si se quitan las partes de la imagen que no son válidas para la
activación. La imagen se puede enmascarar en los vóxeles incluidos dentro del cerebro. Induciendo
un error en el análisis mediante los vóxeles pertinentes. Al reducir el número de vóxeles se afina la
inferencia y el poder adquirido. La primera estimación del número m0 de la hipótesis nula
verdadera, se basa en los ajustes de multiplicidad de m-m0 en lugar de m. Una hipótesis nula es falsa
cuando los p-valores son pequeños. Además bajo la hipótesis nula, el p-valor se distribuye
Uniforme [0,1]. Se busca la ruptura de la recta correspondiente a la uniformidad, por tanto se
encuentra la estimación de m0. , m 0. , basada en los p-valores más grandes. Los p-valores son
lineales y la pendiente de la recta es b=1/ ( m 0. + 1) . Para obtener una estimación de m0., se traza
una recta a través de los p-valores más grandes que pasan por el punto (m+1,1), con pendiente b$ y
m0. = 1/ b$ . La recta se ajusta utilizando los m-1 p-valores más grandes. La pendiente pasa por los
( ) ( )
puntos (m+1, 1) y i, p( i ) , Si = 1 − p(i ) / ( m + 1 − i ) , si Si ≥ S(i-1), hasta el primer k, Sk < Sk-1. Se
estima el número de nulos verdaderos m 0. = min (1/ S k + 1) , m  , con un pequeño valor de m, y
con el mayor entero de la inversa de la pendiente Sk.

Se utiliza el análisis del cambio de punto junto con la presentación gráfica de los p-valores
para estimar m0. Con el siguiente procedimiento:
Se aplica una prueba de uniformidad al conjunto de p-valores de forma iterativa. A partir
del conjunto inicial, se rechaza la prueba de uniformidad cuando se descarta el menor p-valor, a esta
misma prueba se le aplica un conjunto reducido de datos hasta que la hipótesis de uniformidad no se
rechaza. El máximo residual considera la prueba estadística que usa la simulación para determinar si
un conjunto de p-valores que difieren significativamente de la distribución. Un modelo basado en
las ideas gráficas de adaptación es trazar un histograma de los p-valores, en lugar de representar los
p-valores, en el caso de que algunas pruebas son nulos verdaderos y otros no. El lado izquierdo del
histograma representa los p-valores más pequeños y está compuesto por los nulos verdaderos y por
nulos falsos. El resto del histograma será más o menos uniforme. El modelo de la distribución de los
p-valores, es la mixtura de la Uniforme [0,1] y de otra distribución. La familia Beta es flexible e
incluye la uniforme como un caso especial. El siguiente modelo muestra la distribución de los p-
(
valores como una mixtura de la Beta(a, 1) y la Uniforme [0, 1]: f ( p | π , a ) = π + 1 − π ap
a −1
)
Con este modelo se estima la densidad representada en un histograma.

La estimación de π es la estimación de la proporción de veces donde se da la hipótesis nula

en los datos. Se alcanzan cotas superiores estimadas sobre la tasa de falsos descubrimientos, que a
su vez están conducidos por un umbral de adaptación. Se usa FDR condicional (cFDR), para la
proporción esperada de descubrimientos falsos, dado que los r vóxeles se declaran activos.

Capítulo 7
Implementación en código
MATLAB
7.1. Introducción
Según se ha descrito en capítulos anteriores, muchos métodos están disponibles para el
análisis estadístico de los datos de la fMRI, desde un modelo lineal simple para la respuesta y un
modelo global de primer orden autorregresivo de los errores temporales (SPM'99), a un modelo más
sofisticado no lineal para la respuesta con un modelo de estado espacio local de los errores
temporales (Purdon). La implementación de estos métodos, por ejemplo, en código Matlab debe
proporcionar un compromiso: rapidez, eficiencia, generalidad y validez. Los objetivos principales
son:
1) Reducir el sesgo en la estimación de los parámetros de un modelo autorregresivo de los
errores.
2) Combinar los resultados de series independientes a través de un sencillo modelo de efectos
aleatorios estimados por el algoritmo EM.
3) Modificar el algoritmo EM para reducir el sesgo y aumentar la velocidad de ejecución
4) Regulación espacial del efecto aleatorio para aumentar los grados de libertad.
5) Mejorar la ejecución general velocidad del código informático.
El resultado es un conjunto de cuatro funciones de MATLAB, conocidos colectivamente como
fmristat, que están disponibles libremente en la web en http://www.math.mcgill.ca/keith/fmristat.
o El primero, fmridesign, establece la matriz de diseño de un modelo lineal para el
estímulo externo convolucionado con una función de respuesta pre-especificada
hemodinámica (HRF).
o El segundo, fmrilm, ajusta el modelo lineal a una única prueba de los datos fMRI
permitiendo correlación espacial de los errores. También se puede estimar el retraso voxel-
racional de la HRF.
o El tercero, Multistat, combina la salida de los análisis por separado de fmrilm de
pruebas diferentes en un período de sesiones, sesiones diferentes sobre el mismo tema, así
como entre los sujetos dentro de una población, utilizando un tipo de análisis de efectos
aleatorios.
o El cuarto el umbral tstat fija el umbral de detección de pico y el tamaño del clúster
utilizando la teoría del campo al azar.
Se debe tener en cuenta que la normalización espacial registra imágenes de un atlas estándar,

mientras que las coordenadas Tailarach, sólo se realizan en la salida de cada período de sesiones, no
en los datos originales, ni la salida de cada carrera. Esto reduce la cantidad de normalización
considerablemente.
7.2 El diseño del modelo estadístico
7.2.1 El modelo de la señal

El primer paso en el análisis estadístico de los datos de la fMRI es construir un modelo de
cómo los datos responde a un estímulo externo. Supongamos que sin ruido la fMRI responde a un
voxel particular en el tiempo t dada por x(t), y el estímulo externo está dado por s(t). La
correspondiente respuesta de la fMRI no es inmediata, hay un retraso de la respuesta en el máximo
en aproximadamente 6 segundos. La forma más sencilla de calcular este modelo es suponer que la
respuesta externa por convolución del estímulo de la fMRI con una respuesta de la función
hemodinámica h(t) de la forma:
∞
x ( t ) = ∫ h ( u ) s ( t − u ) du
0
Se han propuesto varios modelos de h(t), un modelo sencillo es una función gamma a
diferencia de dos funciones gamma que modelan levemente la inclinación de la intensidad, después
de la respuesta hemódinamica, la inclinación se ha reducido a cero. Un ejemplo es la HRF está
disponible en SPM '96:
 ( t − d1 )   t   (t − d2 ) 
a1 a2
 t 
h ( t ) =   exp  −  − c   exp  − 
 d1   b1   d 2   b2 
Siendo:
• T el tiempo en segundos
• d j = a jb j el tiempo máximo
• a1 = 6, a2 = 12, b1 = b2 = 0.9 segundos

• c = 0.35
• Las submuestras se adquieren en los tiempos t1,…, tn para xi = x(ti) en i.
El efecto combinado de k tipos de estímulos diferentes en los datos escaneados (i) denotado
por k diferentes respuestas xi1,…, xik a menudo se supone que es aditivo, pero con diferentes
coeficientes multiplicativos β1,…, βk que varían de voxel a voxel. La respuesta combinada de la
fMRI se modela como un modelo lineal (Friston)
xi1βi + K + xik β k
Algunos voxels de las series de datos en las fMRI muestran una deriva considerable en el
tiempo. La deriva puede ser lineal, o con una variación lenta más general. Si no se elimina la deriva
entonces puede ser confundido con la respuesta fMRI, sobre todo si los estímulos varían lentamente
con el tiempo, o se añade a la estimación del ruido aleatorio.

La deriva puede ser eliminada, por un filtro alto, bajo o mediante la introducción de términos
variación de la frecuencia, como cosenos, polinomios o por un modelo lineal. La función de
transformación del coseno tiene pendiente cero en los extremos de la secuencia, por ello se utiliza la
función polinomica. Todo puede ser escrito como respuestas adicionales, xi , k +1 ,K , xi , m en el
instante i, y se agrega al modelo lineal. Por ejemplo, un polinomio con derivada de orden q se puede
eliminar mediante la adición a un modelo lineal xi ,k +1+ j = ti j , j = 0,1,K , q, m = k + 1 + q . Un error
aleatorio εi se añade para obtener los datos observados en fMRI, en el índice de tiempo i:
Yi = xi1β1 + K + xik β k + xi ,k +1β k +1 + K + xim β m + ε i = xi' β + ε i
1442443 144424443
respuesta FMRI deriva
Siendo:
• xi = ( xi1 ,K , xim ) '
• β = ( βi1 ,..., β im ) '
7.2.2 Modelización del ruido

Los errores no son independientes en el tiempo, normalmente la correlación entre las
exploraciones dura unos tres segundos pero no puede ser tan alto en las regiones corticales. Se
utiliza el ajuste del modelo por mínimos cuadrados para estimar cada parámetro β, y no tener en
cuenta la estructura de correlación o usando el modelo de correlación errónea, provocando sesgos
en el error estimado de la estimación de β. El modelo de la estructura más simple de correlación
temporal es el modelo autorregresivo, de orden uno, en el que las exploraciones son iguales en el
tiempo y en el espacio y se supone que el error de los últimos análisis se combina con el nuevo
ruido para producir el error para el escaner actual:
ε i = ρε i −1 + ξi1
Siendo:
• |ρ|<1
• ξi1 una secuencia independiente e idénticamente distribuidos según una variable
aleatoria normal con media 0 y desviación estándar, es decir, σ 1 , ξi1 N ( 0, σ i2 )
(conocido como 'ruido blanco').

El resultado de la autocorrelación en el retraso es:
Cor ( ε i , ε i −1 ) = ρ l
Esto se extiende a los modelos autorregresivos de orden p, denotado por AR(p), especificado
por:
ε i = α iε i −1 + α 2ε i − 2 + K + α pε i − p + ξi1
Siendo la estructura de autocorrelación más compleja, incluso en condiciones oscilatoria, así

como un descenso exponencial. Para tener en cuenta el ruido blanco del escáner, se ha ampliado el
modelo AR(1) para agregar un segundo término independiente de ruido blanco.
7.2.3 fMRIdesign
La función de MATLAB fmridesign toma como entrada el estímulo s(t) y los
parámetros de la función de respuesta hemódinamica (HRF(2)), calculan la respuesta x(t),
luego se toman muestras en distintos momentos de la adquisición producidos por un conjunto
diferente de regresores de la variable xi para cada sector. Este análisis utiliza regresores
adaptados a cada sector, mientras que SPM simplemente aumenta los regresores que incluyen
las covariables adicionales del modelo con pequeños cambios en el tiempo inducido por la
adquisición del corte secuencial.
fmridesign especifica una área, por regresor específico, mientras que SPM aumenta la
matriz de diseño incluyendo un regresor adicional que conserva el mismo diseño de la matriz
en todos los voxels.
7.3. El análisis de los modelos lineales de una única prueba
7.3.1 Estimación de los parámetros de la señal

Worsley y Friston propusieron la estimación de β por minimos cuadrados:
Yi = xi1β1 + K + xik β k + xi ,k +1β k +1 + K + xim β m + ε i = xi' β + ε i

1442443 144424443
respuesta FMRI deriva
Un estimador general insesgado de β se encuentra multiplicando el vector de observaciones

Y = (Y1,..., Yn)’ y el modelo por una matriz de An × n. A continuación se estudia la estimación de los
parámetros por mínimos cuadrados. El estimador eficiente de β se obtiene mediante la elección A =
V-1/2, donde es el Vσ2 es la matriz de varianza n × n de Y, de modo que la varianza de los errores
resultante es proporcional a la matriz identidad, lo que equivale a 'blanquear' los errores. SPM'99
elige A para suprimir altas y bajas frecuencias:
o La eliminación de las bajas frecuencias implementa un blanqueamiento
aproximado de los datos
o La eliminación de las altas frecuencias hace que la inferencia resultante sea robusta
frente a errores de especificación de la estructura de correlación (Friston).
SPM'99 adopta un modelo AR(1) de los datos originales, cuyo parámetro ρ se supone que es
constante a través del cerebro, en lugar de variar espacialmente. Aunque no hay pruebas de que ρ
no es constante, se suaviza aparentemente la componente temporal para aliviar este problema. La
estrategia del pre-blanqueamiento con un espacio para distintas A = V-1/2, pero esto, en la práctica,
conlleva mucho tiempo si se repite en cada voxel. Afortunadamente, hay maneras de encontrar
efectividad biológica de cómputo V-1/2 si los errores son generados por un proceso AR(p) o un
modelo de espacio de estado (utilizando el filtro de Kalman). El modelo AR(1), por ejemplo, pre-

blanquea los datos y logra regresores
Y 1 = Y1 , Y i =
(Yi − ρYi −1 )
1− ρ 2
X 1 = X1, X i =
( X i − ρ X i −1 )
1− ρ 2
Con i = 2,…, N, de modo que el modelo se convierte en
'
Y i = X i β + ξi
Siendo:
• ξi N ( 0, σ 2 ) de forma independiente.
σ 12
• σ2 =
(1 − ρ )
Designando la seudoinversa por +; el estimador de mínimos cuadrados en la fórmula anterior
es:
β = X +Y
Siendo:
• ( )
X = x1 ,K , xn ' es el diseño de la transformada de la matriz
• ( )
Y = y1 ,K , yn ' es la observación de la transformada del vector.
7.3.2 Estimación de parámetros del ruido

El vector de residuos r = (r1,..., rn)’ es
+
r = Y − X β = RY , R = I − X X
Si V es conocida, entonces se estima σ2 es estimado por:
2 r 'r
σ =
υ
Siendo: υ = n − rank X ( ) los grados de libertad, igual que n - m si el modelo no se ha terminado
con parámetros. Pasamos ahora a la estimación de los parámetros de la estructura de correlación V.
En primer lugar, se estima β por mínimos cuadrados para los datos originales no transformados, es
decir, con una igualdad en la matriz identidad. Si bien no es totalmente eficiente, este estimador es
insesgado, por lo que los residuos tienen cero expectativa y una estructura de correlación
aproximadamente igual a la de los errores ε. El parámetro del modelo AR(1) se estima por la
n
autocorrelación muestral de los residuos
∑rr i i −1
ρ= i =2
n
∑r
i =1
i
2

Y 1 = Y1 , Y i =
(Yi − ρYi −1 )
Sustituyendolo en: 1− ρ 2
X 1 = X1, X i =
( X i − ρ X i −1 )
1− ρ 2
El sesgo reducido regularizado ρ produce datos blanqueados aproximadamente que se utilizan

2 r 'r
para producir los valores finales de β y de β = X + Y y σ = . Esto se reitera para re-estimar
υ
r, β y ρ pero en la práctica esto no parece mejorar mucho el método.
7.3.3 Blas reducción y regularización de las autocorrelaciones
Una estimación del sesgo ρ se debe a la correlación de los residuos inducidos por la
eliminación de una recta estimada a partir de las observaciones. Esto se debe a la varianza de la
matriz de los residuos es RVRσ2, que no es la misma que la matriz de varianzas de los errores Vσ2.
Aunque ρ es 0.05, un valor inferior a lo esperado.
Teniendo en cuenta que SPM'99 estima un valor global de ρ basado en la agrupación de la

muestra a partir de la autocorrelación de los datos en bruto después de la normalización, teniendo
en cuenta que este problema se debe evitar. Esto se realiza a costa de la introducción de otra fuente
potencial de sesgo debido al hecho de que la señal y los términos de deriva, no eliminan la
normalización global, porque no han sido removidos. Sin embargo, sólo una pequeña fracción de
los voxels debe mostrar la señal, así que cuando la autocorrelación reúne los voxels esta fuente de
sesgo se reduce. Debido al uso global de una estimación local de ρ, este sesgo se reduce en la banda
de paso la estrategia de filtrado.
Un método para obtener parámetros con menor sesgo es la máxima verosimilitud restringida
o restringida estimada (REML), pero se trata de iteraciones costosas. Por ello se propone un
método rápido, basado en equiparar las autocovarianzas. Insertanto las autocorrelaciones
resultantes en las ecuaciones de Yule-Walker y obtiendo estimaciones de los parámetros AR(p).
Sin embargo antes de hacer esto, hay que regularizar las autocorrelaciones. En la práctica los
parámetros de autocorrelación estimados difieren considerablemente de los valores reales. Incluso
en ausencia de correlación. Si la desviación estándar de la autocorrelación de la muestra ρ es
aproximadamente 1 , o alrededor de 0,1 para las ejecuciones típicas de n = 100 lecturas. Esto
n
es bastante grande en comparación con las correlaciones que oscilan entre 0 y 0,4. Ciertos métodos
de regularización reducen esta variación y alcanza este objetivo mediante un suavizado espacial. En
su lugar se propone el método más simple consistente en el suavizado espacial del sesgo (reducido)

y en autocorrelaciones de la muestra. Esto reduce considerablemente la variabilidad, a costa de un

ligero aumento de la polarización.
7.3.4 Inferencia para los efectos

Un efecto de interés, como la diferencia entre los estímulos, puede ser especificado por cβ,
donde c es un vector de fila con m contrastes. Estimado por
E = cβ
con la desviación estándar estimada por:
+
S = cX σ
Para detectar el efecto, se contrasta que el efecto es cero mediante contraste de hipótesis de
ajuste. Esta prueba estadística se comprueba a partir del estadístico T:
T =E
S
que tiene una distribución t con ν grados de libertad, si no hay efectos cβ=0. Para detectar más de
uno efecto al mismo tiempo, es decir, si c es una matriz con rango k, el estadístico T se sustituirá
por un estadístico F definido por:
( )
−1
 +
' + '
E C X C X  E
F=  
kσ
2
( )
Que se distingue según una F con k y ν grados de libertad, cuando no hay efectos.
7.3.5 Fmrilm
Los métodos descritos en esta sección se han implementado en la función fmrilm de
MATLAB (fMRI modelo lineal) para el modelo AR(p). Esto toma como entrada el diseño de
matrices y añade tendencias polinomionales con fmridesign. Las tendencias polinomionales no se
suavizan por la HRF, por lo que los términos constante para un descanso o una condición de base
que se supone que existen antes de la digitalización inicial. Para reducir el sesgo de ρ hay que
aplicar el método de mínimos cuadrados residuales no transformado. Los datos de la fRMI y el
diseño de la matriz se blanquea con ρ y la estimación final de β y σ serán calculados los efectos, E
sus errores estándar, siendo S, T y F los estadísticos de prueba. Estas medidas dan las respuestas
correctas, incluso si la matriz de diseño no tiene el rango completo. Se reducen cálculos con el uso
de la pseudoinversa.
7.4 La combinación de múltiples pasadas, sesiones o subproyectos

7.4.1 El modelo de efectos aleatorios

El siguiente paso es combinar los efectos aleatorios y los errores estándar de pruebas
diferentes en la misma sesión. Se comienza por la combinación de ejecutar n*; la combinación de
períodos de sesiones y los temas es similar. Ej denota los efectos sobre cada j, donde E = c β , y Sj
+
denota su desviación estándar S j = c X j σ j , j = 1,…,n *. Se puede capturar con otro vector de
variables regresoras, denotado por zj. Y Ej es una variable aleatoria cuya esperanza es un modelo
lineal z 'j γ en las variables regresoras. Esto se realiza con el fin de ampliar nuestra inferencia a las
muestras aleatorias, en lugar de las exploraciones complementarias dentro del mismo recorrido,
suponiendo que el efecto tiene dos componentes de variabilidad:
o La primera es la varianza S 2j de exploraciones complementarias, dentro del mismo
recorrido, considerado como fijo.
o El segundo es una varianza de efectos aleatorios σ aleatoria

2
de la variabilidad
esperada Ej de ejecución. El modelo de efectos aleatorios es entonces:
E j = z 'jγ + η j
Siendo:
ηj una distribución normal con media cero y varianza S 2j + σ aleatoria
2
independientemente para
j al azar, j = 1,…,n*. Considerando σ aleatoria

2
= 0 se tiene un análisis de efectos fijos.
7.4.2 Estimación de los parámetros

o Si σ aleatoria
2
es conocido, entonces el mejor estimador de γ se obtiene por mínimos
cuadrados ponderados con un peso inversamente proporcional a S 2j + σ aleatoria

2
. Las
estimaciones de efects fijos usan pesos inversamente proporcionales a S 2j , siendo esta la base
de la primera versión de Multistat.
o Si σ aleatoria
2
es desconocido, se puede estimar γ y σ aleatoria
2
queda aproximada por el
método de áxima verosimilitud restringida (REML) (Harville), una menor estimación sesgada
de la varianza se obtiene por máxima verosimilitud (ML).
Sin embargo, el hecho de que el error de varianzas indique que no existe una expresión
analítica para el REML o de estimadores ML, así que debemos recurrir a algoritmos iterativos. La
estabilidad es más importante que la velocidad de convergencia, ya que no es fácil supervisar el
algoritmo en cada voxel, por lo que se elige el algoritmo EM, que siempre produce estimaciones
positivas de componentes de varianza. Cuando el efecto aleatorio es pequeño, el algoritmo EM es
conocido por ser lento para converger y produce graves sesgos en sus estimaciones. Esto se debe a
que el algoritmo EM siempre devuelve una estimación positiva de σ aleatoria
2
aun cuando el valor real

2
es cero. Para superar esto, restamos S min = min j S 2j , lo que da un modelo equivalente para Ej con
varianza
(S 2
j − S min
2
) + (σ aleatoria
2
+ Smin
2
)
El algoritmo EM para estimar el parámetro desconocido
σ aleatoria
*2
= (σ aleatoria
2
+ Smin
2
)
Los valores de partida son las estimaciones de los mínimos cuadrados en el supuesto de que
Sj = 0. La convergencia es más rápida porque σ aleatoria
*2
está más lejos de cero. Finalmente restamos
2
S min para obtener σ aleatoria
*2
como estimador de σ aleatoria
2
que parece ser casi insesgada para los datos
simulados.
7.4.3 Regularización de la varianza de efectos aleatorios
El número de series, sesiones o temas suele ser pequeño y la estimación de σ aleatoria

2
es muy
()
variable, resultando un bajo grado de libertad ν* de la varianza estimada Var γ$ . Si todas las
desviaciones estándar de Sj son iguales, entonces la varianza de cada efecto Ej se desconoce, pero se
puede demostrar que los grados de libertad es υ * = n* − p* , donde p* = rango ( Z ) y
( )
Z = z1 ,K , zn* . Si n* = 4 se obtiene un promedio de ν* = 3 grados de libertad. Esto es
especialmente grave para detectar máximos locales por el umbral del estadístico T, ya que el umbral
puede ser extremadamente alto, lo que es muy difícil de detectar con una señal de que está
realmente presente (Worsley). Teniendo en cuenta que la imagen de los efectos aleatorios de la
desviación típica es muy ruidosa (debido a los bajos grados de la libertad), es importante que
contenga la estructura anatómica. Esta misma estructura anatómicas es también evidente en la
imagen de los efectos fijos de la desviación estándar, σ 2fijo obtenida como:
∑υ S j
2
j
σ 2fijo = j
υ fixed
Donde:
o νj los grados de libertad de Sj
o υ fijo = ∑υ j los grados de libertad del análisis de efectos fijos.

j
Teniendo en cuenta que la imagen de los efectos fijos de la desviación estándar tiene menos
ruido, por tener un alto grado de libertad procedente del gran número de exploraciones para cada
ejecución. Entonces se pueden utilizar los efectos fijos de la desviación estándar como una plantilla
para una mejor estimación de los efectos aleatorios de la desviación estándar. Para ver esto, se
considera la relación de los dos efectos con una estructura menos anatómica.

2
σ 2fijo + σ aleatoria
τ =
2
σ 2fijo
Por tanto, se puede reducir el ruido en τ2 por el suavizamiento espacial y luego se multiplica
de nuevo por los efectos fijos de la desviación estándar para obtener un estimador que mejore los
efectos aleatorios de la desviación estándar con un mayor grado de libertad:
σ aleatoria = liso (τ 2 ) × σ 2fijo − σ 2fijo =

2
 σ aleatoria
2

= liso   × σ 2fijo
 σ 2fijo 
 
2
Esto puede ser aplicado usado en lugar de σ aleatoria para obtener un mejor estimador de γ y su
desviación estándar. Teniendo en cuenta que sin suavizado da un análisis de los efectos puramente
aleatorios, mientras que si se utiliza un filtro de suavizado se amplia infinitamente, de modo que el
coeficiente de variación es 1 en todas partes, produciendo un análisis puramente de efectos fijos. La
cantidad deseada de alisado se puede determinar por el grado de libertad deseado.
7.4.4 Estimación de los grados de libertad

Al suavizar la relación de la imagen de la varianza τ2 se disminuye su variabilidad a expensas
de un posible pequeño aumento en su sesgo. La disminución real en la variabilidad se mide por su
grado efectivo de libertad. Para obtener una estimación aproximada de esto, se supone que el
FWHM del filtro es wratio y que la función de correlación espacial de cada Ej es una función
gaussiana. Los grados efectivos de libertad de la razón de varianzas regularizada se aproxima por
3
  w 
2
 2
υ ratio = υ * ⋅  2  ratio  + 1 
  wefecto  
 
* *
Los grados de libertad de la desviación estándar S , denotada por υ% , se estima por:
1 1 1
= +
υ% υratio υ fijo
*
El parámetro wratio proporciona un análisis intermedio entre un análisis de efectos aleatorios

y un análisis de efectos fijos.
o Configuración: wratio = 0 (sin suavizado) produce un análisis de efectos aleatorios.
o Ajuste wratio = ∞, suaviza la relación de la varianza, produciendo un análisis de
efectos fijos.
*
o En la práctica, wratio produce υ% , por lo que las estimaciones de los errores no
afectan en gran medida la distribución del estadístico del contraste.

Finalmente, los efectos se definen por los contrastes en E * = bγ$ con una desviación
estándar:
()
S * = bVar γ$ b '
*
El estadístico T, T = E con υ * grados de libertad, entonces se puede utilizar para
S*
detectar ese efecto.
7.4.5 Multistat
El análisis de esta sección se hace con Multistat. Tomando como entrada la salida del efecto
Ej y la desviación estándar de imágenes Sj de fmrilm, junto con sus grados de libertad νj. Si las
imágenes de la desviación estándar no se calculan con Multistat se consideran 0 con νfijo = ∞.
El FWHM de la entrada de wefectos se d generalmente estimado por el FWHM de los datos
primarios. Por último, el FWHM suaviza la relación de la varianza wratio por ser elegido para dar por
lo menos 100 grados de libertad. La razón de varianza τ se facilita en 3D, entonces γ se obtiene por
mínimos cuadrados ponderados con pesos:
1
2
S 2j + σ aleatoria
En raras ocasiones, cerca de los artefactos del escáner fuera del cerebro, los pesos pueden ser
*
negativos. La producción es el grado de libertad υ% , el efecto E* y su desviación estándar S*, se
puede utilizar como entrada a espacios del Multistat.
7.5. Detección de regiones activadas

El último paso en el análisis es detectar las regiones activadas por el estímulo, o por el
contraste de estímulos. Esta parte es casi idéntica a la empleada por SPM. EL Umbral_Tstat
encuentra el umbral para el máximo de un estadístico T con un determinado valor P, que es por
defecto 0.05. El umbral, es el volumen de la región de búsqueda, el volumen de un vóxel, el
FWHM de los datos y los grados de libertad. Este cálculo es bastante robusto a la forma de la
región por lo que asume la región de búsqueda es esférica, y da un umbral que es un límite inferior
para las regiones con el mismo volumen (Worsley). A veces, si el FWHM es pequeño en relación al
volumen del voxel, una reducción de BonFerronia da un umbral más bajo que la teoría de campo de
azar, el Umbral_Tstat toma el menor de los dos valores. El umbral también es robusto frente a la
no-estacionariedad de los datos (Worsley). Dado el hecho de que un diseño de la matriz se utiliza
para cada trozo, y diferentes autocorrelacciones se utilizan para pre-blanquear los datos. Por último,
un tamaño del análisis clúster del estadístico T es superior a un umbral de entrada que se calcula
usando los nuevos resultados de la teoría de campos aleatorios (Cao). El tamaño del clúster es
sensible a la no estacionariedad, por lo que se debe utilizar con precaución.

7.6. Una ilustración empírica

Todos estos métodos se han aplicado a un experimento fMRI para la percepción del dolor
(Chen). Después de 9 segundos de descanso, un sujeto se le dio un estímulo térmico doloroso de
(49ºC) en el antebrazo izquierdo durante 9 segundos, seguido de 9 segundos de descanso, a
continuación, un estímulo caliente de (35ºC) durante 9 segundos, esto se repite 10 veces durante 6
minutos. Durante este tiempo el individuo se escaneó cada TR = 3 segundos (120 exploraciones),
utilizando una máquina Siemens 1.5 T y 13 cortes de 128 × 128 píxeles las imágenes se obtuvieron
BOLD. Los 2 primeros escaneos fueron descartados, dejando n = 118 exploraciones como datos.
Fmridesign se utilizó para crear matrices de 13 diseños diferentes para los 13 cortes,
compensada por la adquisición de 0,12 veces segundo tramo entrelazado. Dos funciones de caja
fueron creados para los estímulos caliente y tibia entonces se convoluciono con la HRF(2),
mostrándose la adquisición rebanada.
Fmrilm fue utilizado para analizar una única prueba con la eliminación de la deriva cúbica (q
= 3) y 15 mm FWHM para alisamiento del parámetro de sesgo reducido de la autocorrelación del
modelo AR(1). En efecto de un dolor, por lo que un cambio de c = (1 - 1 0 0 0 0) se utiliza para
comparar:
o El estímulo caliente (1)
o El estímulo templado (-1)
o 4 coeficientes cúbicos de la corriente (0 valores).
Las dos etapas de suavizado y la reducción de sesgo de la autocorrelación se muestran en
una rebanada. Sin suavizado con la reducción de prejuicios la imagen es bastante ruidosa (± 0,1),
pero con clara evidencia de una mayor correlación en áreas corticales que en la sustancia blanca o
fuera del cerebro. Después del suavizado, el ruido se reduce mucho y ahora hay una clara evidencia
de un sesgo negativo de ≈ -0,05 fuera del cerebro donde la autocorrelación debe ser cero. Esto se
elimina correctamente por la reducción del sesgo para revelar que las correlaciones van desde 0,2
hasta 0,4 en las zonas corticales.
Fmrilm se utilizó para instalar un modelo de AR(4), para el suavizamiento con reducción del
sesgo de las estimaciones de los parámetro α1, α2, α3, α4. El coeficiente α1 domina claramente, la
presencia de valores no nulos en los parámetros de orden superior indica que no se puede descartar
por completo, ya que existe una estructura anatómica particular en α2. Para ver si esto tiene algún
efecto en las estadísticas resultantes del estadístico T para el efecto del dolor, se calculo el
estadístico T del modelo AR(p) con p = 1, 2, 4.
Para un modelo AR(16), los estadísticos T eran casi idénticos. Sin embargo, si se tiene en
cuenta la correlación y los datos se supone que son independientes, entonces el estadístico T es de
aproximadamente 11% mayor de lo que debería ser. Así, que el modelo AR(1) es el adecuado para
este experimento.

El experimento se repitió en n* = 4 ejecuciones consecutivas separadas por 18, 7 y 4 minutos

respectivamente. El uso de un modelo AR(1), con efectos resultantes E1-E4, errores estándar S1-S4,
siendo T el estadístico T = Ej / Sj con ν = 118 - 6 = 112 grados de libertad. Existe cierta evidencia
de un efecto del dolor en la región central, pero la característica más llamativa es la gran
variabilidad de ejecución, en la primera ejecución hay muy poca evidencia para determinar un
efecto de dolor en esta división. Multistat se utilizó para la media de las covariables y efectos
usando zj = 1 y el efecto final E*, la desviación estándar S* y el estadístico T* y T. Los efectos
aleatorios de la desviación estándar son muy ruidosos debido a su bajo grado de libertad (ν* = n* -
p* = 4 - 1 = 3). Se muestra una estructura espacial similar a la de efectos fijos de la desviación
estándar, que tiene grados de libertad muy altos (νhijo =n* ν = 448). El ratio de la dos es mayor,
aunque todavía es muy ruidoso. Después del suavizado que desprende de la proporción es cercana a
una zona fuera del cerebro y en muchas regiones del cerebro, lo que indica poca evidencia de un
efecto aleatorio, salvo en las regiones frontal y anterior donde alcanza valores tan altos como 1,6.
Esto significa que en estas regiones la variabilidad de los efectos es hasta un 60% más alto que su
variabilidad, debido a las exploraciones. Tras realizar un análisis de efectos fijos, el estadístico T es
hasta un 60% mayor en estas regiones de lo que debería ser. Para corregir esto, se multiplica el
cociente suavizado por los efectos fijos de la desviación estándar para obtener una estimación
aproximada insesgada de la varianza, teniendo en cuenta que la desviación estándar es de hasta un
60% más en las regiones frontal y anterior para compensar los efectos aleatorios.

CAPITULO 8
ALGUNAS REFERENCIAS
RECIENTES EN EL ANALÍSIS
ESTADÍSTICO FMRI.
TRATAMIENTO DE CASOS PRÁCTICOS.
8.1. Aplicación.
Ingo R. Keck, Ica aplicado a datos de EEG y fMRI (Tesis de la Universidad de Regensburg,
Alemania, 2007)
En esta tesis se utiliza el Modelo Lineal General (GLM), aplicado al análisis fMRI. Para ello se
analiza la evolución temporal de un vóxel:
r
x = ( x ( t1 ) ,K , x ( tn ) )
T
r r r
Sabiendo que el Modelo Lineal General es: x = Fb + e
Donde:
r
o b : coeficiente de regresión.
o
rF: fuentes de filtro.
o
e : errores de la distribución gaussiana.
La desventaja de este modelo es que hay que conocer la evolución temporal de la actividad para el
análisis. También se realiza un Análisis de Componentes Independientes (ICA) aplicado a fMRI,
r r r r
()
considerando el ICA x r = As r () espacial
Donde:
o La segregación funcional del cerebro corresponde a la independencia estadística espacial

r r
()
o Las mezclas x r son las imágenes fMRI
r r
()
o Las fuentes s r son los mapas de activación
o La evaluación temporal de la activación está en las columnas de la matriz de mezcla A.
La ventaja de este modelo es que no hay que conocer la función de actividad para el análisis.
Al aplicar el Análisis de Componentes Independientes al fMRI sabemos que:

o ICA funciona bien con datos de fMRI.

o ICA es una clase de análisis “sin-modelo” para fMRI.
o ICA presenta mejores resultados que GLM.
o ICA puede ser una herramienta poderosa en la investigación del cerebro
Aunque los problemas de estas aplicaciones son:

o La estabilidad del ICA.
o La necesidad del “post-procesamiento” manual (entre 50 y 400 componentes por sesión)
o Alta demanda computacional
Se puede redefinir la formula del ICA espacial pero teniendo en cuenta el ruido que no se
puede ignorar en fMRI:
r r r r r r
() () ()
x r = As r + n r
Teniendo el indicador simple de la varianza la siguiente expresión:

ur ur
( ) ( )
Var y = E  y − muyr  = σ 2
2
 
8.2. Aplicación.
Meli, C. y García, S. Resonancia Magnética Funcional: Casos clínicos. (Departamento de
Neurología. Buenos Aires, 2002)
En este trabajo para el análisis de las imágenes funcionales se utiliza el programa MEDx
3,41 que realinean 500 imágenes para corregir posibles movimientos producidos por el paciente
durante la ejecución del paradigma. Después se le aplica un filtro espacial Gaussiano a la respuesta
hemodinámica de acuerdo con la función de los puntos de dispersión (PSF). Para la construcción de
los mapas estadísticos de Z se realiza un análisis estadístico paramétrico que incluye el test de “t” de
muestras no apareadas con un nivel de significación p<0,001. Para finalizar, se transforman los
datos al espacio del Atlas de Talairach and Tournoux de manera de estandarizar las coordenadas de
los mapas estadísticos. En este trabajo se estudian diferentes casos prácticos en los cuales la fMRI
es utilizada como una herramienta de gran aporte en aplicación clínica. Uno de ellos es: Un paciente
de 17 años, atropellado por un tren, ingresa con traumatismo de cráneo. Se le hace la resonancia
funcional 5 meses después del accidente, donde cumple con el criterio de MCS. Dos meses y medio
después del estudio fMRI, el paciente comienza a despertar. Y se obtienen resultados dentro del
rango normal, mostrando la resonancia una disminución de la dilatación ventricular.
8.3. Aplicación.
Campitelli, G. Recordar como habilidad experta: refutación de la hipótesis de los almacenes
de memoria. (Universidad Abierta Interamericana, 2008)

En este trabajo, se seleccionó una muestra de cinco ajedrecistas y siete no ajedrecistas que
participaron en una prueba de memoria de corto plazo en un scanner de resonancia magnética
funcional (fMRI). En cada bloque, se presentó una posición de una partida de ajedrez durante 2,5
segundos, seguido de una serie de 7 posiciones que se presentaron por 3 segundos con un intervalo
inter-estímulo de 1 segundo. La tarea consistió en decidir si cada posición de la serie era idéntica a
la primera. Se encontró que la activación cerebral de los no expertos fue muy superior a la de los
expertos y se concentró principalmente en los lóbulos frontal y parietal. Mientras, que la activación
de los expertos fue relativamente mayor en el lóbulo temporal. Este estudio demuestra que una
misma tarea se ejecuta en forma diferente de acuerdo al nivel de experiencia. Se utilizaron los
resultados de este estudio junto con otros de la psicología sobre la experiencia para demostrar que el
rendimiento en tareas de memoria en todas las personas depende del entrenamiento realizado.
8.4. Aplicación.
Vayá, M.I. Análisis de series temporales mediante ICA. (Biomedical Mining Group,
Universidad Politécnica de Valencia, 2009)
En este trabajo se investiga que la actividad cerebral aumentada el flujo sanguíneo en una
región del cerebro. Se utiliza un método que aporta información sobre conectividad funcional, y que
revela los factores ocultos bajo un conjunto de variables aleatorias, o señales. Además asume que
los datos de fMRI son mezclas lineales de fuentes independientes e intenta extraer señales que son
independientes de sus coeficientes de mezcla. Es un método motivado por los datos y esto implica
que estas fuentes independientes representan agrupaciones coherentes de activaciones de fMRI,
llamados mapas de componentes. Estos mapas son una representación de las redes funcionalmente
conectadas. Así se puede capturar la actividad coherente que no tiene porque seguir a la tarea
administrada por el estimulo.
Conclusión:
• ICA funciona bien con datos de fMRI
• ICA es una clase de análisis “sin-modelo” y dirigido por los datos para fMRI
• ICA presenta resultados interesantes para la interpretación clínica
• ICA puede ser una herramienta poderosa en la investigación del cerebro
8.5. Aplicación
Nardi, B. Capecci, I. Fabri, M. Polonara, G. Salvolini, U. Bellantuono, C. y Moltedo, A.
Estudio mediante imagen funcional de resonancia magnética (fMRI) de las activaciones emotivas
correlacionadas a la presentación de rostros extraños o del propio rostro en sujetos con
personalidad inward y outward. (Universidad Politécnica de la Marca Italia, 2008 ).

El objetivo de esta investigación es estudiar en diferentes personas voluntarias, sin ninguna

patología, las activaciones de estructuras tras la actuación de estímulos emocionales externos
estandarizados, estudiados mediante la resonancia magnética funcional (fMRI), cuando el sujeto
percibe expresiones emotivas relativas a un rostro extraño, o cuando percibe las mismas
activaciones en la imagen de su propio rostro. Por lo tanto, se observaron si los resultados obtenidos
eran similares o si existen diferencias según la modalidad de enfoque interno (“inward”) o externo
(“outward”).
Se realizó un estudio en un grupo de 10 sujetos voluntarios normales sin patología (5
mujeres y 5 hombres, de 28 a 53 años). Los sujetos han sido seleccionados, entre un amplio grupo
(N = 25), con igualdad en mujeres y hombres, con entrevistas clínicas previas al reclutamiento. El
protocolo preveía la exclusión del estudio de aquellos sujetos para los cuales se encontró una
eventual no concordancia entre los resultados de los tests y las evaluaciones clínicas de la
modalidad de enfoque inward u outward situación que no sucedió en ningún caso. Entre los sujetos
examinados se utiliza una batería de tests y una entrevista clínica, 6 han manifestado una modalidad
de enfoque outward y los otros 4 inward. De los sujetos outward, 4 eran mujeres y 2 hombres; entre
los inward 3 eran hombres y sólo una mujer. Las imágenes adquiridas se analizaron con los
softwares Functool, BrainVoyager QX y SPM2, mediante una serie de realineaciones, corregistros,
normalización y análisis estadístico. Estos programas pueden suministrar un mapa de las áreas con
la activación cerebral, correlacionada a la presentación del estímulo, haciendo referencia al sistema
de Coordenadas de Talairach. Es posible en este contexto localizar las áreas de activación en base a
tres valores numéricos (x, y, z) y dando valores a las dimensiones del volumen cerebral activado,
expresado por el número de voxeles. Mediante los tests y la entrevista clínica, 4 sujetos han
presentado una organización de personalidad con enfoque inward, 6 con enfoque outward. Para
asegurarse que el estímulo visual se ha percibido, se controla la activación del área visual primaria
en el lóbulo occipital.
En presencia de activación en esta región han sido estudiadas las estructuras cerebrales
directamente correlacionadas con la elaboración de los estímulos emotivos. En esta fase la atención
ha sido dirigida al estudio de la amígdala, que tiene un rol importante en los estímulos. La expresión
de rabia en un rostro desconocido ha activado la amígdala derecha en 6 sujetos y la izquierda en 3
sujetos. Los volúmenes de activación no presentan resultados distintos de aquellos determinados por
la presentación de caras estándar. En lo que respecta al estilo de personalidad, la diferencia más
evidente ha consistido en el mayor número de voxeles activados en la amígdala derecha de los
sujetos inward respecto a los outward.
8.6. Aplicación
C. Chavarrías1, M. Benito1, P. Montesinos1, V. García-Vázquez2, J. Taylor3, E. Goiriena3, M.
Desco1. Adquisición de imágenes de resonancia magnética funcional (fMRI) en cerebro de rata.

(1 Laboratorio de Imagen Médica. Unidad de Medicina y Cirugía Experimental, Hospital General

Universitario Gregorio Marañón, Madrid, España, 2007).
(2 Centro de investigación en red en salud mental (CIBERSAM), Madrid, España, 2007).
(3 Grupo de Función Sensitivomotora. Hospital de Parapléjicos de Toledo SESCAM, Toledo, España, 2007).
En este trabajo se realiza la configuración experimental necesaria para realizar

experimentos de resonancia magnética funcional (fMRI) con diferentes estímulos en cerebro de
rata. Se puede modificar el software de adquisición de la máquina de resonancia para generar
señales de sincronismo que controlen el estimulador eléctrico, calibrando dicho estimulado se
ajustan los parámetros de adquisición de la secuencia EPI y del estimulador. Uno de los avances
más interesantes en MRI se basa en la posibilidad de obtener imágenes funcionales (fMRI), como
por ejemplo los mapas de activación cerebral BOLD, en los que la señal se genera de manera
endógena, normalmente vinculada con un estímulo externo.
El contraste BOLD fue descrito por primera vez por Ogawa, en estudios de cerebro de rata
con alto campo magnético (7 y 8.4T). El fenómeno es debido a las inhomogeneidades de campo
magnético que produce la desoxi-hemoglobina (dHb), que actúa como agente de contraste. Las
propiedades magnéticas de la dHb junto con la restricción de los vasos sanguíneos producen
diferencias de susceptibilidad magnética entre vasos y tejidos adyacentes, generando gradientes con
un campo magnético alrededor de los mismos. Las secuencias de adquisición de MRI enfatizan
dichas variaciones de susceptibilidad magnética presentando diferencias cuando el nivel de dHb
varía. Estas inhomogeneidades inducidas por la dHb deberían producir una caída de la señal, y sin
embargo, la realidad es que la señal BOLD aumenta respecto al nivel basal. Esto se debe a que la
activación neuronal produce un aumento del flujo sanguíneo cerebral y del consumo de glucosa,
pero no un aumento acorde del consumo de oxígeno. Esto conduce a un descenso de la fracción de
extracción de oxígeno y una menor concentración de dHb por unidad de volumen de tejido.
La corteza somato-sensorial de la rata ha supuesto un modelo excelente para el estudio de
materias relacionadas con fMRI. Un gran número de grupos ha publicado resultados de fMRI
robustos durante la estimulación de las extremidades del animal, existiendo una fuerte coincidencia
en el área de activación y la intensidad de la misma. Asimismo se ha estudiado, mediante trabajos
de alta resolución temporal y espacial, la procedencia anatómica de la señal de fMRI. En concreto,
se ha analizado la diferente contribución de los pequeños y grandes vasos sanguíneos a la señal
BOLD. Además se han publicado comparativas entre distintos tipos de fMRI: BOLD, perfusión y
fMRI basada en el volumen de sangre.
Las adquisiciones de fMRI consisten en comparar series de imágenes obtenidas durante el
estado basal con las obtenidas durante estimulación. Podría servir una secuencia de adquisición
sencilla de eco de gradiente; pero si consideramos las altas exigencias de resolución temporal
requeridas para analizar la evolución temporal de la respuesta hemodinámica, es necesario acudir a

técnicas rápidas de adquisición de imagen. Un ejemplo son las secuencias EPI, combinadas con
adquisiciones de Fourier parcial y antenas phased-array, que permiten adquirir en paralelo.
8.7. Aplicación
Sánchez, C.L. Aplicaciones Open Source en el ámbito de la Salud y Sanidad. (Coordinador
Técnico de la Plataforma para la Salud en Código Abierto. Proceso de Datos de la Delegación de
Innovación, Ciencia y Empresa, Junta de Andalucía. España.)
Se ha recopilado desde la Fundación de Salud, FeSALUD, un mapa global de
aplicaciones/framework libres, para poder construir diferentes redes y para comunicar y crear
sinergias que permitan saber qué se hace, cómo se hace y qué hay por hacer.
Niftilib: es un conjunto de librerias input/output para leer y escribir archivos en el formato
de datos nifti-1. El formato nifti-1 es un archivo binario para almacenar datos de imágenes médicas,
por ejemplo, imagen de resonancia magnética (MRI) y resonancia magnética funcional (fMRI) del
cerebro. Niftilib cuenta actualmente con C, Java, MATLAB, Python y bibliotecas.
FSL: Es la librería de software FMRIB (FSL) es una herramientas de análisis para el fMRI,
RM y DTI de datos de imágenes del cerebro. FSL está escrito principalmente por los miembros del
Analysis Group, FMRIB, Oxford, UK. FSL se ejecuta en Apple y PC (Linux y Windows), y es muy
fácil de instalar. La mayoría de las herramientas se puede ejecutar tanto desde la línea de comandos
y las interfaces gráficas.
Lipsia Permite el procesamiento de Imágenes de Leipzig y la inferencia estadística
algorítmica. Es una herramienta de software para procesamiento de imágenes de resonancia
magnética funcional (fMRI) de datos. Fue desarrollado en el transcurso de varios años en el Max-
Planck- Institute for Human Cognitive and Brain Sciences en Leipzig.
8.8. Aplicación
Quirós, A. Análisis Estadístico de imágenes de resonancia magnética funcional. (Tesis de
la Universidad Rey Juan Carlos, Albacete, 2010).
Este estudio aborda el análisis de imágenes de resonancia magnética funcional (fMRI). La
resonancia magnética funcional es una técnica no invasiva para obtener imágenes de actividad
cerebral en respuesta a periodos específicos de estimulación, acciones u operaciones del
conocimiento. Se obtiene una serie de imágenes en el tiempo en, al menos, dos condiciones
diferentes y las regiones activadas del cerebro se detectan observando las diferencias en la
magnetización sanguínea debida a la respuesta hemodinámica. El análisis de datos de fMRI
considera dos problemas principales: la detección de actividad cerebral y la estimación de la curva
de respuesta hemodinámica. Se proponen diferentes modelos espaciotemporales para tratar de dar
una solución a estos problemas. El paradigma bayesiano proporciona un marco adecuado para hacer
inferencia en modelos complejos y constituye, asimismo, una teoría rigurosa para combinar la
información previa con la experimental de forma natural.

8.9. Aplicación.
Mazzone, L. Yu, S. Blair, C. Un estudio de fMRI de circuitos frontoestriatales durante la
inhibición del parpadeo en personas con Síndrome de Tourette. (Instituto de Psiquiatria Interactiva.
Palmanova, Mallorca, 2008)
Los autores trataron de estudiar la actividad en los circuitos neurales que favorecen la
inhibición de un comportamiento motor semi-involuntario, parpadeo, en niños y adultos con
Síndrome de Tourette y en sujetos sanos de comparación. Con este objetivo se utilizó la resonancia
magnética funcional para explorar a 120 participantes (51 con síndrome de Tourette y 69 sujetos de
comparación) ya sea presentando un parpadeo normal o éxito inhibido del parpadeo. Los autores
compararon la señal dependiente del nivel de oxígeno en sangre durante estas dos condiciones en
los grupos de Tourette y de comparación. En relación a los sujetos de comparación, los pacientes
con síndrome de Tourette activaron con más fuerza la corteza frontal y el cuerpo estriado durante la
inhibición del parpadeo. La activación incrementó aun más con la edad, en la corteza prefrontal
dorsolateral e inferolateral y el núcleo caudado en el grupo Tourette que en los sujetos de
comparación. Además, el grupo Tourette activó más fuertemente el gyrus frontal medio, la
cingulada anterior dorsal y las cortezas temporales. La severidad de los síntomas de tic en el grupo
Tourette correlacionó inversamente con la activación en el putamen y la corteza prefrontal
inferolateral. Las conclusiones extraídas de este estudio son: La actividad frontoestriatal se
incrementa en personas con síndrome de Tourette durante la inhibición del parpadeo ocular. En esta
población la activación de circuitos frontoestriatales pueden ayudar a mantener un control regulador
sobre las conductas semi-involuntarias, ya sean tics o parpadeos.

APÉNDICE 1
LA TRANSFORMADA DE FOURIER
DISCRETA
La descomposición de Fourier representa funciones periódicas y definidas en [-π, π]. Está
descomposición se aplica a las funciones de cuadrado integrable.
El resultado de Fourier establece que cualquier f L2 [-, ] se puede expresar como una suma
infinita dilatada de las funciones seno y coseno:
∞
1
f ( x) = a0 + ∑ ( a j cos ( jx ) + b j sin ( jx ) )
2 j =1
Esta suma aumenta al infinito, pero la función se aproxima a la suma finita con el índice j del límite
superior de la suma. Esto define la serie truncada de Fourier:
J
1
S j ( x) = a0 + ∑ ( a j cos ( jx ) + b j sin ( jx ) )
2 j =1
Al aumentar el índice de dilatación j, aumenta la frecuencia de la función. En la suma finita, las

representaciones de la serie truncada se muestran en una función lineal, tal que:
 x + π , -π ≤ x ≤ −π / 2

f ( x ) =  x / 2, -π / 2 < x ≤ π / 2
x − π , π / 2 < x ≤ π

Como el límite de la suma de j es grande, se incluyen más términos en la reconstrucción. Para j ≥ 1,
los coeficientes de Fourier se calculan con el producto interior de la función f y de las funciones base:
π
1
aj =
π ∫ f ( x ) cos ( jx ) dx,
−π
j = 0,1,...,
π
1
bj =
π ∫ f ( x ) sin ( jx ) dx,
−π
j = 0,1,...,
Estos coeficientes miden el contenido de la función f al nivel de resolución j, esto ayuda a

comprender la naturaleza de la función. Los coeficientes aj disminuyen rápidamente, cuando j es grande.
La mayor parte del contenido de frecuencia de esta función esta concentrado en frecuencias bajas.
Una secuencia de función {fj} es un completo sistema ortonormal (CONS) si FJ es ortonormal
para cada j, y la única función ortogonal a FJ es la función cero. El conjunto (h0, gJ, hj, j = 1,2,..) es un
sistema ortonormal L2 [-π, π]. La base de Fourier no es el único intervalo de CONS.

APÉNDICE 2
EL SISTEMA DE HAAR
La extensión de análisis de Fourier al análisis Wavelet se hace a través de la base Haar. Por
ello la función de Haar es una función Wavelet.
La función Haar, se describe como:
 1
1, 0 ≤ x< 2

 1
ψ ( x ) = −1, ≤ x < 1
 2
0, otro caso


La función Haar Ψ definida anteriormente se denomina Wavelet madre. Esta función da a luz a
toda una familia de Wavelet a través de dos operaciones:
o Dilataciones diádicas.
o Traducciones.
Siendo:
o j el índice de dilatación
o k el índice de la traducción.
Cada Wavelet nacida de una wavelet madre se define por estos dos índices de la siguiente
manera:
ψ ( x ) = 2 j /2ψ ( 2 j x − k ) , j, k ∈ Z
Teorema:
El conjunto (Ψj,k, j, k) ε Z constituye un sistema de ortonormal L2(R). Para establecer el teorema,
es necesario demostrar:
1. El conjunto es ortonormal.
2. Cualquier función f ε L2(R) se aproxima a una combinación lineal finita de Ψj,k's.
1) Comprobar que se satisfacen las propiedades de la Wavelet Haar:
∞
∫ ψ ( x )dx = 0,
−∞
j ,k j, k ∈ Z
Para demostrarlo, se comprueba que la función Wavelet Ψj,k es
sup pψ j , k =  k 2− j , ( k + 1) 2− j 
Si dos Wavelets tienen el mismo índice de dilatación j, pero no el mismo índice de

traducción k, no son ortogonales.

Si dos Wavelets tienen diferentes índices de dilatación, con supp Ψj,k una región con la
Wavelet constante, entonces son ortogonales. Como ψ j ,k = 1 para todos j, k ε Z, el conjunto es

ortonormal.
2) Para demostrar la aproximación de cualquier L2(R) a la función f con el apoyo compacto: Desde
2 J1 ∞
∫ f 2 ( x) → ∫ f 2 ( x)
−2 J1 −∞
Análisis Multiresolución
Se construye FJ como una aproximación de la función original y siendo la mejor aproximación
de FJ-1.
Cada función GJ se escribe como una combinación lineal de las funciones Ψj,k.
Por ello se define el espacio Vj con j ε Z:
{
V j = f ∈ L2 ( ℜ ) : f es una constante en  k2− J , ( k + 1) 2− J  , k ∈ Z }
Cada subespacio Vj está compuesto de funciones constantes en intervalos de doble longitud que
Vj-1.
j −1 j −1
Se define PJ f, la proyección de una función f en el espacio Vj: P f = P f + g
j
La función GJ-1 se escribe en términos de la función Wavelet de dilatación y de traducción,
dando:
P j f = P j −1 f + ∑ ( f ,ψ j −1,k )ψ j −1,k
h∈Z
{ψ j ,k , k ∈ Z} y Vj no son un sistema ortonormal, pero si un conjunto de funciones ortogonales
a cada espacio Vj.

El análisis de Multiresolución (MRA) se utiliza cuando hay una secuencia de espacios (Vj)j Z
que satisfacen las siguientes cuatro propiedades:
1. .. ⊂ V−2 ⊂ V−1 ⊂ V0 ⊂ V1 ⊂ V2 ⊂ ...


2. I V j = {0} , U V j = L ( R )
2
 j∈Z j∈Z
3. f ∈ V j si y sólo si f(2⋅) ∈ V j +1


4. f ∈ V0 → f( ⋅ -k) ∈ V0 para todok ∈ Z
Función de escalada
Una función ε Vo con {φ 0, k = φ ( ⋅ − k ) , k ∈ Z } es una base ortonormal para Vo, y es una
función de escalada según Haar es: φ ( x) = I[0,1) ( x )

Su dilatación se traduce como una ortonormal que constituye las bases para todos los
subespacios Vj. La función de escalada también se conoce como el padre Wavelet.
Se define una función de escalada que utiliza el siguiente espacio:
V j = span {φ j , k , k ∈ Z}

(Vj)j Z constituye una MRA, y la función genera un análisis multiresolución.
Representación Wavelet.
La proyección de L2(R) en una función del espacio Vj se hace en términos de su dilatación y
su traducción:
∞
P j f = ∑ c j , kφ j , k
k
con: c j , k = f , φ j , k = ∫
−∞
f ( x) φ j , k ( x) dx
Se desea encontrar una función Ψ, mediante el análisis multiresolución y la función de

escalada .
{ }
Denotando φ ∈ V0 y φ ∈ V1 , con φ1,k , k ∈ Z base para V1, y se escribe en términos de
φ1,k ' s . Entonces:

1 1
φ ( x) = φ1,0 ( x) + φ1,1 ( x)
2 2
De forma análoga se escribe:
1 1
ψ ( x) = φ1,0 ( x) − φ1,1 ( x)
2 2
Está es la ecuación general de Wavelet.
Existe una relación muy estrecha entre la función de escalada y la función Wavelet,
entonces se puede obtener una función Wavelet a partir de una función de escalda.
En Haar se obtiene que φ j , k ,ψ j ',k ' = 0, con j ≤ j' (j, j, k, k' ε Z), es decir, una función de escalada
y una wavelet ortonormal, siendo la función de escalada de menor resolución. Definiendo una
importante propiedad de multiresolución
V j = V j −1 ⊕ W j −1
Los coeficientes Wavelet se calculan con el producto interior, de la función
Wavelet: d j ,k = f ,ψ j ,k = ∫ f ( x) ψ j ,k ( x) dx .
Se debe verificar la integración del producto Wavelets y la función f. Donde:
ψ j ,k ( x) =
(φ j +1,2 k ( x) − φ j +1,2 k +1 ( x) )
2
Análisis de objetivos multiresolución

Las Wavelets Multiresolución y el análisis del procesamiento de señales, obtienen una
representación de la función escrita con la suma de sus componentes esenciales
Una imagen en blanco y negro se expresa en una función f(x, y) en dos dimensiones, donde la
función f(xo, yo) representa la escala de grises. En muchas imágenes hay que limpiar grandes áreas
homogéneas de una sombra particular de color gris.

La imagen se puede afinar sin aumentar la cantidad de información que se almacena utilizando
un número reducido de componentes para representar las grandes zonas homogéneas, dejando un
gran número de componentes con los que representa la acción de la imagen.
Pasar de una gruesa aproximación de la resolución a una fina o de una fina a una gruesa, se
denomina zoom-in zoom-out del análisis de multiresolución.
∞
La Wavelet oscila alrededor de cero para que: ∫ ψ ( x) dx=0 .

-∞
Las propiedades hacen que la oscilación de una función onda, se convierta en una Wavelet. Si la
oscilación es rápida, se pueden representan detalles más finos en la señal.
(
Una madre wavelet Ψ se dilata a: ψ j , k ( x) = 2 ψ 2 x − k
j /2 j
)
Donde el punto x = 2-j K se localiza en Ψj,k(x).
El coeficiente Wavelet d j ,k = f ,ψ j ,k mide la cantidad de fluctuaciones de la función

alrededor del punto x = 2-jk.

APÉNDICE 3
BASES DE WAVELETS REGULARES
Existen muchas familias Wavelet: Stromberg, Meyer, Batle y Lemarie, Wang Chuil, Ingrid
Daubechies, entre otras. Con tantas familias wavelet entre las que escoger, es difícil elegir la más
idónea.
Una cualidad importante que debe poseer una base Wavelet es la ortonormalidad, es decir, la
independencia de los coeficientes empíricos.
Normalmente, los conjuntos de datos están limitados en una escala del intervalo [0,1] por lo que
es natural una Wavelet con soporte compacto.

APÉNDICE 4
WAVELETS DE DESCOMPOSICIÓN Y
LA RECONSTRUCCIÓN
El algoritmo de descomposición Haar expresa la función Wavelet y la ampliación de los
coeficientes de la función en cualquier nivel de resolución y en términos de los coeficientes de la
función de escalada en los niveles superiores.
Escala de dos relaciones

Un MRA consiste en espacios (Vj, j ε Z) con base ortonormal {Фj,k, k ε Z} y
φ j ,k ( x) = 2 j /2 φ (2 j x − k ) , con Φ ε Vo y Φ ε V1, siendo Vo c V1.
Se considera que (Ф1,K k ε Z) es una base ortonormal para V1, entonces existe una secuencia
{hk} tal que:
φ ( x) = ∑ hkφ1,k ( x)
h∈Z
Donde h k = φ , φ1,k es una secuencia de cuadrados sumables, denominada ecuación de dilatación

o de refinamiento y es una función relacionada con diferentes factores de escala.
La multiresolución de la base Haar se relaciona con las funciones de ampliación a dos
niveles de hk y se utiliza para definir la Wavelet madre con:
La hipótesis de la estructura de error.
La independencia.
La varianza constante
El ajuste del modelo.
Se define el espacio Wo como la duración de la serie de Wavelet {Ψ0,k K ε Z}. Con:
V0 ⊥ W0 y V j ⊥ W j Para todo j ε Z.
Por todo esto se sabe que las Wavelet {ψj,k, j,k ε Z} son un sistema ortonormal para L2 (R).
El algoritmo de descomposición
Los espacios {cj,k j,k ε Z} y {dj,k j,k ε Z} representan la función de escalada y los coeficientes
Wavelet de una función f, respectivamente. Estos coeficientes se calculan de la siguiente manera:
c j , k = ∫ f ( x)φ j , k ( x)dx; d j , k = ∫ f ( x)ψ j , k ( x)dx
La relación de dos escalas para cualquier función de escala en términos de niveles más altos
obtiene la ecuación:
φ j ,k ( x) = ∑ hL − 2 kφ j +1, L ( x)
L∈Z

El algoritmo de descomposición amplia los coeficientes de la función:

c j , k = ∑ hL − 2 K c j +1, L
L
El coeficiente Wavelet del algoritmo de descomposición es:
d j ,k = ∑ (−1) L h− L + 2 K +1c j +1, L
L∈Z
Los coeficientes Wavelet de bajo nivel se calculan a partir de la ampliación de la función de

escala y utilizando los coeficientes Wavelet.
Si hay un número finito de números no nulos, a los elementos de la secuencia {hL} se le
aplica el algoritmo de descomposición del conjunto de coeficientes de la función de escala a nivel j
+1.
El algoritmo de reconstrucción
El algoritmo de reconstrucción comienza con los coeficientes de bajo nivel y calculando los
de alto nivel. Este algoritmo comienza con un MRA con (Фj,K, KεZ) y {ψj,k, k ε Z} formando bases
ortonormales para Vj y WJ, respectivamente.
De Ф1,0 ε V1 se sabe que Ф1,0 es la combinación lineal de Фo,k (base para Vo) y Ψ0 (base para
Wo) y lo mismo para Ф1,1. Los coeficientes de las combinaciones lineales calculan los productos
interiores, de la unificación del tratamiento.
φ1,0 ( x) = ∑ ( a2 kφ0,k ( x) + b2 kψ 0,k ( x) ) φ1,1 ( x) = ∑ ( a2 k −1φ0,k ( x) + b2 k −1ψ 0,k ( x) )
k∈Z y k∈Z
La expresión relativa de cada función de escalada j,k a las funciones de ampliación y

funciones Wavelet en nivel j-1 es:
φ j ,k ( x) = ∑ a2 L − kφ j −1, L + b2 L − kψ j −1, L ( x)
L∈Z
Esto se utiliza para obtener el algoritmo de reconstrucción de la función de escalada y los
coeficientes Wavelet:
c j ,k ( x) = ∑ a2 L − k c j −1, L + b2 L − k d j −1, L ( x)
L∈Z
Los coeficientes de la función de escalada calculan un conjunto de coeficientes de bajo
nivel de la función de escala y los coeficientes intermedios Wavelet.
El algoritmo de reconstrucción se expresa en términos de la secuencia {hk}:
c j , k ( x ) = ∑ hk − 2 L c j −1, L + (−1) k h2 L − k +1d j −1, L ( x )
L∈Z

APÉNDICE 5
LOS CONCEPTOS DE
REPRESENTACIÓN CON FILTRO
Se realiza un estudio para aplicar un filtro a una señal pura contaminada con ruido, intentando
aislar la señal pura o extraer el ruido. La señal f se representa por {fk}k Z., con f L2 (Z) y el filtro por
{ak}k € Z y se denota por A.
El filtrado de subbandas se aplica al algoritmo de descomposición por una operación de
muestreo aplicando ese filtro a una señal en los resultados de la señal con la mitad de longitud que la
señal original.
El proceso de filtrado consta de una convolución discreta de la secuencia de filtro con la señal,
aplicando el filtro de la señal A a la f tal que:
( Af )k = ∑ aL−2 k f L
L∈Z
La notación del operador habitual será: AB, f señala el resultado de la primera aplicación de un
filtro de B a la señal de f y luego aplica el filtro A del resultado intermedio.
La escala de coeficientes de la función en el inferior se obtiene mediante la aplicación del filtro
H a la señal: cj-1 = Hcj,
Los coeficientes de la función de escalada se obtiene en varias ocasiones con la aplicación del filtro H:
cj-m = Hm cj, y del nuevo filtro G por: Gk = (-1)k h1-k, k Z
Los coeficientes Wavelet en el nivel j-1 se obtienen en la escala de coeficientes de la función al
nivel j a través de este filtro de D j-1=Gcj. Uniendo los dos filtros, los coeficientes de Wavelet en un nivel
inferior pueden calcular la escala de coeficientes de la función al nivel j: D j-m = GHm-1 cj
Estos filtros se llaman filtros espejo en cuadratura de los procesadores de la señal. El filtro H es
conocido como filtro de paso bajo, mientras que G es un filtro de paso alto. Los filtros de paso bajo
corresponde al promedio de las operaciones, y el filtro de paso alto corresponde a la diferencia.
En las Wavelet Haar, una señal f = {fk}k € Z utiliza los elementos de la señal filtrada f`= Hf en el
filtro de Haar de la siguiente manera:
1
f k' = ( f 2 k + f 2 k −1 )
2
El filtro H se aplica a una señal de promedios ponderados localizados en la señal original. La
aplicación del filtro G en la señal cuyos elementos son contrastes de los elementos localizados en la señal
original.

APÉNDICE 6
LOCALIZACIÓN DE FRECUENCIA
La transformada de Fourier CONTINUA
El análisis de una función periódica definida en R se representa por:
∞
1
f(x)= a0 + ∑ ( a j cos( jx) + b j sin( jx) )
2 j =1
Esto se escribe aplicando la fórmula de Euler: e = cos w + i sin w

iw
Esta expresión permite escribir las funciones trigonométricas:

1 iw − iw 1
cos w =
2
( e + e ) , sin w = ( eiw − e− iw )
2i
Sustituyendo estas relaciones en la función no periódica se obtiene que:
∞
f ( x) =
1
2
(
a0 + ∑ ( a j − ib j ) eijx + ( a j + ib j ) e − ijx
j =1
)
En términos de estos coeficientes, la representación Fourier es:
∞
f(x) = ∑ p jeijx
j=-∞
La ampliación de la expresión anterior a un continuo de frecuencias y cambiando los límites
de integración a R da una transformada estándar de Fourier continua en f L2(R).
Se representa en términos de la transformada de Fourier por medio de la transformada
inversa de Fourier:
∞
f ( w) = 2π ∫
−∞
f ( x)eiwx dx
Para x R, se obtiene la representación continua de la suma de Fourier de una función

periódica. Así en L2(R), la función se caracteriza por su transformada de Fourier (w), w R.
Se define la identidad de Parseval como una relación importante entre la función y la
transforma de Fourier: Para f, g L2(R),
1
f,g = f ,g
2π
La fórmula de Parseval muestra que la norma L2 de una función es proporcional a la
transformada de Fourier. Esta identidad tiene una representación análoga en una transformada
discreta de Fourier, relacionada con la norma de una función periódica en sus coeficientes de
Fourier:
π ∞
1
∫ f 2 ( x)dx = ∑ p 2j
2π −π j=-∞
La Ventana de la transformada de Fourier

La transformada continua de Fourier proporciona información sobre el contenido de

frecuencia de la señal en la frecuencia w. Una deficiencia de estos métodos es la insuficiencia en los
cambios de frecuencia de las señales en el tiempo.
La ventana transformada de Fourier extrae información de la frecuencia local de la señal,
esta transformada usa la función Gaussiana. Y se expresa:
∞
( G f ) (w) = ∫
α
b f (t )gα (t − b)e − iwt dt
−∞
En la transformada continua de Fourier, existe una inversa transformada de Gabor esto
repercute en la señal original de su transformada.
El centro de la ventana se define como:
∞
1
t* = ∫ tw (t )dt ,
2
2
w −∞
El radio de una ventana se define como:

1/ 2
1  
∞
 ∫ ( t − t *) w (t )dt 
2
∆w = 2
w  −∞ 
Se vuelve a escribir la transformada de Fourier en términos de la anchura:
∞
( Gbα f ) (w) = f,Gbα,w = ∫ f (t )Gbα, w (t )dt

−∞
La transformada de Fourier de la función Gaussiana es proporcional a una función Gauss.
Esta expresión se considera una función de ventana en el dominio de frecuencia. La aplicación de
este resultado da:
( Gbα f ) (w) = 2 πα
(
e − ib (ξ − w) 1/4α
Gb f ) ( −b )
La anchura de la ventana en el dominio del tiempo es, 2√α, y la anchura de la ventana en el
dominio de la frecuencia es 1/√α.
La anchura y la altura relativa de la ventana se ajustan a la variable α, pero el área de la
ventana en dos dimensiones es constante en 2. Esta zona es óptima de acuerdo con el principio de
Incertidumbre, donde se establece que para todas las ventanas convenientemente elegidas de la
( )
función w, el principio de incertidumbre es ( 2δ w ) 2δ w ≥ 2 . Alcanzándose la igualdad si y sólo si
la w es la función de ventana de Gauss.
La Transformada Wavelet continua.

Una Wavelet madre Ψ se define sin limitar la dilatación y la traducción por el conjunto de
los enteros. Para a> 0, b R, se define:
 x −b 
ψ ( a ,b ) ( x) = a −1/2ψ  
 a 
Entonces la Transformación continua Wavelet se define, por F L2 (R)

∞
 t −b 
(Wψ f ) ( a, b ) = f ,ψ ( a,b) = a −1/2 ∫ f ( x)ψ 
 a 
 dt
−∞
Esto supone que Ψ y ψ son funciones de Ventanas.

La función de Ventanas Ψ tiene centro t* y radio ∆Ψ. Por tanto, Ψ(a,b) es también una función de
ventana, con centro b+at* y radio ∆Ψ.
Para ver la localización en el dominio de frecuencia, se define una expresión para la
transformada de Fourier Ψ(a,b):
ψ ( a ,b ) ( w) = a e −iwbψ (aw)
Se aplica la identidad de Parseval en el resultado anterior:
(W f ) ( a, b ) = 2πa ∫ f (w)e
ψ
iwb
ψ (aw)dw
Si es una función con centro w* y radio ∆ψ es una función de ventana. Será también una función
de Ventana si tiene centro w*/a y radio ∆ψ /a .

Así es posible reconstruir una señal f(t), dada la transformada de Fourier por medio de la
transformada inversa de Fourier, también es posible reconstruir una señal dando su Transformación
Wavelet (WΨ f) (a, b).
Para una apropiada wavelet Ψ adecuada y por f L2(R).
∞ ∞
2 1
f (t ) =
Cψ −∞ 0
∫ ∫ (Wψ f ) ( a, b )ψ ( a ,b )
(t )
a2
dadb
Para cada t R en f continua. La constante CΨ está dada por:

2 2
∞ ψ ( w) ∞ ψ ( −w)
Cψ = 2∫ dw = 2∫ dw
0
w 0
w

APÉNDICE 7
LOS EJEMPLOS DE WAVELETS Y SUS
CONSTRUCCIONES
WAVELET ORTOGONAL
Se describe el desarrollo de dos Wavelets ortogonales: la familia Battle-Lemarié y la familia
Daubechies.
El campo de Wavelet Battle-Lemarié forma las funciones B-splines. Donde el primer
miembro de la familia Battle-Lemarié es la función de escala igual a la constante spline por partes.
Este sistema Wavelets es la base de la función de escala ortonormal.
El segunda miembro de esta familia comienza con el spline lineal a trozos N2(x). Esta
función tiene una pequeña relación de dos escalas:
N2(x)=(1/2)N2 (2x +1)+N2(2x)+(1/2)N2(2x-1).
Esta función no es ortonormal, por lo que no es adecuada usarla en la construcción de un
sistema de Wavelet ortonormal. La función debe ser ortogonal por medio de una función de
escalada adecuada.
El desarrollo de la familia Battle-Lemarié comienza con la definición de una función de
escalada que genera un análisis de multiresolución.
La derivación de la familia Daubechies Wavelet representa un enfoque diferente. Comienza
con los filtros y luego se derivan los coeficientes de la función de filtro tanto la ampliación y la
Wavelet.
Para un soporte compacto (x), sólo un número finito de hk es distinto de cero. El
acercamiento de Daubechies a la construcción de Wavelet ortogonal con soporte compacto
comienza con la definición del polinomio trigonométrico periódico.
Wavelets Bio-ortogonales
Las Wavelet Bio-ortogonales trabajan con una clase más general de Wavelet, con soporte
compacto y simetría, pero no ortogonalidad. Las Wavelet bio-ortogonal fueron construidas por:
Tchamitchian, Cohen, Daubechies y Feauveau.
Se denomina Wavelet bio-ortogonal, cuando no es ortogonal, es decir, cuando dos análisis
multiresolución separados en L2(R) corresponden a una Wavelet bio-ortogonal, siendo una el doble
que la otra.
El primer análisis multiresolución se genera mediante la función de escala y el segundo se
genera por una función de escalamiento dual
Wavelet semi-ortogonal

El enfoque semi-ortogonal que ofrecen Chui y Wang y Auscher, permiten construir una
familia de bases de Wavelets ortogonales que conservan el apoyo compacto, la simetría y la
ortogonalidad entre niveles detallados.
Las Wavelet Wang Chui se basan en los cardinales B-splines, al igual que la Wavelet Battle-
Lemarié.
Se constituye una base de Riesz para el espacio Vj de la función donde todos los splines de
orden m-1 son de la familia Wavelet Battle-Lemarié, aunque la base de Chui-Wang no es ortogonal.

APÉNDICE 8
WAVELET DOS DIMENSIONES
En el análisis bidimensional se puede conseguir un método similar al unidimensional. Si la
señal bidimensional f(x, y) es el cuadrado integrable sobre el verdadero plano: f (x, y) L2(R).
Se puede construir fácilmente una base Wavelet para L2(R) con el producto simple Wavelet
unidimensional:
ψ j1 , j2 , k1 , k2 , ( x, y ) = ψ j1 , k1 , ( x) ⋅ψ j2 , k2 , ( y )
Esta fórmula es demasiado simple para reflejar todos los rasgos del análisis multiresolución.
Por ello se aplica el análisis unidimensional MRA para definir el espacio bidimensional Vo
como el producto de 2 espacios unidimensionales:
V0 = V0 ⊗ V0 = span { f ( x) g ( y ), f , g ,∈ V0 }
Para cualquier j, se define este conjunto de subespacios que tienen las propiedades de MRA, pero
trasladadas al caso bidimensional. Por lo que se define:
φ ( x, y ) = φ ( x)φ ( y ) y φ j ,k , k ( x, y ) = 2 j φ ( 2 j x − k1 , 2 j x − k2 )
1 2
{ }
El conjunto φ j , k1 , k2 , j , k1 , k2 ∈ Z constituye una base ortonormal para V0.
El caso bidimensional intenta encontrar los espacios complementarios que representan la
señal de detalle entre aproximaciones sucesivas. En el caso unidimensional, se define Wj como el
complemento ortogonal de Vj en Vj+1. El desglose de estos MRA se expresa de la siguiente manera:
V j +1 = V j +1 ⊗ V j +1 = V j ⊗ W j
El espacio de detalle Wj se compone de tres subespacios ortogonales. Una base de estos tres
espacios detalle son los productos correspondientes de sus componentes, definiéndose así las
Wavelet bidimensionales:
ψ 1 ( x, y ) = φ ( x)ψ ( y ); ψ 2 ( x, y ) = ψ ( x)φ ( y ); ψ 3 ( x, y ) = ψ ( x)ψ ( y )
{
Siendo la base ortonormal para L2(R2): ψ j , k1 ,k2 , m = 1, 2,3, k1 , k2 ∈ Z
m
}
La imagen de detalle asociada a cada una de estas tres orientaciones especial atención a los
bordes de la imagen en la dirección indicada. En concreto, la Wavelet Ψ1 corresponde a la dirección
horizontal, la Wavelet Ψ2 con la dirección vertical, y la Wavelet Ψ3 con la diagonal.
El algoritmo tridimensional consigue mediante la doble aplicación de la relación Wavelet
bidimensional, llegar a la relación de doble escala bidimensional:
φ j , k , k ( x, y ) =
1 2 ∑ ∑h
L1∈Z L2 ∈Z
h
L1 − 2 k1 L2 − 2 k2 φ j +1, L , L ( x, y )
1 2
La aplicación de dos veces este resultado

φ j ,k ( x) = ∑ a2 L − kφ j −1, L + b2 L − kψ j −1, L ( x)
L∈Z

da un resultado análogo bidimensional, relacionado con una función de escalada en cualquier nivel
de funciones de escalada y Wavelet.
Esto tiene una versión análoga de las fórmulas que se aplican a la descomposición y
reconstrucción de algoritmos para los coeficientes, representados en términos de paso alto y filtros
de paso bajo.
La descomposición es el resultado de un proceso de dos pasos.
1) Se considera la matriz de coeficientes de la función de escala en una señal bidimensional,
donde cada fila está pensada como una señal independiente.
2) El primer paso consiste en aplicar los filtros H y G para cada fila de la matriz. Los resultados
son dos matrices con el mismo número de filas, pero la mitad de columnas que la matriz
original.
3) Cada una de estas matrices es un conjunto de columnas unidimensionales. Los filtros H y G
se aplican a las columnas, dando cuatro matrices cuadradas, con la mitad de filas y la mitad de
columnas que la matriz original.
4)Cada matriz resultante corresponde a la función de escalada y a las tres Wavelet descritas
anteriormente. El CJ-1 de la matriz es la suavización de los coeficientes de expansión de niveles
más altos, y las matrices D1j-1, D2j-1, D3j-1 representan las componentes de detalle horizontal,
vertical y diagonal, respectivamente.
D1j+3 D3j+3
D1j+2 D3j+2
D1j+1 D1j+1 D2j+3
D3j+1
Cj D2j+1
Esto representa la descomposición de la señal en dos dimensiones
Un ejemplo muy común de una señal bidimensional es una imagen digital. Esto consiste en
una matriz donde los valores son los píxeles, que representan la escala de grises.
La descomposición Wavelet de una imagen comienza con los elementos originales. La
matriz de coeficientes de la función de escala es una descomposición que suaviza la imagen
original. Las otras tres matrices constituyen imágenes de detalle.

APÉNDICE 9
PAQUETES WAVELET
Funciones de los paquetes Wavelet
Los Paquetes Wavelet, son una generalización de bases Wavelet, con bases que forman una
combinación lineal de funciones Wavelet. Estas bases tienen propiedades de normalidad y suavidad
correspondientes a funciones Wavelet. Mediante el uso de paquetes Wavelet se construye cualquier
aplicación donde se eligen funciones base.
Una función de paquetes wavelet es una función con tres índices: wmj,k(t). Donde j y k son
los índices enteros de dilatación y las operaciones de traducción respectivamente:
wmj ,k ( x) = 2 j / 2 wm ( 2 j x − k )
Donde wm , con j = k = 0 y m = 0,1, ... se llama parámetro de la modulación o parámetro de

oscilación. Las dos primeras funciones Wavelet (m = 0 o 1) son conocidas como la función de
escalada habitual, la wavelet padre y la wavelet madre, respectivamente:
φ ( x ) = w0 ( x )
ψ ( x) = w1 ( x)
Las funciones de paquetes Wavelet para m = 2,3 ... se definen como:
w2 m ( x) = ∑ hk w1,mk ( x) y w2 m +1 ( x) = ∑ (−1) k h− k +1w1,mk ( x)
k k
Estos paquetes calculan bases alternativas de los mismos espacios que se estudio la
dilatación y traducción de las funciones de escala y Wavelet. Se observa que el conjunto { wm0,k, k
Z, m = 0, 1, …} forma una base ortonormal de L2(R) sin ajustar el índice de dilatación. Otra base
ortonormal posible para Vj es el conjunto de funciones de paquetes wavelet
{w
m
0, k , 0 ≤ m ≤ 2 j , k ∈ Z}
Vj+1 = Vj + Wj es otra base ortonormal para el espacio de detalle Wj.

Una base para L2(R) esta formada por una amplia K sobre Z, y la elección de un conjunto
de índices I = {(m0, j0), (m1, j1), …} se realiza en el intervalo [2ji mi, 2ji (mi+1)] cubriendo así todo el
intervalo [0, ∞):
∞
U 2 ji
)
mi , 2 ji (mi + 1) = [ 0, ∞ )
i =1
Se demuestra que la base wavelet tienen una cubierta como: (m0, j0) = (0,0), y, a
continuación, se establece que m1 = m2 = ... = 1 y dejar ji = i, para, i = 1,2 .... Esto es válido para la
base de Haar, estos resultados se utilizan para las funciones Wavelet y sus subespacios asociados Vj
y WJ para j ε Z.

La colección de funciones de paquetes Wavelet tienen demasiados elementos para formar

una base ortonormal. Denotando por I los índices de la descomposición de L2(R), la función f en sus
componentes de paquetes Wavelet está dada por:
f(x)= ∑ ∑∑ a mj,k wmj,k ( x)
(m,j) ∈I k∈Z
Donde los coeficientes se calculan a través de:

∞
= ∫
m
a j,k f ( x ) w mj, k ( x ) d x
−∞
Los paquetes Wavelet ofrecen una gran variedad en los conjuntos de funciones de base. La
agrupación de todas las bases se llama biblioteca de bases. Para elegir un buen paquete Wavelet útil
en la práctica, se elige una buena forma de adaptación donde se consigue que el conjunto más
adecuado de funciones de base representen una función determinada.
EL MEJOR ALGORITMO DE BASE

La descomposición de los paquetes Wavelet continuos se muestra en un diagrama de árbol.
Cada conjunto de coeficientes está sujeto a los filtros H y G. El cálculo de la descomposición
completa de paquetes wavelet consiste en aplicar filtros tanto a los valores Yi y recursivamente a
cada señal intermedia.
La descomposición de cada señal en cada nodo del árbol mediante la aplicación de los dos
filtros que se conoce como el algoritmo de división.
J
Este calculo se realiza en un vector de datos con n = 2 puntos para los r niveles de la Resolución, el
resultado es un grupo de series de coeficientes. En cada nivel, se tiene en cuenta que la disminución
de resolución en el filtro hay n coeficientes entre todos los conjuntos en el plano. El número total de
coeficientes es, n(r+1).
El algoritmo desarrollado por Coifman y Wickerhauser consiste en viajar por la estructura del
árbol, y tomar una decisión basada en los datos de cada nodo. El resultado es la mejor base para
representar el conjunto de datos.
Este algoritmo asegura que el conjunto de índices resultante {(m0, j0), (m1, j1)...} cubre el
intervalo [0, ∞), garantizando una base ortonormal de L2(R).

APÉNDICE 10
TRADUCCIÓN INVARIANTE WAVELET

SMOOTHING
Uno problema de la base Wavelet es la falta de invariancia en la traducción. Se define la
descomposición de la base Haar de la función como f(x)=Ψ(x). Ahora la traducción de F es una
pequeña cantidad δ: f (x) = Ψ (x-δ).
Esta función se define en L2(R) y se descompone en sus componentes Wavelet, perdiendo la
estructura del coeficiente de la descomposición original. Para esta función hay sucesivamente:
o Dos coeficientes no nulos en el nivel 0: (d0,0 d0,1)=(1-2 δ, δ)
o Tres coeficientes no nulos en el nivel 1: (d1,0 d1,1 d1,2)=√2(-δ, δ, δ)
Si δ es el cambio llevado a ser un número entero, entonces la estructura se conserva: Si d0,δ
= 1 y los demás coeficientes son cero, la descomposición Wavelet Haar es invariante bajo cambios
integrales de traducción.
La energía en la función se garantiza que conserva en el conjunto total de coeficientes
Wavelet. La falta de invariancia es una debilidad importante, que se aplica a los métodos finitos
Wavelet de los conjuntos de datos con tamaños de muestras pequeños o moderados.
A todos los conjuntos de datos, se aplica la teoría universal a todos los niveles de los
coeficientes mediante el operador umbral. El estimador Wavelet resultante se muestra junto a cada
conjunto de datos. Los errores:
2
1 n  i  i 
 ∑ f  − f  
 n  i =1  n  n 
Coifman y Donoho consideran el problema de la falta de invariancia por traslación de
diversas causas en la reconstrucción de funciones, como los fenómenos Gibbs. Se propuso una
solución ingeniosa pero simple, producir un cambio en el conjunto de datos antes de que la
descomposición tuviese lugar, entonces se descomponen, se encogen, se reconstruye, y se invierte el
turno. Esto no se utiliza en la práctica porque es complicado controlar todos los datos. Por ello se
calcula el estimador de Wavelet para todos los cambios posibles, invirtiendo el turno y tomando
como estimación final la media de las estimaciones resultantes de todos los cambios de valores.

Bibliografía:
1. Bosq, D. y Blande, D. (2007). Prediction and inference in large dimensions.

Wiley Series in Probability and Statistics. Wiley-Dunod.
2. Lazar, N.A. (2008). The statistical analysis of functional MRI data. Serie:
Statistics for Biology and Health. Springer Science+Business Media.
3. Ruiz-Medina, M.D. y Angulo, J.M. (2002). Spatio-temporal filtering using

wavelets. Stochastic Environmental Research and Risk Assessment, 16, 241-
266.
4. Ruiz-Medina, M.D., Angulo, J.M. y Fernández-Pascual, R (2007). Wavelet-

vaguelette decomposition of spatiotemporal random fields. Stochastic
Environmental Research and Risk Assessment 21, 273-281.
5. Friston, K.J. Ashburner, J. Kiebel, S.J. Nichols, T.E. y Penny, W.D. (2007) The
Analysis of Functional Brain Images. Statistical Parametric Mapping.
6. Montgomery, C. (2002). Diseño y análisis de experimentos. Limusa-Wiley.
7. Tuckey, J. (1977). Exploratory Data Analysis. Addison-Wesley
8. Peña, D. (1998). Estadística. Modelos y Métodos 2. Modelos Lineales y Series

Temporales. Alianza Universidad Textos.
9. AIR, J. ANDERSON, R. TATHAM, R. y BLACK, W. (1999). Análisis

Multivariante. Prentice Hall.
10. Higham, D.J. y Higham, N.J. (200) Matlab guide. SIAM.
11. Berger, G. (1985). Statistical Decision Theory and Bayesian Analysis. Springer-
Verlag.
12. Ingo R. Keck, (2007) Ica aplicado a datos de EEG y fMRI. Tesis de la
Universidad de Regensburg, Alemania.
13. Carpintiero, M. y Salvat, B. (2002) Resonancia Magnética Funcional: Casos

clínicos. Departamento de Neurología. Buenos Aires.
14. Campitelli, G. Recordar como habilidad experta: refutación de la hipótesis de

los almacenes de memoria. Universidad Abierta Interamericana.

15. Vayá, M.I. Análisis de series temporales mediante ICA. (Biomedical Mining
Group, Universidad Politécnica de Valencia).
16. Nardi, B. Capecci, I. Fabri, M. Polonara, G. Salvolini, U. Bellantuono, C. y

Moltedo, A. (2008) Estudio mediante imagen funcional de resonancia magnética
(fMRI) de las activaciones emotivas correlacionadas a la presentación de rostros
extraños o del propio rostro en sujetos con personalidad inward y outward.
Universidad Politécnica de la Marca, Italia.
17. Chavarrías, C. Benito, M. Montesinos, P. García-Vázquez, V. Taylor, J.

Goiriena, E. Desco, M. Adquisición de imágenes de resonancia magnética
funcional (fMRI) en cerebro de rata. Laboratorio de Imagen Médica. Unidad de
Medicina y Cirugía Experimental, Hospital General Universitario Gregorio
Marañón, Madrid, España.
18. Sánchez, C. L. Aplicaciones Open Source en el ámbito de la Salud y Sanidad.

Coordinador Técnico de la Plataforma para la Salud en Código Abierto. Proceso
de Datos de la Delegación de Innovación, Ciencia y Empresa. Junta de
Andalucía. España.
19. Quirós, A. (2010) Análisis Estadístico de imágenes de resonancia magnética

funcional. Tesis de la Universidad Rey Juan Carlos, Albacete.
20. Mazzone, L. Yu, Shan. y Blair, C. Un estudio de fMRI de circuitos

frontoestriatales durante la inhibición del parpadeo en personas con Síndrome
de Tourette. Instituto de Psiquiatria Interactiva, Mallorca.
21. Angioma Alliance (2010). Información esencial sobre las imágenes

diagnósticas.
http://www.angiomaalliance.org/pages.aspx?content=208&id=198
22. Radiological Society of North America, Inc. (2010). RMN funcional (RMNf) –
Cerebro. http://www.radiologyinfo.org/sp/info.cfm?pg=fmribrain
23. Ursino, M.T. (2009). Resonancia magnética.

http://www.elnegrodeneuro.com.ar/neuroimagenes/rm.html
24. Principios Básicos Resonancia Magnética. (2008).

http://sirfreakthemighty.wikidot.com/mri:basics

25. García, H. y Ramírez, J.F. Método Basado en Redes Neuronales Wavelet para
Eliminar Ruido en Espectros Estelares. Instituto Tecnológico de Apizaco,
Mexico. http://www.lsi.us.es/redmidas/CEDI07/[11].pdf.

Introducción Al Análisis Estadístico de Imágenes de Resonancia Magnética Funcional

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Introducción Al Análisis Estadístico de Imágenes de Resonancia Magnética Funcional

Cargado por

Copyright:

Formatos disponibles

INTRODUCCIÓN AL ANÁLISIS ESTADÍSITICO DE IMÁGENES DE RESONANCIA MÁGNETICA FUNCIONAL

Línea de investigación realizada por:

Rosa María Espejo Montes

Tutora de la línea de investigación:

María Dolores Ruiz Medina

Facultad de Ciencias – Universidad de Granada

Rosa María Espejo Montes Página 1 de 118

1. PRELMINARES SOBRE EL FMRI

2. ENFOQUES EN EL ANÁLISIS ESTADÍSTICO DE FMRI

3. ENFOQUES DEL ANÁLISIS ESTADÍSTICO MULTIVARIANTE

Rosa María Espejo Montes Página 2 de 118

3.1.2 Análisis de Componentes Independientes

4. PROYECCIÓN EN BASES FUNCIONALES. FUNCIONES WAVELETS

5. ANÁLISIS BAYESIANO DE FMRI

6. OTROS MÉTODOS DE ANÁLISIS DE FMRI

7. IMPLEMENTACIÓN EN CÓDIGO MATLAB

Rosa María Espejo Montes Página 3 de 118

7.6.4. Estimación de los grados de libertad

8. ALGUNAS REFERENCIAS RECIENTES EN EL ANÁLISIS ESTADÍSTICO

Rosa María Espejo Montes Página 4 de 118

La imagen por resonancia magnética funcional (FMRI) es un procedimiento clínico y de

PARTE I: Elementos básicos de las FMRI

Rosa María Espejo Montes Página 5 de 118

información codificada en espacio de fase. Esta información se transformada en posiciones espaciales

Si τ 2 <τ1 la pérdida de coherencia de fase ocurre antes de alcanzar el equilibrio.

Rosa María Espejo Montes Página 6 de 118

T1 es la componente de relajación que ocurre en la dirección del campo magnético ambiente.. T1 se

1.3 Resonancia magnética para FMRI

magnetización transversal, relacionada con τ 2 y τ 2 .

1.4 Datos de la imagen

Rosa María Espejo Montes Página 7 de 118

La frecuencia de Larmor es la frecuencia a la que la RM de un núcleo puede excitarse y detectarse.

vector de magnitud ρ ( x, y ) siendo el tamaño de la unidad elemental ( dx dy ) y la fase se denota por

PARTE II: DISEÑO EXPERIMENTAL PARA FMRI

Rosa María Espejo Montes Página 8 de 118

• La coronal o frontal son rebanadas paralelas a la parte frontal del cuerpo.

Definición de los parámetros:

Fenómeno de decaimiento de inducción libre (FID): es la señal recibida en el tiempo t=0 .

Rosa María Espejo Montes Página 9 de 118

En el TR si el pulso se apaga la magnetización en el plano transversal comienza a decaer, con una

En el momento t = T, se aplica el siguiente pulso M z (TR ) = M 0 1 − e ( −TR /T1

M 0 (1 − e −TR /T1 ) e −TE /T2 .

Se puede cambiar la señal de resonancia magnética al modificar el tiempo de repetición y el tiempo

cAB = M0 A (1− e−TR/T1A ) e−TE/T2 A − M0B (1− e−TR/T1B ) e−TE/T2 B

- Si T1 A > T1B el tejido A tiene mayor tiempo de recuperación que el tejido B.

Rosa María Espejo Montes Página 10 de 118

( FOVX / N X )( FOVY ) ∆Z NEX / NY BW

1.2.1.3 Llenado en el espacio k

Rosa María Espejo Montes Página 11 de 118

1.2.2. Cuestiones estadísticas del diseño

Rosa María Espejo Montes Página 12 de 118

1.2.3. Cuestiones adicionales.

Rosa María Espejo Montes Página 13 de 118

o La selección de los diseños es similar a la selección natural seleccionando los mejores, y

PARTE III: ANÁLISIS DE LAS FUENTES DE VARIACIÓN

1.3.2. Manipular el ambiente del escáner con el tratamiento del ruido

Rosa María Espejo Montes Página 14 de 118

1.3.3 Procesamiento de datos FMRI

Rosa María Espejo Montes Página 15 de 118

Corrección de Ruido fisiológicos

Rosa María Espejo Montes Página 16 de 118

Evaluar el estudio de los efectos de pre-procesamiento

PARTE IV: PROCESAMIENTO DE DATOS FMRI

Rosa María Espejo Montes Página 17 de 118