Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El modelado lineal generalizado es flexible y poderoso, con coeficientes β que son relativamente
fáciles de interpretar, especialmente cuando se comparan entre sı́ (ya que todos actúan sobre el
mismo predictor lineal). Sin embargo, no todos los fenómenos se comportan linealmente, incluso
bajo transformación. Este capı́tulo considera el caso más general en el que los parámetros y los
predictores no se combinan linealmente. Ejemplos simples incluyen una razón tal como E(y) =
a1 + b 1 x 1
o una suma de funciones no lineales tales como E(y) = A1 e−α1 x + A2 e−α2 x , ver Ejercicio
a2 + b 2 x 2
19.3.
1
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 2
Debido a que los modelos no lineales vienen en muchos sabores, no hay un menú sistemático
de opciones para presentar. En general, cada nuevo problema de modelado debe abordarse de
nuevo. Presentamos dos ejemplos de nuestra propia investigación aplicada para dar una idea de
las posibilidades.
Más precisamente, las diluciones brindan varias medidas de diferente precisión, y un enfoque baye-
siano o de probabilidad deberı́a permitirnos combinar la información en estas medidas de manera
adecuada. Un ensayo se presenta en una placa con varios pocillos, cada uno de los cuales contiene
una muestra o una dilución especı́fica de una muestra. Hay dos tipos de muestras: las desconocidas,
que son las muestras que deben medirse y sus diluciones, y las estándares, que son diluciones de
un compuesto conocido, que se utilizan para calibrar las mediciones. La Figura 19.1 muestra una
placa tı́pica con 96 pocillos; las dos primeras columnas de la placa contienen las estándares y sus
diluciones y las diez columnas restantes son para cantidades desconocidas. Los valores de dilución
para las muestras desconocidas están más espaciados que los estándares para cubrir un rango más
amplio de concentraciones con un número dado de ensayos.
Figura 19.1: Configuración tı́pica de una placa con 96 pocillos para un ensayo de dilución en serie.
Las primeras dos columnas son diluciones “estándares” con concentraciones conocidas, y las otras
diez columnas son “desconocidas” diferentes. El objetivo del ensayo es estimar las concentraciones
de las desconocidas, utilizando las estándares como calibración.
Datos de laboratorio
La Figura 19.2 muestra datos de una sola placa en un estudio de alérgenos de cucarachas en los
hogares de pacientes con asma. Cada gráfico muestra las mediciones ópticas y frente a las diluciones
para un solo compuesto junto con una curva estimada que describe la relación entre la dilución y la
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 3
medición. La estimación de las curvas que relacionan las diluciones con las mediciones se describe
a continuación.
Figura 19.2: Datos de una sola placa de un ensayo de dilución en serie. El gráfico grande muestra los
datos de calibración, y los diez gráficos pequeños muestran datos de los compuestos desconocidos.
El objetivo del análisis es descubrir cómo escalar los ejes x de los desconocidos para que se alineen
con la curva estimada a partir de los estándares. (Las curvas mostradas en estos gráficos se estiman
a partir del modelo como se describe en la Sección 19.1).
Figura 19.3: Ejemplo de mediciones y de una placa según lo analizado por un software estándar uti-
lizado para ensayos de dilución. Los datos estándar se utilizan para estimar la curva de calibración,
que luego se usa para estimar las concentraciones desconocidas. Las concentraciones indicadas por
asteriscos están etiquetadas como “por debajo del lı́mite de detección”. Sin embargo, la informa-
ción está presente en estas observaciones bajas, como puede verse al observar el patrón decreciente
1 1
de las mediciones de las diluciones 1 a a en cada muestra .
3 9
La Figura 19.3 ilustra las dificultades con un enfoque actualmente estándar para estimar concentra-
ciones desconocidas. La parte izquierda de la figura muestra los datos estándar (correspondientes
al primer gráfico de la Figura 19.2): las dos muestras iniciales tienen concentraciones conocidas
de 0.64, cada una seguida por varias diluciones y una medición de cero. Las mediciones de color
óptico comienzan por encima de 100 para las muestras con una concentración de 0.64 y disminuyen
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 4
a alrededor de 14 para las muestras de concentración cero (todos compuestos inertes). La parte
derecha de la Figura 19.3 muestra, para dos de las diez incógnitas de la placa, las medidas de color
y y las estimaciones de concentración correspondientes de un método estándar.
Todas las estimaciones para el desconocido 8 se muestran con asteriscos, lo que indica que se
registraron como “por debajo del lı́mite de detección” y el programa informático estándar para
analizar estos datos no proporciona ninguna estimación. Un vistazo casual a los datos (vea la gráfica
de Desconocido 8 en la Figura 19.2) podrı́a sugerir que estos datos son en realidad todos de ruido,
pero un análisis cuidadoso de los números revela que las mediciones disminuyen constantemente
1 1
de las concentraciones de 1 a , con solo las diluciones finales aparentemente perdidas en el
3 9
1 1
ruido (en que las medidas en no son más bajas que en ). Una señal clara está presente para
27 9
las primeras seis mediciones de esta muestra desconocida.
El desconocido 9 muestra un mejor resultado, en el que cuatro de las ocho mediciones están por
encima del lı́mite de detección. Las cuatro mediciones más diluidas producen lecturas que están
por debajo del lı́mite de detección. Una vez más, sin embargo, la información parece estar presente
en las mediciones más bajas, que disminuyen de manera consistente con la dilución.
Como se puede ver en la Figura 19.2, los desconocidos 8 y 9 no son casos extremos, sino que son
algo tı́picos de los datos de esta placa. En las mediciones de alérgenos, incluso las concentraciones
bajas pueden ser importantes, y debemos ser capaces de distinguir entre concentraciones cero y
valores que son simplemente bajos. La inferencia bayesiana que se describe aquı́ hace que esta
distinción sea mucho más precisa que el método anterior mediante el cual se analizaron dichos
datos.
El modelo
Notación. Los parámetros de interés en un estudio como el de las Figuras 19.1 – 19.2 son las
concentraciones de las muestras desconocidas; los etiquetamos como θ1 , ..., θ1 0 para la disposición
de la placa que se muestra en la Figura 19.1. La concentración conocida del estándar se denota por
θ0 . Etiquetamos la concentración en el pozo i como xi y utilizamos yi para indicar la medida de
intensidad de color correspondiente, con i = 1, ..., 96 para nuestro plato. Cada xi es una dilución
especı́fica de una de las muestras. Configuramos el modelo para las observaciones de intensidad de
color y en etapas: un modelo paramétrico para la intensidad de color esperada para una concen-
tración dada, errores de medición para las lecturas ópticas, errores introducidos durante el proceso
de preparación de la dilución y, finalmente, distribuciones previas para todos Los parametros.
β2
E(y|x, β) = g(x, β) = β1 + (19.1)
1 + (x/β3 )−β4
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 5
Error de medición. Los errores de medición se modelan como distribuidos normalmente con
varianzas desiguales:
2α !
g(xi , β)
yi N g(xi , β), σy2 (19.2)
A
donde el parámetro α, que se limita a estar entre 0 y 1, modela el patrón de que las varianzas son
más altas para mediciones más grandes (por ejemplo, consulte la Figura 19.2). La constante A en
(19.2) es arbitraria; lo establecimos en el valor 30, que está en el centro del rango de los datos. Se
incluye en el modelo para que el parámetro σy tenga una interpretación más directa como el error
de la desviación estándar para una medición “tı́pica”.
Errores de dilución. El proceso introduce errores en dos lugares: la dilución inicial, en la cual
una cantidad medida del estándar se mezcla con una cantidad medida de un lı́quido inerte; y
diluciones en serie, en las que una muestra se diluye por un factor fijo como 2 o 3. Para los datos
de alérgenos de cucarachas, los errores de dilución en serie fueron bajos, por lo que solo incluimos
el error de dilución inicial en nuestro modelo.
Usamos un modelo normal en la escala de registro (natural) para el error de dilución inicial asociado
con la preparación de la muestra estándar. La concentración conocida de la solución estándar es θ0 ,
y dinit
0 es la dilución inicial (conocida) del estándar requerido. Sin error de dilución, la concentración
de la dilución inicial serı́a por lo tanto dinit0 θ0 . Sea x la concentración real (desconocida) de la
dilución inicial, con
log(xinit init
0 ) ∼ N (log(d0 · θ0 ), (σ init )2 ) (19.3)
Para los desconocidos, no hay dilución inicial, por lo que la concentración inicial desconocida
para la muestra j es xinit
j = θj para j = 1, ..., 10. Para las diluciones adicionales de estándares y
desconocidos, simplemente establecemos
xi = di · xinit
j(i) , (19.4)
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 6
Hay un parámetro en el modelo - σ init , la escala del error de dilución inicial - que no se puede
estimar a partir de una sola placa. Para nuestro análisis, lo fijamos en el valor 0.02 (es decir, un
error de dilución inicial con una desviación estándar del 2 %), que se obtuvo a partir de un análisis
previo de datos de placas con varias diluciones iniciales diferentes del estándar.
Inferencia. Ajustamos el modelo utilizando el paquete Bugs (un antecesor del software Stan
descrito en el Apéndice C). Obtuvimos una convergencia aproximada (los posibles factores de
reducción de escala Rb estaban por debajo de 1.1 para todos los parámetros) después de 50, 000
iteraciones de dos cadenas paralelas de la muestra de Gibbs. Para ahorrar memoria y tiempo
de cálculo al procesar las simulaciones, guardamos cada 20 iteración de cada cadena. Al ajustar
el modelo, es útil usar puntos de inicio razonables (que se pueden obtener usando estimaciones
crudas de los datos) y parametrizar en términos de los logaritmos de los parámetros βj y las
concentraciones desconocidas θj . Para acelerar la convergencia, trabajamos con los parámetros
logβ, α, σy y logγ, donde log(γj ) = log(θj /β3 ). El uso de γj en lugar de θj soluciona el problema
de la fuerte correlación posterior entre las concentraciones desconocidas y el parámetro β3 , que
indexa la posición x de la curva de calibración (consulte (19.1)).
Las estimaciones de la mediana posterior (y los intervalos posteriores del 50 %) para los parámetros
de la curva de calibración son βb1 = 14.7[14.5, 14.9], βb2 = 99.7[96.8, 102.9], βb3 = 0.054[0.051, 0.058]
y βb4 = 1.34[1.30, 1.38]. La estimación de la mediana posterior de β define una curva g(x, β) que se
muestra en el gráfico superior izquierdo de la Figura 19.1. Como se esperaba, la curva pasa por los
datos utilizados para estimarla. Los parámetros de varianza σy y α se estiman en 2.2 y 0.97 (con
intervalos del 50 % de [2.1, 2.3] y [0.94, 0.99], respectivamente). La alta precisión de las mediciones
(como se puede ver en las repeticiones en la Figura 19.2) permitió que los parámetros se estimaran
con precisión a partir de un conjunto de datos relativamente pequeño.
La Figura 19.4 muestra las inferencias para las concentraciones de las 10 muestras desconocidas.
Utilizamos estas estimaciones, junto con la curva de calibración estimada, para graficar curvas
escaladas para cada una de las 10 desconocidas que se muestran en la Figura 19.2. Finalmente, la
Figura 19.5 muestra los residuos, que parecen generalmente razonables.
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 7
Figura 19.5: Residuos estandarizados (yi − E(yi |xi ))/sd(yi |xi )) vs. valores esperados E(yi |xi ), para
el modelo se ajusta los estándares y datos desconocidos de una sola placa. Los cı́rculos y cru-
ces indican medidas de estándares y de desconocidos, respectivamente. No aparecen problemas
importantes con el ajuste del modelo.
El método que es la práctica estándar en el campo implica primero estimar la curva de calibración
y luego transformar cada medición de las muestras desconocidas directamente a una concentración
estimada, invirtiendo la curva de calibración ajustada. Para cada muestra desconocida, las con-
centraciones estimadas se dividen por sus diluciones y se promedian para obtener una estimación
única. (Por ejemplo, utilizando este enfoque, la concentración estimada para el desconocido 9 a
partir de los datos mostrados en la Figura 19.3 es 1/4(0.040 + 0.031 + 3 · 0.005 + 3 · 0.005) = 0.025).
Las estimaciones del análisis bayesiano son generalmente similares a las del método estándar pero
con mayor precisión. Una ventaja del enfoque bayesiano es que produce una estimación de concen-
tración para todas las desconocidas, incluso el desconocido 8 para el cual no existe una estimación
estándar porque todas sus mediciones están “por debajo del lı́mite de detección”. También crea-
mos estimaciones de concentración para cada incógnita en función de cada una las dos mitades de
los datos (en la configuración de la Figura 19.1, utilizando solo los cuatro pozos superiores o los
cuatro pozos inferiores para cada desconocido). Para los enfoques estándar y bayesiano, las dos
estimaciones son similares, pero la confiabilidad (es decir, el acuerdo entre las dos estimaciones) es
mucho más fuerte para la estimación bayesiana. No nos gustarı́a hacer una afirmación demasiado
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 8
fuerte basada en datos de una sola placa. Realizamos un estudio más exhaustivo (no se muestra
aquı́) para comparar los métodos antiguos y nuevos en un rango de condiciones experimentales.
En esta sección, analizamos un modelo no lineal mucho más complicado utilizado en la toxico-
cinética (el estudio del flujo y el metabolismo de las toxinas en el cuerpo) con el objetivo final de
evaluar el riesgo en la población general asociada con un contaminante del aire en particular. Este
modelo es jerárquico y multivariado, con un vector de parámetros que se estimarán en cada uno
de varios sujetos experimentales. Las distribuciones anteriores para este modelo son informativas
y jerárquicas, con componentes de varianza separados correspondientes a la incertidumbre sobre
el nivel promedio en la población y la variación alrededor de ese promedio.
Antecedentes
El percloroetileno (PERC) es uno de los muchos productos industriales que causan cáncer en los
animales y se cree que también lo hace en los seres humanos. Se respira PERC, y el entendimiento
general es que se metaboliza en el hı́gado y que sus metabolitos son cancerı́genos. Por lo tanto,
una “dosis” relevante para estudiar al calibrar los efectos del PERC es la cantidad metabolizada
en el hı́gado. No todo el PERC que una persona respira será metabolizado. Nos centramos aquı́ en
estimar la fracción metabolizada en función de la concentración del compuesto en el aire respirado, y
cómo esta función varı́a en toda la población. Para dar una idea de nuestros objetivos inferenciales,
nos adelantamos para mostrar algunos resultados de nuestro análisis. La Figura 19.6 muestra la
fracción estimada de PERC inhalado que se metaboliza en función de la concentración en el aire,
para 10 extracciones seleccionadas al azar de la población estimada de hombres adultos jóvenes
blancos (el grupo sobre el cual tenı́amos datos). La forma de la curva se describe a continuación
después de que se describe el modelo estadı́stico.
Figura 19.6: Fracción estimada del PERC metabolizado, en función de la concentración en estado
estacionario en el aire inhalado, para 10 individuos hipotéticos seleccionados al azar de la población
estimada de varones blancos adultos jóvenes.
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 9
No es posible estimar curvas de este tipo con una confianza razonable usando procedimientos
simples como la medición directa de concentraciones de metabolitos (difı́cil incluso en exposiciones
altas y no es factible en exposiciones bajas) o extrapolación de resultados de animales. En su lugar,
se utiliza un modelo matemático del flujo de la toxina a través del torrente sanguı́neo y los órganos
del cuerpo, y de su metabolismo en el hı́gado para estimar la fracción del PERC metabolizado.
En la Figura 19.7 se muestra una muestra de los datos experimentales que utilizamos para ajustar
el modelo del flujo de toxinas. Cada uno de los seis voluntarios estuvo expuesto a PERC a un nivel
alto durante cuatro horas (se creı́a que el tiempo suficiente para que las concentraciones de PERC
en la mayorı́a de sus órganos corporales alcanzaran el equilibrio) y luego las concentraciones de
PERC en aire exhalado y en sangre se midieron durante un perı́odo de una semana (168 horas).
Además, los datos de cada persona se repitieron en un segundo nivel de exposición (datos no
mostrados).
Figura 19.7: Concentración de PERC (en miligramos por litro) en aire exhalado y en sangre, con el
tiempo, para una de dos repeticiones en cada uno de los seis sujetos experimentales. Las medidas
se muestran en escalas logarı́tmicas.
Modelo toxicocinético.
Nuestro análisis se basa en un modelo fisiológico estándar, según el cual la toxina entra y sale a
través de la respiración, se distribuye por flujo sanguı́neo a cuatro “compartimentos”, tejidos bien
perfundidos, tejidos mal perfundidos, grasa e hı́gado, y se metaboliza en el hı́gado. Este modelo
tiene una larga historia en el modelado de toxicologı́a y se ha demostrado que reproduce la mayorı́a
de las caracterı́sticas de dichos datos. Un modelo más simple de uno o dos compartimentos podrı́a
ser más fácil de estimar, pero tales modelos no se ajustan bien a nuestros datos y, lo que es más
importante, no tienen la complejidad para ajustarse con precisión a las diferentes condiciones de
exposición.
Describimos brevemente la naturaleza del modelo toxicocinético, omitiendo detalles que no son
necesarios para comprender nuestro análisis. Dada una concentración conocida del compuesto en
el aire, la concentración del compuesto en cada compartimento a lo largo del tiempo se rige por
una ecuación diferencial de primer orden, con parámetros para el volumen, el flujo sanguı́neo y el
coeficiente de reparto (concentración de equilibrio en relación con la sangre) de cada compartimen-
to. El compartimiento del hı́gado donde se produce el metabolismo tiene una ecuación ligeramente
diferente a los otros compartimentos y se rige por los parámetros mencionados anteriormente y
un par de parámetros adicionales. Las cuatro ecuaciones diferenciales dan lugar a un total de 15
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 10
parámetros para cada individuo. Utilizamos la notación θk = (θk1 , ..., θkL ) para el vector de L = 15
parámetros asociados con la persona k.
Dados los valores de los parámetros fisiológicos y las condiciones de exposición iniciales, las ecua-
ciones diferenciales se pueden resolver utilizando algoritmos numéricos especializados para obtener
las concentraciones del compuesto en cada compartimento y la tasa de metabolismo en función del
tiempo. Podemos combinar las predicciones sobre la concentración de PERC en el aire exhalado y
la sangre en función de la solución numérica de las ecuaciones diferenciales con nuestras mediciones
de concentración observadas para estimar los parámetros del modelo para cada individuo.
Modelo de medición.
Primero describimos cómo se usa el modelo toxicológico como un componente del modelo no
lineal para las mediciones de concentración de sangre y aire. A continuación, se presenta una
descripción del modelo de población que nos permite inferir la distribución de las caracterı́sticas
de la población relacionadas con el metabolismo del PERC. Los datos son una serie de mediciones
de aire exhalado y se toman concentraciones de sangre en cada una de las seis personas en el estudio.
Etiquetamos estos datos como yjkmt , con r repeticiones de indexación (j = 1, 2 para los dos niveles
de exposición en nuestros datos), k individuos indexados, m mediciones de indexación (m = 1 para
la concentración en sangre y m = 2 para la concentración en el aire), y t tiempo de indexación.
Los valores esperados de las concentraciones de aire y sangre exhaladas son funciones no lineales
gm (θk , Ej , t) de los parámetros individuales θk del individuo, el nivel de exposición Ej y el tiempo
t. Las funciones gm (·) son nuestra notación abreviada para la solución del sistema de ecuaciones
diferenciales que relacionan los parámetros fisiológicos con la concentración esperada. Dadas las
condiciones de entrada para la replicación j (es decir, Ej ) y los parámetros θk (ası́ como una
cantidad de cantidades adicionales medidas en cada individuo pero suprimidas en nuestra notación
aquı́), uno puede evaluar numéricamente las ecuaciones diferenciales farmacocinéticas a lo largo del
tiempo y calcular g1 y g2 para todos los valores a los que se han realizado mediciones, obteniendo
ası́ los valores esperados de todas las mediciones. Las concentraciones realmente observadas en el
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 11
aire y la sangre caducados también se ven afectadas por los errores de medición, que, como de
costumbre, se supone que son independientes y lognormalmente distribuidos, con una media de
cero y una desviación estándar de σm (en la escala de registro) para m = 1, 2. Estas distribuciones
de errores de medición también dan cuenta implı́citamente de errores en el modelo. Permitimos
que los dos componentes de σ difieran, porque las mediciones en sangre y aire exhalado tienen
diferentes protocolos experimentales y, por lo tanto, es probable que tengan precisiones diferentes.
No tenemos ninguna razón particular para creer que los errores de medición o modelado para
las mediciones de aire y sangre se correlacionarán, por lo que asignamos distribuciones a prioris
uniformes independientes a logσ1 y logσ2 . (Después de ajustar el modelo, examinamos los residuos
y no encontramos ninguna evidencia de correlaciones altas).
Uno de los objetivos de este proyecto es estimar la distribución de los parámetros farmacocinéticos
individuales y de los valores predichos, como la fracción metabolizada (que son funciones complejas
de los parámetros individuales), en la población general. En un experimento con K individuos,
establecimos un modelo jerárquico en los K vectores de parámetros para permitirnos extraer in-
ferencias sobre la población general de la que se extraen los individuos. Una distribución sesgada
y lognormal se observa generalmente para los parámetros biológicos. La mayorı́a, si no todos, de
los parámetros biológicos también tienen lı́mites fisiológicos. Sobre la base de esta información,
los parámetros farmacocinéticos individuales después de la transformación logarı́tmica y el esca-
lamiento apropiado (ver a continuación), se modelan con distribuciones normales que tienen una
media poblacional truncada a ±3 desviaciones estándar de la media, donde k ı́ndexa individuos
y l = 1, ..., L indexa los parámetros farmacocinéticos en el modelo. Las distribuciones se truncan
para restringir los parámetros del modelo a valores cientı́ficamente razonables. Además, los trunca-
mientos desempeñan un papel útil cuando monitoreamos las simulaciones de los parámetros desde
su distribución posterior: si las simulaciones de un parámetro están pegadas cerca de los puntos
de truncamiento, esto indica que los datos y el modelo farmacocinético contradigan la distribución
anterior, y alguna parte del modelo debe ser reexaminada.
El vector de parámetros para k individual es θk = (θk1 , ..., θkL ) con L = 15. Algunos de los
parámetros están limitados por definición: en el modelo en discusión, los parámetros θk2 , θk3 , θk4 ,
θk5 representan las fracciones del flujo de sangre a cada compartimento, y por lo tanto se limitan a
sumar a 1. También, los parámetros θk6 , θk7 , θk8 corresponden a los coeficientes de escalamiento de
los volúmenes de órganos, y se limitan a sumar a 0.873 (la fracción estándar de la masa corporal
magra sin incluir los huesos), para cada individuo. De estos tres parametros, θk8 , el volumen del
hı́gado es mucho más pequeño que los otros y existe una considerable información previa sobre
esta cantidad. Para los propósitos de modelado y cálculo, transformamos el modelo en términos
de un nuevo conjunto de parámetros ψkl definidos de la siguiente manera:
eψkl
θkl = ψ , para l = 2, 3, 4, 5
e k2 + eψk3 + eψk4 + eψk5
eψkl (19.5)
= (0.873 − eψk8 ) ψ , para l = 6, 7
e k6 + eψk7
= eψkl , para l = 1 8 − 15.
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 12
Los parámetros ψk2 , ..., ψk5 y ψk6 , ..., ψk7 no están identificados (por ejemplo, agregando cualquier
constante a ψk2 , ..., ψk5 no altera los valores de los parámetros fisiológicos, θk2 , ..., θk5 ), pero se
les asignan distribuciones a priori adecuadas, por lo que podemos manipular formalmente sus
distribuciones posteriores.
Se supone que cada conjunto de parámetros ψkl sigue una distribución normal con una media µl y
una desviación estándar τl , truncada en tres desviaciones estándar. El modelado en la escala de ψ
respeta las restricciones en θ al tiempo que conserva las distribuciones lognormales truncadas para
los componentes no restringidos. Todos los cálculos se realizan con las ψ’s, que luego se transforman
de nuevo a θ’s para interpretar los resultados en las escalas naturales.
Información a priori.
Para ajustar el modelo de población, asignamos distribuciones a priori a las medias y varianzas, µl
y τl2 , de los parámetros fisiológicos L (transformados). Especificamos una distribución a priori para
cada µl (normal con los parámetros Ml y Sl2 según el conocimiento sustantivo) y τl2 (χ2 -inversa,
centrada en una estimación τ0l2 de la verdadera varianza poblacional y con un número bajo de
grados de libertad νl , tı́picamente establecer en 2 para indicar grandes incertidumbres).
El modelo tiene 15 parámetros para cada una de las seis personas en un experimento toxicocinético;
θjk es el valor del parámetro kth para la persona j, con j = 1, ..., 6 y k = 1, ..., 15. Información
a priori sobre los parámetros estaba disponible en la literatura biológica. Para cada parámetro,
era importante distinguir entre dos fuentes de variación: incertidumbre a priori sobre el valor
del parámetro y la variación de la población. Esto fue representado por un modelo lognormal
para cada parámetro, logθjk ∼ N (µk , τk2 ), y asignando distribuciones a prioris independientes
a la media geométrica de la población y la desviación estándar, µk y τk : µk ∼ N (Mk , Sk2 ) y
τk2 ∼ χ2 − Inv(ν, τk02
). La distribución a priori en µk , especialmente a través de la desviación
estándar Sk , describe nuestra incertidumbre acerca de los valores tı́picos del parámetro en la
población. La distribución a priori en τk nos informa sobre la variación de la población para el
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 13
parámetro. Debido a que el conocimiento previo sobre la variación de la población era impreciso,
los grados de libertad en las distribuciones a prioris para τk2 se establecieron en el valor bajo de
ν = 2.
Algunos parámetros se entienden mejor que otros. Por ejemplo, se estimó que el peso del hı́gado,
cuando se expresaba como una fracción del peso corporal magro, tenı́a una media geométrica
poblacional de 0.033, con la incertidumbre sobre el promedio de la población y la heterogeneidad
en la población estimada en el orden del 10 % al 20 %. Los parámetros anteriores se establecieron en
Mk = log(0.033), Sk = log(1.1) y τk0 = log(1.1). En contraste, el coeficiente de Michaelis-Menten
(un parámetro particular en el modelo farmacocinético) fue poco conocido: su media geométrica
poblacional se estimó en 0.7, pero con una posible incertidumbre de hasta un factor de 100 por
encima o por debajo. Sin embargo, a pesar de la gran incertidumbre en la magnitud de este
parámetro, se creı́a que no variaba más de un factor de 4 en relación con la media de la población,
entre los individuos de la población. Los parámetros anteriores se establecieron en Mk = log(0.7),
Sk = log(10) y τk0 = log(2). El modelo jerárquico proporciona un marco esencial para expresar las
dos fuentes de variación (o incertidumbre) y combinarlas en el análisis.
Para la inferencia bayesiana, obtenemos la distribución posterior (hasta una constante multiplica-
tiva) para todos los parámetros de interés, dados los datos y la información a priori, al multiplicar
todos los factores en el modelo jerárquico: la distribución de datos, p(y|ψ, E, t, σ), el modelo po-
blacional, p(ψ|µ, τ ) y la distribución a priori p(µ, τ |M, S, τ0 ),
Cálculo.
Nuestros objetivos son primero ajustar un modelo farmacocinético a los datos experimentales, y
luego usar el modelo para realizar inferencias sobre cantidades de interés, como la distribución
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 14
Las distribuciones condicionales para los parámetros ψ no tienen forma cerrada, por lo que mues-
treamos de ellas usando los pasos del algoritmo Metropolis, que solo requiere la capacidad de
calcular la densidad posterior hasta una constante multiplicativa, como en (19.6).
Nuestra implementación del algoritmo Metropolis altera los parámetros una persona a la vez (por
lo tanto, K salta en cada iteración, y cada salto afecta a un vector ψk de dimensión L). Los vectores
de parámetros se modifican utilizando una distribución de propuesta normal centrada en el valor
actual, con una matriz de covarianza proporcional a la obtenida a partir de algunas ejecuciones
iniciales y escaladas de modo que la tasa de aceptación sea de aproximadamente 0.23. Actualizar
los parámetros de una persona a la vez significa que los únicos factores de la densidad posterior
que deben calcularse para el paso de Metrópolis son los correspondientes a esa persona. Esta es
una preocupación importante, porque la evaluación de las funciones gm para obtener los valores
esperados de las mediciones es la parte más costosa del cálculo. Un enfoque alternativo serı́a alterar
un solo componente ψkl a la vez; esto requerirı́a saltos de KL en cada iteración.
Realizamos cinco ejecuciones de simulación independientes, cada una de 50,000 iteraciones, con
puntos de inicio obtenidos al muestrear cada ψkl al azar de su distribución a priori y luego es-
tableciendo los promedios de la población en sus medias a prioris, Ml . Luego comenzamos las
simulaciones muestreando σ y τ . Debido a las limitaciones de almacenamiento, guardamos solo
cada décima iteración del vector de parámetros. Monitoreamos la convergencia de las simulacio-
nes al comparar las variaciones dentro y entre simulaciones, como se describe en la Sección 11.4.
En la práctica, el modelo se implementó y depuró gradualmente durante un perı́odo de meses,
y una razón para nuestra confianza en los resultados es su consistencia general con simulaciones
anteriores de diferentes variantes del modelo.
En primer lugar, examinamos las inferencias acerca de los parámetros del modelo y su variabilidad
poblacional, y verificamos que tenı́an sentido y eran consistentes con la distribución a priori.
Después de esto, las principales cantidades de interés fueron la fracción de PERC metabolizado en
diferentes escenarios de exposición, según se calculó mediante la evaluación numérica del modelo de
ecuación diferencial bajo las condiciones de entrada apropiadas. Para cada k individual, podemos
calcular la fracción metabolizada para cada vector de parámetro simulado ψk ; el uso del conjunto de
simulaciones produce una distribución de la fracción metabolizada para ese individuo. La varianza
en la distribución para cada individuo se debe a la incertidumbre en la distribución posterior de
los parámetros fisiológicos, ψk .
La Figura 19.8 muestra las distribuciones posteriores de la fracción de PERC metabolizada, para
cada persona en el experimento, a un nivel de exposición alto de 50 partes por millón (ppm) y
un nivel bajo de 0.001 ppm. Las seis personas no estaban realmente expuestas a estos niveles; las
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 15
inferencias se obtuvieron al ejecutar el modelo de ecuación diferencial con estas dos condiciones de
entrada hipotetizadas junto con los parámetros estimados para cada persona. Seleccionamos estos
dos niveles para ilustrar las inferencias del modelo; el nivel alto corresponde a las exposiciones
ocupacionales y el nivel bajo a las exposiciones ambientales del PERC. Podemos y consideramos
otros escenarios de exposición también. La Figura muestra la correlación entre las estimaciones de
dosis altas y bajas de la fracción metabolizada en las seis personas. Existen grandes variaciones
entre individuos; por ejemplo, se ve un factor de dos diferencias entre los sujetos A y E.
Figura 19.8: Inferencias posteriores para las cantidades de interés (la fracción metabolizada en
exposiciones altas y bajas) para cada uno de los seis sujetos en el experimento PERC. La dispersión
dentro de cada gráfico representa la incertidumbre posterior sobre el metabolismo de cada persona.
La variación entre estas seis personas representa una variación en la población estudiada de varones
blancos adultos jóvenes.
Simulaciones similares se realizaron para una persona adicional de la población (es decir, una
persona intercambiable con los sujetos en el estudio) mediante la simulación de vectores aleatorios
de los parámetros fisiológicos de sus distribuciones de población. La varianza en la distribución
poblacional resultante de la fracción del PERC metabolizado incluye incertidumbre posterior en las
estimaciones de los parámetros y la variación real interindividual en la población. Las estimaciones
de intervalo para la fracción metabolizada se pueden obtener como percentiles de las distribuciones
simuladas. En exposición alta (50 ppm), el intervalo del 95 % para la fracción metabolizada en la
población es [0.5 %, 4.1 %]; a baja exposición (0,001 ppm) es [15 %, 58 %].
Al interpretar estos resultados, uno debe recordar que se basan en un solo experimento. Este estudio
parece ser uno de los mejores disponibles; sin embargo, solo incluyó a seis personas de una población
homogénea, medidas en solo dos condiciones de exposición. Gran parte de la incertidumbre asociada
con los resultados se debe a estas limitaciones experimentales. La incertidumbre posterior sobre los
parámetros para las personas en el estudio podrı́a reducirse al recopilar y analizar datos adicionales
sobre estos individuos. Para aprender más sobre la población necesitarı́amos individuos adicionales.
La variabilidad de la población, que en este estudio es aproximadamente tan grande como la
incertidumbre posterior, podrı́a aumentar si se incluyera un grupo más heterogéneo de sujetos.
Además de su papel en la inferencia dado el modelo, las simulaciones posteriores se pueden usar
de varias maneras para verificar el ajuste del modelo.
Más directamente, podemos examinar los errores de medición y modelado comparando los datos
observados, yjkmt , con sus esperanzas, gm (θk , Ej , t), para todas las mediciones, basadas en las
simulaciones posteriores de ϑ. La Figura 19.9 muestra un diagrama de dispersión de los errores
de predicción relativos de todos nuestros datos observados (es decir, datos observados divididos
por sus predicciones del modelo) frente a las predicciones del modelo. (Dado que el análisis fue
bayesiano, tenemos muchas muestras de simulación del vector de parámetros, cada una de los
cuales produce datos predichos ligeramente diferentes. La Figura 19.9, por simplicidad, muestra
los pronósticos de solo una de estas muestras de simulación, seleccionados al azar). La magnitud
de estos errores es razonablemente bajo en comparación con otros ajustes de este tipo de datos.
Figura 19.9: Las concentraciones de PERC observadas (para todos los individuos en el estudio)
divididas por las concentraciones esperadas, representadas frente a las concentraciones esperadas.
Los ejes x e y están en diferentes escalas (logarı́tmicas): las observaciones varı́an en un factor de
10,000, pero los errores relativos están principalmente entre 0.8 y 1.25. Debido a que las concen-
traciones esperadas se calculan en base a un sorteo aleatorio de los parámetros de su distribución
posterior, la Figura muestra el desajuste real estimado por el modelo, sin la necesidad de ajustar
para el ajuste.
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 17
También podemos verificar el modelo comparando sus predicciones con datos adicionales que no
se usaron en el ajuste original. Utilizamos los resultados de un segundo experimento de inhalación
en voluntarios humanos, en el que 6 personas estuvieron expuestas a niveles constantes de PERC
que oscilaron entre 0.5 y 9 ppm (muy por debajo de las concentraciones en nuestro estudio) y
se midió la concentración en aire exhalado y sangre durante la exposición hasta 50 minutos (un
perı́odo de tiempo mucho más corto que en nuestro estudio). Como se trata de individuos nuevos,
creamos simulaciones posteriores de la proporción de concentración de sangre/aire exhalado (esta
es la cantidad estudiada por los investigadores en el segundo experimento) mediante el uso de
extracciones posteriores de la distribución de la población p(θ|µ, σ) como los parámetros en el
modelo no lineal. La Figura 19.10 presenta los datos observados y la predicción del modelo (con
95 % y 99 % de lı́mites de simulación). El ajuste del modelo es bueno en general, aunque los niveles
de exposición fueron de 5 a 100 veces más bajos que los utilizados en nuestros datos. Sin embargo,
la cinética a corto plazo (menos de 15 minutos después del inicio de la exposición) no está bien
descrita por el modelo, que incluye solo una descripción simple de los intercambios pulmonares.
Figura 19.10: Los datos de validación externa y los intervalos predictivos del 95 % del modelo se
ajustan a los datos PERC. Las predicciones del modelo se ajustan a los datos razonablemente bien,
pero no en los primeros 15 minutos de exposición, un problema que atribuimos al hecho de que
el modelo asume que todos los compartimentos están en equilibrio instantáneo, mientras que en
realidad esto toma aproximadamente 15 minutos para mantenerse aproximadamente.
Nuestro análisis tiene cinco caracterı́sticas clave, todas las cuales funcionan en combinación: (1)
un modelo fisiológico, (2) un modelo de población, (3) información previa sobre los parámetros
fisiológicos de la población, (4) datos experimentales y (5) inferencia bayesiana. Si falta alguna
de estas cinco caracterı́sticas, el modelo no funcionará: (1) sin un modelo fisiológico, no hay una
buena manera de obtener información previa sobre los parámetros, (2) sin un modelo de población,
generalmente no hay suficientes datos para estimar el modelo de forma independiente en cada in-
dividuo, (3 y 4) los parámetros de un modelo fisiológico de múltiples compartimentos no se pueden
determinar con precisión solo con datos o información previa, y (5) la inferencia bayesiana produce
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 18
una distribución de parámetros coherente con la información a priori y datos, si tal acuerdo es
posible. Debido a que incluye automáticamente tanto la incertidumbre inferencial como la varia-
bilidad de la población, el enfoque bayesiano jerárquico produce una distribución posterior que se
puede usar directamente para un análisis de incertidumbre del proceso de evaluación de riesgos.
McCullagh y Nelder (1989, p. 11) analizan un ejemplo temprano de un ensayo de dilución en serie,
de Fisher (1922). Los ensayos de la forma descrita en la Sección 19.1 son discutidos por Racine-
Poon, Weihs y Smith(1991) y Higgins et al. (1998). El análisis descrito en la Sección 19.1 aparece
en Gelman, Chew y Shnaidman (2004).
El ejemplo de toxicologı́a se describe en Gelman, Bois y Jiang (1996). Los modelos farmacocinéticos
jerárquicos tienen una larga historia; ver, por ejemplo, Sheiner, Rosenberg y Melmon (1972), Shei-
ner y Beal (1982), Wakefield (1996), y la discusión de Wakefield, Aarons y Racine-Poon (1999).
Otras aplicaciones biomédicas en las que se ha utilizado el análisis bayesiano para modelos no
lineales incluyen la resonancia magnética (Genovese, 2001).
Los modelos no lineales con un gran número de parámetros son un puente a los métodos estadı́sti-
cos no paramétricos clásicos y a los métodos como las redes neuronales que son populares en la
informática. Neal (1996a) y Denison et al. (2002) discuten estos desde una perspectiva bayesiana.
Chipman, George y McCulloch (1998, 2002) ofrecen una presentación bayesiana de modelos de
árboles de regresión no lineales. Las discusiones bayesianas de los modelos spline, que pueden verse
como generalizaciones no paramétricas de los modelos de regresión lineal, incluyen Wahba (1978),
DiMatteo et al. (2001), y Denison et al. (2002) entre otros. Zhao (2000) da una discusión teórica
de los modelos no paramétricos bayesianos.
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 19
Cuadro 19.1: Número de ensayos y éxitos de putts de golf, por distancia del hoyo, para una muestra
de golfistas profesionales. De Berry (1996).
19.4. Ejercicios
1. Modelado no lineal: el archivo dilution.dat contiene datos del experimento de ensayo de
dilución descrito en la Sección 19.1.
2. Modelado no lineal: el Cuadro 19.1 1 presenta datos sobre la tasa de éxito de los putts por
parte de golfistas profesionales (ver Berry, 1996, y Gelman y Nolan, 2002c).
1
Reimpreso con permiso de Brooks/Cole, una división de Thomson Learning
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 20
(a) Ajuste el modelo utilizando una distribución a priori uniforme para los logaritmos de
los cuatro parámetros.
(b) Hacer simulaciones con diferentes valores de n. ¿Qué tan grande debe ser n hasta que
las inferencias bayesianas coincidan con los parámetros verdaderos con una precisión
razonable?