Está en la página 1de 20

Capı́tulo 19

Modelos paramétricos no lineales

El enfoque de regresión lineal de la Parte IV sugiere una presentación de modelos estadı́sticos


en forma de menú, con un conjunto de posibles distribuciones para la variable de respuesta, un
conjunto de transformaciones para facilitar el uso de esas distribuciones y la capacidad de incluir
información en forma de predictores lineales. En un modelo lineal generalizado, el valor esperado
de y es una función no lineal del predictor lineal: E(y|X, β) = g −1 (Xβ). Los modelos robustos
(Capı́tulo 17) y de mezcla (Capı́tulo 22) los generalizan agregando un parámetro de mezcla latente
(no observado) para cada punto de datos.

El modelado lineal generalizado es flexible y poderoso, con coeficientes β que son relativamente
fáciles de interpretar, especialmente cuando se comparan entre sı́ (ya que todos actúan sobre el
mismo predictor lineal). Sin embargo, no todos los fenómenos se comportan linealmente, incluso
bajo transformación. Este capı́tulo considera el caso más general en el que los parámetros y los
predictores no se combinan linealmente. Ejemplos simples incluyen una razón tal como E(y) =
a1 + b 1 x 1
o una suma de funciones no lineales tales como E(y) = A1 e−α1 x + A2 e−α2 x , ver Ejercicio
a2 + b 2 x 2
19.3.

Los principios generales de inferencia y computación pueden aplicarse directamente a modelos


no lineales. Consideramos brevemente los tres pasos del análisis de datos bayesiano: construcción
de modelos, cálculo y verificación de modelos. Los enfoques más flexibles para el modelado no
lineal tı́picamente involucran relaciones complicadas entre los predictores y los resultados, pero
generalmente sin la necesidad de distribuciones de probabilidad inusuales. La computación puede
presentar desafı́os, porque no podemos simplemente adaptar los cálculos de regresión lineal, como
se hizo en el Capı́tulo 16 para modelos lineales generalizados. El control del modelo a veces se
puede realizar utilizando gráficos residuales, pruebas χ2 y otros resúmenes existentes, pero a veces
es necesario crear nuevos gráficos en el contexto de un modelo en particular.

Además, surgen nuevas dificultades en la interpretación de parámetros que no pueden entenderse


simplemente en términos de un predictor lineal. Un paso clave en cualquier inferencia para un
modelo no lineal es mostrar gráficamente la relación no lineal ajustada.

1
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 2

Debido a que los modelos no lineales vienen en muchos sabores, no hay un menú sistemático
de opciones para presentar. En general, cada nuevo problema de modelado debe abordarse de
nuevo. Presentamos dos ejemplos de nuestra propia investigación aplicada para dar una idea de
las posibilidades.

19.1. Ejemplo: ensayo de dilución en serie

Un diseño común para estimar las concentraciones de compuestos en muestras biológicas es el


ensayo de dilución en serie, en el que las mediciones se toman en varias diluciones diferentes de
una muestra. El motivo de las diluciones en serie de cada muestra es que la concentración en un
ensayo se cuantifica mediante una lectura óptica automatizada de un cambio de color, y hay un
rango limitado de concentraciones para las cuales el cambio de color es informativo: a valores bajos,
el cambio de color es imperceptible, y en valores altos, el color se satura. Ası́, varias diluciones dan
varias oportunidades para una medición precisa.

Más precisamente, las diluciones brindan varias medidas de diferente precisión, y un enfoque baye-
siano o de probabilidad deberı́a permitirnos combinar la información en estas medidas de manera
adecuada. Un ensayo se presenta en una placa con varios pocillos, cada uno de los cuales contiene
una muestra o una dilución especı́fica de una muestra. Hay dos tipos de muestras: las desconocidas,
que son las muestras que deben medirse y sus diluciones, y las estándares, que son diluciones de
un compuesto conocido, que se utilizan para calibrar las mediciones. La Figura 19.1 muestra una
placa tı́pica con 96 pocillos; las dos primeras columnas de la placa contienen las estándares y sus
diluciones y las diez columnas restantes son para cantidades desconocidas. Los valores de dilución
para las muestras desconocidas están más espaciados que los estándares para cubrir un rango más
amplio de concentraciones con un número dado de ensayos.

Figura 19.1: Configuración tı́pica de una placa con 96 pocillos para un ensayo de dilución en serie.
Las primeras dos columnas son diluciones “estándares” con concentraciones conocidas, y las otras
diez columnas son “desconocidas” diferentes. El objetivo del ensayo es estimar las concentraciones
de las desconocidas, utilizando las estándares como calibración.

Datos de laboratorio

La Figura 19.2 muestra datos de una sola placa en un estudio de alérgenos de cucarachas en los
hogares de pacientes con asma. Cada gráfico muestra las mediciones ópticas y frente a las diluciones
para un solo compuesto junto con una curva estimada que describe la relación entre la dilución y la
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 3

medición. La estimación de las curvas que relacionan las diluciones con las mediciones se describe
a continuación.

Figura 19.2: Datos de una sola placa de un ensayo de dilución en serie. El gráfico grande muestra los
datos de calibración, y los diez gráficos pequeños muestran datos de los compuestos desconocidos.
El objetivo del análisis es descubrir cómo escalar los ejes x de los desconocidos para que se alineen
con la curva estimada a partir de los estándares. (Las curvas mostradas en estos gráficos se estiman
a partir del modelo como se describe en la Sección 19.1).

Figura 19.3: Ejemplo de mediciones y de una placa según lo analizado por un software estándar uti-
lizado para ensayos de dilución. Los datos estándar se utilizan para estimar la curva de calibración,
que luego se usa para estimar las concentraciones desconocidas. Las concentraciones indicadas por
asteriscos están etiquetadas como “por debajo del lı́mite de detección”. Sin embargo, la informa-
ción está presente en estas observaciones bajas, como puede verse al observar el patrón decreciente
1 1
de las mediciones de las diluciones 1 a a en cada muestra .
3 9

La Figura 19.3 ilustra las dificultades con un enfoque actualmente estándar para estimar concentra-
ciones desconocidas. La parte izquierda de la figura muestra los datos estándar (correspondientes
al primer gráfico de la Figura 19.2): las dos muestras iniciales tienen concentraciones conocidas
de 0.64, cada una seguida por varias diluciones y una medición de cero. Las mediciones de color
óptico comienzan por encima de 100 para las muestras con una concentración de 0.64 y disminuyen
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 4

a alrededor de 14 para las muestras de concentración cero (todos compuestos inertes). La parte
derecha de la Figura 19.3 muestra, para dos de las diez incógnitas de la placa, las medidas de color
y y las estimaciones de concentración correspondientes de un método estándar.

Todas las estimaciones para el desconocido 8 se muestran con asteriscos, lo que indica que se
registraron como “por debajo del lı́mite de detección” y el programa informático estándar para
analizar estos datos no proporciona ninguna estimación. Un vistazo casual a los datos (vea la gráfica
de Desconocido 8 en la Figura 19.2) podrı́a sugerir que estos datos son en realidad todos de ruido,
pero un análisis cuidadoso de los números revela que las mediciones disminuyen constantemente
1 1
de las concentraciones de 1 a , con solo las diluciones finales aparentemente perdidas en el
3 9
1 1
ruido (en que las medidas en no son más bajas que en ). Una señal clara está presente para
27 9
las primeras seis mediciones de esta muestra desconocida.

El desconocido 9 muestra un mejor resultado, en el que cuatro de las ocho mediciones están por
encima del lı́mite de detección. Las cuatro mediciones más diluidas producen lecturas que están
por debajo del lı́mite de detección. Una vez más, sin embargo, la información parece estar presente
en las mediciones más bajas, que disminuyen de manera consistente con la dilución.

Como se puede ver en la Figura 19.2, los desconocidos 8 y 9 no son casos extremos, sino que son
algo tı́picos de los datos de esta placa. En las mediciones de alérgenos, incluso las concentraciones
bajas pueden ser importantes, y debemos ser capaces de distinguir entre concentraciones cero y
valores que son simplemente bajos. La inferencia bayesiana que se describe aquı́ hace que esta
distinción sea mucho más precisa que el método anterior mediante el cual se analizaron dichos
datos.

El modelo

Notación. Los parámetros de interés en un estudio como el de las Figuras 19.1 – 19.2 son las
concentraciones de las muestras desconocidas; los etiquetamos como θ1 , ..., θ1 0 para la disposición
de la placa que se muestra en la Figura 19.1. La concentración conocida del estándar se denota por
θ0 . Etiquetamos la concentración en el pozo i como xi y utilizamos yi para indicar la medida de
intensidad de color correspondiente, con i = 1, ..., 96 para nuestro plato. Cada xi es una dilución
especı́fica de una de las muestras. Configuramos el modelo para las observaciones de intensidad de
color y en etapas: un modelo paramétrico para la intensidad de color esperada para una concen-
tración dada, errores de medición para las lecturas ópticas, errores introducidos durante el proceso
de preparación de la dilución y, finalmente, distribuciones previas para todos Los parametros.

Curva de medidas esperadas dada la concentración. Seguimos la práctica habitual en este


campo y ajustamos el siguiente modelo no lineal de cuatro parámetros para la lectura óptica
esperada dada la concentración x:

β2
E(y|x, β) = g(x, β) = β1 + (19.1)
1 + (x/β3 )−β4
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 5

donde β1 es la intensidad del color en concentración cero, β2 es el aumento hasta la saturación, β3


es la concentración a la que gira el gradiente de la curva y β4 es la velocidad a la que se produce
la saturación. Todos los parámetros están restringidos a valores no negativos. Este modelo es
equivalente a una función logı́stica escalada y desplazada de log(x). El modelo se ajusta bastante
bien a los datos, como se puede ver en la Figura 19.1 en la página 472.

Error de medición. Los errores de medición se modelan como distribuidos normalmente con
varianzas desiguales:

 2α !
g(xi , β)
yi  N g(xi , β), σy2 (19.2)
A

donde el parámetro α, que se limita a estar entre 0 y 1, modela el patrón de que las varianzas son
más altas para mediciones más grandes (por ejemplo, consulte la Figura 19.2). La constante A en
(19.2) es arbitraria; lo establecimos en el valor 30, que está en el centro del rango de los datos. Se
incluye en el modelo para que el parámetro σy tenga una interpretación más directa como el error
de la desviación estándar para una medición “tı́pica”.

El modelo (19.2) se reduce a un modelo normal de igual varianza si α = 0 y corresponde aproxima-


damente al modelo de igual varianza en la escala logarı́tmica si α = 1. La corrección de la relación
de varianza es importante aquı́ porque muchos de nuestros datos están en bajas concentraciones,
y no queremos que nuestro modelo utilice estas medidas, pero no exagerar su precisión.

Errores de dilución. El proceso introduce errores en dos lugares: la dilución inicial, en la cual
una cantidad medida del estándar se mezcla con una cantidad medida de un lı́quido inerte; y
diluciones en serie, en las que una muestra se diluye por un factor fijo como 2 o 3. Para los datos
de alérgenos de cucarachas, los errores de dilución en serie fueron bajos, por lo que solo incluimos
el error de dilución inicial en nuestro modelo.

Usamos un modelo normal en la escala de registro (natural) para el error de dilución inicial asociado
con la preparación de la muestra estándar. La concentración conocida de la solución estándar es θ0 ,
y dinit
0 es la dilución inicial (conocida) del estándar requerido. Sin error de dilución, la concentración
de la dilución inicial serı́a por lo tanto dinit0 θ0 . Sea x la concentración real (desconocida) de la
dilución inicial, con

log(xinit init
0 ) ∼ N (log(d0 · θ0 ), (σ init )2 ) (19.3)

Para los desconocidos, no hay dilución inicial, por lo que la concentración inicial desconocida
para la muestra j es xinit
j = θj para j = 1, ..., 10. Para las diluciones adicionales de estándares y
desconocidos, simplemente establecemos

xi = di · xinit
j(i) , (19.4)
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 6

donde j(i) es la muestra (0, 1, 2, ..., o 10) correspondiente a la observación i, y di es la dilución de


la observación i en relación con la dilución inicial. (Los di ’s son los números que se muestran en la
Figura 19.1). La relación (19.4) refleja la suposición de que los errores de dilución en serie son lo
suficientemente bajos como para ignorarlos.

Distribuciones a prioris. Asignamos distribuciones a priori uniformes no informativas a los


parámetros de la curva de calibración: log(βk ) ∼ U (−∞, ∞) para k = 1, ..., 4; σy ∼ U (0, ∞);
σ ∼ U (0, 1). Un diseño como el que se muestra en la Figura 19.1 con una gran cantidad de datos
estándar nos permite estimar todos estos parámetros con bastante precisión. También asignamos
distribuciones a priori no informativas para las concentraciones desconocidas: p(logθj ) ∝ 1 pa-
ra cada desconocido j = 1, ..., 10. Otra opción serı́a ajustar un modelo jerárquico de la forma,
logθj ∼ N (µθ , σθ2 ) (o, mejor aún, un modelo de mezcla que incluye la posibilidad de que algunas
concentraciones verdaderas θj sean cero), pero para simplificar utilizamos un modelo sin agrupación
(correspondiente a σθ = ∞) en este análisis.

Hay un parámetro en el modelo - σ init , la escala del error de dilución inicial - que no se puede
estimar a partir de una sola placa. Para nuestro análisis, lo fijamos en el valor 0.02 (es decir, un
error de dilución inicial con una desviación estándar del 2 %), que se obtuvo a partir de un análisis
previo de datos de placas con varias diluciones iniciales diferentes del estándar.

Inferencia. Ajustamos el modelo utilizando el paquete Bugs (un antecesor del software Stan
descrito en el Apéndice C). Obtuvimos una convergencia aproximada (los posibles factores de
reducción de escala Rb estaban por debajo de 1.1 para todos los parámetros) después de 50, 000
iteraciones de dos cadenas paralelas de la muestra de Gibbs. Para ahorrar memoria y tiempo
de cálculo al procesar las simulaciones, guardamos cada 20 iteración de cada cadena. Al ajustar
el modelo, es útil usar puntos de inicio razonables (que se pueden obtener usando estimaciones
crudas de los datos) y parametrizar en términos de los logaritmos de los parámetros βj y las
concentraciones desconocidas θj . Para acelerar la convergencia, trabajamos con los parámetros
logβ, α, σy y logγ, donde log(γj ) = log(θj /β3 ). El uso de γj en lugar de θj soluciona el problema
de la fuerte correlación posterior entre las concentraciones desconocidas y el parámetro β3 , que
indexa la posición x de la curva de calibración (consulte (19.1)).

Las estimaciones de la mediana posterior (y los intervalos posteriores del 50 %) para los parámetros
de la curva de calibración son βb1 = 14.7[14.5, 14.9], βb2 = 99.7[96.8, 102.9], βb3 = 0.054[0.051, 0.058]
y βb4 = 1.34[1.30, 1.38]. La estimación de la mediana posterior de β define una curva g(x, β) que se
muestra en el gráfico superior izquierdo de la Figura 19.1. Como se esperaba, la curva pasa por los
datos utilizados para estimarla. Los parámetros de varianza σy y α se estiman en 2.2 y 0.97 (con
intervalos del 50 % de [2.1, 2.3] y [0.94, 0.99], respectivamente). La alta precisión de las mediciones
(como se puede ver en las repeticiones en la Figura 19.2) permitió que los parámetros se estimaran
con precisión a partir de un conjunto de datos relativamente pequeño.

La Figura 19.4 muestra las inferencias para las concentraciones de las 10 muestras desconocidas.
Utilizamos estas estimaciones, junto con la curva de calibración estimada, para graficar curvas
escaladas para cada una de las 10 desconocidas que se muestran en la Figura 19.2. Finalmente, la
Figura 19.5 muestra los residuos, que parecen generalmente razonables.
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 7

Figura 19.4: Medianas posteriores, intervalos de 50 % e intervalos de 95 % para las concentraciones


de las 10 desconocidas para los datos mostrados en la Figura 19.2. Se obtienen estimaciones para
todas las muestras, incluso para el desconocido 8, todos cuyos datos estaban “por debajo del lı́mite
de detección” (consulte la Figura 19.3).

Figura 19.5: Residuos estandarizados (yi − E(yi |xi ))/sd(yi |xi )) vs. valores esperados E(yi |xi ), para
el modelo se ajusta los estándares y datos desconocidos de una sola placa. Los cı́rculos y cru-
ces indican medidas de estándares y de desconocidos, respectivamente. No aparecen problemas
importantes con el ajuste del modelo.

Comparación con estimaciones existentes.

El método que es la práctica estándar en el campo implica primero estimar la curva de calibración
y luego transformar cada medición de las muestras desconocidas directamente a una concentración
estimada, invirtiendo la curva de calibración ajustada. Para cada muestra desconocida, las con-
centraciones estimadas se dividen por sus diluciones y se promedian para obtener una estimación
única. (Por ejemplo, utilizando este enfoque, la concentración estimada para el desconocido 9 a
partir de los datos mostrados en la Figura 19.3 es 1/4(0.040 + 0.031 + 3 · 0.005 + 3 · 0.005) = 0.025).

Las estimaciones del análisis bayesiano son generalmente similares a las del método estándar pero
con mayor precisión. Una ventaja del enfoque bayesiano es que produce una estimación de concen-
tración para todas las desconocidas, incluso el desconocido 8 para el cual no existe una estimación
estándar porque todas sus mediciones están “por debajo del lı́mite de detección”. También crea-
mos estimaciones de concentración para cada incógnita en función de cada una las dos mitades de
los datos (en la configuración de la Figura 19.1, utilizando solo los cuatro pozos superiores o los
cuatro pozos inferiores para cada desconocido). Para los enfoques estándar y bayesiano, las dos
estimaciones son similares, pero la confiabilidad (es decir, el acuerdo entre las dos estimaciones) es
mucho más fuerte para la estimación bayesiana. No nos gustarı́a hacer una afirmación demasiado
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 8

fuerte basada en datos de una sola placa. Realizamos un estudio más exhaustivo (no se muestra
aquı́) para comparar los métodos antiguos y nuevos en un rango de condiciones experimentales.

19.2. Ejemplo: población toxicocinética.

En esta sección, analizamos un modelo no lineal mucho más complicado utilizado en la toxico-
cinética (el estudio del flujo y el metabolismo de las toxinas en el cuerpo) con el objetivo final de
evaluar el riesgo en la población general asociada con un contaminante del aire en particular. Este
modelo es jerárquico y multivariado, con un vector de parámetros que se estimarán en cada uno
de varios sujetos experimentales. Las distribuciones anteriores para este modelo son informativas
y jerárquicas, con componentes de varianza separados correspondientes a la incertidumbre sobre
el nivel promedio en la población y la variación alrededor de ese promedio.

Antecedentes

El percloroetileno (PERC) es uno de los muchos productos industriales que causan cáncer en los
animales y se cree que también lo hace en los seres humanos. Se respira PERC, y el entendimiento
general es que se metaboliza en el hı́gado y que sus metabolitos son cancerı́genos. Por lo tanto,
una “dosis” relevante para estudiar al calibrar los efectos del PERC es la cantidad metabolizada
en el hı́gado. No todo el PERC que una persona respira será metabolizado. Nos centramos aquı́ en
estimar la fracción metabolizada en función de la concentración del compuesto en el aire respirado, y
cómo esta función varı́a en toda la población. Para dar una idea de nuestros objetivos inferenciales,
nos adelantamos para mostrar algunos resultados de nuestro análisis. La Figura 19.6 muestra la
fracción estimada de PERC inhalado que se metaboliza en función de la concentración en el aire,
para 10 extracciones seleccionadas al azar de la población estimada de hombres adultos jóvenes
blancos (el grupo sobre el cual tenı́amos datos). La forma de la curva se describe a continuación
después de que se describe el modelo estadı́stico.

Figura 19.6: Fracción estimada del PERC metabolizado, en función de la concentración en estado
estacionario en el aire inhalado, para 10 individuos hipotéticos seleccionados al azar de la población
estimada de varones blancos adultos jóvenes.
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 9

No es posible estimar curvas de este tipo con una confianza razonable usando procedimientos
simples como la medición directa de concentraciones de metabolitos (difı́cil incluso en exposiciones
altas y no es factible en exposiciones bajas) o extrapolación de resultados de animales. En su lugar,
se utiliza un modelo matemático del flujo de la toxina a través del torrente sanguı́neo y los órganos
del cuerpo, y de su metabolismo en el hı́gado para estimar la fracción del PERC metabolizado.

En la Figura 19.7 se muestra una muestra de los datos experimentales que utilizamos para ajustar
el modelo del flujo de toxinas. Cada uno de los seis voluntarios estuvo expuesto a PERC a un nivel
alto durante cuatro horas (se creı́a que el tiempo suficiente para que las concentraciones de PERC
en la mayorı́a de sus órganos corporales alcanzaran el equilibrio) y luego las concentraciones de
PERC en aire exhalado y en sangre se midieron durante un perı́odo de una semana (168 horas).
Además, los datos de cada persona se repitieron en un segundo nivel de exposición (datos no
mostrados).

Figura 19.7: Concentración de PERC (en miligramos por litro) en aire exhalado y en sangre, con el
tiempo, para una de dos repeticiones en cada uno de los seis sujetos experimentales. Las medidas
se muestran en escalas logarı́tmicas.

Modelo toxicocinético.

Nuestro análisis se basa en un modelo fisiológico estándar, según el cual la toxina entra y sale a
través de la respiración, se distribuye por flujo sanguı́neo a cuatro “compartimentos”, tejidos bien
perfundidos, tejidos mal perfundidos, grasa e hı́gado, y se metaboliza en el hı́gado. Este modelo
tiene una larga historia en el modelado de toxicologı́a y se ha demostrado que reproduce la mayorı́a
de las caracterı́sticas de dichos datos. Un modelo más simple de uno o dos compartimentos podrı́a
ser más fácil de estimar, pero tales modelos no se ajustan bien a nuestros datos y, lo que es más
importante, no tienen la complejidad para ajustarse con precisión a las diferentes condiciones de
exposición.

Describimos brevemente la naturaleza del modelo toxicocinético, omitiendo detalles que no son
necesarios para comprender nuestro análisis. Dada una concentración conocida del compuesto en
el aire, la concentración del compuesto en cada compartimento a lo largo del tiempo se rige por
una ecuación diferencial de primer orden, con parámetros para el volumen, el flujo sanguı́neo y el
coeficiente de reparto (concentración de equilibrio en relación con la sangre) de cada compartimen-
to. El compartimiento del hı́gado donde se produce el metabolismo tiene una ecuación ligeramente
diferente a los otros compartimentos y se rige por los parámetros mencionados anteriormente y
un par de parámetros adicionales. Las cuatro ecuaciones diferenciales dan lugar a un total de 15
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 10

parámetros para cada individuo. Utilizamos la notación θk = (θk1 , ..., θkL ) para el vector de L = 15
parámetros asociados con la persona k.

Dados los valores de los parámetros fisiológicos y las condiciones de exposición iniciales, las ecua-
ciones diferenciales se pueden resolver utilizando algoritmos numéricos especializados para obtener
las concentraciones del compuesto en cada compartimento y la tasa de metabolismo en función del
tiempo. Podemos combinar las predicciones sobre la concentración de PERC en el aire exhalado y
la sangre en función de la solución numérica de las ecuaciones diferenciales con nuestras mediciones
de concentración observadas para estimar los parámetros del modelo para cada individuo.

Dificultades en la estimación y el papel de la a priori informativa.

Una dificultad caracterı́stica de la estimación de modelos en toxicologı́a y farmacologı́a es que


predicen patrones de concentración en el tiempo que están cerca de mezclas de funciones expo-
nenciales decrecientes, con las amplitudes y tiempos de decaimiento de los diferentes componentes
correspondientes a las funciones de los parámetros del modelo. Es bien sabido que la estimación
de los tiempos de caı́da de una mezcla de exponenciales es un problema mal condicionado (ver
Ejercicio 19.3); es decir, los parámetros en tal modelo son difı́ciles de estimar simultáneamente.

Resolver el problema de estimar el metabolismo a partir de datos indirectos se facilita utilizando


un modelo farmacocinético fisiológico; es decir, uno en el que los parámetros individuales y de
población tienen interpretaciones fı́sicas directas (por ejemplo, el flujo de sangre a través del
tejido graso o los coeficientes de partición tejido/sangre). Estos modelos permiten la identificación
de muchos de sus valores de parámetros a través de datos fisiológicos anteriores (por ejemplo,
publicados). Dado que los parámetros de estos modelos son esencialmente imposibles de estimar a
partir de los datos solos, es crucial que tengan un significado fı́sico y puedan asignarse distribuciones
a priori informativas.

Modelo de medición.

Primero describimos cómo se usa el modelo toxicológico como un componente del modelo no
lineal para las mediciones de concentración de sangre y aire. A continuación, se presenta una
descripción del modelo de población que nos permite inferir la distribución de las caracterı́sticas
de la población relacionadas con el metabolismo del PERC. Los datos son una serie de mediciones
de aire exhalado y se toman concentraciones de sangre en cada una de las seis personas en el estudio.
Etiquetamos estos datos como yjkmt , con r repeticiones de indexación (j = 1, 2 para los dos niveles
de exposición en nuestros datos), k individuos indexados, m mediciones de indexación (m = 1 para
la concentración en sangre y m = 2 para la concentración en el aire), y t tiempo de indexación.
Los valores esperados de las concentraciones de aire y sangre exhaladas son funciones no lineales
gm (θk , Ej , t) de los parámetros individuales θk del individuo, el nivel de exposición Ej y el tiempo
t. Las funciones gm (·) son nuestra notación abreviada para la solución del sistema de ecuaciones
diferenciales que relacionan los parámetros fisiológicos con la concentración esperada. Dadas las
condiciones de entrada para la replicación j (es decir, Ej ) y los parámetros θk (ası́ como una
cantidad de cantidades adicionales medidas en cada individuo pero suprimidas en nuestra notación
aquı́), uno puede evaluar numéricamente las ecuaciones diferenciales farmacocinéticas a lo largo del
tiempo y calcular g1 y g2 para todos los valores a los que se han realizado mediciones, obteniendo
ası́ los valores esperados de todas las mediciones. Las concentraciones realmente observadas en el
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 11

aire y la sangre caducados también se ven afectadas por los errores de medición, que, como de
costumbre, se supone que son independientes y lognormalmente distribuidos, con una media de
cero y una desviación estándar de σm (en la escala de registro) para m = 1, 2. Estas distribuciones
de errores de medición también dan cuenta implı́citamente de errores en el modelo. Permitimos
que los dos componentes de σ difieran, porque las mediciones en sangre y aire exhalado tienen
diferentes protocolos experimentales y, por lo tanto, es probable que tengan precisiones diferentes.
No tenemos ninguna razón particular para creer que los errores de medición o modelado para
las mediciones de aire y sangre se correlacionarán, por lo que asignamos distribuciones a prioris
uniformes independientes a logσ1 y logσ2 . (Después de ajustar el modelo, examinamos los residuos
y no encontramos ninguna evidencia de correlaciones altas).

Modelo poblacional para parámetros.

Uno de los objetivos de este proyecto es estimar la distribución de los parámetros farmacocinéticos
individuales y de los valores predichos, como la fracción metabolizada (que son funciones complejas
de los parámetros individuales), en la población general. En un experimento con K individuos,
establecimos un modelo jerárquico en los K vectores de parámetros para permitirnos extraer in-
ferencias sobre la población general de la que se extraen los individuos. Una distribución sesgada
y lognormal se observa generalmente para los parámetros biológicos. La mayorı́a, si no todos, de
los parámetros biológicos también tienen lı́mites fisiológicos. Sobre la base de esta información,
los parámetros farmacocinéticos individuales después de la transformación logarı́tmica y el esca-
lamiento apropiado (ver a continuación), se modelan con distribuciones normales que tienen una
media poblacional truncada a ±3 desviaciones estándar de la media, donde k ı́ndexa individuos
y l = 1, ..., L indexa los parámetros farmacocinéticos en el modelo. Las distribuciones se truncan
para restringir los parámetros del modelo a valores cientı́ficamente razonables. Además, los trunca-
mientos desempeñan un papel útil cuando monitoreamos las simulaciones de los parámetros desde
su distribución posterior: si las simulaciones de un parámetro están pegadas cerca de los puntos
de truncamiento, esto indica que los datos y el modelo farmacocinético contradigan la distribución
anterior, y alguna parte del modelo debe ser reexaminada.

El vector de parámetros para k individual es θk = (θk1 , ..., θkL ) con L = 15. Algunos de los
parámetros están limitados por definición: en el modelo en discusión, los parámetros θk2 , θk3 , θk4 ,
θk5 representan las fracciones del flujo de sangre a cada compartimento, y por lo tanto se limitan a
sumar a 1. También, los parámetros θk6 , θk7 , θk8 corresponden a los coeficientes de escalamiento de
los volúmenes de órganos, y se limitan a sumar a 0.873 (la fracción estándar de la masa corporal
magra sin incluir los huesos), para cada individuo. De estos tres parametros, θk8 , el volumen del
hı́gado es mucho más pequeño que los otros y existe una considerable información previa sobre
esta cantidad. Para los propósitos de modelado y cálculo, transformamos el modelo en términos
de un nuevo conjunto de parámetros ψkl definidos de la siguiente manera:

eψkl
θkl = ψ , para l = 2, 3, 4, 5
e k2 + eψk3 + eψk4 + eψk5
eψkl (19.5)
= (0.873 − eψk8 ) ψ , para l = 6, 7
e k6 + eψk7
= eψkl , para l = 1 8 − 15.
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 12

Los parámetros ψk2 , ..., ψk5 y ψk6 , ..., ψk7 no están identificados (por ejemplo, agregando cualquier
constante a ψk2 , ..., ψk5 no altera los valores de los parámetros fisiológicos, θk2 , ..., θk5 ), pero se
les asignan distribuciones a priori adecuadas, por lo que podemos manipular formalmente sus
distribuciones posteriores.

Se supone que cada conjunto de parámetros ψkl sigue una distribución normal con una media µl y
una desviación estándar τl , truncada en tres desviaciones estándar. El modelado en la escala de ψ
respeta las restricciones en θ al tiempo que conserva las distribuciones lognormales truncadas para
los componentes no restringidos. Todos los cálculos se realizan con las ψ’s, que luego se transforman
de nuevo a θ’s para interpretar los resultados en las escalas naturales.

En el modelo, las distribuciones de población para los parámetros fisiológicos L = 15 se suponen


independientes. Después de ajustar el modelo, verificamos las correlaciones 15 · 14/2 entre los pares
de parámetros entre las seis personas y no encontramos evidencia de que difirieran de cero. Si
encontramos grandes correlaciones, nos gustarı́a agregar correlaciones al modelo (como se describe
en la Sección 15.4) o reparameterizar para hacer las correlaciones más pequeñas. De hecho, los
parámetros de nuestro modelo ya se transformaron para reducir las correlaciones (por ejemplo, al
trabajar con flujos de sangre y volúmenes de órganos proporcionales en lugar de absolutos, como
se describe en la parte superior de esta página.

Información a priori.

Para ajustar el modelo de población, asignamos distribuciones a priori a las medias y varianzas, µl
y τl2 , de los parámetros fisiológicos L (transformados). Especificamos una distribución a priori para
cada µl (normal con los parámetros Ml y Sl2 según el conocimiento sustantivo) y τl2 (χ2 -inversa,
centrada en una estimación τ0l2 de la verdadera varianza poblacional y con un número bajo de
grados de libertad νl , tı́picamente establecer en 2 para indicar grandes incertidumbres).

Los hiperparámetros Ml , Sl y τ0 l se basan en estimaciones disponibles en la literatura biológica.


Las fuentes incluyen estudios en humanos y escalas alométricas a partir de mediciones en animales.
Establecemos distribuciones s prioris independientes para los µl ’s y τl ’s porque nuestra información
a priori sobre los parámetros es esencialmente independiente, a nuestro entender, dada la parame-
trización y la escala utilizada (por ejemplo, los flujos de sangre como una proporción del total en
lugar de en valores escalados absolutos). Al establecer incertidumbres, tratamos de ser débilmente
informativos y establecer las varianzas a priori más altas que bajas cuando existe ambigüedad en
la literatura biológica.

El modelo tiene 15 parámetros para cada una de las seis personas en un experimento toxicocinético;
θjk es el valor del parámetro kth para la persona j, con j = 1, ..., 6 y k = 1, ..., 15. Información
a priori sobre los parámetros estaba disponible en la literatura biológica. Para cada parámetro,
era importante distinguir entre dos fuentes de variación: incertidumbre a priori sobre el valor
del parámetro y la variación de la población. Esto fue representado por un modelo lognormal
para cada parámetro, logθjk ∼ N (µk , τk2 ), y asignando distribuciones a prioris independientes
a la media geométrica de la población y la desviación estándar, µk y τk : µk ∼ N (Mk , Sk2 ) y
τk2 ∼ χ2 − Inv(ν, τk02
). La distribución a priori en µk , especialmente a través de la desviación
estándar Sk , describe nuestra incertidumbre acerca de los valores tı́picos del parámetro en la
población. La distribución a priori en τk nos informa sobre la variación de la población para el
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 13

parámetro. Debido a que el conocimiento previo sobre la variación de la población era impreciso,
los grados de libertad en las distribuciones a prioris para τk2 se establecieron en el valor bajo de
ν = 2.

Algunos parámetros se entienden mejor que otros. Por ejemplo, se estimó que el peso del hı́gado,
cuando se expresaba como una fracción del peso corporal magro, tenı́a una media geométrica
poblacional de 0.033, con la incertidumbre sobre el promedio de la población y la heterogeneidad
en la población estimada en el orden del 10 % al 20 %. Los parámetros anteriores se establecieron en
Mk = log(0.033), Sk = log(1.1) y τk0 = log(1.1). En contraste, el coeficiente de Michaelis-Menten
(un parámetro particular en el modelo farmacocinético) fue poco conocido: su media geométrica
poblacional se estimó en 0.7, pero con una posible incertidumbre de hasta un factor de 100 por
encima o por debajo. Sin embargo, a pesar de la gran incertidumbre en la magnitud de este
parámetro, se creı́a que no variaba más de un factor de 4 en relación con la media de la población,
entre los individuos de la población. Los parámetros anteriores se establecieron en Mk = log(0.7),
Sk = log(10) y τk0 = log(2). El modelo jerárquico proporciona un marco esencial para expresar las
dos fuentes de variación (o incertidumbre) y combinarlas en el análisis.

Distribución posterior conjunta para el modelo jerárquico.

Para la inferencia bayesiana, obtenemos la distribución posterior (hasta una constante multiplica-
tiva) para todos los parámetros de interés, dados los datos y la información a priori, al multiplicar
todos los factores en el modelo jerárquico: la distribución de datos, p(y|ψ, E, t, σ), el modelo po-
blacional, p(ψ|µ, τ ) y la distribución a priori p(µ, τ |M, S, τ0 ),

p(ψ, µ, τ 2 , σ 2 |y, E, t, φ, M, S, τ02 , ν) ∝ p(y|ψ, φ, E, t, σ 2 )p(ψ|µ, τ 2 )p(µ, τ 2 |M, S, τ02 )p(σ 2 )


J YK Y 2 Y
!
Y
∝ N (logykmt |loggm (θk , Ej , t)σm ) σ1−2 σ2−2 ×
2

j=1 k=1 m=1 t


K Y
L
! L
!
Y Y
Ntrunc (ψkl |µl , τl2 ) N (µl |Ml , Sl2 )χ2 − Inv(τl2 |νl , τ0l2 )
k=1 l=1 l=1
(19.6)

donde ψ es el conjunto de vectores de parámetros de nivel individual, µ y τ son los vectores de


medias poblacionales y desviaciones estándar, σ es el par de varianzas de medición, y es el vector
de mediciones de concentración, E y t son las concentraciones de exposición y tiempos, y M , S, τ
y ν son los hiperparámetros. Usamos la notación Ntrunc para la distribución normal truncada en
el número especificado de desviaciones estándar de la media. Los ı́ndices j, k, l, m y t se refieren a
la replicación, persona, parámetro, tipo de medición (sangre o aire) y tiempo de medición. Para
calcular (19.6) en función de los parámetros, datos y condiciones experimentales, las funciones
gm se deben calcular numéricamente en el intervalo de tiempo correspondiente a las mediciones
experimentales.

Cálculo.

Nuestros objetivos son primero ajustar un modelo farmacocinético a los datos experimentales, y
luego usar el modelo para realizar inferencias sobre cantidades de interés, como la distribución
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 14

de la población de la fracción del compuesto metabolizado a una dosis determinada. Alcanza-


mos estos objetivos utilizando sorteos aleatorios de los parámetros de la distribución posterior
p(ψ, µ, τ, σ|y, E, t, M, S, τ0 , ν). Utilizamos un enfoque de muestreo de Gibbs, que actualiza itera-
tivamente los parámetros en la siguiente secuencia: σ, τ, µ, ψ1 , ..., ψK . Cada uno de estos es en
realidad un parámetro vectorial. Las distribuciones condicionales para los componentes de σ 2 y τ 2
y µ son χ2 -inversa, χ2 -inversa y normal.

Las distribuciones condicionales para los parámetros ψ no tienen forma cerrada, por lo que mues-
treamos de ellas usando los pasos del algoritmo Metropolis, que solo requiere la capacidad de
calcular la densidad posterior hasta una constante multiplicativa, como en (19.6).

Nuestra implementación del algoritmo Metropolis altera los parámetros una persona a la vez (por
lo tanto, K salta en cada iteración, y cada salto afecta a un vector ψk de dimensión L). Los vectores
de parámetros se modifican utilizando una distribución de propuesta normal centrada en el valor
actual, con una matriz de covarianza proporcional a la obtenida a partir de algunas ejecuciones
iniciales y escaladas de modo que la tasa de aceptación sea de aproximadamente 0.23. Actualizar
los parámetros de una persona a la vez significa que los únicos factores de la densidad posterior
que deben calcularse para el paso de Metrópolis son los correspondientes a esa persona. Esta es
una preocupación importante, porque la evaluación de las funciones gm para obtener los valores
esperados de las mediciones es la parte más costosa del cálculo. Un enfoque alternativo serı́a alterar
un solo componente ψkl a la vez; esto requerirı́a saltos de KL en cada iteración.

Realizamos cinco ejecuciones de simulación independientes, cada una de 50,000 iteraciones, con
puntos de inicio obtenidos al muestrear cada ψkl al azar de su distribución a priori y luego es-
tableciendo los promedios de la población en sus medias a prioris, Ml . Luego comenzamos las
simulaciones muestreando σ y τ . Debido a las limitaciones de almacenamiento, guardamos solo
cada décima iteración del vector de parámetros. Monitoreamos la convergencia de las simulacio-
nes al comparar las variaciones dentro y entre simulaciones, como se describe en la Sección 11.4.
En la práctica, el modelo se implementó y depuró gradualmente durante un perı́odo de meses,
y una razón para nuestra confianza en los resultados es su consistencia general con simulaciones
anteriores de diferentes variantes del modelo.

Inferencia para cantidades de interés.

En primer lugar, examinamos las inferencias acerca de los parámetros del modelo y su variabilidad
poblacional, y verificamos que tenı́an sentido y eran consistentes con la distribución a priori.
Después de esto, las principales cantidades de interés fueron la fracción de PERC metabolizado en
diferentes escenarios de exposición, según se calculó mediante la evaluación numérica del modelo de
ecuación diferencial bajo las condiciones de entrada apropiadas. Para cada k individual, podemos
calcular la fracción metabolizada para cada vector de parámetro simulado ψk ; el uso del conjunto de
simulaciones produce una distribución de la fracción metabolizada para ese individuo. La varianza
en la distribución para cada individuo se debe a la incertidumbre en la distribución posterior de
los parámetros fisiológicos, ψk .

La Figura 19.8 muestra las distribuciones posteriores de la fracción de PERC metabolizada, para
cada persona en el experimento, a un nivel de exposición alto de 50 partes por millón (ppm) y
un nivel bajo de 0.001 ppm. Las seis personas no estaban realmente expuestas a estos niveles; las
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 15

inferencias se obtuvieron al ejecutar el modelo de ecuación diferencial con estas dos condiciones de
entrada hipotetizadas junto con los parámetros estimados para cada persona. Seleccionamos estos
dos niveles para ilustrar las inferencias del modelo; el nivel alto corresponde a las exposiciones
ocupacionales y el nivel bajo a las exposiciones ambientales del PERC. Podemos y consideramos
otros escenarios de exposición también. La Figura muestra la correlación entre las estimaciones de
dosis altas y bajas de la fracción metabolizada en las seis personas. Existen grandes variaciones
entre individuos; por ejemplo, se ve un factor de dos diferencias entre los sujetos A y E.

Figura 19.8: Inferencias posteriores para las cantidades de interés (la fracción metabolizada en
exposiciones altas y bajas) para cada uno de los seis sujetos en el experimento PERC. La dispersión
dentro de cada gráfico representa la incertidumbre posterior sobre el metabolismo de cada persona.
La variación entre estas seis personas representa una variación en la población estudiada de varones
blancos adultos jóvenes.

Simulaciones similares se realizaron para una persona adicional de la población (es decir, una
persona intercambiable con los sujetos en el estudio) mediante la simulación de vectores aleatorios
de los parámetros fisiológicos de sus distribuciones de población. La varianza en la distribución
poblacional resultante de la fracción del PERC metabolizado incluye incertidumbre posterior en las
estimaciones de los parámetros y la variación real interindividual en la población. Las estimaciones
de intervalo para la fracción metabolizada se pueden obtener como percentiles de las distribuciones
simuladas. En exposición alta (50 ppm), el intervalo del 95 % para la fracción metabolizada en la
población es [0.5 %, 4.1 %]; a baja exposición (0,001 ppm) es [15 %, 58 %].

También estudiamos la fracción de PERC metabolizado en un dı́a (después de tres semanas de


exposición por inhalación) en función del nivel de exposición. Esta es la relación que mostramos
al presentar el ejemplo PERC; se muestra en la Figura 19.6. A bajas exposiciones, la fracción
metabolizada permanece constante, ya que el metabolismo es lineal. La saturación comienza por
encima de 1 ppm y está casi completa a 10 ppm. A niveles más altos, la fracción metabolizada
disminuye linealmente con la exposición, ya que la cantidad metabolizada por unidad de tiempo
es máxima.
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 16

Al interpretar estos resultados, uno debe recordar que se basan en un solo experimento. Este estudio
parece ser uno de los mejores disponibles; sin embargo, solo incluyó a seis personas de una población
homogénea, medidas en solo dos condiciones de exposición. Gran parte de la incertidumbre asociada
con los resultados se debe a estas limitaciones experimentales. La incertidumbre posterior sobre los
parámetros para las personas en el estudio podrı́a reducirse al recopilar y analizar datos adicionales
sobre estos individuos. Para aprender más sobre la población necesitarı́amos individuos adicionales.
La variabilidad de la población, que en este estudio es aproximadamente tan grande como la
incertidumbre posterior, podrı́a aumentar si se incluyera un grupo más heterogéneo de sujetos.

Evaluando el ajuste del modelo.

Además de su papel en la inferencia dado el modelo, las simulaciones posteriores se pueden usar
de varias maneras para verificar el ajuste del modelo.

Más directamente, podemos examinar los errores de medición y modelado comparando los datos
observados, yjkmt , con sus esperanzas, gm (θk , Ej , t), para todas las mediciones, basadas en las
simulaciones posteriores de ϑ. La Figura 19.9 muestra un diagrama de dispersión de los errores
de predicción relativos de todos nuestros datos observados (es decir, datos observados divididos
por sus predicciones del modelo) frente a las predicciones del modelo. (Dado que el análisis fue
bayesiano, tenemos muchas muestras de simulación del vector de parámetros, cada una de los
cuales produce datos predichos ligeramente diferentes. La Figura 19.9, por simplicidad, muestra
los pronósticos de solo una de estas muestras de simulación, seleccionados al azar). La magnitud
de estos errores es razonablemente bajo en comparación con otros ajustes de este tipo de datos.

Figura 19.9: Las concentraciones de PERC observadas (para todos los individuos en el estudio)
divididas por las concentraciones esperadas, representadas frente a las concentraciones esperadas.
Los ejes x e y están en diferentes escalas (logarı́tmicas): las observaciones varı́an en un factor de
10,000, pero los errores relativos están principalmente entre 0.8 y 1.25. Debido a que las concen-
traciones esperadas se calculan en base a un sorteo aleatorio de los parámetros de su distribución
posterior, la Figura muestra el desajuste real estimado por el modelo, sin la necesidad de ajustar
para el ajuste.
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 17

También podemos verificar el modelo comparando sus predicciones con datos adicionales que no
se usaron en el ajuste original. Utilizamos los resultados de un segundo experimento de inhalación
en voluntarios humanos, en el que 6 personas estuvieron expuestas a niveles constantes de PERC
que oscilaron entre 0.5 y 9 ppm (muy por debajo de las concentraciones en nuestro estudio) y
se midió la concentración en aire exhalado y sangre durante la exposición hasta 50 minutos (un
perı́odo de tiempo mucho más corto que en nuestro estudio). Como se trata de individuos nuevos,
creamos simulaciones posteriores de la proporción de concentración de sangre/aire exhalado (esta
es la cantidad estudiada por los investigadores en el segundo experimento) mediante el uso de
extracciones posteriores de la distribución de la población p(θ|µ, σ) como los parámetros en el
modelo no lineal. La Figura 19.10 presenta los datos observados y la predicción del modelo (con
95 % y 99 % de lı́mites de simulación). El ajuste del modelo es bueno en general, aunque los niveles
de exposición fueron de 5 a 100 veces más bajos que los utilizados en nuestros datos. Sin embargo,
la cinética a corto plazo (menos de 15 minutos después del inicio de la exposición) no está bien
descrita por el modelo, que incluye solo una descripción simple de los intercambios pulmonares.

Figura 19.10: Los datos de validación externa y los intervalos predictivos del 95 % del modelo se
ajustan a los datos PERC. Las predicciones del modelo se ajustan a los datos razonablemente bien,
pero no en los primeros 15 minutos de exposición, un problema que atribuimos al hecho de que
el modelo asume que todos los compartimentos están en equilibrio instantáneo, mientras que en
realidad esto toma aproximadamente 15 minutos para mantenerse aproximadamente.

Uso de un modelo complejo con una distribución a priori informativa.

Nuestro análisis tiene cinco caracterı́sticas clave, todas las cuales funcionan en combinación: (1)
un modelo fisiológico, (2) un modelo de población, (3) información previa sobre los parámetros
fisiológicos de la población, (4) datos experimentales y (5) inferencia bayesiana. Si falta alguna
de estas cinco caracterı́sticas, el modelo no funcionará: (1) sin un modelo fisiológico, no hay una
buena manera de obtener información previa sobre los parámetros, (2) sin un modelo de población,
generalmente no hay suficientes datos para estimar el modelo de forma independiente en cada in-
dividuo, (3 y 4) los parámetros de un modelo fisiológico de múltiples compartimentos no se pueden
determinar con precisión solo con datos o información previa, y (5) la inferencia bayesiana produce
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 18

una distribución de parámetros coherente con la información a priori y datos, si tal acuerdo es
posible. Debido a que incluye automáticamente tanto la incertidumbre inferencial como la varia-
bilidad de la población, el enfoque bayesiano jerárquico produce una distribución posterior que se
puede usar directamente para un análisis de incertidumbre del proceso de evaluación de riesgos.

19.3. Nota bibliografica

Carroll, Ruppert y Stefanski (1995) es un tratamiento reciente de modelos estadı́sticos no lineales.


Giltinan y Davidian (1995) discuten modelos jerárquicos no lineales. Reilly y Zeringue (2004)
muestran cómo un simple modelo bayesiano no lineal presa-depredador puede superar a los modelos
clásicos de series de tiempo para un ejemplo de abundancia animal.

McCullagh y Nelder (1989, p. 11) analizan un ejemplo temprano de un ensayo de dilución en serie,
de Fisher (1922). Los ensayos de la forma descrita en la Sección 19.1 son discutidos por Racine-
Poon, Weihs y Smith(1991) y Higgins et al. (1998). El análisis descrito en la Sección 19.1 aparece
en Gelman, Chew y Shnaidman (2004).

El ejemplo de toxicologı́a se describe en Gelman, Bois y Jiang (1996). Los modelos farmacocinéticos
jerárquicos tienen una larga historia; ver, por ejemplo, Sheiner, Rosenberg y Melmon (1972), Shei-
ner y Beal (1982), Wakefield (1996), y la discusión de Wakefield, Aarons y Racine-Poon (1999).
Otras aplicaciones biomédicas en las que se ha utilizado el análisis bayesiano para modelos no
lineales incluyen la resonancia magnética (Genovese, 2001).

Los modelos no lineales con un gran número de parámetros son un puente a los métodos estadı́sti-
cos no paramétricos clásicos y a los métodos como las redes neuronales que son populares en la
informática. Neal (1996a) y Denison et al. (2002) discuten estos desde una perspectiva bayesiana.
Chipman, George y McCulloch (1998, 2002) ofrecen una presentación bayesiana de modelos de
árboles de regresión no lineales. Las discusiones bayesianas de los modelos spline, que pueden verse
como generalizaciones no paramétricas de los modelos de regresión lineal, incluyen Wahba (1978),
DiMatteo et al. (2001), y Denison et al. (2002) entre otros. Zhao (2000) da una discusión teórica
de los modelos no paramétricos bayesianos.
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 19

Distancia Número de Número de


(pies) ensayos éxitos
2 1443 1346
3 694 577
4 455 337
5 353 208
6 272 149
7 256 136
8 240 111
9 217 69
10 200 67
11 237 75
12 202 52
13 192 46
14 174 54
15 167 28
16 201 27
17 195 31
18 191 33
19 147 20
20 152 24

Cuadro 19.1: Número de ensayos y éxitos de putts de golf, por distancia del hoyo, para una muestra
de golfistas profesionales. De Berry (1996).

19.4. Ejercicios
1. Modelado no lineal: el archivo dilution.dat contiene datos del experimento de ensayo de
dilución descrito en la Sección 19.1.

(a) Use Stan para ajustar el modelo descrito en la Sección 19.1.


(b) Ajuste el mismo modelo, pero con una distribución jerárquica previa de la mezcla en
las θj ’s que incluye la posibilidad de que algunas concentraciones verdaderas θj sean
cero. Discuta su modelo, sus parámetros y su distribución hiper a priori para estos
parámetros.
(c) Compare las inferencias para los θj ’s de los dos modelos anteriores.
(d) Construya un conjunto de datos (con las mismas diluciones y el mismo número de
incógnitas y medidas), para lo cual estos dos modelos producen inferencias muy dife-
rentes.

2. Modelado no lineal: el Cuadro 19.1 1 presenta datos sobre la tasa de éxito de los putts por
parte de golfistas profesionales (ver Berry, 1996, y Gelman y Nolan, 2002c).
1
Reimpreso con permiso de Brooks/Cole, una división de Thomson Learning
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 20

(a) Ajuste un modelo no lineal para la probabilidad de éxito (utilizando la probabilidad


binomial) en función de la distancia. ¿Tiene sentido su modelo ajustado en el rango de
los datos y sobre las extrapolaciones potenciales?
(b) Utilice controles predictivos posteriores para evaluar el ajuste del modelo.

3. Sistemas mal plantados: Genere n observaciones independientes yi a partir del siguiente


2
modelo: yi ∼ N (Ae−α1 xi + Be−α2 xi ,σ ), donde los predictores x1 , ..., xn se distribuyen unifor-
memente en [0, 10], y ha elegido algunos valores verdaderos particulares para los parámetros.

(a) Ajuste el modelo utilizando una distribución a priori uniforme para los logaritmos de
los cuatro parámetros.
(b) Hacer simulaciones con diferentes valores de n. ¿Qué tan grande debe ser n hasta que
las inferencias bayesianas coincidan con los parámetros verdaderos con una precisión
razonable?

También podría gustarte