Cap 19

Capı́tulo 19
Modelos paramétricos no lineales
El enfoque de regresión lineal de la Parte IV sugiere una presentación de modelos estadı́sticos

en forma de menú, con un conjunto de posibles distribuciones para la variable de respuesta, un
conjunto de transformaciones para facilitar el uso de esas distribuciones y la capacidad de incluir
información en forma de predictores lineales. En un modelo lineal generalizado, el valor esperado
de y es una función no lineal del predictor lineal: E(y|X, β) = g −1 (Xβ). Los modelos robustos
(Capı́tulo 17) y de mezcla (Capı́tulo 22) los generalizan agregando un parámetro de mezcla latente
(no observado) para cada punto de datos.
El modelado lineal generalizado es flexible y poderoso, con coeficientes β que son relativamente
fáciles de interpretar, especialmente cuando se comparan entre sı́ (ya que todos actúan sobre el
mismo predictor lineal). Sin embargo, no todos los fenómenos se comportan linealmente, incluso
bajo transformación. Este capı́tulo considera el caso más general en el que los parámetros y los
predictores no se combinan linealmente. Ejemplos simples incluyen una razón tal como E(y) =
a1 + b 1 x 1
o una suma de funciones no lineales tales como E(y) = A1 e−α1 x + A2 e−α2 x , ver Ejercicio
a2 + b 2 x 2
19.3.
Los principios generales de inferencia y computación pueden aplicarse directamente a modelos

no lineales. Consideramos brevemente los tres pasos del análisis de datos bayesiano: construcción
de modelos, cálculo y verificación de modelos. Los enfoques más flexibles para el modelado no
lineal tı́picamente involucran relaciones complicadas entre los predictores y los resultados, pero
generalmente sin la necesidad de distribuciones de probabilidad inusuales. La computación puede
presentar desafı́os, porque no podemos simplemente adaptar los cálculos de regresión lineal, como
se hizo en el Capı́tulo 16 para modelos lineales generalizados. El control del modelo a veces se
puede realizar utilizando gráficos residuales, pruebas χ2 y otros resúmenes existentes, pero a veces
es necesario crear nuevos gráficos en el contexto de un modelo en particular.
Además, surgen nuevas dificultades en la interpretación de parámetros que no pueden entenderse

simplemente en términos de un predictor lineal. Un paso clave en cualquier inferencia para un
modelo no lineal es mostrar gráficamente la relación no lineal ajustada.
1
CAPÍTULO 19. MODELOS PARAMÉTRICOS NO LINEALES 2
Debido a que los modelos no lineales vienen en muchos sabores, no hay un menú sistemático
de opciones para presentar. En general, cada nuevo problema de modelado debe abordarse de
nuevo. Presentamos dos ejemplos de nuestra propia investigación aplicada para dar una idea de
las posibilidades.
19.1. Ejemplo: ensayo de dilución en serie
Un diseño común para estimar las concentraciones de compuestos en muestras biológicas es el

ensayo de dilución en serie, en el que las mediciones se toman en varias diluciones diferentes de
una muestra. El motivo de las diluciones en serie de cada muestra es que la concentración en un
ensayo se cuantifica mediante una lectura óptica automatizada de un cambio de color, y hay un
rango limitado de concentraciones para las cuales el cambio de color es informativo: a valores bajos,
el cambio de color es imperceptible, y en valores altos, el color se satura. Ası́, varias diluciones dan
varias oportunidades para una medición precisa.
Más precisamente, las diluciones brindan varias medidas de diferente precisión, y un enfoque baye-
siano o de probabilidad deberı́a permitirnos combinar la información en estas medidas de manera
adecuada. Un ensayo se presenta en una placa con varios pocillos, cada uno de los cuales contiene
una muestra o una dilución especı́fica de una muestra. Hay dos tipos de muestras: las desconocidas,
que son las muestras que deben medirse y sus diluciones, y las estándares, que son diluciones de
un compuesto conocido, que se utilizan para calibrar las mediciones. La Figura 19.1 muestra una
placa tı́pica con 96 pocillos; las dos primeras columnas de la placa contienen las estándares y sus
diluciones y las diez columnas restantes son para cantidades desconocidas. Los valores de dilución
para las muestras desconocidas están más espaciados que los estándares para cubrir un rango más
amplio de concentraciones con un número dado de ensayos.
Figura 19.1: Configuración tı́pica de una placa con 96 pocillos para un ensayo de dilución en serie.
Las primeras dos columnas son diluciones “estándares” con concentraciones conocidas, y las otras
diez columnas son “desconocidas” diferentes. El objetivo del ensayo es estimar las concentraciones
de las desconocidas, utilizando las estándares como calibración.
Datos de laboratorio
La Figura 19.2 muestra datos de una sola placa en un estudio de alérgenos de cucarachas en los
hogares de pacientes con asma. Cada gráfico muestra las mediciones ópticas y frente a las diluciones
para un solo compuesto junto con una curva estimada que describe la relación entre la dilución y la
medición. La estimación de las curvas que relacionan las diluciones con las mediciones se describe
a continuación.
Figura 19.2: Datos de una sola placa de un ensayo de dilución en serie. El gráfico grande muestra los
datos de calibración, y los diez gráficos pequeños muestran datos de los compuestos desconocidos.
El objetivo del análisis es descubrir cómo escalar los ejes x de los desconocidos para que se alineen
con la curva estimada a partir de los estándares. (Las curvas mostradas en estos gráficos se estiman
a partir del modelo como se describe en la Sección 19.1).
Figura 19.3: Ejemplo de mediciones y de una placa según lo analizado por un software estándar uti-
lizado para ensayos de dilución. Los datos estándar se utilizan para estimar la curva de calibración,
que luego se usa para estimar las concentraciones desconocidas. Las concentraciones indicadas por
asteriscos están etiquetadas como “por debajo del lı́mite de detección”. Sin embargo, la informa-
ción está presente en estas observaciones bajas, como puede verse al observar el patrón decreciente
1 1
de las mediciones de las diluciones 1 a a en cada muestra .
3 9
La Figura 19.3 ilustra las dificultades con un enfoque actualmente estándar para estimar concentra-
ciones desconocidas. La parte izquierda de la figura muestra los datos estándar (correspondientes
al primer gráfico de la Figura 19.2): las dos muestras iniciales tienen concentraciones conocidas
de 0.64, cada una seguida por varias diluciones y una medición de cero. Las mediciones de color
óptico comienzan por encima de 100 para las muestras con una concentración de 0.64 y disminuyen
a alrededor de 14 para las muestras de concentración cero (todos compuestos inertes). La parte
derecha de la Figura 19.3 muestra, para dos de las diez incógnitas de la placa, las medidas de color
y y las estimaciones de concentración correspondientes de un método estándar.
Todas las estimaciones para el desconocido 8 se muestran con asteriscos, lo que indica que se
registraron como “por debajo del lı́mite de detección” y el programa informático estándar para
analizar estos datos no proporciona ninguna estimación. Un vistazo casual a los datos (vea la gráfica
de Desconocido 8 en la Figura 19.2) podrı́a sugerir que estos datos son en realidad todos de ruido,
pero un análisis cuidadoso de los números revela que las mediciones disminuyen constantemente
1 1
de las concentraciones de 1 a , con solo las diluciones finales aparentemente perdidas en el
3 9
1 1
ruido (en que las medidas en no son más bajas que en ). Una señal clara está presente para
27 9
las primeras seis mediciones de esta muestra desconocida.
El desconocido 9 muestra un mejor resultado, en el que cuatro de las ocho mediciones están por
encima del lı́mite de detección. Las cuatro mediciones más diluidas producen lecturas que están
por debajo del lı́mite de detección. Una vez más, sin embargo, la información parece estar presente
en las mediciones más bajas, que disminuyen de manera consistente con la dilución.
Como se puede ver en la Figura 19.2, los desconocidos 8 y 9 no son casos extremos, sino que son
algo tı́picos de los datos de esta placa. En las mediciones de alérgenos, incluso las concentraciones
bajas pueden ser importantes, y debemos ser capaces de distinguir entre concentraciones cero y
valores que son simplemente bajos. La inferencia bayesiana que se describe aquı́ hace que esta
distinción sea mucho más precisa que el método anterior mediante el cual se analizaron dichos
datos.
El modelo
Notación. Los parámetros de interés en un estudio como el de las Figuras 19.1 – 19.2 son las
concentraciones de las muestras desconocidas; los etiquetamos como θ1 , ..., θ1 0 para la disposición
de la placa que se muestra en la Figura 19.1. La concentración conocida del estándar se denota por
θ0 . Etiquetamos la concentración en el pozo i como xi y utilizamos yi para indicar la medida de
intensidad de color correspondiente, con i = 1, ..., 96 para nuestro plato. Cada xi es una dilución
especı́fica de una de las muestras. Configuramos el modelo para las observaciones de intensidad de
color y en etapas: un modelo paramétrico para la intensidad de color esperada para una concen-
tración dada, errores de medición para las lecturas ópticas, errores introducidos durante el proceso
de preparación de la dilución y, finalmente, distribuciones previas para todos Los parametros.
Curva de medidas esperadas dada la concentración. Seguimos la práctica habitual en este

campo y ajustamos el siguiente modelo no lineal de cuatro parámetros para la lectura óptica
esperada dada la concentración x:
β2
E(y|x, β) = g(x, β) = β1 + (19.1)
1 + (x/β3 )−β4
donde β1 es la intensidad del color en concentración cero, β2 es el aumento hasta la saturación, β3

es la concentración a la que gira el gradiente de la curva y β4 es la velocidad a la que se produce
la saturación. Todos los parámetros están restringidos a valores no negativos. Este modelo es
equivalente a una función logı́stica escalada y desplazada de log(x). El modelo se ajusta bastante
bien a los datos, como se puede ver en la Figura 19.1 en la página 472.
Error de medición. Los errores de medición se modelan como distribuidos normalmente con
varianzas desiguales:
2α !
g(xi , β)
yi N g(xi , β), σy2 (19.2)
A
donde el parámetro α, que se limita a estar entre 0 y 1, modela el patrón de que las varianzas son
más altas para mediciones más grandes (por ejemplo, consulte la Figura 19.2). La constante A en
(19.2) es arbitraria; lo establecimos en el valor 30, que está en el centro del rango de los datos. Se
incluye en el modelo para que el parámetro σy tenga una interpretación más directa como el error
de la desviación estándar para una medición “tı́pica”.
El modelo (19.2) se reduce a un modelo normal de igual varianza si α = 0 y corresponde aproxima-

damente al modelo de igual varianza en la escala logarı́tmica si α = 1. La corrección de la relación
de varianza es importante aquı́ porque muchos de nuestros datos están en bajas concentraciones,
y no queremos que nuestro modelo utilice estas medidas, pero no exagerar su precisión.
Errores de dilución. El proceso introduce errores en dos lugares: la dilución inicial, en la cual
una cantidad medida del estándar se mezcla con una cantidad medida de un lı́quido inerte; y
diluciones en serie, en las que una muestra se diluye por un factor fijo como 2 o 3. Para los datos
de alérgenos de cucarachas, los errores de dilución en serie fueron bajos, por lo que solo incluimos
el error de dilución inicial en nuestro modelo.
Usamos un modelo normal en la escala de registro (natural) para el error de dilución inicial asociado
con la preparación de la muestra estándar. La concentración conocida de la solución estándar es θ0 ,
y dinit
0 es la dilución inicial (conocida) del estándar requerido. Sin error de dilución, la concentración
de la dilución inicial serı́a por lo tanto dinit0 θ0 . Sea x la concentración real (desconocida) de la
dilución inicial, con
log(xinit init
0 ) ∼ N (log(d0 · θ0 ), (σ init )2 ) (19.3)
Para los desconocidos, no hay dilución inicial, por lo que la concentración inicial desconocida
para la muestra j es xinit
j = θj para j = 1, ..., 10. Para las diluciones adicionales de estándares y
desconocidos, simplemente establecemos
xi = di · xinit
j(i) , (19.4)
donde j(i) es la muestra (0, 1, 2, ..., o 10) correspondiente a la observación i, y di es la dilución de

la observación i en relación con la dilución inicial. (Los di ’s son los números que se muestran en la
Figura 19.1). La relación (19.4) refleja la suposición de que los errores de dilución en serie son lo
suficientemente bajos como para ignorarlos.
Distribuciones a prioris. Asignamos distribuciones a priori uniformes no informativas a los

parámetros de la curva de calibración: log(βk ) ∼ U (−∞, ∞) para k = 1, ..., 4; σy ∼ U (0, ∞);
σ ∼ U (0, 1). Un diseño como el que se muestra en la Figura 19.1 con una gran cantidad de datos
estándar nos permite estimar todos estos parámetros con bastante precisión. También asignamos
distribuciones a priori no informativas para las concentraciones desconocidas: p(logθj ) ∝ 1 pa-
ra cada desconocido j = 1, ..., 10. Otra opción serı́a ajustar un modelo jerárquico de la forma,
logθj ∼ N (µθ , σθ2 ) (o, mejor aún, un modelo de mezcla que incluye la posibilidad de que algunas
concentraciones verdaderas θj sean cero), pero para simplificar utilizamos un modelo sin agrupación
(correspondiente a σθ = ∞) en este análisis.
Hay un parámetro en el modelo - σ init , la escala del error de dilución inicial - que no se puede
estimar a partir de una sola placa. Para nuestro análisis, lo fijamos en el valor 0.02 (es decir, un
error de dilución inicial con una desviación estándar del 2 %), que se obtuvo a partir de un análisis
previo de datos de placas con varias diluciones iniciales diferentes del estándar.
Inferencia. Ajustamos el modelo utilizando el paquete Bugs (un antecesor del software Stan
descrito en el Apéndice C). Obtuvimos una convergencia aproximada (los posibles factores de
reducción de escala Rb estaban por debajo de 1.1 para todos los parámetros) después de 50, 000
iteraciones de dos cadenas paralelas de la muestra de Gibbs. Para ahorrar memoria y tiempo
de cálculo al procesar las simulaciones, guardamos cada 20 iteración de cada cadena. Al ajustar
el modelo, es útil usar puntos de inicio razonables (que se pueden obtener usando estimaciones
crudas de los datos) y parametrizar en términos de los logaritmos de los parámetros βj y las
concentraciones desconocidas θj . Para acelerar la convergencia, trabajamos con los parámetros
logβ, α, σy y logγ, donde log(γj ) = log(θj /β3 ). El uso de γj en lugar de θj soluciona el problema
de la fuerte correlación posterior entre las concentraciones desconocidas y el parámetro β3 , que
indexa la posición x de la curva de calibración (consulte (19.1)).
Las estimaciones de la mediana posterior (y los intervalos posteriores del 50 %) para los parámetros
de la curva de calibración son βb1 = 14.7[14.5, 14.9], βb2 = 99.7[96.8, 102.9], βb3 = 0.054[0.051, 0.058]
y βb4 = 1.34[1.30, 1.38]. La estimación de la mediana posterior de β define una curva g(x, β) que se
muestra en el gráfico superior izquierdo de la Figura 19.1. Como se esperaba, la curva pasa por los
datos utilizados para estimarla. Los parámetros de varianza σy y α se estiman en 2.2 y 0.97 (con
intervalos del 50 % de [2.1, 2.3] y [0.94, 0.99], respectivamente). La alta precisión de las mediciones
(como se puede ver en las repeticiones en la Figura 19.2) permitió que los parámetros se estimaran
con precisión a partir de un conjunto de datos relativamente pequeño.
La Figura 19.4 muestra las inferencias para las concentraciones de las 10 muestras desconocidas.
Utilizamos estas estimaciones, junto con la curva de calibración estimada, para graficar curvas
escaladas para cada una de las 10 desconocidas que se muestran en la Figura 19.2. Finalmente, la
Figura 19.5 muestra los residuos, que parecen generalmente razonables.
Figura 19.4: Medianas posteriores, intervalos de 50 % e intervalos de 95 % para las concentraciones

de las 10 desconocidas para los datos mostrados en la Figura 19.2. Se obtienen estimaciones para
todas las muestras, incluso para el desconocido 8, todos cuyos datos estaban “por debajo del lı́mite
de detección” (consulte la Figura 19.3).
Figura 19.5: Residuos estandarizados (yi − E(yi |xi ))/sd(yi |xi )) vs. valores esperados E(yi |xi ), para
el modelo se ajusta los estándares y datos desconocidos de una sola placa. Los cı́rculos y cru-
ces indican medidas de estándares y de desconocidos, respectivamente. No aparecen problemas
importantes con el ajuste del modelo.
Comparación con estimaciones existentes.
El método que es la práctica estándar en el campo implica primero estimar la curva de calibración
y luego transformar cada medición de las muestras desconocidas directamente a una concentración
estimada, invirtiendo la curva de calibración ajustada. Para cada muestra desconocida, las con-
centraciones estimadas se dividen por sus diluciones y se promedian para obtener una estimación
única. (Por ejemplo, utilizando este enfoque, la concentración estimada para el desconocido 9 a
partir de los datos mostrados en la Figura 19.3 es 1/4(0.040 + 0.031 + 3 · 0.005 + 3 · 0.005) = 0.025).
Las estimaciones del análisis bayesiano son generalmente similares a las del método estándar pero
con mayor precisión. Una ventaja del enfoque bayesiano es que produce una estimación de concen-
tración para todas las desconocidas, incluso el desconocido 8 para el cual no existe una estimación
estándar porque todas sus mediciones están “por debajo del lı́mite de detección”. También crea-
mos estimaciones de concentración para cada incógnita en función de cada una las dos mitades de
los datos (en la configuración de la Figura 19.1, utilizando solo los cuatro pozos superiores o los
cuatro pozos inferiores para cada desconocido). Para los enfoques estándar y bayesiano, las dos
estimaciones son similares, pero la confiabilidad (es decir, el acuerdo entre las dos estimaciones) es
mucho más fuerte para la estimación bayesiana. No nos gustarı́a hacer una afirmación demasiado
fuerte basada en datos de una sola placa. Realizamos un estudio más exhaustivo (no se muestra
aquı́) para comparar los métodos antiguos y nuevos en un rango de condiciones experimentales.
19.2. Ejemplo: población toxicocinética.
En esta sección, analizamos un modelo no lineal mucho más complicado utilizado en la toxico-
cinética (el estudio del flujo y el metabolismo de las toxinas en el cuerpo) con el objetivo final de
evaluar el riesgo en la población general asociada con un contaminante del aire en particular. Este
modelo es jerárquico y multivariado, con un vector de parámetros que se estimarán en cada uno
de varios sujetos experimentales. Las distribuciones anteriores para este modelo son informativas
y jerárquicas, con componentes de varianza separados correspondientes a la incertidumbre sobre
el nivel promedio en la población y la variación alrededor de ese promedio.
Antecedentes
El percloroetileno (PERC) es uno de los muchos productos industriales que causan cáncer en los
animales y se cree que también lo hace en los seres humanos. Se respira PERC, y el entendimiento
general es que se metaboliza en el hı́gado y que sus metabolitos son cancerı́genos. Por lo tanto,
una “dosis” relevante para estudiar al calibrar los efectos del PERC es la cantidad metabolizada
en el hı́gado. No todo el PERC que una persona respira será metabolizado. Nos centramos aquı́ en
estimar la fracción metabolizada en función de la concentración del compuesto en el aire respirado, y
cómo esta función varı́a en toda la población. Para dar una idea de nuestros objetivos inferenciales,
nos adelantamos para mostrar algunos resultados de nuestro análisis. La Figura 19.6 muestra la
fracción estimada de PERC inhalado que se metaboliza en función de la concentración en el aire,
para 10 extracciones seleccionadas al azar de la población estimada de hombres adultos jóvenes
blancos (el grupo sobre el cual tenı́amos datos). La forma de la curva se describe a continuación
después de que se describe el modelo estadı́stico.
Figura 19.6: Fracción estimada del PERC metabolizado, en función de la concentración en estado
estacionario en el aire inhalado, para 10 individuos hipotéticos seleccionados al azar de la población
estimada de varones blancos adultos jóvenes.
No es posible estimar curvas de este tipo con una confianza razonable usando procedimientos
simples como la medición directa de concentraciones de metabolitos (difı́cil incluso en exposiciones
altas y no es factible en exposiciones bajas) o extrapolación de resultados de animales. En su lugar,
se utiliza un modelo matemático del flujo de la toxina a través del torrente sanguı́neo y los órganos
del cuerpo, y de su metabolismo en el hı́gado para estimar la fracción del PERC metabolizado.
En la Figura 19.7 se muestra una muestra de los datos experimentales que utilizamos para ajustar
el modelo del flujo de toxinas. Cada uno de los seis voluntarios estuvo expuesto a PERC a un nivel
alto durante cuatro horas (se creı́a que el tiempo suficiente para que las concentraciones de PERC
en la mayorı́a de sus órganos corporales alcanzaran el equilibrio) y luego las concentraciones de
PERC en aire exhalado y en sangre se midieron durante un perı́odo de una semana (168 horas).
Además, los datos de cada persona se repitieron en un segundo nivel de exposición (datos no
mostrados).
Figura 19.7: Concentración de PERC (en miligramos por litro) en aire exhalado y en sangre, con el
tiempo, para una de dos repeticiones en cada uno de los seis sujetos experimentales. Las medidas
se muestran en escalas logarı́tmicas.
Modelo toxicocinético.
Nuestro análisis se basa en un modelo fisiológico estándar, según el cual la toxina entra y sale a
través de la respiración, se distribuye por flujo sanguı́neo a cuatro “compartimentos”, tejidos bien
perfundidos, tejidos mal perfundidos, grasa e hı́gado, y se metaboliza en el hı́gado. Este modelo
tiene una larga historia en el modelado de toxicologı́a y se ha demostrado que reproduce la mayorı́a
de las caracterı́sticas de dichos datos. Un modelo más simple de uno o dos compartimentos podrı́a
ser más fácil de estimar, pero tales modelos no se ajustan bien a nuestros datos y, lo que es más
importante, no tienen la complejidad para ajustarse con precisión a las diferentes condiciones de
exposición.
Describimos brevemente la naturaleza del modelo toxicocinético, omitiendo detalles que no son
necesarios para comprender nuestro análisis. Dada una concentración conocida del compuesto en
el aire, la concentración del compuesto en cada compartimento a lo largo del tiempo se rige por
una ecuación diferencial de primer orden, con parámetros para el volumen, el flujo sanguı́neo y el
coeficiente de reparto (concentración de equilibrio en relación con la sangre) de cada compartimen-
to. El compartimiento del hı́gado donde se produce el metabolismo tiene una ecuación ligeramente
diferente a los otros compartimentos y se rige por los parámetros mencionados anteriormente y
un par de parámetros adicionales. Las cuatro ecuaciones diferenciales dan lugar a un total de 15
parámetros para cada individuo. Utilizamos la notación θk = (θk1 , ..., θkL ) para el vector de L = 15
parámetros asociados con la persona k.
Dados los valores de los parámetros fisiológicos y las condiciones de exposición iniciales, las ecua-
ciones diferenciales se pueden resolver utilizando algoritmos numéricos especializados para obtener
las concentraciones del compuesto en cada compartimento y la tasa de metabolismo en función del
tiempo. Podemos combinar las predicciones sobre la concentración de PERC en el aire exhalado y
la sangre en función de la solución numérica de las ecuaciones diferenciales con nuestras mediciones
de concentración observadas para estimar los parámetros del modelo para cada individuo.
Dificultades en la estimación y el papel de la a priori informativa.
Una dificultad caracterı́stica de la estimación de modelos en toxicologı́a y farmacologı́a es que

predicen patrones de concentración en el tiempo que están cerca de mezclas de funciones expo-
nenciales decrecientes, con las amplitudes y tiempos de decaimiento de los diferentes componentes
correspondientes a las funciones de los parámetros del modelo. Es bien sabido que la estimación
de los tiempos de caı́da de una mezcla de exponenciales es un problema mal condicionado (ver
Ejercicio 19.3); es decir, los parámetros en tal modelo son difı́ciles de estimar simultáneamente.
Resolver el problema de estimar el metabolismo a partir de datos indirectos se facilita utilizando

un modelo farmacocinético fisiológico; es decir, uno en el que los parámetros individuales y de
población tienen interpretaciones fı́sicas directas (por ejemplo, el flujo de sangre a través del
tejido graso o los coeficientes de partición tejido/sangre). Estos modelos permiten la identificación
de muchos de sus valores de parámetros a través de datos fisiológicos anteriores (por ejemplo,
publicados). Dado que los parámetros de estos modelos son esencialmente imposibles de estimar a
partir de los datos solos, es crucial que tengan un significado fı́sico y puedan asignarse distribuciones
a priori informativas.
Modelo de medición.
Primero describimos cómo se usa el modelo toxicológico como un componente del modelo no
lineal para las mediciones de concentración de sangre y aire. A continuación, se presenta una
descripción del modelo de población que nos permite inferir la distribución de las caracterı́sticas
de la población relacionadas con el metabolismo del PERC. Los datos son una serie de mediciones
de aire exhalado y se toman concentraciones de sangre en cada una de las seis personas en el estudio.
Etiquetamos estos datos como yjkmt , con r repeticiones de indexación (j = 1, 2 para los dos niveles
de exposición en nuestros datos), k individuos indexados, m mediciones de indexación (m = 1 para
la concentración en sangre y m = 2 para la concentración en el aire), y t tiempo de indexación.
Los valores esperados de las concentraciones de aire y sangre exhaladas son funciones no lineales
gm (θk , Ej , t) de los parámetros individuales θk del individuo, el nivel de exposición Ej y el tiempo
t. Las funciones gm (·) son nuestra notación abreviada para la solución del sistema de ecuaciones
diferenciales que relacionan los parámetros fisiológicos con la concentración esperada. Dadas las
condiciones de entrada para la replicación j (es decir, Ej ) y los parámetros θk (ası́ como una
cantidad de cantidades adicionales medidas en cada individuo pero suprimidas en nuestra notación
aquı́), uno puede evaluar numéricamente las ecuaciones diferenciales farmacocinéticas a lo largo del
tiempo y calcular g1 y g2 para todos los valores a los que se han realizado mediciones, obteniendo
ası́ los valores esperados de todas las mediciones. Las concentraciones realmente observadas en el
aire y la sangre caducados también se ven afectadas por los errores de medición, que, como de
costumbre, se supone que son independientes y lognormalmente distribuidos, con una media de
cero y una desviación estándar de σm (en la escala de registro) para m = 1, 2. Estas distribuciones
de errores de medición también dan cuenta implı́citamente de errores en el modelo. Permitimos
que los dos componentes de σ difieran, porque las mediciones en sangre y aire exhalado tienen
diferentes protocolos experimentales y, por lo tanto, es probable que tengan precisiones diferentes.
No tenemos ninguna razón particular para creer que los errores de medición o modelado para
las mediciones de aire y sangre se correlacionarán, por lo que asignamos distribuciones a prioris
uniformes independientes a logσ1 y logσ2 . (Después de ajustar el modelo, examinamos los residuos
y no encontramos ninguna evidencia de correlaciones altas).
Modelo poblacional para parámetros.
Uno de los objetivos de este proyecto es estimar la distribución de los parámetros farmacocinéticos
individuales y de los valores predichos, como la fracción metabolizada (que son funciones complejas
de los parámetros individuales), en la población general. En un experimento con K individuos,
establecimos un modelo jerárquico en los K vectores de parámetros para permitirnos extraer in-
ferencias sobre la población general de la que se extraen los individuos. Una distribución sesgada
y lognormal se observa generalmente para los parámetros biológicos. La mayorı́a, si no todos, de
los parámetros biológicos también tienen lı́mites fisiológicos. Sobre la base de esta información,
los parámetros farmacocinéticos individuales después de la transformación logarı́tmica y el esca-
lamiento apropiado (ver a continuación), se modelan con distribuciones normales que tienen una
media poblacional truncada a ±3 desviaciones estándar de la media, donde k ı́ndexa individuos
y l = 1, ..., L indexa los parámetros farmacocinéticos en el modelo. Las distribuciones se truncan
para restringir los parámetros del modelo a valores cientı́ficamente razonables. Además, los trunca-
mientos desempeñan un papel útil cuando monitoreamos las simulaciones de los parámetros desde
su distribución posterior: si las simulaciones de un parámetro están pegadas cerca de los puntos
de truncamiento, esto indica que los datos y el modelo farmacocinético contradigan la distribución
anterior, y alguna parte del modelo debe ser reexaminada.
El vector de parámetros para k individual es θk = (θk1 , ..., θkL ) con L = 15. Algunos de los
parámetros están limitados por definición: en el modelo en discusión, los parámetros θk2 , θk3 , θk4 ,
θk5 representan las fracciones del flujo de sangre a cada compartimento, y por lo tanto se limitan a
sumar a 1. También, los parámetros θk6 , θk7 , θk8 corresponden a los coeficientes de escalamiento de
los volúmenes de órganos, y se limitan a sumar a 0.873 (la fracción estándar de la masa corporal
magra sin incluir los huesos), para cada individuo. De estos tres parametros, θk8 , el volumen del
hı́gado es mucho más pequeño que los otros y existe una considerable información previa sobre
esta cantidad. Para los propósitos de modelado y cálculo, transformamos el modelo en términos
de un nuevo conjunto de parámetros ψkl definidos de la siguiente manera:
eψkl
θkl = ψ , para l = 2, 3, 4, 5
e k2 + eψk3 + eψk4 + eψk5
eψkl (19.5)
= (0.873 − eψk8 ) ψ , para l = 6, 7
e k6 + eψk7
= eψkl , para l = 1 8 − 15.
Los parámetros ψk2 , ..., ψk5 y ψk6 , ..., ψk7 no están identificados (por ejemplo, agregando cualquier
constante a ψk2 , ..., ψk5 no altera los valores de los parámetros fisiológicos, θk2 , ..., θk5 ), pero se
les asignan distribuciones a priori adecuadas, por lo que podemos manipular formalmente sus
distribuciones posteriores.
Se supone que cada conjunto de parámetros ψkl sigue una distribución normal con una media µl y
una desviación estándar τl , truncada en tres desviaciones estándar. El modelado en la escala de ψ
respeta las restricciones en θ al tiempo que conserva las distribuciones lognormales truncadas para
los componentes no restringidos. Todos los cálculos se realizan con las ψ’s, que luego se transforman
de nuevo a θ’s para interpretar los resultados en las escalas naturales.
En el modelo, las distribuciones de población para los parámetros fisiológicos L = 15 se suponen

independientes. Después de ajustar el modelo, verificamos las correlaciones 15 · 14/2 entre los pares
de parámetros entre las seis personas y no encontramos evidencia de que difirieran de cero. Si
encontramos grandes correlaciones, nos gustarı́a agregar correlaciones al modelo (como se describe
en la Sección 15.4) o reparameterizar para hacer las correlaciones más pequeñas. De hecho, los
parámetros de nuestro modelo ya se transformaron para reducir las correlaciones (por ejemplo, al
trabajar con flujos de sangre y volúmenes de órganos proporcionales en lugar de absolutos, como
se describe en la parte superior de esta página.
Información a priori.
Para ajustar el modelo de población, asignamos distribuciones a priori a las medias y varianzas, µl
y τl2 , de los parámetros fisiológicos L (transformados). Especificamos una distribución a priori para
cada µl (normal con los parámetros Ml y Sl2 según el conocimiento sustantivo) y τl2 (χ2 -inversa,
centrada en una estimación τ0l2 de la verdadera varianza poblacional y con un número bajo de
grados de libertad νl , tı́picamente establecer en 2 para indicar grandes incertidumbres).
Los hiperparámetros Ml , Sl y τ0 l se basan en estimaciones disponibles en la literatura biológica.

Las fuentes incluyen estudios en humanos y escalas alométricas a partir de mediciones en animales.
Establecemos distribuciones s prioris independientes para los µl ’s y τl ’s porque nuestra información
a priori sobre los parámetros es esencialmente independiente, a nuestro entender, dada la parame-
trización y la escala utilizada (por ejemplo, los flujos de sangre como una proporción del total en
lugar de en valores escalados absolutos). Al establecer incertidumbres, tratamos de ser débilmente
informativos y establecer las varianzas a priori más altas que bajas cuando existe ambigüedad en
la literatura biológica.
El modelo tiene 15 parámetros para cada una de las seis personas en un experimento toxicocinético;
θjk es el valor del parámetro kth para la persona j, con j = 1, ..., 6 y k = 1, ..., 15. Información
a priori sobre los parámetros estaba disponible en la literatura biológica. Para cada parámetro,
era importante distinguir entre dos fuentes de variación: incertidumbre a priori sobre el valor
del parámetro y la variación de la población. Esto fue representado por un modelo lognormal
para cada parámetro, logθjk ∼ N (µk , τk2 ), y asignando distribuciones a prioris independientes
a la media geométrica de la población y la desviación estándar, µk y τk : µk ∼ N (Mk , Sk2 ) y
τk2 ∼ χ2 − Inv(ν, τk02
). La distribución a priori en µk , especialmente a través de la desviación
estándar Sk , describe nuestra incertidumbre acerca de los valores tı́picos del parámetro en la
población. La distribución a priori en τk nos informa sobre la variación de la población para el
parámetro. Debido a que el conocimiento previo sobre la variación de la población era impreciso,
los grados de libertad en las distribuciones a prioris para τk2 se establecieron en el valor bajo de
ν = 2.
Algunos parámetros se entienden mejor que otros. Por ejemplo, se estimó que el peso del hı́gado,
cuando se expresaba como una fracción del peso corporal magro, tenı́a una media geométrica
poblacional de 0.033, con la incertidumbre sobre el promedio de la población y la heterogeneidad
en la población estimada en el orden del 10 % al 20 %. Los parámetros anteriores se establecieron en
Mk = log(0.033), Sk = log(1.1) y τk0 = log(1.1). En contraste, el coeficiente de Michaelis-Menten
(un parámetro particular en el modelo farmacocinético) fue poco conocido: su media geométrica
poblacional se estimó en 0.7, pero con una posible incertidumbre de hasta un factor de 100 por
encima o por debajo. Sin embargo, a pesar de la gran incertidumbre en la magnitud de este
parámetro, se creı́a que no variaba más de un factor de 4 en relación con la media de la población,
entre los individuos de la población. Los parámetros anteriores se establecieron en Mk = log(0.7),
Sk = log(10) y τk0 = log(2). El modelo jerárquico proporciona un marco esencial para expresar las
dos fuentes de variación (o incertidumbre) y combinarlas en el análisis.
Distribución posterior conjunta para el modelo jerárquico.
Para la inferencia bayesiana, obtenemos la distribución posterior (hasta una constante multiplica-
tiva) para todos los parámetros de interés, dados los datos y la información a priori, al multiplicar
todos los factores en el modelo jerárquico: la distribución de datos, p(y|ψ, E, t, σ), el modelo po-
blacional, p(ψ|µ, τ ) y la distribución a priori p(µ, τ |M, S, τ0 ),
p(ψ, µ, τ 2 , σ 2 |y, E, t, φ, M, S, τ02 , ν) ∝ p(y|ψ, φ, E, t, σ 2 )p(ψ|µ, τ 2 )p(µ, τ 2 |M, S, τ02 )p(σ 2 )

J YK Y 2 Y
!
Y
∝ N (logykmt |loggm (θk , Ej , t)σm ) σ1−2 σ2−2 ×
2
j=1 k=1 m=1 t

K Y
L
! L
!
Y Y
Ntrunc (ψkl |µl , τl2 ) N (µl |Ml , Sl2 )χ2 − Inv(τl2 |νl , τ0l2 )
k=1 l=1 l=1
(19.6)
donde ψ es el conjunto de vectores de parámetros de nivel individual, µ y τ son los vectores de

medias poblacionales y desviaciones estándar, σ es el par de varianzas de medición, y es el vector
de mediciones de concentración, E y t son las concentraciones de exposición y tiempos, y M , S, τ
y ν son los hiperparámetros. Usamos la notación Ntrunc para la distribución normal truncada en
el número especificado de desviaciones estándar de la media. Los ı́ndices j, k, l, m y t se refieren a
la replicación, persona, parámetro, tipo de medición (sangre o aire) y tiempo de medición. Para
calcular (19.6) en función de los parámetros, datos y condiciones experimentales, las funciones
gm se deben calcular numéricamente en el intervalo de tiempo correspondiente a las mediciones
experimentales.
Cálculo.
Nuestros objetivos son primero ajustar un modelo farmacocinético a los datos experimentales, y
luego usar el modelo para realizar inferencias sobre cantidades de interés, como la distribución
de la población de la fracción del compuesto metabolizado a una dosis determinada. Alcanza-

mos estos objetivos utilizando sorteos aleatorios de los parámetros de la distribución posterior
p(ψ, µ, τ, σ|y, E, t, M, S, τ0 , ν). Utilizamos un enfoque de muestreo de Gibbs, que actualiza itera-
tivamente los parámetros en la siguiente secuencia: σ, τ, µ, ψ1 , ..., ψK . Cada uno de estos es en
realidad un parámetro vectorial. Las distribuciones condicionales para los componentes de σ 2 y τ 2
y µ son χ2 -inversa, χ2 -inversa y normal.
Las distribuciones condicionales para los parámetros ψ no tienen forma cerrada, por lo que mues-
treamos de ellas usando los pasos del algoritmo Metropolis, que solo requiere la capacidad de
calcular la densidad posterior hasta una constante multiplicativa, como en (19.6).
Nuestra implementación del algoritmo Metropolis altera los parámetros una persona a la vez (por
lo tanto, K salta en cada iteración, y cada salto afecta a un vector ψk de dimensión L). Los vectores
de parámetros se modifican utilizando una distribución de propuesta normal centrada en el valor
actual, con una matriz de covarianza proporcional a la obtenida a partir de algunas ejecuciones
iniciales y escaladas de modo que la tasa de aceptación sea de aproximadamente 0.23. Actualizar
los parámetros de una persona a la vez significa que los únicos factores de la densidad posterior
que deben calcularse para el paso de Metrópolis son los correspondientes a esa persona. Esta es
una preocupación importante, porque la evaluación de las funciones gm para obtener los valores
esperados de las mediciones es la parte más costosa del cálculo. Un enfoque alternativo serı́a alterar
un solo componente ψkl a la vez; esto requerirı́a saltos de KL en cada iteración.
Realizamos cinco ejecuciones de simulación independientes, cada una de 50,000 iteraciones, con
puntos de inicio obtenidos al muestrear cada ψkl al azar de su distribución a priori y luego es-
tableciendo los promedios de la población en sus medias a prioris, Ml . Luego comenzamos las
simulaciones muestreando σ y τ . Debido a las limitaciones de almacenamiento, guardamos solo
cada décima iteración del vector de parámetros. Monitoreamos la convergencia de las simulacio-
nes al comparar las variaciones dentro y entre simulaciones, como se describe en la Sección 11.4.
En la práctica, el modelo se implementó y depuró gradualmente durante un perı́odo de meses,
y una razón para nuestra confianza en los resultados es su consistencia general con simulaciones
anteriores de diferentes variantes del modelo.
Inferencia para cantidades de interés.
En primer lugar, examinamos las inferencias acerca de los parámetros del modelo y su variabilidad
poblacional, y verificamos que tenı́an sentido y eran consistentes con la distribución a priori.
Después de esto, las principales cantidades de interés fueron la fracción de PERC metabolizado en
diferentes escenarios de exposición, según se calculó mediante la evaluación numérica del modelo de
ecuación diferencial bajo las condiciones de entrada apropiadas. Para cada k individual, podemos
calcular la fracción metabolizada para cada vector de parámetro simulado ψk ; el uso del conjunto de
simulaciones produce una distribución de la fracción metabolizada para ese individuo. La varianza
en la distribución para cada individuo se debe a la incertidumbre en la distribución posterior de
los parámetros fisiológicos, ψk .
La Figura 19.8 muestra las distribuciones posteriores de la fracción de PERC metabolizada, para
cada persona en el experimento, a un nivel de exposición alto de 50 partes por millón (ppm) y
un nivel bajo de 0.001 ppm. Las seis personas no estaban realmente expuestas a estos niveles; las
inferencias se obtuvieron al ejecutar el modelo de ecuación diferencial con estas dos condiciones de
entrada hipotetizadas junto con los parámetros estimados para cada persona. Seleccionamos estos
dos niveles para ilustrar las inferencias del modelo; el nivel alto corresponde a las exposiciones
ocupacionales y el nivel bajo a las exposiciones ambientales del PERC. Podemos y consideramos
otros escenarios de exposición también. La Figura muestra la correlación entre las estimaciones de
dosis altas y bajas de la fracción metabolizada en las seis personas. Existen grandes variaciones
entre individuos; por ejemplo, se ve un factor de dos diferencias entre los sujetos A y E.
Figura 19.8: Inferencias posteriores para las cantidades de interés (la fracción metabolizada en
exposiciones altas y bajas) para cada uno de los seis sujetos en el experimento PERC. La dispersión
dentro de cada gráfico representa la incertidumbre posterior sobre el metabolismo de cada persona.
La variación entre estas seis personas representa una variación en la población estudiada de varones
blancos adultos jóvenes.
Simulaciones similares se realizaron para una persona adicional de la población (es decir, una
persona intercambiable con los sujetos en el estudio) mediante la simulación de vectores aleatorios
de los parámetros fisiológicos de sus distribuciones de población. La varianza en la distribución
poblacional resultante de la fracción del PERC metabolizado incluye incertidumbre posterior en las
estimaciones de los parámetros y la variación real interindividual en la población. Las estimaciones
de intervalo para la fracción metabolizada se pueden obtener como percentiles de las distribuciones
simuladas. En exposición alta (50 ppm), el intervalo del 95 % para la fracción metabolizada en la
población es [0.5 %, 4.1 %]; a baja exposición (0,001 ppm) es [15 %, 58 %].
También estudiamos la fracción de PERC metabolizado en un dı́a (después de tres semanas de

exposición por inhalación) en función del nivel de exposición. Esta es la relación que mostramos
al presentar el ejemplo PERC; se muestra en la Figura 19.6. A bajas exposiciones, la fracción
metabolizada permanece constante, ya que el metabolismo es lineal. La saturación comienza por
encima de 1 ppm y está casi completa a 10 ppm. A niveles más altos, la fracción metabolizada
disminuye linealmente con la exposición, ya que la cantidad metabolizada por unidad de tiempo
es máxima.
Al interpretar estos resultados, uno debe recordar que se basan en un solo experimento. Este estudio
parece ser uno de los mejores disponibles; sin embargo, solo incluyó a seis personas de una población
homogénea, medidas en solo dos condiciones de exposición. Gran parte de la incertidumbre asociada
con los resultados se debe a estas limitaciones experimentales. La incertidumbre posterior sobre los
parámetros para las personas en el estudio podrı́a reducirse al recopilar y analizar datos adicionales
sobre estos individuos. Para aprender más sobre la población necesitarı́amos individuos adicionales.
La variabilidad de la población, que en este estudio es aproximadamente tan grande como la
incertidumbre posterior, podrı́a aumentar si se incluyera un grupo más heterogéneo de sujetos.
Evaluando el ajuste del modelo.
Además de su papel en la inferencia dado el modelo, las simulaciones posteriores se pueden usar
de varias maneras para verificar el ajuste del modelo.
Más directamente, podemos examinar los errores de medición y modelado comparando los datos
observados, yjkmt , con sus esperanzas, gm (θk , Ej , t), para todas las mediciones, basadas en las
simulaciones posteriores de ϑ. La Figura 19.9 muestra un diagrama de dispersión de los errores
de predicción relativos de todos nuestros datos observados (es decir, datos observados divididos
por sus predicciones del modelo) frente a las predicciones del modelo. (Dado que el análisis fue
bayesiano, tenemos muchas muestras de simulación del vector de parámetros, cada una de los
cuales produce datos predichos ligeramente diferentes. La Figura 19.9, por simplicidad, muestra
los pronósticos de solo una de estas muestras de simulación, seleccionados al azar). La magnitud
de estos errores es razonablemente bajo en comparación con otros ajustes de este tipo de datos.
Figura 19.9: Las concentraciones de PERC observadas (para todos los individuos en el estudio)
divididas por las concentraciones esperadas, representadas frente a las concentraciones esperadas.
Los ejes x e y están en diferentes escalas (logarı́tmicas): las observaciones varı́an en un factor de
10,000, pero los errores relativos están principalmente entre 0.8 y 1.25. Debido a que las concen-
traciones esperadas se calculan en base a un sorteo aleatorio de los parámetros de su distribución
posterior, la Figura muestra el desajuste real estimado por el modelo, sin la necesidad de ajustar
para el ajuste.
También podemos verificar el modelo comparando sus predicciones con datos adicionales que no
se usaron en el ajuste original. Utilizamos los resultados de un segundo experimento de inhalación
en voluntarios humanos, en el que 6 personas estuvieron expuestas a niveles constantes de PERC
que oscilaron entre 0.5 y 9 ppm (muy por debajo de las concentraciones en nuestro estudio) y
se midió la concentración en aire exhalado y sangre durante la exposición hasta 50 minutos (un
perı́odo de tiempo mucho más corto que en nuestro estudio). Como se trata de individuos nuevos,
creamos simulaciones posteriores de la proporción de concentración de sangre/aire exhalado (esta
es la cantidad estudiada por los investigadores en el segundo experimento) mediante el uso de
extracciones posteriores de la distribución de la población p(θ|µ, σ) como los parámetros en el
modelo no lineal. La Figura 19.10 presenta los datos observados y la predicción del modelo (con
95 % y 99 % de lı́mites de simulación). El ajuste del modelo es bueno en general, aunque los niveles
de exposición fueron de 5 a 100 veces más bajos que los utilizados en nuestros datos. Sin embargo,
la cinética a corto plazo (menos de 15 minutos después del inicio de la exposición) no está bien
descrita por el modelo, que incluye solo una descripción simple de los intercambios pulmonares.
Figura 19.10: Los datos de validación externa y los intervalos predictivos del 95 % del modelo se
ajustan a los datos PERC. Las predicciones del modelo se ajustan a los datos razonablemente bien,
pero no en los primeros 15 minutos de exposición, un problema que atribuimos al hecho de que
el modelo asume que todos los compartimentos están en equilibrio instantáneo, mientras que en
realidad esto toma aproximadamente 15 minutos para mantenerse aproximadamente.
Uso de un modelo complejo con una distribución a priori informativa.
Nuestro análisis tiene cinco caracterı́sticas clave, todas las cuales funcionan en combinación: (1)
un modelo fisiológico, (2) un modelo de población, (3) información previa sobre los parámetros
fisiológicos de la población, (4) datos experimentales y (5) inferencia bayesiana. Si falta alguna
de estas cinco caracterı́sticas, el modelo no funcionará: (1) sin un modelo fisiológico, no hay una
buena manera de obtener información previa sobre los parámetros, (2) sin un modelo de población,
generalmente no hay suficientes datos para estimar el modelo de forma independiente en cada in-
dividuo, (3 y 4) los parámetros de un modelo fisiológico de múltiples compartimentos no se pueden
determinar con precisión solo con datos o información previa, y (5) la inferencia bayesiana produce
una distribución de parámetros coherente con la información a priori y datos, si tal acuerdo es
posible. Debido a que incluye automáticamente tanto la incertidumbre inferencial como la varia-
bilidad de la población, el enfoque bayesiano jerárquico produce una distribución posterior que se
puede usar directamente para un análisis de incertidumbre del proceso de evaluación de riesgos.
19.3. Nota bibliografica
Carroll, Ruppert y Stefanski (1995) es un tratamiento reciente de modelos estadı́sticos no lineales.

Giltinan y Davidian (1995) discuten modelos jerárquicos no lineales. Reilly y Zeringue (2004)
muestran cómo un simple modelo bayesiano no lineal presa-depredador puede superar a los modelos
clásicos de series de tiempo para un ejemplo de abundancia animal.
McCullagh y Nelder (1989, p. 11) analizan un ejemplo temprano de un ensayo de dilución en serie,
de Fisher (1922). Los ensayos de la forma descrita en la Sección 19.1 son discutidos por Racine-
Poon, Weihs y Smith(1991) y Higgins et al. (1998). El análisis descrito en la Sección 19.1 aparece
en Gelman, Chew y Shnaidman (2004).
El ejemplo de toxicologı́a se describe en Gelman, Bois y Jiang (1996). Los modelos farmacocinéticos
jerárquicos tienen una larga historia; ver, por ejemplo, Sheiner, Rosenberg y Melmon (1972), Shei-
ner y Beal (1982), Wakefield (1996), y la discusión de Wakefield, Aarons y Racine-Poon (1999).
Otras aplicaciones biomédicas en las que se ha utilizado el análisis bayesiano para modelos no
lineales incluyen la resonancia magnética (Genovese, 2001).
Los modelos no lineales con un gran número de parámetros son un puente a los métodos estadı́sti-
cos no paramétricos clásicos y a los métodos como las redes neuronales que son populares en la
informática. Neal (1996a) y Denison et al. (2002) discuten estos desde una perspectiva bayesiana.
Chipman, George y McCulloch (1998, 2002) ofrecen una presentación bayesiana de modelos de
árboles de regresión no lineales. Las discusiones bayesianas de los modelos spline, que pueden verse
como generalizaciones no paramétricas de los modelos de regresión lineal, incluyen Wahba (1978),
DiMatteo et al. (2001), y Denison et al. (2002) entre otros. Zhao (2000) da una discusión teórica
de los modelos no paramétricos bayesianos.
Distancia Número de Número de

(pies) ensayos éxitos
2 1443 1346
3 694 577
4 455 337
5 353 208
6 272 149
7 256 136
8 240 111
9 217 69
10 200 67
11 237 75
12 202 52
13 192 46
14 174 54
15 167 28
16 201 27
17 195 31
18 191 33
19 147 20
20 152 24
Cuadro 19.1: Número de ensayos y éxitos de putts de golf, por distancia del hoyo, para una muestra
de golfistas profesionales. De Berry (1996).
19.4. Ejercicios
1. Modelado no lineal: el archivo dilution.dat contiene datos del experimento de ensayo de
dilución descrito en la Sección 19.1.
(a) Use Stan para ajustar el modelo descrito en la Sección 19.1.

(b) Ajuste el mismo modelo, pero con una distribución jerárquica previa de la mezcla en
las θj ’s que incluye la posibilidad de que algunas concentraciones verdaderas θj sean
cero. Discuta su modelo, sus parámetros y su distribución hiper a priori para estos
parámetros.
(c) Compare las inferencias para los θj ’s de los dos modelos anteriores.
(d) Construya un conjunto de datos (con las mismas diluciones y el mismo número de
incógnitas y medidas), para lo cual estos dos modelos producen inferencias muy dife-
rentes.
2. Modelado no lineal: el Cuadro 19.1 1 presenta datos sobre la tasa de éxito de los putts por
parte de golfistas profesionales (ver Berry, 1996, y Gelman y Nolan, 2002c).
1
Reimpreso con permiso de Brooks/Cole, una división de Thomson Learning
(a) Ajuste un modelo no lineal para la probabilidad de éxito (utilizando la probabilidad

binomial) en función de la distancia. ¿Tiene sentido su modelo ajustado en el rango de
los datos y sobre las extrapolaciones potenciales?
(b) Utilice controles predictivos posteriores para evaluar el ajuste del modelo.
3. Sistemas mal plantados: Genere n observaciones independientes yi a partir del siguiente

2
modelo: yi ∼ N (Ae−α1 xi + Be−α2 xi ,σ ), donde los predictores x1 , ..., xn se distribuyen unifor-
memente en [0, 10], y ha elegido algunos valores verdaderos particulares para los parámetros.
(a) Ajuste el modelo utilizando una distribución a priori uniforme para los logaritmos de
los cuatro parámetros.
(b) Hacer simulaciones con diferentes valores de n. ¿Qué tan grande debe ser n hasta que
las inferencias bayesianas coincidan con los parámetros verdaderos con una precisión
razonable?

Cap 19

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Cap 19

Cargado por

Copyright:

Formatos disponibles

Capı́tulo 19

Modelos paramétricos no lineales

El enfoque de regresión lineal de la Parte IV sugiere una presentación de modelos estadı́sticos

Los principios generales de inferencia y computación pueden aplicarse directamente a modelos

Además, surgen nuevas dificultades en la interpretación de parámetros que no pueden entenderse

19.1. Ejemplo: ensayo de dilución en serie

Un diseño común para estimar las concentraciones de compuestos en muestras biológicas es el

Curva de medidas esperadas dada la concentración. Seguimos la práctica habitual en este

donde β1 es la intensidad del color en concentración cero, β2 es el aumento hasta la saturación, β3

El modelo (19.2) se reduce a un modelo normal de igual varianza si α = 0 y corresponde aproxima-

donde j(i) es la muestra (0, 1, 2, ..., o 10) correspondiente a la observación i, y di es la dilución de

Distribuciones a prioris. Asignamos distribuciones a priori uniformes no informativas a los

Figura 19.4: Medianas posteriores, intervalos de 50 % e intervalos de 95 % para las concentraciones

Comparación con estimaciones existentes.

19.2. Ejemplo: población toxicocinética.

Dificultades en la estimación y el papel de la a priori informativa.

Una dificultad caracterı́stica de la estimación de modelos en toxicologı́a y farmacologı́a es que

Resolver el problema de estimar el metabolismo a partir de datos indirectos se facilita utilizando

Modelo poblacional para parámetros.

En el modelo, las distribuciones de población para los parámetros fisiológicos L = 15 se suponen

Los hiperparámetros Ml , Sl y τ0 l se basan en estimaciones disponibles en la literatura biológica.

Distribución posterior conjunta para el modelo jerárquico.

p(ψ, µ, τ 2 , σ 2 |y, E, t, φ, M, S, τ02 , ν) ∝ p(y|ψ, φ, E, t, σ 2 )p(ψ|µ, τ 2 )p(µ, τ 2 |M, S, τ02 )p(σ 2 )

j=1 k=1 m=1 t

donde ψ es el conjunto de vectores de parámetros de nivel individual, µ y τ son los vectores de

de la población de la fracción del compuesto metabolizado a una dosis determinada. Alcanza-

Inferencia para cantidades de interés.

También estudiamos la fracción de PERC metabolizado en un dı́a (después de tres semanas de

Evaluando el ajuste del modelo.

Uso de un modelo complejo con una distribución a priori informativa.

19.3. Nota bibliografica

Carroll, Ruppert y Stefanski (1995) es un tratamiento reciente de modelos estadı́sticos no lineales.

Distancia Número de Número de

(a) Use Stan para ajustar el modelo descrito en la Sección 19.1.

(a) Ajuste un modelo no lineal para la probabilidad de éxito (utilizando la probabilidad

3. Sistemas mal plantados: Genere n observaciones independientes yi a partir del siguiente

También podría gustarte