Está en la página 1de 22

Anuario Jurdico y Econmico Escurialense, XLII (2009) 245-266 / ISSN: 1133-3677

Bibliotecas: el coste de las suscripciones y


aportaciones bayesianas
Agustn ALONSO RODRGUEZ
Real Centro Universitario
Escorial-Mara Cristina
San Lorenzo del Escorial
Resumen: Tomando el artculo de Bergstrom sobre los costes de las suscripciones
a las revistas de economa por parte de la bibliotecas en Estados Unidos, como punto
de partida, se presenta el modelo de Stock-Watson para estos datos, y se completa el
modelo propuesto con el punto de vista bayesiano. El resultado final muestra las
semejanzas entre la estimacin mnimo cuadrtica ordinaria y la bayesiana.

Abstract: Taking the article of Bergstrom on libraries subscriptions to economic


journals in the US as an starting point, the paper presents the model of Stock-Watson
for these data. The proposed model is then taken into consideration from a bayesian
perspective. The final result shows the similarities of estimates in both methods: frequentist and bayesian.

Palabras clave: Bibliotecas, suscripciones, revistas de economa, Teorema de


Bayes, estimacin mnimo cuadrtica, estimacin bayesiana, distribucin de probabilidad a priori, distribucin de probabilidad a posteriori, MCMC, programa R, programa WinBUGS.

Key words: Libraries, journals subscriptions, economic journals, Bayes Theorem, statistical estimation methods, prior probability distributions, posterior probability distributions, MCMC, R statistical program, WinBUGS program.

Sumario:

I. Introduccin.

II. Los costes de las suscripciones para las bibliotecas.

III. Razn de la situacin.

IV. Un modelo para la demanda de suscripciones por parte de las bibliotecas.


V. La aportacin bayesiana.

VI. Implementacin bayesiana.

246

VII. Detalles estadsticos.

AGUSTN ALONSO RODRGUEZ

VIII. Aplicacin del programa WinBUGS al modelo de las suscripciones de


las bibliotecas.
IX. Conclusin.

X. Bibliografa.

I. INTRODUCCIN

Theodore C. Bergstrom, en un artculo famoso y controvertido sobre las


suscripciones a las revistas de economa por parte de las bibliotecas, animaba
a un boicot de las revistas publicadas por editoriales comerciales, dado lo elevado de los costes.

El autor, comparando los precios de las suscripciones a las revistas publicadas por asociaciones profesionales y universidades con las publicadas por
editoriales comerciales, consideraba injustificados los altos precios cargados
por estas ltimas, a los que tacha de abusivos.
II. LOS COSTES DE LAS SUSCRIPCIONES PARA LAS BIBLIOTECAS

El artculo publicado en 2001 presenta los resultados de comparar 180


revistas de carcter cientfico en el mbito de la economa y en los Estados
Unidos. Toma como referencias el precio por pgina, el precio por cita, el ranking de la revista por las citas y otras nueve variables ms.
El artculo es de obligada lectura. Aqu sealaremos algunos de los resultados ms notables.

En primer lugar, el autor divide las publicaciones en dos grandes grupos:


publicaciones de asociaciones profesionales y de editoriales universitarias,
publicaciones sin carcter de lucro, y revistas de editoriales comerciales.

Las seis revistas ms citadas por el Social Science Citation Index son de
carcter no lucrativo, con un coste medio de suscripcin anual de 180 dlares.
Si se consideran las veinte revistas ms citadas, slo cinco pertenecen al sector comercial, siendo el coste medio de estas cinco revistas de 1.660 dlares
anuales.
Con las tarifas de suscripcin del ao 2001, Bergstrom elabora las dos
tablas siguientes.

248

AGUSTN ALONSO RODRGUEZ

Tabla 1. Precios subscripciones y citas Revistas sin nimo de lucro

Ttulo revista

AEA Journals*
Econometrica
J Political Ec

Quarterly J Ec
J Finance

J Consumer Res

Precio
Precio por
bibliotecas pgina
$140

$0.03

$175

$0.10

$214
$198
$207
$99

Ec Journal

$321

Rev Ec Statistics

$200

Rev Ec Studies
Amer J Ag Ec
Notas:

$180
$134

$0.14
$0.13
$0.07
$0.23
$0.16
$0.22
$0.29
$0.11

Precio por
cita
$0.01
$0.03
$0.03
$0.05
$0.05
$0.04
$0.13
$0.08
$0.09
$0.07

Precio por
cita reciente
$0.12
$0.93
$0.69
$0.70
$0.63
$0.90
$1.29
$2.34
$1.15
$1.01

Ranking
1
2
3
4
5
6
8

11

12
14

1. AEA Journals: The American Economic Review, Journal of Economic Perspectives y


Journal of Economic Literature. Los costes por pgina y cita se han calculado utilizando el total de pginas y citas de las tres revistas.

2. El precio por pgina se obtiene al dividir el precio de la suscripcin por el nmero de


pginas de la publicacin en el ao 2000.
3. El precio por cita es resultado de dividir el precio de la suscripcin por el nmero de
citas en 1998, recogido por el Social Science Citation Index.

4. El precio por cita reciente se obtiene al dividir el precio de la suscripcin por el nmero de veces que los volmenes de las revistas publicados en 1996 y 1997 son citados en
1998.
5. El ranking de la revista es resultado del nmero de veces que la revista fue citada en
1998.

249

BIBLIOTECAS: EL COSTE DE LAS SUSCRIPCIONES Y APORTACIONES...

Tabla 2. Precios subscripciones y citas Revistas de editoriales comerciales

Titulo Revista

J Financial Ec
J Ec Theory

J Econometrics

J Monetary Econ
J Public Ec

World Development
European Ec Rev

J Env Ec & Mgmt


J Health Ec
Ec Letters

Precio
bibliotecas
$1429
$1800
$2020
$1078
$1546
$1548
$1189
$650
$865

$1592

Notas, como en la Tabla 1.

Precio por
pgina
$0.73
$0.90
$0.87
$0.80
$0.72
$1.35
$0.65
$1.02
$0.98
$1.04

Precio por
cita
$0.53

Precio por
Ranking
cita reciente
$7.85

$8.74

10

$1.08

$10.66

19

$0.96

$6.83

$0.72

$10.40

$0.58

$9.71

$0.81

$1.10
$0.56
$0.90
$1.03

$7.04
$3.90
$5.41

$17.12

13
20
21
22
28
29

Para completar la informacin, el autor hace referencia a los descuentos


ofrecidos a los suscriptores individuales. As, las diez ms importantes revistas no-lucrativas ofrecen un precio medio de suscripcin de 60 dlares al ao.
Mientras que las diez revistas ms importantes de carcter comercial ofrecen
suscripciones que van desde 85 a 1.187 dlares al ao, con un promedio de
360 dlares.
Otro detalle que resalta Bergstrom es el referente al nmero de suscriptores. Las de carcter no-lucrativo tienen un gran nmero de suscriptores individuales. Por ejemplo, Econometrica tena unos 2.900, suscriptores individuales y 2.400 suscriptores institucionales. La Review of Economic Studies,
unos 850 individuales y 2.000 institucionales. En lo que respecta a las editoriales comerciales, las cifras de suscritores se guardan como secretas.
En relacin con las revistas de menor prestigio, las diferencias entre las
revistas no-lucrativas y las comerciales tienen parecidas caractersticas.
Si pasamos a los costes de publicacin, Bergstrom presenta como resumen, los datos de la tabla 3, referidos a una muestra de 297 publicaciones.

250

Tabla 3.- Estadsticas por el tipo de propietario

Tipo de
editorial

No-lucrativas

Nmero de Coste
revistas
total

Blackwell

Comerciales
Totales

91

$11,644

160

$100,381

46

297

$11,807

$123,832

Total
pginas

AGUSTN ALONSO RODRGUEZ

Total
citas

66,304

75,330

23,574

6,335

113,646

40,402

203,524

122,067

Precio por
pagina

Precio por
cita

$0.50

$1.86

$0.15
$0.88

$0.15
$2.48

La presencia de Blackwell (actualmente absorbida por Wiley) se debe al


hecho de que esta editorial publica revistas de su propiedad, pero tambin de
asociaciones no-lucrativas.
A manera de resumen, las editoriales comerciales cargan alrededor de seis
veces ms por pgina, y 16 veces ms por cita que las editoriales no-lucrativas.

Otra caracterstica que analiza Bergestrom es la efectividad de los costes


de las suscripciones. Mientras las editoriales no-lucrativas proporcionan la
mayor parte de la informacin utilizada por los economistas, las editoriales
comerciales absorben la mayor parte del presupuesto de las bibliotecas. En
cifras, si una biblioteca se subscribiese a todas las revistas de economa nolucrativas ello le supondra menos del 10% del presupuesto, permitiendo el
acceso a ms del 60% de los artculos citados en el mbito de la economa.
Sin embargo, la suscripcin a las revistas publicadas por las editoriales
comerciales, Blackwell excluida, consumira el 80% del presupuesto, permitiendo el acceso a slo la tercera parte de los artculos citados. Cf. la Tabla 4.
Tabla 4. Reparto de costes, pginas y citas

Tipo de editorial
No lucrativas
Blackwell

Comerciales

Total costes
9%

10%

81%

Total pginas

Total citas

12%

5%

33%
56%

62%
33%

Esta situacin no es exclusiva de la disciplina econmica, sino que es


comn con otras ramas de la ciencia.
III. RAZN DE LA SITUACIN

Hasta aqu los hechos en el ao 2001. A continuacin, el autor se pregunta


cmo ha podido llegarse a esta situacin, y dado que ahora aparece una varia-

BIBLIOTECAS: EL COSTE DE LAS SUSCRIPCIONES Y APORTACIONES...

251

ble que posteriormente entrar en el modelo economtrico, como es la edad


de las revistas, se hace un breve resumen sobre el tema.

Ocho de las diez revistas ms citadas de carcter no-lucrativo fueron fundadas antes de 1933, y nueve ms, antes de 1945. Y por lo que respecta a ocho
de las diez ms citadas de las editoriales comerciales fueron fundadas entre
1969 y 1974, y el total de las diez, entre 1966 y 1982.
Esta evolucin es resultado de la gran expansin de los estudios y de los
profesionales de la economa, y de la incapacidad a aumentar sus posibilidades las editoriales no-lucrativas ante el incremento de la investigacin publicable.

Al principio, las editoriales comerciales fijaron precios ms competitivos


que los actuales, que, como se ha indicado, absorban en el 2001 el 80% del
presupuesto de las bibliotecas. Para explicar tal situacin Bergstrom acude a
la Teora de juegos, ejemplarizndola en la Parbola de la reunin anual de
los anarquistas, que, a pesar de su anarqua, es decir de su falta de coordinacin, se ven forzados a una situacin que permite al dueo del hotel donde se
celebra la reunin anual, alzar los precios sin que por ello se anule la reunin
anual de los anarquistas.
Aleccionados por la parbola, las editoriales comerciales de las revistas
econmicas con xito han descubierto que pueden alzar los precios de las suscripciones por encima de sus costes medios. Tal subida puede que reduzca el
nmero de suscriptores, pero aumenta los beneficios, ya que el efecto final es
mayor que la reduccin de suscripciones, siendo ello posible ante la falta de
coordinacin de las bibliotecas e instituciones no-lucrativas.

Esta falta de coordinacin en la Comunidad Acadmica es la que motiva al


autor a proponer una serie de actuaciones conjuntas, que intenten reducir el
80% del presupuesto bibliotecario destinado a la adquisicin de revistas que
slo aportan el 30% de las citas que se utilizan en el mbito de la economa.
El lector puede encontrar estas medidas en el artculo tantas veces citado del
Journal of Economic Perspectives, accesible tambin en la pgina web del
autor: http://www.econ.ucsb.edu/~tedb/
IV UN MODELO PARA LA DEMANDA DE SUSCRIPCIONES POR PARTE DE LAS
BIBLIOTECAS

Las ideas y hallazgos de Bergstrom no han cado en el vaco, y buena prueba de ello es el hecho de su popularizacin, al ser objeto de estudio y ejemplo
en textos de econometra, como Stock-Watson: Introduction to Econometrics
(2007), segunda edicin, y Kleiber-Zeilis: Applied Econometrics with R
(2008).

252

AGUSTN ALONSO RODRGUEZ

Stock y Watson utilizan los datos del artculo de Bergstrom para establecer
un modelo, inicialmente no lineal, para explicar la demanda de suscripciones
a las revistas tcnicas en economa.

Su razonamiento es directo y sencillo. Los economistas profesionales


siguen de cerca la investigacin en materia econmica que aparece en las
revistas de la especialidad, bien por suscripcin individual o acudiendo a las
bibliotecas. Desde el punto de vista de estas ltimas, los autores se preguntan
por la elasticidad de demanda de las bibliotecas respecto a las revistas en economa en los Estados Unidos.

Para contestar a esta pregunta, estudian la relacin entre el nmero de suscripciones y los precios de las suscripciones. Al fin y al cabo, el producto final
de las revistas tcnicas son las ideas que contienen, cuantificando su precio no
directamente pero s indirectamente a partir del nmero de veces que tales
ideas se citan por los especialistas en otras publicaciones. Dado el inters por
estimar las elasticidades de la demanda, la especificacin apropiada del
modelo se hace en logaritmos. Es decir, el modelo inicialmente adoptado es:

Con los datos de Bergstrom, las variables en consideracin son:

a) el nmero de subscripciones bibliotecarias: subs,


b) el precio de la cita: precio de la suscripcin dividido por el nmero de
citas.

Para evitar el posible sesgo causado por la ausencia de variables, StockWatson incluyen tres variables de control, a saber, la edad de la revista y el
nmero de caracteres anuales de la publicacin, as como la variable de interaccin resultante de estas ltimas.
Tenemos as el modelo final propuesto:

tras hacer

y: nmero de subscripciones bibliotecarias


x2: precio de las citas
x3: edad de la revista = 2000 - ao de fundacin de la revista
x4: nmero de caracteres anuales de la revista=caracteres por pgina multiplicado por nmero de pginas de la revista, dividiendo el total por 106.

BIBLIOTECAS: EL COSTE DE LAS SUSCRIPCIONES Y APORTACIONES...

253

La formulacin en (1) es la especificacin lineal final a la que llegan Stock


y Watson, que inicialmente consideraron para estos datos una formulacin nolineal.
Con ayuda del programa R, el modelo estimado, con algunos de sus estadsticos, es el siguiente:

A la vista de estos resultados, Stock y Watson establecen las siguientes


conclusiones:

a) la demanda es menos elstica para las revistas ms antiguas que para


las de fundacin reciente;
b) la demanda es mayor para las revistas con mayor numero de caracteres,
permaneciendo constantes el precio y la edad;

c) la evidencia remite a una especificacin lineal, quedando descartada la


no-lineal inicialmente asumida, por presentar coeficientes estadsticamente no-significativos (Cf. STOCK-WATSON, Introduction to Econometrics, segunda edicin, p. 290.)

Para posterior comparacin, el intervalo del 95% de confianza para los


coeficientes del modelo viene dado por

Tenemos as que la demanda de suscripciones depende de la edad de la


revista, lo que se puede interpretar afirmando que las bibliotecas muestran
mayor preferencia por las revistas consolidadas, y que la demanda es muy

254

AGUSTN ALONSO RODRGUEZ

inelstica con relacin al precio, especialmente para las revistas ms antiguas


(para una revista de 80 aos de existencia la elasticidad es 0.28, con un error
estndar de 0,06, y para la demanda de una revista con cinco aos de existencia, la elasticidad pasa a ser 0.67, con un error estndar de 0,08). El disponer
de la investigacin ms reciente es, por tanto, para las bibliotecas, una necesidad no un lujo. Stock y Watson terminan su anlisis relacionando esta inelasticidad, o adicin de las bibliotecas, con la adicin a los cigarrillos, que vara
entre 0,3 y 0,5, si bien, como ellos sealan, la adicin de las bibliotecas no
daa a la salud. Cf. ID., ibd.
V. LA APORTACIN BAYESIANA

El enfoque bayesiano tambin arranca con un modelo para los datos observados,
, dado un vector de parmetros desconocido . El
modelo en formato funcional se da como una distribucin de probabilidad
.
. Al poner el nfasis en el vector de parmetros tenemos la funcin de
verosimilitud, escrita frecuentemente como
, para resaltar el cambio de
roles de e y.

Puede ocurrir que L no sea una funcin de distribucin de probabilidad de


puede no ser igual a la uni, , dados los valores de y, es decir, que
dad, e incluso puede que no sea finita. No obstante, dados los valores concretos de y, es posible encontrar un que maximice la funcin de verosimilitud.
. Tal valor
es la estimacin mximoverosiEs decir,
mil de . Estas ideas se remontan a Ronald A. Fisher, el inventor del mtodo,
ya en 1922.
En el enfoque bayesiano, en lugar de considerar el vector de parmetros o
desconocido, pero de valor constante, se considera como una magnitud aleatoria, es decir, como una variable aleatoria.

La forma de hacer operativa esta idea consiste en atribuir a una distribucin de probabilidad, que resume en s la informacin que se conozca al margen de la aportada por los datos muestrales: y. Esta distribucin de probabilidad recibe el nombre tcnico de distribucin de probabilidad a priori.

Como la funcin de verosimilitud tiene parmetros , tambin la distribucin de probabilidad a priori tiene sus parmetros, , conocidos como hiperparmetros, en vista a diferenciarlos de los parmetros
de la funcin de
verosimilitud.
Para empezar, supongamos conocidos los hiperparmetros. Ello nos per.
mite escribir la funcin de probabilidad a priori como
En estas circunstancias, la inferencia respecto a queda recogida en la distribucin de probabilidad a posteriori

BIBLIOTECAS: EL COSTE DE LAS SUSCRIPCIONES Y APORTACIONES...

255

frmula que se conoce como el Teorema de Bayes (1763).

Conviene destacar que tanto la contribucin de los datos, mediante la funcin de verosimilitud f, como la opinin a priori, presente en son los componentes de la funcin de probabilidad a posteriori en (2). De hecho, la distribucin de probabilidad a posteriori es simplemente el producto de la funcin
de verosimilitud por la distribucin de probabilidad a priori, normalizando el
producto para que la integral sea igual a la unidad, y as ser una distribucin
de probabilidad vlida.

Llegados aqu, quizs sea apropiado presentar la versin discreta de la formulacin en (2). Sea A el evento de inters, y
una coleccin
de eventos disjuntos o mutuamente excluyentes. Dadas las probabilidades
.
y la probabilidad condicionada
, podemos escribir

siendo
la probabilidad conjunta de que A y Bj ocurran, tambin
escrita como .
.(Alonso Rodrguez, 2008). sta es la formulacin del
Teorema de Bayes en los textos introductorios de estadstica.

Al comparar (2) con (3) se puede observar la correspondencia de las


expresiones al hacer que Bj juegue el papel de y A el papel del vector de
datos y.
VI. IMPLEMENTACIN BAYESIANA

Una forma concreta de evaluar la distribucin de probabilidad a posteriori


de los parmetros es acudiendo al programa WinBUGS. Las cuatro letras de
BUGS hacen referencia a Bayesian inference Using Gibbs Sampling (Spiegelhalter, Thomas, Best y Lunn, 2003). No es la nica adaptacin del mtodo
Gibbs para la obtencin de muestras. JAGS: Jet Another Gibbs Sampler
(Plummer, 2003) es otra implementacin del mtodo.
WinBUGS utiliza el procedimiento Gibbs (Geman y Geman, 1984; Gelfand y Smith, 1990, Casella y George, 1992) y el algoritmo Metropolis

256

AGUSTN ALONSO RODRGUEZ

(Metropolis, Rosenbluth, Rosenbluth, Teller y Teller, 1953) para generar


cadenas de Markov, al muestrear distribuciones condicionadas de probabilidad.
Una nueva y ms flexible revisin de WinBUGS es OpenBUGS(Spiegelhalter, Thomas, Best y Lunn, 2004). Para R, la versin adaptada es R2WinBUGS (Sturz, Ligges y Gelman). Basado en OpenBUGS est el programa
BRugs. Con el tiempo se espera fundir ambos programas, BRugs y R2WinBUGS en un solo paquete para R.

WinBUGS es un programa gratuito desarrollado por especialistas en probabilidad y estadstica en la Unidad de Investigacin del Consejo de Bioestadstica en la Universidad de Cambridge, Reino Unido.

El programa WinBUGS utiliza una sintaxis muy parecida a la utilizada por


el programa R. Es ms, como se ha indicado antes, existen dos adaptaciones a
R del programa WinBUGS: BRugs y R2WinBUGS.
WinBUGS utiliza una forma concreta del algoritmo Monte Carlo conocida
como Markov Chain Monte Carlo, abreviadamente MCMC. En esencia, WinBUGS genera muestras aleatorias secuenciales de las distribuciones de cada
uno de los parmetros del modelo, condicionadas a los parmetros de otro
modelo y a los datos muestrales en consideracin.
La utilizacin del programa requiere le especificacin de tres elementos:

un modelo, en la sintaxis de WinBUGS,


los datos muestrales, y
la especificacin de los valores iniciales para los parmetros.

Tanto WinBUGS como JAGS generan resultados en formato MCMC, que


permiten ser analizados, con gran lujo de detalles, por otros dos paquetes:
CODA y BOA, tambin adaptados a R. Los nombres de estos paquetes hacen
referencia al anlisis de los resultados en formato MCMC: BOA, Bayesian
Output Analysis (Smith, 2004) y CODA: Output analysis and diagnostics for
MCMC (Plummer, Best, Cowles y Vines, 2004).

La utilizacin de BRugs y R2WinBUGS suponen el tener que formular el


modelo a utilizar en el formato establecido por WinBUGS, y el establecimiento de los otros dos pasos antes mencionados. Para facilitar an ms la
aplicacin de la visin bayesiana, existen otros dos programas de carcter
general, que liberan al analista de tener que especificar los anteriores pasos.
Son MCMCpack (Martin, Quinn y Park, 2000) y Zelig: Everyones Statistical
Software (Imai, King y Lau, 2000). Ambos paquetes requieren tan slo el formular los modelos a simular en el lenguaje bsico de la regresin establecido
por R.

257

BIBLIOTECAS: EL COSTE DE LAS SUSCRIPCIONES Y APORTACIONES...

VII. DETALLES ESTADSTICOS

Si volvemos a la formulacin en (2), cabe escribirla tambin como:

que podemos enunciar en palabras diciendo que la distribucin de probabilidad a posteriori de los parmetros es proporcional a la funcin de verosimilitud multiplicada por la probabilidad a priori de los parmetros.

Para aplicar el programa R2WinBUGS es necesario formular el modelo en


el formato establecido por WinBUGS. En esta seccin presentamos los fundamentos para poder hacerlo.
El modelo lineal general clsico en formato matricial se escribe como:
siendo:

y, de dimensiones n x 1, el vector de observaciones


X, de dimensiones n x k, la matriz de regresores o variables explicativas,
con la primera columna igual a la unidad;
, ,de dimensiones k x 1, el vector de parmetros; y
u, de dimensiones n x 1, el vector trmino de error del modelo.

En el enfoque bayesiano, tanto como u, son variables aleatorias, que, por


tanto, requieren una distribucin de probabilidad a priori.

En el modelo lineal general (5), los supuestos clsicos permiten escribir ,


lo que nos lleva a que
.

La distribucin a posteriori de , tras obtener y y X, es


virtud del teorema de Bayes pasa a ser:

, y en

expresin que requiere conocer la distribucin de probabilidad conjunta de


y y X, dados
: , y la probabilidad de
:.

Como
, si logramos establecer la probabilidad conjunta X y u,
requiedados , entonces podremos obtener la de y y X. Ahora bien,
re el cumplimiento de
, y en el contexto bayesiano tenemos que
pasar del supuesto de la media condicionada anterior a una distribucin de
probabilidad completa. La forma ms directa de establecerla requiere exigir
que u y X sean independientes, y no simplemente incorrelacionados, es lo que
implica
.

258

AGUSTN ALONSO RODRGUEZ

En estas condiciones, podemos escribir:

Si intercambiamos las variables u y X por y y X, utilizando (5), llegamos a


Se evidencia as que la funcin de probabilidad para los errores del modelo, p(u) , depende de la naturaleza de la variable y. Si es continua o aproximadamente continua y toma valores en la lnea recta, una distribucin inicialmente apropiada es la distribucin normal. Si y es discreta o binaria o nonegativa otras posibilidades existen. Cabe incluso la transformacin de los
valores de y para acercarlos a los valores de la distribucin normal.

Comencemos, pues, suponiendo que las u tienen distribucin normal, con


sus valores independientes e idnticamente distribuidos con media cero y
varianza constante. En el enfoque bayesiano, en lugar de la varianza se utiliza
el recproco de la varianza, con el nombre precisin, y smbolo tau:
. Tau es un hiperparmetro.

Tenemos as la distribucin de probabilidad a priori


De aqu se sigue:
Si la distribucin de X,
no depende de
, entonces X es estrictamente exgena, y en este supuesto
puede ser absorbido como factor de
proporcionalidad en la anterior expresin, y puede ser eliminado, llegando a
tras eliminar

que no depende de

ni de

Bajo estos supuestos de normalidad, independencia y homoscedasticidad


del modelo lineal general clsico, tenemos, las dos formas siguientes de
representar el modelo lineal general:
o tambin

(9)

BIBLIOTECAS: EL COSTE DE LAS SUSCRIPCIONES Y APORTACIONES...

que expresan el hecho de que dados


una distribucin multinormal, con media
zas
.

259

, la variable aleatoria Y tiene


y matriz de varianzas-covarian-

En esta segunda manera de presentar el modelo lineal, (9), el trmino de


error u es irrelevante, siendo innecesario nombrarlo. Sin embargo, hay que
decir que en la econometra tradicional, la formulacin preferida es la primera (8).
Distribuciones a priori de

Una vez establecida la distribucin del trmino de error u, pasemos a considerar las distribuciones de los parmetros.

Para dar mayor relevancia a los datos y menos a las opiniones del investique se denominan
gador, se opta por distribuciones a priori para y
vagas o no-informativas.

De entre las posibles, hay una particularmente interesante por un doble


motivo. Primero porque va a permitir la inferencia a posteriori respecto a
.
, que al menos numricamente, coincide con los resultados de la econometra tradicional. Y segundo, esta distribucin a priori permite derivaciones
analticas exactas para la obtencin de las distribuciones marginales a posteriori
. Nos referimos a la distribucin uniforme, formulada como:
de
Por el teorema de Bayes, al multiplicar la funcin de verosimilitud (7) por
la distribucin a priori (10) obtenemos la distribucin de probabilidad a pos, considerados como variables aleateriori de los (k + 1) parmetros
torias. Es decir:
o equivalentemente
siendo
drados ordinarios.

, los estimadores de mnimos cua-

El vector de residuos es de importancia crucial a la hora de comprobar si


los supuestos del modelo lineal general son consistentes con las observaciones. Y se puede demostrar que la distribucin marginal de , al integrar respecto a , en (12) es la distribucin gamma. Es decir:

260

AGUSTN ALONSO RODRGUEZ

siendo
VIII.

los grados de libertad, y

la varianza residual.

APLICACIN DEL PROGRAMA WINBUGS AL MODELO DE LAS


SUSCRIPCIONES DE LAS BIBLIOTECAS

Como se ha indicado antes, para aplicar el programa WinBUGS se requiere el establecimiento de un modelo, los datos muestrales y el establecimiento
de los valores iniciales de los parmetros.
El modelo, dadas las explicaciones anteriores, y el modelo establecido
como modelo final por Stock-Watson, permite la siguiente formulacin, en la
sintaxis establecida por WingBUGS, cf. LANCASTER, T., (2004), p. 375.

N. B. La variable de interaccin x2x x 3 pasa a ser aqu la variable x 4, y la


anterior variable x 4, pasa a ser ahora la variable x 5.

Sobre este modelo como base, vamos a generar tres Cadenas de Markov,
de 50.000 muestras o valores muestrales, y valores iniciales diferentes para
cada una, sobre las que el programa WinBUGS establecer la distribucin de
probabilidad a posteriori para los parmetros.
Los valores iniciales, en el formato de WinBUGS, quedan almacenados
con el nombre inits, y son los siguientes:

N. B. El segundo conjunto de valores iniciales se inspira en los valores


estimados por mnimos cuadrados ordinarios, en el modelo de Stock-Watson.

BIBLIOTECAS: EL COSTE DE LAS SUSCRIPCIONES Y APORTACIONES...

261

Invocamos por primera vez el programa WinBUGS mediante la instruccin:

Los resultados quedan guardados como


con invocarlos:

. Para verlos, basta

y los resultados de la simulacin, es decir, la distribucin de probabilidad


a posteriori de los parmetros arroja los siguientes resultados

De esta tabla, que por razones de espacio slo brinda un decimal para el
valor esperado o medio de la distribucin de cada uno de los parmetros, la
primera columna (luego se vern ms decimales), hay que resaltar el valor del
estadstico Rhat de Gelman y Rubin (1992); su valor, igual a la unidad, indica
que las cadenas se entrecruzan y convergen correctamente a la distribucin de
probabilidad a posteriori de cada parmetro.

262

AGUSTN ALONSO RODRGUEZ

Para estudiar mejor los resultados, acudimos al programa CODA. Ahora,


debido a la instruccin codaPkg=TRUE, los resultados de la simulacin se
guardarn para luego poderlos mostrar con ms detalle.
La nueva invocacin de WinBUGS es la siguiente:

Al invocar simulacin2, el programa muestra los tres ficheros en los


que han quedado almacenados los resultados de cada cadena

Para ver estos resultados, los leemos y guardamos como simulaciones, mediante la instruccin:
y con
obtenemos:

BIBLIOTECAS: EL COSTE DE LAS SUSCRIPCIONES Y APORTACIONES...

263

A la vista de estos resultados, y al compararlos con los obtenidos al estimar


el modelo de Stock-Watson por mnimos cuadrados ordinarios, ver columna
Mean y columna Estimate de ambos resmenes (summary), vemos la
coincidencia casi absoluta de los valores, con la salvedad de que en el enfoque
bayesiano hemos obtenido distribuciones de probabilidad para cada parmetro, en lugar del nico valor dado por la estimacin mnimo cuadrtica.
Ya que anteriormente calculamos el intervalo de confianza para los coeficientes estimados del modelo de Stock-Watson, podemos comparar sus valores con los percentiles dados en el summary(simulaciones), y tambin
las coincidencias son notables.

Si nos detenemos en el valor de tau, cuya media es 2.1188, recordando la


relacin
, podemos escribir
, es decir
. En la estimacin de este parmetro por mnimos cuadrados, en el output de R, aparece
.
, Residual standard error.

Con el programa CODA varias son las posibilidades de anlisis que ahora
estn disponibles, y con grficos en alta resolucin. Por ejemplo:
qqmath(simulaciones), que muestra un grfico qqnorm, para
comprobar visualmente la normalidad de los resultados;

cumuplot(simulaciones), para ver las trayectorias seguidas por


las simulaciones;
geweke.diag(simulaciones), para aplicar el contraste de
Geweke;

heidel.diag(simulaciones), para aplicar el contraste de Heidelberger-Welch;


gelman.diag(simulaciones), para aplicar este contraste;

plot(simulaciones), para obtener una visin grfica global de


los resultados; etc.

Aqu nos limitaremos a ver grficamente las distribuciones de los parmetros; la instruccin
densityplot(simulaciones)

264

genera las representaciones de la figura 1.

AGUSTN ALONSO RODRGUEZ

FIGURA 1

La figura 1 muestra la buena mezcla de las 3 cadenas, y su buena adecuacin a la distribucin normal, en lo que se refiere a los parmetros
b1,b2,b3,b4,b5 y a la distribucin gamma en lo referente a tau.
IX. CONCLUSIN

Adems de hacernos eco del artculo de T. Bergstrom, y del modelo desarrollado por Stock y Watson, en este trabajo hemos querido mostrar cmo el

BIBLIOTECAS: EL COSTE DE LAS SUSCRIPCIONES Y APORTACIONES...

265

enfoque bayesiano permite llegar a los resultados del enfoque frecuentista,


tradicional en econometra.

Aunque el establecimiento de probabilidades a priori denominadas noinformativas, permite el acercamiento entre ambos enfoques, con todo no es
lo ms deseable desde el punto de vista bayesiano, que valora grandemente la
opinin de los especialistas en cuanto conocedores de sus mbitos de especializacin.
Dados los avances en el mbito de la informtica y la estadstica, sera de
desear una mayor aceptacin del enfoque bayesiano en econometra, ya que
permite abrir un campo de posibilidades de grandes consecuencias, al establecer la forma de revisar las opiniones de los expertos, traducidas en las probabilidades a priori, un hecho de gran importancia en economa.
X. BIBLIOGRAFA

ALBERT, J., Bayesian Computation with R, Springer, New York 2007.


ALONSO RODRGUEZ, A., El resurgir de Thomas Bayes, en Anuario Jurdico y Econmico Escurialense 41 (2008) 327-360.
BERGSTROM, T. C., Free Labour for Costly Journals?, en Journal of Economic Perspectives, 15, 4 (2001) 183-198. Tambin en: http://www.econ.ucsb.edu/~tedb/
CARLIN, B. P., y LOUIS, T. A., Bayesian Methods for Data Analysis, 3. ed., CRC
Press, Boca Ratn, FL. 2009.
CASELLA, G., y GEORGE, G., Explaining the Gibbs Sampler, en American Statistician, 46 (1992) 167-174.
GELFAND, A. E., y SMITH, A. F. M., Sampling-based Approaches to Calculating Marginal Densities, Journal of the American Statistical Association 85 (1990) 398409.
GELMAN, A., y RUBIN, D. B., Inference from iterative simulations using multiple
sequences (with discussion), en Statistical Science 7 (1992) 457-511.
GELMAN, A., y HILL, J., Data Analysis using Regression and Multilevel/Hierarchical
Models, Cambridge University Press, New York 2007.
GEMAN, S., y GEMAN, D., Stochastic Relaxation, Gibbs Distributions and the Bayesian Restoration of Images, en IEEE Transactions on Pattern Analysis and
Machine Intelligence 6 (1984) 721-741.
GILKS, W. R.; RICHARDSON, S., y SPIEGELHALTER, D. J., Markov Chain Monte Carlo in
Practice, Chapman & Hall/CRC, Boca Ratn, Florida 1996.
GREENBERG, E., Introduction to Bayesian Econometrics, Cambridge University Press,
New York 2008.
IMAI, K.; KING, G., y LAU, O., Zelig: Everyones Statistical Software, R version 3.31, 2008, en CRAN: The Comprehensive R Archive Network,
URL:http://cran.r-project.org/web/packages/Zelig/, Viena.
KLEIBER, C., y ZEILEIS, C., Applied Econometrics with R, Springer, New York 2008.
KOOP, G., Bayesian Econometrics, John Wiley, Chichester, UK 2003.
LANCASTER, T., An Introduction to Modern Bayesian Econometrics, Blackwell
Publishing, Oxford 2004.

266

AGUSTN ALONSO RODRGUEZ

LYNCH, S. M., Introduction to Applied Bayesian Statistics and Estimation for Social
Scientists, Springer, New York 2007.
MARTIN, A.D.; QUINN, K. M., y PARK, J. H., MCMCpack Packge, R version 0.9-5,
2008, en CRAN: The Comprehensive R Archive Network,
URL:http://cran.r-project.org/web/packages/MCMCpack/, Viena.
METROPOLIS, N.; ROSENBLUTH, A.; ROSENBLUTH, M.; TELLER, H., y TELLER E., Equation of State Caculations by Fast Computing Machines, Journal of Chemical
Physics 21 (1953) 1087-1092.
PLUMMER, A., JAGS: Jet Another Gibbs Sampler, version 1.0.3, 2008,
URL: http:// calvin.iarc.fr/~martyn/software/jags/
PLUMMER, M.; BEST, N.; COWLES, K., y VINES, K., 2004, CODA: Output Analysis
and Diagnostics for MCMC, R package version 0.13-3, 2008, en CRAN: The
Comprehensive R Archive Network,
URL:http://cran.r-project.org/web/packages/coda/, Viena.
R Development Core Team, R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Viena, Austria, 2008. URL
http://www.r-project.org.
SMITH, B. J., BOA: Bayesian Output Analysis program for MCMC, 2004. R package, version 1.1.7-2, 2008, en CRAN: The Comprehensive R Archive Network,
URL:http://cran.r-project.org/web/packages/boa/, Viena.
SPIEGELHALTER, D. J.; THOMAS, A.; BEST, N.G., y LUNN, D., WinBUGS Version 1.4
Users Manual, MRC Biostatistics Unit, Cambridge 2003.
WinBUGS Version 2.0 Users Manual, MRC Biostatistics Unit, Cambridge 2004,
URL: http//mathstat.helsinki.fi/openbugs/
STOCK, J. H., y WATSON, M. W., Introduction to Econometrics, 2. ed., Pearson-Addison Wesley, Boston 2007.
STURZ, S.; LIGGES, U.; GELMAN A.; GORJANC, G., y KERMAN, J., R2WinBUGS, R
version 2.1-8, 2008, en CRAN: The Comprehensive R Archive Network,
URL:http://cran.r-project.org/web/packages/R2WinBUGS/, Viena.
SU, Y-S., y YAJIMA, M., R2JAGS, version 0.01-13, 2008, en CRAN: The Comprehensive R Archive Network,
URL:http://cran.r-project.org/web/packages/R2JAGS/, Viena.