Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Analisis Bayesiano
Analisis Bayesiano
NDICE
ANLISIS BAYESIANO................................................................................................................ 3
CONCEPTOS GENERALES.......................................................................................................3
UN EJEMPLO CLSICO............................................................................................................4
PROBABILIDAD SUBJETIVA.................................................................................................. 6
INTERVALO DE PROBABILIDAD........................................................................................ 10
EXPLICACIN DE LOS SUBMDULOS.............................................................................. 11
1. UNA POBLACIN. ESTIMACIN DE UNA PROPORCIN.......................................12
1.1. So!"#$% "o%&'%"#o%(.................................................................................................12
1.2. So!"#$% )(*'+#(%(...................................................................................................... 13
1.3. E '%,o-!' )(*'+#(%o )(.o +!/!'+0o+ (10#,#"#(2'%0' +#2/#,#"(3o+............................13
1.4. E /(+o ( ( "o%0#%!#3(3...............................................................................................14
1.5. I%0'1&(o 3' /1o)()##3(3.............................................................................................20
2. UNA POBLACIN. VALORACIN DE 6IPTESIS SOBRE UNA PROPORCIN.. 23
2.1. P1o/o1"#$% #7!( ( !%( "o%+0(%0'.................................................................................23
2.2. P1o/o1"#$% 3'%01o 3' !% #%0'1&(o............................................................................... 25
3. DOS POBLACIONES. ESTIMACIN DE UNA DI8ERENCIA DE PROPORCIONES
................................................................................................................................................ 26
4. DOS POBLACIONES. VALORACIN DE 6IPTESIS SOBRE UNA DI8ERENCIA
DE PROPORCIONES............................................................................................................ 32
4.1. I7!(3(3 3' /1o/o1"#o%'+.............................................................................................32
4.2. D#,'1'%"#( 3' /1o/o1"#o%'+ 3'%01o 3' !% #%0'1&(o..................................................... 33
5. UNA POBLACIN. ESTIMACIN DE UNA MEDIA................................................... 35
6. UNA POBLACIN. VALORACIN DE 6IPTESIS SOBRE UNA MEDIA.............. 40
6.1. M'3#( #7!( ( !%( "o%+0(%0'........................................................................................ 40
6.2. M'3#( 3'%01o 3' !% #%0'1&(o.......................................................................................42
4. DOS POBLACIONES. ESTIMACIN DE UNA DI8ERENCIA DE MEDIAS.
M9TODO EXACTO.............................................................................................................. 43
:. DOS POBLACIONES. ESTIMACIN DE UNA DI8ERENCIA DE MEDIAS.
M9TODO APROXIMADO................................................................................................... 45
;. DOS POBLACIONES. VALORACIN DE 6IPTESIS SOBRE UNA DI8ERENCIA
DE MEDIAS...........................................................................................................................51
10. TABLAS DE CONTINGENCIA. VALORACIN DE 6IPTESIS DE
INDEPENDENCIA................................................................................................................ 52
11. VALORACIN BAYESIANA DE PRUEBAS CONVENCIONALES......................... 54
BIBLIOGRA8<A........................................................................................................................ 5:
ANLISIS BAYESIANO
CONCEPTOS GENERALES
La inferencia estadstica devino en un recurso extremadamente til para los editores de revistas y
responsables administrativos, cuando a principios del siglo XX la ausencia de una herramienta que
aquilatara cuantitativamente el significado de los hallazgos produjo que las ancdotas clnicas
poblaran las revistas mdicas !e haca necesario, por tanto, usar procedimientos que cuantificaran
la evidencia y complementaran los razonamientos verbales, de modo que los protegiera de la
subjetividad
!in embargo, lo cierto es que, aunque la objetividad es un deseo natural y legtimo,
lamentablemente resulta inalcanzable en estado puro La estadstica no puede resolver este
conflicto, pues todo proceso inferencial, incluso cuando se lleva adelante con su concurso, tendr"
siempre un componente subjetivo !i bien las tcnicas estadsticas suelen ser muy tiles,
ocasionalmente pueden defraudar al usuario #n efecto, pueden despertar expectativas que a la
postre no se cumplan, especialmente cuando el investigador renuncia a examinar la realidad a
travs de un pensamiento integral y deja todo en manos del veredicto formal de los procedimientos
estadsticos Los argumentos aportados en este sentido por $erger y $erry
%
son sumamente
persuasivos
Los trabajos desarrollados por &isher en los a'os () y por los matem"ticos *eyman y +earson en la
dcada del ,), dieron lugar al mtodo actualmente conocido como prueba de significacin, que
responde al llamado -paradigma frecuentista. #ste mtodo engloba un ndice para medir la fuerza
de la evidencia, el llamado valor p, y un procedimiento de elecci/n entre hip/tesis, llamado prueba
de hiptesis 0+12
!in embargo, la metodologa de las pruebas de hip/tesis vive en la actualidad, segn algunos
especialistas, cierta crisis3 desde esa perspectiva, por tanto, resulta atractiva la idea de manejar un
nuevo paradigma o de corregir el actual #n este sentido el enfoque bayesiano se perfila como una
alternativa altamente promisoria
Las crticas m"s reiteradas al paradigma cl"sico han sido que obliga a una decisi/n dicot/mica y
que constituye una medida que depende vitalmente de un elemento ex/geno a los datos4 el tama'o
de muestra 5 un efecto peque'o observado en un estudio con un tama'o de muestra grande
puede corresponder el mismo valor p que a un gran efecto registrado a travs de una muestra
peque'a +or otra parte, basta que haya una diferencia mnima, intrascendente 0o el m"s mnimo
sesgo2, para que tal diferencia pueda ser declarada -significativa., siempre que haya recursos como
para tomar una muestra suficientemente grande #sta problem"tica se discute e ilustra m"s
adelante
!e supone que, al aplicar cierto procedimiento estadstico a un conjunto de datos, lo que se
procura es que el an"lisis gane en objetividad3 es decir, que los puntos de vista del investigador
no puedan modificar sustancialmente las conclusiones +ero la verdad es que los mtodos
estadsticos convencionales est"n lejos de garantizar autom"ticamente tal desideratum #s bien
sabido que la forma de operacionalizar las variables, los puntos de corte que se eligen, el nivel
de significaci/n empleado, las escalas de medici/n adoptadas, las pruebas de significaci/n
seleccionadas, son solo algunos ejemplos de la larga lista de instrumentos estadsticos que
irremediablemente han de elegirse segn un punto de vista que vara entre investigadores !in
,
embargo, donde tal carencia de normas uniformes es m"s acusada es en el punto culminante del
proceso4 a la hora de realizar inferencias una vez examinados los resultados
(
UN EJEMPLO CLSICO
#n $enavides y !ilva
,
se desarrolla un ejemplo que contribuye a exponer m"s claramente el modus
operandi de la tcnica cl"sica y que se retoma m"s adelante para ilustrar el enfoque bayesiano
!up/ngase que hay motivos te/ricos e indicios empricos nacidos del trabajo de enfermera que
hacen pensar que los pacientes afectados por quemaduras se recuperan m"s r"pidamente cuando el
tratamiento combina cierta crema antisptica con un ap/sito hidrocoloide que cuando solo se
utiliza la crema antisptica !e dise'a, entonces, un experimento con la esperanza de rechazar la
hip/tesis nula que afirma que el tratamiento simple es tan efectivo como el combinado
6magnese que se tienen n78) pacientes3 aleatoriamente se eligen 9) de ellos para ser atendidos con
el tratamiento experimental 0combinaci/n de crema antisptica y ap/sito hidrocoloide2 en tanto que
a los 9) restantes se les aplica el tratamiento convencional 0crema nicamente2
:na vez obtenidos los datos 0porcentajes de recuperaci/n en el grupo experimental y en el control,
p
e
y p
c
, y su diferencia, d
)
7p
e
;p
c
2, se calcula la probabilidad asociada a ese resultado bajo el
supuesto de que se cumple 1
)
!up/ngase que el <=> 0p
e
7),<=2 de los pacientes a los cuales se les
aplic/ el tratamiento experimental mejora apreciablemente a los = das, mientras que para los
pacientes tratados de manera convencional, esta tasa de recuperaci/n fue del ?)> 0p
c
7),?)2 La
@abla % recoge la informaci/n relevante de este ejemplo
Tabla 1. Distribui!" #$ u"a %u$stra #$ &' (ai$"t$s s$)*" trata%i$"t+ asi)"a#+ ,
s$)*" s$ r$u($rara" + "+.
Se recuperan
Tratamiento S No Total
#xperimental ,) %) 9)
Aonvencional (9 %? 9)
@otal =9 (? 8)
!egn la pr"ctica regular, ahora procede aplicar una prueba estadstica3 la m"s usada para valorar
la diferencia entre porcentajes es la prueba Bi;cuadrado0enteramente equivalente a la prueba basada
en el estadstico C que opera con la diferencia entre los porcentajes y se distribuye
aproximadamente segn una normal est"ndar2 #s f"cil constatar que en este ejemplo
(
0obs27(,)=
y que el correspondiente valor p es igual a ),%= +uesto que dicho valor no es suficientemente
peque'o como para considerar que -hay significaci/n. a ninguno de los niveles habituales 0),%)3
),)= y ),)%2 y a pesar de que esta diferencia objetivamente observada es notable, segn la pr"ctica al
uso, el investigador tiene que concluir 0aunque casi con seguridad, y con raz/n, a rega'adientes2
que no tiene suficiente evidencia muestral como para afirmar que el tratamiento con crema y
ap/sito sea m"s efectivo que el tratamiento con crema solamente #s decir, debe actuar como si el
experimento no arrojara informaci/n adicional alguna para pronunciarse, lo cual es obviamente
inexacto
+or otra parte, este mtodo, las decisiones se adoptan sin considerar la informaci/n externa a las
observaciones o al experimento3 de ah que una de las objeciones m"s connotadas que se hace al
9
mtodo es que no toma en cuenta de manera formal en el modelo de an"lisis la informaci/n
anterior a los datos, proveniente de estudios previos o de la experiencia emprica informalmente
acumulada, que siempre se tiene sobre el problema que se examina
+ara ilustrar la dependencia que tiene el an"lisis del tama'o muestral, bastar" reproducir la
@abla % pero usando mayores valores de muestra total y conservando la misma distribuci/n en
su interior #l valor de p se puede reducir tanto como se desee +or otra parte, sup/ngase ahora
que el estudio se realiz/ con n79)) pacientes y que arroj/ los resultados de la @abla (
Tabla -. Distribui!" #$ u"a %u$stra #$ .'' (ai$"t$s s$)*" trata%i$"t+ a(lia#+
, s$)*" s$ r$u($rara" + "+.
Se recuperan
Tratamiento S No Total
#xperimental %), D< ())
Aonvencional %() 8) ())
@otal ((, %<< 9))
Las estimaciones son p
e
7),=( y p
c
7),?) Aomo se ve, los resultados est"n en clara colisi/n con las
expectativas del investigador 5 juzgar por estas tasas, habra que pensar en principio que el
ap/sito podra ser da'ino 5l realizar la prueba de hip/tesis formal se obtienen
(
0obs27(,D, y
p7),)D #n este caso, si el investigador usara umbrales fijos, no podra rechazar la hip/tesis 1
)
al
nivel m"s socorrido 07),)=2 pero s al nivel 7),% !i acude al recurso m"s usual 0consignar el valor
exacto de p2, podra declarar algo como lo siguiente4 -las tasas observadas difieren
significativamente 0p7),)D2. #n cualquier variante, el rechazo de la hip/tesis de igualdad entre
tratamientos debera ser a favor de que el que utiliza solamente crema es m"s efectivo que el que
incluye el ap/sito
#sta conclusi/n, sin embargo, contradice los conocimientos previos, la expectativa racional y la
experiencia del investigador, todo lo cual lo colocara probablemente en un conflicto4 Ematiza
verbalmente el resultado hasta hacerle perder de hecho todo valorF Ese escuda en que no se lleg/
al umbral -m"gico. de ),)= y dice simplemente que la diferencia no es significativaF Ese abstiene
de comunicar los resultados y acta como si no se hubieran producidoF 5 juicio de los crticos
del frecuentismo, cualquiera de estas tres variantes sera inconsistente con la -obligaci/n
metodol/gica. que contrajo el investigador al elegir las +1 como medio valorativo del
procedimiento teraputico en estudio
#l atractivo de contar con un enfoque alternativo puede ser f"cilmente comprendido4 resulta
natural que se aspire a contar con un procedimiento inferencial libre de las serias impugnaciones
que se hacen a las pruebas de significaci/n
+ara conjurar la orfandad en que quedara el investigador tras el abandono de las +1, se
manejan varias alternativas :na de ellas, sin duda la m"s sencilla de todas, es simplemente no
usar la prueba de hip/tesis y circunscribirse a la construcci/n de intervalos de confianza 06A2 Ge
manera informal, un intervalo de confianza para un par"metro + se define como una pareja de
nmeros
%
H
P
y
(
H
P
entre los cuales se puede -estar confiado. que se halla el par"metro en
cuesti/n !i bien los 6A se inscriben en la /rbita de la misma vertiente frecuentista que las
pruebas de hip/tesis, se apartan de la interpretaci/n autom"tica de los valores p y constituyen
un recurso para aquilatar, justamente, el grado en que el conocimiento de la verdadera
=
diferencia es adecuado :na ventaja obvia de los intervalos de confianza, sin embargo, es que los
resultados se expresan en las mismas unidades en los cuales se hizo la medici/n y, por tanto,
permiten al lector considerar crticamente la relevancia clnica de los resultados
La otra alternativa es la inferencia bayesiana, objeto del presente m/dulo !egn comentan
detalladamente $enavides y !ilva
,
, se trata de una aproximaci/n metodol/gica exenta de casi
todas las crticas que se le hacen a las pruebas de significaci/n y que goza del atractivo de
incorporar las evidencias aportadas por experiencias previas dentro del proceso analtico y las
contempla, por ende, en las conclusiones
5dvirtase que, tpicamente, el clnico admite con naturalidad que tiene un criterio a priori
sobre un paciente3 realiza ex"menes complementarios y actualiza su visi/n inicial sobre el
diagn/stico que corresponde a ese paciente al conjugar las dos cosas 0visi/n inicial e informaci/n
complementaria2 en lo que constituye un proceso de inducci/n integral +arece bastante natural
la aspiraci/n de que un investigador se conduzca de manera similar3 esa es exactamente la forma
en que opera el pensamiento bayesiano
Los recursos para hacer inferencia estadstica bayesiana se conocen desde hace m"s de ()) a'os
#l reverendo @homas $ayes resolvi/ cuantitativamente por entonces el problema de determinar
cu"l de varias hip/tesis es m"s probable sobre la base de los datos !u descubrimiento b"sico se
conoce como el @eorema de $ayes
$ayes naci/ en Londres en %<)( y falleci/ el %< de abril de %<?% en @unbridge Iells, Jent &ue
distinguido como Fellow de la Koyal !ociety en %<9(, aunque hasta ese momento no haba dado
publicidad a trabajo alguno bajo su nombre !u artculo m"s emblem"tico
9
se titulaba Ensayo
hacia la solucin de un problema en la doctrina del azar 0Essay towards solving a problem in the doctrine
of chances2 y fue publicado p/stumamente
#l pensamiento bayesiano tiene m"s similitud que el frecuentista con el tipo de situaciones en
que se ve el cientfico habitualmente4 lo que tiene son datos 0pacientes con ciertos rasgos, medias
muestrales, series de datos2 y lo que quiere es descubrir qu circunstancias determinaron que los
datos fueran esos y no otros 0es decir, quiere hacer juicios acerca de las leyes que gobiernan el
proceso que produjo los datos que observa2 La diferencia esencial entre el pensamiento cl"sico y
el bayesiano radica en que aqul se pronuncia probabilsticamente sobre los datos a partir de
supuestos 0la -p. no es otra cosa que eso23 en tanto que ste se pronuncia 0tambin
probabilsticamente2 sobre los supuestos partiendo de los datos
5unque las bases de este enfoque datan de hace m"s de dos siglos, es ahora que empieza a
asistirse a un uso apreciable del mismo en la investigaci/n biomdica :na de las razones que
explican tal realidad y que a la vez augura un prominente futuro, es que algunos de los
problemas de cierta complejidad que posee este mtodo exigen el uso de recursos
computacionales accesibles s/lo muy recientemente para el comn de los investigadores
PROBABILIDAD SUBJETI/A
La inferencia bayesiana constituye un enfoque alternativo para el an"lisis estadstico de datos que
contrasta con los mtodos convencionales de inferencia, entre otras cosas, por la forma en que
asume y maneja la probabilidad
=
P
P
P
N%O
5n"logamente,
2 0
2 0
2 M 0
P
P
P
,
de modo que, sustituyendo en N%O la expresi/n
2 0 2 M 0 2 0 P P P
, se llega a la forma m"s
simple de expresar la regla de $ayes4
2 0
2 0 2 M 0
2 M 0
P
P P
P
N(O
5hora bien, sup/ngase que 5
%
, 5
(
, , 5
P
son k sucesos mutuamente excluyentes, uno de los
cuales ha de ocurrir necesariamente3 entonces la conocida 0e intuitiva2 ley de la probabilidad total
establece que4
k
i
i i
P P P
%
2 0 2 M 0 2 0
Ge modo que, tomando el suceso 5
j
en lugar de 5 en la f/rmula N(O y aplicando al denominador
la mencionada ley, se tiene4
k
i
i i
j j
j
P P
P P
P
%
2 0 2 M 0
2 0 2 M 0
2 M 0
N,O
que es otra forma en que suele expresarse la regla de $ayes
+ara el caso particular en que k7(, la expresi/n N,O se reduce a4
( ) A )P A P! )PA) A P!
PA) A) P!
!) PA
+
donde
A
representa el complemento de 5, para dar lugar a la forma m"s conocida del teorema
de $ayes, ya mencionada antes
La regla de $ayes produce probabilidades inversas, en el sentido de que expresa +05M$2 en
trminos de +0$M52
La terminologa convencional para +05M$2 es la probabilidad a posteriori de 5 dado $ y para
+052 es la probabilidad a priori de 5, 0debe su nombre a que se aplica antes, sin estar
condicionada por la informaci/n de que $ ocurri/2
8
:na forma alternativa de expresar el teorema en el caso en que se trabaja con un evento y su
complemento es especialmente til cuando se trabaja con odds
@
M
donde 1 representa que una hip/tesis dada es v"lida y J que lo es la hip/tesis complementaria
$ajo el enfoque bayesiano, se suele valorar el apoyo relativo que dan los datos a cada una de estas
dos hip/tesis en trminos del llamado Factor de !ayes 0$&2, el cual compara las probabilidades de
los datos observados bajo las hip/tesis4
= >
= >
K datos P
H datos P
BF
!intetizando, lo que proclama el enfoque bayesiano es que resulta til, adem"s de ser consistente
con las demandas de la intuici/n, poder contar con un mtodo que combine las evidencias
subjetivamente acumuladas con la informaci/n objetiva obtenida de un experimento en
particular
+or ejemplo, al estimar un par"metro, su valor, naturalmente, se desconoce3 pero es absurdo
suponer un vaco total de ideas o de presunciones en la cabeza de quienes tienen esa ignorancia,
y una persona puede expresar su opini/n acerca de su conocimiento e incertidumbre por medio
de una distribuci/n probabilstica de un conjunto de valores posibles del par"metro La
distribuci/n a priori es la distribuci/n probabilstica que refleja y sintetiza la idea acerca de lo
que dicha persona razonablemente piensa antes de observar los datos #st" claro que la realidad
objetiva 0muchas veces representada a travs de lo que los estadsticos llaman -par"metros.2 es
de determinada manera 0ajena a las impresiones que uno tenga de ella2, y tambin es obvio que
no se comporta aleatoriamente3 pero nuestra visi/n sobre ella s, y en gran medida depende de
nuestra comprensi/n del problema y sobre todo, del conocimiento general prevaleciente en el
momento del estudio
+rocede, sin embargo, aclarar que es posible 0y ocasionalmente recomendable2 emplear
informaci/n emprica para conformar esta opini/n -subjetiva. #n esto se basa el anlisis
bayesiano emprico, consistente en la determinaci/n de la distribuci/n a priori a partir de la
evidencia emprica y el uso de esta misma evidencia para los c"lculos bayesianos formales
D
#n este punto, y a modo de sntesis, cabe preguntar Equ se supone que representa la
distribuci/n a prioriF :na posible respuesta es4 la distribuci/n probabilstica a priori representa
el estado de incertidumbre de un individuo particular acerca de ciertos par"metros +or tanto, si
dos individuos tienen diferentes creencias acerca de un par"metro, y estas creencias son
representadas honestamente por medio de diferentes distribuciones probabilsticas a priori,
entonces ambas distribuciones son, en cierto sentido y de momento, igualmente v"lidas
Kecordemos que los -odds. asociados a cierto suceso se definen como la raz/n entre la probabilidad de que dicho
suceso ocurra y la probabilidad de que no ocurra
8
D
INTER/ALO DE PROBABILIDAD
Kecurdese que en el marco frecuentista un intervalo de confianza se interpreta en trminos de
repeticiones hipotticas del estudio !egn este enfoque cl"sico4 -si se repitiera muchas veces el
muestreo, se aplicara el mismo procedimiento y se calcularan respectivos intervalos de
confianza al D=> segn las f/rmulas conocidas, D= de cada %)) intervalos incluiran al verdadero
par"metro que est" siendo estimado. #sta afirmaci/n es coherente con la definici/n de
probabilidad como frecuencia -a la larga. que usa esta escuela
+rocede se'alar en este contexto que la interpretaci/n de los intervalos de confianza tambin se
presta a confusi/n Auando un investigador calcula un intervalo de confianza al D=>, suele
pensar que este intervalo obtenido a partir de una muestra particular contiene al par"metro de
inters con una alta probabilidad #sta interpretaci/n, aunque intuitiva y muy extendida, es
err/nea :na vez seleccionada la muestra, es el intervalo de confianza el resultado de la
experiencia aleatoria3 lo que puede afirmarse es que, aproximadamente para el D=> de las
muestras posibles, el intervalo resultante contendra al par"metro desconocido Aon este
enfoque, solo se puede confiar en el procedimiento seguido4 si este intervalo se calculara
repetidamente, entonces se sabe que aproximadamente en el D=> de los casos se obtendr"n
intervalos que contendr"n el valor desconocido3 si se hace una sola vez 0que es lo que se produce
siempre2, entonces solo puede -confiarse. en que este intervalo haya sido uno de los -exitosos.
+ara los bayesianos, que admiten que se considere a la probabilidad como un grado de creencia,
el enfoque correcto es diferente4 se considera la curva que representa la funci/n de densidad que
se obtiene a posteriori, y si el "rea bajo dicha curva entre los valores X e Q es igual a D=>,
entonces se puede hablar de que el verdadero valor est entre X e Q con cierta probabilidad 0por
ejemplo, del D=>2 !e dice entonces que 0X, Q2 constituye un intervalo de credibilidad al D=> o un
intervalo de confianza bayesiano
%)
5l intervalo construido bajo estos supuestos tambin se le llama
intervalo probabil$stico
Nota: #n el desarrollo de la explicaci/n sobre la estimaci/n de una proporci/n se
da una definici/n formal de este intervalo
La literatura referente a los mtodos bayesianos crece a diario :n solo ejemplo claramente
elocuente del auge que han tomado dichos mtodos lo proporciona la Kevista Annals of %nternal
&edicine, una de las de mayor prestigio internacional #n un editorial firmado por Gavidoff
%%
se
plantea4 -Aonvencidos de que la inferencia inductiva es til y factible para la interpretaci/n de
estudios cientficos, en %DD< comenzamos a alentar a los autores que envan sus manuscritos a
Annals a que incluyan la interpretaci/n bayesiana en sus resultados. :n hecho notable es que
en febrero del ())=, una bsqueda en 'oogle, arroj/ que hay ,%=)) sitios en cuyo nombre est" la
palabra !ayes, y %<,))) en que aparece bayesian3 adem"s hay (9=)))) sitios I#$ donde se
menciona en algn lugar dicha palabra bayesian :na medida del crecimiento de la presencia de
los mtodos bayesianos en los artculos mdicos puede apreciarse consultando la base Pubmed3
operando con la clave -bayes () bayesian. se hallaron los resultados que recoge la @abla ,
Tabla 0. N*%$r+ #$ art1ul+s r$)istra#+s $" PUBMED $" u,+s t1tul+s , r$s*%$"$s
a(ar$$ ba,$s + ba,$sia" s$)*" tr$s 2ui"2u$"i+s +"s$uti3+s.
Perodo
Artculos en PUB!" #$$%&$' #$$(&$$ )%%%&%'
@tulos (,( ,D< D<=
Kesmenes ?%< %%%9 (<8<
%)
#n lo que sigue dentro de este texto de ayuda, han de tenerse en cuenta algunas advertencias4
#n aquellos ejemplos en que el algoritmo transita por tcnicas de simulaci/n,
los resultados, naturalmente, difieren en las aplicaciones sucesivas debido,
precisamente, a que el ordenador simula cada vez datos diferentes3 ello explica
asimismo que si el usuario prueba el programa usando los ejemplos aqu
incluidos, no va a obtener exactamente los mismos resultados que dichos
ejemplos ofrecen
#l nmero de simulaciones que han de hacerse debe ser decidido por el
usuario3 la nica restricci/n que pone #pidat ,% es que no sea inferior a =))3 en
muchos casos no tiene sentido poner m"s de =))) o %)))) porque a partir de
esos valores los resultados pr"cticamente no difieren #n cualquier caso, no
existe un nmero -/ptimo., pues nunca va a afectar negativamente que se
decida un nmero mayor
Aiertas zonas del texto contienen formulaciones complejas, algunas
matem"ticamente avanzadas3 el usuario que no tenga suficiente versaci/n
matem"tica, debe pasar por alto tales segmentos, que se han incluido en
beneficio de quienes deseen acceder a una fundamentaci/n formal de
naturaleza m"s tcnica, ya que no se trata de desarrollos f"ciles de hallar en la
literatura convencional
#l -tono. con que en algunos puntos se exaltan las virtudes del enfoque
bayesiano no equivale a que los autores del programa suscriban enteramente
dicho enfoque, el cual tambin es objeto de algunas valoraciones crticas #s
reflejo de los puntos de vista que tpicamente pueden hallarse en la literatura
correspondiente y se emplea para que el usuario conozca cabalmente dichas
opiniones
#n algunos subm/dulos, los datos pueden entrarse segn dos modalidades
@picamente, la forma escogida es irrelevante 0el resultado ser" el mismo2, pero
a veces pueden producirse peque'as diferencias en dependencia de cu"l se
escoja Gichas diferencias son solo atribuibles a cuestiones de redondeo y no
afectan lo esencial de los resultados
E4PLICACI5N DE LOS SUBM5DULOS
5 continuaci/n se da una explicaci/n de las bases te/ricas de cada uno de los subm/dulos
incluidos en #pidat ,% bajo el rubro de An*lisis bayesiano #n cada caso se dar" una explicaci/n
te/rica y luego se pone un ejemplo @al explicaci/n es m"s extensa en algunos casos que en otros
0por ejemplo el de la estimaci/n de una proporci/n o la diferencia de proporciones2 ya que se
aprovechan para dar explicaciones de valor general *o obstante, las bases te/ricas de los
mtodos hay que buscarlos en las referencias que se dan al final de esta ayuda
%%
1. UNA POBLACIN. ESTIMACIN DE UNA PROPORCIN
#l problema posiblemente m"s simple de la inferencia 0aunque a la vez uno de los que se
presenta con mayor frecuencia2 es estimar el valor desconocido de una proporci/n poblacional
La explicaci/n correspondiente a este sencillo problema, permitir" captar algunas ideas
generales del enfoque bayesiano 0y por ende, v"lidas para los dem"s subm/dulos2 @al
circunstancia determina que este punto ser" bastante m"s extenso que el resto
#l proceso para resolver la tarea mencionada exige en cualquier variante obtener una muestra de
n sujetos de la poblaci/n, en la que se evala una variable dicot/mica Los resultados se dividen
en e -xitos. y f7n;e -fracasos.
!up/ngase entonces que es un porcentaje poblacional desconocido 0por ejemplo, la tasa de
prevalencia de asma en una comunidad2 y que se ha concluido una indagaci/n o encuesta para
recoger informaci/n que permita estimarlo
1.1. S+lui!" +"3$"i+"al
#l procedimiento regular que suele aplicarse es bien conocido4 consiste en realizar una
estimaci/n puntual y luego estimar el grado de error atribuible a dicha estimaci/n y, con esos
datos, construir un intervalo de confianza
!up/ngase que se ha hecho un estudio con una muestra de tama'o n7()), entre cuyos
miembros se detectaron e7%% casos positivos #l procedimiento convencional conduce a
construir un intervalo de confianza para la tasa de asm"ticos 02
Las f/rmulas bien conocidas para los lmites inferior y superior 0% y +, respectivamente2 seran4
n
p p
, p %
2 % 0
(
%
y
n
p p
, p +
2 % 0
(
%
#n este caso,
n7()),
)== , )
())
%%
p
y
D? , %
(
%
,
0suponiendo que se trabaja con el consabido 7),)=2,
de modo que un intervalo de confianza al D=> en este marco convencional vendra delimitado
por los valores4 %7),)(, y +7),)8<
#ste procedimiento permite -confiar. en que el verdadero porcentaje se halla entre (,,> y 8,<>
#sto quiere decir que el intervalo en cuesti/n ha sido obtenido por un mtodo que el D=> de las
veces da lugar a intervalos que contienen al verdadero par"metro3 y de ah dimana la confianza
que se tiene en que esta vez haya ocurrido as *o se tiene derecho, sin embargo, a hablar de la
probabilidad de que el intervalo contenga o no a la tasa desconocida
#l enfoque convencional parte de un supuesto implcito4 no se tiene informaci/n alguna sobre la
tasa que se quiere estimar Gesde luego, dicha tasa no se conoce exactamente #l objetivo es,
justamente, incrementar el conocimiento que se tiene sobre el tema con anticipaci/n3 pero eso no
equivale a que no se posea idea alguna #sa es la distinci/n crucial entre esta soluci/n y la
bayesiana
%(
1.-. S+lui!" ba,$sia"a
La inferencia bayesiana exige tener a priori una opini/n acerca de la proporci/n 0reflejo de
nuestro conocimiento antes de realizar observaci/n alguna23 una vez que sta se ha formulado, se
modifica nuestro conocimiento acerca de , y el mecanismo utilizado para la -actualizaci/n. es el
teorema de $ayes Ge modo que, una vez aplicado el teorema, toda la informaci/n acerca de la
proporci/n desconocida est" contenida en la distribuci/n probabilstica que se obtiene para , la
llamada distribucin a posteriori 5 partir de ella se pueden realizar diferentes tipos de
afirmaciones, como se ilustra de inmediato
Aomo se ha dicho, la soluci/n cl"sica parte de un desconocimiento total sobre el porcentaje de
inters #s razonable suponer, sin embargo, que de antemano se tengan ciertas ideas acerca de
cu"l puede ser ese valor desconocido3 por ejemplo, podra considerarse altamente verosmil que
la tasa de prevalencia de asma en la comunidad 02, no est muy distante de D> Gesde luego, tal
criterio inicial, nacido quiz"s de la experiencia propia y ajena, as como del encuadre te/rico del
problema, se produce en un marco de incertidumbre 5s, tal vez se piensa que <> / %,> son
tambin valores posibles, aunque acaso menos verosmiles que D> Q tambin se pudiera estar
convencidos de que ==> sera sumamente improbable, a la vez que se pudiera estar persuadidos
de que cifras como %> u 8)> seran virtualmente imposibles @ener de antemano puntos de
vista como estos no solo es posible sino casi inevitable para alguien versado en la materia
#n la valoraci/n realizada en el p"rrafo precedente se ha empleado una terminologa
probabilstica informal, tpica en las expresiones cotidianas3 pero bien podra llevarse a un plano
formal y el lenguaje evocativo de las probabilidades 0-sumamente improbable., -altamente
verosmil., -virtualmente imposible., etc2 podra ser convertido en nmeros concretos
Ge modo que el problema que se aborda es el de ganar conocimiento sobre una tasa de
prevalencia3 se sabe que se necesita informaci/n procedente de la realidad como parte del proceso
inferencial, pero se est" a la vez consciente de que se poseen criterios racionales potencialmente
valiosos a los efectos de resolver eficientemente dicho problema #l empleo de estos criterios en
el proceso formal de estimaci/n es posible pero, como se ver", exige transitar por el ejercicio de
traducir esos criterios, en una u otra medida subjetivos, a un marco cuantitativo
1.0. El $"6+2u$ ba,$sia"+ ba7+ su(u$st+s arti6iial%$"t$ si%(li6ia#+s
+ara utilizar el mtodo bayesiano, por tanto, el primer paso consiste en fijar las probabilidades a
priori +0
i
2, por cuyo conducto se resume la informaci/n disponible antes de realizar el
experimento o la observaci/n
!up/ngase que se conforma una distribuci/n a priori a partir de una selecci/n de un conjunto
finito de posibles valores de , a cada uno de los cuales se le asigna una probabilidad 0una
distribuci/n a priori bajo este supuesto se conoce como -discreta.2 #n algunos casos se sabe, o se
sospecha fuertemente, que el valor de debe caer en un intervalo particular3 siendo as, se puede
elegir un conjunto de valores para dentro de este intervalo, o, si se tiene poco conocimiento acerca
de la localizaci/n de la proporci/n, entonces se puede elegir una red de valores igualmente
espaciados entre ) y %
5cptese de momento que hay solo k posibles valores para 4
%
,
(
, ,
P
a los que se han
atribuido respectivas probabilidades que reflejan formal y cuantitativamente nuestros puntos de
%,
vista de partida 0probabilidades a priori2 Ll"mense +0
%
2, +0
(
2, , +0
P
2 a dichas probabilidades,
donde4
k
i
i
P
%
% 2 0
!e debe consignar en este punto que #pidat ,% no aborda la soluci/n del problema bajo este
supuesto de que la distribuci/n de es discreta 5qu se introduce para allanar el proceso de
comprensi/n del enfoque bayesiano, pero el presente softRare encara el problema directamente
en una situaci/n realista, como se explica e ilustra m"s adelante
*/tese que, en la medida que se atribuyen probabilidades a cada uno de los valores posibles, el
par"metro se convierte en una variable aleatoria con cierta distribuci/n explcita #l hecho de que
se hable de que -el par"metro sea una variable aleatoria. constituye una especie de
contrasentido para el estadstico cl"sico !olo la comprensi/n de que se trata de un recurso
artificial por cuyo conducto se expresan nuestras certidumbres e incertidumbres previas puede
conferir sentido a la idea !uperado ese escollo, ya se puede hablar, por ejemplo, del valor
esperado de y computarlo con acuerdo a la f/rmula conocida4
k
i
i i
P E
%
2 0 2 0
N9O
!up/ngase tambin que se ha hecho una experiencia emprica consistente en observar n
individuos, y que e de ellos resultan tener la condici/n de inters
Lo que permite el teorema de $ayes es reconstruir nuestra visi/n inicial con los datos que arroja
dicha informaci/n emprica +or su conducto se establece la probabilidad de que el verdadero
valor de sea igual a
j
!e trata de la llamada probabilidad a posteriori, ya que es la que se obtiene
luego de haber observado los datos
5nteriormente se expres/ el teorema de $ayes a travs de la f/rmula N,O4
k
i
i i
j j
j
P P
P P
P
%
2 0 2 M 0
2 0 2 M 0
2 M 0
!i en dicha f/rmula, los
j
ocupan el lugar de 5
j
y ciertos datos 0en este caso que e de los n
individuos encuestados son asm"ticos2 ocupan el de $, entonces sta adopta la forma siguiente4
k
i
i i
j
j
j
P datos P
P datos P
datos P
%
2 0 2 0
2 0 2 0
2 0
N=O
La probabilidad +0datosM
j
2 es la llamada verosimilitud correspondiente a
j
3 se trata de un
nmero que cuantifica cu"n verosmil es que se hayan obtenido esos datos si la verdadera tasa
fuera
j
!e aplicar" en principio la expresi/n N=O para resolver el problema que se intenta resolver +or
ejemplo, podra postularse que la tasa de asm"ticos pudiera corresponderse con solo uno de los
%9
siguientes k7= porcentajes 0modelos posibles24 =>, <>, D>, %%> y %,> :n investigador podra
considerar que las probabilidades que se deben atribuir respectivamente a las distintas opciones
son las que se recogen en la @abla 9
Tabla .. Distribui!" #$ (r+babili#a# a priori (ara l+s 8 %+#$l+s (+sibl$s.
odelos posibles
(* +* $* ##* #,*
Probabilidades a priori
atribuidas
),%) ),() ),9) ),() ),%)
#l valor esperado de es, de acuerdo con N9O4
#0)70),)=20),%)2S0),)<20),()2S0),)D20),9)2S0),%%20),()2S0),%,20),%)27),)D
*/tese que este juego de probabilidades a priori no solo refleja el punto de vista que se tiene
sobre el valor 0D>2 en torno al cual podra hallarse la tasa desconocida, sino tambin nuestro
grado de certidumbre 0e incertidumbre2 al respecto Auanto mayor sea la dispersi/n de las
probabilidades a priori atribuidas a los valores posibles para , mayores dudas se estaran
reflejando, y viceversa +or ejemplo, si en lugar de las probabilidades consignadas en la @abla 9,
un segundo investigador confiriese una probabilidad m"s baja al valor de D> 0dgase, una
probabilidad de ),,)2 y redistribuyese la probabilidad restante, asignando ),() para los valores de
<> y %%>, y ),%= a los valores de => y %,>, este segundo investigador estara reflejando el mismo
punto de vista en torno al posible valor de pero tambin que el grado de convicci/n sobre esta
posibilidad es mucho menor
#n efecto, en este caso, se seguira teniendo #027),)D, pero se estara comunicando una
convicci/n mucho m"s dbil en el sentido de que sea igual a D> #l segundo investigador
estara expresando un grado de incertidumbre mayor3 0ya que estara otorgando m"s
credibilidad en principio a la posibilidad de que la tasa se aleje de tal valor en una u otra
direcci/n2
!in embargo, los resultados finales del an"lisis pudieran no ser demasiado diferentes #s lo que
suele ocurrir salvo que se trate de visiones dr"sticamente distintas #l examen de las posibles
modificaciones debidas a respectivas visiones a priori es lo que se conoce como -an"lisis de
sensibilidad., y se trata de un paso metodol/gicamente recomendado
Tcasionalmente, por otra parte, el investigador pudiera preferir no anticipar criterio alguno3 en tal
caso, optar" por los llamados -priors no informativos. 0es decir, que elegir" la distribuci/n
uniforme como informaci/n a priori, lo cual equivale en esencia a dejar -que los datos hablen por s
mismos.3 en este ejemplo, equivaldra a atribuir probabilidad ),( a cada una de las = posibilidades2
#l siguiente paso, por tanto, consiste en calcular las verosimilitudes 0likelihoods2 #n general, la
verosimilitud de un modelo poblacional es la probabilidad de que se hayan producido los datos
observados d 0o una funci/n de ellos, por ejemplo, una tasa calculada usando dichos datos2
supuesto que ese modelo es v"lido
5hora bien, la probabilidad de tener estos datos 0en este caso, de que se tengan e xitos en n
intentos independientes2, si la probabilidad de cada intento es igual a , no es otra cosa que el
valor de una densidad binomial con par"metros n y evaluada en e 0e4 ), %, , n24
%=
e n e
e
n
n e P
,
_
2 % 0 2 , 0
N?O
donde
2U 0 U
U
e n e
n
e
n
,
_
!up/ngase ahora que se hace una encuesta sobre ()) sujetos elegidos al azar y que se observa
que %% de ellos son asm"ticos #s decir, en ese caso n7()) y e7%%, lo cual arroja una estimaci/n
puntual de =,=>
Aonsecuentemente, la verosimilitud de cada uno de los modelos posibles depende del valor de
que lo define3 por ejemplo, para el modelo que afirma que la tasa de asm"ticos es ),)= 07),)=2,
sta es4
%%?< , ) D= , ) )= , )
%%
())
%8D %%
,
_
#n la @abla = se muestran todos los c"lculos necesarios para este ejemplo La columna , resulta de
aplicar la expresi/n anterior a cada uno de los modelos 5 continuaci/n se multiplican las
probabilidades a priori por sus correspondientes verosimilitudes, se suman todos estos productos
0),),8%2, y se divide cada producto por dicha suma para obtener las probabilidades posteriores
0quinta columna2 +or ejemplo, para el modelo que establece que la probabilidad es igual a ),)=, al
cual se atribuye una probabilidad a priori de ),% y al que corresponde una verosimilitud de ),%%?<,
se multiplica la probabilidad a priori por la verosimilitud y se divide el resultado ),)%%< por la
suma total de los productos 0),),8%23 el valor que se obtiene, ),,)?, es la probabilidad posterior
de ese modelo
Tabla 8. R$sulta#+s #$ l+s 9lul+s #$l $7$%(l+.
odelo Prior -erosimilitud Prior x -erosimilitud Posterior
),)= ),%) ),%%?< ),)%%< ),,)?
),)< ),() ),)89< ),)%?D ),99=
),)D ),9) ),)((% ),))88 ),(,(
),%% ),() ),)),) ),)))? ),)%?
),%, ),%) ),))), ),)))), ),))%
Suma # %,%,.# #
Gen/tese por +0=>Md2 a la probabilidad de que sea correcto el modelo que afirma que 7),)=
supuestos los datos de que una muestra de tama'o ()) arroj/ una tasa de =,=> 0que se denota
por d2 !egn N=O, la probabilidad a posteriori +0=>Md2 es igual a4
,)? , )
2 % , ) 20 ))), , ) 0 2 ( , ) 20 )),) , ) 0 2 9 , ) 20 )((% , ) 0 2 ( , ) 20 )89< , ) 0 2 % , ) 20 %%?< , ) 0
2 % , ) 20 %%?< , ) 0
2 M )= , ) 0
+ + + +
d P
Aomo se puede apreciar, los datos han dado lugar a una redistribuci/n de las probabilidades
iniciales #l nuevo valor esperado es4
%?
#0-d)70),)=20),,)?2S0),)<20),99=2S0),)D20),(,(2S0),%%20),)%?2S0),%,20),))%27),)?D
que resulta ser ahora muy pr/ximo a <>
+or otra parte, el grado de incertidumbre es considerablemente menor Ge hecho, los modelos
7),%% y 7),%, podran virtualmente ser descartados a la luz de los datos empricos
1... El (as+ a la +"ti"ui#a#
Aolocando ahora las cosas en un marco realista, considrese el caso en que se puede ubicar en
cualquier punto del intervalo 0),%2 5hora las probabilidades a priori no se pueden enumerar,
pues son infinitas #l modo de representarlas es a travs de una funci/n de densidad
correspondiente a una distribuci/n continua Aualquier funci/n de densidad continua definida
en el intervalo 0),%2 puede ser til 0siempre que refleje el punto de vista del investigador2, pero la
m"s usual en el caso en que se estima una proporci/n es la distribucin beta, que depende de dos
par"metros 0aV) y bV)2 Gicha distribuci/n se extiende solo sobre el intervalo 0),%2, de modo que
cumple con la condici/n /ptima para representar nuestra percepci/n acerca de cu"n probables
son unos u otros valores de un par"metro que tambin est" constre'ido a tales lmites La
funci/n de densidad beta y sus propiedades pueden verse en cualquier libro de probabilidades
y, aunque m"s abajo se exploran sus rasgos con cierta extensi/n, procede adelantar que, en
particular, puede corroborarse que su media y su desviaci/n est"ndar son, respectivamente, las
siguientes4
b a
a
+
y
2 % 0 2 0
(
+ + +
b a b a
b a
d. . f . ! P ! P 2 0 2 M 0 2 0
donde f0.2 es la funci/n de densidad de una variable aleatoria / evaluada en ., +0$M.2 es la
probabilidad de $ supuesto que /7., y es el recorrido continuo de valores posibles para /
*o es difcil probar que si la distribuci/n a priori es $eta0a,b2 y los datos siguen una distribuci/n
binomial, para la que se han producido e -xitos. y f -fracasos. entonces la distribuci/n a
posteriori es $eta0aSe,bSf2 !e dice que la distribuci/n beta es conjugada para la binomial
!i, por ejemplo, se tuviera cierta convicci/n a priori de que ),,), teniendo en cuenta las
f/rmulas de la media y la varianza de la distribuci/n $eta, se podra fijar a y b de manera que4
,) , )
+ b a
a
*aturalmente, infinitas parejas cumplen tal condici/n !i se estuviera poco convencido de la
visi/n a priori sobre el valor en torno al cual pudiera hallarse , se podra fijar, por ejemplo, a7, y
b7<3 si se concediera m"s credibilidad al valor medio postulado, una expresi/n paramtrica
acorde con ese menor grado de incertidumbre podra conducir a fijar a7? y b7%9 /, por ejemplo,
a7D y b7(%, o a7((,= y b7=(,=
:i)ura -. :u"i+"$s #$ #$"si#a# B$ta (ara 0 3aria"t$s $" 2u$ la %$#ia $s ';0'.
%8
% %,) %,' %,/ %,. #
Beta0,,+1 Beta0/,#'1 Beta0$,)#1
La &igura ( refleja las tres primeras posibilidades #pidat ,% cuenta con una interfase gr"fica4
cuando el usuario comunica valores para a y b, se produce un gr"fico que le permite valorar si la
forma de la funci/n de densidad es acorde con su visi/n !i quiere enmendar dicha visi/n y
cambiarla por otra que considere m"s adecuada, bastar" cambiar los par"metros y podr"
examinar una nueva curva antes de pasar a dar los datos que habr"n de emplearse para la
-actualizaci/n.
Aomo puede apreciarse, la forma de la funci/n de densidad es muy parecida para las tres curvas
0la media es la misma2, pero las curvas varan en el grado de concentraci/n en torno a esa
media2 Las varianzas de las tres distribuciones son respectivamente4 ),)%D, ),)%) y ),))<
!up/ngase para lo que sigue que se acepta la primera de las tres distribuciones consideradas
0a7, y b7<2
!up/ngase nuevamente que la muestra de tama'o n7()) arroja %% asm"ticos 0e7%% y f7%8D23
siendo as, la densidad a posteriori sera la correspondiente a una distribuci/n beta con
par"metros aSe7%9 y bSf7%D?, que tiene una media de ),)?< y una desviaci/n est"ndar de ),)%<
Aomo se observa, la distribuci/n a posteriori se escora notablemente a la izquierda en relaci/n a
la distribuci/n inicial, que estaba centrada en ,)> y ahora lo est" en ?,<> #ste resultado es
coherente con el hecho de que la tasa observada, =,=>, es marcadamente inferior a tal previsi/n
+or otra parte, la nueva distribuci/n, actualizada con la informaci/n emprica, es apreciablemente
m"s estrecha, lo que resulta de que el tama'o muestral es bastante grande La nueva
distribuci/n pone de manifiesto que los datos corrigen al supuesto inicial y que, si bien ste tiene
cierto peso, la verosimilitud domina #ste es un rasgo tpico del enfoque bayesiano4 cuando el
tama'o muestral es muy grande, la distribuci/n a priori que se elija tienda a ser irrelevante #sa
misma circunstancia, dicho sea de paso, subraya que la m"xima utilidad del bayesianismo se
produce cuando los tama'os muestrales no son muy grandes
Qa en el marco bayesiano, una vez construida la distribuci/n a posteriori, procede sacar
conclusiones por su conducto Lo singular es que, con esa herramienta, tales conclusiones
pueden ser directamente expresadas en trminos de probabilidad, algo imposible, como se ha
dicho, en el marco de la estadstica frecuentista cl"sica +or ejemplo, se puede decir que la
probabilidad de que supere a <> es igual a ),,D3 o que la de que est entre 9> y 8> es igual a
),<= #n efecto, al contar con la distribuci/n del par"metro, se trata en este caso de computar
%D
"reas bajo la funci/n de densidad correspondiente 0resolver ciertas integrales23 es decir, hallar las
"reas bajo la curva de densidad en los intervalos que sean de inters, algo que resulta sencillo
con las posibilidades computacionales actuales y que #pidat ,%, naturalmente, incorpora entre
sus posibilidades
1.8. I"t$r3al+ #$ (r+babili#a#
:n procedimiento de an"lisis de gran inters se relaciona con los llamados intervalos de
probabilidad #llos evocan claramente a los intervalos de confianza cl"sicos, pero tienen un rasgo
distintivo fundamental4 a diferencia de estos ltimos, el intervalo de probabilidad 0tambin
llamado de credibilidad2 es un intervalo dentro del cual se hallara el par"metro con cierta
probabilidad especificada +ara fijar las ideas, imagnese que se quiere identificar un intervalo
que contenga a con probabilidad 0%;2%))> donde )XX% !up/ngase que 7),)= 0como suele
elegirse en la inferencia cl"sica2, de modo que en ese caso la probabilidad con la cual estara el
par"metro dentro del intervalo sera D=>
5hora bien, tpicamente existir"n infinitos intervalos que cumplan esa condici/n EAon cu"l de
ellos operarF 1ay varias maneras de elegirlo, pero el inters se centra b"sicamente en el llamado
intervalo de m*.ima densidad
#l intervalo de m*.ima densidad se define como aquel intervalo 0%,+2 para el cual la funci/n de
densidad f cumple la siguiente condici/n4 f0.2 f0y2 cualquiera sea .0%,+2 y cualquiera sea y
0%,+2 #ste intervalo coincide, salvo situaciones excepcionales, con el intervalo m"s corto de entre
los que cumplen la condici/n de tener bajo la curva un "rea de magnitud 0%;2%))>3 es decir, el
intervalo tal que el valor +;% sea mnimo entre aquellos que cumplen +0%+2 7 %;
#n el ejemplo, los percentiles m"s relevantes de la distribuci/n a posteriori $eta0%9, %D?2 son4
Percentil -alor
(,=> ),),<
=> ),)9)
%)> ),)9=
(=> ),)=9
=)> ),)?=
<=> ),)<8
D)> ),)D)
D=> ),)D8
D<,=> ),%)=
#l intervalo de m"xima densidad hay que hallarlo a travs de programas especializados tales
como #pidat ,% Aomo puede comprobarse, dicho intervalo es N),),= 3 ),%)%O
+or ltimo, rep"rese en la diferencia que existe entre el intervalo de confianza calculado segn
los mtodos tradicionales y el intervalo probabilstico que se obtiene a partir de los mtodos
bayesianos +ara los datos del ejemplo, se tiene un D=> de confianza en que la proporci/n de
asm"ticos de la comunidad se encuentra en el intervalo que tiene como lmite inferior a ),)(, y
superior a ),)8< 0intervalo de confianza tradicional23 mientras que, segn los mtodos
bayesianos, se tiene un D=> de probabilidad de que el intervalo N),),< 3 ),%)=O contenga el valor
del par"metro 0proporci/n de asm"ticos2 Aomo se ve, los intervalos son bastante similares
()
0desde el punto de vista matem"tico, porque la interpretaci/n es diferente como ya se sabe2, lo
cual se debe al tama'o de muestra tan grande que se us/3 en efecto, si el tama'o de muestra es
grande el enfoque bayesiano puede no diferir demasiado del frecuentista, porque la
verosimilitud tiene mayor peso que la informaci/n a priori Lo cierto es que un tama'o de
muestra grande nunca es -malo., si bien podra perderse parte del atractivo del enfoque
bayesiano3 pero cuando no es el caso, que es lo que suele ocurrir, entonces el enfoque bayesiano
s juega un papel cardinal, y ah radica una de sus ventajas con respecto al mtodo frecuentista
!2emplo
Aonsidrese el ejemplo de estimaci/n arriba planteado usando #pidat ,%
+ara definir una distribuci/n $eta0a, b2 a priori con a7, y b7<, se dan estos datos al programa y
se marca +K#!#*@5K !e tendra la curva siguiente4
!i no se tiene ninguna idea acerca del valor que deben tomar los par"metros a y b para que la
distribuci/n beta correspondiente adopte la forma que represente nuestra convicci/n sobre la
proporci/n +, #pidat permite, alternativamente, especificar un valor para la media 0entre ) y %2 y
para la desviaci/n est"ndar 0mayor que )2 de dicha distribuci/n 5 partir de estos datos, el
programa calcula los valores de a y b que definen una distribuci/n beta con la media y desviaci/n
establecidas Aomo estos par"metros tienen que ser mayores que ), la desviaci/n est"ndar no
puede superar un determinado valor, que depende de la media, y que #pidat indica a travs de un
mensaje durante la entrada de datos
5hora se comunican los xitos y fracasos de una experiencia concreta3 xitos7%% y fracasos7%8D,
as como que se quiere un intervalo de probabilidad al D=> y conocer el "rea a la izquierda de
),%( Los resultados son los siguientes4
Kesultados con #pidat ,%4
Anlisis bayesiano. Estimacin de una proporcin
Datos muestrales Nmero
---------------- ------
xitos 11
Fracasos 18
(%
---------------- ------
!otal "##
Distribucin beta A priori A posteriori
------------------------- -------- ------------
$armetro a %&# 1'&#
$armetro b (&# 1)&#
------------------------- -------- ------------
*edia #&%# #&#(
Des+iacin estndar #&1' #&#"
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
#&1"# #&)
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 #&#%(
#�# #&#'1
#&1## #&#')
#&"0# #�'
#&0## #&#)0
#&(0# #&#((
#&## #
#&0# #&#(
#&(0 #&1#'
1nter+alo de mxima densidad .ue acumula el 0
3.1n4erior 3.5uperior
((
---------- ----------
#&#%0 #&1#1
Tbsrvese que en este ejemplo se ha pedido el "rea a la izquierda de ),%( #l resultado fue ),DD?
#sto quiere decir que, a la luz de los datos, y hecha con ellos la actualizaci/n respecto de nuestra
idea original, se puede asegurar que la probabilidad de que la tasa de inters sea superior a %(>
es virtualmente nula 0),9>2, ya que %;),DD?7),))9, el "rea a la derecha, que es el complemento
del que queda a la izquierda #l "rea entre dos puntos, naturalmente, se calcula rest"ndole al
"rea a la izquierda del mayor el "rea a la izquierda del menor
2. UNA POBLACIN. VALORACIN DE HIPTESIS SOBRE UNA
PROPORCIN
-.1. Pr+(+ri!" i)ual a u"a +"sta"t$
!e valora la hip/tesis 14 +7+
)
frente a la hip/tesis J4 ++
)
#l primer dato que ha de entrarse es el valor de +
)
que se quiere valorar Luego hay que dar la
distribuci/n a priori que se supone para el par"metro + Aomo se explic/ en el subm/dulo de
estimaci/n, se operar" con la distribuci/n $eta0a, b2, y los par"metros a y b pueden introducirse
directamente, o bien estimarse a partir de la media y la desviaci/n est"ndar de la distribuci/n
beta #n cualquiera de los dos casos, la media debe ser aproximadamente igual a +
)
, de modo
que debe cumplirse la condici/n4
)
P
b a
a
+
/
)
P media
lo cual es enteramente razonable, ya que si el usuario pensara a priori que la media del
par"metro fuera diferente de +
)
, no tendra sentido para l hacer la prueba de hip/tesis !i no se
verifica esta condici/n, o m"s especficamente no se cumple que4
015 A 0 ? ?
0
<
+
b a
a
p
#pidat ,% muestra un mensaje de error para informar de que los par"metros a y b no son
compatibles con la proporci/n p
)
y se le da opci/n al usuario de volver a introducirlos
Gebe advertirse que los par"metros a y b solo pueden tomar valores mayores que )3 asimismo, la
media debe ser un valor entre ) y % y la desviaci/n est"ndar ser" positiva y acotada
superiormente por un valor del que #pidat ,% informa, para garantizar que los par"metros a y b
calculados no sean negativos
Gefinida la distribuci/n a priori se podr" visualizar su representaci/n gr"fica, por si el usuario
desea cambiar su posicionamiento a priori luego de ver el gr"fico
#l procedimiento exige que se establezca tambin una probabilidad a priori 002 de la validez de
1 #n ese punto hay que comunicar e y f, donde e es el nmero de xitos y f el de fracasos en
n7eSf experiencias
#pidat ,% computa 0vase 5lbert, %DD?2
%(
entonces el &actor de $ayes a favor de 1 0$&24
(,
2 , 0
2 , 0 2 % 0
) )
f b e a !
b a ! P P
!F
f e
+ +
,
donde $0a, b2 es la funci/n $eta evaluada en 0a, b2, la cual se define del modo siguiente4
2 0
2 0 2 0
2 % 0 2 , 0
%
)
% %
b a
b a
du u u b a !
b a
+
, y donde
)
%
2 0 du e u .
u .
Aomputa tambin el factor de $ayes en contra de 1 0$A24
!F
!1
%
,
y la probabilidad a posteriori de la veracidad de 14
2 % 0
2 M 0
0 !F 0
!F 0
datos # P
+
Gebe tenerse en cuenta que si el usuario no quiere -tomar partido. a priori sobre la validez de
1, puede optar por informar que 07),=, lo cual hace que la probabilidad a posteriori solo quede
en funci/n de $&4
%
2 M 0
+
!F
!F
datos # P
Gebe advertirse que en el marco bayesiano, no se trata de -elegir. entre una hip/tesis y otra, de
rechazar o no la hip/tesis nula, sino de identificar en qu medida una es m"s razonable que la
otra3 tanto el $& como la probabilidad a posteriori sirven a ese fin, aunque esta ltima sea m"s
expresiva para la mayor parte de los usuarios !obre esas bases se pueden tomar decisiones
pr"cticas o incluso hacer otros desarrollos o an"lisis 0tales como la optimizaci/n de decisiones
con la incorporaci/n de funciones de utilidad, no incluidos en el presente programa2
!2emplo
!up/ngase que se discute la validez de una hip/tesis que afirma que la tasa de prevalencia de
cierta enfermedad es igual a ),< !e fija entonces +
)
7),<
+ara representar la curva a priori se eligen a7,,= y b7%,= !e otorga una probabilidad bastante
alta a priori de que tal hip/tesis es cierta4 07),8, y se informa que el resultado de un estudio por
muestreo sobre (D sujetos dio lugar a e7%% y f7%8 #ntonces, los resultados que se obtienen del
programa son4
Kesultados con #pidat ,%4
Anlisis bayesiano. 6aloracin de 7iptesis sobre una proporcin
8iptesis9 $roporcin : #&(#
$robabilidad a priori de la +alide- de 89 #&8#
Datos muestrales Nmero
------------------- ------
(9
xitos 11
Fracasos 18
------------------- ------
!otal "
Distribucin beta A priori A posteriori
------------------- -------- ------------
$armetro a %&0 1'&0
$armetro b 1&0 1&0
------------------- -------- ------------
*edia #&(# #&'%
Des+iacin estndar #&1 #
Factor de ;ayes a 4a+or de 8 <;F= 9 #%
Factor de ;ayes en contra de 8 <;>= 9 (8&'"8
$robabilidad a posteriori de la +eracidad de 8 9 #&#'
#sto significa que es <8 veces m"s probable que sea cierta la hip/tesis complementaria a que lo
sea 1 !i se incorpora la probabilidad a priori que se haba dado para este hecho, se obtiene la
probabilidad de que 1 sea cierta3 un nmero sumamente bajo4 7),)9D
-.-. Pr+(+ri!" #$"tr+ #$ u" i"t$r3al+
#n este caso se valora la hip/tesis 14 +N+
%
, +
(
O frente a la hip/tesis complementaria J4 +X+
%
/
+V+
(
%
Yuiere esto decir que la idea inicial que se tena acerca de cu"n probablemente cierta era la
hip/tesis se transforma, y la probabilidad, luego de haber observado los datos, pasa a ser ++
Gebe tenerse en cuenta que si el usuario no quiere -tomar partido. a priori sobre la validez de
1, puede optar por informar que 07),=, lo cual hace que la probabilidad a posteriori solo quede
en funci/n de $&4
% +
!F
!F
PP
lo cual, a su vez, equivale a que ++7+012
!2emplo
!up/ngase que se valora la hip/tesis correspondiente al caso +
%
7),= y +
(
7),8 +ara representar la
curva a priori se eligen a7,,= y b7%,= !e otorga una probabilidad bastante alta a priori de que tal
hip/tesis es cierta 007),82 y se informa que el resultado de un estudio por muestreo sobre (D
sujetos dio lugar a e7%% y f7%8
#ntonces, los resultados que se obtienen del programa son4
$robabilidad de la 7iptesis 8 9 #&1"
Factor de ;ayes a 4a+or de 8 <;F= 9 #&"%8
$robabilidad a posteriori de la +eracidad de 8 9 #&'88
*/tese que aunque la fracci/n de -xitos.0%%Z(D7),,82 es considerablemente inferior al extremo
inferior del intervalo N),=);),8)O, la probabilidad de que el porcentaje poblacional est dentro de
dicho intervalo dista de ser peque'a #llo se debe al alto valor que a priori se atribuye a la
veracidad de 1
)
!e haba organizado un experimento con n pacientes, nZ( de los cuales se eligen aleatoriamente
para ser atendidos con el tratamiento novedoso 0combinaci/n de crema antisptica y ap/sito
hidrocoloide2, en tanto que a los nZ( restantes se les aplicar" el tratamiento convencional 0crema
solamente2
#n el ejemplo interesa ganar conocimiento acerca de dos proporciones4 las tasas +
e
y +
c
de
recuperaci/n en cierto lapso con los tratamientos experimental y convencional respectivamente
Aada una de ellas es un valor que puede coincidir con cualquiera de los infinitos nmeros reales
que se hallan entre ) y % Gesde luego, se ignora cu"les son esos dos valores3 pero ello no quiere
decir que no se sepa absolutamente nada sobre ellos Aomo se ha dicho, el primer paso de este
enfoque exige expresar nuestras ideas iniciales 0a priori2 mediante una distribuci/n de
probabilidades para cada proporci/n Kecurdese que los investigadores consideran de
antemano, sobre bases racionales, te/ricas e incluso empricas, que es muy verosmil que el
tratamiento que combina la crema antisptica con el ap/sito hidrocoloide sea m"s efectivo que el
tratamiento con crema solamente 0de lo contrario no planificaran el ensayo2 #n este caso, el
enfoque bayesiano exige que el investigador consiga expresar en trminos probabilsticos su
conocimiento 0y su ignorancia2 sobre esta proporci/n3 es decir, que declare las zonas del
intervalo 0),%2 en las que resulta virtualmente imposible que se halle el valor, as como el grado
en que considera probable que ste se ubique en otros intervalos de las zonas complementarias
La asignaci/n de las probabilidades a priori, por ejemplo, puede dar cuenta de la convicci/n
anticipada de que +
c
se encuentra casi con seguridad entre ),9 y ),8, con alta probabilidad en una
vecindad de ),?, y que se reduce r"pidamente cuando se aleja de ese punto3 y en cuanto a +
e
, que
se halla en un entorno de ),8, con muy escasa probabilidad de estar fuera del intervalo N),< 3
),DO
(
Gebe comenzarse dando la probabilidad a priori 002 de la validez de 1 Luego hay que definir la
distribuci/n $eta0a
%
, b
%
2 a priori en el supuesto de que valga la hip/tesis 1 #sto, como en los
casos anteriormente explicados, se puede hacer dando directamente los valores de los
par"metros a
%
y b
%
, o especificando la media y la desviaci/n est"ndar de la distribuci/n beta
5simismo hay que definir, del mismo modo, la distribuci/n $eta0a
(
, b
(
2 a priori de la segunda
proporci/n en el supuesto de que *T vale 1 #s decir, expresar nuestra convicci/n acerca del
posible valor de +
(
, supuesto que no coincide con +
%
&inalmente, se informar"n los valores e
%
y
f
%
, donde e
%
es el nmero de xitos y f
%
el de fracasos en n
%
7e
%
Sf
%
experiencias llevadas adelante en
el primer caso, as como e
(
y f
(
, donde e
(
es el nmero de xitos y f
(
el de fracasos en n
(
7e
(
Sf
(
experiencias llevadas adelante en el segundo caso
La salida es el factor de $ayes a favor de 1 0vanse las definiciones de esta noci/n y de los
conceptos afines en la ayuda correspondiente a pruebas de hip/tesis con una sola proporci/n2,
que #pidat ,% calcula usando la siguiente expresi/n4
2 , 0 2 , 0
2 , 0 2 , 0
( ( ( ( % % % %
( ( ( % % ( % %
f b e a ! f b e a !
b a ! f f b e e a !
!F
+ + + +
+ + + +
!2emplo
,(
+ara el ejemplo del ensayo clnico sobre tratamientos a quemados expuesto en secciones
anteriores de esta ayuda, y admitiendo 07),%, se tendra4
a
%
7<( b
%
7%8 a
(
7=< b
(
7,8
e
%
7,) f
%
7%) e
(
7(9 f
(
7%?
Los resultados con #pidat ,% son4
Anlisis bayesiano. 6aloracin de 7iptesis sobre una di4erencia de
proporciones
8iptesis9 1/ualdad de proporciones
$robabilidad a priori de la +alide- de 89 #&1
Datos muestrales $oblacin 1 $oblacin "
---------------- ----------- -----------
xitos %# "'
Fracasos 1# 1)
---------------- ----------- -----------
!otal '# '#
Distribuciones beta a priori $oblacin 1 $oblacin "
---------------------------- ----------- -----------
$armetro a ("&# 0(&#
$armetro b 18&# %8&#
---------------------------- ----------- -----------
*edia #&8# #&)#
Des+iacin estndar #&#' #�
Factor de ;ayes a 4a+or de 8 <;F= 9 #&#()
Factor de ;ayes en contra de 8 <;>= 9 1%&"1#
$robabilidad a posteriori de la +eracidad de 8 9 #&##8
Los resultados son claros4 la hip/tesis de nulidad tiene un respaldo muy bajo si se compara con
la que afirma que los tratamientos difieren Luego de haber observado los datos y teniendo en
cuenta el conocimiento previo, la probabilidad de que los procedimientos teraputicos puedan
considerase equivalentes es de 8 entre %)))
..-. Di6$r$"ia #$ (r+(+ri+"$s #$"tr+ #$ u" i"t$r3al+
!e valora la hip/tesis 14 +
%
;+
(
N+
,
, +
9
O contra la hip/tesis complementaria4
J4 +
%
;+
(
X+
,
/ +
%
;+
(
V+
9
!2emplo
+ara el ejemplo del ensayo clnico sobre tratamientos a quemados expuesto en secciones
anteriores de esta ayuda, y admitiendo 07),,3 n7%))))3 +
,
7),() y +
9
7),,= con los datos ya
conocidos4
a
%
7<( b
%
7%8 a
(
7=< b
(
7,8
e
%
7,) f
%
7%) e
(
7(9 f
(
7%?
los resultados con #pidat ,% son4
Anlisis bayesiano. 6aloracin de 7iptesis sobre una di4erencia de
proporciones
8iptesis9 Di4erencia de proporciones @#&"# & #&%0A
$robabilidad a priori de la +alide- de 89 #&%#
Datos muestrales $oblacin 1 $oblacin "
---------------- ----------- -----------
xitos %# "'
Fracasos 1# 1)
---------------- ----------- -----------
!otal '# '#
Distribuciones beta a priori $oblacin 1 $oblacin "
---------------------------- ----------- -----------
$armetro a ("&# 0(&#
$armetro b 18&# %8&#
---------------------------- ----------- -----------
,9
*edia #&8# #&)#
Des+iacin estndar #&#' #�
Distribucin emp?rica a posteriori de las di4erencias
Nmero de simulaciones9 1####
$robabilidad de la 7iptesis 89 #&'1"
Factor de ;ayes a 4a+or de 8 <;F=9 #&(#1
$robabilidad a posteriori de la +eracidad de 89 #&"%1
5. UNA POBLACIN. ESTIMACIN DE UNA MEDIA
@areas muy frecuentes en el mundo investigativo biomdico est"n relacionadas con datos
correspondientes a variables continuas, para los cuales no es v"lida la divisi/n en -xitos. y
-fracasos. Aomo las distribuciones poblacionales generalmente tienen la forma de la funci/n de
densidad normal, para estimar una media suele suponerse que los datos poblacionales siguen
tal distribuci/n con una media & y una desviaci/n est"ndar +
+ara ilustrar el procedimiento bayesiano orientado a conocer acerca de la media poblacional,
considrese el siguiente ejemplo !up/ngase que se realiza un estudio en una escuela primaria
enclavada en un barrio marginal con el fin de examinar la situaci/n en materia estomatol/gica3
b"sicamente, se quiere conocer el promedio de caries por ni'o +uesto que el estomat/logo ha
estudiado profundamente la enfermedad, y tiene conocimientos y experiencias anteriores
obtenidas de su trabajo en esa escuela con los ni'os, est" persuadido, por poner un ejemplo
burdo, de que el promedio de caries es, casi con seguridad, mayor que ),=
!up/ngase que se le realiz/ el examen bucal a ,) ni'os, y que los resultados arrojan que el
promedio de caries fue de ,,= y la desviaci/n est"ndar de %,=
La soluci/n convencional acude a la obtenci/n de un intervalo de confianza La tcnica
estadstica para el caso de una media utiliza un estadstico que sigue una distribuci/n t de
!tudent 5l aplicarla se obtiene que, para un nivel de confianza del D=>, el intervalo es
N(,D9 3 9,)?O
[eamos la soluci/n bayesiana #n esta situaci/n no es razonable asumir priors uniformes, pues,
como se haba dicho, la enfermedad se conoce suficientemente como para establecer valores a
priori de su frecuencia Ge modo que el investigador puede asumir, por ejemplo, que el
promedio de caries se encuentra alrededor de ,, pero no resultara muy sorprendente si fuera %
,=
/ = !up/ngase que se decide a priori que el promedio de caries es , 0m
)
7,2 y la desviaci/n
est"ndar %,=? 0s
)
7%,=?2 $erry
%,
proporciona un mtodo para calcular la desviaci/n est"ndar
!up/ngase que se tiene un %)> de probabilidad a priori de que la media es mayor que = Ge
acuerdo con la tabla de la distribuci/n normal est"ndar, el valor de z que tiene un %)> de
probabilidad a su derecha es %,(8 Ge modo que, suponiendo que nuestra percepci/n a priori es
que la media muestral sigue una distribuci/n normal, se tiene4
(8 , %
, =
s
z y, despejando, se obtiene4
=? , %
(8 , %
(
s
5 continuaci/n, solo resta conjugar este supuesto con los resultados que arroj/ el examen bucal
en una muestra 0informaci/n emprica2 y de ese modo obtener una distribuci/n normal
actualizada Kecurdese que se examinaron ,) ni'os 0n7,)2, y que el promedio de caries fue de
,,= 0 = , , . 2 y la desviaci/n est"ndar de %,= 0s7%,=2
Auando la distribuci/n a priori es normal, como ocurre en este caso, se calculan4
(
)
)
%
s
c
3
(
()
(
2 % 0
(
n
s
n
c
+
3
c c c +
) %
/ /
s
y
( ) % )
s / m
donde = >
1
i i
P
y
c c c +
) %
,
donde4
)
)
c
, si la distribuci/n a priori es la uniforme,
(
)
)
%
s
c
si la distribuci/n a priori es normal
Las salidas que ofrece #pidat ,% son4
\edia de la distribuci/n a posteriori4
1
0 0
c
x c m c
m
p
+
X X
!2emplo
,<
!i se usa la distribuci/n uniforme y se informan los datos siguientes4
.
7%<?3 s7,,%? y n7%), as
como que se quiere conocer la probabilidad de que el valor de la variable sea menor que %<<,
entonces el resultado es el siguiente4
Anlisis bayesiano. Estimacin de una media
Datos muestrales 6alor
------------------- ------
*edia 1()&##
Des+iacin estndar %&1)
!amaBo de muestra 1#
Distribucin a priori9 Cni4orme
Distribucin normal a posteriori 6alor
-------------------------------- -------
*edia 1()&##
Des+iacin estndar 1&"#
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
1((&### #&(8
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 1(%&)0#
#�# 1('&#"8
#&1## 1('&')%
#&"0# 1(0&11
#&0## 1()&###
#&(0# 1()&8#
#&## 1((&0%(
#&0# 1((&("
#&(0 1(8&%0#
1nter+alo de probabilidad <02=
3.1n4erior 3.5uperior
---------- ----------
1(%&)0# 1(8&%0#
!i se elige la distribuci/n a priori normal con m
)
y s
)
conocidas y se informa que m
)
7%<93 s
)
79,?D3
.
7%<?3 s7,,%? y n7%), as como que se quiere conocer la probabilidad de que el valor de la
variable sea menor que %<<, se obtiene4
Anlisis bayesiano. Estimacin de una media
Datos muestrales 6alor
,8
------------------- ------
*edia 1()&##
Des+iacin estndar %&1)
!amaBo de muestra 1#
Distribucin a priori9 Normal
Distribucin normal A priori A posteriori
------------------- -------- ------------
*edia 1('&## 1(0&88
Des+iacin estndar '&) 1&1)
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
1((&### #&8%%
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 1(%&)##
#�# 1(%&))
#&1## 1('&%88
#&"0# 1(0&#'
#&0## 1(0&8((
#&(0# 1()&))1
#&## 1((&%))
#&0# 1((&(88
#&(0 1(8&10'
1nter+alo de probabilidad <02=
3.1n4erior 3.5uperior
---------- ----------
1(%&)## 1(8&10'
Tbsrvese la notable consistencia entre los resultados, independientemente de que se fije una
distribuci/n a priori normal o uniforme #sto no tiene porqu ocurrir siempre, pero cuando s
pasa, como ahora, ello ofrece especial respaldo a las conclusiones
&inalmente, si se elige una distribuci/n a priori normal pero a partir de los puntos /
%
y /
(
, y las
probabilidades asociadas +
%
y +
(
,y si se comunicaran los valores para /
%
7%<93 +
%
7),=3 /
(
7%8)3
+
(
7),D3 x 7%<?3 s7,,%? y n7%), as como que se quiere conocer la probabilidad de que el valor de
la variable sea menor que %<< se obtiene4
Anlisis bayesiano. Estimacin de una media
Datos muestrales 6alor
------------------- ------
*edia 1()&##
Des+iacin estndar %&1)
!amaBo de muestra 1#
Distribucin a priori9 Normal
$armetros de entrada 6alor 1 6alor "
--------------------- ------- -------
,D
$unto 1('&## 18#&##
$robabilidad #&0# #&#
Distribucin normal A priori A posteriori
------------------- -------- ------------
*edia 1('&## 1(0&88
Des+iacin estndar '&)8 1&1)
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
1((&### #&8%%
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 1(%&)##
#�# 1(%&))
#&1## 1('&%88
#&"0# 1(0&#%
#&0## 1(0&8((
#&(0# 1()&))#
#&## 1((&%))
#&0# 1((&(88
#&(0 1(8&10'
1nter+alo de probabilidad <02=
3.1n4erior 3.5uperior
---------- ----------
1(%&)## 1(8&10'
Los resultados son los mismos que en el caso anterior porque la informaci/n que se haba dado
antes para m
2
y s
2
es equivalente a la que se ha dado ahora para X
%
,X
(
,+
%
y +
(
0los dos primeros se
deducen de estos 9 y viceversa2
. UNA POBLACIN. VALORACIN DE HIPTESIS SOBRE UNA MEDIA
<.1. M$#ia i)ual a u"a +"sta"t$
!e trata de valorar la hip/tesis 14 m 7 m
)
frente a la hip/tesis J4 m m
)
,
_
,
_
+
1
]
1
2
2
2
0
2
1
2
2
2
0 2
2
'C/
2
'C/
t
n
m x
t
n
m x
n n
BF
,
el factor de $ayes en contra de 14
!F
!1
%
,
y la probabilidad a posteriori de la veracidad de 14
2 % 0
2 M 0
0 !F 0
!F 0
datos # P
+
!2emplo
!up/ngase que las entradas son4 m
)
7%<)3 7,3 07),=3 t7),=3 . 7%<? y n7%)
#ntonces, los resultados que se obtienen son4
Anlisis bayesiano. 6aloracin de 7iptesis sobre una media
8iptesis 9 *edia : 1(#&##
$robabilidad a priori de la +alide- de 89 #&0#
Des+iacin estndar 6alor
------------------- ------
$oblacional %&##
A priori #&0#
Datos muestrales 6alor
------------------- ------
*edia 1()&##
!amaBo de muestra 1#
Factor de ;ayes a 4a+or de 8 <;F=9 #

Factor de ;ayes en contra de 8 <;>=9 )8&%%
$robabilidad a posteriori de la +eracidad de 89 #'
9%
<.-. M$#ia #$"tr+ #$ u" i"t$r3al+
!e valora la hip/tesis 14 mNm
%
, m
(
O frente a la hip/tesis J4 mXm
%
/ mVm
(
#ste procedimiento asume distribuci/n a priori uniforme 0es decir, priors no informativos2 Las
entradas son los valores de m
%
y m
(
, la probabilidad a priori 002 de la validez de 1 y, finalmente,
los resultados empricos4 media, desviaci/n est"ndar y tama'o muestrales4
.
, s y n
#pidat ,% procede como cuando se trataba de estimar una media para el caso uniforme3 en ese
caso, la distribuci/n a posteriori ser" normal con media m
p
y desviaci/n est"ndar s
p
!2emplo
!up/ngase que las entradas son4 m
%
7%<)3 m
(
7%<83 07),83
.
7%<?3 s7, y n7%)
#ntonces se obtiene4
Anlisis bayesiano. 6aloracin de 7iptesis sobre una media
8iptesis 9 *edia dentro de un inter+alo @1(#&## & 1(8&##A
$robabilidad a priori de la +alide- de 89 #&8#
Datos muestrales 6alor
------------------- ------
*edia 1()&##
Des+iacin estndar %&##
!amaBo de muestra 1#
$robabilidad de la 7iptesis 89 #&)1
Factor de ;ayes a 4a+or de 8 <;F=9 "'&%%%
$robabilidad a posteriori de la +eracidad de 89 #&#
9(
!. DOS POBLACIONES. ESTIMACIN DE UNA DIFERENCIA DE MEDIAS.
M"TODO E#ACTO
#l enfoque convencional para el an"lisis de la diferencia de dos medias, como se sabe, transita
por la formulaci/n de una hip/tesis nula, elegir el nivel de significaci/n , utilizar los datos para
calcular el valor del estadstico, para el cual se utiliza la diferencia de las medias de los dos
grupos 0d7m
%
;m
(
2 y el hecho de que ella sigue una distribuci/n t de !tudent, determinar el valor
p asociado a ese estadstico y, por ltimo, rechazar o no la hip/tesis nula en dependencia del
valor de p !e ha sugerido fuertemente, sin embargo, el empleo de intervalos de confianza para
estimar la diferencia
!up/ngase que se realiza un estudio para evaluar los cambios en la glicemia en pacientes
diabticos controlados y en pacientes sanos !e estudian () pacientes diabticos controlados y 8
libres de esa enfermedad La informaci/n recogida arroja los siguientes datos4
<8 , ?
%
. 3
%% , %
(
%
s
3
()
%
n
8) , ?
(
. 3 =D , )
(
(
s 3
8
(
n
#l intervalo de confianza al 0%;2%))> se obtiene del modo siguiente4
2 0 2 ( 0
( %
(
%
d se n n t d 3im%nf +
2 0 2 ( 0
( %
(
%
d se n n t d 3im+up + +
donde,
( %
. . d ,
( %
% %
2 0
n n
s d se +
,
(
2 % 0 2 % 0
( %
(
( (
(
% %
+
+
n n
s n s n
s ,
2 ( 0
( %
(
%
+
n n t
es el percentil > %)) 2
(
% 0
de la distribuci/n t de !tudent con n
%
Sn
(
;(
grados de libertad
#ste es el procedimiento -usual. que se emplea en el marco frecuentista est"ndar, tal y como se
hace en el m/dulo de inferencia de #pidat ,%
#s f"cil corroborar que, con los datos del ejemplo, se tiene4 d7;),)(3 s7),D8=3 se0d27),9%( y
t
),D<=
0(?27(,)?, de modo que el intervalo de confianza al D=> es N;),8?< 3 ),8(<O
$ajo el enfoque bayesiano, cuando interesa conocer acerca de la diferencia de dos medias, en
#pidat ,% se parte del supuesto de que las medias son independientes y que los datos son
recogidos a partir de dos muestras independientes
#n este caso, hay cuatro par"metros desconocidos4 las medias &
%
y &
(
y las desviaciones
est"ndares +
%
y +
(
de las dos poblaciones Gado que, en general, es difcil establecer una
distribuci/n conjunta para cuatro par"metros, se asume que los par"metros tienen una
distribuci/n a priori no informativa est"ndar proporcional a %Z0+
%
+
(
2 0Nota4 este planteamiento
9,
exhibe dificultades mayores que lo tpico en el presente texto3 por su complejidad, para conocer
m"s detalles, vase 5lbert
%(
2 #ntonces, las medias &
%
y &
(
tienen distribuciones t de !tudent
independientes La distribuci/n a posteriori de la diferencia entre las medias &
(
W&
%
tiene una
forma funcional no est"ndar, por lo que se acude a la simulaci/n Aoncretamente4 se simulan
muestras independientes de un tama'o fijo acordes con las distribuciones posteriores
marginales de &
%
y &
(
, despus se emparejan las observaciones de las dos muestras simuladas y
se toman las diferencias3 entonces se obtienen los valores simulados de la distribuci/n posterior
de la diferencia de medias
#l proceso detallado es como sigue4
!e computan4
(
% %
(
%
s n + y
(
( (
(
(
s n +
!e generan4
n valores y
%%
, y
%(
, , y
%n
con distribuci/n
(
con n
%
;% grados de libertad,
n valores y
(%
, y
((
, , y
(n
con distribuci/n
(
con n
(
;% grados de libertad
!e obtienen dos juegos de n realizaciones z
%%
, z
%(
, , z
%n
y z
(%
, z
((
, , z
(n
con distribuci/n
normal est"ndar
+ara cada i entre % y n se calculan4
%
( %
(
%
(
%
%
.
n y
z +
m
i
i
i
+
y
(
( (
(
(
(
(
(
.
n y
z +
m
i
i
i
+
&inalmente, se obtienen las n diferencias4
i i i
m m d
( %
D
!2emplo
5plicado este procedimiento con n7%)))) simulaciones, y dando los datos arriba expuestos4
<8 , ?
%
. 3
%% , %
(
%
s
0s
%
7%,)=2 y
()
%
n
8) , ?
(
. 3 =D , )
(
(
s 0s
(
7),<<2 y
8
(
n
se obtuvo4
Anlisis bayesiano. Estimacin de una di4erencia de medias por mDtodo exacto
Datos muestrales $oblacin 1 $oblacin "
------------------- ----------- -----------
*edia )&(8 )&8#
Des+iacin estndar 1� #&((
!amaBo de muestra "# 8
Distribucin emp?rica a posteriori de las di4erencias
Nmero de simulaciones9 1####
99
*edia
--------
-#"
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 -#&)'
#�# -#&00#
#&1## -#&'1'
#&"0# -#&""%
#&0## -#�)
#&(0# #'
#&## #&""8
#&0# #&%"0
#&(0 #&'#)
[ale destacar que este valor tan peque'o 0W),)8(2 de la diferencia media entre pacientes
diabticos controlados y libres de la enfermedad no es sorprendente3 obsrvese que el valor
medio de la glicemia es muy parecido en ambos grupos
5 partir de esta distribuci/n emprica pueden hacerse estimaciones 0no paramtricas2 de inters,
tales como la mediana 0;),)=?2
$. DOS POBLACIONES. ESTIMACIN DE UNA DIFERENCIA DE MEDIAS.
M"TODO APRO#IMADO
#n este caso #pidat ,% procede exactamente como en el caso de la estimaci/n de una media, solo
que dos veces en lugar de una4 una para cada poblaci/n !i se responde que la distribuci/n a
priori es la normal, se le har" otra pregunta4 Eva a dar directamente los par"metros 0media y
desviaci/n est"ndar a priori para cada poblaci/n4 m
)%
, m
)(
, s
)%
y s
)(
2 o desea calcularlos a partir de
dos valores de /, y respectivas probabilidades 0"reas a la izquierda de esos puntos2F
#n el primer caso, han de teclearse m
)%
, m
)(
, s
)%
y s
)(
#n el segundo, deben pedrsele los dos
valores /
%
y /
(
para cada poblaci/n, y las probabilidades asociadas +
%
y +
(
Aon esos datos, se
calculan, tal y como se explic/ en el caso de una sola media, m
p%
, s
p%
primero y m
p(
, s
p(
despus
Aomo la distribuci/n a posteriori de cada media es normal, y stas se suponen independientes,
la distribuci/n a posteriori de la diferencia tambin ser" normal
9=
&inalmente, se pide media, desviaci/n est"ndar y tama'o muestrales para cada poblaci/n4
%
. , s
%,
n
%
y
(
. , s
(,
n
(
(
%
(
3
/ /
!2emplo
#l siguiente ejemplo comienza con el caso en que se comunica que ha de emplearse la
distribuci/n uniforme #n tal caso, no hay que dar otra informaci/n adicional fuera de la que
procede de la muestra !up/ngase que las entradas son4
% , <
%
. s
%
7%,%( n
%
7(%
8) , ?
(
. s
(
7),?, n
(
78
as como que se quiere el "rea a la izquierda de ) y de %,(
Las salidas que se obtienen son4
Anlisis bayesiano. Estimacin de una di4erencia de medias por mDtodo
aproximado
Datos muestrales $oblacin 1 $oblacin "
------------------- ----------- -----------
*edia (&1# )&8#
Des+iacin estndar 1&1" #&)%
!amaBo de muestra "1 8
Distribucin a priori9 Cni4orme
9?
Distribucin a posteriori 6alor
------------------------- -----
*edia #&%##
Des+iacin estndar #&%88
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
#&### #&""#
1&"## #&#
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 -#&')1
#�# -#&%%
#&1## -#&18
#&"0# #&#%8
#&0## #&%##
#&(0# #&0)"
#&## #&(8
#&0# #&%
#&(0 1&#)1
1nter+alo de probabilidad del 02
3.1n4erior 3.5uperior
---------- ----------
-#&')1 1&#)1
#n el caso en que se comunica que ha de emplearse la distribuci/n normal con medias y
varianzas conocidas, hay que especificar estos datos !up/ngase que las entradas son4
m
)%
7<,< s
)%
7),< m
)(
7<,< s
)(
7),<
% , <
%
. s
%
7%,%( n
%
7(%
8) , ?
(
. s
(
7),?, n
(
78
y que se quiere el "rea a la izquierda de ) y de %,(
9<
Los resultados son4
Anlisis bayesiano. Estimacin de una di4erencia de medias por mDtodo
aproximado
Datos muestrales $oblacin 1 $oblacin "
------------------- ----------- -----------
*edia (&1# )&8#
Des+iacin estndar 1&1" #&)%
!amaBo de muestra "1 8
Distribucin a priori9 Normal
Distribucin normal a priori $oblacin 1 $oblacin "
---------------------------- ----------- -----------
*edia (&(# (&(#
Des+iacin estndar #&(# #&(#
Distribucin a posteriori 6alor
------------------------- -----
*edia #&"%(
Des+iacin estndar #&%)1
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
#&### #&"0)
1&"## #&)
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
#&### #&"0)
98
1&"## #&)
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 -#&'(1
#�# -#&%0(
#&1## -#&"")
#&"0# -#&##(
#&0## #&"%(
#&(0# #&'8#
#&## #&(##
#&0# #&8%1
#&(0 #&'0
1nter+alo de probabilidad del 02
3.1n4erior 3.5uperior
---------- ----------
-#&'(1 #&'0
&inalmente, en el caso en que se comunica que ha de emplearse la distribuci/n normal pero a
partir de los puntos /
%%
, /
%(
, /
(%
y /
((
y las probabilidades asociadas +
%%
, +
%(
, +
(%
y +
((
, sup/ngase
que las entradas son4
/
%%
7) /
%(
7%,9( /
(%
7) /
((
7%,=(
+
%%
7),= +
%(
7),8 +
(%
7),= +
((
7),8
% , <
%
. s
%
7%,%( n
%
7(%
8) , ?
(
. s
(
7),?, n
(
78
y que se quiere el "rea a la izquierda de ) y de %,(
!e obtiene lo siguiente4
Anlisis bayesiano. Estimacin de una di4erencia de medias por mDtodo
aproximado
Datos muestrales $oblacin 1 $oblacin "
------------------- ----------- -----------
*edia (&1# )&8#
Des+iacin estndar 1&1" #&)%
!amaBo de muestra "1 8
Distribucin a priori9 Normal
$oblacin 1 $oblacin "
$armetros de entrada 6alor 1 6alor " 6alor 1 6alor "
--------------------- ---------- ---------- ---------- ----------
$unto #&## 1&'" #&## 1&0"
9D
$robabilidad #&0# #&8# #&0# #&8#
Distribucin normal a priori $oblacin 1 $oblacin "
---------------------------- ----------- -----------
*edia #&## #&##
Des+iacin estndar 1&) 1&81
Distribucin a posteriori 6alor
------------------------- -----
*edia #&%1'
Des+iacin estndar #&%8'
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
#&### #&"#)
1&"## #&#
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 -#&'%(
#�# -#&%1)
#&1## -#&1((
#&"0# #�)
#&0## #&%1'
#&(0# #&0(%
#&## #&8#)
#&0# #&'0
#&(0 1&#))
1nter+alo de probabilidad del 02
3.1n4erior 3.5uperior
---------- ----------
-#&'%( 1&#))
=)
%. DOS POBLACIONES. VALORACIN DE HIPTESIS SOBRE UNA
DIFERENCIA DE MEDIAS
!e considera la diferencia 4 entre dos medias y se valora la hip/tesis 14 4Nd
%
, d
(
O frente a la
hip/tesis J4 4Xd
%
/ 4Vd
(
#pidat ,% asume distribuci/n a priori uniforme
Los datos de entrada de este subm/dulo son4
\edia, desviaci/n est"ndar y tama'o muestrales en el grupo %4
% . , s
%
y n
%
\edia, desviaci/n est"ndar y tama'o muestrales en el grupo (4
( . , s
(
y n
(
*mero de simulaciones4 n
0Aon estos datos se procede como se hizo en el caso de la estimaci/n de la diferencia de dos
medias, mtodo exacto2
[alores de los extremos involucrados en la hip/tesis4 d
%
y d
(
+robabilidad a priori de la validez de 14 0
Aon esta informaci/n, #pidat ,% produce las salidas siguientes4
+robabilidad de la hip/tesis, +0124 se computa la estimaci/n no paramtrica de esta
probabilidad a partir de la distribuci/n emprica de las diferencias entre las dos medias
&actor de $ayes a favor de 14
2 0
2 0
" P
# P
!F
!2emplo
!up/ngase que se dan los siguientes datos de entrada4
?8
%
. s
%
78 n
%
7=)
?=
(
. s
(
7< n
(
78)
d
%
7( d
(
79 07),?
*mero de simulaciones4 n7%))))
Los resultados que arroja #pidat ,% son4
Anlisis bayesiano. 6aloracin de 7iptesis sobre una di4erencia de medias
8iptesis 9 Di4erencia de medias en un inter+alo @ "&## & '&##A
$robabilidad a priori de la +alide- de 89 #&)##
Datos muestrales $oblacin 1 $oblacin "
------------------- ----------- -----------
*edia )8&## )0&##
Des+iacin estndar 8&## (&##
!amaBo de muestra 0# 8#
=%
Distribucin emp?rica a posteriori de las di4erencias
Nmero de simulaciones9 1####
$robabilidad de la 7iptesis 89 #&(0(
Factor de ;ayes a 4a+or de 8 <;F=9 %&11'
$robabilidad a posteriori de la +eracidad de 89 #&8"'
1&. TABLAS DE CONTIN'ENCIA. VALORACIN DE HIPTESIS DE
INDEPENDENCIA
La exploraci/n de la relaci/n entre mediciones categ/ricas es un problema b"sico de la
inferencia +ara ilustrar esta situaci/n considrese el siguiente ejemplo !up/ngase que se realiza
un estudio para evaluar la relaci/n entre el h"bito de fumar de la madre y el peso al nacer de sus
hijos Los resultados se recogen en una tabla de contingencia de (x, 0@abla ?2
Tabla <. Distribui!" #$ l+s "i=+s s$)*" ($s+ , $#a# #$ la %a#r$.
3bito de 4umar de la madre
Peso del ni5o Nunca
Antes del
embara6o
7ontinu8
4umando
Total
*ormopeso %( ?D 9 8=
$ajo peso %) (9 ? 9)
@otal (( D, %) %(=
!egn los mtodos frecuentistas, para evaluar la posible relaci/n entre el h"bito de fumar de la
madre y el peso del ni'o al nacer 0valorado en este caso dicot/micamente2, se valora la hip/tesis
de independencia, la cual afirma que los niveles de peso de los ni'os son los mismos para los
tres grupos considerados en materia de h"bito de fumar de la madre #l enfoque comnmente
usado comienza por ajustar el modelo de independencia a la tabla y calcula los valores
-esperados. bajo este modelo para todas las celdas de la tabla #ntonces, se aplica una prueba
estadstica, la cual mide cu"n alejados est"n los valores esperados de los observados
=(
La prueba estadstica convencionalmente usada es la Bi;cuadrado de +earson, y se rechaza la
hip/tesis de independencia si el valor del estadstico es suficientemente grande @picamente, se
juzga el tama'o del valor del estadstico a travs del valor p, probabilidad 0bajo la hip/tesis de
independencia2 de observar un valor del Bi;cuadrado con 0K;%2x0A;%2 grados de libertad al
menos tan grande como el que se obtuvo, donde K es el nmero de filas de la tabla y A el de
columnas !i el valor de p es suficientemente peque'o, se rechaza la hip/tesis de independencia
+ara estos datos, el valor del estadstico, que sigue una distribuci/n Bi;cuadrado con ( grados de
libertad, es <,)<, al cual se le asocia un valor de p igual a ),), Gado que este valor es menor que
),)=, desde el punto de vista frecuentista se considera como una evidencia significativa de que el
h"bito de fumar de la madre y el peso al nacer no son independientes
La prueba bayesiana de independencia maneja dos hip/tesis, la hip/tesis 1
%
que afirma que las
dos variables son independientes, y la hip/tesis complementaria, que plantea que las dos
variables son dependientes o est"n de alguna manera relacionadas $ajo el enfoque bayesiano, se
valora el apoyo relativo que dan los datos a cada una de estas dos hip/tesis en trminos del
factor de $ayes, el cual compara las probabilidades de los datos observados bajo las hip/tesis4
2 M 0
2 M 0
) )
) )
# d 4 P
# d 4 P
F!
*aturalmente, mientras 1
)
es una afirmaci/n concreta , la falsedad de 1
)
puede asumir infinitas
expresiones puntuales !in embargo, en condiciones bastante generales, se pueden hallar cotas
inferiores para !F 5s, para el caso en que se valora una asociaci/n a travs de la prueba Bi;
cuadrado, se tiene una cota inferior para el factor de $ayes
%D
en funci/n del valor observado
(
4
F!
,
_
(
%
exp
(
(
,
_
!2emplo
!i la tabla de contingencia fuera la que se expuso al comienzo de esta secci/n, los datos iniciales
de entrada seran4
%( ?D 9
%) (9 ?
!up/ngase que se anticipa el valor 07),D #ntonces los resultados son4
=,
Anlisis bayesiano. !ablas de contin/encia
NE de 4ilas9 "
NE de >olumnas9 %
Frecuencias
1 " % !otales
------- ------- ------- ------- -------
1 1" ) ' 80
" 1# "' ) '#
------- ------- ------- ------- -------
!otales "" % 1# 1'
$rueba con+encional
Fi-cuadrado/l 6alor p
------------- -------
(&#(% " #&#"
6aloracin bayesiana
$robabilidad a priori de la +alide- de 89 #&
$robabilidad a posteriori de la +eracidad de 89
6alor m?nimo
.#&0%'(
11. VALORACIN BA(ESIANA DE PRUEBAS CONVENCIONALES
5unque el aporte de Konald &isher y el que diez a'os m"s tarde realizaron Berzy *eyman y
#gon +earson eran en buena medida conceptualmente contradictorios entre s3 en la actualidad
lo que se aplica es una especie de hbrido que toma del primero el valor p y del segundo la
noci/n de que la tarea consiste en valorar si procede o no rechazar una hip/tesis
Aoncretamente, lo que se hace es planificar una experiencia que permita observar cierta
diferencia 4 !e obtiene que 47d
)
y se calcula la probabilidad de haber obtenido dicha diferencia
u otra mayor, supuesto que es v"lida la hip/tesis nula 01
)
2, que afirma que no existe diferencia
alguna entre las poblaciones bajo estudio #sta probabilidad, p7+04d
)
M1
)
2, se emplea como
base para la decisi/n !i p es peque'a 0tpicamente, si es menor que ),)=2, entonces se rechaza 1
)
3
de lo contrario, no se rechaza
5hora bien, el problema radica en que lo que realmente interesa al investigador no es valorar la
probabilidad de obtener ciertos datos supuesta la veracidad de 1
)
sino lo contrario4 la
probabilidad +01
)
M47d
)
2 de que sea v"lida 1
)
supuesto que se observaron los datos que dan
lugar a d
)
Las probabilidades p7+04d
)
M1
)
2 y +01
)
M47d
)
2, lamentablemente, pueden ser muy
diferentes Q m"s lamentablemente an, muchos investigadores 0quiz"s la mayora2 no son
capaces de distinguir una de otra
\attheRs
%9
sostiene, e ilustra mediante varios ejemplos tomados de la literatura, que los valores
p exageran la significaci/n real de los datos obtenidos, lo que no pocas veces ha conducido a la
=9
aprobaci/n de conductas teraputicas que poco tiempo despus han sido fatalmente
desacreditadas3 la raz/n de estos esc"ndalos, simplemente es, a su juicio, estadstica !egn este
autor, la raz/n m"s persuasiva para usar la inferencia bayesiana es la capacidad que tiene de
proveer un nivel de protecci/n mucho mayor que el enfoque frecuentista contra la posibilidad
de -ver significaci/n en hallazgos procedentes de la investigaci/n cientfica que son enteramente
espurios.
\uy por el contrario, por lo general p puede llegar a ser sustantivamente menor que +01
)
M
47d
)
2 #so es en esencia lo que se advierte mediante la famosa paradoja de Lindley
%=
Aomo se ha dicho, lamentablemente se puede tener un valor peque'o de p sin que ello
signifique que el de +01M42 lo sea E#n qu medida se produce tal discrepanciaF #so depende
de la prueba empleada y de las circunstancias propias de cada caso3 adem"s, es imposible
calcular el valor +01
)
M47d
)
2 exactamente +ero s es posible, sin embargo, obtener cotas
inferiores para dicha magnitud
+or conducto del @eorema de $ayes es f"cil corroborar que4
F! # P
# P
d 4 # P
2 0
2 0 %
%
%
2 M 0
)
)
) )
+
donde +01
)
2 denota la probabilidad a priori que cabe otorgar a la hip/tesis nula de ser cierta y
!F es el llamado -factor de $ayes., definido como4
2 M 0
2 M 0
) )
) )
# d 4 P
# d 4 P
F!
*aturalmente, mientras 1
)
es una afirmaci/n concreta 0tpicamente, que dos tratamientos son
idnticos2, la falsedad de 1
)
puede asumir infinitas expresiones puntuales !in embargo, en
condiciones bastante generales, se pueden hallar cotas inferiores para !F
7omparaci8n de medias
Auando se comparan dos medias, si se llama , al estadstico por conducto del cual se obtiene el
valor p, se puede demostrar
%8
que se cumple4
==
F!
,
,
_
(
exp
(
Aonsecuentemente, se tiene4
2 M 0
(
exp
2 0
2 0 %
%
) )
%
(
)
)
d 4 # P
,
# P
# P
1
1
]
1
,
_
Prueba 9i&cuadrado
5n"logamente, para el caso en que se valora una asociaci/n a travs de la prueba Bi;cuadrado, se
tiene una cota inferior para el factor de $ayes
%D
en funci/n del valor observado
(
4
F!
,
_
(
%
exp
(
(
,
_
!2emplo
Aonsidrese un estudio publicado en una prestigiosa revista debido a 1arris y col
()
5ll se da
cuenta de una valoraci/n de los efectos a distancia de la intercesi/n mediante plegarias
religiosas como recurso teraputico a travs de un ensayo clnico controlado en pacientes
ingresados en una unidad de cuidados coronarios
!e seleccionaron todos los pacientes que ingresaron en la :nidad de Auidados Aoronarios
0:AA2 del 6nstituto 5mericano de Aardiologa, Aiudad de Jansas, a lo largo de un a'o, salvo los
que habran de recibir un transplante de coraz/n, para quienes se anticipaba una estada
prolongada en el servicio
Los pacientes, registrados diariamente, fueron asignados a los grupos de tratamiento usando el
ltimo dgito del nmero con que fue recepcionado 0nmero del registro mdico24 los pares eran
asignados al grupo experimental 09?? pacientes2 y los impares al grupo control 0=(9 pacientes2
!e procuraba valorar as el efecto de las oraciones como recurso para disminuir las
complicaciones que sobrevienen a los pacientes de enfermedades coronarias
:na vez que el paciente era asignado al grupo experimental, se informaba su nombre 0sin
apellidos2 por va telef/nica al responsable de uno de los grupos de intercesores para que se
comenzara a orar por espacio de (8 das exactos +ara cuantificar los resultados, se cre/ al efecto
un ndice de complicaciones 06GA2 5 cada una de las posibles complicaciones 0o acciones
=?
derivadas de ellas2 se le atribuy/ un nmero 0ponderaci/n2 segn la gravedad que ellas
entra'aban y de ese modo se asignaba un valor a cada paciente +ara valorar estadsticamente la
hip/tesis de nulidad se compararon las medias de 6GA mediante la prueba t de !tudent de dos
colas Los resultados finales obtenidos por 1arris y colaboradores se sintetizan en la @abla <
Tabla >. E6$t+s #$ la i"t$r$si!"; %$#ia"t$ la +rai!"; s+br$ $l IDC #$ (ai$"t$s
$" la U"i#a# #$ Cui#a#+s C+r+"ari+s.
"atos relevantes
:rupo
control
:rupo
experimental
]ndice de Aomplicaciones 06GA2 promedio <,%, ?,,=
@ama'o muestral =(9 9??
Gesviaci/n est"ndar =,D= =,8(
#l valor de z en este caso viene dado por la expresi/n4
)8 , (
9??
8( , =
=(9
D= , =
,= , ? %, , <
( (
+
e
e
c
c
e c
n
s
n
s
. .
z
Gebe advertirse que, en rigor, este estadstico sigue una distribuci/n t de !tudent3 sin embargo,
la condici/n se cumple en esencia aunque no se trate exactamente de una normal +or otra parte,
para los tama'os muestrales de este ejemplo, la similitud entre la t y la normal es virtualmente
total
#s f"cil ver que a este valor de z corresponde uno de p igual a ),)9 #l valor de la cota inferior
para +01
)
M47d
)
2 depende de la probabilidad a priori que se atribuya a la hip/tesis de que es lo
mismo ser motivo de los rezos que no serlo !i se atribuyera, por ejemplo, el valor ),= a dicha
probabilidad, se tendra4
%) , )
(
exp
2 0
2 0 %
%
%
(
)
)
1
1
]
1
,
_
,
# P
# P
#l escollo m"s importante que se presenta al aplicar los procedimientos bayesianos es,
precisamente, el de fijar distribuciones de probabilidad a priori, lo que en este caso se reduce a
dar un valor anticipado para +01
)
2
Las opiniones sobre el poder real de los rezos en la salud pueden ser diversas, pero es, como
mnimo, muy razonable partir de un posicionamiento neutro 0agn/stico2 que se traducira en no
escorarse ni a favor ni en contra de la medida y, por ende, en admitir que +01
)
27),= +ero en
algunos casos 0y el que se analiza es un buen ejemplo2, podra ser m"s razonable aun adoptar un
punto de vista escptico 0por ejemplo +01
)
27),8 / +01
)
27),D2
La tabla siguiente recoge los valores de probabilidad a posteriori que, como mnimo, se puede
atribuir a +01
)
M47d
)
2 para diferentes valoraciones a priori de los datos obtenidos en el estudio
Niveles Probabilidad a priori
-alor mnimo de
P03
%
;D<d
%
1
5gn/stico ),= ),%)
=<
#scptico ),8 ),,%
\uy escptico ),D ),=%
Aomo se ve, la probabilidad de que las plegarias sean totalmente estriles 01
)
2 es mucho mayor
que p incluso en caso de que no se adopte una posici/n escptica sino neutra
!up/ngase ahora en el mismo contexto del estudio anterior que se hubiera obtenido que en el
grupo control murieron %(9 pacientes y en el experimental %,8 Aon esos datos se podra
configurar la siguiente tabla de (x(4
:rupos
uerte 7ontrol !xperimental
! a7%(9 b7%,8
*o c79)) d7,(8
n
A
7=(9 n
#
79??
#l valor observado de Bi;cuadrado es igual a4
9D , 9
2 20 0
2 0
(
(
+ +
d c b a n n
bc ad n
e c