Está en la página 1de 60

ANLISIS BAYESIANO

NDICE
ANLISIS BAYESIANO................................................................................................................ 3
CONCEPTOS GENERALES.......................................................................................................3
UN EJEMPLO CLSICO............................................................................................................4
PROBABILIDAD SUBJETIVA.................................................................................................. 6
INTERVALO DE PROBABILIDAD........................................................................................ 10
EXPLICACIN DE LOS SUBMDULOS.............................................................................. 11
1. UNA POBLACIN. ESTIMACIN DE UNA PROPORCIN.......................................12
1.1. So!"#$% "o%&'%"#o%(.................................................................................................12
1.2. So!"#$% )(*'+#(%(...................................................................................................... 13
1.3. E '%,o-!' )(*'+#(%o )(.o +!/!'+0o+ (10#,#"#(2'%0' +#2/#,#"(3o+............................13
1.4. E /(+o ( ( "o%0#%!#3(3...............................................................................................14
1.5. I%0'1&(o 3' /1o)()##3(3.............................................................................................20
2. UNA POBLACIN. VALORACIN DE 6IPTESIS SOBRE UNA PROPORCIN.. 23
2.1. P1o/o1"#$% #7!( ( !%( "o%+0(%0'.................................................................................23
2.2. P1o/o1"#$% 3'%01o 3' !% #%0'1&(o............................................................................... 25
3. DOS POBLACIONES. ESTIMACIN DE UNA DI8ERENCIA DE PROPORCIONES
................................................................................................................................................ 26
4. DOS POBLACIONES. VALORACIN DE 6IPTESIS SOBRE UNA DI8ERENCIA
DE PROPORCIONES............................................................................................................ 32
4.1. I7!(3(3 3' /1o/o1"#o%'+.............................................................................................32
4.2. D#,'1'%"#( 3' /1o/o1"#o%'+ 3'%01o 3' !% #%0'1&(o..................................................... 33
5. UNA POBLACIN. ESTIMACIN DE UNA MEDIA................................................... 35
6. UNA POBLACIN. VALORACIN DE 6IPTESIS SOBRE UNA MEDIA.............. 40
6.1. M'3#( #7!( ( !%( "o%+0(%0'........................................................................................ 40
6.2. M'3#( 3'%01o 3' !% #%0'1&(o.......................................................................................42
4. DOS POBLACIONES. ESTIMACIN DE UNA DI8ERENCIA DE MEDIAS.
M9TODO EXACTO.............................................................................................................. 43
:. DOS POBLACIONES. ESTIMACIN DE UNA DI8ERENCIA DE MEDIAS.
M9TODO APROXIMADO................................................................................................... 45
;. DOS POBLACIONES. VALORACIN DE 6IPTESIS SOBRE UNA DI8ERENCIA
DE MEDIAS...........................................................................................................................51
10. TABLAS DE CONTINGENCIA. VALORACIN DE 6IPTESIS DE
INDEPENDENCIA................................................................................................................ 52
11. VALORACIN BAYESIANA DE PRUEBAS CONVENCIONALES......................... 54
BIBLIOGRA8<A........................................................................................................................ 5:
ANLISIS BAYESIANO
CONCEPTOS GENERALES
La inferencia estadstica devino en un recurso extremadamente til para los editores de revistas y
responsables administrativos, cuando a principios del siglo XX la ausencia de una herramienta que
aquilatara cuantitativamente el significado de los hallazgos produjo que las ancdotas clnicas
poblaran las revistas mdicas !e haca necesario, por tanto, usar procedimientos que cuantificaran
la evidencia y complementaran los razonamientos verbales, de modo que los protegiera de la
subjetividad
!in embargo, lo cierto es que, aunque la objetividad es un deseo natural y legtimo,
lamentablemente resulta inalcanzable en estado puro La estadstica no puede resolver este
conflicto, pues todo proceso inferencial, incluso cuando se lleva adelante con su concurso, tendr"
siempre un componente subjetivo !i bien las tcnicas estadsticas suelen ser muy tiles,
ocasionalmente pueden defraudar al usuario #n efecto, pueden despertar expectativas que a la
postre no se cumplan, especialmente cuando el investigador renuncia a examinar la realidad a
travs de un pensamiento integral y deja todo en manos del veredicto formal de los procedimientos
estadsticos Los argumentos aportados en este sentido por $erger y $erry
%
son sumamente
persuasivos
Los trabajos desarrollados por &isher en los a'os () y por los matem"ticos *eyman y +earson en la
dcada del ,), dieron lugar al mtodo actualmente conocido como prueba de significacin, que
responde al llamado -paradigma frecuentista. #ste mtodo engloba un ndice para medir la fuerza
de la evidencia, el llamado valor p, y un procedimiento de elecci/n entre hip/tesis, llamado prueba
de hiptesis 0+12
!in embargo, la metodologa de las pruebas de hip/tesis vive en la actualidad, segn algunos
especialistas, cierta crisis3 desde esa perspectiva, por tanto, resulta atractiva la idea de manejar un
nuevo paradigma o de corregir el actual #n este sentido el enfoque bayesiano se perfila como una
alternativa altamente promisoria
Las crticas m"s reiteradas al paradigma cl"sico han sido que obliga a una decisi/n dicot/mica y
que constituye una medida que depende vitalmente de un elemento ex/geno a los datos4 el tama'o
de muestra 5 un efecto peque'o observado en un estudio con un tama'o de muestra grande
puede corresponder el mismo valor p que a un gran efecto registrado a travs de una muestra
peque'a +or otra parte, basta que haya una diferencia mnima, intrascendente 0o el m"s mnimo
sesgo2, para que tal diferencia pueda ser declarada -significativa., siempre que haya recursos como
para tomar una muestra suficientemente grande #sta problem"tica se discute e ilustra m"s
adelante
!e supone que, al aplicar cierto procedimiento estadstico a un conjunto de datos, lo que se
procura es que el an"lisis gane en objetividad3 es decir, que los puntos de vista del investigador
no puedan modificar sustancialmente las conclusiones +ero la verdad es que los mtodos
estadsticos convencionales est"n lejos de garantizar autom"ticamente tal desideratum #s bien
sabido que la forma de operacionalizar las variables, los puntos de corte que se eligen, el nivel
de significaci/n empleado, las escalas de medici/n adoptadas, las pruebas de significaci/n
seleccionadas, son solo algunos ejemplos de la larga lista de instrumentos estadsticos que
irremediablemente han de elegirse segn un punto de vista que vara entre investigadores !in
,
embargo, donde tal carencia de normas uniformes es m"s acusada es en el punto culminante del
proceso4 a la hora de realizar inferencias una vez examinados los resultados
(

UN EJEMPLO CLSICO
#n $enavides y !ilva
,
se desarrolla un ejemplo que contribuye a exponer m"s claramente el modus
operandi de la tcnica cl"sica y que se retoma m"s adelante para ilustrar el enfoque bayesiano
!up/ngase que hay motivos te/ricos e indicios empricos nacidos del trabajo de enfermera que
hacen pensar que los pacientes afectados por quemaduras se recuperan m"s r"pidamente cuando el
tratamiento combina cierta crema antisptica con un ap/sito hidrocoloide que cuando solo se
utiliza la crema antisptica !e dise'a, entonces, un experimento con la esperanza de rechazar la
hip/tesis nula que afirma que el tratamiento simple es tan efectivo como el combinado
6magnese que se tienen n78) pacientes3 aleatoriamente se eligen 9) de ellos para ser atendidos con
el tratamiento experimental 0combinaci/n de crema antisptica y ap/sito hidrocoloide2 en tanto que
a los 9) restantes se les aplica el tratamiento convencional 0crema nicamente2
:na vez obtenidos los datos 0porcentajes de recuperaci/n en el grupo experimental y en el control,
p
e
y p
c
, y su diferencia, d
)
7p
e
;p
c
2, se calcula la probabilidad asociada a ese resultado bajo el
supuesto de que se cumple 1
)
!up/ngase que el <=> 0p
e
7),<=2 de los pacientes a los cuales se les
aplic/ el tratamiento experimental mejora apreciablemente a los = das, mientras que para los
pacientes tratados de manera convencional, esta tasa de recuperaci/n fue del ?)> 0p
c
7),?)2 La
@abla % recoge la informaci/n relevante de este ejemplo
Tabla 1. Distribui!" #$ u"a %u$stra #$ &' (ai$"t$s s$)*" trata%i$"t+ asi)"a#+ ,
s$)*" s$ r$u($rara" + "+.
Se recuperan
Tratamiento S No Total
#xperimental ,) %) 9)
Aonvencional (9 %? 9)
@otal =9 (? 8)
!egn la pr"ctica regular, ahora procede aplicar una prueba estadstica3 la m"s usada para valorar
la diferencia entre porcentajes es la prueba Bi;cuadrado0enteramente equivalente a la prueba basada
en el estadstico C que opera con la diferencia entre los porcentajes y se distribuye
aproximadamente segn una normal est"ndar2 #s f"cil constatar que en este ejemplo
(
0obs27(,)=
y que el correspondiente valor p es igual a ),%= +uesto que dicho valor no es suficientemente
peque'o como para considerar que -hay significaci/n. a ninguno de los niveles habituales 0),%)3
),)= y ),)%2 y a pesar de que esta diferencia objetivamente observada es notable, segn la pr"ctica al
uso, el investigador tiene que concluir 0aunque casi con seguridad, y con raz/n, a rega'adientes2
que no tiene suficiente evidencia muestral como para afirmar que el tratamiento con crema y
ap/sito sea m"s efectivo que el tratamiento con crema solamente #s decir, debe actuar como si el
experimento no arrojara informaci/n adicional alguna para pronunciarse, lo cual es obviamente
inexacto
+or otra parte, este mtodo, las decisiones se adoptan sin considerar la informaci/n externa a las
observaciones o al experimento3 de ah que una de las objeciones m"s connotadas que se hace al
9
mtodo es que no toma en cuenta de manera formal en el modelo de an"lisis la informaci/n
anterior a los datos, proveniente de estudios previos o de la experiencia emprica informalmente
acumulada, que siempre se tiene sobre el problema que se examina
+ara ilustrar la dependencia que tiene el an"lisis del tama'o muestral, bastar" reproducir la
@abla % pero usando mayores valores de muestra total y conservando la misma distribuci/n en
su interior #l valor de p se puede reducir tanto como se desee +or otra parte, sup/ngase ahora
que el estudio se realiz/ con n79)) pacientes y que arroj/ los resultados de la @abla (
Tabla -. Distribui!" #$ u"a %u$stra #$ .'' (ai$"t$s s$)*" trata%i$"t+ a(lia#+
, s$)*" s$ r$u($rara" + "+.
Se recuperan
Tratamiento S No Total
#xperimental %), D< ())
Aonvencional %() 8) ())
@otal ((, %<< 9))
Las estimaciones son p
e
7),=( y p
c
7),?) Aomo se ve, los resultados est"n en clara colisi/n con las
expectativas del investigador 5 juzgar por estas tasas, habra que pensar en principio que el
ap/sito podra ser da'ino 5l realizar la prueba de hip/tesis formal se obtienen
(
0obs27(,D, y
p7),)D #n este caso, si el investigador usara umbrales fijos, no podra rechazar la hip/tesis 1
)
al
nivel m"s socorrido 07),)=2 pero s al nivel 7),% !i acude al recurso m"s usual 0consignar el valor
exacto de p2, podra declarar algo como lo siguiente4 -las tasas observadas difieren
significativamente 0p7),)D2. #n cualquier variante, el rechazo de la hip/tesis de igualdad entre
tratamientos debera ser a favor de que el que utiliza solamente crema es m"s efectivo que el que
incluye el ap/sito
#sta conclusi/n, sin embargo, contradice los conocimientos previos, la expectativa racional y la
experiencia del investigador, todo lo cual lo colocara probablemente en un conflicto4 Ematiza
verbalmente el resultado hasta hacerle perder de hecho todo valorF Ese escuda en que no se lleg/
al umbral -m"gico. de ),)= y dice simplemente que la diferencia no es significativaF Ese abstiene
de comunicar los resultados y acta como si no se hubieran producidoF 5 juicio de los crticos
del frecuentismo, cualquiera de estas tres variantes sera inconsistente con la -obligaci/n
metodol/gica. que contrajo el investigador al elegir las +1 como medio valorativo del
procedimiento teraputico en estudio
#l atractivo de contar con un enfoque alternativo puede ser f"cilmente comprendido4 resulta
natural que se aspire a contar con un procedimiento inferencial libre de las serias impugnaciones
que se hacen a las pruebas de significaci/n
+ara conjurar la orfandad en que quedara el investigador tras el abandono de las +1, se
manejan varias alternativas :na de ellas, sin duda la m"s sencilla de todas, es simplemente no
usar la prueba de hip/tesis y circunscribirse a la construcci/n de intervalos de confianza 06A2 Ge
manera informal, un intervalo de confianza para un par"metro + se define como una pareja de
nmeros
%
H
P
y
(
H
P
entre los cuales se puede -estar confiado. que se halla el par"metro en
cuesti/n !i bien los 6A se inscriben en la /rbita de la misma vertiente frecuentista que las
pruebas de hip/tesis, se apartan de la interpretaci/n autom"tica de los valores p y constituyen
un recurso para aquilatar, justamente, el grado en que el conocimiento de la verdadera
=
diferencia es adecuado :na ventaja obvia de los intervalos de confianza, sin embargo, es que los
resultados se expresan en las mismas unidades en los cuales se hizo la medici/n y, por tanto,
permiten al lector considerar crticamente la relevancia clnica de los resultados
La otra alternativa es la inferencia bayesiana, objeto del presente m/dulo !egn comentan
detalladamente $enavides y !ilva
,
, se trata de una aproximaci/n metodol/gica exenta de casi
todas las crticas que se le hacen a las pruebas de significaci/n y que goza del atractivo de
incorporar las evidencias aportadas por experiencias previas dentro del proceso analtico y las
contempla, por ende, en las conclusiones
5dvirtase que, tpicamente, el clnico admite con naturalidad que tiene un criterio a priori
sobre un paciente3 realiza ex"menes complementarios y actualiza su visi/n inicial sobre el
diagn/stico que corresponde a ese paciente al conjugar las dos cosas 0visi/n inicial e informaci/n
complementaria2 en lo que constituye un proceso de inducci/n integral +arece bastante natural
la aspiraci/n de que un investigador se conduzca de manera similar3 esa es exactamente la forma
en que opera el pensamiento bayesiano
Los recursos para hacer inferencia estadstica bayesiana se conocen desde hace m"s de ()) a'os
#l reverendo @homas $ayes resolvi/ cuantitativamente por entonces el problema de determinar
cu"l de varias hip/tesis es m"s probable sobre la base de los datos !u descubrimiento b"sico se
conoce como el @eorema de $ayes
$ayes naci/ en Londres en %<)( y falleci/ el %< de abril de %<?% en @unbridge Iells, Jent &ue
distinguido como Fellow de la Koyal !ociety en %<9(, aunque hasta ese momento no haba dado
publicidad a trabajo alguno bajo su nombre !u artculo m"s emblem"tico
9
se titulaba Ensayo
hacia la solucin de un problema en la doctrina del azar 0Essay towards solving a problem in the doctrine
of chances2 y fue publicado p/stumamente
#l pensamiento bayesiano tiene m"s similitud que el frecuentista con el tipo de situaciones en
que se ve el cientfico habitualmente4 lo que tiene son datos 0pacientes con ciertos rasgos, medias
muestrales, series de datos2 y lo que quiere es descubrir qu circunstancias determinaron que los
datos fueran esos y no otros 0es decir, quiere hacer juicios acerca de las leyes que gobiernan el
proceso que produjo los datos que observa2 La diferencia esencial entre el pensamiento cl"sico y
el bayesiano radica en que aqul se pronuncia probabilsticamente sobre los datos a partir de
supuestos 0la -p. no es otra cosa que eso23 en tanto que ste se pronuncia 0tambin
probabilsticamente2 sobre los supuestos partiendo de los datos
5unque las bases de este enfoque datan de hace m"s de dos siglos, es ahora que empieza a
asistirse a un uso apreciable del mismo en la investigaci/n biomdica :na de las razones que
explican tal realidad y que a la vez augura un prominente futuro, es que algunos de los
problemas de cierta complejidad que posee este mtodo exigen el uso de recursos
computacionales accesibles s/lo muy recientemente para el comn de los investigadores
PROBABILIDAD SUBJETI/A
La inferencia bayesiana constituye un enfoque alternativo para el an"lisis estadstico de datos que
contrasta con los mtodos convencionales de inferencia, entre otras cosas, por la forma en que
asume y maneja la probabilidad
=

#xisten dos definiciones de la noci/n de probabilidad4 objetiva y subjetiva La definici/n


frecuentista considera que la probabilidad es el lmite de frecuencias relativas 0o proporciones2 de
?
eventos observables +ero la probabilidad puede tambin ser el resultado de una construcci/n
mental del observador, que corresponde al grado de -certeza racional. que tenga acerca de una
afirmaci/n, donde el trmino -probabilidad. significa nicamente que dicha certidumbre est"
obligada a seguir los axiomas a partir de los que se erige la teora de probabilidades3 como en
este marco las probabilidades pueden variar de una persona a otra, se le llaman certidumbres
personales, credibilidad, probabilidades personales o grados de creencia
?,<
La alternativa bayesiana est"
abierta a manejarse con esta ltima variante, aunque no excluye la primera
Lreenland
?
alerta acerca de que los trminos -objetivo. y -subjetivo. tienen una connotaci/n
que favorece el prejuicio y tiende a alejar a lectores ingenuos de la perspectiva subjetiva +ero
detr"s de esto se esconde cierta perversi/n sem"ntica La palabra -subjetivo. sugiere una
impronta de arbitrariedad o irracionalidad3 sin embargo, esta es una idea simplemente err/nea
#l hecho de que diferentes sujetos pudieran atribuir probabilidades diferentes al mismo evento
no significa que se conduzcan arbitrariamente La palabra -objetivo. sugiere observabilidad
directa3 sin embargo, los lmites de las frecuencias relativas se definen en trminos de secuencias
infinitas, las cuales no son observables directamente
Aon frecuencia se admite que se hable de cu"n probable es que, por ejemplo, un condiscpulo
apruebe un examen3 esto se considera una pregunta razonable y para emitir una respuesta nadie
exigira someterlo %))) veces a ese examen para poder contar cu"ntas veces aprob/ y poder
computar el porcentaje de xitos 6gualmente, nadie considera insensato afirmar -es muy
probable que Buan gane las pr/ximas elecciones.3 ni se tilda de irracional a un mdico que
considere como -improbable. que un paciente en particular sobreviva 0de hecho, los mdicos
actan cotidianamente de esta manera2 Gado que resulta imposible su cuantificaci/n formal, las
afirmaciones de este tipo no tienen sentido en el marco frecuentista3 sin embargo, son muy
usadas en el lenguaje comn y, de hecho, desempe'an un papel real 0aunque informal2 en la
toma de decisiones
La inducci/n bayesiana consiste en usar recursos probabilsticos para actualizar 0cambiar2
nuestra asignaci/n probabilstica inicial o previa 0haya sido sta -objetiva. o -subjetivamente
establecida.2 a la luz de nuevas observaciones3 es decir, computar nuevas asignaciones
condicionadas por nuevas observaciones #l teorema de $ayes es el puente para pasar de una
probabilidad a priori o inicial, +012, de una hip/tesis 1 a una probabilidad a posteriori o
actualizada, +01MG2, basado en una nueva observaci/n G +roduce una probabilidad
conformada a partir de dos componentes4 una que con frecuencia se delimita subjetivamente,
conocida como -probabilidad a priori., y otra objetiva, la llamada verosimilitud, basada
exclusivamente en los datos 5 travs de la combinaci/n de ambas, el analista conforma
entonces un juicio de probabilidad que sintetiza su nuevo grado de convicci/n al respecto #sta
probabilidad a priori, una vez incorporada la evidencia que aportan los datos, se transforma as
en una probabilidad a posteriori
La regla, axioma o teorema de $ayes 0se le ha denominado de todas esas formas2 es en extremo
simple, y se deriva de manera inmediata a partir de la definici/n de probabilidad condicional #sta
sera4
!i se tienen dos sucesos 5 y $ 0donde 5 y $ son ambos sucesos posibles, es decir, con
probabilidad no nula2, entonces la probabilidad condicional de 5 dado $, como es bien conocido,
se define del modo siguiente4
<
= >
= >
= ? >



P
P
P
N%O
5n"logamente,
2 0
2 0
2 M 0



P
P
P
,
de modo que, sustituyendo en N%O la expresi/n
2 0 2 M 0 2 0 P P P
, se llega a la forma m"s
simple de expresar la regla de $ayes4
2 0
2 0 2 M 0
2 M 0



P
P P
P
N(O
5hora bien, sup/ngase que 5
%
, 5
(
, , 5
P
son k sucesos mutuamente excluyentes, uno de los
cuales ha de ocurrir necesariamente3 entonces la conocida 0e intuitiva2 ley de la probabilidad total
establece que4


k
i
i i
P P P
%
2 0 2 M 0 2 0
Ge modo que, tomando el suceso 5
j
en lugar de 5 en la f/rmula N(O y aplicando al denominador
la mencionada ley, se tiene4




k
i
i i
j j
j
P P
P P
P
%
2 0 2 M 0
2 0 2 M 0
2 M 0
N,O
que es otra forma en que suele expresarse la regla de $ayes
+ara el caso particular en que k7(, la expresi/n N,O se reduce a4
( ) A )P A P! )PA) A P!
PA) A) P!
!) PA
+


donde
A
representa el complemento de 5, para dar lugar a la forma m"s conocida del teorema
de $ayes, ya mencionada antes
La regla de $ayes produce probabilidades inversas, en el sentido de que expresa +05M$2 en
trminos de +0$M52
La terminologa convencional para +05M$2 es la probabilidad a posteriori de 5 dado $ y para
+052 es la probabilidad a priori de 5, 0debe su nombre a que se aplica antes, sin estar
condicionada por la informaci/n de que $ ocurri/2
8
:na forma alternativa de expresar el teorema en el caso en que se trabaja con un evento y su
complemento es especialmente til cuando se trabaja con odds

3 en este caso la expresi/n sera4


P")
) # P
) " datos P
) # datos P
) datos P
) datos # P

@
M
donde 1 representa que una hip/tesis dada es v"lida y J que lo es la hip/tesis complementaria
$ajo el enfoque bayesiano, se suele valorar el apoyo relativo que dan los datos a cada una de estas
dos hip/tesis en trminos del llamado Factor de !ayes 0$&2, el cual compara las probabilidades de
los datos observados bajo las hip/tesis4
= >
= >
K datos P
H datos P
BF
!intetizando, lo que proclama el enfoque bayesiano es que resulta til, adem"s de ser consistente
con las demandas de la intuici/n, poder contar con un mtodo que combine las evidencias
subjetivamente acumuladas con la informaci/n objetiva obtenida de un experimento en
particular
+or ejemplo, al estimar un par"metro, su valor, naturalmente, se desconoce3 pero es absurdo
suponer un vaco total de ideas o de presunciones en la cabeza de quienes tienen esa ignorancia,
y una persona puede expresar su opini/n acerca de su conocimiento e incertidumbre por medio
de una distribuci/n probabilstica de un conjunto de valores posibles del par"metro La
distribuci/n a priori es la distribuci/n probabilstica que refleja y sintetiza la idea acerca de lo
que dicha persona razonablemente piensa antes de observar los datos #st" claro que la realidad
objetiva 0muchas veces representada a travs de lo que los estadsticos llaman -par"metros.2 es
de determinada manera 0ajena a las impresiones que uno tenga de ella2, y tambin es obvio que
no se comporta aleatoriamente3 pero nuestra visi/n sobre ella s, y en gran medida depende de
nuestra comprensi/n del problema y sobre todo, del conocimiento general prevaleciente en el
momento del estudio
+rocede, sin embargo, aclarar que es posible 0y ocasionalmente recomendable2 emplear
informaci/n emprica para conformar esta opini/n -subjetiva. #n esto se basa el anlisis
bayesiano emprico, consistente en la determinaci/n de la distribuci/n a priori a partir de la
evidencia emprica y el uso de esta misma evidencia para los c"lculos bayesianos formales
D

#n este punto, y a modo de sntesis, cabe preguntar Equ se supone que representa la
distribuci/n a prioriF :na posible respuesta es4 la distribuci/n probabilstica a priori representa
el estado de incertidumbre de un individuo particular acerca de ciertos par"metros +or tanto, si
dos individuos tienen diferentes creencias acerca de un par"metro, y estas creencias son
representadas honestamente por medio de diferentes distribuciones probabilsticas a priori,
entonces ambas distribuciones son, en cierto sentido y de momento, igualmente v"lidas
Kecordemos que los -odds. asociados a cierto suceso se definen como la raz/n entre la probabilidad de que dicho
suceso ocurra y la probabilidad de que no ocurra
8

D
INTER/ALO DE PROBABILIDAD
Kecurdese que en el marco frecuentista un intervalo de confianza se interpreta en trminos de
repeticiones hipotticas del estudio !egn este enfoque cl"sico4 -si se repitiera muchas veces el
muestreo, se aplicara el mismo procedimiento y se calcularan respectivos intervalos de
confianza al D=> segn las f/rmulas conocidas, D= de cada %)) intervalos incluiran al verdadero
par"metro que est" siendo estimado. #sta afirmaci/n es coherente con la definici/n de
probabilidad como frecuencia -a la larga. que usa esta escuela
+rocede se'alar en este contexto que la interpretaci/n de los intervalos de confianza tambin se
presta a confusi/n Auando un investigador calcula un intervalo de confianza al D=>, suele
pensar que este intervalo obtenido a partir de una muestra particular contiene al par"metro de
inters con una alta probabilidad #sta interpretaci/n, aunque intuitiva y muy extendida, es
err/nea :na vez seleccionada la muestra, es el intervalo de confianza el resultado de la
experiencia aleatoria3 lo que puede afirmarse es que, aproximadamente para el D=> de las
muestras posibles, el intervalo resultante contendra al par"metro desconocido Aon este
enfoque, solo se puede confiar en el procedimiento seguido4 si este intervalo se calculara
repetidamente, entonces se sabe que aproximadamente en el D=> de los casos se obtendr"n
intervalos que contendr"n el valor desconocido3 si se hace una sola vez 0que es lo que se produce
siempre2, entonces solo puede -confiarse. en que este intervalo haya sido uno de los -exitosos.
+ara los bayesianos, que admiten que se considere a la probabilidad como un grado de creencia,
el enfoque correcto es diferente4 se considera la curva que representa la funci/n de densidad que
se obtiene a posteriori, y si el "rea bajo dicha curva entre los valores X e Q es igual a D=>,
entonces se puede hablar de que el verdadero valor est entre X e Q con cierta probabilidad 0por
ejemplo, del D=>2 !e dice entonces que 0X, Q2 constituye un intervalo de credibilidad al D=> o un
intervalo de confianza bayesiano
%)
5l intervalo construido bajo estos supuestos tambin se le llama
intervalo probabil$stico
Nota: #n el desarrollo de la explicaci/n sobre la estimaci/n de una proporci/n se
da una definici/n formal de este intervalo
La literatura referente a los mtodos bayesianos crece a diario :n solo ejemplo claramente
elocuente del auge que han tomado dichos mtodos lo proporciona la Kevista Annals of %nternal
&edicine, una de las de mayor prestigio internacional #n un editorial firmado por Gavidoff
%%
se
plantea4 -Aonvencidos de que la inferencia inductiva es til y factible para la interpretaci/n de
estudios cientficos, en %DD< comenzamos a alentar a los autores que envan sus manuscritos a
Annals a que incluyan la interpretaci/n bayesiana en sus resultados. :n hecho notable es que
en febrero del ())=, una bsqueda en 'oogle, arroj/ que hay ,%=)) sitios en cuyo nombre est" la
palabra !ayes, y %<,))) en que aparece bayesian3 adem"s hay (9=)))) sitios I#$ donde se
menciona en algn lugar dicha palabra bayesian :na medida del crecimiento de la presencia de
los mtodos bayesianos en los artculos mdicos puede apreciarse consultando la base Pubmed3
operando con la clave -bayes () bayesian. se hallaron los resultados que recoge la @abla ,
Tabla 0. N*%$r+ #$ art1ul+s r$)istra#+s $" PUBMED $" u,+s t1tul+s , r$s*%$"$s
a(ar$$ ba,$s + ba,$sia" s$)*" tr$s 2ui"2u$"i+s +"s$uti3+s.
Perodo
Artculos en PUB!" #$$%&$' #$$(&$$ )%%%&%'
@tulos (,( ,D< D<=
Kesmenes ?%< %%%9 (<8<
%)
#n lo que sigue dentro de este texto de ayuda, han de tenerse en cuenta algunas advertencias4
#n aquellos ejemplos en que el algoritmo transita por tcnicas de simulaci/n,
los resultados, naturalmente, difieren en las aplicaciones sucesivas debido,
precisamente, a que el ordenador simula cada vez datos diferentes3 ello explica
asimismo que si el usuario prueba el programa usando los ejemplos aqu
incluidos, no va a obtener exactamente los mismos resultados que dichos
ejemplos ofrecen
#l nmero de simulaciones que han de hacerse debe ser decidido por el
usuario3 la nica restricci/n que pone #pidat ,% es que no sea inferior a =))3 en
muchos casos no tiene sentido poner m"s de =))) o %)))) porque a partir de
esos valores los resultados pr"cticamente no difieren #n cualquier caso, no
existe un nmero -/ptimo., pues nunca va a afectar negativamente que se
decida un nmero mayor
Aiertas zonas del texto contienen formulaciones complejas, algunas
matem"ticamente avanzadas3 el usuario que no tenga suficiente versaci/n
matem"tica, debe pasar por alto tales segmentos, que se han incluido en
beneficio de quienes deseen acceder a una fundamentaci/n formal de
naturaleza m"s tcnica, ya que no se trata de desarrollos f"ciles de hallar en la
literatura convencional
#l -tono. con que en algunos puntos se exaltan las virtudes del enfoque
bayesiano no equivale a que los autores del programa suscriban enteramente
dicho enfoque, el cual tambin es objeto de algunas valoraciones crticas #s
reflejo de los puntos de vista que tpicamente pueden hallarse en la literatura
correspondiente y se emplea para que el usuario conozca cabalmente dichas
opiniones
#n algunos subm/dulos, los datos pueden entrarse segn dos modalidades
@picamente, la forma escogida es irrelevante 0el resultado ser" el mismo2, pero
a veces pueden producirse peque'as diferencias en dependencia de cu"l se
escoja Gichas diferencias son solo atribuibles a cuestiones de redondeo y no
afectan lo esencial de los resultados
E4PLICACI5N DE LOS SUBM5DULOS
5 continuaci/n se da una explicaci/n de las bases te/ricas de cada uno de los subm/dulos
incluidos en #pidat ,% bajo el rubro de An*lisis bayesiano #n cada caso se dar" una explicaci/n
te/rica y luego se pone un ejemplo @al explicaci/n es m"s extensa en algunos casos que en otros
0por ejemplo el de la estimaci/n de una proporci/n o la diferencia de proporciones2 ya que se
aprovechan para dar explicaciones de valor general *o obstante, las bases te/ricas de los
mtodos hay que buscarlos en las referencias que se dan al final de esta ayuda
%%
1. UNA POBLACIN. ESTIMACIN DE UNA PROPORCIN
#l problema posiblemente m"s simple de la inferencia 0aunque a la vez uno de los que se
presenta con mayor frecuencia2 es estimar el valor desconocido de una proporci/n poblacional
La explicaci/n correspondiente a este sencillo problema, permitir" captar algunas ideas
generales del enfoque bayesiano 0y por ende, v"lidas para los dem"s subm/dulos2 @al
circunstancia determina que este punto ser" bastante m"s extenso que el resto
#l proceso para resolver la tarea mencionada exige en cualquier variante obtener una muestra de
n sujetos de la poblaci/n, en la que se evala una variable dicot/mica Los resultados se dividen
en e -xitos. y f7n;e -fracasos.
!up/ngase entonces que es un porcentaje poblacional desconocido 0por ejemplo, la tasa de
prevalencia de asma en una comunidad2 y que se ha concluido una indagaci/n o encuesta para
recoger informaci/n que permita estimarlo
1.1. S+lui!" +"3$"i+"al
#l procedimiento regular que suele aplicarse es bien conocido4 consiste en realizar una
estimaci/n puntual y luego estimar el grado de error atribuible a dicha estimaci/n y, con esos
datos, construir un intervalo de confianza
!up/ngase que se ha hecho un estudio con una muestra de tama'o n7()), entre cuyos
miembros se detectaron e7%% casos positivos #l procedimiento convencional conduce a
construir un intervalo de confianza para la tasa de asm"ticos 02
Las f/rmulas bien conocidas para los lmites inferior y superior 0% y +, respectivamente2 seran4
n
p p
, p %
2 % 0
(
%

y
n
p p
, p +
2 % 0
(
%


#n este caso,
n7()),
)== , )
())
%%
p
y
D? , %
(
%


,
0suponiendo que se trabaja con el consabido 7),)=2,
de modo que un intervalo de confianza al D=> en este marco convencional vendra delimitado
por los valores4 %7),)(, y +7),)8<
#ste procedimiento permite -confiar. en que el verdadero porcentaje se halla entre (,,> y 8,<>
#sto quiere decir que el intervalo en cuesti/n ha sido obtenido por un mtodo que el D=> de las
veces da lugar a intervalos que contienen al verdadero par"metro3 y de ah dimana la confianza
que se tiene en que esta vez haya ocurrido as *o se tiene derecho, sin embargo, a hablar de la
probabilidad de que el intervalo contenga o no a la tasa desconocida
#l enfoque convencional parte de un supuesto implcito4 no se tiene informaci/n alguna sobre la
tasa que se quiere estimar Gesde luego, dicha tasa no se conoce exactamente #l objetivo es,
justamente, incrementar el conocimiento que se tiene sobre el tema con anticipaci/n3 pero eso no
equivale a que no se posea idea alguna #sa es la distinci/n crucial entre esta soluci/n y la
bayesiana
%(
1.-. S+lui!" ba,$sia"a
La inferencia bayesiana exige tener a priori una opini/n acerca de la proporci/n 0reflejo de
nuestro conocimiento antes de realizar observaci/n alguna23 una vez que sta se ha formulado, se
modifica nuestro conocimiento acerca de , y el mecanismo utilizado para la -actualizaci/n. es el
teorema de $ayes Ge modo que, una vez aplicado el teorema, toda la informaci/n acerca de la
proporci/n desconocida est" contenida en la distribuci/n probabilstica que se obtiene para , la
llamada distribucin a posteriori 5 partir de ella se pueden realizar diferentes tipos de
afirmaciones, como se ilustra de inmediato
Aomo se ha dicho, la soluci/n cl"sica parte de un desconocimiento total sobre el porcentaje de
inters #s razonable suponer, sin embargo, que de antemano se tengan ciertas ideas acerca de
cu"l puede ser ese valor desconocido3 por ejemplo, podra considerarse altamente verosmil que
la tasa de prevalencia de asma en la comunidad 02, no est muy distante de D> Gesde luego, tal
criterio inicial, nacido quiz"s de la experiencia propia y ajena, as como del encuadre te/rico del
problema, se produce en un marco de incertidumbre 5s, tal vez se piensa que <> / %,> son
tambin valores posibles, aunque acaso menos verosmiles que D> Q tambin se pudiera estar
convencidos de que ==> sera sumamente improbable, a la vez que se pudiera estar persuadidos
de que cifras como %> u 8)> seran virtualmente imposibles @ener de antemano puntos de
vista como estos no solo es posible sino casi inevitable para alguien versado en la materia
#n la valoraci/n realizada en el p"rrafo precedente se ha empleado una terminologa
probabilstica informal, tpica en las expresiones cotidianas3 pero bien podra llevarse a un plano
formal y el lenguaje evocativo de las probabilidades 0-sumamente improbable., -altamente
verosmil., -virtualmente imposible., etc2 podra ser convertido en nmeros concretos
Ge modo que el problema que se aborda es el de ganar conocimiento sobre una tasa de
prevalencia3 se sabe que se necesita informaci/n procedente de la realidad como parte del proceso
inferencial, pero se est" a la vez consciente de que se poseen criterios racionales potencialmente
valiosos a los efectos de resolver eficientemente dicho problema #l empleo de estos criterios en
el proceso formal de estimaci/n es posible pero, como se ver", exige transitar por el ejercicio de
traducir esos criterios, en una u otra medida subjetivos, a un marco cuantitativo
1.0. El $"6+2u$ ba,$sia"+ ba7+ su(u$st+s arti6iial%$"t$ si%(li6ia#+s
+ara utilizar el mtodo bayesiano, por tanto, el primer paso consiste en fijar las probabilidades a
priori +0
i
2, por cuyo conducto se resume la informaci/n disponible antes de realizar el
experimento o la observaci/n
!up/ngase que se conforma una distribuci/n a priori a partir de una selecci/n de un conjunto
finito de posibles valores de , a cada uno de los cuales se le asigna una probabilidad 0una
distribuci/n a priori bajo este supuesto se conoce como -discreta.2 #n algunos casos se sabe, o se
sospecha fuertemente, que el valor de debe caer en un intervalo particular3 siendo as, se puede
elegir un conjunto de valores para dentro de este intervalo, o, si se tiene poco conocimiento acerca
de la localizaci/n de la proporci/n, entonces se puede elegir una red de valores igualmente
espaciados entre ) y %
5cptese de momento que hay solo k posibles valores para 4
%
,
(
, ,
P
a los que se han
atribuido respectivas probabilidades que reflejan formal y cuantitativamente nuestros puntos de
%,
vista de partida 0probabilidades a priori2 Ll"mense +0
%
2, +0
(
2, , +0
P
2 a dichas probabilidades,
donde4

k
i
i
P
%
% 2 0
!e debe consignar en este punto que #pidat ,% no aborda la soluci/n del problema bajo este
supuesto de que la distribuci/n de es discreta 5qu se introduce para allanar el proceso de
comprensi/n del enfoque bayesiano, pero el presente softRare encara el problema directamente
en una situaci/n realista, como se explica e ilustra m"s adelante
*/tese que, en la medida que se atribuyen probabilidades a cada uno de los valores posibles, el
par"metro se convierte en una variable aleatoria con cierta distribuci/n explcita #l hecho de que
se hable de que -el par"metro sea una variable aleatoria. constituye una especie de
contrasentido para el estadstico cl"sico !olo la comprensi/n de que se trata de un recurso
artificial por cuyo conducto se expresan nuestras certidumbres e incertidumbres previas puede
conferir sentido a la idea !uperado ese escollo, ya se puede hablar, por ejemplo, del valor
esperado de y computarlo con acuerdo a la f/rmula conocida4

k
i
i i
P E
%
2 0 2 0
N9O
!up/ngase tambin que se ha hecho una experiencia emprica consistente en observar n
individuos, y que e de ellos resultan tener la condici/n de inters
Lo que permite el teorema de $ayes es reconstruir nuestra visi/n inicial con los datos que arroja
dicha informaci/n emprica +or su conducto se establece la probabilidad de que el verdadero
valor de sea igual a
j
!e trata de la llamada probabilidad a posteriori, ya que es la que se obtiene
luego de haber observado los datos
5nteriormente se expres/ el teorema de $ayes a travs de la f/rmula N,O4




k
i
i i
j j
j
P P
P P
P
%
2 0 2 M 0
2 0 2 M 0
2 M 0
!i en dicha f/rmula, los
j
ocupan el lugar de 5
j
y ciertos datos 0en este caso que e de los n
individuos encuestados son asm"ticos2 ocupan el de $, entonces sta adopta la forma siguiente4

k
i
i i
j
j
j
P datos P
P datos P
datos P
%
2 0 2 0
2 0 2 0
2 0

N=O
La probabilidad +0datosM
j
2 es la llamada verosimilitud correspondiente a
j
3 se trata de un
nmero que cuantifica cu"n verosmil es que se hayan obtenido esos datos si la verdadera tasa
fuera
j

!e aplicar" en principio la expresi/n N=O para resolver el problema que se intenta resolver +or
ejemplo, podra postularse que la tasa de asm"ticos pudiera corresponderse con solo uno de los
%9
siguientes k7= porcentajes 0modelos posibles24 =>, <>, D>, %%> y %,> :n investigador podra
considerar que las probabilidades que se deben atribuir respectivamente a las distintas opciones
son las que se recogen en la @abla 9
Tabla .. Distribui!" #$ (r+babili#a# a priori (ara l+s 8 %+#$l+s (+sibl$s.
odelos posibles
(* +* $* ##* #,*
Probabilidades a priori
atribuidas
),%) ),() ),9) ),() ),%)
#l valor esperado de es, de acuerdo con N9O4
#0)70),)=20),%)2S0),)<20),()2S0),)D20),9)2S0),%%20),()2S0),%,20),%)27),)D
*/tese que este juego de probabilidades a priori no solo refleja el punto de vista que se tiene
sobre el valor 0D>2 en torno al cual podra hallarse la tasa desconocida, sino tambin nuestro
grado de certidumbre 0e incertidumbre2 al respecto Auanto mayor sea la dispersi/n de las
probabilidades a priori atribuidas a los valores posibles para , mayores dudas se estaran
reflejando, y viceversa +or ejemplo, si en lugar de las probabilidades consignadas en la @abla 9,
un segundo investigador confiriese una probabilidad m"s baja al valor de D> 0dgase, una
probabilidad de ),,)2 y redistribuyese la probabilidad restante, asignando ),() para los valores de
<> y %%>, y ),%= a los valores de => y %,>, este segundo investigador estara reflejando el mismo
punto de vista en torno al posible valor de pero tambin que el grado de convicci/n sobre esta
posibilidad es mucho menor
#n efecto, en este caso, se seguira teniendo #027),)D, pero se estara comunicando una
convicci/n mucho m"s dbil en el sentido de que sea igual a D> #l segundo investigador
estara expresando un grado de incertidumbre mayor3 0ya que estara otorgando m"s
credibilidad en principio a la posibilidad de que la tasa se aleje de tal valor en una u otra
direcci/n2
!in embargo, los resultados finales del an"lisis pudieran no ser demasiado diferentes #s lo que
suele ocurrir salvo que se trate de visiones dr"sticamente distintas #l examen de las posibles
modificaciones debidas a respectivas visiones a priori es lo que se conoce como -an"lisis de
sensibilidad., y se trata de un paso metodol/gicamente recomendado
Tcasionalmente, por otra parte, el investigador pudiera preferir no anticipar criterio alguno3 en tal
caso, optar" por los llamados -priors no informativos. 0es decir, que elegir" la distribuci/n
uniforme como informaci/n a priori, lo cual equivale en esencia a dejar -que los datos hablen por s
mismos.3 en este ejemplo, equivaldra a atribuir probabilidad ),( a cada una de las = posibilidades2
#l siguiente paso, por tanto, consiste en calcular las verosimilitudes 0likelihoods2 #n general, la
verosimilitud de un modelo poblacional es la probabilidad de que se hayan producido los datos
observados d 0o una funci/n de ellos, por ejemplo, una tasa calculada usando dichos datos2
supuesto que ese modelo es v"lido
5hora bien, la probabilidad de tener estos datos 0en este caso, de que se tengan e xitos en n
intentos independientes2, si la probabilidad de cada intento es igual a , no es otra cosa que el
valor de una densidad binomial con par"metros n y evaluada en e 0e4 ), %, , n24
%=
e n e
e
n
n e P

,
_

2 % 0 2 , 0
N?O
donde
2U 0 U
U
e n e
n
e
n

,
_

!up/ngase ahora que se hace una encuesta sobre ()) sujetos elegidos al azar y que se observa
que %% de ellos son asm"ticos #s decir, en ese caso n7()) y e7%%, lo cual arroja una estimaci/n
puntual de =,=>
Aonsecuentemente, la verosimilitud de cada uno de los modelos posibles depende del valor de
que lo define3 por ejemplo, para el modelo que afirma que la tasa de asm"ticos es ),)= 07),)=2,
sta es4
%%?< , ) D= , ) )= , )
%%
())
%8D %%

,
_

#n la @abla = se muestran todos los c"lculos necesarios para este ejemplo La columna , resulta de
aplicar la expresi/n anterior a cada uno de los modelos 5 continuaci/n se multiplican las
probabilidades a priori por sus correspondientes verosimilitudes, se suman todos estos productos
0),),8%2, y se divide cada producto por dicha suma para obtener las probabilidades posteriores
0quinta columna2 +or ejemplo, para el modelo que establece que la probabilidad es igual a ),)=, al
cual se atribuye una probabilidad a priori de ),% y al que corresponde una verosimilitud de ),%%?<,
se multiplica la probabilidad a priori por la verosimilitud y se divide el resultado ),)%%< por la
suma total de los productos 0),),8%23 el valor que se obtiene, ),,)?, es la probabilidad posterior
de ese modelo
Tabla 8. R$sulta#+s #$ l+s 9lul+s #$l $7$%(l+.
odelo Prior -erosimilitud Prior x -erosimilitud Posterior
),)= ),%) ),%%?< ),)%%< ),,)?
),)< ),() ),)89< ),)%?D ),99=
),)D ),9) ),)((% ),))88 ),(,(
),%% ),() ),)),) ),)))? ),)%?
),%, ),%) ),))), ),)))), ),))%
Suma # %,%,.# #
Gen/tese por +0=>Md2 a la probabilidad de que sea correcto el modelo que afirma que 7),)=
supuestos los datos de que una muestra de tama'o ()) arroj/ una tasa de =,=> 0que se denota
por d2 !egn N=O, la probabilidad a posteriori +0=>Md2 es igual a4
,)? , )
2 % , ) 20 ))), , ) 0 2 ( , ) 20 )),) , ) 0 2 9 , ) 20 )((% , ) 0 2 ( , ) 20 )89< , ) 0 2 % , ) 20 %%?< , ) 0
2 % , ) 20 %%?< , ) 0
2 M )= , ) 0
+ + + +
d P
Aomo se puede apreciar, los datos han dado lugar a una redistribuci/n de las probabilidades
iniciales #l nuevo valor esperado es4
%?
#0-d)70),)=20),,)?2S0),)<20),99=2S0),)D20),(,(2S0),%%20),)%?2S0),%,20),))%27),)?D
que resulta ser ahora muy pr/ximo a <>
+or otra parte, el grado de incertidumbre es considerablemente menor Ge hecho, los modelos
7),%% y 7),%, podran virtualmente ser descartados a la luz de los datos empricos
1... El (as+ a la +"ti"ui#a#
Aolocando ahora las cosas en un marco realista, considrese el caso en que se puede ubicar en
cualquier punto del intervalo 0),%2 5hora las probabilidades a priori no se pueden enumerar,
pues son infinitas #l modo de representarlas es a travs de una funci/n de densidad
correspondiente a una distribuci/n continua Aualquier funci/n de densidad continua definida
en el intervalo 0),%2 puede ser til 0siempre que refleje el punto de vista del investigador2, pero la
m"s usual en el caso en que se estima una proporci/n es la distribucin beta, que depende de dos
par"metros 0aV) y bV)2 Gicha distribuci/n se extiende solo sobre el intervalo 0),%2, de modo que
cumple con la condici/n /ptima para representar nuestra percepci/n acerca de cu"n probables
son unos u otros valores de un par"metro que tambin est" constre'ido a tales lmites La
funci/n de densidad beta y sus propiedades pueden verse en cualquier libro de probabilidades
y, aunque m"s abajo se exploran sus rasgos con cierta extensi/n, procede adelantar que, en
particular, puede corroborarse que su media y su desviaci/n est"ndar son, respectivamente, las
siguientes4
b a
a
+

y
2 % 0 2 0
(
+ + +

b a b a
b a

La &igura % permite apreciar parcialmente la diversidad de formas que puede asumir la


distribuci/n beta en dependencia de los valores que adopten a y b 5s, se ve que la curva asume
muy diferentes formas para cuatro juegos de par"metros4 la curva B# corresponde a la pareja
a79, b79, para a79, b7% se obtiene la curva B), a7((, b79 origina la curva B, y la pareja a7%, b79,
la curva B'
:i)ura 1. :u"i+"$s #$ #$"si#a# b$ta (ara uatr+ (ar$s #$ (ar9%$tr+s.
% %,) %,' %,/ %,. #
Beta0','1 Beta0',#1 Beta0)),'1 Beta0#,'1
%<
B#
B' '''
B,
B)
:n caso de particular inters es aquel en que a7% y b7% 0no representada en la &igura %23 con
estos par"metros, la distribuci/n beta coincide con la uniforme en 0),%2 !i se eligiera sta como
distribuci/n a priori, ello significa que el investigador est" adoptando una posici/n totalmente
-neutra. 0sin escorarse en sentido alguno, pues estara otorgando la misma probabilidad a todos
los valores posibles2 #l an"lisis bayesiano es en tal caso esencialmente coincidente con el que se
obtiene mediante el enfoque cl"sico
*uevamente, sup/ngase que en una muestra de tama'o n se registran e asm"ticos 5l nmero
de no asm"ticos se le llamar" f7n;e #n este caso, la f/rmula N,O involucra a una integral en lugar
de a una sumatoria 0de hecho Wexpresado de un modo informal; la integral en un intervalo no es
otra cosa que la suma de los infinitos valores de la funci/n integrada en dicho intervalo2 */tese
que la ley de probabilidad total, que expresaba que4
2 0 2 M 0 2 0
%
i
k
i
i
A P A ! P ! P

se traduce en el caso continuo a4

d. . f . ! P ! P 2 0 2 M 0 2 0
donde f0.2 es la funci/n de densidad de una variable aleatoria / evaluada en ., +0$M.2 es la
probabilidad de $ supuesto que /7., y es el recorrido continuo de valores posibles para /
*o es difcil probar que si la distribuci/n a priori es $eta0a,b2 y los datos siguen una distribuci/n
binomial, para la que se han producido e -xitos. y f -fracasos. entonces la distribuci/n a
posteriori es $eta0aSe,bSf2 !e dice que la distribuci/n beta es conjugada para la binomial
!i, por ejemplo, se tuviera cierta convicci/n a priori de que ),,), teniendo en cuenta las
f/rmulas de la media y la varianza de la distribuci/n $eta, se podra fijar a y b de manera que4
,) , )
+ b a
a
*aturalmente, infinitas parejas cumplen tal condici/n !i se estuviera poco convencido de la
visi/n a priori sobre el valor en torno al cual pudiera hallarse , se podra fijar, por ejemplo, a7, y
b7<3 si se concediera m"s credibilidad al valor medio postulado, una expresi/n paramtrica
acorde con ese menor grado de incertidumbre podra conducir a fijar a7? y b7%9 /, por ejemplo,
a7D y b7(%, o a7((,= y b7=(,=
:i)ura -. :u"i+"$s #$ #$"si#a# B$ta (ara 0 3aria"t$s $" 2u$ la %$#ia $s ';0'.
%8
% %,) %,' %,/ %,. #
Beta0,,+1 Beta0/,#'1 Beta0$,)#1
La &igura ( refleja las tres primeras posibilidades #pidat ,% cuenta con una interfase gr"fica4
cuando el usuario comunica valores para a y b, se produce un gr"fico que le permite valorar si la
forma de la funci/n de densidad es acorde con su visi/n !i quiere enmendar dicha visi/n y
cambiarla por otra que considere m"s adecuada, bastar" cambiar los par"metros y podr"
examinar una nueva curva antes de pasar a dar los datos que habr"n de emplearse para la
-actualizaci/n.
Aomo puede apreciarse, la forma de la funci/n de densidad es muy parecida para las tres curvas
0la media es la misma2, pero las curvas varan en el grado de concentraci/n en torno a esa
media2 Las varianzas de las tres distribuciones son respectivamente4 ),)%D, ),)%) y ),))<
!up/ngase para lo que sigue que se acepta la primera de las tres distribuciones consideradas
0a7, y b7<2
!up/ngase nuevamente que la muestra de tama'o n7()) arroja %% asm"ticos 0e7%% y f7%8D23
siendo as, la densidad a posteriori sera la correspondiente a una distribuci/n beta con
par"metros aSe7%9 y bSf7%D?, que tiene una media de ),)?< y una desviaci/n est"ndar de ),)%<
Aomo se observa, la distribuci/n a posteriori se escora notablemente a la izquierda en relaci/n a
la distribuci/n inicial, que estaba centrada en ,)> y ahora lo est" en ?,<> #ste resultado es
coherente con el hecho de que la tasa observada, =,=>, es marcadamente inferior a tal previsi/n
+or otra parte, la nueva distribuci/n, actualizada con la informaci/n emprica, es apreciablemente
m"s estrecha, lo que resulta de que el tama'o muestral es bastante grande La nueva
distribuci/n pone de manifiesto que los datos corrigen al supuesto inicial y que, si bien ste tiene
cierto peso, la verosimilitud domina #ste es un rasgo tpico del enfoque bayesiano4 cuando el
tama'o muestral es muy grande, la distribuci/n a priori que se elija tienda a ser irrelevante #sa
misma circunstancia, dicho sea de paso, subraya que la m"xima utilidad del bayesianismo se
produce cuando los tama'os muestrales no son muy grandes
Qa en el marco bayesiano, una vez construida la distribuci/n a posteriori, procede sacar
conclusiones por su conducto Lo singular es que, con esa herramienta, tales conclusiones
pueden ser directamente expresadas en trminos de probabilidad, algo imposible, como se ha
dicho, en el marco de la estadstica frecuentista cl"sica +or ejemplo, se puede decir que la
probabilidad de que supere a <> es igual a ),,D3 o que la de que est entre 9> y 8> es igual a
),<= #n efecto, al contar con la distribuci/n del par"metro, se trata en este caso de computar
%D
"reas bajo la funci/n de densidad correspondiente 0resolver ciertas integrales23 es decir, hallar las
"reas bajo la curva de densidad en los intervalos que sean de inters, algo que resulta sencillo
con las posibilidades computacionales actuales y que #pidat ,%, naturalmente, incorpora entre
sus posibilidades
1.8. I"t$r3al+ #$ (r+babili#a#
:n procedimiento de an"lisis de gran inters se relaciona con los llamados intervalos de
probabilidad #llos evocan claramente a los intervalos de confianza cl"sicos, pero tienen un rasgo
distintivo fundamental4 a diferencia de estos ltimos, el intervalo de probabilidad 0tambin
llamado de credibilidad2 es un intervalo dentro del cual se hallara el par"metro con cierta
probabilidad especificada +ara fijar las ideas, imagnese que se quiere identificar un intervalo
que contenga a con probabilidad 0%;2%))> donde )XX% !up/ngase que 7),)= 0como suele
elegirse en la inferencia cl"sica2, de modo que en ese caso la probabilidad con la cual estara el
par"metro dentro del intervalo sera D=>
5hora bien, tpicamente existir"n infinitos intervalos que cumplan esa condici/n EAon cu"l de
ellos operarF 1ay varias maneras de elegirlo, pero el inters se centra b"sicamente en el llamado
intervalo de m*.ima densidad
#l intervalo de m*.ima densidad se define como aquel intervalo 0%,+2 para el cual la funci/n de
densidad f cumple la siguiente condici/n4 f0.2 f0y2 cualquiera sea .0%,+2 y cualquiera sea y
0%,+2 #ste intervalo coincide, salvo situaciones excepcionales, con el intervalo m"s corto de entre
los que cumplen la condici/n de tener bajo la curva un "rea de magnitud 0%;2%))>3 es decir, el
intervalo tal que el valor +;% sea mnimo entre aquellos que cumplen +0%+2 7 %;
#n el ejemplo, los percentiles m"s relevantes de la distribuci/n a posteriori $eta0%9, %D?2 son4
Percentil -alor
(,=> ),),<
=> ),)9)
%)> ),)9=
(=> ),)=9
=)> ),)?=
<=> ),)<8
D)> ),)D)
D=> ),)D8
D<,=> ),%)=
#l intervalo de m"xima densidad hay que hallarlo a travs de programas especializados tales
como #pidat ,% Aomo puede comprobarse, dicho intervalo es N),),= 3 ),%)%O
+or ltimo, rep"rese en la diferencia que existe entre el intervalo de confianza calculado segn
los mtodos tradicionales y el intervalo probabilstico que se obtiene a partir de los mtodos
bayesianos +ara los datos del ejemplo, se tiene un D=> de confianza en que la proporci/n de
asm"ticos de la comunidad se encuentra en el intervalo que tiene como lmite inferior a ),)(, y
superior a ),)8< 0intervalo de confianza tradicional23 mientras que, segn los mtodos
bayesianos, se tiene un D=> de probabilidad de que el intervalo N),),< 3 ),%)=O contenga el valor
del par"metro 0proporci/n de asm"ticos2 Aomo se ve, los intervalos son bastante similares
()
0desde el punto de vista matem"tico, porque la interpretaci/n es diferente como ya se sabe2, lo
cual se debe al tama'o de muestra tan grande que se us/3 en efecto, si el tama'o de muestra es
grande el enfoque bayesiano puede no diferir demasiado del frecuentista, porque la
verosimilitud tiene mayor peso que la informaci/n a priori Lo cierto es que un tama'o de
muestra grande nunca es -malo., si bien podra perderse parte del atractivo del enfoque
bayesiano3 pero cuando no es el caso, que es lo que suele ocurrir, entonces el enfoque bayesiano
s juega un papel cardinal, y ah radica una de sus ventajas con respecto al mtodo frecuentista
!2emplo
Aonsidrese el ejemplo de estimaci/n arriba planteado usando #pidat ,%
+ara definir una distribuci/n $eta0a, b2 a priori con a7, y b7<, se dan estos datos al programa y
se marca +K#!#*@5K !e tendra la curva siguiente4
!i no se tiene ninguna idea acerca del valor que deben tomar los par"metros a y b para que la
distribuci/n beta correspondiente adopte la forma que represente nuestra convicci/n sobre la
proporci/n +, #pidat permite, alternativamente, especificar un valor para la media 0entre ) y %2 y
para la desviaci/n est"ndar 0mayor que )2 de dicha distribuci/n 5 partir de estos datos, el
programa calcula los valores de a y b que definen una distribuci/n beta con la media y desviaci/n
establecidas Aomo estos par"metros tienen que ser mayores que ), la desviaci/n est"ndar no
puede superar un determinado valor, que depende de la media, y que #pidat indica a travs de un
mensaje durante la entrada de datos
5hora se comunican los xitos y fracasos de una experiencia concreta3 xitos7%% y fracasos7%8D,
as como que se quiere un intervalo de probabilidad al D=> y conocer el "rea a la izquierda de
),%( Los resultados son los siguientes4
Kesultados con #pidat ,%4
Anlisis bayesiano. Estimacin de una proporcin
Datos muestrales Nmero
---------------- ------
xitos 11
Fracasos 18
(%
---------------- ------
!otal "##
Distribucin beta A priori A posteriori
------------------------- -------- ------------
$armetro a %&# 1'&#
$armetro b (&# 1)&#
------------------------- -------- ------------
*edia #&%# #&#(
Des+iacin estndar #&1' #&#"
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
#&1"# #&)
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 #&#%(
#&#0# #&#'1
#&1## #&#')
#&"0# #&#0'
#&0## #&#)0
#&(0# #&#((
#&## #&#8
#&0# #&#(
#&(0 #&1#'
1nter+alo de mxima densidad .ue acumula el 0&#2
3.1n4erior 3.5uperior
((
---------- ----------
#&#%0 #&1#1
Tbsrvese que en este ejemplo se ha pedido el "rea a la izquierda de ),%( #l resultado fue ),DD?
#sto quiere decir que, a la luz de los datos, y hecha con ellos la actualizaci/n respecto de nuestra
idea original, se puede asegurar que la probabilidad de que la tasa de inters sea superior a %(>
es virtualmente nula 0),9>2, ya que %;),DD?7),))9, el "rea a la derecha, que es el complemento
del que queda a la izquierda #l "rea entre dos puntos, naturalmente, se calcula rest"ndole al
"rea a la izquierda del mayor el "rea a la izquierda del menor
2. UNA POBLACIN. VALORACIN DE HIPTESIS SOBRE UNA
PROPORCIN
-.1. Pr+(+ri!" i)ual a u"a +"sta"t$
!e valora la hip/tesis 14 +7+
)
frente a la hip/tesis J4 ++
)
#l primer dato que ha de entrarse es el valor de +
)
que se quiere valorar Luego hay que dar la
distribuci/n a priori que se supone para el par"metro + Aomo se explic/ en el subm/dulo de
estimaci/n, se operar" con la distribuci/n $eta0a, b2, y los par"metros a y b pueden introducirse
directamente, o bien estimarse a partir de la media y la desviaci/n est"ndar de la distribuci/n
beta #n cualquiera de los dos casos, la media debe ser aproximadamente igual a +
)
, de modo
que debe cumplirse la condici/n4
)
P
b a
a

+
/
)
P media
lo cual es enteramente razonable, ya que si el usuario pensara a priori que la media del
par"metro fuera diferente de +
)
, no tendra sentido para l hacer la prueba de hip/tesis !i no se
verifica esta condici/n, o m"s especficamente no se cumple que4
015 A 0 ? ?
0
<
+

b a
a
p
#pidat ,% muestra un mensaje de error para informar de que los par"metros a y b no son
compatibles con la proporci/n p
)
y se le da opci/n al usuario de volver a introducirlos
Gebe advertirse que los par"metros a y b solo pueden tomar valores mayores que )3 asimismo, la
media debe ser un valor entre ) y % y la desviaci/n est"ndar ser" positiva y acotada
superiormente por un valor del que #pidat ,% informa, para garantizar que los par"metros a y b
calculados no sean negativos
Gefinida la distribuci/n a priori se podr" visualizar su representaci/n gr"fica, por si el usuario
desea cambiar su posicionamiento a priori luego de ver el gr"fico
#l procedimiento exige que se establezca tambin una probabilidad a priori 002 de la validez de
1 #n ese punto hay que comunicar e y f, donde e es el nmero de xitos y f el de fracasos en
n7eSf experiencias
#pidat ,% computa 0vase 5lbert, %DD?2
%(
entonces el &actor de $ayes a favor de 1 0$&24
(,
2 , 0
2 , 0 2 % 0
) )
f b e a !
b a ! P P
!F
f e
+ +

,
donde $0a, b2 es la funci/n $eta evaluada en 0a, b2, la cual se define del modo siguiente4
2 0
2 0 2 0
2 % 0 2 , 0
%
)
% %
b a
b a
du u u b a !
b a
+


, y donde



)
%
2 0 du e u .
u .
Aomputa tambin el factor de $ayes en contra de 1 0$A24
!F
!1
%

,
y la probabilidad a posteriori de la veracidad de 14
2 % 0
2 M 0
0 !F 0
!F 0
datos # P
+

Gebe tenerse en cuenta que si el usuario no quiere -tomar partido. a priori sobre la validez de
1, puede optar por informar que 07),=, lo cual hace que la probabilidad a posteriori solo quede
en funci/n de $&4
%
2 M 0
+

!F
!F
datos # P
Gebe advertirse que en el marco bayesiano, no se trata de -elegir. entre una hip/tesis y otra, de
rechazar o no la hip/tesis nula, sino de identificar en qu medida una es m"s razonable que la
otra3 tanto el $& como la probabilidad a posteriori sirven a ese fin, aunque esta ltima sea m"s
expresiva para la mayor parte de los usuarios !obre esas bases se pueden tomar decisiones
pr"cticas o incluso hacer otros desarrollos o an"lisis 0tales como la optimizaci/n de decisiones
con la incorporaci/n de funciones de utilidad, no incluidos en el presente programa2
!2emplo
!up/ngase que se discute la validez de una hip/tesis que afirma que la tasa de prevalencia de
cierta enfermedad es igual a ),< !e fija entonces +
)
7),<
+ara representar la curva a priori se eligen a7,,= y b7%,= !e otorga una probabilidad bastante
alta a priori de que tal hip/tesis es cierta4 07),8, y se informa que el resultado de un estudio por
muestreo sobre (D sujetos dio lugar a e7%% y f7%8 #ntonces, los resultados que se obtienen del
programa son4
Kesultados con #pidat ,%4
Anlisis bayesiano. 6aloracin de 7iptesis sobre una proporcin
8iptesis9 $roporcin : #&(#
$robabilidad a priori de la +alide- de 89 #&8#
Datos muestrales Nmero
------------------- ------
(9
xitos 11
Fracasos 18
------------------- ------
!otal "
Distribucin beta A priori A posteriori
------------------- -------- ------------
$armetro a %&0 1'&0
$armetro b 1&0 1&0
------------------- -------- ------------
*edia #&(# #&'%
Des+iacin estndar #&1 #&#8
Factor de ;ayes a 4a+or de 8 <;F= 9 #&#1%
Factor de ;ayes en contra de 8 <;>= 9 (8&'"8
$robabilidad a posteriori de la +eracidad de 8 9 #&#'
#sto significa que es <8 veces m"s probable que sea cierta la hip/tesis complementaria a que lo
sea 1 !i se incorpora la probabilidad a priori que se haba dado para este hecho, se obtiene la
probabilidad de que 1 sea cierta3 un nmero sumamente bajo4 7),)9D
-.-. Pr+(+ri!" #$"tr+ #$ u" i"t$r3al+
#n este caso se valora la hip/tesis 14 +N+
%
, +
(
O frente a la hip/tesis complementaria J4 +X+
%
/
+V+
(

5dem"s de los valores de +


%
y +
(
, deben proveerse al programa los par"metros de la distribuci/n
beta 0a y b2, que caracterizan la apreciaci/n a priori del investigador sobre la distribuci/n del
par"metro de inters Los valores de a y b pueden introducirse directamente, o bien estimarse a
partir de la media y la desviaci/n est"ndar de la distribuci/n beta Gefinida la distribuci/n a
priori, se podr" visualizar su representaci/n gr"fica, por si el usuario desea cambiar su
posicionamiento a priori luego de ver el gr"fico
#l procedimiento exige que se establezca tambin una probabilidad a priori 002 de la validez de
1 #n ese punto hay que comunicar e y f, donde e es el nmero de xitos y f el de fracasos en
n7eSf experiencias
(=
#pidat ,% computa, entonces, la probabilidad de la hip/tesis4
2 0 2 0 2 0
% (
P F P F # P
donde &0+2 es la funci/n de distribuci/n a posteriori evaluada en + 0"rea bajo la curva de
densidad a posteriori que queda a la izquierda de +2,
el &actor de $ayes a favor de 1 0$&24
2 0
2 0
" P
# P
!F
y la probabilidad a posteriori de la veracidad de 14
0 0!F
0!F
PP
+

%
Yuiere esto decir que la idea inicial que se tena acerca de cu"n probablemente cierta era la
hip/tesis se transforma, y la probabilidad, luego de haber observado los datos, pasa a ser ++
Gebe tenerse en cuenta que si el usuario no quiere -tomar partido. a priori sobre la validez de
1, puede optar por informar que 07),=, lo cual hace que la probabilidad a posteriori solo quede
en funci/n de $&4
% +

!F
!F
PP
lo cual, a su vez, equivale a que ++7+012
!2emplo
!up/ngase que se valora la hip/tesis correspondiente al caso +
%
7),= y +
(
7),8 +ara representar la
curva a priori se eligen a7,,= y b7%,= !e otorga una probabilidad bastante alta a priori de que tal
hip/tesis es cierta 007),82 y se informa que el resultado de un estudio por muestreo sobre (D
sujetos dio lugar a e7%% y f7%8
#ntonces, los resultados que se obtienen del programa son4
$robabilidad de la 7iptesis 8 9 #&1"
Factor de ;ayes a 4a+or de 8 <;F= 9 #&"%8
$robabilidad a posteriori de la +eracidad de 8 9 #&'88
*/tese que aunque la fracci/n de -xitos.0%%Z(D7),,82 es considerablemente inferior al extremo
inferior del intervalo N),=);),8)O, la probabilidad de que el porcentaje poblacional est dentro de
dicho intervalo dista de ser peque'a #llo se debe al alto valor que a priori se atribuye a la
veracidad de 1
)

3. DOS POBLACIONES. ESTIMACIN DE UNA DIFERENCIA DE


PROPORCIONES
#n la parte inicial de esta ayuda se resolvi/ un problema tpico de la investigaci/n mdica a
travs de una prueba de hip/tesis 5 continuaci/n, se expone la soluci/n de este problema bajo
(?
el enfoque bayesiano Gicha soluci/n, como se ver", transita precisamente por la estimaci/n de
una diferencia de proporciones
Kecurdese que se trataba de un ensayo clnico para valorar si los pacientes afectados por
quemaduras hipodrmicas se recuperan m"s r"pidamente cuando el tratamiento combina cierta
crema antisptica con un ap/sito hidrocoloide que cuando se utiliza solamente la crema
antisptica !e conoce con bastante certeza que solo aproximadamente el ?)> de los pacientes se
recupera con este ltimo recurso #l equipo investigador tiene, por otra parte, motivos te/ricos e
indicios empricos surgidos de la literatura y del trabajo cotidiano de enfermera que hacen
pensar con bastante optimismo que el tratamiento combinado es m"s efectivo que el tratamiento
simple
,

!e haba organizado un experimento con n pacientes, nZ( de los cuales se eligen aleatoriamente
para ser atendidos con el tratamiento novedoso 0combinaci/n de crema antisptica y ap/sito
hidrocoloide2, en tanto que a los nZ( restantes se les aplicar" el tratamiento convencional 0crema
solamente2
#n el ejemplo interesa ganar conocimiento acerca de dos proporciones4 las tasas +
e
y +
c
de
recuperaci/n en cierto lapso con los tratamientos experimental y convencional respectivamente
Aada una de ellas es un valor que puede coincidir con cualquiera de los infinitos nmeros reales
que se hallan entre ) y % Gesde luego, se ignora cu"les son esos dos valores3 pero ello no quiere
decir que no se sepa absolutamente nada sobre ellos Aomo se ha dicho, el primer paso de este
enfoque exige expresar nuestras ideas iniciales 0a priori2 mediante una distribuci/n de
probabilidades para cada proporci/n Kecurdese que los investigadores consideran de
antemano, sobre bases racionales, te/ricas e incluso empricas, que es muy verosmil que el
tratamiento que combina la crema antisptica con el ap/sito hidrocoloide sea m"s efectivo que el
tratamiento con crema solamente 0de lo contrario no planificaran el ensayo2 #n este caso, el
enfoque bayesiano exige que el investigador consiga expresar en trminos probabilsticos su
conocimiento 0y su ignorancia2 sobre esta proporci/n3 es decir, que declare las zonas del
intervalo 0),%2 en las que resulta virtualmente imposible que se halle el valor, as como el grado
en que considera probable que ste se ubique en otros intervalos de las zonas complementarias
La asignaci/n de las probabilidades a priori, por ejemplo, puede dar cuenta de la convicci/n
anticipada de que +
c
se encuentra casi con seguridad entre ),9 y ),8, con alta probabilidad en una
vecindad de ),?, y que se reduce r"pidamente cuando se aleja de ese punto3 y en cuanto a +
e
, que
se halla en un entorno de ),8, con muy escasa probabilidad de estar fuera del intervalo N),< 3
),DO
(

Aomo se haba visto en el caso de la estimaci/n de proporciones, la forma funcional m"s


empleada para una densidad a priori es la que se asocia a la distribuci/n beta 0vanse la
definici/n y diversas propiedades de esta distribuci/n en la ayuda destinada a la estimaci/n de
una proporci/n2 #n este caso, en que se tienen dos proporciones, procede que los investigadores
especifiquen valores de a y b para cada una de ellas con acuerdo a la visi/n arriba descrita #l
investigador puede -jugar. con los valores de a y b, e ir observando los gr"ficos hasta arribar al
que resulte m"s apropiado de acuerdo con sus creencias a priori sobre cada una de las
proporciones de inters #pidat ,% ofrece exactamente esta interfase gr"fica con el usuario #n el
ejemplo, la distribuci/n beta a priori para +
e
que se ajusta a la visi/n descrita podra ser la que
tiene par"metros a
e
7<( y b
e
7%8, y en el caso de +
c
, la distribuci/n beta con par"metros a
c
7=< y
(<
b
c
7,8 La figura siguiente muestra estas funciones de densidad seleccionadas a priori para las
proporciones +
e
y +
c
tal y como se obtienen a travs de #pidat ,% 0%;@ratamiento experimental,
(; @ratamiento convencional24
#pidat ,% tambin ofrece la posibilidad de especificar la media y la desviaci/n est"ndar para cada
una de las distribuciones beta a priori sobre las dos proporciones 5 partir de estos datos, el
programa calcula, en cada caso, los valores de a y b que definen una distribuci/n beta con la media
y desviaci/n establecidas Aomo estos par"metros tienen que ser mayores que ), la desviaci/n
est"ndar no puede superar un determinado valor, que depende de la media, y que #pidat indica a
travs de un mensaje durante la entrada de datos
#n el ejemplo, para los datos de la @abla % se tena4 e
e
7,) y f
e
7%) por una parte, y e
c
7(9 y f
c
7%?
por otra3 como a
e
7<(, b
e
7%8, a
c
7=< y b
c
7,8, ahora las distribuciones a posteriori para +
e
y +
c
seran, respectivamente, $eta
e
0%)(, (82 y $eta
c
08%, =92
5n"logamente, si los resultados experimentales hubieran sido los de la @abla ( para la cual
e
e
7%),, f
e
7D<, e
c
7%() y f
c
78), las distribuciones a posteriori para +
e
y +
c
seran, respectivamente,
$eta
e
0%<=, %%=2 y $eta
c
0%<<, %%82
#pidat ,% pide los resultados de la experiencia, genera las distribuciones actualizadas y luego,
para cada una de tales distribuciones a posteriori, se genera cierto nmero s de datos simulados
0el mismo nmero para ambas2 y se calculan las s diferencias Aon ellas, finalmente, el programa
construye una distribuci/n emprica que ser" empleada posteriormente para hacer juicios
probabilsticos concernientes a la diferencia entre los porcentajes
#n nuestro ejemplo, adem"s de los par"metros que definen las distribuciones a priori y de los
resultados del ensayo 0primero de los dos escenarios considerados2, el usuario debe comunicar
el nmero de simulaciones que ha de realizarse 0p/ngase por caso que fueran %))))2 y tambin
0si lo desea2 los puntos para los cuales se quiere el "rea a la izquierda bajo la distribuci/n de las
diferencias entre las proporciones
+or ejemplo, puede pedirse la probabilidad de que la diferencia est ubicada a la izquierda de
),%) #l resultado del an"lisis bayesiano sera como sigue4
Kesultados con #pidat ,%
Anlisis bayesiano. Estimacin de una di4erencia de proporciones
(8
Datos muestrales $oblacin 1 $oblacin "
---------------- ----------- -----------
xitos %# "'
Fracasos 1# 1)
---------------- ----------- -----------
!otal '# '#
Distribuciones beta a priori $oblacin 1 $oblacin "
---------------------------- ----------- -----------
$armetro a ("&# 0(&#
$armetro b 18&# %8&#
---------------------------- ----------- -----------
*edia #&8# #&)#
Des+iacin estndar #&#' #&#0
Distribucin emp?rica a posteriori de las di4erencias
Nmero de simulaciones9 1####

*edia
----------
#&18'
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
#&1## #&#)%
$ercentiles rele+antes
$ercentil $unto
--------- ----------
#&#"0 #&#(%
#&#0# #&#'
#&1## #&11%
#&"0# #&1'8
#&0## #&180
#&(0# #&""1
#&## #&"00
#&0# #&"(0
(D
#&(0 #&"%
La figura representa la distribuci/n emprica de la diferencia entre las proporciones de curaci/n
usando los hipotticos datos experimentales de la @abla % Gebe tenerse en cuenta que si se
repitiera esta solicitud, #pidat ,% producira percentiles diferentes a estos, ya que se construyen
con el resultado de las %)))) simulaciones, las cuales son diferentes cada vez
Aomo se ve, en el caso en que se utiliza la informaci/n de la @abla %, la zona m"s probable de la
diferencia se ubica en un entorno de ),%8 !e recordar" que, bajo el enfoque frecuentista, el
investigador no poda arribar a conclusi/n alguna una vez realizada la prueba
(
, ya que la falta
de significaci/n estadstica solo le permita afirmar que no exista evidencia muestral suficiente
como para declarar la superioridad del tratamiento novedoso !in embargo, el enfoque
bayesiano permite computar probabilidades con las que se pueden hacer afirmaciones
razonables y precisas4 por ejemplo, que la probabilidad de que la diferencia entre las
proporciones de curaci/n entre estos tratamientos sea como mnimo de un %)>, asciende a %;
),)?,7),D,< 0un D,,<>, lo que vale decir que es virtualmente seguro que el tratamiento nuevo
hace un aporte sustancial2
:n proceso similar para los datos de la @abla (, produce los siguientes resultados4
Anlisis bayesiano. Estimacin de una di4erencia de proporciones
Datos muestrales $oblacin 1 $oblacin "
---------------- ----------- -----------
xitos 1#% 1"#
Fracasos ( 8#
---------------- ----------- -----------
!otal "## "##
Distribuciones beta a priori $oblacin 1 $oblacin "
---------------------------- ----------- -----------
$armetro a ("&# 0(&#
$armetro b 18&# %8&#
---------------------------- ----------- -----------
*edia #&8# #&)#
Des+iacin estndar #&#' #&#0
Distribucin emp?rica a posteriori de las di4erencias
Nmero de simulaciones9 1####
,)

*edia
----------
#&##%
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
#&1## #&%
$ercentiles rele+antes
$ercentil $unto
--------- ----------
#&#"0 -#&#(0
#&#0# -#&#)%
#&1## -#&#'
#&"0# -#&#"'
#&0## #&##"
#&(0# #&#%#
#&## #&#00
#&0# #&#)8
#&(0 #&#81
5l considerar bayesianamente el caso en que los resultados del experimento contradicen las
convicciones previas del investigador, con los mismos par"metros de la distribuci/n beta a
priori y los resultados de la @abla (, la diferencia entre los tratamientos se -mueve. en torno al
cero, como se observa en la figura !i bien, como se recordar", bajo el marco frecuentista se
rechazara 0al nivel 7),%2 la hip/tesis de que el tratamiento que utiliza crema y ap/sito es
equivalente al que prescinde del ap/sito 0y que tal rechazo se hara en favor del segundo2, con
este enfoque se obtiene que la probabilidad de que la diferencia entre los porcentajes de
recuperaci/n sea mayor que un %)> es pr"cticamente despreciable 0apenas un ),<>2, en tanto
que la probabilidad de que el porcentaje de recuperaci/n del tratamiento novedoso supere al del
convencional en menos de un => es enorme 08=,<>2 #n fin, puesto que la diferencia se halla en
un entorno de ) con una masa grande en vecindades estrechas de ese nmero, habra que
concluir que los tratamientos son en esencia equivalentes #n este caso, la asignaci/n de las
probabilidades a priori que hizo el investigador desempe'a un papel singularmente atractivo4
n/tese que, aunque su teora a favor del tratamiento experimental est" enfrentando un notable
embate emprico, no es suplantada por una afirmaci/n radicalmente opuesta a sus
,%
conocimientos y experiencias anteriores, como habra que hacer bajo el enfoque frecuentista, a la
vez que el resultado de la experiencia tiene peso suficiente como para cuestionar aquella
convicci/n
Lo cierto es que los mtodos bayesianos siempre permiten arribar a alguna conclusi/n, que por
otra parte resulta menos rgida, y en ese sentido m"s cercana al sentido comn, que la que dictan
los mtodos frecuentistas
4. DOS POBLACIONES. VALORACIN DE HIPTESIS SOBRE UNA
DIFERENCIA DE PROPORCIONES
..1. I)ual#a# #$ (r+(+ri+"$s
!e valora la hip/tesis 14+
%
7+
(
contra la hip/tesis J4+
%
+
(

Gebe comenzarse dando la probabilidad a priori 002 de la validez de 1 Luego hay que definir la
distribuci/n $eta0a
%
, b
%
2 a priori en el supuesto de que valga la hip/tesis 1 #sto, como en los
casos anteriormente explicados, se puede hacer dando directamente los valores de los
par"metros a
%
y b
%
, o especificando la media y la desviaci/n est"ndar de la distribuci/n beta
5simismo hay que definir, del mismo modo, la distribuci/n $eta0a
(
, b
(
2 a priori de la segunda
proporci/n en el supuesto de que *T vale 1 #s decir, expresar nuestra convicci/n acerca del
posible valor de +
(
, supuesto que no coincide con +
%
&inalmente, se informar"n los valores e
%
y
f
%
, donde e
%
es el nmero de xitos y f
%
el de fracasos en n
%
7e
%
Sf
%
experiencias llevadas adelante en
el primer caso, as como e
(
y f
(
, donde e
(
es el nmero de xitos y f
(
el de fracasos en n
(
7e
(
Sf
(
experiencias llevadas adelante en el segundo caso
La salida es el factor de $ayes a favor de 1 0vanse las definiciones de esta noci/n y de los
conceptos afines en la ayuda correspondiente a pruebas de hip/tesis con una sola proporci/n2,
que #pidat ,% calcula usando la siguiente expresi/n4
2 , 0 2 , 0
2 , 0 2 , 0
( ( ( ( % % % %
( ( ( % % ( % %
f b e a ! f b e a !
b a ! f f b e e a !
!F
+ + + +
+ + + +

donde $0x,y2 denota la funci/n beta evaluada en 0x,y2


!e obtienen, asimismo, el factor de $ayes en contra de 14
!F
!1
%
,
y la probabilidad a posteriori de la veracidad de 14
2 % 0
2 M 0
0 !F 0
!F 0
datos # P
+

!2emplo
,(
+ara el ejemplo del ensayo clnico sobre tratamientos a quemados expuesto en secciones
anteriores de esta ayuda, y admitiendo 07),%, se tendra4
a
%
7<( b
%
7%8 a
(
7=< b
(
7,8
e
%
7,) f
%
7%) e
(
7(9 f
(
7%?
Los resultados con #pidat ,% son4
Anlisis bayesiano. 6aloracin de 7iptesis sobre una di4erencia de
proporciones
8iptesis9 1/ualdad de proporciones
$robabilidad a priori de la +alide- de 89 #&1
Datos muestrales $oblacin 1 $oblacin "
---------------- ----------- -----------
xitos %# "'
Fracasos 1# 1)
---------------- ----------- -----------
!otal '# '#
Distribuciones beta a priori $oblacin 1 $oblacin "
---------------------------- ----------- -----------
$armetro a ("&# 0(&#
$armetro b 18&# %8&#
---------------------------- ----------- -----------
*edia #&8# #&)#
Des+iacin estndar #&#' #&#0
Factor de ;ayes a 4a+or de 8 <;F= 9 #&#()
Factor de ;ayes en contra de 8 <;>= 9 1%&"1#
$robabilidad a posteriori de la +eracidad de 8 9 #&##8
Los resultados son claros4 la hip/tesis de nulidad tiene un respaldo muy bajo si se compara con
la que afirma que los tratamientos difieren Luego de haber observado los datos y teniendo en
cuenta el conocimiento previo, la probabilidad de que los procedimientos teraputicos puedan
considerase equivalentes es de 8 entre %)))
..-. Di6$r$"ia #$ (r+(+ri+"$s #$"tr+ #$ u" i"t$r3al+
!e valora la hip/tesis 14 +
%
;+
(
N+
,
, +
9
O contra la hip/tesis complementaria4
J4 +
%
;+
(
X+
,
/ +
%
;+
(
V+
9

Gebe comenzarse especificando los valores de +


,
y +
9
, y definiendo las dos distribuciones a
priori, $eta0a
%
, b
%
2 y $eta0a
(
, b
(
2 #sto, como en casos previos, se puede hacer dando directamente
los valores de los par"metros a y b, o especificando la media y la desviaci/n est"ndar de la
distribuci/n beta &inalmente, se informar"n los valores e
%
y f
%
, donde e
%
es el nmero de xitos y
f
%
el de fracasos en n
%
7e
%
Sf
%
experiencias llevadas adelante en el primer caso, as como e
(
y f
(
,
donde e
(
es el nmero de xitos y f
(
el de fracasos en n
(
7e
(
Sf
(
experiencias llevadas adelante en el
,,
segundo caso @ambin hay que indicar la probabilidad a priori 002 de la validez de la hip/tesis
1
#l mtodo opera por simulaci/n, de modo que hay que decidir el nmero n de simulaciones a
realizar 0no menor de =))2
Aon esos datos, #pidat ,% procede a generar n valores de la distribuci/n $eta0a
%
Se
%
, b
%
Sf
%
24
y
%%
, y
%(
, , y
%n
y n valores de la distribuci/n $eta0a
(
Se
(
, b
(
Sf
(
24 y
(%
, y
((
, , y
(n
para luego formar las n
diferencias4 d
i
7y
%i
Wy
(i
con las que opera para producir las salidas #stas son4
La probabilidad de la hip/tesis4
2 0 2 0 2 0
, 9
P F P F # P ,
el factor de $ayes a favor de 14
2 0
2 0
" P
# P
!F
,
y la probabilidad a posteriori de la veracidad de 14
0 0!F
0!F
PP
+

!2emplo
+ara el ejemplo del ensayo clnico sobre tratamientos a quemados expuesto en secciones
anteriores de esta ayuda, y admitiendo 07),,3 n7%))))3 +
,
7),() y +
9
7),,= con los datos ya
conocidos4
a
%
7<( b
%
7%8 a
(
7=< b
(
7,8
e
%
7,) f
%
7%) e
(
7(9 f
(
7%?
los resultados con #pidat ,% son4
Anlisis bayesiano. 6aloracin de 7iptesis sobre una di4erencia de
proporciones
8iptesis9 Di4erencia de proporciones @#&"# & #&%0A
$robabilidad a priori de la +alide- de 89 #&%#
Datos muestrales $oblacin 1 $oblacin "
---------------- ----------- -----------
xitos %# "'
Fracasos 1# 1)
---------------- ----------- -----------
!otal '# '#
Distribuciones beta a priori $oblacin 1 $oblacin "
---------------------------- ----------- -----------
$armetro a ("&# 0(&#
$armetro b 18&# %8&#
---------------------------- ----------- -----------
,9
*edia #&8# #&)#
Des+iacin estndar #&#' #&#0
Distribucin emp?rica a posteriori de las di4erencias
Nmero de simulaciones9 1####
$robabilidad de la 7iptesis 89 #&'1"
Factor de ;ayes a 4a+or de 8 <;F=9 #&(#1
$robabilidad a posteriori de la +eracidad de 89 #&"%1
5. UNA POBLACIN. ESTIMACIN DE UNA MEDIA
@areas muy frecuentes en el mundo investigativo biomdico est"n relacionadas con datos
correspondientes a variables continuas, para los cuales no es v"lida la divisi/n en -xitos. y
-fracasos. Aomo las distribuciones poblacionales generalmente tienen la forma de la funci/n de
densidad normal, para estimar una media suele suponerse que los datos poblacionales siguen
tal distribuci/n con una media & y una desviaci/n est"ndar +
+ara ilustrar el procedimiento bayesiano orientado a conocer acerca de la media poblacional,
considrese el siguiente ejemplo !up/ngase que se realiza un estudio en una escuela primaria
enclavada en un barrio marginal con el fin de examinar la situaci/n en materia estomatol/gica3
b"sicamente, se quiere conocer el promedio de caries por ni'o +uesto que el estomat/logo ha
estudiado profundamente la enfermedad, y tiene conocimientos y experiencias anteriores
obtenidas de su trabajo en esa escuela con los ni'os, est" persuadido, por poner un ejemplo
burdo, de que el promedio de caries es, casi con seguridad, mayor que ),=
!up/ngase que se le realiz/ el examen bucal a ,) ni'os, y que los resultados arrojan que el
promedio de caries fue de ,,= y la desviaci/n est"ndar de %,=
La soluci/n convencional acude a la obtenci/n de un intervalo de confianza La tcnica
estadstica para el caso de una media utiliza un estadstico que sigue una distribuci/n t de
!tudent 5l aplicarla se obtiene que, para un nivel de confianza del D=>, el intervalo es
N(,D9 3 9,)?O
[eamos la soluci/n bayesiana #n esta situaci/n no es razonable asumir priors uniformes, pues,
como se haba dicho, la enfermedad se conoce suficientemente como para establecer valores a
priori de su frecuencia Ge modo que el investigador puede asumir, por ejemplo, que el
promedio de caries se encuentra alrededor de ,, pero no resultara muy sorprendente si fuera %
,=
/ = !up/ngase que se decide a priori que el promedio de caries es , 0m
)
7,2 y la desviaci/n
est"ndar %,=? 0s
)
7%,=?2 $erry
%,
proporciona un mtodo para calcular la desviaci/n est"ndar
!up/ngase que se tiene un %)> de probabilidad a priori de que la media es mayor que = Ge
acuerdo con la tabla de la distribuci/n normal est"ndar, el valor de z que tiene un %)> de
probabilidad a su derecha es %,(8 Ge modo que, suponiendo que nuestra percepci/n a priori es
que la media muestral sigue una distribuci/n normal, se tiene4
(8 , %
, =

s
z y, despejando, se obtiene4
=? , %
(8 , %
(
s

5 continuaci/n, solo resta conjugar este supuesto con los resultados que arroj/ el examen bucal
en una muestra 0informaci/n emprica2 y de ese modo obtener una distribuci/n normal
actualizada Kecurdese que se examinaron ,) ni'os 0n7,)2, y que el promedio de caries fue de
,,= 0 = , , . 2 y la desviaci/n est"ndar de %,= 0s7%,=2
Auando la distribuci/n a priori es normal, como ocurre en este caso, se calculan4
(
)
)
%
s
c
3
(
()
(
2 % 0
(
n
s
n
c
+

3
c c c +
) %

Aon los datos muestrales y la informaci/n a priori se calculan la media y la desviaci/n de la


distribuci/n a posteriori, que tambin ser" normal4
%
) )
c
. c m c
m
p
+
3
%
%
c
s
p

La media de la distribuci/n a posteriori es ,,98 y la desviaci/n est"ndar ),(8 La curva posterior,


resultante de la uni/n de ambas informaciones a travs de mtodos bayesianos, es m"s estrecha
que la densidad a priori
!e puede conocer ahora la probabilidad de que sean v"lidos ciertos valores3 en este caso, la
probabilidad de que el promedio de caries por ni'o sea mayor o menor que un valor dado +or
ejemplo, la probabilidad de que sea menor que , 0valor fijado a priori por el investigador2 es
igual a ),)9
+or ltimo, tambin pueden calcularse intervalos de probabilidad para el promedio de caries
por ni'o :n intervalo de probabilidad al D=>, que es a su vez el de m"xima densidad por ser
simtrica la curva de densidad normal, tiene como lmite inferior a (,D9 y como lmite superior a
9,)( #l resultado es, en este caso, virtualmente igual al que arroja el enfoque frecuentista,
aunque la interpretaci/n, desde luego, no
!e ha desarrollado un ejemplo en el cual el investigador anticipa una distribuci/n normal para la
variable de trabajo, pero #pidat ,% contempla la posibilidad de que se trabaje con priors no
informativos 0con la distribuci/n uniforme en lugar de la normal2 Ge modo que lo primero que
se pide al usuario es que responda si la distribuci/n a priori que usar" es la uniforme o la
normal #n cualquiera de los dos casos, la distribuci/n a posteriori ser" normal
!i responde que es la normal, se le har" otra pregunta4 Eva a dar directamente los par"metros
0media y una desviaci/n est"ndar a priori4 m
)
y s
)
2 o desea calcularlos a partir de dos valores
posibles de la media 0dgase /
%
y /
(
2 de /, y respectivas probabilidades 0"reas a la izquierda de
,?
esos puntos2F #n el primer caso, han de teclearse m
)
y s
)
#n el segundo deben pedrsele los dos
valores /
%
y /
(
, y las probabilidades asociadas +
%
y +
(
Aon esos cuatro datos, #pidat ,% calcula4
( %
( %
)

/ /
s
y
( ) % )
s / m
donde = >
1
i i
P

, es decir, la inversa de la distribuci/n normal est"ndar aplicada a la


probabilidad +
i
0i7%, (2
#n cualquiera de los dos casos, se mostrar" el gr"fico de la densidad resultante, *ormal0m
)
, s
)
2 y
se pedir" al usuario que confirme los datos que ha dado !i no los confirma, se regresa al punto
inicial
Luego, en cualquier variante, hay que comunicar el tama'o muestral n y los resultados de la
experiencia emprica4 la media muestral y la desviaci/n est"ndar muestral4
.
y s
#n ese punto el programa calcula4
(
()
(
2 % 0
(
n
s
n
c
+

y
c c c +
) %
,
donde4
)
)
c
, si la distribuci/n a priori es la uniforme,
(
)
)
%
s
c
si la distribuci/n a priori es normal
Las salidas que ofrece #pidat ,% son4
\edia de la distribuci/n a posteriori4
1
0 0
c
x c m c
m
p
+

Gesviaci/n de la distribuci/n a posteriori4


%
%
c
s
p

#stimaci/n paramtrica de percentiles de la distribuci/n normal 0a posteriori2 m"s


relevantes4 (,=3 =3 %)3 (=3 =)3 <=3 D)3 D=3 D<,=
#stimaci/n paramtrica de probabilidades 0"reas a la izquierda2 correspondientes a
valores comunicados por el usuario
Lr"fico de la curva normal a posteriori 0en el caso de la normal, se incluye tambin la
distribuci/n a priori junto con esta curva3 si se opt/ por la uniforme, entonces solo
aparecer" la densidad a posteriori2
6ntervalo de probabilidad al 0%;2%))>4
( )
2 2
1
B

X X

!2emplo
,<
!i se usa la distribuci/n uniforme y se informan los datos siguientes4
.
7%<?3 s7,,%? y n7%), as
como que se quiere conocer la probabilidad de que el valor de la variable sea menor que %<<,
entonces el resultado es el siguiente4
Anlisis bayesiano. Estimacin de una media
Datos muestrales 6alor
------------------- ------
*edia 1()&##
Des+iacin estndar %&1)
!amaBo de muestra 1#
Distribucin a priori9 Cni4orme
Distribucin normal a posteriori 6alor
-------------------------------- -------
*edia 1()&##
Des+iacin estndar 1&"#
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
1((&### #&(8
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 1(%&)0#
#&#0# 1('&#"8
#&1## 1('&')%
#&"0# 1(0&11
#&0## 1()&###
#&(0# 1()&8#
#&## 1((&0%(
#&0# 1((&("
#&(0 1(8&%0#
1nter+alo de probabilidad <02=
3.1n4erior 3.5uperior
---------- ----------
1(%&)0# 1(8&%0#
!i se elige la distribuci/n a priori normal con m
)
y s
)
conocidas y se informa que m
)
7%<93 s
)
79,?D3
.
7%<?3 s7,,%? y n7%), as como que se quiere conocer la probabilidad de que el valor de la
variable sea menor que %<<, se obtiene4
Anlisis bayesiano. Estimacin de una media
Datos muestrales 6alor
,8
------------------- ------
*edia 1()&##
Des+iacin estndar %&1)
!amaBo de muestra 1#
Distribucin a priori9 Normal
Distribucin normal A priori A posteriori
------------------- -------- ------------
*edia 1('&## 1(0&88
Des+iacin estndar '&) 1&1)
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
1((&### #&8%%
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 1(%&)##
#&#0# 1(%&))
#&1## 1('&%88
#&"0# 1(0&#'
#&0## 1(0&8((
#&(0# 1()&))1
#&## 1((&%))
#&0# 1((&(88
#&(0 1(8&10'
1nter+alo de probabilidad <02=
3.1n4erior 3.5uperior
---------- ----------
1(%&)## 1(8&10'
Tbsrvese la notable consistencia entre los resultados, independientemente de que se fije una
distribuci/n a priori normal o uniforme #sto no tiene porqu ocurrir siempre, pero cuando s
pasa, como ahora, ello ofrece especial respaldo a las conclusiones
&inalmente, si se elige una distribuci/n a priori normal pero a partir de los puntos /
%
y /
(
, y las
probabilidades asociadas +
%
y +
(
,y si se comunicaran los valores para /
%
7%<93 +
%
7),=3 /
(
7%8)3
+
(
7),D3 x 7%<?3 s7,,%? y n7%), as como que se quiere conocer la probabilidad de que el valor de
la variable sea menor que %<< se obtiene4
Anlisis bayesiano. Estimacin de una media
Datos muestrales 6alor
------------------- ------
*edia 1()&##
Des+iacin estndar %&1)
!amaBo de muestra 1#
Distribucin a priori9 Normal
$armetros de entrada 6alor 1 6alor "
--------------------- ------- -------
,D
$unto 1('&## 18#&##
$robabilidad #&0# #&#
Distribucin normal A priori A posteriori
------------------- -------- ------------
*edia 1('&## 1(0&88
Des+iacin estndar '&)8 1&1)
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
1((&### #&8%%
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 1(%&)##
#&#0# 1(%&))
#&1## 1('&%88
#&"0# 1(0&#%
#&0## 1(0&8((
#&(0# 1()&))#
#&## 1((&%))
#&0# 1((&(88
#&(0 1(8&10'
1nter+alo de probabilidad <02=
3.1n4erior 3.5uperior
---------- ----------
1(%&)## 1(8&10'
Los resultados son los mismos que en el caso anterior porque la informaci/n que se haba dado
antes para m
2
y s
2
es equivalente a la que se ha dado ahora para X
%
,X
(
,+
%
y +
(
0los dos primeros se
deducen de estos 9 y viceversa2
. UNA POBLACIN. VALORACIN DE HIPTESIS SOBRE UNA MEDIA
<.1. M$#ia i)ual a u"a +"sta"t$
!e trata de valorar la hip/tesis 14 m 7 m
)
frente a la hip/tesis J4 m m
)

Los datos de entrada son el valor de m


)
y la desviaci/n est"ndar poblacional que se
presuponen, la probabilidad a priori de la validez de 1 002 y la desviaci/n est"ndar de la
distribuci/n a priori bajo la hip/tesis J 0t2 &inalmente, han de comunicarse los datos empricos4
media muestral y tama'o muestral4 x y n
#pidat ,% procede a computar el factor de $ayes 0vase 5lbert, %DD?2
%(
a favor de la hip/tesis4
9)
( )
( )
1
1
1
1
]
1

,
_

,
_

+
1
]
1

2
2
2
0
2
1
2
2
2
0 2
2
'C/
2
'C/
t
n
m x
t
n
m x
n n
BF


,
el factor de $ayes en contra de 14
!F
!1
%
,
y la probabilidad a posteriori de la veracidad de 14
2 % 0
2 M 0
0 !F 0
!F 0
datos # P
+

!2emplo
!up/ngase que las entradas son4 m
)
7%<)3 7,3 07),=3 t7),=3 . 7%<? y n7%)
#ntonces, los resultados que se obtienen son4
Anlisis bayesiano. 6aloracin de 7iptesis sobre una media
8iptesis 9 *edia : 1(#&##
$robabilidad a priori de la +alide- de 89 #&0#
Des+iacin estndar 6alor
------------------- ------
$oblacional %&##
A priori #&0#
Datos muestrales 6alor
------------------- ------
*edia 1()&##
!amaBo de muestra 1#
Factor de ;ayes a 4a+or de 8 <;F=9 #&#10
Factor de ;ayes en contra de 8 <;>=9 )8&%%
$robabilidad a posteriori de la +eracidad de 89 #&#1'
9%
<.-. M$#ia #$"tr+ #$ u" i"t$r3al+
!e valora la hip/tesis 14 mNm
%
, m
(
O frente a la hip/tesis J4 mXm
%
/ mVm
(

#ste procedimiento asume distribuci/n a priori uniforme 0es decir, priors no informativos2 Las
entradas son los valores de m
%
y m
(
, la probabilidad a priori 002 de la validez de 1 y, finalmente,
los resultados empricos4 media, desviaci/n est"ndar y tama'o muestrales4
.
, s y n
#pidat ,% procede como cuando se trataba de estimar una media para el caso uniforme3 en ese
caso, la distribuci/n a posteriori ser" normal con media m
p
y desviaci/n est"ndar s
p

Las salidas que se producen son4


+robabilidad de la hip/tesis4 +0127&0m
(
2W&0m
%
2, donde &0m2 es la funci/n de distribuci/n
evaluada en m, es decir, el "rea bajo la curva de densidad a posteriori 0normal con media
y desviaci/n est"ndar m
p
y s
p
2 que queda a la izquierda de m
&actor de $ayes a favor de 14
2 0
2 0
" P
# P
!F

+robabilidad a posteriori de la veracidad de 14


0 0!F
0!F
PP
+

!2emplo
!up/ngase que las entradas son4 m
%
7%<)3 m
(
7%<83 07),83
.
7%<?3 s7, y n7%)
#ntonces se obtiene4
Anlisis bayesiano. 6aloracin de 7iptesis sobre una media
8iptesis 9 *edia dentro de un inter+alo @1(#&## & 1(8&##A
$robabilidad a priori de la +alide- de 89 #&8#
Datos muestrales 6alor
------------------- ------
*edia 1()&##
Des+iacin estndar %&##
!amaBo de muestra 1#
$robabilidad de la 7iptesis 89 #&)1
Factor de ;ayes a 4a+or de 8 <;F=9 "'&%%%
$robabilidad a posteriori de la +eracidad de 89 #&#
9(
!. DOS POBLACIONES. ESTIMACIN DE UNA DIFERENCIA DE MEDIAS.
M"TODO E#ACTO
#l enfoque convencional para el an"lisis de la diferencia de dos medias, como se sabe, transita
por la formulaci/n de una hip/tesis nula, elegir el nivel de significaci/n , utilizar los datos para
calcular el valor del estadstico, para el cual se utiliza la diferencia de las medias de los dos
grupos 0d7m
%
;m
(
2 y el hecho de que ella sigue una distribuci/n t de !tudent, determinar el valor
p asociado a ese estadstico y, por ltimo, rechazar o no la hip/tesis nula en dependencia del
valor de p !e ha sugerido fuertemente, sin embargo, el empleo de intervalos de confianza para
estimar la diferencia
!up/ngase que se realiza un estudio para evaluar los cambios en la glicemia en pacientes
diabticos controlados y en pacientes sanos !e estudian () pacientes diabticos controlados y 8
libres de esa enfermedad La informaci/n recogida arroja los siguientes datos4
<8 , ?
%
. 3
%% , %
(
%
s
3
()
%
n
8) , ?
(
. 3 =D , )
(
(
s 3
8
(
n
#l intervalo de confianza al 0%;2%))> se obtiene del modo siguiente4
2 0 2 ( 0
( %
(
%
d se n n t d 3im%nf +


2 0 2 ( 0
( %
(
%
d se n n t d 3im+up + +


donde,
( %
. . d ,
( %
% %
2 0
n n
s d se +
,
(
2 % 0 2 % 0
( %
(
( (
(
% %
+
+

n n
s n s n
s ,
2 ( 0
( %
(
%
+

n n t

es el percentil > %)) 2
(
% 0

de la distribuci/n t de !tudent con n
%
Sn
(
;(
grados de libertad
#ste es el procedimiento -usual. que se emplea en el marco frecuentista est"ndar, tal y como se
hace en el m/dulo de inferencia de #pidat ,%
#s f"cil corroborar que, con los datos del ejemplo, se tiene4 d7;),)(3 s7),D8=3 se0d27),9%( y
t
),D<=
0(?27(,)?, de modo que el intervalo de confianza al D=> es N;),8?< 3 ),8(<O
$ajo el enfoque bayesiano, cuando interesa conocer acerca de la diferencia de dos medias, en
#pidat ,% se parte del supuesto de que las medias son independientes y que los datos son
recogidos a partir de dos muestras independientes
#n este caso, hay cuatro par"metros desconocidos4 las medias &
%
y &
(
y las desviaciones
est"ndares +
%
y +
(
de las dos poblaciones Gado que, en general, es difcil establecer una
distribuci/n conjunta para cuatro par"metros, se asume que los par"metros tienen una
distribuci/n a priori no informativa est"ndar proporcional a %Z0+
%
+
(
2 0Nota4 este planteamiento
9,
exhibe dificultades mayores que lo tpico en el presente texto3 por su complejidad, para conocer
m"s detalles, vase 5lbert
%(
2 #ntonces, las medias &
%
y &
(
tienen distribuciones t de !tudent
independientes La distribuci/n a posteriori de la diferencia entre las medias &
(
W&
%
tiene una
forma funcional no est"ndar, por lo que se acude a la simulaci/n Aoncretamente4 se simulan
muestras independientes de un tama'o fijo acordes con las distribuciones posteriores
marginales de &
%
y &
(
, despus se emparejan las observaciones de las dos muestras simuladas y
se toman las diferencias3 entonces se obtienen los valores simulados de la distribuci/n posterior
de la diferencia de medias
#l proceso detallado es como sigue4
!e computan4
(
% %
(
%
s n + y
(
( (
(
(
s n +
!e generan4
n valores y
%%
, y
%(
, , y
%n
con distribuci/n
(
con n
%
;% grados de libertad,
n valores y
(%
, y
((
, , y
(n
con distribuci/n
(
con n
(
;% grados de libertad
!e obtienen dos juegos de n realizaciones z
%%
, z
%(
, , z
%n
y z
(%
, z
((
, , z
(n
con distribuci/n
normal est"ndar
+ara cada i entre % y n se calculan4
%
( %
(
%
(
%
%
.
n y
z +
m
i
i
i
+
y
(
( (
(
(
(
(
(
.
n y
z +
m
i
i
i
+
&inalmente, se obtienen las n diferencias4
i i i
m m d
( %
D

!2emplo
5plicado este procedimiento con n7%)))) simulaciones, y dando los datos arriba expuestos4
<8 , ?
%
. 3
%% , %
(
%
s
0s
%
7%,)=2 y
()
%
n
8) , ?
(
. 3 =D , )
(
(
s 0s
(
7),<<2 y
8
(
n
se obtuvo4
Anlisis bayesiano. Estimacin de una di4erencia de medias por mDtodo exacto
Datos muestrales $oblacin 1 $oblacin "
------------------- ----------- -----------
*edia )&(8 )&8#
Des+iacin estndar 1&#0 #&((
!amaBo de muestra "# 8
Distribucin emp?rica a posteriori de las di4erencias
Nmero de simulaciones9 1####
99

*edia
--------
-#&#8"
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 -#&)'
#&#0# -#&00#
#&1## -#&'1'
#&"0# -#&""%
#&0## -#&#0)
#&(0# #&#8'
#&## #&""8
#&0# #&%"0
#&(0 #&'#)
[ale destacar que este valor tan peque'o 0W),)8(2 de la diferencia media entre pacientes
diabticos controlados y libres de la enfermedad no es sorprendente3 obsrvese que el valor
medio de la glicemia es muy parecido en ambos grupos
5 partir de esta distribuci/n emprica pueden hacerse estimaciones 0no paramtricas2 de inters,
tales como la mediana 0;),)=?2
$. DOS POBLACIONES. ESTIMACIN DE UNA DIFERENCIA DE MEDIAS.
M"TODO APRO#IMADO
#n este caso #pidat ,% procede exactamente como en el caso de la estimaci/n de una media, solo
que dos veces en lugar de una4 una para cada poblaci/n !i se responde que la distribuci/n a
priori es la normal, se le har" otra pregunta4 Eva a dar directamente los par"metros 0media y
desviaci/n est"ndar a priori para cada poblaci/n4 m
)%
, m
)(
, s
)%
y s
)(
2 o desea calcularlos a partir de
dos valores de /, y respectivas probabilidades 0"reas a la izquierda de esos puntos2F
#n el primer caso, han de teclearse m
)%
, m
)(
, s
)%
y s
)(
#n el segundo, deben pedrsele los dos
valores /
%
y /
(
para cada poblaci/n, y las probabilidades asociadas +
%
y +
(
Aon esos datos, se
calculan, tal y como se explic/ en el caso de una sola media, m
p%
, s
p%
primero y m
p(
, s
p(
despus
Aomo la distribuci/n a posteriori de cada media es normal, y stas se suponen independientes,
la distribuci/n a posteriori de la diferencia tambin ser" normal
9=
&inalmente, se pide media, desviaci/n est"ndar y tama'o muestrales para cada poblaci/n4
%
. , s
%,
n
%
y
(
. , s
(,
n
(

Las salidas en este subm/dulo son4


\edia de la distribuci/n a posteriori de la diferencia4 ( % p p
m m m

Gesviaci/n de la distribuci/n a posteriori de la diferencia


(
(
(
% p p
s s s +
#stimaci/n paramtrica de percentiles de la distribuci/n a posteriori m"s relevantes4 (,=3
=3 %)3 (=3 =)3 <=3 D)3 D=3 D<,=
#stimaci/n paramtrica de probabilidades 0"reas a la izquierda2 correspondientes a
valores comunicados por el usuario
Lr"fico de la densidad normal a posteriori de la diferencia con media m y varianza s
(

6ntervalo de probabilidad al 0%;2%))> de la diferencia4


,
_

(
%
(
3

/ /

!2emplo
#l siguiente ejemplo comienza con el caso en que se comunica que ha de emplearse la
distribuci/n uniforme #n tal caso, no hay que dar otra informaci/n adicional fuera de la que
procede de la muestra !up/ngase que las entradas son4
% , <
%
. s
%
7%,%( n
%
7(%
8) , ?
(
. s
(
7),?, n
(
78
as como que se quiere el "rea a la izquierda de ) y de %,(
Las salidas que se obtienen son4
Anlisis bayesiano. Estimacin de una di4erencia de medias por mDtodo
aproximado
Datos muestrales $oblacin 1 $oblacin "
------------------- ----------- -----------
*edia (&1# )&8#
Des+iacin estndar 1&1" #&)%
!amaBo de muestra "1 8
Distribucin a priori9 Cni4orme
9?
Distribucin a posteriori 6alor
------------------------- -----
*edia #&%##
Des+iacin estndar #&%88
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
#&### #&""#
1&"## #&#
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 -#&')1
#&#0# -#&%%
#&1## -#&18
#&"0# #&#%8
#&0## #&%##
#&(0# #&0)"
#&## #&(8
#&0# #&%
#&(0 1&#)1
1nter+alo de probabilidad del 02
3.1n4erior 3.5uperior
---------- ----------
-#&')1 1&#)1
#n el caso en que se comunica que ha de emplearse la distribuci/n normal con medias y
varianzas conocidas, hay que especificar estos datos !up/ngase que las entradas son4
m
)%
7<,< s
)%
7),< m
)(
7<,< s
)(
7),<
% , <
%
. s
%
7%,%( n
%
7(%
8) , ?
(
. s
(
7),?, n
(
78
y que se quiere el "rea a la izquierda de ) y de %,(
9<
Los resultados son4
Anlisis bayesiano. Estimacin de una di4erencia de medias por mDtodo
aproximado
Datos muestrales $oblacin 1 $oblacin "
------------------- ----------- -----------
*edia (&1# )&8#
Des+iacin estndar 1&1" #&)%
!amaBo de muestra "1 8
Distribucin a priori9 Normal
Distribucin normal a priori $oblacin 1 $oblacin "
---------------------------- ----------- -----------
*edia (&(# (&(#
Des+iacin estndar #&(# #&(#
Distribucin a posteriori 6alor
------------------------- -----
*edia #&"%(
Des+iacin estndar #&%)1
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
#&### #&"0)
1&"## #&)
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
#&### #&"0)
98
1&"## #&)
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 -#&'(1
#&#0# -#&%0(
#&1## -#&"")
#&"0# -#&##(
#&0## #&"%(
#&(0# #&'8#
#&## #&(##
#&0# #&8%1
#&(0 #&'0
1nter+alo de probabilidad del 02
3.1n4erior 3.5uperior
---------- ----------
-#&'(1 #&'0
&inalmente, en el caso en que se comunica que ha de emplearse la distribuci/n normal pero a
partir de los puntos /
%%
, /
%(
, /
(%
y /
((
y las probabilidades asociadas +
%%
, +
%(
, +
(%
y +
((
, sup/ngase
que las entradas son4
/
%%
7) /
%(
7%,9( /
(%
7) /
((
7%,=(
+
%%
7),= +
%(
7),8 +
(%
7),= +
((
7),8
% , <
%
. s
%
7%,%( n
%
7(%
8) , ?
(
. s
(
7),?, n
(
78
y que se quiere el "rea a la izquierda de ) y de %,(
!e obtiene lo siguiente4
Anlisis bayesiano. Estimacin de una di4erencia de medias por mDtodo
aproximado
Datos muestrales $oblacin 1 $oblacin "
------------------- ----------- -----------
*edia (&1# )&8#
Des+iacin estndar 1&1" #&)%
!amaBo de muestra "1 8
Distribucin a priori9 Normal
$oblacin 1 $oblacin "
$armetros de entrada 6alor 1 6alor " 6alor 1 6alor "
--------------------- ---------- ---------- ---------- ----------
$unto #&## 1&'" #&## 1&0"
9D
$robabilidad #&0# #&8# #&0# #&8#
Distribucin normal a priori $oblacin 1 $oblacin "
---------------------------- ----------- -----------
*edia #&## #&##
Des+iacin estndar 1&) 1&81
Distribucin a posteriori 6alor
------------------------- -----
*edia #&%1'
Des+iacin estndar #&%8'
,rea a la i-.uierda de los puntos ele/idos
$unto ,rea
---------- ----------
#&### #&"#)
1&"## #&#
$ercentiles rele+antes
,rea $ercentil
---------- ----------
#&#"0 -#&'%(
#&#0# -#&%1)
#&1## -#&1((
#&"0# #&#0)
#&0## #&%1'
#&(0# #&0(%
#&## #&8#)
#&0# #&'0
#&(0 1&#))
1nter+alo de probabilidad del 02
3.1n4erior 3.5uperior
---------- ----------
-#&'%( 1&#))
=)
%. DOS POBLACIONES. VALORACIN DE HIPTESIS SOBRE UNA
DIFERENCIA DE MEDIAS
!e considera la diferencia 4 entre dos medias y se valora la hip/tesis 14 4Nd
%
, d
(
O frente a la
hip/tesis J4 4Xd
%
/ 4Vd
(
#pidat ,% asume distribuci/n a priori uniforme
Los datos de entrada de este subm/dulo son4
\edia, desviaci/n est"ndar y tama'o muestrales en el grupo %4
% . , s
%
y n
%
\edia, desviaci/n est"ndar y tama'o muestrales en el grupo (4
( . , s
(
y n
(
*mero de simulaciones4 n
0Aon estos datos se procede como se hizo en el caso de la estimaci/n de la diferencia de dos
medias, mtodo exacto2
[alores de los extremos involucrados en la hip/tesis4 d
%
y d
(
+robabilidad a priori de la validez de 14 0
Aon esta informaci/n, #pidat ,% produce las salidas siguientes4
+robabilidad de la hip/tesis, +0124 se computa la estimaci/n no paramtrica de esta
probabilidad a partir de la distribuci/n emprica de las diferencias entre las dos medias
&actor de $ayes a favor de 14
2 0
2 0
" P
# P
!F

+robabilidad a posteriori de la veracidad de 14


0 0!F
0!F
PP
+

!2emplo
!up/ngase que se dan los siguientes datos de entrada4
?8
%
. s
%
78 n
%
7=)
?=
(
. s
(
7< n
(
78)
d
%
7( d
(
79 07),?
*mero de simulaciones4 n7%))))
Los resultados que arroja #pidat ,% son4
Anlisis bayesiano. 6aloracin de 7iptesis sobre una di4erencia de medias
8iptesis 9 Di4erencia de medias en un inter+alo @ "&## & '&##A
$robabilidad a priori de la +alide- de 89 #&)##
Datos muestrales $oblacin 1 $oblacin "
------------------- ----------- -----------
*edia )8&## )0&##
Des+iacin estndar 8&## (&##
!amaBo de muestra 0# 8#
=%
Distribucin emp?rica a posteriori de las di4erencias
Nmero de simulaciones9 1####
$robabilidad de la 7iptesis 89 #&(0(
Factor de ;ayes a 4a+or de 8 <;F=9 %&11'
$robabilidad a posteriori de la +eracidad de 89 #&8"'
1&. TABLAS DE CONTIN'ENCIA. VALORACIN DE HIPTESIS DE
INDEPENDENCIA
La exploraci/n de la relaci/n entre mediciones categ/ricas es un problema b"sico de la
inferencia +ara ilustrar esta situaci/n considrese el siguiente ejemplo !up/ngase que se realiza
un estudio para evaluar la relaci/n entre el h"bito de fumar de la madre y el peso al nacer de sus
hijos Los resultados se recogen en una tabla de contingencia de (x, 0@abla ?2
Tabla <. Distribui!" #$ l+s "i=+s s$)*" ($s+ , $#a# #$ la %a#r$.
3bito de 4umar de la madre
Peso del ni5o Nunca
Antes del
embara6o
7ontinu8
4umando
Total
*ormopeso %( ?D 9 8=
$ajo peso %) (9 ? 9)
@otal (( D, %) %(=
!egn los mtodos frecuentistas, para evaluar la posible relaci/n entre el h"bito de fumar de la
madre y el peso del ni'o al nacer 0valorado en este caso dicot/micamente2, se valora la hip/tesis
de independencia, la cual afirma que los niveles de peso de los ni'os son los mismos para los
tres grupos considerados en materia de h"bito de fumar de la madre #l enfoque comnmente
usado comienza por ajustar el modelo de independencia a la tabla y calcula los valores
-esperados. bajo este modelo para todas las celdas de la tabla #ntonces, se aplica una prueba
estadstica, la cual mide cu"n alejados est"n los valores esperados de los observados
=(
La prueba estadstica convencionalmente usada es la Bi;cuadrado de +earson, y se rechaza la
hip/tesis de independencia si el valor del estadstico es suficientemente grande @picamente, se
juzga el tama'o del valor del estadstico a travs del valor p, probabilidad 0bajo la hip/tesis de
independencia2 de observar un valor del Bi;cuadrado con 0K;%2x0A;%2 grados de libertad al
menos tan grande como el que se obtuvo, donde K es el nmero de filas de la tabla y A el de
columnas !i el valor de p es suficientemente peque'o, se rechaza la hip/tesis de independencia
+ara estos datos, el valor del estadstico, que sigue una distribuci/n Bi;cuadrado con ( grados de
libertad, es <,)<, al cual se le asocia un valor de p igual a ),), Gado que este valor es menor que
),)=, desde el punto de vista frecuentista se considera como una evidencia significativa de que el
h"bito de fumar de la madre y el peso al nacer no son independientes
La prueba bayesiana de independencia maneja dos hip/tesis, la hip/tesis 1
%
que afirma que las
dos variables son independientes, y la hip/tesis complementaria, que plantea que las dos
variables son dependientes o est"n de alguna manera relacionadas $ajo el enfoque bayesiano, se
valora el apoyo relativo que dan los datos a cada una de estas dos hip/tesis en trminos del
factor de $ayes, el cual compara las probabilidades de los datos observados bajo las hip/tesis4
2 M 0
2 M 0
) )
) )
# d 4 P
# d 4 P
F!

*aturalmente, mientras 1
)
es una afirmaci/n concreta , la falsedad de 1
)
puede asumir infinitas
expresiones puntuales !in embargo, en condiciones bastante generales, se pueden hallar cotas
inferiores para !F 5s, para el caso en que se valora una asociaci/n a travs de la prueba Bi;
cuadrado, se tiene una cota inferior para el factor de $ayes
%D
en funci/n del valor observado
(
4
F!

,
_


(
%
exp
(
(

#sto da lugar a la siguiente desigualdad4


= ? >
2
1
'C/ = >
= > 1
1
0 0
1
2
2
0
0
d D H P
H p
H p

1
1
1
1
1
]
1

,
_

!2emplo
!i la tabla de contingencia fuera la que se expuso al comienzo de esta secci/n, los datos iniciales
de entrada seran4
%( ?D 9
%) (9 ?
!up/ngase que se anticipa el valor 07),D #ntonces los resultados son4
=,
Anlisis bayesiano. !ablas de contin/encia
NE de 4ilas9 "
NE de >olumnas9 %
Frecuencias
1 " % !otales
------- ------- ------- ------- -------
1 1" ) ' 80
" 1# "' ) '#
------- ------- ------- ------- -------
!otales "" % 1# 1'
$rueba con+encional
Fi-cuadrado/l 6alor p
------------- -------
(&#(% " #&#"
6aloracin bayesiana
$robabilidad a priori de la +alide- de 89 #&
$robabilidad a posteriori de la +eracidad de 89
6alor m?nimo
.#&0%'(
11. VALORACIN BA(ESIANA DE PRUEBAS CONVENCIONALES
5unque el aporte de Konald &isher y el que diez a'os m"s tarde realizaron Berzy *eyman y
#gon +earson eran en buena medida conceptualmente contradictorios entre s3 en la actualidad
lo que se aplica es una especie de hbrido que toma del primero el valor p y del segundo la
noci/n de que la tarea consiste en valorar si procede o no rechazar una hip/tesis
Aoncretamente, lo que se hace es planificar una experiencia que permita observar cierta
diferencia 4 !e obtiene que 47d
)
y se calcula la probabilidad de haber obtenido dicha diferencia
u otra mayor, supuesto que es v"lida la hip/tesis nula 01
)
2, que afirma que no existe diferencia
alguna entre las poblaciones bajo estudio #sta probabilidad, p7+04d
)
M1
)
2, se emplea como
base para la decisi/n !i p es peque'a 0tpicamente, si es menor que ),)=2, entonces se rechaza 1
)
3
de lo contrario, no se rechaza
5hora bien, el problema radica en que lo que realmente interesa al investigador no es valorar la
probabilidad de obtener ciertos datos supuesta la veracidad de 1
)
sino lo contrario4 la
probabilidad +01
)
M47d
)
2 de que sea v"lida 1
)
supuesto que se observaron los datos que dan
lugar a d
)
Las probabilidades p7+04d
)
M1
)
2 y +01
)
M47d
)
2, lamentablemente, pueden ser muy
diferentes Q m"s lamentablemente an, muchos investigadores 0quiz"s la mayora2 no son
capaces de distinguir una de otra
\attheRs
%9
sostiene, e ilustra mediante varios ejemplos tomados de la literatura, que los valores
p exageran la significaci/n real de los datos obtenidos, lo que no pocas veces ha conducido a la
=9
aprobaci/n de conductas teraputicas que poco tiempo despus han sido fatalmente
desacreditadas3 la raz/n de estos esc"ndalos, simplemente es, a su juicio, estadstica !egn este
autor, la raz/n m"s persuasiva para usar la inferencia bayesiana es la capacidad que tiene de
proveer un nivel de protecci/n mucho mayor que el enfoque frecuentista contra la posibilidad
de -ver significaci/n en hallazgos procedentes de la investigaci/n cientfica que son enteramente
espurios.
\uy por el contrario, por lo general p puede llegar a ser sustantivamente menor que +01
)
M
47d
)
2 #so es en esencia lo que se advierte mediante la famosa paradoja de Lindley
%=

La disparidad entre p y +01


)
M47d
)
2 se incrementa en la medida que +01
)
2 crece, supuesto d
)
fijo3
de modo que p es un indicador m"s enga'oso cuanto menos plausible resulte ser la teora bajo
investigaci/n #sta diferencia entre la probabilidad que usualmente se computa 0p2 y la que
verdaderamente interesa, tambin se hace m"s acusada, por otra parte, en la medida que se
incrementa el tama'o muestral
%?
4 quiere esto decir que para tama'os de muestra grandes, el
riesgo de atribuir incorrectamente una baja probabilidad a la hip/tesis nula debido a que es
menor el -p value., es mayor
#l enfoque bayesiano es matem"ticamente coherente con el hecho de que, si bien el apoyo que
puede otorgarse a cierta teora puede inicialmente ser vago y subjetivo, el cmulo de datos
conduce progresivamente hacia una nica y objetiva realidad acerca de la cual todos
coincidir"n
%<

Aomo se ha dicho, lamentablemente se puede tener un valor peque'o de p sin que ello
signifique que el de +01M42 lo sea E#n qu medida se produce tal discrepanciaF #so depende
de la prueba empleada y de las circunstancias propias de cada caso3 adem"s, es imposible
calcular el valor +01
)
M47d
)
2 exactamente +ero s es posible, sin embargo, obtener cotas
inferiores para dicha magnitud
+or conducto del @eorema de $ayes es f"cil corroborar que4
F! # P
# P
d 4 # P
2 0
2 0 %
%
%
2 M 0
)
)
) )

+

donde +01
)
2 denota la probabilidad a priori que cabe otorgar a la hip/tesis nula de ser cierta y
!F es el llamado -factor de $ayes., definido como4
2 M 0
2 M 0
) )
) )
# d 4 P
# d 4 P
F!

*aturalmente, mientras 1
)
es una afirmaci/n concreta 0tpicamente, que dos tratamientos son
idnticos2, la falsedad de 1
)
puede asumir infinitas expresiones puntuales !in embargo, en
condiciones bastante generales, se pueden hallar cotas inferiores para !F
7omparaci8n de medias
Auando se comparan dos medias, si se llama , al estadstico por conducto del cual se obtiene el
valor p, se puede demostrar
%8
que se cumple4
==
F!
,

,
_

(
exp
(
Aonsecuentemente, se tiene4
2 M 0
(
exp
2 0
2 0 %
%
) )
%
(
)
)
d 4 # P
,
# P
# P

1
1
]
1

,
_

Prueba 9i&cuadrado
5n"logamente, para el caso en que se valora una asociaci/n a travs de la prueba Bi;cuadrado, se
tiene una cota inferior para el factor de $ayes
%D
en funci/n del valor observado
(
4
F!

,
_


(
%
exp
(
(

#sto da lugar a la siguiente desigualdad4


2 M 0
(
%
exp 2 0
2 0 %
%
) )
%
(
(
)
)
d 4 # P
# P
# P

1
1
1
1
1
]
1

,
_

!2emplo
Aonsidrese un estudio publicado en una prestigiosa revista debido a 1arris y col
()
5ll se da
cuenta de una valoraci/n de los efectos a distancia de la intercesi/n mediante plegarias
religiosas como recurso teraputico a travs de un ensayo clnico controlado en pacientes
ingresados en una unidad de cuidados coronarios
!e seleccionaron todos los pacientes que ingresaron en la :nidad de Auidados Aoronarios
0:AA2 del 6nstituto 5mericano de Aardiologa, Aiudad de Jansas, a lo largo de un a'o, salvo los
que habran de recibir un transplante de coraz/n, para quienes se anticipaba una estada
prolongada en el servicio
Los pacientes, registrados diariamente, fueron asignados a los grupos de tratamiento usando el
ltimo dgito del nmero con que fue recepcionado 0nmero del registro mdico24 los pares eran
asignados al grupo experimental 09?? pacientes2 y los impares al grupo control 0=(9 pacientes2
!e procuraba valorar as el efecto de las oraciones como recurso para disminuir las
complicaciones que sobrevienen a los pacientes de enfermedades coronarias
:na vez que el paciente era asignado al grupo experimental, se informaba su nombre 0sin
apellidos2 por va telef/nica al responsable de uno de los grupos de intercesores para que se
comenzara a orar por espacio de (8 das exactos +ara cuantificar los resultados, se cre/ al efecto
un ndice de complicaciones 06GA2 5 cada una de las posibles complicaciones 0o acciones
=?
derivadas de ellas2 se le atribuy/ un nmero 0ponderaci/n2 segn la gravedad que ellas
entra'aban y de ese modo se asignaba un valor a cada paciente +ara valorar estadsticamente la
hip/tesis de nulidad se compararon las medias de 6GA mediante la prueba t de !tudent de dos
colas Los resultados finales obtenidos por 1arris y colaboradores se sintetizan en la @abla <
Tabla >. E6$t+s #$ la i"t$r$si!"; %$#ia"t$ la +rai!"; s+br$ $l IDC #$ (ai$"t$s
$" la U"i#a# #$ Cui#a#+s C+r+"ari+s.
"atos relevantes
:rupo
control
:rupo
experimental
]ndice de Aomplicaciones 06GA2 promedio <,%, ?,,=
@ama'o muestral =(9 9??
Gesviaci/n est"ndar =,D= =,8(
#l valor de z en este caso viene dado por la expresi/n4
)8 , (
9??
8( , =
=(9
D= , =
,= , ? %, , <
( (

+

e
e
c
c
e c
n
s
n
s
. .
z
Gebe advertirse que, en rigor, este estadstico sigue una distribuci/n t de !tudent3 sin embargo,
la condici/n se cumple en esencia aunque no se trate exactamente de una normal +or otra parte,
para los tama'os muestrales de este ejemplo, la similitud entre la t y la normal es virtualmente
total
#s f"cil ver que a este valor de z corresponde uno de p igual a ),)9 #l valor de la cota inferior
para +01
)
M47d
)
2 depende de la probabilidad a priori que se atribuya a la hip/tesis de que es lo
mismo ser motivo de los rezos que no serlo !i se atribuyera, por ejemplo, el valor ),= a dicha
probabilidad, se tendra4
%) , )
(
exp
2 0
2 0 %
%
%
(
)
)

1
1
]
1

,
_

,
# P
# P
#l escollo m"s importante que se presenta al aplicar los procedimientos bayesianos es,
precisamente, el de fijar distribuciones de probabilidad a priori, lo que en este caso se reduce a
dar un valor anticipado para +01
)
2
Las opiniones sobre el poder real de los rezos en la salud pueden ser diversas, pero es, como
mnimo, muy razonable partir de un posicionamiento neutro 0agn/stico2 que se traducira en no
escorarse ni a favor ni en contra de la medida y, por ende, en admitir que +01
)
27),= +ero en
algunos casos 0y el que se analiza es un buen ejemplo2, podra ser m"s razonable aun adoptar un
punto de vista escptico 0por ejemplo +01
)
27),8 / +01
)
27),D2
La tabla siguiente recoge los valores de probabilidad a posteriori que, como mnimo, se puede
atribuir a +01
)
M47d
)
2 para diferentes valoraciones a priori de los datos obtenidos en el estudio
Niveles Probabilidad a priori
-alor mnimo de
P03
%
;D<d
%
1
5gn/stico ),= ),%)
=<
#scptico ),8 ),,%
\uy escptico ),D ),=%
Aomo se ve, la probabilidad de que las plegarias sean totalmente estriles 01
)
2 es mucho mayor
que p incluso en caso de que no se adopte una posici/n escptica sino neutra
!up/ngase ahora en el mismo contexto del estudio anterior que se hubiera obtenido que en el
grupo control murieron %(9 pacientes y en el experimental %,8 Aon esos datos se podra
configurar la siguiente tabla de (x(4
:rupos
uerte 7ontrol !xperimental
! a7%(9 b7%,8
*o c79)) d7,(8
n
A
7=(9 n
#
79??
#l valor observado de Bi;cuadrado es igual a4
9D , 9
2 20 0
2 0
(
(

+ +

d c b a n n
bc ad n
e c

y a este resultado se asocia un valor de p7),),9


Los valores de probabilidad a posteriori que, como mnimo, se puede atribuir a +01
)
M47d
)
2 para
diferentes valoraciones a priori de los datos obtenidos en el estudio se muestra a continuaci/n
Niveles Probabilidad a priori
-alor mnimo de P03
%
;
D<d
%
1
5gn/stico ),= ),(<
#scptico ),8 ),?)
\uy escptico ),D ),<<
#sto quiere decir que, incluso en el caso en que se adopte un punto de vista inicial que no se
pronuncie a priori ni a favor ni en contra de la validez de la hip/tesis de nulidad 0que establece
que la probabilidad de muerte no vara si se adicionan rezos a los cuidados normales2 la
probabilidad de que tal hip/tesis sea correcta es sumamente alta 0como mnimo, asciende a ),(<2
a diferencia de lo que podra hacer pensar el valor de p 0),),92, si se interpretara
incorrectamente, como suele ocurrir
BIBLIOGRA:A
1. $erger BT, $erry G5 !tatistical analysis and the illusion of objectivity American +cientist
%D883 <?4 %=D;?=
2. !ilva LA, $enavides 5 #l enfoque bayesiano4 otra manera de inferir 'ac +anit ())%3 %=4
,9%;?
=8
3. $enavides 5, !ilva LA Aontra la sumisi/n estadstica4 un apunte sobre las pruebas de
significaci/n &etas de Enfermer$a ()))3 ,4 ,=;9)
4. $ayes @ #ssay toRards solving a problem in the doctrine of chances NKeproduced from Phil
5rans )oy +oc %<?,3 =,4,<);9%8O !tudies in the history of probability and statistics 6X Iith a
bibliographical note by L5 $arnard !iometrika %D=83 9=4 (DD
5. !ilva LA, \u'oz 5 Gebate sobre mtodos frecuentistas vs bayesianos 'ac +anit ()))3 %94
98(;D9
6. Lreenland ! +robability logic and probabilistic induction Epidemiology %DD83 D4 ,((;,(
4. Lilford KB, $raunholtz G @he statistical basis of public policy4 a paradigm shift is overdue
!r &ed 6 %DD?3 ,%,4 ?),;<
:. !ilva LA E.cursin a la regresin log$stica en ciencias de la salud \adrid4 Gaz de !antos3 %DD=
;. Aarlin $+, Louis @5 !ayes and empirical !ayes methods for data analysis (nd ed *eR QorP4
Ahapman ^ 1allZAKA3 ()))
10. $urton +K 1elping doctors to draR appropriate inferences from the analysis of medical
studies +tat &ed %DD93 %,4 %?DD;<%,
11. Gavidoff & !tanding statistics right side up Ann %ntern &ed %DDD3 %,)4 %)%D;(%
%( 5lbert B !ayesian computation using &initab $elmont, Aalifornia4 Guxbury +ress, IadsRorth
+ublishing Aompany3 %DD?
13. $erry G5 +tatistics7 A !ayesian perspective $elmont, Aalifornia4 Guxbury +ress3 %DD?
14. \attheRs K5 !ignificance levels for the assessment of anomalous phenomena 6ournal of
+cientific E.ploration %DDD3 %,0%24 %;<
15. Lindley G[ @he analysis of experimental data4 @he appreciation of tea and Rine 5eaching
+tatistics %DD,3 %=4 ((W=
16. Bohnson G1 @he 6nsignificance of statistical significance testing 6ournal of 8ildlife
&anagement %DDD3 ?,0,24 %?(D;,(
%< \attheRs K5 &acts versus &actions4 the use and abuse of subjectivity in scientific research
#uropean !cience and #nvironment &orum IorPing +aper3 reprinted in KethinPing KisP
and the +recautionary +rinciple #d4 \orris, B Txford4 $utterRorth3 ()))
%8 Lee +\ !ayesian +tatistics7 an introduction (nd ed London4 5rnold3 %DD<
%D $erger B, !ellPe @ @esting a point null hypothesis4 the irreconcilability of +;values and
evidence 6ournal of the American +tatistical Association %D8<3 8(4 %%(
=D
20. 1arris I!, LoRda \, Jolb BI, !trychacz A+, [aceP BL, Bones +L et al 5 randomized,
controlled trial of effects of remote, intercessory prayer on outcomes in patients admitted to
the coronary care unit Arch %ntern &ed %DDD3 %=D4 ((<,;8
?)

También podría gustarte