Está en la página 1de 11

ESTIMACIN DE UNA PROBABILIDAD - 1 -

Est imacin de una probabilidad



Int roducci n

En general, la probabilidad de un suceso es desconocida y debe estimarse a partir de
una muestra representativa. Para ello, deberemos conocer el procedimiento adecuado
para llevar a cabo dicha estimacin y los distintos conceptos implicados. A continuacin,
empezaremos por situar el problema, pasando despus a comentar la solucin
estadstica. Finalmente, desarrollaremos algunos problemas de aplicacin.

Probabi l i dades y porcent aj es
La probabilidad de un suceso es una medida de la incertidumbre acerca de su aparicin
al realizar una observacin aleatoria. As, al hablar de la probabilidad de que un
paciente de 55 aos presente un infarto en el siguiente ao, lo que intentamos
establecer es en qu medida se espera este suceso en este tipo de paciente. Desde un
punto de vista formal, la probabilidad es un valor entre 0 y 1, de manera que la
probabilidad anterior puede indicarse como P(Infarto/Edad>55)=p, donde p ser un
valor entre 0 y 1.
Desde un punto de vista prctico, en muchos casos nos referimos a la probabilidad en
trminos de porcentajes. As, diremos que hay una probabilidad de un 50% de que el
sexo de un recin nacido sea varn y un 50% de que sea hembra. Al realizar esta
interpretacin, estamos utilizando el porcentaje como un sinnimo de probabilidad.
Aunque esto es correcto en muchos casos, debemos ser prudentes al utilizar el
concepto de porcentaje, ya que no todos los porcentajes son probabilidades.
El porcent aje de result ados en una muest ra no es una probabilidad
Cuando decimos que un 84.4% de las mujeres encuestados prefieren la anestesia
epidural, nos estamos refiriendo a un porcentaje muestral (frecuencia relativa) y no a
una probabilidad. En todo caso, este porcentaje puede tomarse como una estimacin
de la probabilidad del suceso observado. Obviamente, el porcentaje muestral cambiar
con cada muestra, pero el valor de la probabilidad es constante. Por lo tanto, vamos
concretar esta diferencia. Consideremos la probabilidad de que un individuo de una
poblacin se infecte por el virus de la gripe en un ao determinado. Esta probabilidad es
P(G). Como tal, esta probabilidad es una propiedad de la poblacin objeto de estudio y
es esencialmente desconocida. Si realizamos un encuesta de salud, podemos
aproximar el valor de esta probabilidad a partir del porcentaje de personas que se han
infectado. Este porcentaje muestral ser dependiente de la muestra escogida y, por lo
tanto, ser tan solo una aproximacin al valor de P(G).
No t odos los porcent ajes son probabilidades
En un estudio clnico podemos establecer que un frmaco reduce en un 15% el peso de
un individuo. Este tipo de porcentajes indican una variacin porcentual respecto a un
valor de referencia y no son indicativos de una probabilidad. Por lo tanto, los mtodos de
clculo y estimacin de probabilidad no son de aplicacin a este tipo de porcentajes.
ESTIMACIN DE UNA PROBABILIDAD - 2 -

La probabilidad es un parmet ro caract erst ico de la poblacin objet o de
est udio
La probabilidad de un suceso es un parmetro caracterstico de la poblacin objeto de
estudio. As, la probabilidad de padecer un infarto depender de la poblacin a la que
nos estemos refiriendo.
Probabilidad de infarto en un
individuo de la poblacin general
P(I)
Probabilidad de infarto en un
varn
P(I/V)
Probabilidad de infarto en un
varn hipertenso
P(I/V!H)
Probabilidad de infarto en un
varn hipertenso de ms de 55
aos
P(I/ V!H!(Edad>55))

En cada caso, deberemos obtener informacin pertinente al grupo de referencia
considerado para poder estimar el valor de la probabilidad.
La probabilidad la encontramos en muchas situaciones diferentes bajo nombres
especiales. Algunos ejemplos en el caso de pruebas diagnsticas son:
Sensibilidad de una prueba diagnstica P(+/E)
Especificidad de una prueba diagnstica P(-/S)
Probabilidad de falsos positivos
Probabilidad de falsos negativos
P(+!S)
P(-!E)
Valor pronstico positivo
Valor pronstico negativo
P(E/+)
P(S/-)

En todos estos casos, el problema es el mismo: estimar el valor de la probabilidad
desconocida a partir de los resultados muestrales.
ESTIMACIN DE UNA PROBABILIDAD - 3 -

Est i maci n de una probabi l i dad
Llamaremos a la probabilidad desconocida (sea la que sea en cada caso). De
manera general, si Aes el suceso de inters, entonces = ) (A P .
Est imacin punt ual
Si disponemos de una muestra de tamao n de la poblacin a la que se refiere la
probabilidad, entonces la frecuencia relativa de apariciones del suceso Aen la muestra
es el estimador de :
= ) (A P
n
f
A

(1)

Int ervalo de confianza
La estimacin puntual, por s sola, es de poco valor dado que en cada muestra vamos a
obtener un resultado distinto. El intervalo de confianza establece un rango de valores
donde se encuentra el valor de con una cierta probabilidad.
El intervalo de confianza ) 1 ( correspondera al rango de valores que incluira el
valor de con una probabilidad ) 1 ( . Si llamamos N f p
A
/
0
= a la frecuencia
relativa del suceso en una muestra de tamao n y
0 0
1 p q = , entonces el intervalo
de confianza ) 1 ( se define como:
n
q p
z p
0 0
2 / 1 0



(2)

El valor
2 / 1
z corresponde al valor de una normal N(0,1) que delimita un intervalo
) 1 ( . En el caso 95 . 0 ) 1 ( = , tenemos que 975 . 0 ) 2 / 1 ( = y por lo tanto
96 . 1
975 . 0
= z .
Este intervalo es vlido para muestras de cierto tamao y proporciona una estimacin
de los posibles valores de . En el apndice se comentarn algunas alternativas a este
tipo de intervalo.
ESTIMACIN DE UNA PROBABILIDAD - 4 -

Ejemplo bsico
Consideremos que un 23.3% de un total de 235 hombres encuestados responden que
son contrarios a estar presentes en el parto. Cul seria la estimacin de la probabilidad
de que un hombre sea contrario a estar presente en el parto?
Si la muestra de 235 se ha obtenido al azar y es representativa de la poblacin general,
es decir no existen sesgos de seleccin en la muestra, entonces podemos utilizar el
intervalo de confianza anterior para estimar la probabilidad buscada. En este caso
233 . 0
0
= p y 235 = n . Por lo tanto, para una confianza de 0.95 :
( ) 287 . 0 , 179 . 0
054 . 0 233 . 0
235
767 . 0 233 . 0
96 . 1 233 . 0


(3)
Por lo tanto, estimamos con una confianza de 0.95 que el valor de la probabilidad
buscada se encuentra entre 0.179 y 0.287.
Tabla y porcent ajes
La estimacin de una probabilidad es complementaria al clculo de porcentajes en una
tabla. De hecho, los porcentajes de la tabla deberan complementarse siempre con el
correspondiente intervalo de confianza. Veamos el siguiente ejemplo.
Un estudio clnico evala un tratamiento frente a un grupo control. En cada caso, se
determina si se ha producido o no una mejora respecto al estado de referencia antes del
tratamiento. Los resultados son:
Tabla de contingencia MEJORA * GRUPO
23 18 41
65,7% 72,0% 68,3%
12 7 19
34,3% 28,0% 31,7%
35 25 60
100,0% 100,0% 100,0%
Recuento
% de GRUPO
Recuento
% de GRUPO
Recuento
% de GRUPO
Si
No
MEJORA
Total
Control Tratamiento
GRUPO
Total

Podemos ver que el porcentaje de mejoras en el grupo de tratamiento es del 72%,
mientras que en el grupo control es del 65.7%. Esta observacin parece indicar que el
tratamiento es eficaz. Grficamente, se obtiene:
ESTIMACIN DE UNA PROBABILIDAD - 5 -
Casos ponderados por OBS
MEJORA
No Si
P
o
r
c
e
n
t
a
j
e
80
60
40
20
0
GRUPO
Control
Tratamiento

Veamos el resultado de estimar la probabilidad de mejora en cada grupo. Para el gupo
control tendremos:
( ) 90 . 0 , 54 . 0
18 . 0 72 . 0
25
28 . 0 72 . 0
96 . 1 72 . 0


(4)

Para el grupo control tendremos:
( ) 82 . 0 , 50 . 0
16 . 0 657 . 0
35
343 . 0 657 . 0
96 . 1 657 . 0


(5)
Podemos observar que los intervalos de confianza se solapan. Esto es indicativo de que
no podemos descartar que las probabilidades de mejora sean iguales en cada grupo,
aunque la muestra presente un resultado favorable al tratamiento. Grficamente:

0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
Control Tratamiento
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1

ESTIMACIN DE UNA PROBABILIDAD - 6 -

Clculo del t amao muest ral necesario para est imar una probabilidad
La precisin con la que se estima un determinado parmetro poblacional depende,
siempre, del tamao muestral empleado. En el caso de la estimacin de una
probabilidad, la precisin de la estimacin puede indicarse como:
n
q p
z
p
0 0
2 / 1
0

=


(6)
Para conseguir una precisin adecuada, debemos emplear un tamao muestral igual
a:
2
0 0
2
2 / 1

=

q p z
n


(7)
En este caso,
0
p hace referencia a una estimacin previa de la probabilidad buscada.
Esto puede conseguirse mediante una muestra piloto. En caso de no disponer de esta
estimacin previa, entonces utilizaremos un valor de 0.5. Este valor representa la
situacin ms desfavorable. La precisin depender del problema en particular. As,
en una encuesta electoral, podramos utilizar 03 . 0 = , lo que indicara una precisin
de % 3 en los resultados de la encuesta. Sin embargo, si queremos estimar la
probabilidad de presencia de una determinada enfermedad que afecta alrededor de un
1 por mil de la poblacin, entonces deberamos utilizar una precisin mucho menor, p.e.
de un 0.3 por mil.
Veamos los resultados de ambos ejemplos. En el caso de la encuesta electoral
tendramos:
1068 11 . 1067
03 . 0
5 . 0 5 . 0 96 . 1
3
2
=

= n
(8)
En este caso, utilizamos un valor 5 . 0
0
= p para realizar el clculo del tamao muestral
que asegura la precisin buscada para cualquier resultado de la muestra. En el caso de
la estimacin de la probabilidad de la enfermedad tenemos que 1000 / 1
0
p . Si
fijamos una precisin 100 / 3 . 0 = , el tamao muestral requerido ser:
42642 76 . 42641
3 . 0
999 96 . 1
1000
3 . 0
1000
999
1000
1
96 . 1
2
2
2
2
=


= n
(9)

ESTIMACIN DE UNA PROBABILIDAD - 7 -

Probl emas resuel t os
Est imacin de la sensibilidad y la especificidad de una prueba diagnst ica
En una ensayo clnico, se dispone de 35 individuos que padecen una determinada
enfermedad y de 45 individuos sanos. Se quiere validar un procedimiento diagnstico
rpido para esta enfermedad. En el estudio, dan positivo 29 individuos del grupo de
enfermos y 18 del grupo de sanos. Se pide estimar la sensibilidad y la especificad de la
prueba diagnstica.
En este caso, podemos calcular la estimacin puntual de la sensibilidad como
83 . 0 35 / 29 ) / ( = = + E P . De acuerdo con los datos, la especificidad sera:
60 . 0 45 / 27 ) / ( = = S P . A partir de estos resultados, podemos estimar:
Sensibilidad: ) / ( E P + =
( ) 95 . 0 , 71 . 0
12 . 0 83 . 0
35
17 . 0 83 . 0
96 . 1 83 . 0


(10)
Especificidad: ) / ( S P =
( ) 74 . 0 , 46 . 0
14 . 0 60 . 0
45
40 . 0 . 0 60 . 0
96 . 1 60 . 0


(11)
Por lo tanto, aunque en la muestra la especificidad es del 60%, podra ser que fuera
inferior al 50%, segn resulta del intervalo de confianza.
Qu tamao muestral sera necesario para estimar la sensibilidad con una precisin
del 2%?. En este caso, podemos tomar 83 . 0
0
= p y 02 . 0 = . El tamao muestral
necesario sera:
1356 12 . 1355
02 . 0
17 . 0 83 . 0 96 . 1
2
2
=

= n
(12)


ESTIMACIN DE UNA PROBABILIDAD - 8 -

Comparacin de t rat amient os
En un ensayo clnico, se obtienen los siguientes resultados:
Tabla de contingencia MEJORA * GRUPO
35 20 55
74,5% 42,6% 58,5%
12 27 39
25,5% 57,4% 41,5%
47 47 94
100,0% 100,0% 100,0%
Recuento
% de GRUPO
Recuento
% de GRUPO
Recuento
% de GRUPO
Si
No
MEJORA
Total
Tratamiento Control
GRUPO
Total

De acuerdo con este resultado, se pide estimar el probabilidad de mejora en ambos
grupos y comparar los resultados.
La proporcin observada de mejoras en el grupo de tratamiento es del 74.5%, mientras
que en el grupo control es de 46.2%. La estimacin de la probabilidad de mejora en el
grupo de tratamiento seria:
( ) 87 . 0 , 62 . 0
125 . 0 745 . 0
47
255 . 0 745 . 0
96 . 1 745 . 0


(13)
En el grupo control tendramos:
( ) 61 . 0 , 32 . 0
143 . 0 462 . 0
47
538 . 0 462 . 0
96 . 1 462 . 0


(14)
De acuerdo con estos resultados, la estimacin de la proporcin de mejoras en ambos
grupos proporciona dos intervalos que no se solapan. En tal caso, podemos concluir
que la probabilidad de mejora en el grupo de tratamiento es ms elevada. Para
completar esta interpretacin, sin embargo, sera conveniente comparar ambas
probabilidades. Veremos ms adelante que esto se puede hacer mediante un
intervalote confianza de la diferencia de probabilidades o mediante la estimacin del
cociente de dos probabilidades.
ESTIMACIN DE UNA PROBABILIDAD - 9 -

Probl emas de apl i caci n
PREGUNTA 1

En una encuesta realizada a 234 personas, un 67% contestan afirmativamente a la
pregunta: Est usted de acuerdo con la utilizacin de clulas madre en investigacin
mdica?. Estima la proporcin de personas favorables a esta iniciativa en la poblacin
original. (95% de confianza)

1) (0.61, 0.73)
2) (0.63, 0.71)
3) (0.59, 0.75)
4) (0.64, 0.70)

PREGUNTA 2

Un estudio epidemolgico de cohortes proporciona los resultados siguientes:
Tabla de contingencia EXPOSICI * GRUPO
Recuento
65 33 98
45 74 119
110 107 217
Expuestos
No expuestos
EXPOSICI
Total
Casos Controles
GRUPO
Total

Calcula una estimacin (95% de confianza) de la proporcin de expuestos que han
desarrollado la enfermedad.

1) (0.51, 0.67)
2) (0.57, 0.75)
3) (0.52, 0.66)
4) (0.50, 0.68)

PREGUNTA 3

En una encuesta realizada a 90 personas, 74 contestan afirmativamente a la pregunta:
Est usted de acuerdo con la utilizacin de clulas madre en investigacin mdica?.
Cuntas personas deberamos encuestar para estimar la proporcin de personas
favorables a esta iniciativa en la poblacin original con un 95% de confianza y una
precisin del 2%?

1) 1418
2) 2401
3) 1803
4) 385
ESTIMACIN DE UNA PROBABILIDAD - 10 -

PREGUNTA 4

En un ensayo clnico, se quiere determinar la sensibilidad de un mtodo diagnstico.
Los resultados obtenidos son:
Tabla de contingencia DIAGNOST * GRUPO
Recuento
72 33 105
12 83 95
84 116 200
(+)
(-)
DIAGNOST
Total
Enfermos Sanos
GRUPO
Total

Estima la sensibilidad con una confianza del 95%.

1) (0.63, 0.80)
2) (0.81, 0.91)
3) (0.65, 0.78)
4) (0.78, 0.93)

PREGUNTA 5

En un ensayo clnico, se quiere determinar la especificidad de un mtodo diagnstico.
Los resultados obtenidos son:
Tabla de contingencia DIAGNOST * GRUPO
Recuento
72 33 105
12 83 95
84 116 200
(+)
(-)
DIAGNOST
Total
Enfermos Sanos
GRUPO
Total

Estima la especificidad con una confianza del 95%.

1) (0.63, 0.80)
2) (0.78, 0.93)
3) (0.65, 0.78)
4) (0.81, 0.91)

PREGUNTA 6

De acuerdo con los resultados de la pregunta anterior, Cuntas personas deberamos
incluir en el grupo correspondiente, para estimar la especificidad con una precisin del
3% y una confianza del 95%?

1) 715
2) 890
3) 623
4) 868

ESTIMACIN DE UNA PROBABILIDAD - 11 -

Respuest as a las pregunt as

Pregunta Respuesta
1 1
2 2
3 1
4 4
5 1
6 4