Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bioestadistica3 PDF
Bioestadistica3 PDF
4.2 introduccin
Si el nico propsito del investigador es describir los resultados de un experimento
concreto, los mtodos analizados en los captulos anteriores pueden considerarse
suficientes. No obstante, si lo que se pretende es utilizar la informacin obtenida para
extraer conclusiones generales sobre todos aquellos objetos del tipo de los que han sido
estudiados, entonces estos mtodos constituyen slo el principio del anlisis, y debe
recurrirse a mtodos de inferencia estadstica, los cuales implican el uso inteligente de la
teora de la probabilidad.
Comenzamos este bloque interpretando la nocin de probabilidad y la terminologa
subyacente a esta rea de las matemticas, ya que la probabilidad constituye por s
misma un concepto bsico que refleja su relacin con la faceta del mundo exterior que
pretende estudiar: los fenmenos aleatorios, los cuales obedecen unas ciertas reglas de
comportamiento. De alguna manera, el concepto de probabilidad, se relaciona o nos
recuerda las propiedades de la frecuencia relativa.
A partir de ella, y junto con las definiciones de probabilidad condicionada y la de
sucesos independientes, se deducen los teoremas fundamentales del Clculo de
Probabilidades.
Nos centraremos posteriormente en el eslabn que une la teora de la probabilidad y la
estadstica aplicada: la nocin de variable aleatoria, mostrando de esta manera, como
puede emplearse la teora de la probabilidad para sacar conclusiones precisas acerca de
una poblacin en base a una muestra extrada de ella, y que muchos de los estudios
estadsticos son de hecho, estudio de las propiedades de una o ms variables aleatorias.
Tal como hemos citado anteriormente, en las aplicaciones prcticas es importante poder
describir los rasgos principales de una distribucin, es decir, caracterizar los resultados
del experimento aleatorio mediante unos parmetros. Llegamos as al estudio de las
caractersticas asociadas a una variable aleatoria introduciendo los conceptos de
esperanza y varianza matemtica, relacionndolos con los conceptos de media y
varianza de una variable estadstica.
Obsrvese que los sucesos elementales son sucesos aleatorios compuestos por un slo
elemento. Por supuesto los sucesos aleatorios son ms generales que los elementales, ya
que son conjuntos que pueden contener no a uno slo, sino a una infinidad de sucesos
elementales --y tambin no contener ninguno.-- Sucesos aleatorios que aparecen con
gran frecuencia en el clculo de probabilidades son los siguientes:
4.4.0.0.0.1 Suceso seguro:
Es aquel que siempre se verifica despus del experimento aleatorio, es decir, el mismo E
Es aquel que nunca se verifica como resultado del experimento aleatorio. Como debe
ser un subconjunto de E, la nica posibilidad es que el suceso imposible sea el conjunto
vaco
4.4.0.1 Ejemplo
, y de su suceso contrario
, el
4.6.0.0.0.2 Interseccin:
, con su
4.6.0.0.0.3 Diferencia:
representa mediante
, o bien A-B, al suceso aleatorio formado por todos los
sucesos elementales que pertenecen a A, pero no a B:
Si
mediante
, al suceso aleatorio formado por todos los sucesos elementales que
pertenecen a A y no a B, y los que estn en By no en A:
As:
se representa: en (a)
Hay ciertas propiedades que relacionan la unin, interseccin y suceso contrario, que
son conocidas bajo el nombre de Leyes de Morgan:
de reposo, y dejado caer al vaco desde una torre, llega siempre al suelo con la misma
velocidad:
4.1
4.8.0.1 Ejemplo
En la Figura 4.3 se presenta la evolucin de la frecuencia relativa del nmero de caras
obtenido en el lanzamiento de una moneda en 100 ocasiones (simulado por un
ordenador). En principio la evolucin de las frecuencias relativas es errtica, pero a
medida que el nmero de tiradas aumenta, tiende a lo que entendemos por probabilidad
de cara.
Figura: Convergencia a 1/2 de la frecuencia relativa del nmero de caras obtenido en lanzamientos
sucesivos de una moneda (simulacin en ordenador).
4.8.2.1 Ejemplo
Calcular la probabilidad de que al lanzar un dado se obtenga un nmero impar.
Solucin:
El espacio muestral es
ni del
La probabilidad de la unin de sucesos debe ser mayor que la de cada uno de los
sucesos por separado:
En las ltimas lneas hemos esbozado ciertas propiedades que debera cumplir una
funcin que queramos llamar probabilidad. Hemos de tener en cuenta entonces que
siguiendo esos puntos:
1.
La funcin de probabilidad debe calcularse sobre subconjuntos de E. No es
estrictamente necesario que sean todos, pero si es necesario que si se puede
calcular sobre un conjunto, lo pueda ser tambin sobre su complementario, y que
si se puede calcular sobre dos conjuntos A y B, que tambin se pueda calcular
sobre su unin y su interseccin. Para ello introduciremos el concepto de lgebra de sucesos, que ser una clase de subconjuntos de Esobre los que
podamos aplicar las reglas de la probabilidad.
2.
Entre las leyes que debe cumplir una funcin de probabilidad y que hemos
escrito antes, hemos observado que algunas son redundantes, ya que se pueden
deducir de las dems. Con la definicin axiomtica de la probabilidad
pretendemos dar el menor conjunto posible de estas reglas, para que las dems
se deduzcan como una simple consecuencia de ellas.
Precisemos entonces los conceptos de -lgebra de sucesos y de probabilidad.
4.8.4.1 Concepto de
-lgebra de sucesos
Sea una clase no vaca formada por ciertos subconjuntos del espacio muestral E.
Diremos que esta clase es un -lgebra de sucesos si los sucesos complementarios de
aquellos que estn en tambin estn en , as como sus uniones numerables (sean
finitas o infinitas). Esto se puede enunciar como:
Ax-2.
La probabilidad del suceso seguro es 1
Ax-3.
La probabilidad de la unin numerable de sucesos disjuntos es la suma de sus
probabilidades (figura 4.4):
4.8.4.3 Observacin
con
Este tipo de conjuntos (los intervalos) son los que nos interesan en la prctica, v.g.
calcular la probabilidad de que el peso en kilogramos de un nio al nacer est en el
intervalo [2,4]. De esto modo vamos a realizar el siguiente convenio a lo largo del
libro:
No haremos en general referencia al -lgebra de sucesos ms que
cuando sea estrictamente necesario. De este modo cuando a partir de
ahora se diga ``
'', nos referiremos implcitamente a que
,
donde es un -lgebra de sucesos asociado a E y sobre el que se ha
definido la funcin de probabilidad.
Si el espacio muestral es finito o infinito numerable, entenderemos que el
-lgebra de sucesos es por defecto P(E).
Si E es un conjunto infinito no numerable como ,
,o
subconjuntos suyos en forma de intervalos, entenderemos que el lgebra asociada es la mencionada en el ejemplo anterior, es decir, la
formada por todos los intervalos abiertos, cerrados o semi-abiertos (lo
que incluye en particular a los puntos), y sus uniones finitas. De este
modo podremos calcular probabilidades como las siguientes:
representamos mediante
o bien
4.10.0.1 Ejemplo
Se lanza un dado al aire Cul es la probabilidad de que salga el nmero 4? Si sabemos
que el resultado ha sido un nmero par, se ha modificado esta probabilidad?
Solucin:
El espacio muestral que corresponde a este experimento es
Por otro lado, si ha salido un nmero par, de nuevo por la definicin de probabilidad de
Laplace tendramos
y entonces
que por supuesto coincide con el mismo valor que calculamos usando la definicin de
probabilidad de Laplace.
4.10.0.2 Observacin
Obsrvese que segn la definicin de probabilidad condicionada, se puede escribir la
probabilidad de la interseccin de dos sucesos de probabilidad no nula como
Esta relacin puede ser escrita de modo equivalente, cuando dos sucesos son de
probabilidad no nula como
4.12.0.1 Proposicin
Sean
no necesariamente disjuntos. Se verifican entonces las siguientes
propiedades:
1.
Probabilidad de la unin de sucesos:
2.
Probabilidad de la interseccin de sucesos:
3.
Probabilidad del suceso contrario:
4.
Probabilidad condicionada del suceso contrario:
4.12.0.2 Ejemplo
En una universidad el 50% de los alumnos habla ingls, el 20% francs y el 5% los dos
idiomas Cul es la probabilidad de encontrar alumnos que hablen alguna lengua
extranjera?
Solucin:
Sea A el suceso hablar ingls:
4.12.0.3 Ejemplo
.
:
En una estacin de esqu, para navidad-es, la experiencia indica que hay un tiempo
soleado slo el
de los das. Por otro lado, se ha calculado que cuando un da es
soleado, hay una probabilidad del 20% de que el da posterior tambin lo sea. Calcular
la probabilidad de que, en navidades, un fin de semana completo sea soleado.
Solucin: Llamemos S al suceso sbado soleado y D al suceso domingo soleado. La
nica manera en que un fin de semana completo sea soleado es que lo sea en primer
lugar el sbado, y que el domingo posterior tambin. Es decir:
Luego slo el
Demostracin
Los teoremas que restan nos dicen como calcular las probabilidades de sucesos cuando
tenemos que el suceso seguro est descompuesto en una serie de sucesos incompatibles
de los que conocemos su probabilidad. Para ello necesitamos introducir un nuevo
concepto: Se dice que la coleccin
es un sistema exhaustivo y
excluyente de sucesos si se verifican las relaciones (vase la figura 4.5):
Demostracin
Obsrvese la Figura 4.6. De ah realizamos las siguientes operaciones:
, o lo que es lo mismo,
4.12.0.6 Ejemplo
Se tienen dos urnas, y cada una de ellas contiene un nmero diferente de bolas blancas y
rojas:
U1
U2
Sea
un
, a las que
Demostracin
Es una consecuencia de la definicin de probabilidad condicionada en trminos de la
interseccin, y del teorema de la probabilidad total:
4.12.0.8 Ejemplo
Se tienen tres urnas. Cada una de ellas contiene un nmero diferente de bolas blancas y
rojas:
U1
U2
U3
4.12.0.9 Observacin
Obsrvese que en el ejemplo anterior, antes de realizar el experimento aleatorio de
extraer una bola para ver su resultado, tenamos que la probabilidad de elegir una urna i
cualquiera es
. Estas probabilidades se denominan probabilidades a priori. Sin
embargo, despus de realizar el experimento, y observar que el resultado del mismo ha
sido la extraccin de una bola blanca, las probabilidades de cada urna han cambiado a
. Estas cantidades se denominan probabilidades a posteriori. Vamos a
representar en una tabla la diferencia entre ambas:
a priori
a posteriori
reforzada si
. Una aplicacin bsica de esta tcnica la tenemos en Medicina
para decidir si un paciente padece cierta enfermedad o no, en funcin de los resultados
de un test diagnstico.
2.
Como ayuda al diagnstico de la enfermedad, se le hace pasar una serie de
pruebas (tests), que dan como resultado:
Previamente, sobre el test diagnstico a utilizar, han debido ser estimadas las
cantidades:
Sensibilidad:
Es la probabilidad de el test de positivo sobre una persona que sabemos que
padece la enfermedad,
.
Especificidad:
Es la probabilidad que el test de negativo sobre una persona que no la padece,
.
La sensibilidad y especificidad se denominan tambin respectivamente tasa de
verdaderos positivos y tasa de verdaderos negativos. Estas cantidades son
calculadas de modo aproximado, antes de utilizar el test diagnstico,
considerando grupos suficientemente numerosos de personas de las que sabemos
si padecen la enfermedad o no, y estimando los porcentajes correspondientes.
Por ejemplo se toman 100 personas sanas y 100 enfermas, y se observa que
E
T+ 89
T- 11
97
100 100
Tasa de verdaderos positivos: 89%
Tasa de falsos positivos:
3%
11%
3.
teniendo en cuenta el resultado del test diagnstico, se utiliza el teorema de
Bayes para ver cual es, a la vista de los resultados obtenidos, la probabilidad de
que realmente est enfermo si le dio positivo (ndice predictivo de verdaderos
positivos),
4.14.0.1 Ejemplo
Con el objeto de diagnosticar la colelietasis se usan los ultrasonidos. Tal tcnica tiene
una sensibilidad del 91% y una especificidad del 98%. En la poblacin que nos ocupa,
la probabilidad de colelietasis es de 0,2.
1.
Si a un individuo de tal poblacin se le aplican los ultrasonidos y dan positivos,
cul es la probabilidad de que sufra la colelietasis?
2.
Si el resultado fuese negativo, cul sera la probabilidad de que no tenga la
enfermedad?
Solucin:
Vamos a utilizar la siguiente notacin:
Este problema puede ser resuelto de otro modo, utilizando tablas bidimensionales e
identificando las probabilidades con las frecuencias relativas de la siguiente tabla
E
T+
T-
4.16 Problemas
Ejercicio 4..1. Una mujer portadora de hemofilia clsica da a luz tres hijos.
1.
Cual es la probabilidad de que de los tres hijos, ninguno est afectado por la
enfermedad?
2.
Cual es la probabilidad de que exactamente dos de los tres nios est afectado?
Ejercicio 4..2. El 60% de los individuos de una poblacin estn vacunados contra una
cierta enfermedad. Durante una epidemia se sabe que el 20% la ha contrado y que 2 de
cada 100 individuos estn vacunados y son enfermos. Calcular el porcentaje de
vacunados que enferma y el de vacunados entre los que estn enfermos..
Ejercicio 4..3. La proporcin de alcohlicos que existe en la poblacin de Mlaga es,
aproximadamente, un 10%; no obstante, en las bajas que dan los mdicos de la
Seguridad Social difcilmente se encuentra el diagnstico de alcoholismo. Aparecen sin
embargo diagnosticados de hepatopatas, lumbalgias, etc., que pueden hacer sospechar
alcoholismo subyacente. Se realiz un estudio que puso de manifiesto que el 85% de los
individuos alcohlicos y el 7% de los no alcohlicos sufran tales patologas. Se desea
saber cul es la probabilidad de que un individuo con esas patologas sea realmente
alcohlico.
Ejercicio 4..4. Dos tratamientos A y B curan una determinada enfermedad en el 20% y
30% de los casos, respectivamente. Suponiendo que ambos actan de modo
independiente, cul de las dos siguientes estrategias utilizara para curar a un individuo
con tal enfermedad:
1.
Aplicar ambos tratamientos a la vez.
2.
Aplicar primero el tratamiento B y, si no surte efecto, aplicar el A.
Ejercicio 4..5. Se eligen al azar 3 deportistas de un equipo de 10 integrantes para
realizar un control antidopaje; Se sabe que 2 de los jugadores del equipo han tomado
sustancias prohibidas. Cul es la probabilidad de elegir para el anlisis a alguno de los
infractores?
Ejercicio 4..6. Estamos interesados en saber cul de dos anlisis A y B es mejor para el
diagnstico de una determinada enfermedad, de la cual sabemos que la presentan un
10% de individuos de la poblacin. El porcentaje de resultados falsos positivos del
anlisis A es del 15% y el de B es del 22%. El porcentaje de falsos negativos de A es
del 7% y de B es del 3%. Cul es la probabilidad de acertar en el diagnstico con cada
mtodo?
Ejercicio 4..7. Con objeto de diagnosticar la colelitiasis se usan los ultrasonidos. Tal
tcnica tiene una sensibilidad del 91% y una especificidad del 98%. En la poblacin que
nos ocupa la probabilidad de colelitiasis es del 20%.
1.
Si a un individuo de tal poblacin se le aplican los ultrasonidos y dan positivos,
cul es la probabilidad de que sufra la colelitiasis?
2.
Si el resultado fuese negativo, cul es la probabilidad de que no tenga la
enfermedad?
Ejercicio 4..8. Entre los estudiantes de una Facultad de Filosofa y Letras se dan las
siguientes proporciones: el 40% son hombres. El 70% de los varones fuman, mientras
que entre las mujeres slo fuman el 20%. Escogido un estudiante al azar, calclese la
probabilidad de que fume.
Ejercicio 4..9. Los estudios epidemiolgicos indican que el 20% de los ancianos sufren
un deterioro neuropsicolgico. Sabemos que la tomografa axial computerizada (TAC)
es capaz de detectar este trastorno en el 80% de los que lo sufren, pero que tambin da
un 3% de falsos positivos entre personas sanas. Si tomamos un anciano al azar y da
positivo en el TAC, cul es la probabilidad de que est realmente enfermo?
Ejercicio 4..10. Sabemos que tiene estudios superiores el 15% de la poblacin espaola,
estudios medios el 40%, estudios primarios el 35% y no tiene estudios el 10%. Los
desempleados no se distribuyen proporcionalmente entre esas categoras, dado que de
entre los de estudios superiores estn sin trabajo el 10%, entre los de estudios medios el
35%, entre los de estudios primarios el 18%, y entre los que no tienen estudios el 37%.
Obtenga las probabilidades de que extrado uno al azar, ste sea:
1.
Titulado superior, sabiendo que est parado.
2.
Un sujeto sin estudios que est en paro.
3.
Un sujeto con estudios primarios o que est trabajando.
Ejercicio 4..11. Una enfermedad puede estar producida por tres virus A, B, y C. En el
laboratorio hay 3 tubos de ensayo con el virus A, 2 tubos con el virus B y 5 tubos con el
virus C. La probabilidad de que el virus A produzca la enfermedad es de 1/3, que la
produzca B es de 2/3 y que la produzca el virus C es de 1/7. Se inocula un virus a un
animal y contrae la enfermedad. Cul es la probabilidad de que el virus que se inocule
sea el C?
Ejercicio 4..12. El 70% de los estudiantes aprueba una asignatura A y un 60% aprueba
otra asignatura B. Sabemos, adems, que un 35% del total aprueba ambas. Elegido un
estudiante al azar, calcular las probabilidades de las siguientes situaciones:
1.
Haya aprobado la asignatura B, sabiendo que ha aprobado la A.
2.
Haya aprobado la asignatura B, sabiendo que no no ha aprobado la A.
3.
No haya aprobado la asignatura B, sabiendo que ha aprobado la A.
4.
No haya aprobado la asignatura B, sabiendo que no ha aprobado la A.
Ejercicio 4..13. La cuarta parte de los conductores de coche son mujeres. La
probabilidad de que una mujer sufra un accidente en un ao es de 5/10.000, y para los
hombres es de 1/10.000. Calclese la probabilidad de que si acaece un accidente, el
accidentado sea hombre.
Ejercicio 4..14. En un campus universitario existen 3 carreras sanitarias. Se sabe que el
50% cursan estudios de Enfermera, el 30% Medicina y el 20% Veterinaria. Los que