Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bioestadistica 3
Bioestadistica 3
4.2 introducción
Si el único propósito del investigador es describir los resultados de un experimento
concreto, los métodos analizados en los capítulos anteriores pueden considerarse
suficientes. No obstante, si lo que se pretende es utilizar la información obtenida para
extraer conclusiones generales sobre todos aquellos objetos del tipo de los que han sido
estudiados, entonces estos métodos constituyen sólo el principio del análisis, y debe
recurrirse a métodos de inferencia estadística, los cuales implican el uso inteligente de la
teoría de la probabilidad.
Tal como hemos citado anteriormente, en las aplicaciones prácticas es importante poder
describir los rasgos principales de una distribución, es decir, caracterizar los resultados
del experimento aleatorio mediante unos parámetros. Llegamos así al estudio de las
características asociadas a una variable aleatoria introduciendo los conceptos de
esperanza y varianza matemática, relacionándolos con los conceptos de media y
varianza de una variable estadística.
Para trabajar con el cálculo de probabilidades es necesario fijar previamente cierta
terminología. Vamos a introducir parte de ella en las próximas líneas.
1.
Se puede repetir indefinidamente, siempre en las mismas condiciones;
2.
Antes de realizarlo, no se puede predecir el resultado que se va a obtener;
3.
El resultado que se obtenga, e, pertenece a un conjunto conocido previamente de
resultados posibles. A este conjunto, de resultados posibles, lo denominaremos
espacio muestral y lo denotaremos normalmente mediante la letra E. Los
elementos del espacio muestral se denominan sucesos elementales.
Obsérvese que los sucesos elementales son sucesos aleatorios compuestos por un sólo
elemento. Por supuesto los sucesos aleatorios son más generales que los elementales, ya
que son conjuntos que pueden contener no a uno sólo, sino a una infinidad de sucesos
elementales --y también no contener ninguno.-- Sucesos aleatorios que aparecen con
gran frecuencia en el cálculo de probabilidades son los siguientes:
4.4.0.0.0.1 Suceso seguro:
Es aquel que siempre se verifica después del experimento aleatorio, es decir, el mismo
E
4.4.0.0.0.2 Suceso imposible:
Es aquel que nunca se verifica como resultado del experimento aleatorio. Como debe
ser un subconjunto de E, la única posibilidad es que el suceso imposible sea el conjunto
vacío
4.4.0.0.0.3 Suceso contrario a un suceso A:
Figura: Representación gráfica de un suceso
4.6.0.0.0.1 Unión:
4.6.0.0.0.2 Intersección:
representa mediante , o bien A-B, al suceso aleatorio formado por todos los
sucesos elementales que pertenecen a A, pero no a B:
4.6.0.0.0.4 Diferencia simétrica:
mediante , al suceso aleatorio formado por todos los sucesos elementales que
pertenecen a A y no a B, y los que están en By no en A:
Así:
Figura: Dados dos sucesos aleatorios
Hay ciertas propiedades que relacionan la unión, intersección y suceso contrario, que
son conocidas bajo el nombre de Leyes de Morgan:
4.8 Experimentos aleatorios y
probabilidad
Se denominan experimentos deterministas aquellos que realizados de una misma
forma y con las mismas condiciones iniciales, ofrecen siempre el mismo resultado.
Como ejemplo, tenemos que un objeto de cualquier masa partiendo de un estado inicial
de reposo, y dejado caer al vacío desde una torre, llega siempre al suelo con la misma
4.1
velocidad:
4.8.0.1 Ejemplo
Figura: Convergencia a 1/2 de la frecuencia
relativa del número de caras obtenido en
lanzamientos sucesivos de una moneda (simulación
en ordenador).
Esta es la noción frecuentista de probabilidad. Sin embargo esta definición no se
puede utilizar en la práctica pues:
Solución:
Más aún, si los sucesos son disjuntos (incompatibles) debe ocurrir que
1.
La función de probabilidad debe calcularse sobre subconjuntos de E. No es
estrictamente necesario que sean todos, pero si es necesario que si se puede
calcular sobre un conjunto, lo pueda ser también sobre su complementario, y que
si se puede calcular sobre dos conjuntos A y B, que también se pueda calcular
sobre su unión y su intersección. Para ello introduciremos el concepto de -
álgebra de sucesos, que será una clase de subconjuntos de Esobre los que
podamos aplicar las reglas de la probabilidad.
2.
Entre las leyes que debe cumplir una función de probabilidad y que hemos
escrito antes, hemos observado que algunas son redundantes, ya que se pueden
deducir de las demás. Con la definición axiomática de la probabilidad
pretendemos dar el menor conjunto posible de estas reglas, para que las demás
se deduzcan como una simple consecuencia de ellas.
Precisemos entonces los conceptos de -álgebra de sucesos y de probabilidad.
Sea una clase no vacía formada por ciertos subconjuntos del espacio muestral E.
Diremos que esta clase es un -álgebra de sucesos si los sucesos complementarios de
aquellos que están en también están en , así como sus uniones numerables (sean
finitas o infinitas). Esto se puede enunciar como:
Ax-1.
La probabilidad es una función definida sobre y que sólo toma valores
positivos comprendidos entre 0 y 1
Ax-2.
La probabilidad del suceso seguro es 1
Ax-3.
La probabilidad de la unión numerable de sucesos disjuntos es la suma de sus
probabilidades (figura 4.4):
Figura: El tercer axioma de probabilidad indica
que si con ,
entonces
4.8.4.3 Observación
La introducción de la definición de -álgebra puede parecer innecesaria a primera
vista, ya que es una clase formada por subconjuntos de Eque verifican ciertas
propiedades relativas a la complementariedad y a las uniones finitas que ya verifica de
antemano el conjunto denominado partes de E, P(E), formado por todos los
subconjuntos de E. Cuando el conjunto E de los posibles resultados de un experimento
aleatorio sea finito, normalmente consideraremos como -álgebra de sucesos al
conjunto P(E). Esto ocurre cuando por ejemplo realizamos el experimento aleatorio de
lanzar un dado:
Solución:
Por otro lado, si ha salido un número par, de nuevo por la definición de probabilidad de
Laplace tendríamos
Esta misma probabilidad se podría haber calculado siguiendo la definición de la
probabilidad condicionada, ya que si escribimos
y entonces
que por supuesto coincide con el mismo valor que calculamos usando la definición de
probabilidad de Laplace.
4.10.0.2 Observación
Si entre dos sucesos no existe ninguna relación cabe esperar que la expresión
``sabiendo que'' no aporte ninguna información. De este modo introducimos el concepto
de independencia de dos sucesos A y B como:
Esta relación puede ser escrita de modo equivalente, cuando dos sucesos son de
probabilidad no nula como
4.12.0.1 Proposición
3.
Probabilidad del suceso contrario:
4.
Probabilidad condicionada del suceso contrario:
4.12.0.2 Ejemplo
En una universidad el 50% de los alumnos habla inglés, el 20% francés y el 5% los dos
idiomas ¿Cuál es la probabilidad de encontrar alumnos que hablen alguna lengua
extranjera?
Solución:
Así:
4.12.0.3 Ejemplo
En una estación de esquí, para navidad-es, la experiencia indica que hay un tiempo
soleado sólo el de los días. Por otro lado, se ha calculado que cuando un día es
soleado, hay una probabilidad del 20% de que el día posterior también lo sea. Calcular
la probabilidad de que, en navidades, un fin de semana completo sea soleado.
Demostración
Los teoremas que restan nos dicen como calcular las probabilidades de sucesos cuando
tenemos que el suceso seguro está descompuesto en una serie de sucesos incompatibles
de los que conocemos su probabilidad. Para ello necesitamos introducir un nuevo
Figura: A1,A2,A3,A4 forman un sistema exhaustivo
y excluyente se sucesos.
Demostración
Obsérvese la Figura 4.6. De ahí realizamos las siguientes operaciones:
Figura: Si A1,A2,A3,A4 forma un sistema
exhaustivo y excluyente se sucesos, podemos
calcular la probabilidad de B a partir de las
4.12.0.6 Ejemplo
Se tienen dos urnas, y cada una de ellas contiene un número diferente de bolas blancas y
rojas:
Primera urna, U1: 3 bolas blancas y 2 rojas;
Segunda urna, U2: 4 bolas blancas y 2 rojas.
Se realiza el siguiente experimento aleatorio:
Se tira una moneda al aire y si sale cara se elige una bola de la primera
urna, y si sale cruz de la segunda.
U1
U2
4.12.0.8 Ejemplo
Se tienen tres urnas. Cada una de ellas contiene un número diferente de bolas blancas y
rojas:
Primera urna, U1: 3 bolas blancas y 2 rojas;
Segunda urna, U2: 4 bolas blancas y 2 rojas;
Tercera urna, U3: 3 bolas rojas.
Alguien elije al azar y con la misma probabilidad una de las tres urnas, y
saca una bola.
Solución:
U1
U2
U3
1 1
podemos llevar a cabo la experimentación que se considere más conveniente, para una
vez obtenido el cuerpo de evidencia, B, calcular como se modifican las probabilidades
de verosimilitud de cada teoría mediante el teorema de Bayes:
1.
Se sospecha que un paciente puede padecer cierta enfermedad, que tiene una
incidencia de la enfermedad en la población (probabilidad de que la
Previamente, sobre el test diagnóstico a utilizar, han debido ser estimadas las
cantidades:
Sensibilidad:
Es la probabilidad de el test de positivo sobre una persona que sabemos que
padece la enfermedad, .
Especificidad:
Es la probabilidad que el test de negativo sobre una persona que no la padece,
.
La sensibilidad y especificidad se denominan también respectivamente tasa de
verdaderos positivos y tasa de verdaderos negativos. Estas cantidades son
calculadas de modo aproximado, antes de utilizar el test diagnóstico,
considerando grupos suficientemente numerosos de personas de las que sabemos
si padecen la enfermedad o no, y estimando los porcentajes correspondientes.
Por ejemplo se toman 100 personas sanas y 100 enfermas, y se observa que
E
T+ 89 3
T- 11 97
100 100
Tasa de verdaderos positivos: 89%
Tasa de falsos positivos: 3%
Tasa de verdaderos negativos: 97%
Tasa de falsos negativos: 11%
3.
teniendo en cuenta el resultado del test diagnóstico, se utiliza el teorema de
Bayes para ver cual es, a la vista de los resultados obtenidos, la probabilidad de
que realmente esté enfermo si le dio positivo (índice predictivo de verdaderos
positivos),
o la de que esté sano si le dio negativo (índice predictivo de verdaderos
negativos):
4.14.0.1 Ejemplo
Con el objeto de diagnosticar la colelietasis se usan los ultrasonidos. Tal técnica tiene
una sensibilidad del 91% y una especificidad del 98%. En la población que nos ocupa,
la probabilidad de colelietasis es de 0,2.
1.
Si a un individuo de tal población se le aplican los ultrasonidos y dan positivos,
¿cuál es la probabilidad de que sufra la colelietasis?
2.
Si el resultado fuese negativo, ¿cuál sería la probabilidad de que no tenga la
enfermedad?
Solución:
Negativos'', ,
Este problema puede ser resuelto de otro modo, utilizando tablas bidimensionales e
identificando las probabilidades con las frecuencias relativas de la siguiente tabla
E
T+
T-
1
4.16 Problemas
Ejercicio 4..1. Una mujer portadora de hemofilia clásica da a luz tres hijos.
1.
¿Cual es la probabilidad de que de los tres hijos, ninguno esté afectado por la
enfermedad?
2.
¿Cual es la probabilidad de que exactamente dos de los tres niños esté afectado?
Ejercicio 4..2. El 60% de los individuos de una población están vacunados contra una
cierta enfermedad. Durante una epidemia se sabe que el 20% la ha contraído y que 2 de
cada 100 individuos están vacunados y son enfermos. Calcular el porcentaje de
vacunados que enferma y el de vacunados entre los que están enfermos..
1.
Aplicar ambos tratamientos a la vez.
2.
Aplicar primero el tratamiento B y, si no surte efecto, aplicar el A.
Ejercicio 4..6. Estamos interesados en saber cuál de dos análisis A y B es mejor para el
diagnóstico de una determinada enfermedad, de la cual sabemos que la presentan un
10% de individuos de la población. El porcentaje de resultados falsos positivos del
análisis A es del 15% y el de B es del 22%. El porcentaje de falsos negativos de A es
del 7% y de B es del 3%. ¿Cuál es la probabilidad de acertar en el diagnóstico con cada
método?
Ejercicio 4..7. Con objeto de diagnosticar la colelitiasis se usan los ultrasonidos. Tal
técnica tiene una sensibilidad del 91% y una especificidad del 98%. En la población que
nos ocupa la probabilidad de colelitiasis es del 20%.
1.
Si a un individuo de tal población se le aplican los ultrasonidos y dan positivos,
¿cuál es la probabilidad de que sufra la colelitiasis?
2.
Si el resultado fuese negativo, ¿cuál es la probabilidad de que no tenga la
enfermedad?
Ejercicio 4..8. Entre los estudiantes de una Facultad de Filosofía y Letras se dan las
siguientes proporciones: el 40% son hombres. El 70% de los varones fuman, mientras
que entre las mujeres sólo fuman el 20%. Escogido un estudiante al azar, calcúlese la
probabilidad de que fume.
Ejercicio 4..9. Los estudios epidemiológicos indican que el 20% de los ancianos sufren
un deterioro neuropsicológico. Sabemos que la tomografía axial computerizada (TAC)
es capaz de detectar este trastorno en el 80% de los que lo sufren, pero que también da
un 3% de falsos positivos entre personas sanas. Si tomamos un anciano al azar y da
positivo en el TAC, ¿cuál es la probabilidad de que esté realmente enfermo?
Ejercicio 4..10. Sabemos que tiene estudios superiores el 15% de la población española,
estudios medios el 40%, estudios primarios el 35% y no tiene estudios el 10%. Los
desempleados no se distribuyen proporcionalmente entre esas categorías, dado que de
entre los de estudios superiores están sin trabajo el 10%, entre los de estudios medios el
35%, entre los de estudios primarios el 18%, y entre los que no tienen estudios el 37%.
Obtenga las probabilidades de que extraído uno al azar, éste sea:
1.
Titulado superior, sabiendo que está parado.
2.
Un sujeto sin estudios que está en paro.
3.
Un sujeto con estudios primarios o que está trabajando.
Ejercicio 4..11. Una enfermedad puede estar producida por tres virus A, B, y C. En el
laboratorio hay 3 tubos de ensayo con el virus A, 2 tubos con el virus B y 5 tubos con el
virus C. La probabilidad de que el virus A produzca la enfermedad es de 1/3, que la
produzca B es de 2/3 y que la produzca el virus C es de 1/7. Se inocula un virus a un
animal y contrae la enfermedad. ¿Cuál es la probabilidad de que el virus que se inocule
sea el C?
Ejercicio 4..12. El 70% de los estudiantes aprueba una asignatura A y un 60% aprueba
otra asignatura B. Sabemos, además, que un 35% del total aprueba ambas. Elegido un
estudiante al azar, calcular las probabilidades de las siguientes situaciones:
1.
Haya aprobado la asignatura B, sabiendo que ha aprobado la A.
2.
Haya aprobado la asignatura B, sabiendo que no no ha aprobado la A.
3.
No haya aprobado la asignatura B, sabiendo que ha aprobado la A.
4.
No haya aprobado la asignatura B, sabiendo que no ha aprobado la A.