Está en la página 1de 29

UNIDAD 3:

DISTRIBUCIONES DE
PROBABILIDAD CONTINUAS Y
DISCRETAS (CONTINUACIÓN)
EJEMPLO DE PRUEBAS DIAGNÓSTICAS : DIABETES
▪ Los carbohidratos que ingerimos terminan como glucosa en la sangre. El exceso se transforma en
glucógeno y se almacena en el hígado y los músculos. Este se transforma entre comidas de nuevo en
glucosa según las necesidades.

▪ La principal hormona que regula su concentración es la insulina. La diabetes provoca su deficiencia, o


bien la insensibilidad del organismo a su presencia. Es una enfermedad muy común que afecta al 2%
de la población (prevalencia).

▪ Una prueba común para diagnosticar la diabetes, consiste en medir el nivel de glucose en la sangre. En
individuos sanos suele variar entre 64 y 110mg/dL.

▪ El cambio de color de un indicador al contacto con la orina suele usarse como resultado del test
positivo.

▪ Valores por encima de 110 mg/dL se asocian con un posible estado pre-diabético, pero no es seguro.
Otras causas podrían ser: hipertiroidismo, cáncer de páncreas, pancreatitis, ingesta excesiva reciente
de comida.

▪ Supongamos que los enfermos de diabetes, tienen un valor medio de 126mg/dL.


NOMBRE PRESENTACIÓN 00
EJEMPLO DE PRUEBAS DIAGNÓSTICAS : DIABETES
Valor límite: 110mg/dL
Superior: test positivo.
Inferior: test negativo.

Probabilidad de acierto:
Para enfermos
Verdadero positivo
(sensibilidad)
Para sanos
Verdadero negativo
(especificidad)

Probabilidad de error
Para enfermos
Falso –
Para sanos
Falso +

NOMBRE PRESENTACIÓN 00
¿CÓMO DEFINIR EL PUNTO DE CORTE DE LA PRUEBA DIAGNÓSTICA?

No es simple. No es posible aumentar sensibilidad y especificidad al mismo tiempo.


Hay que elegir una solución de compromiso: Es decir, lograr una aceptable sensibilidad y
especificidad.
NOMBRE PRESENTACIÓN 00
EJEMPLO DE PRUEBAS DIAGNÓSTICAS : DIABETES
▪ Una prueba diagnóstica ayuda a mejorar una estimación de la probabilidad de que un individuo
presente una enfermedad.

▪ En principio, tenemos una idea subjetiva de P (Enfermo). Nos ayudamos de:


▪ Incidencia: Porcentaje de nuevos casos de la enfermedad en la población.
▪ Prevalencia: Porcentaje de la población que presenta una enfermedad.

▪ Para confirmar la sospecha, usamos una prueba diagnóstica. Ha sido evaluada con anterioridad sobre
dos grupos de individuos: sanos y enfermos. Así de modo frecuentista se ha estimado:
P (+ | Enfermo) = Sensibilidad (Verdaderos +) = Tasa de acierto sobre enfermos.
P ( - | Sano) = Especificidad (Verdaderos -) = Tasa de acierto sobre sanos.

▪ A partir de lo anterior, y usando el teorema de Bayes, podemos calcular las probabilidades a posteriori
(en función de los resultados del test): Índices predictivos
P (Enfermo | +) = Índice predictivo positivo
P (Sano | - ) = Índice predictivo negativo

NOMBRE PRESENTACIÓN 00
EJEMPLO DE PRUEBAS DIAGNÓSTICAS : TEOREMA DE BAYES Y DIABETES

Sensibilidad, T+
verdaderos +
Prob.. a priori de enfermedad:
incid., preval., intuición,… Enfermo

Falsos - T-
Individuo
Falsos +
T+
Sano

Especificidad, T-
Verdaderos -

NOMBRE PRESENTACIÓN 00
EJEMPLO DE PRUEBAS DIAGNÓSTICAS : TEOREMA DE BAYES Y DIABETES
Individuo
La diabetes afecta al 2% de los
individuos. 0,98 0,02

La presencia de glucosuria se
usa como indicador de diabetes.

Su sensibilidad es de 0,945.
0,055 0,945
0,977 0,023
La especificidad de 0,977.

Calcular los índices predictivos. T+ T- T+


T-

NOMBRE PRESENTACIÓN 00
EJEMPLO DE PRUEBAS DIAGNÓSTICAS : TEOREMA DE BAYES Y DIABETES
-¿Qué probabilidad tengo
En el ejemplo anterior, al llegar un individuo a la de estar enfermo?
consulta tenemos una idea a priori sobre la
- En principio un 2%. Le
probabilidad de que tenga una enfermedad.
haremos unas pruebas.

A continuación se le pasa una prueba diagnóstica


que nos aportará nueva información: Presenta
glucosuria o no.

En función del resultado tenemos una nueva idea (a


posteriori) sobre la probabilidad de que esté
enfermo. - Presenta glucosuria. La
probabilidad ahora es del
Nuestra opinión a priori ha sido modificada por 45,6%.
el resultado de un experimento.

NOMBRE 8
PRESENTACIÓN 00
VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

▪ Si a cada punto de un espacio muestral asignamos un número, así definimos una


función en el espacio muestral. Esta función se llama variable aleatoria (o variable
estocástica) o más precisamente función aleatoria (función estocástica).

▪ Comúnmente se denota por una letra mayúscula como X o Y. En general, una


variable aleatoria tiene algún significado físico, geométrico u otro.

▪ A esta expresión de probabilidad, P(X = x), se le conoce como función de


probabilidad, o distribución de probabilidad, y se representa mediante :

𝒇 𝒙 = P (X = xk )

▪ Una variable aleatoria que toma un número finito o infinito contable de valores se
denomina variable aleatoria discreta, mientras que una que toma un número
infinito no contable de valores se llama variable aleatoria no discreta o continua.
NOMBRE PRESENTACIÓN 00
DISTRIBUCIONES DE PROBABILIDAD DISCRETAS

▪ Si una variable X toma un conjunto discreto de valores X1, X2, . . . , XK con


probabilidades respectivas p1, p2, . . . , pK, donde p1 + p2 +. . .+ pK = 1, esto se define
como una distribución de probabilidad discreta de X.

▪ La función p (X), que tiene los valores p1, p2, . . . , pK para X = X1, X2, . . . , XK ,
respectivamente, se llama función de probabilidad o función de frecuencia de X.

▪ Como X puede tomar ciertos valores con determinadas probabilidades, suele llamársele
variable aleatoria discreta. A las variables aleatorias también se les conoce como
variables estocásticas.

▪ Ejemplo: Número de caras al lanzar 3 monedas


(frecuencia relativa y diagrama de barras). Una
distribución de probabilidad se puede representar
graficando p(X) contra X, como se hace con las
distribuciones de frecuencias relativas.
NOMBRE PRESENTACIÓN 00
DISTRIBUCIONES DE PROBABILIDAD DISCRETAS
EJEMPLO: Se tiran al azar 2 dados diferentes, y los resultados se anotan como la suma de los
puntos que caen hacia arriba:

S = {11, 12, 13, 14, 15, 16, 21, 22, 23, 24, 25, 26, 31, 32, 33, 34, 35, 36, 41, 42, 43, 44, 45, 46,
51, 52, 53, 54, 55, 56, 61, 62, 63, 64, 65, 66}

NOMBRE PRESENTACIÓN 00
DISTRIBUCIONES DE PROBABILIDAD CONTINUAS
Las ideas anteriores pueden extenderse al caso en el que la variable X puede tomar un conjunto
continuo de valores. El polígono de frecuencias relativas de la muestra se convierte, en el caso
teórico o límite de una población, en una curva continua cuya ecuación es Y = p (X).

El área total limitada por el eje X, bajo esta curva, es igual a 1, y el área entre las rectas X = a y X
= b corresponde a la probabilidad de que X se encuentre entre a y b, lo que se denota como
P {a < X < b}.

A p (X) se le conoce como función de densidad


de probabilidad o brevemente función de densidad,
y cuando se da una de estas funciones se dice que
se define una distribución de probabilidad continua
para X; a la variable X suele llamársele variable
aleatoria continua. Como en el caso discreto, se
pueden definir distribuciones de probabilidad
acumulada y las funciones de distribución
correspondientes.
NOMBRE PRESENTACIÓN 00
DISTRIBUCIONES DE PROBABILIDAD CONTINUAS: FUNCIÓN DE DENSIDAD

▪ Muchos procesos aleatorios vienen descritos por variables, de forma que son conocidas las
probabilidades en intervalos.

▪ La integral definida de la función de densidad en dichos intervalos coincide con la


probabilidad de los mismos.

▪ Es decir, identificamos la probabilidad de un intervalo con el área bajo la función de


densidad.

NOMBRE PRESENTACIÓN 00
DISTRIBUCIONES CONTINUAS: FUNCIÓN DE DISTRIBUCIÓN

▪ Es la función que asocia a cada valor de una variable, la probabilidad acumulada de los
valores inferiores o iguales.

▪ Es similar a las frecuencias acumuladas que vimos anteriormente.

▪ A los valores extremadamente bajos les corresponden valores de la función de distribución


cercanos a cero, mientras que a los valores extremadamente altos les corresponden valores
de la función de distribución cercanos a uno.

▪ Generalmente lo encontraremos con el nombre de “p-valor”, significación.

NOMBRE PRESENTACIÓN 00
DISTRIBUCIONES CONTINUAS: UTILIDAD DE LA FUNCIÓN DE DISTRIBUCIÓN

1. Contrastar lo anómalo de una observación concreta.

▪ Por ejemplo, sabemos que una persona de altura 2,10 cm. es “anómala” porque la función de
distribución en 2,10 es muy alta.

▪ También sabemos que una persona adulta que mida menos de 140cm es “anómala” porque la
función de distribución es muy baja para 140 cm.

▪ Por su parte, una persona que mida 1,70 cm. no posee una altura nada extraña pues su
función de distribución es aproximadamente 0,5.

2. En contrastes de hipótesis: podremos observar unos resultados experimentales, y contrastar


lo “anómalos” que son, en relación con una hipótesis determinada.

NOMBRE PRESENTACIÓN 00
VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA

1. VALOR ESPERADO :

✓ Se representa mediante E (X) o μ, y es el equivalente a la media

2. VARIANZA:

✓ Se representa mediante VAR (X) o σ2.

✓ Es el equivalente a la varianza, mientras que σ es la desviación estándar.

NOMBRE PRESENTACIÓN 00
MODELOS DE VARIABLES ALEATORIAS

▪ Hay Variables aleatorias que aparecen con frecuencia en las Ciencias de la Salud.

1. Experimentos dicotómicos.
2. Bernoulli

▪ Algunas distribuciones nos permiten contar éxitos en experimentos dicotómicos


repetidos:

1. Binomial
2. Poisson (sucesos raros)
3. Hipergeométrica

▪ Y en otras muchas ocasiones…


1. Distribución normal (gaussiana, campana de Gauss)

NOMBRE PRESENTACIÓN 00
1.- DISTRIBUCIONES DISCRETAS: DE BERNOULLI

▪ Tenemos un experimento de Bernoulli si al realizar un experimentos sólo son posibles dos


resultados:
X=1 (éxito, con probabilidad p)
X=0 (fracaso, con probabilidad q = 1-p)

▪ Lanzar una moneda y que salga cara => p = ½ = 50%

▪ Elegir una persona de la población y que esté enfermo => p = 1/1.000 = prevalencia de la
enfermedad.
▪ Aplicar un tratamiento a un enfermo y que éste se cure => p = 95%, probabilidad de que el
individuo se cure.

▪ Como se aprecia, en experimentos donde el resultado es dicotómico, la variable queda


perfectamente determinada, conociendo el parámetro p.

NOMBRE PRESENTACIÓN 00
DISTRIBUCIÓN DISCRETAS: DE BERNOULLI

EJEMPLO 1: Se han observado, en base a estudios, 2.000 accidentes de tráfico con impacto
frontal y cuyos conductores no tenían cinturón de seguridad, en los que 300 individuos
quedaron con secuelas. Describa el experimento usando conceptos de variable aleatoria.

Solución:
La noción frecuentista de probabilidad, nos permite aproximar la probabilidad de tener secuelas
mediante el cálculo;
300 / 2000 = 0,15 = 15%

X= “tener secuelas tras accidente sin cinturón” es variable de Bernoulli.


X = 1 tiene probabilidad p ≈ 0,15
X = 0 tiene probabilidad q ≈ 0,85

NOMBRE PRESENTACIÓN 00
DISTRIBUCIÓN DISCRETAS: DE BERNOULLI

EJEMPLO: Se ha observado, estudiando 2.000 accidentes de tráfico con impacto frontal y cuyos
conductores sí tenían cinturón de seguridad, que 10 individuos quedaron con secuelas.
Describa el experimento usando conceptos de variable aleatoria.

Solución:
La noción frecuentista de probabilidad nos permite aproximar la probabilidad de quedar con
secuelas:
10 / 2000 = 0,005 = 0,5%

X = “tener secuelas tras accidente usando cinturón” es variable de Bernoulli


X = 1 tiene probabilidad p ≈ 0,005
X = 0 tiene probabilidad q (o 1 – p) ≈ 0,995

NOMBRE PRESENTACIÓN 00
DISTRIBUCIÓN DISCRETAS: DE BERNOULLI

▪ En los dos ejemplos anteriores hemos visto como enunciar los resultados de un experimento
en forma de estimación de parámetros en distribuciones de Bernoulli.

▪ Secuelas sin cinturón: p ≈ 15%


Secuelas con cinturón: p ≈ 0,5%

NOMBRE PRESENTACIÓN 00
2.- DISTRIBUCIÓN DISCRETAS: BINOMIAL

▪ Si p es la probabilidad de que en un sólo ensayo ocurra un evento (llamada la probabilidad de


éxito),
▪ q = 1 − p es la probabilidad de que este evento no ocurra en un solo ensayo (llamada
probabilidad de fracaso),

▪ Entonces, la probabilidad de que el evento ocurra exactamente X veces en N ensayos (es


decir, que ocurran X éxitos y N − X fracasos) está dada por:

El componente P(X = x | n, p) se lee como “la probabilidad de que X sea igual a x, dado el número
de intentos n y la probabilidad de éxito p en un intento determinado”.

Su forma funcional depende de p: cuando es igual a 0.5, su distribución es simétrica; cuando es


mayor de 0.5, se carga a la derecha del centro; y cuando es menor de 0.5, se carga a la
izquierda.
NOMBRE PRESENTACIÓN 00
DISTRIBUCIÓN DISCRETAS: BINOMIAL

EJEMPLO: Supóngase que en un área geográfica determinada, 40% de la población adulta


ha sido vacunada contra viruela. De esta población se saca una muestra aleatoria de 10
adultos.
¿Qué probabilidad hay de que 3 de ellos hayan recibido la vacuna?

Se supone que el tamaño de la población es grande en relación con el tamaño de la muestra.


Se tiene, pues, una pregunta que se puede contestar por medio de la distribución binomial,
en la cual N = 10, p = 0,4 y X = 3.

= P (X= 3 | 10, 0,4) = 10! x 0,43 x 0,67= 21,5%


(3!) (10! - 3!)

Por tanto, la probabilidad de que haya tres personas vacunadas contra viruela entre 10
adultos escogidos al azar en una población grande en la que 40% ha sido vacunado es de
0,215 = 21,5%.

NOMBRE PRESENTACIÓN 00
DISTRIBUCIÓN DISCRETAS: BINOMIAL
▪ Por lo general, esta ecuación es un poco difícil de realizar por la gran cantidad de cálculos
que requiere. Para el cálculo de estas probabilidades se han desarrollado tablas de
distribución binomial, además de una fórmula de aproximación a la normal, que es muy útil
cuando el número de observaciones es muy grande.

▪ La distribución normal proporciona una buena aproximación de la distribución binomial,


cuando N es grande y p no está demasiado cerca de 0 o de 1. Una regla práctica que se
sigue con frecuencia establece que la aproximación normal de la binomial es apropiada
cuando el producto P x Q x N es igual o mayor a 5, y p es mayor a 0,1 y menor a 0,9.

▪ Su forma funcional depende de p: cuando es igual a 0.5, su distribución es simétrica;


cuando es mayor de 0.5, se carga a la derecha del centro; y cuando es menor de 0.5, se
carga a la izquierda.

▪ Propiedades de la distribución Binomial:


a) Media: μ = N x P
b) Varianza: σ2 = N x P x Q
NOMBRE PRESENTACIÓN 00
3.- DISTRIBUCIONES DISCRETAS: DE POISSON
▪ La distribución de Poisson describe una distribución muestral muy útil cuando estamos
interesados en un evento aleatorio que se presenta a lo largo de un intervalo de tiempo.
En general utilizaremos la distribución de Poisson como aproximación de experimentos
binomiales donde el número de pruebas es muy alto, pero la probabilidad de éxito muy
baja.

▪ Si identificamos como x el número de veces que el evento se presenta en un intervalo


de tiempo o espacio, entonces la probabilidad de que ocurra x está dada por:

▪ Donde 𝝀 es el parámetro de la distribución, y corresponde al número promedio de veces


que el evento aleatorio se presenta en el intervalo de tiempo o región. El símbolo ⅇ es la
constante 2,71828. Dado que la probabilidad de que ocurra el evento x depende de 𝜆 la
tasa de ocurrencias se representa con el término P(X = x| 𝜆 t ).
NOMBRE PRESENTACIÓN 00
DISTRIBUCIONES DISCRETAS: DE POISSON
▪ La distribución de Poisson cumple con los requerimientos de toda distribución de
probabilidad, porque f(x) > 0 para toda x, y 𝛴f(x) = 1.

▪ Una particularidad interesante de la distribución de Poisson es el hecho de que la media y


la varianza son iguales y tienen ambas el valor de 𝝀 .

▪ En ciencias de la salud, la distribución de Poisson tiene dos usos principales.

1. Permite describir la distribución de probabilidad que muestra un grupo especial de


razones: las densidades de incidencia, en las que el numerador está formado por conteos
y el denominador es la suma de tiempos-persona que se acumulan en la observación.

2. Por la otra, asumiendo que μ = 𝜆 = np, esta distribución proporciona una buena
aproximación a la distribución binomial cuando p < 0,1 o p > 0,9 y n ≥ 20.

NOMBRE PRESENTACIÓN 00
DISTRIBUCIONES DISCRETAS: DE POISSON

EJEMPLO: El administrador de un hospital ha llegado a la conclusión de que las admisiones


diarias de emergencia están distribuidas de acuerdo con el proceso de Poisson. Los registros del
hospital revelan que, durante un periodo determinado, las admisiones de emergencia han sido en
promedio de 3 por día. Si el administrador está en lo cierto al suponer una distribución de
Poisson, se puede encontrar la probabilidad de que:

1. En un día dado, ocurran exactamente dos admisiones de emergencia.


𝜆=3
X=2

f (x) = e–3 λ2 = 2,71828-3 x 3 2 = 0,0498 x 9 = 22,4%


2! 1x2 2

2. En un día particular, no ocurra admisión de emergencia alguna.

f (x) = e–3 λ0 = 2,71828-3 x 3 0 = 0,0498 x 1 = 5%


0! 1 1
NOMBRE PRESENTACIÓN 00
DISTRIBUCIONES DISCRETAS: DE POISSON
Ejemplos:
1.- El número de individuos que será atendido un día cualquiera en el servicio de urgencias del
hospital clínico universitario de La Serena.
- En la Región hay 500.000 habitantes (n grande).
- La probabilidad de que cualquier persona tenga un accidente es pequeña, pero no nula.
Supongamos que es 1/10.000

Bin (n = 500.000, p = 1/10.000) ≈ Poisson (μ = np = 50)

2.- Sospechamos que diferentes hospitales pueden tener servicios de traumatología de diferente
“calidad” (algunos presentan pocos, pero creemos que aún demasiados, enfermos con secuelas tras la
intervención). Es difícil compararlos pues cada hospital atiende poblaciones de tamaños diferentes
(ciudades, pueblos,…). Tenemos en cada hospital X un n, el número de pacientes atendidos o número
de individuos de la población que cubre el hospital.

Tenemos p pequeño calculado como frecuencia relativa de secuelas con respecto al total de pacientes
que trata el hospital, o el tamaño de la población.

Se puede modelar mediante Poisson (μ = np) NOMBRE PRESENTACIÓN 00


ANTOFAGASTA / LA SERENA / SANTIAGO / CHILLÁN

También podría gustarte