Está en la página 1de 19

UNIDAD VI: DISTRIBUCIONES DE PROBABILIDAD

Introducción:

Como se puede intuir con distribución de probabilidades, se pretende estudiar cómo se


distribuye la probabilidad de la aparición de los distintos valores de la variable, en función de estos.
Indica toda la gama de valores que pueden representarse como resultado de un experimento. Se puede
visualizar a través de un gráfico en el plano (probabilidad en función de los valores de la variable).
Es importante relacionar la probabilidad con el concepto de frecuencia relativa. Una
distribución de probabilidad tiene relación con la distribución de frecuencias relativas ya que fr = fi/ n,
que numéricamente coincide con la definición clásica “a priori” de probabilidad. La diferencia es que,
en vez de describir el pasado (distribución de frecuencia relativa), describe la probabilidad que un
evento se realice en el futuro (distribución de probabilidad), constituye una herramienta fundamental
para la prospectiva, para la inferencia, puesto que se puede diseñar un escenario de acontecimientos
futuros considerando las tendencias actuales de diversos fenómenos que se observan en la naturaleza.
La estadística inferencial toma decisiones que son evaluadas en términos de probabilidades, esto
es fundamental en la investigación.
Existen protocolos de trabajo para este estudio que dependen de la clasificación de la variable: si
es cualitativa, cuantitativa, si es discreta, continua…….
- DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS
DISCRETAS

“Una variable aleatoria discreta es aquella que puede tomar algunos valores
entre dos dados”

Los resultados de experimentos aleatorios pueden ser de nuestro interés por sí mismos, o al
asignarle un valor determinado, nos ayuden a decidir sobre alguna cuestión específica. Por ejemplo al
lanzar una moneda los resultados posibles son: cara, sello, entonces la variable aleatoria “lanzar una
moneda” toma esos dos valores, pero a estos se les puede asignar un significado específico por ejemplo:
si sale cara, lavas el material de vidrio. Aunque se tengan distintos objetivos o se desee interpretar los
resultados de distinta manera, el comportamiento de la variable no cambia. Tomando como variable
aleatoria al aspecto o característica que nos interesa medir, siendo el azar el responsable de los valores
obtenidos.

Definición 1:

Variable aleatoria es aquella que toma valores de acuerdo a los resultados de un


experimento.

1
Definición 2:
Es una función de valor real que tiene como dominio el espacio muestral asociado
a un experimento aleatorio.
Las variables aleatorias generalmente se simbolizan con X,Y,Z. Analizaremos un ejemplo: Se
lanza una moneda 3 veces ( o la situación equivalente en estadística: lanzamos tres monedas a la vez). El
espacio muestral para este experimento es:

S = {(ccc), (ccs), (csc), (scc), (ssc), (scs), (css), (sss)}

El espacio muestral se puede obtener mediante el diagrama de árbol

De este experimento nos puede interesar el número de sellos que salen en cada lanzamiento, esto
implica que los valores de la variable son:
x1 = 0, que representa la situación no salió sello en los tres
lanzamientos. Esto se puede indicar como evento o suceso A: “no se
obtienen sellos” o “se obtienen tres caras”
x2 = 1 que representa la situación salió 1 sello en los tres
lanzamientos. Esto se puede indicar como evento o suceso B: “se obtiene 1
sello” o “se obtienen dos caras”
x3 = 2 que representa la situación salieron 2 sellos en los tres
lanzamientos. Esto se puede indicar como evento o suceso C: “se obtienen
2 sellos” o “se obtiene una cara”
x4 = 3 que representa la situación salieron 3 sellos en los tres
lanzamientos. Esto se puede indicar como evento o suceso D: “se obtienen
3 sellos” o “no se obtienen caras”
En una distribución de probabilidades se relacionan los valores de la variable con las respectivas
probabilidades de ocurrencia, esta relación se puede presentar no excluyentemente, a través de tablas, de
gráficos, o de indicadores

 Tablas
X: 0 1 2 3
P[X=Xi]: 1/8 3/8 3/8 1/8

Se observa que los eventos o sucesos son mutuamente excluyentes y en la tabla comprobamos
que se cumple:

2
P[X=0] + P[X=1] +P[X=2] + P[X=3] = 1/8+ 3/8+ 3/8 +1/8 = 1
Este resultado es para todos los valores que toma una variable aleatoria discreta: “la suma de las
probabilidades de los distintos valores que toma la variable aleatoria discreta es igual a 1”
Podemos además, hacer los siguientes cálculos:
¿Cuál es la probabilidad de que salgan como máximo dos sellos?
P[X < 2] = P[X=0] + P[X=1] +P[X=2] = 1/8+ 3/8+ 3/8= 7/8
¿Cuál es la probabilidad de que salgan por lo menos dos sellos?
P[X > 2] = P[X=2] + P[X=3] +P[X=2] = 3/8+ 1/8= 4/8 = ½

 Gráfico

 Indicadores
Cuando se trabajó con distribución de frecuencia relativa para los valores de la variable se
utilizaron dos indicadores muy útiles que nos ayudaron a representar lo que ocurre con los valores de la
variable en estudio, uno de tendencia central, la media o promedio aritmético (μ para población y para
muestra) y otro de dispersión, la varianza (σ2 para la población, s2 para muestra)

-Media o promedio aritmético

En distribución de probabilidades la media o promedio μ también es llamada ESPERANZA


MATEMÁTICA (E[X])

3
Aplicado al ejemplo:

¿Cómo podemos interpretar este resultado? ¿Podríamos decir que lo más probable, el valor
esperado, es que salga 1,5 sellos al lanzar tres veces una moneda? No tiene sentido, como respuesta del
experimento relacionado con el valor de la media, o sale un sello o salen dos en las tres tiradas. Pero si
se consideran dos tiradas y en la primera sale un sello y en la segunda salen dos, al hacer el promedio
tiene sentido el valor de 1,5. Si este experimento se repite n veces, con n tendiendo a infinito tiene
todavía más sentido este resultado.

-Varianza

Aplicado al ejemplo:

σ2 = V[X] = (0- 1,5)2 x 1/8 +(1- 1,5)2 x 1/8 + (2- 1,5)2 x 1/8 + (3- 1,5)2 x 1/8 = 0,75

A este parámetro, asociado a la distribución de probabilidades se le llama VARIANZA.

siendo el desvío σ = 0,866


Otro ejemplo
Si lanzamos dos dados y nuestro interés es determinar la suma de los valores de las caras
superiores, la tabla que representa al experimento es:

+ 1 2 3 4 5 6

1 2 3 4 5 6 7

2 3 4 5 6 7 8

3 4 5 6 7 8 9

4 5 6 7 8 9 10

5 6 7 8 9 10 11

6 7 8 9 10 11 12

4
Si calculamos la probabilidad de que la suma sea siete aplicando la definición clásica de La
Place, nos haría falta calcular el número de casos favorables (m) y el número de resultados posibles para
este experimento (n).
Se pueden calcular m y n, a partir de la tabla precedente pero n es fácil de relacionar con
combinatoria: un resultado posible del evento al que se ha hecho referencia es (4 , 5) esto es que el 1°
dado salga 4 y el 2° salga 5.
Podemos deducir n = 6 (cantidad de símbolos que podrían ocupar el lugar del 4 o del 5 y r = 2,
cantidad de símbolos que tiene el ejemplo elegido). Recordemos, si n ≠ r, no se aplica la fórmula de
permutación. Como importa el orden, se descarta combinación. Entonces se puede calcular como
variación con repetición ya que otro posible resultado podría haber sido (5 , 5):
, Entonces

Y teniendo en cuenta todos los resultados posibles del experimento, se obtiene la distribución de
probabilidades para esta variable:

 Tabla

X: 2 3 4 5 6 7 8 9 10 11 12
P [X = Xi]: 1 2 3 4 5 6 5 4 3 2 1
36 36 36 36 36 36 36 36 36 36 36

Podemos observar que los eventos o sucesos son mutuamente excluyentes y en la tabla
comprobamos que se cumple:

P[X=2] + P[X=3] +P[X=4] + P[X=5] + P[X=6] + P[X=7] +P[X=8] + P[X=9] + P[X=10] +


1 2 3 4 5 6 5 4 3 2 1
P[X=11] +P[X=12] =           1
36 36 36 36 36 36 36 36 36 36 36

Este resultado es para todos los valores que toma una variable aleatoria discreta: “la suma de las
probabilidades de los distintos valores que toma la variable aleatoria discreta es igual a 1”
Podemos además, hacer los siguientes cálculos:
-¿Cuál es la probabilidad de que la suma sea como máximo tres?
1 2 3
P[X < 3] = P[X=2] + P[X=3] = + =
36 36 36

-¿Cuál es la probabilidad de que salgan por lo menos ocho?

5
5 4 3 2 1 15
P[X > 8] = P[X=8] + P[X=9] + P[X=10] + P[X=11] +P[X=12]=     
36 36 36 36 36 36

Gráfico

 Indicadores
-Media o promedio aritmético

Aplicado al ejemplo:
=7

-Varianza

Aplicado al ejemplo:

siendo el desvío σ = 2,415

MODELOS DE ESTUDIO PARA VARIABLE ALEATORIA DISCRETA


Del estudio de los resultados de un experimento y la relación que estos tienen con su
probabilidad de ocurrencia, surgen los modelos probabilísticos que ayudan a obtener una conclusión
estadística.

6
Una distribución de probabilidades para una variable aleatoria discreta, es un listado mutuamente
excluyente de todos los resultados numéricos posibles para esa variable aleatoria, tal que una
probabilidad específica de ocurrencia se asocia con cada resultado.
El valor esperado de una variable aleatoria discreta es un promedio ponderado de todos los
posibles resultados, donde las ponderaciones son las probabilidades asociadas con cada uno de los
resultados.
En el área competente a temas de salud es común que surjan preguntas como las siguientes:
 ¿Se producirán partos múltiples el próximo mes?
 Un laboratorio propone un medicamento con una eficacia del 80%, ¿será correcto?
 ¿Qué cantidad de personal necesito para la guardia pediátrica para los fines de semana?
La bioestadística da respuestas científicas a estas preguntas en términos de probabilidad, luego de
realizar el análisis correspondiente:
 La probabilidad de partos múltiple el próximo mes es de……
 La aseveración del laboratorio es correcta en 95 de cada 100 casos, la probabilidad de que ocurra
ese resultado es de 0,95.
 Los fines de semana la probabilidad de ingreso de pacientes pediátricos al hospital es de 0,4; por
lo que el 40% del personal debe asistir esa área, suponiendo que el personal se distribuya
proporcionalmente a la cantidad de pacientes.

Existen distintos modelos que se aplican a comportamientos específicos de la variable


aleatoria, los que se estudiarán serán el modelo Binomial y el modelo de Poisson. Estas son las
principales distribuciones para las variables aleatorias discretas.
Para aplicar estos modelos las variables estudiadas toman dos únicos valores: “se cumple la
característica de interés o no se cumple”. La distribución de probabilidades, es decir, el
comportamiento de este tipo de variables se puede estudiar mediante una fórmula, que se le denomina
función de probabilidad.

DISTRIBUCIÓN BINOMIAL
Para poder entender el modelo de distribución binomial, se estudiará un experimento llamado
ensayo de Bernouilli (Jacques Bernouilli, 1654-1705)
Propone un experimento aleatorio, la variable toma dos únicos valores, uno llamado éxito y el
otro fracaso. Son mutuamente excluyentes e independientes.
La distribución de probabilidad del experimento está dada por
p para x1 = 1
P[X = xi ] = q para x2 = 0
0 en otro caso
Donde: xi = i-ésimo resultado de la variable X.

7
P[X = xi] = probabilidad de que ocurra el i-ésimo resultado de la variable aleatoria discreta X.
¿Cómo se interpretan los valores de la variable X? x1 = “1” es considerado éxito (la medida que
se realiza tiene la característica de interés) y x2 = “0”, llamada fracaso (la medida que se realiza no tiene
la característica de interés) y a la probabilidad de que la variable tome el valor “1” se le asigna “p”,
como a la probabilidad de que la variable tome el valor “0” se le asigna “q”. Son respectivamente la
probabilidad de éxito y la probabilidad de fracaso. A las variables que se comportan según este modelo
se les dice que tienen distribución de Bernoulli.
Una distribución se caracteriza con sus indicadores
Media o promedio aritmético
La varianza de una variable aleatoria discreta se define como el promedio ponderado de los
cuadrados de las diferencias entre cada resultado posible y su media (al ponderar consideramos a través
de las probabilidades el “peso” o la “importancia” relativa de cada resultado posible).

Reemplazando con los datos del ensayo:

Para “n” experimentos n . p


Ejemplo: El porcentaje de nacimientos de varones es de 0,45%, en 100 nacimientos, ¿cuántos varones
se espera?
n . p = 100 . 0,45 = 45 varones

Varianza

Reemplazando con los datos del ensayo:

Para “n” experimentos n . p . q


Ejemplo: El porcentaje de nacimientos de varones es de 45%, en 100 nacimientos, ¿cuál es el desvío de
la distribución?
n . p . q = 100 . 0,45 . 0,55 = 24,75 y el desvío es s= 4,975

CARACTERÍSTICAS DE LA DISTRIBUCION BINOMIAL


La distribución binomial es una distribución de probabilidades en la que deben cumplirse cinco
condiciones:
1. La población es infinita
2. La variable toma dos únicos valores

8
3. En cada experimento, los dos resultados posibles son mutuamente excluyentes,
4. Los resultados de cada ensayo son independientes entre si
5. La probabilidad de cada resultado en cualquier experimento es constante.

Es evidente que la variable que cumple con estas condiciones se puede estudiar a través de muestras de
tamaño n. Se estudia la distribución de probabilidades de una muestra de tamaño n donde la variable
toma n+1 valores.
Cuando se cumple estas condiciones, la distribución binomial proporciona cada resultado posible de
los n ensayos (o experimentos) y la probabilidad de obtener cada uno de estos resultados.
Para este tipo de distribución de probabilidad, la función matemática es la siguiente

para x= 0,1,2,3………….n
P[X = xi]
0, para cualquier otro valor de x

Donde: P[X = xi] = probabilidad de xi éxitos


n = tamaño de la muestra
p = probabilidad de éxito
1 – p = probabilidad de fracaso
xi = iésimo éxito en la muestra

Aplicando al ejemplo de los nacidos varones, se puede obtener en una serie de 10


ensayos (muestra de tamaño 10) la probabilidad de que:
a) Nazcan 6 varones
Donde x = 6, p = 0,45 y q = 0,55, aplicando la fórmula:

P[X = xi] = = = = 0,1595


Que se puede interpretar como que de cada 10 000 muestras de tamaño 10; 1 595 tienen 6
varones nacidos.
b) Nazcan por lo menos 8 varones
P[X >7] = P[X = 8] + P[X = 9] + P[X = 10]
= = 0,02289 + 0,00416 +
0,00034 = 0,0274
Que se puede interpretar como que de cada 10 000 muestras de tamaño 10; 274 tienen por lo
menos 8 varones nacidos.

c) Nazcan como máximo 2 varones

9
P[X <3] = P[X = 0] + P[X = 1] + P[X = 2]
= = 0,00253 + 0,02072 +
0,0763 = 0,0955
A los casos b) y c) se le llama valores para la distribución acumulada de probabilidades.
Se puede obtener estos resultados utilizando las funciones estadísticas que proporciona el programa
Excel:

Escogemos en Seleccionar una categoría, a las Estadísticas. Y dentro de las estadísticas, escogemos a
la DISTR.BINOM.

Ingresamos la información del problema y listo. P(X=6) = 0,15956

10
Para encontrar la distribución de probabilidades acumulada, se procede de igual manera, cambiando
solamente el falso de la opción “acumulado” por verdadero.
Para P[X <3] = P[X = 0] + P[X = 1] + P[X = 2]
= = 0,00253 + 0,02072 +
0,0763 = 0,09955

11
Tamaño de la muestra:
Cuando el tamaño de la muestra tiende a infinito la distribución binomial tiende a la
distribución Normal.

DISTRIBUCION DE POISSON
Llamada así por el nombre de Simeón Denis Poisson (1782-1840)
Se dice que existe un proceso de Poisson si podemos observar eventos discretos en un intervalo
continuo (de tiempo, longitud, superficie, volumen, etc.).
La ocurrencia de este evento es poco probable, es llamado evento raro. Si n es grande y la
probabilidad p de ocurrencia de un evento se acerca a cero, de tal manera que q = 1 – p, se acerca a 1.
En la práctica consideraremos que un evento es raro si el número de experimentos n > 100 y p<
0,05 ó n . p es menor que 5 y p < 0,1. En tales casos la distribución binomial se aproxima estrechamente
a la distribución de Poisson caracterizada con los parámetros .

12
La distribución de Poisson se puede considerar como el límite de la binomial cuando n es muy
grande y p es muy pequeño. El interés por sustituir la distribución binomial por una distribución de
Poisson se debe a que esta última depende únicamente de un solo parámetro, , y la binomial de dos, n
y p. En la distribución de Poisson se verifica que:

1. La probabilidad de observar exactamente un éxito en el intervalo es constante.


2. La probabilidad de obtener más de un éxito en el intervalo es practicamente 0, esto significa que
la probabilidad después de la primera ocurrencia se vuelve muy pequeña.
3. La probabilidad de observar un éxito en cualquier intervalo es estadísticamente independiente de
la de cualquier otro intervalo.

Una variable con distribución de Poisson debe responder interrogantes mediante el siguiente
planteo:
Sea x el número de veces que ocurre un suceso en la unidad de tiempo, espacio, volumen. Los valores de
la probabilidad de la variable están dados por la siguiente función:

x = 1,2,3………..

P[ X = xi ]
0 en cualquier otro caso

Donde: P[X = xi] = probabilidad de x éxitos dado el valor de λ


λ = esperanza del número de éxitos, E[X]
e = constante matemática, con valor aproximado 2,71828
xi = iésimo éxito por cada unidad

Esta distribución se aplica en situaciones como:


 El número de pacientes que llegan al servicio de emergencia de un hospital en un intervalo de
tiempo dado.
 El número de radiaciones que se recibe en un lapso de tiempo,
 El número de glóbulos blancos que se cuentan en una muestra dada.
 El número de partos triples por año.

Su utilidad en el área de la salud es muy amplia.

Ejemplo: Si en promedio, llegan tres pacientes por minuto al servicio de emergencia del
Hospital Notti, durante la hora del almuerzo. a) ¿Cuál es la probabilidad de que en un minuto dado,
lleguen exactamente dos pacientes? , b) ¿Cuál es la probabilidad de que lleguen más de dos pacientes en
un minuto dado? y c) cuál es la probabilidad de que lleguen como máximo 3 pacientes?
Datos: = 3 pacientes por minuto

13
a)
P[X=2] = ¿?

Aplicando la fórmula

Tenemos

Este resultado se puede interpretar como sigue:


De cada 1 000 minutos en 224 de ellos llegan dos pacientes
b)
P[X>2] = ¿?
P[X>2] = P[X=3] +P[X=4] + P[X=5] + P[X=6] +…………….= 1 – (P[X=2] + P[X=1] +P[X=0])

P[X>2] = 1 – (P[X=2] + P[X=1] +P[X=0]) = 1 – 0,4236 = 0,5764


Este resultado se puede interpretar como sigue:
De cada 10 000 minutos en 5 765 de ellos llegarán más de dos pacientes.
c)
P[X<4] = ¿?

P[X<4] = P[X=0] +P[X=1] + P[X=2] + P[X=3] = 0,6472


Este resultado se puede interpretar como sigue:
De cada 10 minutos en 9 de ellos llegarán como máximo 4 pacientes.

Para resolver esto utilizamos al Excel. De las funciones estadísticas, seleccionamos la función
POISSON.

14
Ingresamos la información que tenemos: y listo, tenemos el resultado:

15
P[X=2] = 0,2240

16
DISTRIBUCIÓN DE PROBABILIDADES ACUMULADA

Para resolver la segunda parte del problema P(X>2) = ¿?


Con el Excel encontraremos P(X ≤ 2) y hacemos el siguiente cálculo:
P(X > 2 ) = 1 - P(X ≤ 2) = 1 – 0,42319

Utilizando nuevamente el Excel:

Entonces:
P(X>2) = 1 – 0,4232 = 0,5768

Otro ejemplo:

17
P[X<4] = ¿?

P[X<4] = P[X=0] +P[X=1] + P[X=2] + P[X=3] = 0,6472

18
EJERCITACIÓN:
1) Supongamos que el 80% de los pacientes responden positivamente mejorando su patología por la
administración de un medicamento. Sea X la variable que toma el valor 1 cuando el paciente
elegido al azar responde positivamente y 0 cuando no. Hallar la media o valor esperado y la
varianza de X.
2) Un promotor de un plan de salud vende diariamente una cantidad de planes que puede describirse
con la siguiente función de probabilidades:
x 0 1 2 3 4 5
p(x) 0,30 0,36 0,19 0,12 0,02 0,01
Calcule el valor esperado y el desvío estándar de la cantidad de planes que vende por día.

3) Se afirma que una vacuna contra el resfriado es 70 por ciento más eficaz; es decir, que de 100
personas que reciben la vacuna, 70 pasarán el invierno sin resfriados. Sea W la variable aleatoria
de Bernoulli en este caso, halle la media y la varianza de W.
4)
5) Calcule la probabilidad de que en cinco lanzamientos de un dado, se obtenga un tres:
a. ninguna vez.
b. - una vez.
c. - dos veces.
d. - tres veces.
e. - cuatro veces.
f. .-cinco veces
6) La probabilidad de que un estudiante que ingresa a la universidad se gradúe es de 0,4. Encuentre
la probabilidad de que en un total de cinco estudiantes:
a. - ninguno se gradúe.
b. - uno se gradúe.
c. - al menos uno se gradúe.
d. - todos se gradúen

7) El promedio de socios de una Clínica que se atienden por hora durante horas hábiles es una.
Halle la probabilidad de que durante una hora dada:
a) - no aparezcan socios.
b) - haya tres ó más socios.
c) - haya tres ó menos socios.

8) En un Hospital, exactamente el 10 por ciento de los trabajadores son técnicos Asistenciales en


Salud. Se toma al azar una muestra de 100 trabajadores. Aplicando. Hallar la probabilidad de
que la muestra contenga:
a) sólo chicos.
b) sólo una chica.
c) menos de tres chicas.
d) más de tres chicas

9) Cinco por ciento de los instrumentos para cirugía convencional, resultan defectuosos. Calcule la
probabilidad de que en una muestra de cincuenta instrumentos elegidos al azar exactamente dos
sean defectuosos.

19

También podría gustarte