Está en la página 1de 23

ESTADÍSTICA

Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

CORPORACIÓN UNIVERSITARIA LASALLISTA


ESTADÍSTICA
RECOPILADO POR: CÉSAR RUIZ JARAMILLO

UNIDAD 4. DISTRIBUCIONES DE PROBABILIDAD

CONCEPTOS INICIALES

Identificación de valores inusuales

Recordemos que una variable discreta o continua es aleatoria si toma


diferentes valores como resultado de un experimento aleatorio. Se pueden
identificar sus valores “inusuales” o atípicos si caen fuera de los límites:

Valor esperado o esperanza matemática o esperanza

La media de una variable aleatoria discreta es el resultado medio teórico de un


número infinito de ensayos. Se puede considerar a esa media como el valor
esperado en el sentido de que constituye el valor promedio que se esperaría
obtener si los ensayos pudieran continuar de manera indefinida. Los usos del
valor esperado son extensos y variados, y desempeñan un papel muy
importante en el área de aplicación denominada teoría de la decisión.

Distribución de frecuencias Vs Distribución de probabilidad

Una distribución de frecuencias es un listado de las frecuencias observadas


de todos los resultados de un experimento que se presentaron realmente
cuando se efectuó el experimento, mientras que una distribución de
probabilidad es un listado de las probabilidades de todos los posibles
resultados que podrían obtenerse si el experimento se llevara a cabo.
Las distribuciones de probabilidad pueden ser:
• Discretas: la variable puede tomar sólo un número limitado de valores. Por
ejemplo, los votantes de la elección para presidencia de Colombia sólo
tenían 2 opciones en la segunda vuelta: candidato A o candidato B.
También, la probabilidad de que usted haya nacido en un mes dado es
discreta, puesto que sólo hay 12 posibles valores (los 12 meses del año).
• Continuas: la variable puede tomar cualquier valor dentro de un intervalo
dado. Por ejemplo, si se quiere medir el contenido de bacterias en un litro
de agua potable, se puede esperar un intervalo continuo de bacterias por
litro.

1
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

DISTRIBUCIÓN BINOMIAL

Definición
Una distribución de probabilidad binomial resulta de un procedimiento que
cumple con todos los siguientes requisitos:
1. El procedimiento tiene un número fijo de ensayos.
2. Los ensayos deben ser independientes. (El resultado de cualquier
ensayo individual no afecta las probabilidades de los demás ensayos).
3. Todos los resultados de cada ensayo deben clasificarse en dos
categorías (generalmente llamadas éxito y fracaso).
4. La probabilidad de un éxito permanece igual en todos los ensayos.

Tratar eventos dependientes como independientes


Si los cálculos son engorrosos y el tamaño de muestra no es mayor que el 5%
del tamaño de la población, trate las selecciones como independientes (incluso
si las selecciones se efectúan sin reemplazo, de modo que sean técnicamente
dependientes).

Notación

Ejemplo:
Se seleccionan 5 hinchas involucrados en incidentes violentos en el estadio
Atanasio Girardot de la ciudad de Medellín. Suponga que la probabilidad de
que entre los hinchas seleccionados haya de Medellín es 3/4 o 0.75. Es decir,
P(hinchas DIM) = 0.75. Suponga que queremos calcular la probabilidad de que
exactamente 3 de los 5 hinchas violentos sean del DIM.
a) ¿Este procedimiento da como resultado una distribución binomial?
b) Si este procedimiento da como resultado una distribución binomial,
identifique los valores de n, x, p y q.

2
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

1. El número de ensayos (5) es fijo.


2. Los 5 ensayos son independientes, ya que la probabilidad de que cualquier
hincha sea del DIM no se ve afectada por el resultado de cualquier otro hincha.
3. Cada uno de los 5 ensayos tiene dos categorías de resultados: el hincha es
del DIM o no.
4. Para cada hincha violento seleccionado, la probabilidad de que sea del rojo
es 3/4 o 0.75, y la probabilidad es la misma para los 5 hinchas.
b)
1. Con 5 experimentos o ensayos, n = 5.
2. Se quiere conocer la probabilidad de exactamente 3 hinchas del DIM dentro
de los 5 hinchas violentos seleccionados, de manera que x = 3.
3. La probabilidad de éxito (obtener un hincha rojo) en una selección es 0.75,
de modo que p = 0.75.
4. La probabilidad de fracaso (no tener un hincha del DIM) es 0.25, de modo
que q = 0.25.

Existen tres métodos diferentes para calcular probabilidades binomiales. En su


orden de simplicidad de uso son:

Calcular la probabilidad de obtener exactamente 3 hinchas rojos cuando se


seleccionan 5 hinchas violentos. Es decir, P(3) dado n=5, x=3, p=0.75, q=0.25.

Método 1: Uso de herramientas tecnológicas Excel

En Excel se utiliza la función:


=DISTR.BINOM.N(x;n;p;acumulado)
Donde

=DISTR.BINOM.N(3;5;0,75,FALSO) = 0.0017

Método 2: Uso de tablas de probabilidades binomiales

Para utilizar la tabla primero localice n y el valor de x deseado correspondiente.


En este paso se debe aislar un renglón de números. Ahora alinee ese renglón
con la probabilidad correspondiente de p, usando la columna que cruza por la
parte superior. El número aislado representa la probabilidad deseada. Una
probabilidad tan pequeña como 0.000064 se indica como 0.
La tabla seleccionada no puede utilizarse con el ejemplo, ya que la probabilidad
de p= 0.75 no viene incluida.

3
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

Método 3: Uso de la fórmula de probabilidad binomial

Ejemplo 3 - Reconocimiento de la marca McDonald’s


La cadena de comida rápida McDonald’s tiene una tasa de reconocimiento de
marca del 95% en todo el mundo (según datos de Retail Marketing Group).
Suponga que se eligen 5 personas al azar. Calcule:
a) La probabilidad de que exactamente 3 de las 5 personas reconozcan la
marca McDonald’s. P(3) = 0.021
b) La probabilidad de que el número de personas que reconozcan la marca
McDonald’s sea 3 o menos. P(3 o menos) = P(3 o 2 o 1 o 0) = 0.022

Ejercicios
1. Determine si el procedimiento indicado produce una distribución binomial. Si
la distribución no es binomial, identifique cuál (es) requisitos no se cumplen.
a. Seleccionar al azar a 20 senadores diferentes del Congreso
colombiano actual, que tiene un total de 102 senadores, y preguntar
a cada uno si está a favor de aumentar su salario.
b. Seleccionar al azar a 20 estudiantes de estadística, y preguntar a
cada uno si tiene una calculadora científica.
2. Suponga que un procedimiento produce una distribución binomial con un
ensayo repetido n veces. Utilice la tabla para calcular la probabilidad de x
éxitos, dada la probabilidad p de éxito en un ensayo dado.
a. n = 2 x = 1 p = 0.30
b. n = 15 x = 11 p = 0.99
c. n= 10 x = 2 p = 0.05
3. Al seleccionar al azar 5 donadores de sangre, el 45% tenía sangre del
grupo O. La tabla muestra las probabilidades para n = 5 y p = 0.45.

4
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

a. Calcule la probabilidad de que al menos 1 de los 5 donadores tenga


sangre del grupo O. Si se necesita al menos un donador del grupo O,
¿sería razonable esperar obtener al menos 1?
b. Calcule la probabilidad de que al menos 3 de los 5 donadores tengan
sangre del grupo O. Si se necesitan al menos 3 donadores del grupo
O, ¿es muy probable que se obtengan al menos 3?
c. Calcule la probabilidad de que los 5 donadores tengan sangre del
grupo O. ¿Es inusual obtener cinco donadores del grupo O de un
total de 5 donadores seleccionados al azar? ¿Por qué?
4. Un laboratorio de pruebas médicas ahorra dinero al combinar muestras de
sangre para efectuar pruebas, de manera que solo se realiza una prueba
para varias personas. La muestra combinada resulta positiva si al menos
una de las personas está infectada. Si la muestra combinada resulta
positiva, se realizan pruebas de sangre individuales. En una prueba para
gonorrea se combinan las muestras de 30 individuos elegidos al azar.
Calcule la probabilidad de que la muestra combinada resulte positiva si al
menos una de las 30 personas está infectada. Con base en datos de los
centros de salud, la probabilidad de seleccionar al azar a una persona con
gonorrea es 0.00114. ¿Es probable que este tipo de muestras combinadas
resulten positivas?
5. Cuando una persona compra un boleto para un vuelo, hay una probabilidad
de 0.0995 de que no se presente en el aeropuerto (según datos de un
documento de investigación de IBM, de Lawrence, Hong y Cherrier). Un
agente de Air America desea registrar a 24 personas en un avión en el que
solo se pueden sentar 22. Si se registran 24 personas, calcule la
probabilidad de que no haya suficientes asientos disponibles. ¿Esta
probabilidad es lo suficientemente baja para que la sobreventa no
constituya una preocupación?
6. La empresa Yoshi Scribo fabrica bolígrafos y ha estado registrando una
tasa del 6% de bolígrafos defectuosos. Se hacen modificaciones al proceso
de manufactura para mejorar la calidad, y el gerente afirma que el
procedimiento modificado es mejor, ya que una prueba de 60 bolígrafos
indica que solo 1 está defectuoso.
a. Suponiendo que la tasa de defectos del 6% no ha cambiado, calcule
la probabilidad de que, en 60 bolígrafos, exactamente 1 esté
defectuoso.
b. Suponiendo que la tasa de defectos del 6% no ha cambiado, calcule
la probabilidad de que, en 60 bolígrafos, ninguno esté defectuoso.
5
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

c. ¿Qué probabilidad se debe usar para determinar si el proceso


modificado produce una tasa de defectos menor al 6%?
d. ¿Qué concluye usted acerca de la eficacia del proceso de producción
modificado?

Parámetros Media, varianza y desviación estándar para la distribución


binomial

En la clase pasada se indicaron las fórmulas para calcular media, varianza y


desviación estándar de una distribución de probabilidad discreta. Puesto que
una distribución binomial es un tipo especial de distribución de probabilidad
discreta, se pueden usar las mismas fórmulas. Sin embargo, es más fácil usar
las fórmulas que se presentan a continuación (Observe que q = 1 – p. Por
ejemplo, si p = 0.75, entonces q = 0.25).

𝜇 = 𝑛𝑝
𝜎 2 = 𝑛𝑝𝑞
𝜎 = √𝑛𝑝𝑞

Ejercicios
7. Una clase de estadística está integrada por 10 mujeres y 30 hombres. Cada
día se eligen al azar 12 estudiantes sin reemplazo, y se cuenta el número
de mujeres. Si utilizamos los métodos de esta sección, obtenemos µ=3.0
mujeres y =1.5 mujeres, pero el valor de la desviación estándar es
incorrecto. ¿Por qué los métodos utilizados en distribuciones binomiales no
dan el resultado correcto en este caso?
8. Excel se utiliza para calcular la media y la desviación estándar de una
distribución de probabilidad discreta, con los siguientes resultados: µ=2.0 y
=3.5. ¿Pueden ser correctos estos resultados? Explique.
9. En un estudio de 420,095 usuarios de teléfono celular en Dinamarca, se
encontró que 135 desarrollaron cáncer cerebral o del sistema nervioso. Si
suponemos que el uso de teléfonos celulares no tiene el efecto de provocar
este tipo de cáncer, la probabilidad de que una persona adquiera esta
enfermedad es de 0.000340.
a. Suponiendo que los teléfonos celulares no están relacionados con el
cáncer, calcule la media y la desviación estándar del número de
personas, en grupos de 420,095, que pueden esperar tener cáncer
cerebral o del sistema nervioso.
b. Con base en los resultados del inciso a, ¿será inusual que, entre
420,095 personas, existan 135 casos de cáncer cerebral o del
sistema nervioso? ¿Por qué?
c. ¿Qué sugieren estos resultados sobre la preocupación pública de
que los teléfonos celulares son dañinos para la salud porque
incrementan el riesgo de cáncer cerebral o del sistema nervioso?

6
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

DISTRIBUCIÓN HIPERGEOMÉTRICA

Si se realiza un muestreo sin reemplazo de una población finita pequeña, no


debería usarse la distribución binomial porque los eventos no son
independientes. Si el muestreo se hace sin reemplazo y los resultados
pertenecen a uno de dos tipos, se puede usar la distribución hipergeométrica.

Este experimento implica que cada vez que se selecciona una persona, el total
de personas que conforman la población se irá reduciendo cada vez en una
unidad, puesto que no hay reemplazo después de cada ensayo, ya que, si lo
hubiera, significaría que una persona tendría la posibilidad de ser seleccionada
varias veces.

Requisitos de la distribución hipergeométrica:


a) Solo se puede presentar un número finito de ensayos n.
b) Existen dos resultados posibles en cada ensayo (éxito y fracaso), opuestos
entre sí.
c) Los ensayos son dependientes entre sí.
d) Las probabilidades de éxito y fracaso cambian de ensayo a ensayo.

Se puede calcular con Excel, tablas o fórmula. En cualquier caso se debe


identificar el tamaño de la población (N), el tamaño de la muestra (n), el número
de éxitos en la población (r) y el número de éxitos en la muestra (x).

Ejemplo. Un almacén de juguetes recibe un embarque de 25 juegos de


modelos de aviones, entre los cuales hay 4 incompletos. Si un comprador
escoge aleatoriamente 3 juegos de estos modelos sin derecho a cambio, ¿cuál
es la probabilidad de que los 3 resulten incompletos? ¿Es una distribución de
probabilidad hipergeométrica?
Solución
a) Solo puede haber un número finito de ensayos, puesto que la selección
implica que cada avión seleccionado no puede ser cambiado, es decir podrían
hacerse máximo 25 selecciones.
b) Existen 2 resultados posibles opuestos entre sí: éxito (avión incompleto) y
fracaso (avión completo).
c) Los ensayos son dependientes, puesto que la probabilidad de éxito en cada
ensayo depende de lo que haya sucedido en los ensayos anteriores. Así pues:
La probabilidad de incompleto en la primera selección es 4/25. La probabilidad
de incompleto en la segunda selección es 3/24, si en la primera selección el
avión fue incompleto, o 4/24 si el primer avión seleccionado fue completo y así
sucesivamente. Como puede verse, la probabilidad de éxito en cada selección
depende de lo que haya sucedido en las anteriores selecciones.
d) Como pudo verse en el literal anterior, la probabilidad de éxito es cambiante
de ensayo a ensayo.
De acuerdo al enunciado:
7
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

x=3 (que los 3 resulten incompletos)


N=25 (embarque de 25 juegos de modelos de aviones)
r=4 (de los 25 hay 4 incompletos)
n=3 (un comprador escoge aleatoriamente 3 juegos)

En Excel se utiliza la función:


=DISTR.HIPERGEOM.N(x;n;r;N)
Donde

=DISTR.HIPERGEOM.N(3,3,4,25) = 0.0017

Ejercicio
En el juego de lotería del estado de Nueva York, un participante selecciona seis
números del 1 al 59 (sin repetición) y después se selecciona al azar una
combinación de seis números ganadores. Calcule la probabilidad de los
siguientes eventos y expréselos en forma decimal:
a) Usted compra un billete con una combinación de 6 números y elige los 6
números ganadores. 2,21939E-08 = 0.0000000222
b) Usted compra un billete con una combinación de 6 números y elige
exactamente 5 de los números ganadores. 7,05765E-06 = 0.00000706
c) Usted compra un billete con una combinación de 6 números y elige
exactamente 3 de los números ganadores. 0,010398275 = 0.0104
d) Usted compra un billete con una combinación de 6 números y no elige
ningún número ganador. 0,509515469 = 0.510

Parámetros Media y varianza para la distribución hipergeométrica

𝜇 = 𝑛𝑝

(𝑁 − 𝑛)
𝜎 2 = 𝑛𝑝𝑞
(𝑁 − 1)

En el ejemplo del almacén de juguetes: p=4/25, q=21/25. Entonces:


4 12
𝜇 = 𝑛𝑝 = 3 ( ) = = 0.48
25 25

(𝑁 − 𝑛) 4 21 (25 − 3)
𝜎 2 = 𝑛𝑝𝑞 = 3( )( ) = 4.4352
(𝑛 − 1) 25 25 (3 − 1)
𝜎 = √𝜎 2 = 2.1060

Ej. Suponga que una clase de estadística está integrada por 10 mujeres y 30
hombres, y que cada día se eligen 12 estudiantes al azar sin reemplazo.
¿Debido a que el muestreo se realiza con una población finita pequeña sin
reemplazo, es posible aplicar la distribución hipergeométrica? Sí es así, calcule
la media y la desviación estándar del número de mujeres que se seleccionan
en diferentes días. µ = 3.0 y  = 1.3.

8
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

DISTRIBUCIÓN DE POISSON

La distribución de Poisson es otra distribución de probabilidad discreta que se


utiliza para describir comportamientos que ocurren en raras ocasiones (con
probabilidades pequeñas). Por ejemplo, la llegada de personas a una fila, la
reproducción de águilas en una región, los pacientes que llegan a la sala de
emergencias, los choques que ocurren en las carreteras de Antioquia, los
usuarios de Internet que visitan un sitio Web, etc. Por ejemplo, suponga que en
el hospital local, la media de los pacientes que ingresan a la sala de
emergencias los viernes entre las 10:00 P.M. y las 11:00 P.M. es de 2.3. Se
puede calcular la probabilidad de que un viernes elegido al azar, entre las
10:00 P.M. y las 11:00 P.M. lleguen exactamente 4 pacientes.

La distribución de Poisson es una distribución de probabilidad discreta que se


aplica a las ocurrencias de algún evento durante un intervalo específico. La
variable aleatoria x es el número de veces que ocurre un evento en un
intervalo. El intervalo puede ser tiempo, distancia, área, volumen o alguna
unidad similar. La probabilidad de que el evento ocurra x veces durante un
intervalo está dada por la fórmula:

𝜇 𝑥 𝑒 −𝜇
𝑃(𝑥, 𝜇) = 𝑑𝑜𝑛𝑑𝑒 𝑒 = 2.71828
𝑥!

Solo existen tablas hasta µ = 10, puesto que cuando µ ≥ 10, la distribución
normal se considera una aproximación adecuada para resolver un problema de
distribución de Poisson.

En Excel la función es:


= POISSON.DIST(x,media,acumulado)
Devuelve la distribución de Poisson. La sintaxis de la función POISSON tiene
los siguientes argumentos:
• x: Obligatorio. Es el número de eventos.
• Media: Obligatorio. Es el valor numérico esperado.
• Acumulado: Obligatorio. Es un valor lógico que determina la forma de la
distribución de probabilidad devuelta. Si el argumento acumulado es
VERDADERO, POISSON devuelve la probabilidad de Poisson de que
un evento aleatorio ocurra un número de veces comprendido entre 0 y x,
ambos incluidos; si el argumento acumulado es FALSO, la función
devuelve la probabilidad de Poisson de que un evento ocurra
exactamente x veces.

9
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

Requisitos de la distribución de Poisson P(x,µ)


1. La variable aleatoria x es el número de veces que ocurre un evento durante
un intervalo.
2. Las ocurrencias deben ser aleatorias.
3. Las ocurrencias deben ser independientes entre sí.
4. Las ocurrencias deben estar uniformemente distribuidas dentro del intervalo
considerado.

Parámetros media y desviación estándar de la distribución de Poisson


• La media es µ.
• La desviación estándar es 𝜎 = √𝜇

Diferencias entre la distribución de Poisson y la distribución binomial


La distribución binomial está orientada a resolver problemas relacionados con
los éxitos esperados en “n” ensayos, mientras que la distribución de Poisson
busca dar respuesta a problemas relacionados con los éxitos esperados en un
intervalo de tiempo o de espacio. Esto se resume en 2 diferencias:
1. La distribución binomial se ve afectada por el tamaño de la muestra n y la
probabilidad de éxito p, mientras que la distribución de Poisson solo se ve
afectada por la media µ.
2. En una distribución binomial, los valores posibles de la variable aleatoria x
son 0, 1,…, n, pero los valores posibles x de una distribución de Poisson son 0,
1, 2,…, sin límite superior.

Ejemplo: Terremotos
En un periodo reciente de 100 años, hubo 93 grandes terremotos (con una
magnitud de al menos 6.0 en la escala de Richter) en el mundo. Suponga que
la distribución de Poisson es un modelo adecuado.
a) Calcule la media del número de grandes terremotos que ocurren cada año.
b) Si P(x) es la probabilidad de x terremotos en un año elegido al azar, calcule
P(0), P(1), P(2), P(3), P(4), P(5), P(6) y P(7).
c) Los resultados reales son los siguientes: 47 años (0 grandes terremotos); 31
años (un gran terremoto); 13 años (2 grandes terremotos); 5 años (3 grandes
terremotos); 2 años (4 grandes terremotos); 0 años (5 grandes terremotos); un
año (6 grandes terremotos); 1 año (7 grandes terremotos). ¿Qué diferencia hay
entre los resultados reales y las probabilidades obtenidas en el inciso b)? Al
parecer, ¿la distribución de Poisson es un buen modelo en este caso?

Solución
a) Se aplica la distribución de Poisson, ya que son ocurrencias de un evento
(terremotos) dentro de un intervalo (un año). El número medio de terremotos
por año es
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑡𝑒𝑟𝑟𝑒𝑚𝑜𝑡𝑜𝑠 93
𝜇= = = 0.93
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎ñ𝑜𝑠 100
𝜇 𝑥 𝑒 −𝜇 0.932 2.71828−0.93 0.8649×0.394554
b) 𝑃(2,0.93) = 𝑥!
= 2!
= 2
= 0.171

10
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

Las demás son:

x P(x,µ)
0 0,394553957
1 0,36693518
2 0,170624859
3 0,052893706
4 0,012297787
5 0,002287388
6 0,000354545
7 4,71039E-05

c) La probabilidad de P(0,0.93) = 0.395 del inciso b) corresponde a la


probabilidad de obtener 0 terremotos en un año. De esta manera, en 100 años,
el número esperado de años con 0 terremotos es 100 * 0.395 = 39.5 años.
Utilizando las probabilidades del inciso b), todas las frecuencias esperadas son:
39.5, 36.7, 17.1, 5.29, 1.23, 0.229, 0.0355 y 0.00471. Estas frecuencias
esperadas coinciden razonablemente bien con las frecuencias reales de 47, 31,
13, 5, 2, 0, 1 y 1, por lo cual, la distribución de Poisson es un buen modelo para
este caso.

Ejercicio.
Al inspeccionar la aplicación de estaño por un proceso electrolítico continuo se
descubren en promedio 0.8 imperfecciones por minuto. Calcular la probabilidad
de descubrir: a) Una imperfección en un minuto. P(1, 0.8) = 0.3595 b) 4
imperfecciones en 5 minutos. P(4,4) = 0.1954 c) Calcular la media o valor
esperado y la desviación estándar correspondiente. µ=0.8 y =0.89

Distribución de Poisson como aproximación de la distribución binomial


Cuando el número de ensayos u observaciones “n”, en una distribución
binomial es grande (n ≥ 100) y por otra parte µ=np ≤ 10, entonces, se considera
que la distribución de Poisson es una aproximación adecuada para la
distribución binomial.
NOTA: algunos textos consideran como regla n≥30 y µ≤5 para aproximar.

Ejemplo. En un laboratorio radiológico, 650 de cada 10.000 radiografías


resultan defectuosas. Calcular la probabilidad de que se encuentren 4
defectuosas de las 40 radiografías que se han programado para el día de hoy.
n= 40 por lo cual se cumple la primera condición.
µ=40x650/10000 = 2.6. También se cumple la segunda.

𝜇 𝑥 𝑒 −𝜇 2.64 × 2.71828−2.6 45.6976 × 0,074273708


𝑃(4,2.6) = = = = 0,141422
𝑥! 4! 24

11
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

Ejercicio. En el juego Pick 3, usted paga $500 para seleccionar una secuencia
de tres dígitos, como 729. Si participa en este juego una vez al día, calcule la
probabilidad de ganar exactamente una vez en 365 días. P(1,0.365) = 0.253

Ejercicios.
1. Se considera que un bebé recién nacido tiene bajo peso si pesa menos de
2500 g. Estos bebés a menudo requieren ayuda adicional. El Hospital
General ha registrado una media de 210.0 casos de bajo peso al nacer
cada año.
a. Calcule la media del número de bebés que nacen con bajo peso
cada día.
b. Calcule la probabilidad de que en un día determinado nazca más de
un bebé con bajo peso.
c. ¿Es inusual que nazca más de 1 bebé con bajo peso en un día?
¿Por qué?
2. En cierta parte del País se ha registrado una media de 35.4 muertes por
vehículos automotores cada año.
a. Calcule la media del número de muertes por día. 0.0970
b. Calcule la probabilidad de que en un día determinado haya más de 2
muertes por vehículos automotores. 0.000141
c. ¿Es inusual que haya más de 2 muertes por vehículos automotores
el mismo día? ¿Por qué?
3. La compañía de seguros de vida Fidelity
cobra 226 mil pesos por una póliza de seguro de vida de 50 millones de
pesos a una mujer de 50 años de edad. La probabilidad de que una mujer
como esta sobreviva durante un año es 0.9968. Suponga que la compañía
vende 700 de estas pólizas a mujeres de 50 años de edad, de manera que
recauda $158,200 millones en pagos por pólizas. La compañía obtendrá
una utilidad si menos de 4 de las 700 mujeres mueren durante el año.
a. ¿Cuál es la media del número de muertes en grupos de este tipo de
700 mujeres? 2.24
b. Calcule la probabilidad de que la compañía obtenga una utilidad de
las 700 pólizas. ¿La probabilidad es lo suficientemente alta para que
la compañía esté casi segura de obtener una utilidad? 0.811
c. Utilice la distribución binomial para calcular la probabilidad de que la
compañía obtenga una utilidad de las 700 pólizas, y luego compare
el resultado con el dato obtenido en el inciso b).

12
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

DISTRIBUCIONES DE PROBABILIDAD NORMAL

Esta es una distribución de probabilidad continua y simétrica, por lo cual, el


punto medio bajo la curva es justamente la media aritmética de la distribución
(μ). La forma de la curva normal, indica que las frecuencias están concentradas
en la porción central de la curva y los valores hacia abajo y hacia arriba de la
media están igualmente distribuidos.

La distribución normal es muy importante en estadística por, entre otras, las


siguientes razones:
1. Muchos procesos aleatorios se comportan de acuerdo a esta distribución.
2. Sirve para aproximar otros tipos de distribuciones de probabilidad, como la
Binomial y la de Poisson.
3. Algunas distribuciones como la distribución en el muestreo de la media y la
distribución en el muestreo de la proporción tienen un comportamiento normal.

Como se observa en la ecuación que define cualquier distribución normal, ésta


depende de dos parámetros: la media y la desviación estándar.

1 𝑥−𝜇 2
𝑒 −2 ( )
𝜎
𝑦=
𝜎√2𝜋

La curva normal estándar no utiliza la variable aleatoria x, sino que la


transforma en una nueva variable z. Al expresar la variable x en términos de
unidades estándar [z = (x − μ)/σ], en lugar de la ecuación anterior se tiene la
llamada forma estándar:
1 2
𝑒 −2 𝑧
𝑦=
𝜎√2𝜋

En estos casos se dice que z está distribuida normalmente y que tiene media 0
y varianza 1. En la siguiente figura se presenta la gráfica de esta curva normal
estándar; también se muestra que las áreas comprendidas entre z= −1 y z= +1,
13
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

z= −2 y z= +2, y z= −3 y z= +3 son iguales, respectivamente, a 68.27%, 95.45%


y 99.73% del área total, que es 1.

Al igual que las otras distribuciones vistas, la normal puede calcularse con
ayuda de software (en este caso Excel), con ayuda de tablas o con la fórmula
planteada. Los valores de Z deben buscarse en las tablas teniendo en cuenta
que “Z” debe aproximarse hasta dos decimales. Si el dígito que corresponde a
la segunda cifra decimal de Z es “0”, el valor de probabilidad se debe buscar en
la columna “0”. Si el dígito de la segunda cifra decimal de Z es “1”, el valor de
probabilidad debe buscarse en la columna “1” y así sucesivamente.
También es importante aclarar que el área de toda la curva equivale al espacio
muestral cuya probabilidad es 1(uno). El área bajo la curva comprendida entre
dos valores “X1” y “X2”, equivale a la probabilidad de que un valor
aleatoriamente seleccionado de la población, fluctúe entre dichos valores.

En Excel pueden emplearse las siguientes funciones:


=DISTR.NORM.N(x,media,desv_estándar,acum)
Devuelve la distribución normal para la media y desviación estándar
especificadas. La sintaxis de la función DISTR.NORM tiene los siguientes
argumentos:
• x: Obligatorio. Es el valor cuya distribución desea obtener.
• Media: Obligatorio. Es la media aritmética de la distribución.
• Desv_estándar: Obligatorio. Es la desviación estándar de la
distribución.
• Acum: Obligatorio. Es un valor lógico que determina la forma de la
función. Si el argumento acum es VERDADERO, la función
DISTR.NORM devuelve la función de distribución acumulativa; si es
FALSO, devuelve la función de masa de probabilidad

14
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

=DISTR.NORM.ESTAND.N(z,acumulado) o = DISTR.NORM.ESTAND(z)
Devuelve la función de distribución normal estándar (que tiene una media de 0
y una desviación estándar de uno). Use esta función en lugar de una tabla
estándar de áreas de curvas normales. La sintaxis de la función
DISTR.NORM.ESTAND.N tiene los siguientes argumentos:
• z: Obligatorio. Es el valor cuya distribución desea obtener.
• Acumulado: Obligatorio. Acumulado es un valor lógico que determina la
forma de la función. Si el argumento acumulado es VERDADERO, la
función DISTR.NORM.ESTAND.N devuelve la función de distribución
acumulativa; si es FALSO, devuelve la función de masa de probabilidad.

=INV.NORM.ESTAND(probabilidad) o DISTR.NORM.ESTAND.INV(probabilidad)
Devuelve el inverso de la distribución normal estándar acumulativa. La sintaxis
de la función INV.NORM.ESTAND tiene los siguientes argumentos:
Probabilidad: Obligatorio. Es una probabilidad correspondiente a la
distribución normal.

=INV.NORM(probabilidad,media,desv_estándar) o
DISTR.NORM.INV(probabilidad,media,desv_estándar)
Devuelve el inverso de la distribución normal acumulativa para la media y
desviación estándar especificadas. La sintaxis de la función INV.NORM tiene
los siguientes argumentos:
• Probabilidad: Obligatorio. Es una probabilidad correspondiente a la
distribución normal.
• Media: Obligatorio. Es la media aritmética de la distribución.
• Desv_estándar: Obligatorio. Es la desviación estándar de la
distribución.

Ejemplo. Hallar valores de Z. En un examen final de matemáticas la media de


la muestra fue 72 y la desviación estándar fue 15. Determinar las puntuaciones
estándar (es decir, las calificaciones en unidades de desviaciones estándar) de
los estudiantes que obtuvieron: a) 60, b) 93 y c) 72 puntos.

¿Cuál es la probabilidad de sacar a alguien al azar que haya obtenido estas


puntuaciones? Se debe buscar en la tabla los valores -0.80, 0.00 y 1.40

Ejemplo. Supóngase que la cantidad de juegos en que participan los


beisbolistas de la liga mayor durante su carrera se distribuye normalmente con
media 1500 juegos y desviación estándar 350 juegos. a) ¿Qué porcentaje
15
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

participa en menos de 750 juegos? b) Qué porcentaje participa en más de 2000


juegos? y c) Encontrar el percentil 90 de la cantidad de juegos en los que
participan durante su carrera.

a) La expresión de Excel =DISTR.NORM(750,1500, 350, 1) busca el área a la


izquierda de 750 en una curva normal con media igual a 1 500 y desviación
estándar igual a 350. La respuesta es Pr{X < 750} = 0.0161 o bien 1.61%
participa en menos de 750 juegos.
b) La expresión de Excel =1- DISTR.NORM(2 000,1500, 350, 1) busca el área
a la derecha de 2000 en una curva normal con media igual a 1500 y desviación
estándar igual a 350. La respuesta es Pr{X > 2000} = 0.0766 o bien 7.66%
participa en más de 2 000 juegos.
c) La expresión de Excel = DISTR.NORM.INV(0.9,1500, 350) busca en el eje
horizontal el valor tal que a su izquierda se encuentra 90% del área bajo la
curva normal con media 1500 y desviación estándar 350. P90 = 1948.5.

Ejemplo Termómetros. La Precision Scientific Instrument Company fabrica


termómetros que, se supone, deben dar lecturas de 0°C en el punto de
congelación del agua. Las pruebas de una muestra grande de estos
instrumentos revelaron que en el punto de congelación del agua, algunos
termómetros daban lecturas por debajo de 0° (denotadas con números
negativos), y otros daban lecturas por encima de 0° (denotadas con números
positivos). Suponga que la lectura media es 0°C y que la desviación estándar
de las lecturas es 1.00°C. También suponga que las lecturas se distribuyen de
manera normal. Si se elige al azar un termómetro, calcule la probabilidad de
que, en el punto de congelación del agua,
a) La lectura sea menor que 1.27°
b) La lectura esté por arriba de -1.23°
c) Las lecturas estén entre -2.00° y 1.50°
d) Calcule la temperatura correspondiente a P95, el percentil 95. Es decir,
calcule la temperatura que separa el 95% inferior del 5% superior.
e) Calcule las temperaturas que separan el 2.5% inferior y el 2.5% superior.

Solución a). La distribución de probabilidad de las lecturas es una distribución


normal estándar, porque la media es cero y la desviación estándar 1. Dado
esto, se debe encontrar la puntuación z de 1.27, primero localizando 1.2 en la
columna izquierda y luego encuentrando el valor en el renglón adjunto de
probabilidad que está directamente debajo de 0.07 (ver el siguiente extracto de
la tabla).

16
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

La probabilidad de seleccionar al azar un termómetro con una lectura menor


que 1.27° (en el punto de congelación del agua) es igual al área de 0.8980, que
aparece como la región sombreada en la figura. Otra forma de interpretar este
resultado es concluir que el 89.80% de los termómetros tendrán lecturas por
debajo de 1.27°.

Solución b). En la tabla, el área acumulada de la izquierda hasta z = -1.23 es


0.1093, tal como se observa en la figura.

Sabiendo que el área total bajo la curva es 1, se puede calcular el área


sombreada restando 0.1093 de 1. El resultado es 0.8907. Se puede concluir
que la probabilidad de seleccionar aleatoriamente un termómetro con una
lectura por arriba de -1.23°, en el punto de congelación del agua, es de 0.8907
(que corresponde al área a la derecha de z = -1.23). En otras palabras, el
89.07% de los termómetros tienen lecturas por encima de -1.23°.

17
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

Solución c). La probabilidad de seleccionar un termómetro con una lectura


comprendida entre -2.00° y 1.50° no puede encontrarse directamente en la
tabla, pero si se puede encontrar que z = -2.00 corresponde al área de 0.0228,
y que z = 1.50 corresponde al área de 0.9332. Note que el área sombreada en
la figura corresponde a la diferencia entre 0.9332 y 0.0228. El área sombreada
es, por lo tanto, 0.9332 - 0.0228 = 0.9104.

Se concluye que existe una probabilidad de 0.9104 de seleccionar al azar uno


de los termómetros con una lectura entre -2.00° y 1.50°, en el punto de
congelación del agua. Otra forma de interpretar este resultado es afirmar que si
se seleccionan muchos termómetros para probarlos en el punto de congelación
del agua, entonces 0.9104 (o el 91.04%) de ellos tendrán lecturas entre -2.00°
y 1.50°.

Solución d) La figura incluye la puntuación z que corresponde al percentil 95,


con el 95% del área (o 0.95) por debajo de ella. En la tabla se busca el área de
0.95 en el cuerpo de la tabla y después la puntuación z correspondiente. En la
tabla las áreas son 0.9495 y 0.9505, pero hay un asterisco con una nota
especial que indica que 0.9500 corresponde a una puntuación z de 1.645.
Ahora podemos concluir que la puntuación z en la figura es 1.645, por lo que el
percentil 95 es la lectura de temperatura correspondiente a 1.645°C.

18
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

Al probar los termómetros a la temperatura de congelación, el 95% de las


lecturas serán menores que o iguales a 1.645°C, y el 5% de ellas serán
mayores que o iguales a 1.645°C.

Solución e) La figura presenta las puntuaciones z requeridas. Para encontrar la


puntuación z localizada a la izquierda, se debe buscar el área de 0.025 en el
cuerpo de la tabla. El resultado es z = -1.96. Para encontrar la puntuación z
localizada a la derecha, se busca en el cuerpo de la tabla el área de 0.975. El
resultado es z = 1.96. Los valores de z = -1.96 y z = 1.96 separan el 2.5%
inferior y el 2.5% superior, como se observa en la figura.

Al probar los termómetros a la temperatura de congelación, el 2.5% de las


lecturas serán iguales o menores que -1.96°, y el 2.5% de las lecturas serán
iguales o mayores que 1.96°. Otra interpretación es que, en el punto de
congelación del agua, el 95% de todas las lecturas de los termómetros se
ubicarán entre -1.96° y 1.96°.

Ejercicios.
En los ejercicios 9 a 12, calcule el área de la región sombreada. La gráfica
describe la distribución normal estándar con media igual a 0 y desviación
estándar igual a 1.

19
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

En los ejercicios 13 a 16, calcule la puntuación z indicada. La gráfica describe


la distribución normal estándar con media igual a 0 y desviación estándar igual
a 1.

En los ejercicios 17 a 21, suponga que las lecturas de termómetros se


distribuyen normalmente, con una media de 0°C y una desviación estándar de
1.00°C. Se selecciona al azar un termómetro y se prueba. En cada caso,
elabore un bosquejo y calcule la probabilidad de cada lectura. (Los valores
están en grados Celsius). Si utiliza la tecnología en lugar de las tablas,
redondee las respuestas a cuatro posiciones decimales.
17. Menor que -1.50
18. Mayor que -1.75
19. Entre 0.50 y 1.00
20. Entre -2.50 y 5.00
20
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

21. Mayor que 0

22. Los pesos al nacer en Estados Unidos se distribuyen de manera normal


con una media de 3420 g y una desviación estándar de 495 g. El hospital
Newport General requiere de un tratamiento especial para los bebés que pesan
menos de 2450 g (inusualmente ligeros) o más de 4390 g (inusualmente
pesados). ¿Cuál es el porcentaje de bebés que no requieren de un tratamiento
especial porque tienen pesos al nacer comprendidos entre 2450 g y 4390 g?
En tales condiciones, ¿muchos bebés requieren de un tratamiento especial?

23. Un taxi acuático se hundió en el Inner Harbor de Baltimore. De las 25


personas a bordo, 5 murieron y 16 resultaron lesionadas. Una investigación
reveló que la carga segura de pasajeros del taxi acuático era de 3500 libras.
Suponiendo un peso medio de 140 libras por pasajero, el taxi acuático tenía
permitido transportar a 25 pasajeros, pero la media de 140 libras fue
determinada hace 44 años, cuando la gente no pesaba tanto como ahora. (Se
descubrió que el peso medio de los 25 pasajeros que viajaban en el barco que
se hundió era de 168 libras). El National Transportation and Safety Board
sugirió que la antigua media estimada de 140 libras se actualizara a 174 libras,
de manera que la carga segura de 3500 libras ahora solo admitía 20 pasajeros
en vez de 25.
De acuerdo a esto, suponga el “peor de los casos”, en el que todos los
pasajeros son hombres adultos. Con base en datos de la encuesta National
Health and Nutrition Examination, suponga que los pesos de los hombres se
distribuyen normalmente con una media de 172 libras y una desviación
estándar de 29 libras.
a) Si se selecciona a un hombre al azar, calcule la probabilidad de que pese
menos de 174 libras.
b) Con un límite de carga de 3500 libras, ¿cuántos hombres podrían viajar, si
suponemos un peso medio de 140 libras?
c) Con un límite de carga de 3500 libras, ¿cuántos hombres podrían viajar, si
utilizamos el peso medio de 174 libras?
d) ¿Por qué es necesario que se revise periódicamente el número permitido de
pasajeros a bordo?

24. Un equipo de ingenieros desea diseñar asientos para aviones comerciales,


de tal manera que sean lo suficientemente amplios para que quepa el 99% de
los hombres. (Para abarcar al 100% de los hombres se requerirían asientos
muy amplios que, por lo mismo, serían demasiado costosos). Las anchuras de
cadera de los hombres se distribuyen normalmente, con una media de 14.4
pulgadas y una desviación estándar de 1.0 pulgadas (según datos de una
encuesta antropométrica de Gordon, Clauser, et al.). Calcule P99, es decir,
calcule la anchura de cadera de los hombres que separa al 99% de los
individuos con caderas más angostas del 1% de individuos con caderas más
anchas.

21
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

25. La duración de los embarazos se distribuye normalmente, con una media


de 268 días y una desviación estándar de 15 días.
a) Un uso clásico de la distribución normal está inspirado por una carta dirigida
a “Dear Abby”, en la que una mujer afirmaba haber dado a luz 308 días (44
semanas) después de una breve visita de su esposo, quien trabajaba en la
marina. A partir de esta información, calcule la probabilidad de que un
embarazo dure 308 días o más. ¿Qué sugiere el resultado? 0,00383 b) Si
estipulamos que un bebé es prematuro cuando la duración del embarazo se
encuentra en el 4% inferior, calcule la duración en días y en semanas que
separa a los bebés prematuros de aquellos que no lo son. Los bebés
prematuros suelen requerir cuidados especiales, de manera que este resultado
será muy útil para que los gerentes de hospitales planeen esos cuidados.

Distribución normal como aproximación de la distribución binomial


Si n es grande y si ni p ni q tienen valores muy cercanos a cero, la distribución
binomial puede ser aproximada por una distribución normal con la variable
estandarizada dada por:
𝑥 − 𝑛𝑝
𝑧=
√𝑛𝑝𝑞

A medida que crece n, la aproximación mejora y en el caso límite es exacta. En


la práctica, la aproximación es buena si tanto np como nq son mayores a 5.

Ejemplo. En la siguiente figura se muestra la distribución binomial


correspondiente a n = 16 y p = 0.5, ilustrando las probabilidades de obtener X
caras en 16 lanzamientos de una moneda, así como la distribución normal con
media 8 y desviación estándar 2. Obsérvese lo semejante que son ambas
distribuciones. X es binomial, con media = np = 16(0.5) = 8 y desviación
estándar √𝑛𝑝𝑞 = √16(0.5)(0.5) = 2. Y es una curva normal con media = 8 y
desviación estándar 2.

22
ESTADÍSTICA
Recopilado por:
César Ruiz Jaramillo
UNIDAD 1. Distribuciones de Probabilidad Versión: 2020

Ejercicio. Se lanza una moneda 500 veces. Hallar la probabilidad de que el


número de caras no sea diferente de 250: a) en más de 10 y b) en más de 30.

Ejercicio. Supóngase que en el grupo de edad de 1 a 4 años, el 75% usa el


cinturón de seguridad de manera habitual. Hallar la probabilidad de que si se
detienen, al azar, algunos automóviles que transporten pasajeros de 1 a 4
años, 70 o menos estén usando el cinturón de seguridad. Dar la solución
empleando la distribución binomial así como la aproximación normal a la
distribución binomial.

FUENTES:

TRIOLA, Mario F. Estadística. 11ª edición. PEARSON EDUCACIÓN, México,


2013. 888 páginas. Capítulo 5 Distribuciones de probabilidad discreta y
Capítulo 6 Distribuciones de probabilidad normal

SPIEGEL, Murray R. y STEPHENS, Larry J. Estadística. Schaum 4a edición.


MCGRAW HILL, México, 2009. 601 páginas. Capítulo 7 Las distribuciones
binomial, normal y Poisson.

GÓMEZ, Hugo. Estadística. Editorial de la Universidad Nacional, Medellín,


2009. 273 páginas. Capítulo 5 Distribuciones de Probabilidad.

23

También podría gustarte