Está en la página 1de 11

65

UNIDAD IV

Qué es una distribución de probabilidad. Variables aleatorias. Distribuciones


de probabilidad discretas. Media, Varianza y Desvío Estándar de una distri-
bución de probabilidad. Distribución binomial. Distribución binomial negati-
va. Tablas de probabilidad binomial. Distribución de probabilidad hipergeo-
métrica. Distribución de probabilidad de Poisson. Distribuciones de probabi-
lidad continuas. Distribución acumulativa. Distribución uniforme. Familia de
distribuciones de probabilidad normal. Distribución de probabilidad normal
estándar: usos, área bajo la curva, ejercicios. Desigualdad de Chebyshev.
Aproximación normal de la distribución binomial.

QUÉ ES UNA DISTRIBUCIÓN DE PROBABILIDAD

En las dos primeras unidades anteriores nos dedicamos a la estadística descriptiva,


describimos datos originales (o datos sin agrupar) organizándolos en una distribución
de frecuencia y representando gráficamente la distribución. También calculamos me-
didas de tendencia central, como la media, la mediana o la moda a fin de encontrar un
valor representativo cerca del centro de la distribución. Se emplearon la amplitud de
variación y la desviación estándar para describir la dispersión de los datos. Por tanto,
en las primeras unidades hemos centrado nuestra atención en la descripción de algo
que ya había sucedido.

En la unidad anterior el punto de interés cambio, empezamos a examinar algo que


probablemente sucedería y como lo indicamos en su momento, a esta faceta de la
estadística la denominamos inferencia estadística. El objetivo era hacer inferencias
(enunciados) respecto a una población basándonos en una muestra. Establecimos que
una probabilidad es un valor que va de 0 a 1 inclusive y examinamos cómo se podían
combinar las probabilidades utilizando las reglas de adición y de multiplicación.

En esta unidad iniciaremos el estudio de las distribuciones de probabilidad. Una


distribución de probabilidad indica toda la gama de valores que pueden presentarse
como resultado de un experimento; resulta similar a una distribución de frecuencias
relativas pero que describe no el pasado sino qué tan probable es un evento futuro.
También vamos a estudiar la media, la varianza y la desviación estándar de una distri-
bución de probabilidad así como tres familias de distribuciones probabilísticas que
normalmente se presentan (binomial, hipergeométrica y de Poisson) como distribucio-
nes de probabilidad discreta. Continuando con el estudio de las distribuciones de pro-
babilidad examinaremos una distribución de probabilidad continua muy importante: la
distribución de probabilidad normal. Luego presentaremos la distribución normal es-
tándar y sus aplicaciones para por último, considerar cómo se emplea la distribución
normal para estimar probabilidades binomiales.

Empezaremos entonces mencionando que una distribución de probabilidad muestra


todos los resultados posibles de un experimento y la probabilidad de cada resultado.

Distribución de probabilidad: Indica en una lista todos los resultados posibles de


un experimento junto con la probabilidad correspondiente a cada uno de ellos.

VARIABLES ALEATORIAS

En cualquier experimento aleatorio, los resultados se presentan al azar y en conse-


cuencia, se habla de una variable aleatoria. Por ejemplo, si un experimento es “tirar un
66

dado” se puede presentar cualquiera de los seis resultados posibles. Algunos experi-
mentos dan resultados que son cuantitativos y otros dan resultados que son cualitati-
vos. A continuación algunos ejemplos para ilustrar mejor el significado de variable
aleatoria.

• Si se cuenta el número de empleados ausentes de su turno de trabajo del lunes, el


número puede ser 0, 1, 2, 3, … el número de inasistencias es una variable aleatoria.
• Si se tiran al aire dos monedas y se cuenta el número de caras, el mismo puede ser
cero, uno o dos. Como el número de caras se debe al azar, dicho número de caras
es la variable aleatoria.

Variable aleatoria: cantidad que es el resultado de un experimento, y debido al


azar, puede tomar valores diferentes.

Variable aleatoria discreta: variable que sólo puede tomar ciertos valores clara-
mente separados. En general, una variable aleatoria discreta es el resultado de
contar algo.

Variable aleatoria continua: variable que puede tomar un valor de una cantidad
infinitamente grande de valores, dentro de ciertas limitaciones. Surge del efecto de
medir.

MEDIA, VARIANZA Y DESVÍO ESTÁNDAR


DE UNA DISTRIBUCIÓN DE PROBABILIDAD

En la unidad dos analizamos medidas de posición y de variación para una distribución


de frecuencias. La media indica la ubicación central de los datos y la varianza describe
su dispersión. De manera semejante, una distribución de probabilidad se resume indi-
cando su media y su varianza.

Media

La media es un valor típico que sirve para representar una distribución de probabilidad.
También es el valor promedio, a largo plazo, de la variable aleatoria. A la media de
una distribución de probabilidad se la conoce también como su “valor esperado”. Esta
media es un promedio ponderado en el que los valores posibles se ponderan mediante
sus probabilidades correspondientes de ocurrencia.

𝜇𝜇 = �[𝑥𝑥 𝑃𝑃(𝑥𝑥)]

Donde
P(x) es la probabilidad de cada valor que puede tomar la variable aleatoria x

Varianza y desviación estándar

Como observamos, la media es un valor característico que se utiliza para representar


una distribución de probabilidad discreta; sin embargo, no describe el grado de disper-
sión (o variación) en una distribución. La varianza si lo hace. A continuación la fórmula
matemática:

𝜎𝜎 2 = �[(𝑥𝑥 − 𝜇𝜇)2 𝑃𝑃(𝑥𝑥)]

La desviación típica o estándar, σ, se determina tomando la raíz cuadrada de σ2.


67

DISTRIBUCIÓN BINOMIAL

La distribución de probabilidad binomial es un ejemplo de una distribución de probabi-


lidad discreta.

Una característica de la mencionada distribución es que sólo hay dos resultados (mu-
tuamente excluyentes) posibles en cada ensayo de un experimento. Otra característica
es que la variable aleatoria es el resultado de conteos; esto es, se cuenta el número
de éxitos en la totalidad de ensayos. Una tercer característica de esta distribución es
que la probabilidad de un éxito sigue siendo la misma de un ensayo a otro. La última
característica es que cada ensayo es independiente de cualquier otro, esto significa
que los resultados no siguen ningún patrón.

Resumiendo, una distribución binomial tiene las siguientes características:

1. El resultado de cada ensayo de un experimento se clasifica en una de dos catego-


rías mutuamente excluyentes a saber: éxito o fracaso.
2. La variable aleatoria cuenta el número de éxitos en una cantidad fija de ensayos.
3. La probabilidad de un éxito permanece igual en todos los ensayos. Lo mismo suce-
de con la probabilidad de un fracaso.
4. Los ensayos son independientes, lo cual significa que el resultado de un ensayo no
afecta al resultado de algún otro.

Para elaborar una distribución de probabilidad binomial se necesita el número de en-


sayos y la probabilidad de éxito de cada ensayo. Por ejemplo si el examen del curso
contiene 20 preguntas con opción múltiple, el número de ensayos es 20; suponiendo
que cada pregunta tiene 5 opciones y sólo una es correcta, la probabilidad de éxito en
cada ensayo que tiene una persona que desconoce la materia es 0,20. De este modo,
la probabilidad de que una persona son conocimiento del tema adivine la respuesta
correcta a una pregunta tiene un valor de 0,20. Por tanto, se satisfacen las condiciones
descritas anteriormente para distribución binomial.

La fórmula matemática que describe la distribución binomial es la siguiente:

𝑃𝑃(𝑥𝑥) = 𝑛𝑛𝑛𝑛𝑛𝑛 𝜌𝜌 𝑥𝑥 (1 − 𝜌𝜌)𝑛𝑛−𝑥𝑥

Donde
C es una combinación
n es el número de ensayos
x es el número de éxitos
ρ es la probabilidad de éxito en cada ensayo

Tablas de probabilidad binomial

Hemos visto que una distribución de probabilidad binomial puede expresarse mediante
una fórmula, sin embargo, con la excepción de problemas en los que n es pequeña,
los cálculos son tediosos. Como ayuda para determinar las probabilidades necesarias,
se ha desarrollado una tabla que indica las probabilidades desde 0, 1, 2, 3,… n éxitos
para diferentes valores de n y ρ.
68

DISTRIBUCIÓN DE PROBABILIDAD HIPERGEOMÉTRICA

Para aplicar la distribución binomial, la probabilidad de un éxito debe permanecer igual


en cada ensayo sucesivo. Por ejemplo, la probabilidad de adivinar la respuesta correc-
ta a una pregunta del tipo verdadero/falso es igual a 0,50. Esta probabilidad permane-
ce igual para cada pregunta de un examen.

Cuando el muestreo se realiza con reposición, es decir, cuando el elemento seleccio-


nado se coloca nuevamente en la muestra antes de elegir nuevamente, podemos afir-
mar que las probabilidades se mantienen constantes. Sin embargo, la mayor parte de
los muestreos se realizan sin reposición, en consecuencia si la población es pequeña
la probabilidad cambiará en cada observación.

Recordemos que uno de los criterios para utilizar la distribución binomial es que la
probabilidad de éxito permanezca igual de ensayo a otro, para casos en los que el
muestreo se realice sin reposición y la muestra sea relativamente pequeña debería
aplicarse la distribución hipergeométrica.

Por tanto, si se selecciona una muestra de una población finita sin reposición y si el
tamaño de la muestra n es mayor que el 5% del tamaño de N de la población, enton-
ces se utiliza la distribución hipergeométrica para determinar la probabilidad de un
número específico de éxitos o fracasos. Esta distribución resulta adecuada cuando el
tamaño de la muestra es pequeño, su fórmula se enuncia a continuación:
69

(𝑠𝑠𝑠𝑠𝑠𝑠)( 𝑁𝑁−𝑆𝑆𝐶𝐶𝑛𝑛−𝑥𝑥 )
𝑃𝑃(𝑥𝑥) =
𝑁𝑁𝐶𝐶𝑛𝑛

Donde
N es el tamaño de la población
S es la cantidad de éxitos en la población
x es el número de éxitos en la muestra
n es el tamaño de la muestra o el número de ensayos
C es una combinación

Cuando la condición binomial de una probabilidad constante de éxito no puede ser


satisfecha tenemos que utilizar en su lugar la distribución hipergeométrica. Sin embar-
go, bajo muchas condiciones los resultados de la distribución binomial se aproximan
mucho a los de la hipergeométrica. Como regla empírica, si los elementos selecciona-
dos no se devuelven a la población y el tamaño de la muestra es menor que el 5% de
la población, puede utilizarse la distribución binomial para aproximar la distribución
hipergeométrica.

DISTRIBUCIÓN DE PROBABILIDAD DE POISSON

La distribución de probabilidad de Poisson describe la cantidad de veces que ocurre


un evento en un intervalo determinado. Este intervalo puede ser de tiempo, distancia,
área o volumen. La distribución se basa en dos supuestos:

1. La probabilidad es proporcional a la extensión del intervalo.


2. Los intervalos son independientes.

Es decir, cuanto mayor sea la magnitud o extensión del intervalo, tanto mayor será la
probabilidad, y el número de ocurrencias en un intervalo no afecta a los otros interva-
los.

Esta distribución también es una forma límite de la distribución binomial, cuando la


probabilidad de éxito es muy pequeña y n es muy grande (Ley de los eventos impro-
bables) y si bien tiene muchas aplicación, se utiliza como modelo para describir la dis-
tribución de errores en la captura de datos, en el número de rayaduras y otras imper-
fecciones en los tableros de los autos y también en el número de accidentes ocurridos
en ruta durante un periodo corto.

La distribución de Poisson puede describirse matemáticamente utilizando la siguiente


fórmula:

𝜇𝜇 𝑥𝑥 𝑒𝑒 −𝜇𝜇
𝑃𝑃(𝑥𝑥) =
𝑥𝑥!

Donde

μ es la media del número de ocurrencias (éxitos) en un intervalo específico, ma-


temáticamente resulta del producto de x por su probabilidad de éxito  μ = xρ
e es la constante 2,71828 (base del sistema logarítmico neperiano)
x es el número de ocurrencias (éxitos)
P(x) es la probabilidad calculada

Ejemplo: Consideremos que en la Empresa Aerolíneas Argentinas rara vez se pierde


el equipaje. En la mayoría de los vuelos no se observa un mal manejo de las maletas,
algunos reportan una valija extraviada, unos pocos tienes dos valijas extraviadas, rara
70

vez para un vuelo se tienen tres y así sucesivamente. Supongamos que una muestra
aleatoria de 1000 viajes aéreos revela un total de 300 valijas perdidas. De esta forma,
la media aritmética del número de equipajes extraviados por vuelo es 0,3 (300/1000)
Si la cantidad de valijas perdidas por viaje aéreo sigue una distribución de Poisson con
μ = 0,30 ¿cuál sería la probabilidad de no perder ninguna valija?

0,300 𝑒𝑒 −0,3
𝑃𝑃(0) = = 0,7408
0!

En otras palabras, el 74,08% de los vuelos no habrá equipaje perdido.

La probabilidad de exactamente una valija extraviada es:

0,301 𝑒𝑒 −0,30
𝑃𝑃(1) = = 0,2222
1!

Por tanto, se esperaría encontrar una valija extraviada en 22% de los vuelos.

A continuación mostramos la tabla de distribución de probabilidades de Poisson.

DISTRIBUCIONES CONTINUAS

En una distribución de probabilidad continua, la variable que se está considerando


puede tomar cualquier valor dentro de un intervalo dado. Las distribuciones continuas
son una forma conveniente de presentar distribuciones discretas que tienen muchos
resultados posibles, todos cercanos entre sí.
71

Familia de distribuciones de probabilidad normal

Una distribución de probabilidades continua muy importante es la distribución de pro-


babilidad normal y su correspondiente curva normal. Varios matemáticos contribuyeron
a su desarrollo, entre los que podemos contar al astrónomo-matemático del siglo XIX
Karl Gauss. En honor a su trabajo, la distribución normal a menudo es también llama-
da distribución gaussiana.

Entre las razones básicas por las cuales la distribución normal ocupa un lugar tan
prominente en la estadística se encuentran:

• Tiene propiedades que la hacen aplicables a un gran número de situaciones en las


que es necesario hacer inferencias mediante la toma de muestras.
• Casi se ajusta a las distribuciones de frecuencias reales observadas en muchos fe-
nómenos, incluyendo características humanas (peso, altura, IQ) resultados de pro-
cesos físicos (dimensiones y rendimientos) y muchas otras medidas de interés para
los administradores, tanto en el sector público como en el privado.

Como podemos observar en la gráfica, esta distribución tiene las siguientes caracterís-
ticas:

1. La curva normal es acampanada y presenta un solo pico en el centro de la distribu-


ción. La media aritmética, la mediana y la moda de la distribución son iguales y es-
tán localizadas en el pico.
2. La distribución de probabilidad normal es simétrica con respecto a su media.
3. La curva normal decrece uniformemente en ambas direcciones a partir del valor
central. Es asintótica, es significa que la curva se acerca cada vez más al eje x pero
en realidad nunca llega a tocarlo. Los puntos extremos de la curva se extienden in-
definidamente en ambas direcciones.

No hay una sola distribución de probabilidad normal sino que hay una “familia” de
ellas. Para definir una distribución normal, necesitamos definir sólo dos parámetros: la
media (µ) y la desviación estándar (σ). A continuación ilustramos una “familia” de cur-
vas normales.
72

DISTRIBUCIÓN DE PROBABILIDAD NORMAL ESTÁNDAR

Como hay una familia de distribuciones normales, cada distribución puede tener una
media (μ) o desviación diferentes. Por tanto, el número de distribuciones normales es
ilimitado pero por fortuna se puede utilizar, en todos los casos en los que la distribu-
ción normal es aplicable, un miembro de la familia de distribuciones normales que tie-
ne una media 0 y una desviación estándar 1, denominado distribución normal están-
dar. Cualquier distribución normal puede convertirse en la “distribución normal es-
tándar” restando la media a cada observación y dividiendo entre la desviación están-
dar.

Convertiremos o “estandarizaremos” primero la distribución que se tiene, en la distri-


bución normal estándar utilizando un valor z (también denominada, puntuación z, va-
lor estadístico, desviación normal estándar o simplemente desviación normal)

Valor Z: Diferencia entre un valor elegido, denotado por x, y la media μ, dividida


entre la desviación estándar, σ.

(𝑥𝑥 − 𝜇𝜇)
𝑧𝑧 =
𝜎𝜎

Esto es, que el valor Z se constituye en la distancia a la media, medida en unidades de


la desviación estándar. Al determinar su valor se puede obtener el área o la probabili-
dad bajo cualquier curva normal. A continuación la tabla de distribución de probabili-
dades normal.
73

DESIGUALDAD DE CHEBYSHEV

Antes de examinar diversos usos de la distribución de probabilidad normal estándar,


consideraremos tres áreas bajo la curva normal que si bien ya las expusimos como la
Regla Empírica del Teorema de Chebyshev, viene al caso recordarlas.

• Aproximadamente 68% de todos los valores de una población normalmente distri-


buida se encuentra dentro de ± 1 σ desde la media µ.

• Aproximadamente 95,5% de todos los valores de una población normalmente dis-


tribuida se encuentra dentro de ± 2 σ desde la media µ.
74

• Aproximadamente 99,7% de todos los valores de una población normalmente dis-


tribuida se encuentra dentro de ± 3 σ desde la media µ.

La primera aplicación de la distribución normal estándar incluye el cálculo del área, en


una distribución normal, entre la media y un valor determinado.

Aproximación normal de la distribución binomial

Utilizar la distribución normal (que es contínua) como sustituto de una distribución bi-
nomial (que es una distribución discreta) para valores grandes de n parece razonable
porque conforme aumenta n, una distribución binomial se acerca cada vez más a una
distribución normal.

¿Cuándo se debe utilizar la aproximación normal a al binomial? La distribución de pro-


babilidad normal se considera buena aproximación a la distribución binomial cuando
ambas, n y n(1-ρ) son por lo menos 5. Sin embargo, antes de aplicar la aproximación
normal es necesario asegurarse de que la distribución de interés sea en realidad de
tipo binomial.

Ejemplo: Supongamos que la gerencia de una pizzería encontró que el 70% de sus
nuevos clientes regresa al establecimiento. En una semana en la que hubo 80 consu-
midores nuevos ¿cuál es la probabilidad de que 60 o más regresen en otra ocasión?

Como las condiciones binomiales se satisfacen, podemos utilizar su fórmula para pri-
meramente, calcular la probabilidad de que exactamente 60 clientes regresen.

𝑃𝑃(60) = 80𝐶𝐶60 0,7060 (1 − 0,70)20 = 0,63

Después calcular la probabilidad de que exactamente 61 clientes regresen y continuar


así hasta que se tiene la probabilidad de que los 80 regresen. Por último sumar las
probabilidades de 60 a 80 lo que daría como resultado 0,197.

Al representar gráficamente estos valores se puede observar la semejanza de esta


distribución con la normal; todo lo que debemos hacer es suavizar las probabilidades
discretas hacia una distribución continua. Además, el hecho de trabajar con una distri-
bución normal requerirá de una cantidad muy inferior de cálculos que el trabajo con la
distribución normal.
75

Debido a que se utiliza la distribución normal para determinar la probabilidad de 60 o


más éxitos, se debe restar, en este caso, 0,50 de 60. Al valor 0,50 se lo denomina fac-
tor de corrección por continuidad. Este pequeño ajuste debe hacerse porque se utiliza
una distribución continua (normal) para aproximar una distribución discreta (binomial)

Factor de corrección por continuidad: El valor 0,50 que se resta o se suma,


dependiendo de la situación, a un valor seleccionado cuando una distribu-
ción de probabilidad discreta se aproxima por medio de una distribución de
probabilidad continua.

Solamente pueden presentarse 4 casos para aplicar el factor de corrección que son:

1. Para la probabilidad de que por lo menos ocurra x, se usa el área sobre los valores
mayores que (x - 0,05)
2. Para la probabilidad de que ocurran más de x, se usa el área sobre los valores ma-
yores de (x + 0,5)
3. Para la probabilidad de que ocurra x o menos, se usa el área sobre los valores me-
nores que (x + 0,5)
4. Para la probabilidad de que ocurran menos de x, se usa el área sobre los valores
menores que (x - 0,5)

Los pasos para utilizar la distribución normal con el fin de aproximar la probabilidad de
que 60 o más, de 80 clientes nuevos, regresen al restaurante son:

• Encontrar el valor z que corresponde a x = 59,5 aplicando las fórmulas ya vistas


𝜇𝜇 = 𝑛𝑛𝑛𝑛 = 80(0,70) = 56
𝜎𝜎 2 = 𝑛𝑛𝑛𝑛(1 − 𝜌𝜌) = 80 (0,70)(1 − 0,70) = 16,8
𝜎𝜎 = �16,8 = 4,10
𝑥𝑥 − 𝜇𝜇 59,5 − 56
𝑧𝑧 = = = 0,85
𝜎𝜎 4,10

• Determinar el área bajo la curva normal entre μ=56 y x=59,5  z= 0,85 consultado
en tabla se obtiene 0,3023
• Calcular el área más allá de 59,5  0,1977 es la probabilidad aproximada de que 60
o más de los 80 nuevos clientes, regresen.

Sin dudas, estaremos de acuerdo en que utilizar la aproximación normal a la binomial


es un método mucho más eficiente para calcular la probabilidad de que 60 o más
clientes nuevos regresen. La comparación de estos resultados con los obtenidos utili-
zando la distribución exacta es satisfactoria (0,197 binomial vs 0,1977 normal).

También podría gustarte