Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UNIDAD IV
VARIABLES ALEATORIAS
dado” se puede presentar cualquiera de los seis resultados posibles. Algunos experi-
mentos dan resultados que son cuantitativos y otros dan resultados que son cualitati-
vos. A continuación algunos ejemplos para ilustrar mejor el significado de variable
aleatoria.
Variable aleatoria discreta: variable que sólo puede tomar ciertos valores clara-
mente separados. En general, una variable aleatoria discreta es el resultado de
contar algo.
Variable aleatoria continua: variable que puede tomar un valor de una cantidad
infinitamente grande de valores, dentro de ciertas limitaciones. Surge del efecto de
medir.
Media
La media es un valor típico que sirve para representar una distribución de probabilidad.
También es el valor promedio, a largo plazo, de la variable aleatoria. A la media de
una distribución de probabilidad se la conoce también como su “valor esperado”. Esta
media es un promedio ponderado en el que los valores posibles se ponderan mediante
sus probabilidades correspondientes de ocurrencia.
𝜇𝜇 = �[𝑥𝑥 𝑃𝑃(𝑥𝑥)]
Donde
P(x) es la probabilidad de cada valor que puede tomar la variable aleatoria x
DISTRIBUCIÓN BINOMIAL
Una característica de la mencionada distribución es que sólo hay dos resultados (mu-
tuamente excluyentes) posibles en cada ensayo de un experimento. Otra característica
es que la variable aleatoria es el resultado de conteos; esto es, se cuenta el número
de éxitos en la totalidad de ensayos. Una tercer característica de esta distribución es
que la probabilidad de un éxito sigue siendo la misma de un ensayo a otro. La última
característica es que cada ensayo es independiente de cualquier otro, esto significa
que los resultados no siguen ningún patrón.
Donde
C es una combinación
n es el número de ensayos
x es el número de éxitos
ρ es la probabilidad de éxito en cada ensayo
Hemos visto que una distribución de probabilidad binomial puede expresarse mediante
una fórmula, sin embargo, con la excepción de problemas en los que n es pequeña,
los cálculos son tediosos. Como ayuda para determinar las probabilidades necesarias,
se ha desarrollado una tabla que indica las probabilidades desde 0, 1, 2, 3,… n éxitos
para diferentes valores de n y ρ.
68
Recordemos que uno de los criterios para utilizar la distribución binomial es que la
probabilidad de éxito permanezca igual de ensayo a otro, para casos en los que el
muestreo se realice sin reposición y la muestra sea relativamente pequeña debería
aplicarse la distribución hipergeométrica.
Por tanto, si se selecciona una muestra de una población finita sin reposición y si el
tamaño de la muestra n es mayor que el 5% del tamaño de N de la población, enton-
ces se utiliza la distribución hipergeométrica para determinar la probabilidad de un
número específico de éxitos o fracasos. Esta distribución resulta adecuada cuando el
tamaño de la muestra es pequeño, su fórmula se enuncia a continuación:
69
(𝑠𝑠𝑠𝑠𝑠𝑠)( 𝑁𝑁−𝑆𝑆𝐶𝐶𝑛𝑛−𝑥𝑥 )
𝑃𝑃(𝑥𝑥) =
𝑁𝑁𝐶𝐶𝑛𝑛
Donde
N es el tamaño de la población
S es la cantidad de éxitos en la población
x es el número de éxitos en la muestra
n es el tamaño de la muestra o el número de ensayos
C es una combinación
Es decir, cuanto mayor sea la magnitud o extensión del intervalo, tanto mayor será la
probabilidad, y el número de ocurrencias en un intervalo no afecta a los otros interva-
los.
𝜇𝜇 𝑥𝑥 𝑒𝑒 −𝜇𝜇
𝑃𝑃(𝑥𝑥) =
𝑥𝑥!
Donde
vez para un vuelo se tienen tres y así sucesivamente. Supongamos que una muestra
aleatoria de 1000 viajes aéreos revela un total de 300 valijas perdidas. De esta forma,
la media aritmética del número de equipajes extraviados por vuelo es 0,3 (300/1000)
Si la cantidad de valijas perdidas por viaje aéreo sigue una distribución de Poisson con
μ = 0,30 ¿cuál sería la probabilidad de no perder ninguna valija?
0,300 𝑒𝑒 −0,3
𝑃𝑃(0) = = 0,7408
0!
0,301 𝑒𝑒 −0,30
𝑃𝑃(1) = = 0,2222
1!
Por tanto, se esperaría encontrar una valija extraviada en 22% de los vuelos.
DISTRIBUCIONES CONTINUAS
Entre las razones básicas por las cuales la distribución normal ocupa un lugar tan
prominente en la estadística se encuentran:
Como podemos observar en la gráfica, esta distribución tiene las siguientes caracterís-
ticas:
No hay una sola distribución de probabilidad normal sino que hay una “familia” de
ellas. Para definir una distribución normal, necesitamos definir sólo dos parámetros: la
media (µ) y la desviación estándar (σ). A continuación ilustramos una “familia” de cur-
vas normales.
72
Como hay una familia de distribuciones normales, cada distribución puede tener una
media (μ) o desviación diferentes. Por tanto, el número de distribuciones normales es
ilimitado pero por fortuna se puede utilizar, en todos los casos en los que la distribu-
ción normal es aplicable, un miembro de la familia de distribuciones normales que tie-
ne una media 0 y una desviación estándar 1, denominado distribución normal están-
dar. Cualquier distribución normal puede convertirse en la “distribución normal es-
tándar” restando la media a cada observación y dividiendo entre la desviación están-
dar.
(𝑥𝑥 − 𝜇𝜇)
𝑧𝑧 =
𝜎𝜎
DESIGUALDAD DE CHEBYSHEV
Utilizar la distribución normal (que es contínua) como sustituto de una distribución bi-
nomial (que es una distribución discreta) para valores grandes de n parece razonable
porque conforme aumenta n, una distribución binomial se acerca cada vez más a una
distribución normal.
Ejemplo: Supongamos que la gerencia de una pizzería encontró que el 70% de sus
nuevos clientes regresa al establecimiento. En una semana en la que hubo 80 consu-
midores nuevos ¿cuál es la probabilidad de que 60 o más regresen en otra ocasión?
Como las condiciones binomiales se satisfacen, podemos utilizar su fórmula para pri-
meramente, calcular la probabilidad de que exactamente 60 clientes regresen.
Solamente pueden presentarse 4 casos para aplicar el factor de corrección que son:
1. Para la probabilidad de que por lo menos ocurra x, se usa el área sobre los valores
mayores que (x - 0,05)
2. Para la probabilidad de que ocurran más de x, se usa el área sobre los valores ma-
yores de (x + 0,5)
3. Para la probabilidad de que ocurra x o menos, se usa el área sobre los valores me-
nores que (x + 0,5)
4. Para la probabilidad de que ocurran menos de x, se usa el área sobre los valores
menores que (x - 0,5)
Los pasos para utilizar la distribución normal con el fin de aproximar la probabilidad de
que 60 o más, de 80 clientes nuevos, regresen al restaurante son:
• Determinar el área bajo la curva normal entre μ=56 y x=59,5 z= 0,85 consultado
en tabla se obtiene 0,3023
• Calcular el área más allá de 59,5 0,1977 es la probabilidad aproximada de que 60
o más de los 80 nuevos clientes, regresen.