Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad-III 2023
Unidad-III 2023
de Probabilidad
3.1. Introducción
En este capítulo deniremos dos de los conceptos más importantes de la Estadística. Nos referimos
a los conceptos de variable aleatoria y el de distribución de probabilidad de una variable aleatoria.
Estos conceptos serán muy utilizados al aplicar las técnicas inferenciales que estudiaremos más
adelante.
En el capítulo anterior habíamos denido como experimento aleatorio a una secuencia de activi-
dades diseñadas para obtener información de interés para el investigador y que tiene las siguientes
propiedades:
Puede realizarse tantas veces como se quiera bajo las mismas condiciones
Se sabe cuales son los resultados posibles
Antes de realizar una repetición no se sabe cuál de los resultados ocurrirá
Al conjunto de todos los resultados posibles del experimento lo llamamos espacio muestral y lo
simbolizamos en general con la letra S . También denimos como evento a cualquier subconjunto
de S .
Todo experimento aleatorio puede denir cierto tipo de variables que se utilizan para describir
numéricamente los eventos de su espacio muestral. Estas variables reciben el nombre de variables
aleatorias.
Damos a continuación una primera denición de variable aleatoria.
Denición 3.1. Cuando los valores que toma una variable son el resultado de algún proceso en el
que interviene el azar, la variable recibe el nombre de variable aleatoria.
Supongamos que se lanza una moneda tres veces y estamos interesados en el número de caras
obtenidas en los tres lanzamientos.. El espacio muestral de este experimento es, como ya sabemos:
S = {CCC, CC+, C + C, +CC, C + +, +C+, + + C, + + +}
67
X = 0 que se identica con el evento A1 = {+ + +}. (No se obtuvieron caras)
X = 1 que se identica con el evento A2 = {C + +, +C+, + + C}. (Se obtuvo una cara)
X = 2 que se identica con el evento A3 = {CC+, C + C, +CC}. (Se obtuvieron dos caras)
X = 3 que se identica con el evento A4 = {CCC}. (Se obtuvieron tres caras)
En general, las variables aleatorias se designan con las últimas letras del abecedario en mayúsculas
como por ejemplo X, Y, W, Z etc. y sus valores con las respectivas minúsculas.
Siguiendo con el ejemplo en el que denimos la variable aleatoria
y como una consecuencia de la relación que se establece entre los eventos de S y números reales,
podemos calcular la probabilidad de cada uno de los valores de X .
Asumiendo que los resultados son igualmente probables tendremos:
1
Pr(X = 0) = Pr(A1 ) = 8
3
Pr(X = 1) = Pr(A2 ) = 8
3
Pr(X = 2) = Pr(A3 ) = 8
1
Pr(X = 3) = Pr(A4 ) = 8
Es decir, si X es una variable aleatoria discreta, sus valores posibles se puede anotar de la siguiente
manera: x1 , x2 , ..., xi , ... etc. En el caso nito, la lista termina, en el caso innito, la lista continua
indenidamente.
La variable aleatoria
68
es discreta y nita pues X = 0, 1, 2, 3.
Supongamos que de una línea de producción se selecciona aleatoriamente un producto hasta en-
contrar el primer defectuoso.
La variable aleatoria de interés para este caso es:
Los valores posibles de esta variable son X = 1, 2, 3, ...etc, donde (X = 1) signica que se obtuvo el
primer defectuoso en la primera extracción, (X = 2), se obtuvo el primer defectuoso en la segunda
extracción, etc. En teoría, la lista de valores de la variable X no tiene límite.
Por lo tanto, X es una variable aleatoria discreta e innita.
Denición 3.4. La distribución de probabilidad de una variable aleatoria discreta es una tabla,
un gráco, una fórmula o cualquier otro medio que sirva para especicar todos los valores de la
variable junto con sus respectivas probabilidades.
X p(x) = Pr(X = x)
x1 p(x1 )
x2 p(x2 )
.. ..
. .
xn p(xn )
En la primera columna de la Tabla (3.1) se listan los valores de la variable X y en la segunda sus
probabilidades.
Para la variable aleatoria X del ejemplo que consiste en arrojar tres veces una moneda, su distri-
bución de probabilidad en forma tabular se muestra en la Tabla (3.2)
X p(x) = Pr(X = x)
0 1/8
1 3/8
2 3/8
3 1/8
69
Algunas propiedades de la función factorial son las siguientes:
0! = 1
1! = 1
Vamos a comprobar ahora que la Fórmula (3.1) puede utilizarse también para calcular las proba-
bilidades de la variable X .
Por ejemplo, cuando (X = 0)
3! 1 3! 1 1
p(0) = Pr(X = 0) = = =
0!(3 − 0)! 8 3! 8 8
Cuando (X = 1)
3! 1 3! 1 3
p(0) = Pr(x = 1) = = =
1!(3 − 1)! 8 2! 8 8
En cualquier caso, deben cumplirse dos requisitos para que una tabla, una fórmula un gráco o
cualquier mecanismo puedan considerarse como la distribución de probabilidad de una variable
aleatoria discreta.
Estos requisitos son los siguientes:
0 ≤ p(x) ≤ 1
P
x p(x) = 1
¾Cómo podemos relacionar las ideas de variable aleatoria y de distribución de probabilidad con los
conceptos que hemos desarrollado anteriormente, más precisamente en el Capítulo 1?
Supongamos que se lanza efectivamente tres veces una moneda un número grande de veces y se
registra el número X de caras observadas en cada lanzamiento.
El gráco de barras de frecuencias relativas para el conjunto de valores X = 0, 1, 2, 3 tendrá barras
cuyas alturas aproximadas serían 1/8, 3/8, 3/8 y 1/8.
70
De hecho, si fuera posible repetir el experimento un número muy grande de veces, la distribución
de frecuencias relativas de la variable X se vería muy parecida a el gráco de barras de la Figura
(3.1).
Podemos decir entonces que la distribución de probabilidad de la variable aleatoria discreta pro-
porciona un modelo para su distribución de frecuencias.
¾Cómo se puede interpretar el concepto de valor esperado de una variable aleatoria? Veamos el
siguiente ejemplo.
Supongamos que dos jugadores A y B se enfrentan en un juego que consiste en lanzar una moneda
al aire. Si sale cara A gana un peso, pero si sale cruz A pierde un peso.
La variable aleatoria que representa la ganancia de A en el juego se puede denir de la siguiente
manera:
X = 1, −1
Si la moneda está balanceada, la probabilidad de obtener cara será igual a la de obtener cruz. La
distribución de probabilidad de X se muestra en la Tabla (3.3)
X p(x) = Pr(X = x)
-1 0,5
1 0,5
Esto quiere decir que si A juega un gran número de veces el juego, en promedio, no perderá ni
ganará ninguna suma de dinero.
Volvamos nuevamente al experimento que consiste en arrojar tres veces una moneda balanceada.
71
El espacio muestral de este experimento lo hemos denido de la siguiente manera:
X p(x) = Pr(X = x)
x1 1/N
x2 1/N
.. ..
. .
xN 1/N
Consideremos nuevamente el ejemplo de arrojar tres veces una moneda equilibrada. La varianza
de la variable aleatoria
72
1 3 3 1
σ 2 = (0 − 1, 5)2 + (1 − 1, 5)2 + (2 − 1, 5)2 + (3 − 1, 5)2 = 0, 75
8 8 8 8
(3.4)
X
F (x0 ) = Pr(X ≤ x0 ) = p(xi ) = p(x1 ) + p(x2 ) + · · · + p(x0 )
x
1
F (0) = Pr(X ≤ 0) =
8
Si X ≤ 1, entonces
1 3 4
F (1) = Pr(X ≤ 1) = p(0) + p(1) = + =
8 8 8
Si X ≤ 2, entonces
4 3 7
F (2) = Pr(X ≤ 2) = p(0) + p(1) + p(2) = + =
8 8 8
73
Finalmente, si X ≤ 3, entonces
7 1
F (3) = Pr(X ≤ 3) = p(0) + p(1) + p(2) + p(3) = + =1
8 8
F (4) = Pr(X ≤ 4) = 1 + 0 = 1
lı́mx→−∞ F (x) = 0
lı́mx→+∞ F (x) = 1
74
3.5. Variable aleatorias continuas
Hemos visto al principio de este capítulo que las variables aleatorias se pueden clasicar como
discretas y continuas.
En las secciones anteriores analizamos las características y propiedades más importantes de las
variables aleatorias discretas.
En lo que sigue efectuaremos un análisis similar para las variables aleatorias continuas.
Comenzamos el estudio de las variables aleatorias continuas con la siguiente denición.
Denición 3.8. Una variable aleatoria es continua si puede tomar cualquier valor en un intervalo
real de valores posibles.
Supongamos que el administrador de control de calidad de una empresa dedicada a la fabricación
de productos de iluminación realiza un experimento consiste en seleccionar aleatoriamente una
lámpara de luz hogareña en una línea de producción y registrar el tiempo de duración de la
lámpara antes de fallar. La variable aleatoria
X =Tiempo de duración de la lámpara hogareña antes de fallar
es una variable aleatoria continua porque puede asumir, al menos en teoría, cualquier valor en el
intervalo 0 y 200 horas (valores hipotéticos)
Los experimentos que resultan en mediciones denen variables aleatorias continuas.
Existen algunas diferencias importantes en el tratamiento de las variables aleatorias discretas y
continuas. Estas diferencias siempre se deben tener en cuenta cuando se las analiza.
Recordemos que para una variable aleatoria discreta se puede calcular Pr(X = x), es decir, la
probabilidad de que la variable tome cierto valor especíco x.
Para las variables aleatorias continuas, el caso es muy distinto ya que la misma puede tomar
cualquier valor dentro de un intervalo real de la recta numérica.
Como en el intervalo real de valores posibles de la variable existen innitos valores, para calcular
Pr(X = x) aplicando la denición clásica de probabilidad, deberíamos dividir el número de veces
que ocurre el evento x por un número innito de valores. Debido a ello, el cociente siempre será
igual a cero.
x
Recuerde que un cociente como tiende a cero cuando el denominador crece sin límite.
n
En lugar de esto, debemos pensar en términos de calcular la probabilidad de que una variable
aleatoria continua tome un valor dentro de un intervalo de valores posible, es decir, calcular Pr(a ≤
X ≤ b).
Para describir las distribuciones discretas de probabilidad presentamos el concepto de función de
probabilidad p(x).
Esta función permite calcular la probabilidad de que una variable aleatoria discreta X tome un
valor especíco, es decir, p(x) = Pr(X = x).
En el caso continuo, la contraparte de la función de probabilidad es la función de densidad de
probabilidad representada por f (x) y denida de la siguiente manera:
Denición 3.9. Una función f (x) es una función de densidad de probabilidad de una variable
aleatoria continua X si cumple con las siguientes condiciones:
1. f (x) ≥ 0
+∞
2. −∞ f (x)dx =1
b
3. Pr(a ≤ x ≤ b) = a
f (x)dx
Observación 3.1. Como f (x) ≥ 0 entonces Pr(a ≤ x ≤ b) = ab f (x)dx representa el área compren-
dida entre el gráco de f (x), la recta de los valores de X , y las rectas verticales x = a y x = b. Es
decir, para las variables aleatorias continuas, área y probabilidad son dos conceptos equivalentes.
75
En la Figura (3.3) se muestran grácamente las tres condiciones para que una función f (x) pueda
considerarse como la densidad de probabilidad de una variable aleatoria continua X .
Algunas de las propiedades más importantes de la densidad de probabilidad f (x) de una variable
aleatoria continua X se presentan en el siguiente resultado:
Teorema 3.1. Si X es una variable aleatoria continua con densidad de probabilidad f (x), entonces
a
1. Pr(a ≤ X ≤ a) = a
f (x)dx = 0, es decir Pr(x = a) = 0
b
2. Pr(a ≤ X ≤ b) = a
f (x)dx = Pr(a < X < b)
Ejemplo 3.2. Sea X una variable aleatoria continua con densidad de probabilidad
(
x2
3 −1 < x < 2
f (x) =
0 en otro caso
1. Vericar que f (x) cumple con las dos primeras condiciones de la denición de densidad de
probabilidad
2. Calcular Pr(0 < X ≤ 1)
Solución
En la Figura (3.4) se muestra el gráco de f (x).
76
Primer punto
La primera condición para que f (x) a sea la densidad de probabilidad de la variable aleatoria X
es que f (x) ≥ 0, es decir, las imágenes en su dominio de denición deben ser siempre no negativas.
Esta condición se cumple por la denición misma de la función f (x) pues en el intervalo (−1 < X < 2),
f (x) se dene como un polinomio de segundo grado con ordenada al origen igual a cero.
Por lo tanto f (x) > 0 para todos los valores de X en dicho intervalo.
En el resto de los valores de X en su dominio de denición resulta f (x) = 0. De esta manera se
verica el cumplimiento de la primera condición.
+∞
La segunda condición establece que −∞ f (x)dx = 1
Como la función esta denida por tramos, debemos calcular la integral también por tramos.
Procediendo de esta manera obtendremos:
+∞ −1 2 +∞
1 2
f (x)dx = 0dx + x dx + 0dx
−∞ −∞ 3 −1 2
O sea
+∞ 2
1 1 3 2 1
f (x)dx = x2 dx = x −1 = (8 + 1) = 1
−∞ 3 −1 9 9
Se cumple la segunda condición.
Segundo punto
A partir de la tercera condición de la denición de densidad de probabilidad:
1
1 1 2 1
Pr(0 < X < 1) = x2 dx = (1 − 03 ) =
3 0 9 9
Téngase presente este resultado pues lo volveremos a calcular por otro método un poco más ade-
lante.
lı́mx→−∞ F (x) = 0
lı́mx→+∞ F (x) = 1
77
Si x1 < x2 entonces F (x1 ) ≤ F (x2 ) para cualquier par de números reales x1 y x2
2. f (x) = dF (x)
dx en los valores de X donde exista la derivada.
Ejemplo 3.3. Para la función de densidad f (x) del Ejemplo (3.2) encuentre F (x) y úsela para
evaluar Pr(0 < X ≤ 1).
Solución
Si X ≤ −1 x
f (x) = 0 ⇒ F (x) = 0dt = 0
−∞
Si −1 < X < 2 x
−1 x
x3 + 1
1 2 1 3
F (x) = 0dt + t dt = t =
−∞ 3 −1 9 −1 9
Si X ≥ 2
−1 2 +∞ 2 2
1 2 1 3 1
F (x) = 0dt + t dt + 0dt = t = t2 dt
−∞ 3 −1 2 9 −1 3 −1
Luego
2
1 1 3 2 1
F (x) = t2 dt = t −1 = (8 + 1) = 1
3 −1 9 9
Por lo tanto
0
x ≤ −1
1
F (x) = (x3 + 1) −1 < x < 2
9
1 x≥2
78
3.7. Valor esperado y varianza de una variable aleatoria con-
tinua
Denimos a continuación dos de las medidas descriptivas numéricas más importantes que caracte-
rizan a toda variable aleatoria continua. Se trata de la media o valor esperado y su varianza.
Denición 3.11. Sea X una variable aleatoria continua con función de densidad f (x), su media
o valor esperado se denen de la siguiente manera:
+∞
µ= xf (x)dx (3.6)
−∞
Puede verse que se trata de una denición muy parecida a la del valor esperado de una variable
aleatoria discreta solo que en lugar de sumatorias se utilizan integrales.
Denición 3.12. Sea X una variable aleatoria con densidad de probabilidad f (x), la varianza de
X se dene de la siguiente manera:
+∞
σ2 = (x − µ)2 f (x)dx (3.7)
−∞
Solución
Aplicando la denición de media o valor esperado de una variable aleatoria continua
20 20
E(X) = µ = x(0, 05)dx = 0, 05 xdx
0 0
Por lo tanto
0, 05 2 20 0, 05
E(X) = µ = x 0 = (202 − 02 ) = 10
2 2
De acuerdo con la denición de varianza de una variable aleatoria
20
σ2 = (x − 10)2 (0, 05)dx
0
Luego
20 20
(x − 10)3
σ 2 = 0, 05 (x − 10)2 dx = 0, 05 = 33, 33
0 3 0
√
Por lo tanto σ = 33, 33 = 5, 77.
79
3.8. Modelos de distribución de probabilidad. Variables alea-
torias discretas
Analicemos los siguientes experimentos y sus resultados correspondientes:
Primer experimento
Se lanza una moneda al aire tres veces y se registran los resultados obtenidos
Variable de interés: X = Número de caras obtenidas en los tres lanzamientos
Espacio muestral: S1 = {CCC, CC+, C + C, +CC, C + +, +C+, + + C, + + +}
Valores de la variable: X = 0, 1, 2, 3
Segundo experimento
Se seleccionan tres artículos al azar y se los clasica como defectuoso (D) o no defectuoso
(N )
Pueden verse claramente las similitudes de los dos experimentos y sus resultados.
Sería muy tedioso, y llevaría mucho tiempo estudiar en forma individual las propiedades de variables
aleatorias generadas por experimentos aleatorios de características muy parecidas como los dos
anteriores.
Debido a ello, se han desarrollado modelos de distribuciones de probabilidad que describen expe-
rimentos con características similares y que además generan a variables aleatorias con idénticas
propiedades.
Comenzamos analizando algunos de los modelos de distribución de probabilidad para variables
aleatorias discretas más utilizados en Administración y Economía.
Los experimentos aleatorios con estas características reciben el nombre de experimentos binomiales.
Para un experimento Binomial la variable aleatoria de interés es la siguiente:
80
Sus valores son los siguientes: X = 0, 1, ..., n.
¾Cómo se interpretan los valores de la variable? Por ejemplo si (X = 0) signica que se realizaron
las n pruebas y no se obtuvo ningún éxito, si (X = 1) signica que se realizaron n pruebas y se
obtuvo un éxito, etc.
Es posible demostrar que si una variable aleatoria X tiene distribución Binomial, su función de
probabilidad es la siguiente:
n!
p(x) = Pr(X = x) = px q n−x (3.8)
x!(n − x)!
Además, si X una variable aleatoria con distribución Binomial, entonces E(X) = np y σ 2 = npq .
√
Además σ = npq .
Los números n y p reciben el nombre de parámetros de la distribución. Para cada combinación de
sus valores se tiene una distribución Binomial diferente.
Si una variable aleatoria discreta X tiene distribución Binomial de parámetros n y p se escribe
X ∼ B(n, p).
Por ejemplo, suponga que X ∼ B(n = 5, p = 0, 25).
Los valores que puede tomar esta variable son X = 0, 1, 2, 3, 4, 5
La función de probabilidad de X para n = 5 y p = 0, 25
5!
p(x) = Pr(X = x) = (0, 25)x (0, 75)5−x
x!(5 − x)!
Entonces, si (X = 0)
5!
p(0) = Pr(X = 0) = (0, 25)0 (0, 75)5 = 0, 237
0!(5 − 0)!
Si (X = 1)
5!
p(1) = Pr(X = 1) = (0, 25)1 (0, 75)4 = 0, 395
1!(5 − 4)!
Se puede proceder de la misma manera para encontrar las probabilidades de los restantes valores
de la variable.
En la Tabla (3.6) se muestra el resultado nal.
X p(x) = Pr(X = x)
0 0,237
1 0,395
2 0,263
3 0,087
4 0,014
5 0,001
81
Figura 3.6: Distribución de probabilidad de X ∼ B(n = 5; p = 0.25)
5!
p(x) = Pr(X = x) = (0, 5)x (0, 5)n−x
x!(5 − x)!
5!
p(0) = Pr(X = 0) = (0, 5)0 (0, 5)5 = 0, 031
0!(5 − 0)!
Si (X = 1)
5!
p(1) = Pr(X = 1) = (0, 50)(0, 5)4 = 0, 156
1!(5 − 1)!
Procediendo de manera semejante se pueden encontrar las probabilidades de los restantes valores
de X .
Los resultados se presentan en la Tabla (3.7).
X p(x) = Pr(X = x)
0 0,031
1 0,156
2 0.312
3 0,315
4 0,156
5 0,031
82
Figura 3.7: Distribución de probabilidad de X ∼ B(n = 5; p = 0.5)
1. Ninguna defectuosa
2. Cuatro defectuosas
3. Como máximo 2 defectuosas
Solución
Asumimos que X tiene distribución Binomial.
Variable aleatoria:
Primer punto
10!
p(0) = Pr(X = 0) = (0, 10)0 (0, 90)10−0 = 0, 348
0!(10 − 0)!
Segundo punto
10!
p(4) = Pr(X = 4) = (0, 10)4 (0, 90)10−4 = 0, 011
4!(10 − 4)!
Tercer punto
83
Además E(X) = np = 10(0, 10) = 1 y σ 2 = npq = 10(0, 10)(0, 90) = 0, 90.
√
Finalmente, σ = 0, 90 = 0, 948.
Debe tenerse muy en cuenta que el uso del modelo binomial solo debe llevarse a cabo si se cumplen
las condiciones de un experimento binomial.
Un punto clave es el que arma que la probabilidad de éxito debe permanecer constante de ensayo
a ensayo, condición que no siempre se cumple.
Si el experimento consiste en tomar muestras de una población, el modelo binomial se puede aplicar
cuando la muestra se toma con reposición de una población nita.
Si se selecciona la muestra de esta manera, la probabilidad de éxito permanecerá constante.
Sin embargo, en la práctica suele ser más lógico tomar muestras sin reposición de poblaciones nita.
De esta manera se evita la posibilidad de analizar dos veces la misma unidad.
En estos casos debe tenerse mucho cuidado al aplicar la distribución Binomial.
Existe un consenso general de cuando el tamaño de la población es por lo menos 20 veces el
tamaño de la muestra, es posible utilizar la distribución Binomial aún cuando la muestra se tome
sin reposición de una población nita.
De esta manera se asegura que la probabilidad de éxito se mantendrá aproximadamente constante.
Resumiendo:
Si se toman muestras sin reposición de una población nita, la distribución Binomial podrá
utilizarse siempre y cuando N ≥ 20n o equivalentemente Nn ≤ 0, 05 siendo n el tamaño de la
muestra y N el tamaño de la población
La cantidad n
recibe el nombre de fracción de muestreo.
N
Ejemplo 3.6. En una provincia de 1.000.000 de habitantes estudios de mercado anteriores han
determinado que el 40 % de la población consume determinada marca de yerba mate. Se toma una
muestra sin reposición de 10 personas. ¾Cuál es la probabilidad de que 3 personas consuman la
marca de esta yerba?
Solución
Como Nn ≤ 0, 05 se puede utilizar el modelo Binomial aún cuando la muestra se toma sin reemplazo.
Variable de interés:
10
p(x) = Pr(X = x) = (0, 40)x (0, 60)10−x
x!(10 − x)!
Por lo tanto:
10!
p(3) = Pr(X = 3) = (0, 40)3 (0, 60)7 = 0, 2150
3!(10 − 3)!
84
1. El experimento consiste en extraer al azar y sin reposición n unidades observacionales de una
conjunto de N unidades, Ne de las cuales resultan éxito y Nf = N − Ne resultan fracaso
2. La probabilidad de obtener un éxito no permanece constante
3. Los resultados de las pruebas no son independientes
La variable aleatoria de interés en un experimento con estas propiedades es la siguiente:
X = Número de resultados éxitos en una muestra de n elementos
Por ejemplo, si en una población existen Ne = 50 éxitos y n = 10, el conteo de los valores de la
variable aleatoria puede ir hasta n = 10.
En otro caso, si n = 50 pero Ne = 5 el conteo de los valores de la variable aleatoria puede ir a los
sumo hasta 5 a pesar de que la muestra es de 50 unidades observacionales.
Puede demostrarse que la función de probabilidad de una variable aleatoria con distribución Hi-
pergeométrica es la siguiente:
Ne Nf
p(x) = Pr X = x) = x
N
n−x
(3.9)
n
combinatorios.
En genera, si n y x son dos números enteros no negativos tales que n ≥ x , la expresión nx recibe
Algunas de las medidas descriptivas numéricas que caracterizar una variable aleatoria con distri-
bución hipergeométrica son las siguientes:
Media o valor esperado:
Ne
E(X) = n
N
Varianza:
2 Ne Ne N −n
V (X) = σ = n 1−
N N N −1
√
Desviación estándar: σ = σ2 .
En estas fórmulas
N = Número de unidades observacionales de la población
Ne = Número de éxitos en las N unidades observacionales
Nf = 1 − Ne = Número de fracasos en las N unidades observacionales
85
n = Número de unidades seleccionadas en la muestra
como puede vericarse aplicando las técnicas estándar del cálculo de límites.
De ser así, puede prescindirse del factor corrección en el cálculo de la varianza resultando
Ne Ne
σ2 = n 1−
N N
.Una forma práctica de determinar si N es lo sucientemente grande respecto del tamaño de la
muestra es que se cumplan algunas de las siguientes condiciones equivalentes: N ≥ 20n o bien
N ≤ 0, 05.
n
Solución
Datos: N = 87, n = 10, Ne = 13 y Nf = 87 − 13 = 74.
Variable aleatoria:
86
1. El experimento consiste en contar el número X de veces que ocurre un evento particular por
unidad de medida (tiempo, área, volumen, etc.)
2. La probabilidad de que un evento ocurra por unidad de medida es la misma para todas las
unidades
3. El número de eventos que ocurren en una unidad de medida es independiente de los que
ocurren en otra unidad de medida
4. El número promedio o esperado de eventos por unidad de medida es constante y se denota
con la letra griega λ (letra griega landa)
En general, una variable aleatoria de Poisson se dene de la siguiente manera:
X = Número de ocurrencias de un evento por unidad de medida
e−λ λx
p(x) = Pr(X = x) = con X = 0, 1, 2, ... (3.10)
x!
donde λ es el número medio de eventos por unidad de medida.
Puede demostrarse que la media o valor esperado, la varianza√ y la desviación estándar de una
variable de Poisson son E(X) = λ, V (X) = σ 2 = λ y σ = λ respectivamente.
Para cada valor de λ se tiene un distribución de Poisson diferente, es decir, λ es el único parámetro
del modelo.
Ejemplo 3.8. Suponga que el número promedio de llamadas telefónicas que llegan a una central
telefónica es de 0, 5 llamadas por minuto. Hallar la probabilidad de que:
1. En un minuto no lleguen llamadas
2. En un minuto lleguen más de tres llamadas
3. En tres minutos lleguen menos de cinco llamadas
Solución
Primer punto
Variable aleatoria:
X = Número de llamadas que ingresan a la central cada minuto
Segundo punto
Se pide calcular Pr(X > 3). Como Pr(X > 3) y Pr(X ≤ 3) son eventos complementarios se cumple
la siguiente relación:
0, 50 0, 51 0, 52 0, 53
−0,5
Pr(X > 3) = 1 − e + + + = 1 − 0, 998 = 0, 002
0! 1! 2! 3!
87
Tercer punto
Variable aleatoria:
Y = Número de llamadas que ingresan a la central cada tres minutos
El número medio de llamadas cada tres minutos se calcula de la siguiente manera. Si en un minuto
ingresan 0, 5 llamadas, en tres minutos ingresarán
3 × 0, 5
λ1 = = 1, 5
1
Es decir, se espera que ingresen λ1 = 1, 5 llamadas cada tres minutos.
Luego:
1, 50 1, 51 1, 54
−1,5
Pr(Y < 5) = e + + ··· + = 0, 981
0! 1! 4!
aplicando reiteradamente el modelo de Poisson.
88
f (x) > 0
La gráca de la función de densidad de probabilidad Normal es simétrica y con forma de
campana. El valor de µ está en el centro de la distribución mientras que σ es una medida
de la dispersión de los valores de la variable X respecto de µ. En la Figura (3.8) muestra el
gráco típico la densidad de probabilidad Normal para una variable X con esta distribución
Si una variable aleatoria X tiene distribución Normal con media µ y varianza σ 2 se escribe X ∼
N (µ, σ 2 ).
Hemos dicho que para cada valor de µ y de σ 2 existe una distribución Normal diferente.
En la Figura (3.9) se muestran los grácos de algunas variables con distribución Normal para
distintas combinaciones de los valores de µ y σ 2
Note que a medida que aumenta la varianza de la distribución la curva se hace más aplanada.
Una vez que se han presentados las principales características de la distribución Normal, el siguiente
paso es determinar como se calculan probabilidades con esta densidad de probabilidad.
En principio, si una variable aleatoria X tiene distribución Normal y es necesario calcular Pr(a ≤
X ≤ b), deberíamos proceder de la siguiente manera:
b
Pr(a ≤ X ≤ b) = f (x)dx
a
89
Figura 3.9: Distribuciones normales para distintas medias y varianzas
1 2
f (z) = √ e−(z /2) (3.12)
2π
donde z es cualquier número real.
Entonces, para calcular la probabilidad de que Z tome un valor entre z0 y z1 , es decir, para
calcular Pr(z0 ≤ Z ≤ z1 ) debería realizarse el siguiente cálculo:
z1
1 2
Pr(z0 ≤ Z ≤ z1 ) = √ e−z /2 dz
z0 2π
Por fortuna este cálculo no es necesario porque existen tablas disponibles que proporcionan los
resultados de todas las integraciones en las que se pueda estar interesados.
En la Figura (3.10) prestamos una de estas tablas.
La tabla suministra los valores de:
z0
F (z0 ) = Pr(Z ≤ z0 ) = f (z)dz
−∞
90
Figura 3.10: Tabla de probabilidades. Distribución Normal Estándar
1. Se ubica en la primera columna de la tabla el valor más cercano a Z = 0, 54 que en este caso
es 0, 5
2. En la primera la de la tabla se ubica el valor de Z tal que 0, 5 + Z = 0, 54. En este caso es
z = 0, 04
3. En la intersección de la la rotulada con el valor 0, 5 y la columna rotulada con el valor 0, 04
se obtiene la probabilidad correspondiente que en este caso es 0, 7054. Es decir, F (0, 54) =
Pr(Z ≤ 0, 54) = 0, 7054
En la parte superior izquierda de la tabla se muestra el valor de F (0, 54) = Pr(Z ≤ 0, 54) = 0, 7054.
En la parte superior derecha se graca el área acumulada desde −∞ hasta z0 = 0, 54.
Veamos algunos ejemplos adicionales.
Ejemplo 3.9. Para la variable aleatoria Z con distribución Normal Estándar calcular las siguien-
tes probabilidades:
1. Pr(Z ≤ 2)
2. Pr(−2, 74 ≤ Z ≤ 1, 53)
3. Pr(Z ≥ 0, 5)
Solución
Primer punto
De acuerdo con la equivalencia de área y probabilidad para las variables aleatorias continuas
debemos calcular el área bajo la gráca de f (z) desde −∞ hasta z0 = 2.
El área buscada se muestra en la Figura (3.11).
¾Como se procede? En la primera columna de nuestra tabla se busca el valor z = 2. Como no hay
que agregar nada a este valor, la probabilidad buscada esta en la intersección de la la de z = 2 y
la columna 0, 00. Por lo tanto Pr(Z ≤ 2) = F (2) = 0, 9772.
91
Figura 3.11: Probabilidad de que Z sea menor o igual a 2
Segundo punto
El área o probabilidad buscada se muestra en la Figura (3.12).
Se pide calcular
Pr(−2, 74 ≤ Z ≤ 1, 53) = Pr(Z ≤ 1, 53) − Pr(Z ≤ −2, 74) = F (1, 53) − F (−2, 74)
Por lo tanto
Tercer punto
La probabilidad buscada se muestra en la Figura (3.13).
Como Pr(Z ≥ 0, 5) y Pr(Z ≤ 0, 5) son eventos complementarios podemos escribir
Pr(Z ≥ 0, 5) + Pr(Z ≤ 0, 5) = 1
Por lo tanto
Pr(Z ≥ 0, 5) = 1 − Pr(Z ≤ 0, 5)
Luego
92
Figura 3.13: Probabilidad de que Z sea mayor o igual a 0, 5
X −µ
Z= (3.13)
σ
donde µ y σ son la media y la desviación aleatoria de la variable aleatoria X .
Es decir, si a todos los valores de la variable aleatoria X se le resta su media µ y a ese resul-
tado se lo divide por su desviación estándar σ , los valores de X se transforman en sus valores Z
correspondientes.
A este proceso se lo denomina estandarización o tipicación de la variable aleatoria X . Este proceso
se muestra grácamente en la Figura (3.14).
93
Al realizar la diferencia X − µ obtenemos una nueva variable aleatoria normal con media
cero ( se cambia el origen)
Al dividir esta diferencia por σ se cambia la escala de medición obteniéndose la variable Z
que como sabemos tiene medios cero y varianza igual a uno
Solución
En primer lugar ese transforma X = 11 en su correspondiente valor Z .
Lo hacemos de la siguiente manera:
x−µ 11 − 10
z= = √ = 0, 4
σ 6, 25
Por lo tanto
Pr(X ≤ 11) = Pr(Z ≤ 0, 4)
Por lo tanto
Solución
Variable aleatoria:
Primer punto
Se pide calcular Pr(X ≤ 15.000)
Primero estandarizamos X = 15.000
15.000 − 18.000
z= = −1, 33
2.700
Por lo tanto:
Pr(Z ≤ 15.000) = Pr(Z ≤ −1, 33) = 0, 091
94
Segundo punto
Se quiere calcular Pr(X ≥ 21.000)
Como la tabla de probabilidades para la distribución Normal que utilizaremos sólo calcula Pr(x ≤
21.000) procederemos de la siguiente manera.
Por propiedad de eventos complementarios:
O sea
Por lo tanto
Existen otros modelos de distribución de probabilidad para variables aleatorias continuas que sirven
para la solución de múltiples problemas de Estadística aplicada a la Administración y Economía.
Algunos de estos modelos son la distribución t de Student, la distribución χ2 (Chi-cuadrado), la
distribución F de Fisher y otras más. Estos modelos de densidad de probabilidad serán analizadas
oportunamente.
La desviación
q estándar de g(X) se dene como la raíz cuadrada positiva de su varianza, es decir
σy = σy2 .
95
X p(x) = Pr(X = x)
4 1/12
5 1/12
6 1/4
7 1/4
8 1/6
9 1/6
Ejemplo 3.12. Suponga que en una estación de servicios el número X de automóviles que pasan
por una máquina lavadora automática los días viernes tiene la distribución de probabilidad que se
presenta en la Tabla (3.8)
Sea Y = 2X − 1 la variable aleatoria que representa el pago que recibe el operador de la máquina.
Encuentre la ganancia esperada del operario en ese período de tiempo en particular.
Solución
Consideremos la variable aleatoria
De acuerdo con denición de valor esperado para una función de una variable aleatoria tendremos:
n
X n
X
µy = g(xi )p(xi ) = (2xi − 1)p(xi )
i=1 i=1
Por lo tanto
1 1 1 1 1 1
µy = 7 +9 + 11 + 13 + 15 + 17 = 12, 67 dólares
12 12 4 4 6 6
Por lo tanto, el ingreso esperado del operador de la máquina de lavado será 12, 67 dólares para los
días viernes.
Hemos denido el valor esperado y la varianza de una función de una variable aleatoria X discreta.
Se pueden dar deniciones equivalentes en el caso de que X sea una variable aleatoria continua.
Denición 3.15. Sea X una variable aleatoria continua con densidad de probabilidad f (x) y sea
Y = g(X) una función de X . La media o valor esperado de Y se dene de la siguiente manera:
+∞
E(Y ) = µy = g(x)f (x)dx (3.16)
−∞
Además σy = V (Y ).
p
Ejemplo 3.13. Sea X una variable aleatoria continua con la siguiente densidad de probabilidad
(
x2
3 −1 < x < 2
f (x) =
0 en cualquier otro caso
96
Solución
La media o valor esperado de Y la calculamos de la siguiente manera:
+2 +2
x2
E(Y ) = µy = 3x dx = x3 dx
−1 3 −1
Por lo tanto
+2
1 4 1 4 15
E(Y ) = µy = x = 2 − (−1)4 = = 3, 75
4 −1 4 4
La varianza de Y se calcula de la siguiente manera:
+2 2
x2
15
V (Y ) = σy2 = 3x − dx
−1 4 3
Aplicando las reglas de la integral denida se obtiene
459
V (Y ) = = 5, 73
80
√
La desviación estándar de Y es σy = 5, 73 = 2, 39
Primera propiedad
Si k es una constante, entonces E(k) = k
Demostración
Aplicando la denición de valor esperado, de la denición de densidad de probabilidad y propie-
dades de la integral denida se tiene que
+∞ +∞
E(k) = kf (x)dx = k f (x)dx = k(1) = k
−∞ −∞
97
Segunda propiedad
Si k es una constante entonces E(kX) = kE(X)
Demostración
Si X es una variable aleatoria, se sabe que kX también lo es. Por lo tanto, por la denición del
valor esperado de función de una variable aleatoria y por propiedades de la integral denida se
tiene que
+∞ +∞
E(kX) = (kx)f (x)dx = k xf (x) = kE(X)
−∞ −∞
Tercera propiedad
Si X es una variable aleatoria y k una constante, entonces E(X + k) = E(X) + k
Demostración
Nuevamente, Si X es una variable aleatoria, X + k también es una variable aleatoria. Por lo tanto:
+∞ +∞ +∞
E(X + k) = (x + k)f (x)dx = xf (x)dx + kf (x)dx = E(X) + k
−∞ −∞ −∞
V (X) ≥ 0
V (k) = 0
V (kX) = k 2 V (X)
V (X + k) = V (X)
Primera propiedad
Si X es una variable aleatoria, entonces V (X) ≥ 0.
Demostración
Como sabemos, la denición de la varianza de una variable aleatoria continua es
+∞
V (X) = (x − µ)2 f (x)dx
−∞
Como el término (x − µ) siempre es mayor o igual a cero y que por denición f (x) ≥ 0, entonces
2
V (X) ≥ 0.
Segunda propiedad
Si k es una constante entonces V (k) = 0
Demostración
Hemos demostrado que E(k) = k, por lo tanto
+∞
V (k) = (k − k)f (x)dx = 0
−∞
98
Tercera propiedad
Si X es una variable aleatoria y k una constante, entonces V (kX) = k2 V (X)
Demostración
Sabemos que si X es una variable aleatoria y k una constante, entonces E(kX) = kE(X). Por lo
tanto:
+∞
2
V (kX) = [kx − E(kx)] f (x)dx
−∞
+∞ +∞
2 2
[kx − kE(X)] f (x)dx = [k {x − E(X)}] f (x)dx
−∞ −∞
+∞ +∞ h i
2 2
[k {x − E(X)}] f (x)dx = k 2 {x − E(x)} f (x)dx
−∞ −∞
+∞ h i +∞
2 2 2
k {x − E(x)} f (x)dx = k {x − E(X)} f (x)dx = k 2 E(X)
−∞ ∞
esperado.
Demostración
Demostramos la propiedad para una variable aleatoria continua. Sabemos que
+∞
σ2 = (x − µ)2 f (x)dx
−∞
Desarrollando el cuadrado
+∞
2
x2 − 2xµ + µ2 f (x)dx
σ =
−∞
Luego
+∞
2
σ = xp(x) − 2µ2 + µ2 = E(X 2 ) − µ2
−∞
Por lo tanto σ 2 = E(X 2 ) − µ2 o de forma equivalente E(X 2 ) − [E(X)]2 como se quería demostrar.
99
Denición 3.16. Sean X1 , X2 , ..., Xn un conjunto de variables aleatorias y k1 , k2 , ..., kn igual
cantidad de números reales, entonces, la variable aleatoria
n
(3.18)
X
Y = k1 X1 + k2 X2 + ... + kn Xn = ki Xi
i=1
Es decir
X1 + X2 + · · · + Xn
X̄ =
n
La variable aleatoria X̄ recibe el nombre de media muestral.
Como veremos más adelante, la variable aleatoria media muestral es muy utilizada en los proceso
inferenciales.
Enunciamos sin demostración la siguientes propiedades de una combinación lineal de variables
aleatorias.
Teorema 3.3. Sean X1 , X2 , ..., Xn variables aleatorias con medias o valores esperados µ1 , µ2 , ..., µn
y varianzas σ12 , σ22 , ..., σn2 respectivamente. Entonces:
E(α1 X1 + α2 X2 + ... + αn Xn ) = α1 µ1 + α2 µ2 + · · · + αn µn
Si las Xj son independientes, V ar(α1 X1 + α2 X2 + ... + αn Xn ) = α12 σ12 + α22 σ22 + · · · + αn2 σn2
Ejemplo 3.15. Una estación de servicios vende tres clases de combustibles, común, extra y súper
a 1,20; 1,35 y 1,50 dólares por litro. Representemos por X1 , X2 y X3 las cantidades de combustible
vendidos (en litros) cierto día. Supongamos que las venteas de los distintos tipos de los combustibles
son independientes. Además, se sabe que µ1 = 1.000, µ2 = 500 y µ3 = 300 y que además σ1 =
100, σ2 = 80 y σ3 = 50. Hallar el ingreso medio esperado diario por la venta de combustible.
Determinar la varianza y la desviación estándar del ingreso.
Solución
De acuerdo con los datos, la función ingreso se puede denir de la siguiente manera Y = 1, 20X1 +
1, 35X2 + 1, 50X2 .
Por lo tanto, el ingreso esperado diario por las ventas de combustible será:
E(Y ) = 1, 20µ1 + 1, 35µ2 + 1, 50µ3 = 1, 20 × 1.000 + 1, 35 × 500 + 1, 50 × 300 = $2.325
Por otro lado
V (Y ) = σy2 = (1, 20)2 × (1.000)2 + (1, 35)2 × (80)2 + (1, 50)2 × (50)2 = 31.689
√
por lo tanto, σy = 31.689 = 178 aproximadamente.
Par nalizar con esta unidad enunciamos, sin demostración el siguiente teorema cuyo resultado
es sumamente importante en la aplicación de las técnicas inferenciales que estudiaremos en los
capítulos siguientes.
100
Teorema 3.4. Si X1 , X2 , ..., Xn son variables aleatorias independientes cada una con distribución
Normal (posiblemente con medias y/o varianzas diferentes), entonces, cualquier combinación lineal
de estas variables también tendrá distribución Normal.
Ejemplo 3.16. Tenga en cuenta los resultados del Ejemplo (3.15). Suponga además que las Xj
tienen distribución Normal. Calcular la probabilidad de que el ingreso sea mayor a 2.500 dólares.
Solución
Los datos para la solución para este ejemplo son los siguientes: µy = 2.325 y σy = 178 dólares.
Por lo tanto
Pr(Y > 2.500) = 1 − Pr(Y ≤ 2.500)
2.500 − 2.325
z= = 0, 98
178
Luego
101