Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Variable Aleatoria
Nuestro objetivo, en este tema, es el de aprender a diseñar una función denominada Variable
Aleatoria (de aquí en más v.a.) que servirá como herramienta para la construcción de Modelos
de distribuciones probabilísticas a partir de los conceptos tratados en “Introducción al cálculo de
Probabilidades”.
Las variables aleatorias discretas, como cualquier variable discreta, surge del conteo
del atributo de interés en cada elemento del espacio muestral
1
Diario Clarín, 31 de mayo de 2001.
1
Variable Aleatoria
Como problema ejemplo consideraremos los informes semanales de la balanza comercial del
año 2009 de Argentina.
Si se quiere conocer la cantidad de semanas con superávit que hay en un período
determinado en la Argentina, primero se tiene que contar con los informes del Instituto Nacional
de Estadísticas y Censos (INDEC) de dicho período de tiempo, luego seleccionar una muestra
aleatoria, en nuestro caso será de tamaño 3 (3 resúmenes semanales de la balanza comercial)
y luego observar cada una de las semanas y anotar si el saldo arrojó o no superávit. Los datos
con que contamos es que en el 2009 el 20% de las semanas arrojó superávit con esa
información confeccionamos la siguiente distribución de frecuencias:
Balanza comercial f% fr
superávit 20 0,20
No superávit 80 0,80
n= 100 1,00
Aclaración: Completamos dos columnas porque contamos con las f% y nos interesan las fr que
son la medida de probabilidad de cada suceso.
E = {(S, S, S); (S, S, noS); (S, noS, S); (S, noS, noS); (noS, S, S); (noS, S, noS); (noS,
noS, S); (noS, noS, noS)}
Como los elementos del espacio muestral no son numéricos y es más sencillo trabajar con
datos numéricos, se hace corresponder mediante una función, a cada elemento del espacio
muestral un número. En general, como lo adelantara, se elige como función la que “cuenta la
cantidad de elementos que poseen la característica en estudio dentro de cada uno de los
resultados posibles del experimento aleatorio”.
2
Variable Aleatoria
A nosotros lo que nos interesa contar es la cantidad de semanas con superávit por lo cual
definimos la función X que a cada terna ordenada de valores Wi2 le hace corresponder la
cantidad de semanas con superávit que posee dicha terna. Si nos toca en la selección la terna
(superávit, superávit, superávit) en ella contamos 3 semanas con superávit, en la siguiente tabla
y diagrama resumimos todas las posibilidades que podemos encontrar y el resultado del conteo
realizado.
La v.a. X: “cuenta la cantidad de semanas con superávit dentro de cada uno de los resultados
posibles del espacio muestral”.
Llamamos R al conjunto de los números reales y R(x) al subconjunto de los números reales
que son imagen de algún elemento del espacio muestral (sólo se marcan los números que
están en la relación) y se lo denomina conjunto recorrido de X.
En nuestro caso el recorrido de la variable aleatoria es:
R(x) = {0, 1, 2, 3 }
Es mucho más fácil trabajar con el conjunto R(x) que con el E, a partir de ahora R(x)
reemplazará a E por lo tanto necesitamos conocer la probabilidad de cada elemento ri de R(x).
2
Como a la función se la denomina X a los valores del espacio muestral lo simbolizamos con otra letra, en este
caso wi y a los números asignados por la función (su imagen) con la letra ri.
3
Variable Aleatoria
Como la probabilidad del E es 1 (Axioma 2) la suma de las probabilidades debe ser igual a 1.
No olvidar que siempre hay que verificarlo.
3
recordar que las fr se estabilizan en condiciones “normales” y se las puede utilizar para aproximar las
probabilidades buscadas (teoría frecuencial de probabilidad).
4
Variable Aleatoria
Ri 0 1 2 3
P(ri) 0,512 0,384 0,096 0,008
P(x ≤ r i ) 0,512 0,896 0,992 1,000
Que, como pueden apreciar, se parece a las primeras tablas de frecuencias que usábamos en
Estadística descriptiva pero más reducida porque sólo se calculan la fr y su acumulada F r donde
Fx = P(x ≤ ri) a la que se denomina función de distribución de probabilidades o probabilidad
acumulativa. Y a P(ri) o simplemente P(x) se la denomina función de probabilidad.
Lo más importante es que las tablas de distribución de frecuencias anteriores eran la síntesis
de algo que ya había ocurrido y la de ahora es lo que se espera que ocurra si se realiza el
experimento (muchas veces, como en este caso, basándonos en la estadística anterior).
Como las probabilidades volcadas en la tabla son de toda la población teórica debe cumplir
con los axiomas, es decir no pueden ser negativas y deben sumar 1 por lo tanto las
probabilidades asignadas deben verificar:
Propiedades:
1) P(ri) ≥ 0
2) ∑ P(ri) = 1
G.1
5
Variable Aleatoria
ri P(x ≤ ri )
0 0,512
1 0,896
2 0,992
3 1,000
G.2
Tanto la tabla de distribución de probabilidades y los gráficos son los que teóricamente se
espera se den si uno realizara el experimento, por eso es el modelo de éste.
MEDIDAS:
Las medidas que se determinan para la v. a. discreta X= ri son la esperanza (promedio
teórico) y la varianza, de ésta última se calcula el desvío estándar.
1- Esperanza matemática
Como lo acabamos de ver, al promedio se denomina esperanza matemática o valor esperado
y se simboliza E(x) = μ (se lee mu).
Aclaración: La esperanza μ es un parámetro (una medida poblacional) y el X es un estadístico
(una medida muestral, depende de la muestra que nos tocó en la selección).
Como es un promedio sumamos todos los datos multiplicados por su frecuencia y dividimos
por el total, desarrollando la sumatoria y distribuyendo n en cada término se tiene:
6
Variable Aleatoria
xi. fi x1 .f1 x 2 . f 2 x 3 . f 3 x .f fi
E(x)= ∑ n
=
n
+
n
+
n
+ ... + n n =
n
∑ xi.
n
= ∑ x i .f r = reemplazando fi/n
por fr
E(x) = ∑ x. P(x)
Aclaración:
Para el caso de las variables aleatorias discretas podemos hacer uso de la calculadora para
determinar las medidas, se cargan los valores de la variable seguido de las probabilidades (fr)
(con ; o multiplicando según el modelo de la calculadora). Ahora el total de datos n será 1 y si
seleccionamos la tecla X nos brinda la esperanza y si necesitamos la varianza elegimos la
tecla del desvío poblacional xσn, lo elevamos al cuadrado y tendremos la varianza esperada σ2
(la poblacional).
2- Mediana
Para determinar el valor de la mediana utilizamos la propiedad de ésta deja el 50% de los datos
por debajo de ella y al otro 50% por encima de su valor.
P( x < Me) = P( x> Me ) = 0,50 entonces hallamos qué valor de los ri cumplen esa condición,
ese valor será la mediana.
3- Varianza
La varianza es la poblacional, σ2 (se lee sigma cuadrado), y se calcula sin el ajuste de dividir
por n –1.
La fórmula para el cálculo es:
V(x) = E(x 2 ) − [E(x)]2
¿Cómo se obtiene?
En la fórmula de varianza vista se reemplaza x por E(x) y a f r por P(x)
V(x) = ∑ (xi − x) 2 . fi
= ∑ (xi − x) 2 .
fi
= ∑ (x − E(x)) 2 . P(x)
n n
Se divide por n
7
Variable Aleatoria
Queda
V(x) = ∑ (x − E(x)) .P(x) = ∑ [x .P(x) − 2.x.E(x).P(x) + (E(x))
2 2 2
.P(x)] =
.......... = ∑ x .P(x) − 2.E(x).∑ x.P(x) + (E(x)) .∑ P(x)
2 2
Trabajando algebraicamente
V(x) = ∑ x .P(x) − 2.E(x).E(x) + (E(x)) .1
2 2
Calcularemos las medidas esperadas del ejemplo de los informes semanales de la balanza
comercial de Argentina del año 2009.
Haremos los cálculos a partir de los datos reales de la tabla de los resúmenes y, como dijimos
antes, pasamos a la tabla de distribución de probabilidades.
ri 0 1 2 3
P(ri) 0,512 0,384 0,096 0,008
P(x ≤ ri ) 0,512 0,896 0,992 1,000
Esperanza
E(x) = 0 . 0,512 + 1 . 0,384 + 2 . 0,096 + 3 . 0,008 = 0,6 semanas
Interpretación: En promedio se espera encontrar 0,6 semanas de las tres seleccionadas con
superávit comercial.
Mediana
Me = 0 semanas pues la P( x ≤ 0) =0,512 es decir contiene a 0,50
Interpretación: En la mitad de las muestras de tamaño 3 a lo sumo se encontrará 0 semanas
con superávit.
Varianza
V(x) = σ 2 = E(x 2 ) − [E(x)]2
8
Variable Aleatoria
Desviación estándar
Suele parecerles algo complicado pero no lo es, se puede simplificar todo lo realizado si
armamos un modelo para los experimentos aleatorios. Es el próximo paso, la semana que
viene.
Nosotros no veremos todos sino que vamos a estudiar algunos modelos especiales de las
variables aleatorias discretas y algunos de las continuas. De los primeros los modelos son:
experimento Bernoulli, distribución Binomial, distribución Hipergeométrica y distribución de
Poisson.
Cuando una variable aleatoria es continua no se pueden listar todos los valores que toma,
pero sí considerar intervalos de valores de su recorrido; por tal motivo, en este caso sólo es
posible calcular probabilidades para intervalos.
9
Variable Aleatoria
La función de probabilidad de una variable aleatoria continua f(x) permite calcular las
probabilidades para cualquier intervalo del recorrido de dicha variable, esta función se
denomina función de densidad de probabilidad4.
Propiedades
Como la función f(x) -función de densidad de probabilidad- de una variable aleatoria continua
permite calcular probabilidades, éstas deben cumplir con los axiomas, es decir que se deben
cumplir con:
1. f(x) ≥ 0 ∀x∈R (se lee para todo x perteneciente al conjunto de los números
reales)
f(x) no puede ser negativa para todos los números reales.
+∞
2. ∫
−∞
f(x) d(x) = 1
G. 3 G.4
Cuando a coincida con b el rectángulo (o figura geométrica determinada entre a y b con la
curva de f(x)) tendrá base igual a 0 pues es un segmento por lo cual el área también será 05.
4
la función de densidad de probabilidad f(x) no es una probabilidad, pero a través de ella podemos calcular la
probabilidad de que la variable aleatoria se encuentre entre dos valores a y b.
5
Área rectángulo = base . altura = 0 . k = 0
10
Variable Aleatoria
Aclaración: Las funciones de densidad que usaremos en los ejemplos no son muy complicadas
para integrar, y tienen la opción de calcular las áreas que representan las probabilidades
geométricamente (sin integrar).
El cálculo de las medidas en una v.a. continua es similar al de las v.a. discretas pero en lugar
de ser la sumatoria de una expresión es la integral de esa expresión porque es una sumatoria
de infinitos términos.
1- Esperanza matemática
2- Mediana
Para determinar el valor de la mediana utilizamos la propiedad de ésta, es decir la que divide
al conjunto de datos en dos partes iguales (deja el 50% de los datos por debajo de ella y al
otro 50% por encima de su valor.
3- Varianza
La varianza es:
11
Variable Aleatoria
( ∫ x . f(x) d(x) )
2
V(x) = ∫ x 2 . f(x) d(x) −
cumple la primera propiedad, por lo tanto, para que el gráfico de f(x) corresponda al de una
función de densidad de probabilidad de una v. a. continua el área que encierra la curva entre las
rectas x = - 1, x = 2 y el eje de las x debe ser igual a 1.
b) Sombrear en el gráfico P(-1,5 < x < 1) y comparar con P(-1< x < 1).
Como entre –1,5 y –1 el área es igual a 0 vemos que ambas probabilidades tienen el mismo
resultado es decir que P(-1,5 < x < 1 ) = P(-1 < x < 1 )
Les toca hacer el ejercicio 20.
21- El tiempo en horas requerido por los empleados de una empresa para realizar una
determinada tarea es una variable aleatoria continua con función de densidad dada por:
12
Variable Aleatoria
1
x si 0 ≤ x ≤ 2
f(x) = 2
0 para otro x
a) Comprobar que el área definida por la función para el recorrido de la variable es 1.
Siempre les resulta más sencillo si representan gráficamente la f(x), entre 0 y 2 la f(x)
es una recta que pasa por el origen de coordenadas pues su ecuación es y = 1/2 x.
f(x)
1) De la fórmula de f(x) vemos que se cumple
2
la propiedad 1, ya que f(x) ≥ 0 para todo los
1
números reales.
0 1 2 x
2) Calculemos el área por los dos métodos
para que vean los procedimientos que pueden
seguir.
Geométricamente:
Los intervalos de − ∞ a 0 y de 2 a +∞ no aportan área ya que la f(x) es 0 por lo cual las
áreas en los extremos derecho e izquierdo de la distribución son 0, en cambio entre 0 y 2
se forma un triángulo por lo cual la probabilidad de que la v.a. asuma un valor
comprendido entre 0 y 2 es el área de dicho triángulo por lo cual escribimos:
Analíticamente:
Ustedes calculan por el método que les sea más sencillo, no deben hacer los dos (el
geométrico y el analítico).
+∞ 0 2 1 +∞
∫ −∞
f(x) d(x) = ∫ −∞
0.d(x) + ∫ 0 2
.x d(x) + ∫ 0.d(x) =
2
2
1 x2 1 1
= 0+ . + 0 = .(22 − 0 2 ) = .4 = 1
2 2 0 4 4
Por verificar f(x) las propiedades 1 y 2 es una función de densidad de probabilidad y
podemos utilizar la propiedad 3 para calcular probabilidades.
13
Variable Aleatoria
Geométricamente.
14
Variable Aleatoria
Cálculos auxiliares:
y = 1/2 x = ½*0,5= 0,25
y = 1/2 x = ½*1,5= 0,75
área ∆2 =1,5 . 0,75 = 0,5625
2
área ∆1 = 0,5 . 0,25 = 0,0625
2
Analíticamente:
1 1,5 1 x 2 1,5 1
P(0,5< x < 1,5) = ∫ .xd(x) = . = .(1,52 − 0,52 ) =
0,5 2 2 2 0,5 4
1
= (2, 25 − 0, 25) = 0,50
4
Rta: La probabilidad de que un empleado tarde entre media y una hora y media en
realizar la tarea es 0,50.
P(x>2) = 0
∞
P( x>2) = ∫ 2
0. d(x) = 0
0 si -∞ <x < t
t 1 2
F(x) = P( x ≤ t) = ∫ −∞
f(x) d(x)=
4
t 0<x <t
1 si t ≥ 2
Cálculo Auxiliar
Si 0 < x < t
t 1 1 x2 t 1 2 2 1
F(x) = P( x ≤ t) = ∫0 2 .xd(x) = .
2 2 0
=
4
.(t − 0 ) = .t 2
4
15
Variable Aleatoria
E(x) = 1,33
Me 1
0 Me 1
P(x < Me) =
−∞ ∫ −∞
f(x) d(x) = ∫ 0. d(x)+ ∫
0 2
.x d(x) = 0+F(Me) = .Me 2 = 0,50
4
⇒ Me = 0,50 . 4 ⇒ Me = + 2 ≅ 1, 4142
2
Interpretación: La mitad de los empleados tardan como máximo 1,4142 horas en realizar la
tarea.
Ya pueden hacer todos los ejercicios de la práctica 6, mucha suerte y envien dudas al Foro.
El sábado comenzamos a tratar las variables aleatorias especiales, se hace más sencillo pues
se conocen las fórmulas de las funciones de probabilidad o la función de distribución de
probabilidad y varias están tabuladas (se han calculado probabilidades para valores de x y
volcado en tablas de distribuciones de probabilidades. Deben adquirir las tablas de las
distribuciones Binomial, Normal, t de Student y Chi cuadrado (en la fotocopiadora del centro de
estudiantes están a la venta) también las pueden bajar de INTERNET. Miren el cronograma de
actividades para organizarse y no retrasarse mucho. Recuerden que el sábado 4 de junio hay
un encuentro presencial, es el sábado anterior al de la evaluación “Segunda Parte del Primer
evaluación parcial.
16