Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Distribuciones de Probabilidad
Distribuciones de Probabilidad
VARIABLE ALEATORIA
Son variables aleatorias la suma de puntos obtenidas al arrojar dos dados, la distancia
de un impacto al centro de un blanco, la velocidad de una molécula de gas en un instante, el
número de partículas emitidas por un material radioactivo en un intervalo de tiempo, la altura
de una planta al cabo de un año, el número de goles que realizará un equipo de fútbol en un
partido, el número de lotería que saldrá sorteado, etc.
Estudiar una variable aleatoria es describir el conjunto de valores que ella tome. Este
conjunto se llama recorrido de la variable, y puede constar de un número infinito de
resultados, o finito pero muy grande. La enumeración de los mismos aún en el caso de poder
hacerlo no describe a la variable. Para una verdadera y útil descripción se debe dar el recorrido
de la variable y asignar, mediante el uso del cálculo de probabilidades, medidas a cada valor,
si se trata de una variable discreta o medidas a intervalos adecuados, si ella es continua.
Realizar estas asignaciones de probabilidad, es definir para la variable una distribución de
probabilidades.
1
P(X=0) = (1 - p), por tratarse de un experimento dicotómico (de dos resultados). El modelo
expuesto se llama modelo de Bernouille.
P(X=1) = p
P(X=2) = (1-p).p
P(X=3) = (1-p)2.p
...............
Representando con A acierto y con A el no acierto:
P(X=0) = P{ A A ... A } = (1-p)n
n
P(X=1) = P{(A A ... A ) (A A ... A ) (A A ... A) } = .p.(1-p)n-1
1
n
P(X=2) = P{(A A A ... A ) ......} = .p2.(1-p)n-2
2
n
P(X=x) = P{(A A A ... A ) .... } = .px.(1-p)n-x con x = 0, 1, ... , n
x
En general los modelos discretos están definidos con una función como la de los
ejemplos que se llama función de cuantía y que simplificamos en la notación indicándola
como p(x)=P(X=x).
2
probabilidad.
f(X)
X
x1 x2 .................................. xn
Igual que en las distribuciones de frecuencia, que eran caracterizadas por estadísticos
de posición y dispersión, en las distribuciones de probabilidad se habla de 'parámetros' de
posición y dispersión. Generalmente el parámetro de posición será la 'media teórica' o
esperanza:
= E(X) =
x Rx
x . p(x)
Notar que es una media de los valores de X ponderados por las respectivas probabilidades,
cuya suma es 1, por lo que no aparece en el divisor.
2
2
= V(X) = (xi - ) . p( x i )
x Rx
3
Veamos ahora otra variable aleatoria asociada al mismo experimento del tiro al blanco;
consideremos que todos los tiros aciertan (o que los yerros tienen probabilidad cero), y
definimos la variable:
X4: "distancia del impacto al centro del blanco"
El recorrido de la variable será el intervalo real Rx = [0, R) donde R es el valor del radio
del blanco.
Se pueden hacer conjeturas tales como que los infinitos puntos del blanco tienen la
misma probabilidad de ser impactados por el dardo, pero esa probabilidad es practicamente
nula. Esto nos lleva a la conclusión de que los sucesos se pueden pensar como porciones del
blanco, y que su probabilidad es proporcional a la medida de su área.
X
0 1 2 3 ............…. R
4
linealmente de modo que el modelo ajustado sería un trozo de recta con extremos en el origen
y en el punto (R,k).
f(X)
X
0 r R
(2/R2) . x si 0 x < R
f(x) =
0 en otro caso
Por ejemplo P(X r) es el área del triángulo rayado en la figura, que tiene altura f(r)=(2/R2).r
de modo que P(X r) = 1/2 . r . 2/R2 . r = r2/R2.
+
= E(X) =
-
x . f(x) . dx
+
2
= V(X) = ( x )2 . f(x) . dx
-
Existen muchos modelos teóricos de probabilidad, para variables continuas, pero uno en
5
particular tiene aplicación en muchísimos casos. Fue desarrollado por Moivre y luego por
Gauss, se lo conoce con el nombre de modelo normal o modelo gausseano. La función de
densidad tiene forma de campana con probabilidades altas alrededor del centro de la
distribución, luego esas probabilidades decrecen rápida y simétricamente hacia ambos lados
hasta alcanzar puntos de inflexión a partir de los cuales la curva es cóncava hacia arriba y el
decrecimiento es cada vez más lento pero extendido hasta - y + .
f(X)
X
1 2
n n
1 1
ˆ = x =
n
i=1
xi y 2 2
ˆ = S =
n -1
i=1
(x i - x )
2
X - x
Z
x
es una variable normal con media z = 0 y variancia z2 = 1 , y de allí el desvío estándar es
también z = 1.
6
0.60
0.45
0.30
0.15
0.00
-3 -2 -1 0 1 2 3
Las probabilidades de sucesos de la forma P(Z zo) = (zo) están tabulados para
distintos valores de zo pertenecientes al recorrido de Z.
Para calcular la probabilidad de una variable normal X con media x y desvío x sea
menor o igual que un valor xo se procede de la siguiente manera:
X- x x 0 - x
P(X x 0 ) P P(Z z0 )
x x
Ejemplo: un colectivo llega en promedio a la escuela a la hora 7 con 54 minutos. Si las horas
de llegada es una variable normal con 5 minutos de desvío, cuántas veces en el mes de 22
días de clases los alumnos que viajan en el colectivo llegan tarde a la escuela, siendo las 8 la
hora de entrada ?.
0.60
0.45
0.30
0.15
//
0.00
-3 -2 -1 0 1 2 3 39 44 49 54 59 64 69
7
60-54
P( X > 60 ) = 1 - P( X 60 ) = 1 - P Z = 1 - P( Z 1,2 )
5
= 1 - 0,8849 = 0,1151 o 1,5%
entonces el número de días es: 0,115 . 22 = 2,5 ; es decir, que entre 2 y 3 días en el mes los
alumnos llegarán tarde a clases.
Otra pregunta que podríamos plantearnos es entre qué horas (simétricas respecto a
la media) se dan el 90% de los arribos del colectivo ?.
90%
// 90%
z1 z2 x1 x2
Por la tabla de la normal estándar sabemos que z2 = 1,64 y por simetría z1 = -1,64. La
probabilidad acumulada desde - hasta z2 es 0,95, entonces:
x 2 -54
P( X x2 ) = 0,95 que equivale a P Z = 0,95 entonces,
5
x 2 -54
= 1,64 luego x2 = 1,64 . 5 + 54 = 62,2 minutos = 62 min 12 seg
5