Está en la página 1de 8

DISTRIBUCIONES DE PROBABILIDAD

VARIABLE ALEATORIA
Se denominan variables aleatorias a aquellas variables asociadas a los resultados de un
experimento aleatoria, cuyo valor no puede determinarse sin la ejecucin del experimento. En el
estudio de las ciencias existen otras variables que en contraposicin a las aleatorias, toman valores
perfectamente determinados cuando se conocen las condiciones en que se ha de ejecutar el
experimento, a ellas se las denomina variables determinsticas. Por ejemplo es relativamente fcil
conocer la velocidad conque una piedra llega al suelo cuando se la deja caer desde una altura conocida,
ms all de alguna ligeras diferencias por errores de medicin.
Son variables aleatorias la suma de puntos obtenidas al arrojar dos dados, la distancia de un
impacto al centro de un blanco, la velocidad de una molcula de gas en un instante, el nmero de
partculas emitidas por un material radioactivo en un intervalo de tiempo, la altura de una planta al cabo
de una ao, el nmero de goles que realizar un equipo de ftbol en un partido, el nmero de lotera que
saldr sorteado, etc.
Estudiar una variable aleatoria es describir el conjunto de valores que ella tome. Este conjunto
se llama recorrido de la variable, y puede constar de un nmero infinito de resultados, o finito pero
muy grande. La enumeracin de los mismos an en el caso de poder hacerlo no describe a la variable.
Para una verdadera y til descripcin se debe dar el recorrido de la variable y asignar, mediante el uso
del clculo de probabilidades, medidas a cada valor, si se trata de una variable discreta o medidas a
intervalos adecuados, si ella es continua. Realizar estas asignaciones de probabilidad, es definir para la
variable una distribucin de probabilidades.
Consideremos el siguiente ejemplo: se arroja un dardo a un blanco circular de radio R. El
espacio muestral ms detallado es el conjunto de todos los puntos donde el dardo puede llegar, los del
crculo ms los que estn fuera del crculo. Asociado a este experimento se pueden definir distintas
variables aleatorias:
X1: "acierto o no en el blanco"
el recorrido de X1 es RX1 = {acierto; no acierto} o convencionalmente asignar 1 al acierto y 0 al no
acierto, luego RX1 = {1; 0}.
La medida de probabilidad asignada a 1 debe ser estimada y eso es privativo de la Teora
Estadstica. Por ejemplo se ejecuta un nmero muy grande de tiros y se cuenta cuantos de ellos aciertan
en el blanco, si la frecuencia relativa es p entonces P(X=1) = p, obviamente P(X=0) = (1 - p),
por tratarse de un experimento dicotmico (de dos resultados). El modelo expuesto se llama modelo de
Bernouille.

Otra variable posible es:


X2: "nmero de tiradas necesarias para acertar en el blanco"
Ahora el recorrido es RX2 = {1, 2, 3, ....... , }, siendo p la probabilidad de acierto, entonces:
P(X=1) = p
P(X=2) = (1-p).p
P(X=3) = (1-p)2.p
...............
P(X=x) = (1-p)x-1 . p

con x = 1, 2, ..... ,

El modelo desarrollado es el modelo geomtrico con parmetro p.


Sea X3: "nmero de aciertos en n repeticiones independientes"
El recorrido de esta nueva variable es: RX3 = {0, 1, 2, ...... , n} .

Representando con A acierto y con A el no acierto:



P(X=0) = P{ A A ... A } = (1-p)n



P(X=1) = P{(A A ... A ) (A A ... A ) (A A ... A) } = .p.(1-p)n-1
1
n

P(X=2) = P{(A A A ... A ) ......} = .p2.(1-p)n-2
2

n

n-x
P(X=x) = P{(A A A ... A ) .... } = .px.(1-p)
x

con x = 0, 1, ... , n

Este modelo se conoce como modelo binomial con parmetros n y p.


En general los modelos discretos estn definidos con una funcin como la de los ejemplos que
se llama funcin de cuanta y que simplificamos en la notacin indicndola como p(x)=P(X=x).
Un grfico de ella, es similar al grfico de frecuencias visto en la parte descriptiva, lo que no
debe extraar, ya que vimos que la frecuencia relativa es una estimacin de la probabilidad.

f(X)

X
x1

x2 .................................. xn

Es as que podemos considerar a la distribucin de frecuencias como la expresin emprica del


modelo terico o distribucin de probabilidad.
Igual que en las distribuciones de frecuencia, que eran caracterizadas por estadsticos de
posicin y dispersin, en las distribuciones de probabilidad se habla de 'parmetros' de posicin y
dispersin. Generalmente el parmetro de posicin ser la 'media terica' o esperanza:
= E(X) =

x . p(x)

x Rx

Notar que es una media de los valores de X ponderados por las respectivas probabilidades, cuya suma
es 1, por lo que no aparece en el divisor.
El parmetro de dispersin es la variancia:
2 = V(X) =

( x i - ) 2 . p ( xi )

x Rx

Tambin este es un promedio ponderado de los cuadrados de los desvos respecto a la


esperanza. Es usual utilizar el desvo estndar que es la raiz cuadrada de la variancia.
En los modelos de los ejemplos anteriores es posible demostrar que:
* Modelo de Bernouilli: E(X) = p
y
* Modelo Geomtrico: E(X) = 1/p y
* Modelo Binomial:
E(X) = n.p y

V(X) = p.(1-p)
V(X) = (1-p)/p2
V(X) = n.p.(1-p)

Veamos ahora otra variable aleatoria asociada al mismo experimento del tiro al blanco;
consideremos que todos los tiros aciertan (o que los yerros tienen probabilidad cero), y definimos la
variable:

X4: "distancia del impacto al centro del blanco"


El recorrido de la variable ser el intervalo real Rx = [0, R) donde R es el valor del radio del
blanco.
Se pueden hacer conjeturas tales como que los infinitos puntos del blanco tienen la misma
probabilidad de ser impactados por el dardo, pero esa probabilidad es practicamente nula. Esto nos
lleva a la conclusin de que los sucesos se pueden pensar como porciones del blanco, y que su
probabilidad es proporcional a la medida de su rea.
Si discretizamos la variable X en intervalos [0,1); [1,2);.....; [R-1,R), ellos definen coronas
circulares de reas crecientes desde el centro al borde de modo que a intervalos iguales de X, le
corresponden probabilidades distintas.
El problema de asignar medidas de probabilidad a los sucesos asociados a la variable X, es en
realidad un problema estadstico, pero en este caso en base a las suposiciones dadas, podemos arribar
un modelo terico. Esperamos que al realizar un cierto nmero de tiradas al blanco a cada corona le
correspondern frecuencias empricas de aciertos crecientes. Un histograma de esos datos sera como el
del grfico:
h

X
0

3 .............

La frecuencia de impactos con distancia al centro comprendida entre 2 y 3 unidades (2<X<3)


est representada por el rea rayada; como la frecuencia relativa es un estimador de la probabilidad del
suceso, el rea rayada representa la P(2 < X < 3).
Para ajustar un modelo terico, podemos ajustar un curva al polgono de frecuencias
superpuesto al histograma. Por simplicidad vamos a suponer que las frecuencias crecen linealmente de
modo que el modelo ajustado sera un trozo de recta con extremos en el origen y en el punto (R,k).

f(X)

X
0

Sabemos que la probabilidad de todo el recorrido de X es 1; por lo que siendo el rea bajo la
curva cual a 1, se puede calcular facilmente el parmetro k, haciendo 1/2 R k = 1 de donde k = 2/R.
La ecuacin de la funcin, que adems asigna probabilidad cero a los puntos exteriores al intervalo
[0,R) es:
(2/R2) . x

si 0 x < R

f(x) =
0

en otro caso

Esta funcin recibe el nombre de funcin de densidad de la variable X y es suficiente para


describir las probabilidades de sucesos asociados a ella.
Por ejemplo P(X r) es el rea del tringulo rayado en la figura, que tiene altura f(r)=(2/R2).r de modo
que P(X r) = 1/2 . r . 2/R2 . r = r2/R2.
En general las variables aleatorias continuas tienen distribuciones de probabilidad definidas
mediante funciones de densidad, que tienen la propiedad de ser funciones no negativas y con rea bajo
la curva igual a 1.
La esperanza y la variancia para esta funciones se calcula de manera similar al clculo
respectivo en el caso discreto, pero reemplazando la sumatoria por un integral definida:
+

= E(X) =
+

= V(X) =
2

x . f(x) . dx

( x ) 2 . f(x) . dx

Existen muchos modelos tericos de probabilidad, para variables continuas, pero uno en
particular tiene aplicacin en muchsimos casos. Fue desarrollado por Moivre y luego por Gauss, se lo
conoce con el nombre de modelo normal o modelo gausseano. La funcin de densidad tiene forma de
5

campana con probabilidades altas alrededor del centro de la distribucin, luego esas probabilidades
decrecen rpida y simtricamente hacia ambos lados hasta alcanzar puntos de inflexin a partir de los
cuales la curva es cncava hacia arriba y el decrecimiento es cada vez ms lento pero extendido hasta y + .

f(X)

La esperanza y la variancia de este modelo son estimadas en una muestra de n datos a travs de
la media aritmtica y de la variancia usual, pero en esta ltima el divisor es n-1 en lugar de n, pus de
esta manera la estimacin tiene propiedades interesantes.

= x =

1
n

i=1

2 = S2 =

1
n -1

(x

- x )2

i=1

Tambin es posible demostrar que la variable Z deducida a partir de la variable normal X,


mediante la transformacin:

Z =

X - x
x

es una variable normal con media z = 0 y variancia z2 = 1 , y de all el desvo estndar es tambin z
= 1.
La distribucin de Z est representada por una curva normal centrada en el origen y sirve de
prototipo para los clculos de probabilidades de cualquier modelo normal.

0.60

0.45

0.30

0.15

0.00
-3

-2

-1

Las probabilidades de sucesos de la forma P(Z zo) = (zo) estn tabulados para distintos
valores de zo pertenecientes al recorrido de Z.
Una particularidad de los modelos normales es que tomando un intervalo de un desvo a la
izquierda y a derecha de la media, el porcentaje de poblacin encerrado es de 68,27%, tomando dos
desvos el porcentaje asciende a 95,4% y cuando se ampla a tres desvos tenemos practicamente a toda
la poblacin, 99,73%.
Para calcular la probabilidad de una variable normal X con media x y desvo x sea menor o
igual que un valor xo se procede de la siguiente manera:

X - x
x - x
P(X x 0 ) = P
0
x
x

= P(Z z 0 )

este ltimo, valor que es obtenido de la tabla correspondiente.


Ejemplo: un colectivo llega en promedio a la escuela a la hora 7 con 54 minutos. Si las horas de llegada
es una variable normal con 5 minutos de desvo, cuntas veces en el mes de 22 das de clases los
alumnos que viajan en el colectivo llegan tarde a la escuela, siendo las 8 la hora de entrada ?.
0.60

0.45

0.30

0.15

//
0.00
-3

-2

-1

39

44

49

54

59

64

69

P( X > 60 ) = 1 - P( X 60 ) = 1 - P Z

60 - 54
= 1 - P( Z 1,2 ) = 1 - 0,8849 = 0,1151 o 11,5%
5

entonces el nmero de das es: 0,115 . 22 = 2,5 ; es decir, que entre 2 y 3 das en el mes los alumnos
llegarn tarde a clases.
Otra pregunta que podramos planteranos es entre que horas (simtricas respecto a la media) se
dan el 90% de los arribos del colectivo ?.

90%

//
-3

-2

-1

z1

z2

90%
3

39

44

49

x1

54

59

64

69

x2

Por la tabla de la normal estndar sabemos que z2 = 1,64 y por simetra z1 = -1,64. La probabilidad
acumulada desde - hasta z2 es 0,95, entonces:

P( X x2 ) = 0,95 que equivale a P Z

x 2 - 54
= 0,95 entonces,
5

x 2 - 54
= 1,64 luego x2 = 1,64 . 5 + 54 = 62,2 minutos = 62 min 12 seg
5

similarmente x1 = -1,64 . 5 + 54 = 45,8 minutos = 45 min 48 seg.


El intervalo buscado ser: el 90% de las veces el colectivo llega entre las 7 horas 45 min 48 seg y las 8
horas 2 minutos 12 seg.

También podría gustarte