Está en la página 1de 32

MODELOS ESTOCASTICOS

IVAN DERPICH C.

1
REPASO

VARIABLES ALEATORIAS Y

DISTRIBUCIONES DE PROBABILIDAD

2
4.1. Variables Aleatorias: Ideas Bsicas

La mayora de las aplicaciones que los administradores


hacen de la teora de probabilidades envuelve variables
aleatorias y resultados numricos.

Ejemplo:

La sobreventa, que es el nmero de personas que


teniendo reservas de un vuelo, finalmente no lo toman.

Este nmero es aleatorio y vara de un vuelo a otro, y


da por da, y de una aerolnea a otra.

Ciertamente esta variable es una variable numrica, por


lo cual tiene sentido hablar del nmero promedio de
sobreventa.

El concepto de variable aleatoria es la idea central en el


entendimiento de resultados numricos aleatorios.

Informalmente una variable aleatoria es un resultado


cuantitativo obtenido de un experimento aleatorio.

Por ejemplo, considere el experimento de seleccionar a


un administrador aleatoriamente desde un pool de
administradores en una empresa.

3
Definamos como Y el nmero de aos de escolaridad
que ha tenido el administrador.

Este resultado ser numrico, tal como 12 o 16, no una


categora como privado o publico. Luego, Y est
sujeto a variacin aleatoria.

Si el experimento se repite haciendo una nueva


seleccin, el resultado ser distinto.

Estas dos caractersticas resultados numricos y


sujetos a aleatoriedad- son aspectos claves de la
definicin de una variable aleatoria.

Para especificar una variable aleatoria, necesitamos


conocer sus posibles valores y sus probabilidades.

Para los aos de escolaridad, por ejemplo, los valores


pueden ser 0,1,2,hasta un mximo, quizs de 20.

Las probabilidades pueden ser obtenidas de los registros


de personal de la empresa.

Por ejemplo si 284 de 500 administradores han


completado exactamente 4 aos de universidad
(despus de 12 aos de bsica y media) la probabilidad
de que Y=16 debera ser 284/500=0,568.

Las probabilidades para otros valores se pueden obtener


de manera similar.

4
Definicin 4.1 Variable aleatoria: (Definicin
informal)

Una variable aleatoria es cualquier resultado cuantitativo


de un experimento que est sujeto a variabilidad
aleatoria. Se determina fijando los posibles valores y la
probabilidad asociada con cada valor.

La probabilidad asociada con cada valor de una variable


aleatoria, se obtiene sumando las probabilidades de
todos los resultados que dan ese valor.

Suponga que una planta produce telfonos celulares en


dos lneas de produccin. Se seleccionan aleatoriamente
3 telfonos al azar para ser inspeccionados
destructivamente.

Llamemos H y T las lneas de produccin. Encuentre la


distribucin de probabilidades de Y, el nmero de
telfonos muestreados producidos en la lnea H. Se
tienen 8 resultados posibles.

Resultado HHH HHT HTH THH HTT THT TTH TTT


Probabilidad 1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8
Valor de Y 3 2 2 2 1 1 1 0

Luego, por ejemplo para Y=2 se tiene:

Pr{Y = 2} = Pr{HHT } + Pr{HTH } + Pr{THH } =


1 1 1 3
+ + =
8 8 8 8

Se acostumbra nombrar a las variables aleatorias con


letras maysculas del final de alfabeto, as por ejemplo

5
Y = nmero de suscriptores al diario la tercera en una
muestra de 200 personas.

Los valores que toma una variable aleatoria se denotan


habitualmente por letras minsculas. As podramos
decir que y vale 0, 1 2.

La diferencia entre Y, la variable aleatoria e y uno de sus


valores particulares es la diferencia entre un proceso y
un resultado particular.

Ejemplo 4.1: Suponga que se toma una muestra aleatoria


de dos personas de una gran poblacin que se compone
de un 30% de subscriptores a una revista de negocios y
70% de no subscriptores.

a) Lista de posibles resultados


b) Asignar posibilidades
c) Defina la variable cuantitativa Y como el nmero
de subscriptores en la muestra. Especifique los
valores posibles que la variable aleatoria puede
asumir y determine cada uno de los valores de
probabilidad.

Solucin

a) Si definimos como S a un subscriptor y N a un no


subscriptor, entonces todos los resultados posibles
del experimento de muestreo son :

{ (S,S), (S,N), (N,S), (N,N) }

6
b) De la definicin del problema, sabemos que
P(S)=0,3 y P(N)=0,7. Bajo el supuesto que los
resultados de las dos personas son independientes,
se tiene se tienen las siguientes probabilidades:

P(S,S)= (0,3)2 =0,09


P(S,N)= (0,3)*(0,7)=0,21
P(N,S)= (0,7)*(0,3)=0,21
P(N,N)=(0,7)2 =0,49
1,00

c) Si la variable aleatoria Y es el nmero de


subscriptores en una muestra de dos personas de la
poblacin de inters, entonces los posibles valores de Y
son 0, 1 y 2. Las probabilidades asociadas con estos
valores se pueden determinar de las probabilidades de
los resultados del experimentos correspondientes a cada
valor numrico de la variable Y.

Resultado del Probabilidad y P(y)


experimento
(N,N) 0,49 0 0,49
(N,S) 0,21 1 0,42
(S,N) 0,21 1
(S,S) 0,09 2 0,09

7
V. A Discretas

Las variables aleatorias que hemos considerados hasta


ahora son discretas, sus posibles valores han sido
distintivos y separados, como 0 o 1 o 2 o 3.

V. A. Continuas

Otras variables aleatorias que se consideran


habitualmente son las continuas: sus posibles valores
forman un intervalo o rango (o continuum) Por ejemplo,
los retornos anuales por peso invertido en una accin
comn podran estar en un rango desde 0 hasta un valor
muy grande.

En la practica, virtualmente todas las variables aleatorias


asumen un conjunto de valores discretos; el retorno por
peso de una inversin de un milln de pesos en una
accin comn, podra ser 1,06219424 o 1,06219425.

Pero cuando hay muchos valores posibles para una


variable aleatorias a veces matemticamente til tratarla
como continua.

De hecho, una de las importantes especificaciones de


probabilidades tericas, es -la bien formada distribucin
normal- que formalmente solo se aplica a variables
continuas. En este capitulo solo se definirn algn
lenguaje y notacin para variables aleatorias continuas.

8
9
4.2. Distribuciones de Probabilidad: Variables
aleatorias discretas

Distribucin de probabilidades

La distribucin de probabilidades PY(y) de una variable


aleatoria discreta Y asigna una probabilidad a cada valor
y de la variable aleatoria. La distribucin de
probabilidades para Y se puede expresar como una
formula, un grfico o una tabla.

Definicin 4.2 Propiedades de una Distribucin de


Probabilidad Discreta

1. La probabilidad PY(y) asociada con cada valor


de Y debe cumplir:

0 PY ( y ) 1

2. La suma de las probabilidades de todos los


valores de Y es igual a 1.

P ( y) = 1
y
Y

3. Ya que los diferentes valores de Y son eventos


mutuamente excluyentes, sus probabilidades
son aditivas. Por lo tanto:

P(Y = a oY = b) = PY (a) + PY (b)

Para la variable Y= numero de lneas H de una muestra


de tres telfonos, podemos definir Y a travs de una
tabla, como sigue:

10
y: 0 1 2 3
PY(y): 1/8 3/8 3/8 3/8

O podemos usar una frmula:

3! 1
PY ( y ) = ( )
y!(3 y )! 8

Donde en general k!= k (k 1)(k 2)...(1) y por convencin 0!= 1 . Sustituyendo


y=0,1,2 y 3 en la formula anterior se tienen las mismas probabilidades listadas en la
tabla anterior.

0 1 2 3
3 2 1 1 1 3 2 1 1 3 3 2 1 1 3 3 2 1 1 1
PY ( y = 0) : = = = =
(1)(3 2 1) 8 8 (1)(2 1) 8 8 (2 1)(1) 8 8 (3 2 1)(1) 8 8

Histograma de probabilidades

Un grfico de esta distribucin de probabilidades, llamado histograma de


probabilidades, se muestra en la figura 4.2. La variable aleatoria discreta Y es el
nmero de telfono de la lnea H en una muestra de tres.

Grfico de PY(y) para el experimento de muestreo


de telefonos

0,40
0,35
0,30
Pro b ab ilid ad es

0,25
0,20
0,15
0,10
0,05
0,00
1 2 3 4
nmero de fonos de la linea H

Funcin de distribucin acumulada

La funcin de distribucin acumulada es otra funcin que es particularmente


apropiada cuando se calculan probabilidades y tiene aplicaciones en mtodos
computacionales. En general la funcin de distribucin acumulativa FY(y) para una
variable aleatoria discreta Y es una funcin que especifica la probabilidad de que

11
Y y para todos los valores de y. Por la ley de la suma de probabilidades, todo lo
que debemos hacer es sumar las probabilidades individuales para valores menores o
iguales al valor especificado y. De este modo:

FY ( y ) = P(Y y ) = PY (0) + PY (1) + ... + PY ( y )

Esto puede ilustrarse para el ejemplo de muestreo de telfonos discutido


previamente:

y: 0 1 2 3
PY(y) 1/8 3/8 3/8 1/8
FY(y) 1/8 4/8 7/8 8/8

Como el nombre lo sugiere y el ejemplo ilustra, la funcin de distribucin


acumulativa para un valor particular y suma todas las probabilidades para Y y . Por
ejemplo:

1 3 3 7
FY (2) = P (Y 2) = + + =
8 8 8 8
y

FY (3) = P(Y 3) = 1

La funcin de distribucin acumulativa (abreviada fda) se usa frecuentemente para


construir tablas de probabilidad, de modo que el usuario no tenga que sumar muchos
datos para encontrar las probabilidades. Como ilustracin, supongamos que Y es el
nmero de casos de ataques coronarios que llegan en un da dado a un gran hospital
de enseanza metropolitano. La funcin de distribucin de distribucin acumulada
queda como sigue:

y: 0 1 2 3 4 5 6 7 8
FY(y): 0,001 0,003 0,006 0,011 0,024 0,061 0,139 0,224 0,336
y: 9 10 11 12 13 14 15 16 17
FY(y): 0,510 0,672 0,782 0,870 0,925 0,964 0,988 0,997 1,00

Suponga que el hospital tiene 14 camas de cuidados coronarios disponibles al


comienzo de un da particular. La probabilidad de que el nmero de nuevos casos Y
es menor o igual que 14 puede leerse directamente de la tabla 0,964. Es casi tan fcil
como encontrar la probabilidad de Y sea 15 o mas;

P (Y 15) = 1 P (Y 14) = 1 0,964 = 0,036 .

12
4.3. Valor esperado, Varianza y Desviacin estndar

En la seccin previa introducimos el lenguaje de variables aleatorias. Ya que las


variables aleatorias tienen valores numricos, tiene sentido hablar de promedios y
variabilidad. En esta seccin definiremos la media (o valor esperado) y la varianza
de una cantidad aleatoria.

Valor esperado

El valor promedio de una variable aleatoria debe tomar en cuenta todos los posibles
valores de esa variable y sus respectivas probabilidades .El valor esperado de
invariable aleatoria discreta Y con distribucin de probabilidad PY(y) es el promedio
ponderado en probabilidad de sus posibles valores. Recordemos que un promedio
ponderado es la suma de los valores ponderados dividido por la suma de los pesos
ponderadores.

El valor esperado de Y es tambin llamado media de Y , se denota E(Y) o y .

Definicin 4.3 Valor Esperado de una Variable Aleatoria Discreta

Para una variable aleatoria discreta Y con distribucin de probabilidad PY(y), el valor
esperado de Y es:

y = E (Y ) = yPY ( y )
y

Para encontrar E(Y) tome cada uno de los valores posibles de y, multiplquelo por su
probabilidad PY(y) y sume todos los resultados.

Ejemplo 4.3 Una firma est considerando dos posibles inversiones. Como
aproximacin gruesa, la firma asigna probabilidades (subjetivas) para los resultados
posibles de las inversiones, que son perder un 20% por peso invertido, perder 10%,
mantenerse sin ganar o perder, ganar un 10% por peso invertido y ganar un 20%. Sea
Y el retorno por peso invertido en el primer proyecto y Z el retorno por peso
invertido. Las probabilidades de la firma son:

y: -0,20 -0,10 0 0,10 0,20


PY(y) 0,1 0,2 0,4 0,2 0,1

Z: -0,20 -0,10 0 0,10 0,20


PZ(z) 0,01 0,04 0,1 0,5 0,35

Calcule los retornos esperados por peso invertido en cada proyecto. Cul inversin
parece ser ms atractiva ?

Solucin: El proyecto Y, parece menos atractivo que el Z, pero es as ? para ello


calculemos el valor esperado de cada proyecto.

13
y PY(y) y PY(y) z PZ(z) zPZ(z)
-0,20 0,1 -0,02 -0,20 0,01 -0,002
-0,10 0,2 -0,02 -0,10 0,04 -0,004
0 0,4 0 0 0,1 0
0,10 0,2 0,02 0,10 0,5 0,050
0,20 0,1 +0,02 0,20 0,35 +0,070
E(Y)=0 E(Y)=0,114

El valor esperado Y es menor que el de Z, por lo tanto el proyecto Z es preferible al


proyecto Y.

Estos clculos pueden ser hechos fcilmente con una hoja de clculo o un paquete
estadstico. Liste los posibles valores en una columna, las probabilidades
correspondientes en otra columna, multiplicar los valores correspondientes y luego
sume.

Interpretacin de E(Y)

El valor esperado (media) de una variable aleatoria Y puede ser interpretado i en


varias formas. Primero, es simplemente un promedio ponderado de probabilidades,
segundo se puede pensar como un promedio de largo plazo.

Ejemplo 4.4. Suponga que una poblacin consta de los siguientes valores y
frecuencias asociadas.
Valor: 1000 2000 3000 4000
Frecuencia 80 60 40 20
(N=200)

La media poblacional es 2000. sea Y una variable aleatoria de la poblacin.


Encuentre PY(y) y E(Y).

Solucin: Los posibles valores y sus probabilidades son:


y: 1000 2000 3000 4000
PY(y) 80/200=0,4 60/200=0,3 40/200=0,2 20/200=0,1

El valor esperado es:

E (Y ) = 1000 * 0,4 + 2000 * 0,3 + 3000 * 0,2 + 4000 * 0,1 = 2000

E(Y) es la media de la poblacin.

Varianza de una variable aleatoria

Hemos discutido las diferentes interpretaciones asociadas con el valor esperado de


una variable aleatoria discreta. Otra caracterstica igualmente importante de una
variable aleatoria discreta es la varianza y la desviacin estndar. La varianza de un
conjunto de datos es el promedio de las desviaciones cuadrticas de la media.

14
Similarmente, la varianza de una variable aleatoria Y, Var(Y), es el promedio
ponderado por las probabilidad de las desviaciones cuadrticas con respecto a la
media.

Definicin 4.4 Varianza y Desviacin Estndar de una Variable aleatoria


discreta:

Si Y es una variable aleatoria discreta, entonces :

Y2 = Var (Y ) = ( y Y ) 2 PY ( y ) , donde Y = E (Y )
y

La desviacin estndar de Y, denotada por Y = Var (Y )

Para calcular Var(Y), tomar cada valor restar el valor esperado Y = E (Y ) , elevar al
cuadrado esta diferencia , multiplicar por la probabilidad PY(y), y sumar.

Ejemplo 4.6 Encuentre la varianza y desviacin estndar para Y y Z del ejemplo 4.3.

Solucin: En el ejemplo 4.3 se encontr y = E (Y ) = 0 y Z = E ( Z ) = 0,114 .

y PY(y) (y- Y ) (y- Y ) 2 (y- Y ) 2PY(y)


-0,20 0,1 -0,20 0,04 0,004
-0,10 0,2 -0,10 0,01 0,002
0 0,4 0 0 0
0,10 0,2 0,10 0,01 0,002
0,20 0,1 0,20 0,04 0,004
Y = 0,012
2

Y = 0,12 = 0,110
z PZ(z) (z- Z ) (z- Z ) 2 (z- Z ) 2PZ(z)
-0,20 0,01 -0,314 0,098596 0,000988596
-0,10 0,04 -0,214 0,045796 0,00183184
0 0,1 -0,114 0,012996 0,00129960
0,10 0,5 0-,114 0,00196 0,00009800
0,20 0,35 0,086 0,07396 0,00258860

Z2 = 0,006804
Z = 0,006804 = 0,082

La distribucin Y tiene mayor variabilidad. El grueso de la distribucin Z est


concentrado entre los valores mayores 0,1 y 0,2; mientras que las probabilidades Y
estn mas repartidas entre todos los valores posibles. La varianza de una inversin se
toma habitualmente como una medida de riesgo, en que mayores varianzas indican
mayores niveles de riesgo. En este ejemplo la inversin Z tiene mayor valor esperado
de retorno y menor riesgo.

15
La computacin de la varianza y la desviacin estndar son fciles de hacer en una
planilla electrnica o en un paquete estadstico. Se hace una columna (o una fila)
con los valores y otra con sus probabilidades, tal como lo hicimos para calcular el
valor esperado. Se construye una nueva columna restando la media de cada uno de
los valores y se eleva al cuadrado el resultado. Luego se multiplican los valores
cuadrticos por la probabilidad correspondiente y finalmente se suman todos los
resultados para obtener la varianza. Luego se toma la raz cuadrada de la varianza
para obtener la desviacin estndar.

En la figura 4.6 se presenta un arreglo en Excel para calcular el valor esperado, la


varianza y la desviacin estndar de la variable Y= nmero de cajas abiertas en un
supermercado a las 8 AM.

16
Figura 4.6 Valor esperado, Varianza y desviacin estndar con Excel
y 0 1 2 3 4 5 6 7 8 9 10
P(y) 0,1 0,15 0,25 0,2 0,1 0,08 0,05 0,02 0,02 0,015 0,015

yP(y) 0 0,15 0,5 0,6 0,4 0,4 0,3 0,14 0,16 0,135 0,15

Valor SUMA(B3:L3)
Esperado
y-uY 9 4 1 0 1 4 9 16 25 36 49
(y-uY)2 0,9 0,6 0,25 0 0,1 0,32 0,45 0,32 0,5 0,54 0,735

Varianza SUMA((B7:L7)

Valor 2,935
esperado=
Varianza = 4,715
Desviacin
estndar= 2,171

La varianza y la desviacin estndar de una variable no pueden ser negativas. La


varianza es 0 si todos los valores estn concentrados en un slo valor. Mientras mas
repartida est la probabilidad entre todos los valores, mayor es su valor. Este hecho
proviene de que la varianza es el promedio en probabilidad de las desviaciones
cuadrticas. Si las mayores desviaciones cuadrticas estn en los extremos hay
mayor probabilidad de que la varianza y la desviacin estndar sern grandes.

4.4 Distribucin Conjunta de Probabilidad e Independencia

Hemos desarrollado un lenguaje bsico para variables aleatorias discretas. En esta


seccin se extiende el lenguaje a distribuciones conjuntas de probabilidad para dos
variables aleatorias X e Y. Se hacen nuevas definiciones para el caso de 2 variables
aleatorias discretas.

Probabilidades Conjuntas

Cuando nos enfrentamos a dos variables aleatorias X e Y, es conveniente trabajar con


probabilidades conjuntas. La distribucin conjunta de los eventos A y B es la
probabilidad que ambos eventos ocurran, P(A y B). Sea A el evento X=x, y B el
evento Y=y. Se define la probabilidad PXY(x,y) como la funcin que provee la
distribucin conjunta para cada par de valores x e y.

Ejemplo 4.9 Suponga que en la sala de emergencia de un pequeo hospital, la


mayora de los casos que llegan son ataques cardacos y traumas (por accidentes o
acciones de violencia). Definamos las llegadas de personas de una noche cualquiera
de fin de semana como, X=nmero de ataques cardacos e Y=nmero de traumas. La
distribucin conjunta de probabilidades PXY(x,y) se muestra a continuacin:

17
Y
X 0 1 2 3
0 2/82 3/84 4/84 5/84
1 4/84 6/84 8/84 10/84
2 6/84 9/84 12/84 15/84

Interprete el valor 10/84 en la tabla.

Solucin: El valor 10/84 es la probabilidad conjunta PXY(1,3) , esto es, la


probabilidad de que X=1 y Y=3 en una noche de fin de semana cualquiera. Dicho de
otra forma es la probabilidad de que ocurra 1 caso de ataque cardaco y 3 traumas en
una noche cualquiera de fin de semana.

Probabilidades marginales

Una vez que se ha establecido la distribucin conjunta de probabilidad, las


probabilidades marginales se pueden calcular, por suma.

Ejemplo 4.10 Encontrar la distribucin de probabilidad conjunta de X y la


distribucin de probabilidad conjunta de Y del ejemplo 4.9.

Solucin: Sume a travs de las columnas para obtener la probabilidad marginal de X


y a travs de las filas para obtener la probabilidad marginal de Y.

Y
x 0 1 2 3 PX(x)
0 2/82 3/84 4/84 5/84 14/84
1 4/84 6/84 8/84 10/84 28/84
2 6/84 9/84 12/84 15/84 42/84
PY(y) 12/84 18/84 24/84 30/84

Estas ideas se pueden expresar tambin en frmulas. Para encontrar PX(x) sume las
probabilidades conjuntas de x para todo valor posible de y :

PX ( x) = P( x, y )
y

En este ejemplo

P( X = 1) = PXY (1, y )
y

= PXY(1,0) + Pxy(1,1) + Pxy(1,2) + PXY(1,3)


4 6 8 10 28
= + + + =
84 84 84 84 84

En este ejemplo:

18
P(Y = 1) = PXY ( x,1)
x

= PXY (0,1) + PXY (1,1) + PXY (2,1) =

3 6 9 18
= + + =
84 84 84 84

En una planilla electrnica se pueden hacer estos clculos de manera muy sencilla.

Por ejemplo suponga que una compaa de arriendo de automviles como parte de su
sistema de crditos, recoge las probabilidades conjuntas de dos variables:
X= nmero de muertes ocurridas e Y= nmero de tarjetas de crdito impagas,
resultantes de una toma de datos aleatoria. El archivo Excel se muestra en la figura
4.7.

Figura 4.7
A B C D E F G
1 Probabili y
dades
Conjuntas
2 0 1 2 3
3 0 0,06 0,11 0,16 0,03 =SUMA(C3:F3)

4 X 1 0,13 0,24 0,09 0,02 =SUMA(C4:F4)

5 2 0,08 0,04 0,03 0,01 =SUMA(C5:F5)

6 =SUMA(C3:C5) =SUMA(D3:D5) =SUMA(E3:E5) =SUMA(F3:F5)

A B C D E F G
1 Probabili
dades y
Conjuntas
2 0 1 2 3
3 0 0,06 0,11 0,16 0,03 0,36
4 X 1 0,13 0,24 0,09 0,02 0,48
5 2 0,08 0,04 0,03 0,01 0,16
6 0,27 0,39 0,28 0,06 1

La frmula =SUMA calcula la probabilidad marginal inmediatamente. Se puede


extender la notacin bsica de probabilidad a probabilidades condicionales. Para ello
definamos la probabilidad condicional de B dado A como sigue:

P( A B)
P( B ) =
A P( A)

19
Distribucin condicional

Llamemos Probabilidad condicional de Y dado X=x a PY / X ( y / x) . As para cualquier


valor de Y tenemos:

P( X = x Y = y ) PXY ( x, y )
P(Y = y / X = x) = =
P( X = x) PX ( x)

La necesidad de esta notacin viene de la idea de independencia. Recordemos que


tenemos dos definiciones de independencia para los eventos A y B:

P( A / B) = P( B)

P ( A B ) = P ( A) P ( B )

Definiciones equivalentes de independencia estadstica

Tenemos tambin dos definiciones equivalentes de independencia estadstica, para


las variables aleatorias X e Y:

PY / X ( y / x) = PY ( y ), para todo x,y

PXY ( x, y ) = PX ( x) PY ( y ), para todo x, y

Usualmente nosotros usaremos la segunda definicin de independencia.

Ejemplo 4.11 Mostrar que X e Y de los ejemplos 4.9 y 4.10 son independientes

Solucin: En el ejemplo 4.10 encontramos PX(x) y PY(y). Al multiplicar


adecuadamente ambos trminos se obtiene la siguiente tabla:

y
x 0 1 2 3 PX(x)
0 (12/84)(14/84) (18/84)(14/84) (24/84)(14/84) (30/84)(14/84) 14/84
1 (12/84)(28/84) (18/84)(28/84) (24/84)(28/84) (30/84)(28/84) 28/84
2 (12/84)(42/84) (18/84)(42/84) (24/84)(42/84) (30/84)(42/84) 42/84
12/84 18/84 24/84 30/84

Al reducir a fracciones los datos de esta tabla, se llegan a los datos de la tabla del
ejemplo 4.9. De esta forma PXY(x,y)=PX(x)PY(y) para todo x e y; por lo que X e Y son
independientes.

El supuesto de independencia fue construido en forma matemtica para PXY(x,y). En


la prctica, frecuentemente se supone que X e Y son independientes: una vez que
especificamos PX(x) y PY(y), se calcula PXY(x,y) como el producto PX(x)PY(y). En el
ejemplo 4.9 hay una situacin en la cual el supuesto de independencia parece

20
razonable. El nmero de casos coronarios que llegan a la sala de emergencia no
debera ser relevante para predecir el nmero de casos de trauma que llegan.

Ejercicios

4.21 Una empresa manufacturera de televisores vendo dos modelos principales.


Defnase X=ventas del modelo A en Diciembre (cerca de 100.000) e Y=ventas del
modelo B en Diciembre. El equipo de marketing estima que las probabilidades
conjuntas son PXY(x,y) son:

y
X 1 2 3 4
1 0,03 0,055 0,07 0,075
2 0,055 0,07 0,075 0,07
3 0,07 0,075 0,07 0,055
4 0,075 0,07 0,055 0,030

a. Encontrar P(X=1,Y=2)
b. Encontrar P ( X 2, Y 2)
c. Encontrar PX ( x) y PY ( y )
d. Son X e Y independientes?

4.22 El dueo de una pequea tienda de equipos musicales define las siguientes
variables; X= nmero de amplificadores vendidos en un da de semana e Y= nmero
de parlantes vendidos durante el mismo da.

x: 0 1 2 3 4
Px(x) 0,10 0,40 0,25 0,20 0,05

a. Asuma que X e Y son independientes, calcula la distribucin conjunta


PXY(x,y).
b. Cheque su trabajo encontrando las probabilidades marginales.

4.23 Cree ud. que la independencia es un supuesto razonable en el ejercicio 4.22.?


Debera ser verdad que las ventas de amplificadores son irrelevantes para las
ventas de parlantes ?

4.24 Una pequea empresa consultora presenta propuestas orales y escritas en un


esfuerzo por obtener nuevos contratos. Los registros indican que la distribucin
de probabilidades PXY(x,y) de X=nmero de propuestas orales en una semana e
Y=nmero de propuestas escritas en una semana est dada por la siguiente
tabla:

21
y
x 0 1 2 3 4
0 0,01 0,015 0,030 0,075 0,050
1 0,020 0,030 0,045 0,060 0,040
2 0,030 0,045 0,100 0,045 0,030
3 0,040 0,060 0,045 0,030 0,020
4 0,050 0,075 0,030 0,015 0,010

a. Encuentre la probabilidad de que hayan dos propuestas orales y dos


propuestas escritas en una semana.
b. Encuentre la probabilidad de que hayan exactamente dos propuestas orales en
una semana y dos o menos propuestas escritas en una semana.

4.25 Refirase al ejercicio 4.24.

4.26 a. Use las distribuciones de probabilidad para construir las distribuciones de


probabilidad marginales de X e Y.
b. Asumiendo estas probabilidades por usted calculadas, son X e Y independientes
?

4.26 Calcula la distribucin condicional de Y dado cada valor posible de X usando


las distribuciones del ejercicio 4.24 son estas distribuciones de probabilidad
condicionales independientes ?

4.5. Covarianza y Correlacin de Variables Aleatorias

En la seccin previa se defini la nocin de independencia de una variable aleatoria.


Ahora hablaremos sobre como medir el grado de dependencia entre dos variables
aleatorias. Hay muchas medidas de dependencia que se pueden usar. Dos medidas,
covarianza y correlacin, son particularmente importantes porque estn
estrechamente relacionadas al concepto de varianza de una variable aleatoria. La
correlacin, en particular, es una forma de saber en que medida dos variables
aleatorias varan juntas.

Comencemos, una vez mas, con un ejemplo: Un empleado de confianza de un banco


supone las siguientes (subjetivas) probabilidades conjuntas para el porcentaje de
retorno (inters mas cambio en valor de mercado) de dos bonos. Los retornos se
muestran como X e Y.

y
x 8 9 10 11 12 PX(x)
8 0,03 0,04 0,03 0,00 0,00 0,10
9 0,04 0,06 0,06 0,04 0,00 0,20
10 0,02 0,08 0,20 0,08 0,02 0,40
11 0,00 0,04 0,06 0,06 0,04 0,20
12 0,00 0,00 0,03 0,04 0,03 0,10

22
0,09 0,22 0,38 0,22 0,09 1,00

Hay una relacin entre X e Y. Por ejemplo, dado x=8, las probabilidades de Y se
concentran en los valores mas pequeos de y=8,9 y 10. En el otro extremo dado
x=12, las probabilidades se concentran sobre los valores mayores de y=10, 11 y 12.
En general hay tendencia para que X e Y varen juntos. La convergencia y
correlacin de dos variables aleatorias miden la fortaleza de la tendencia.

La covarianza de dos variables aleatorias se basa en el producto de las desviaciones


con respecto a las medias, ponderadas por la probabilidad conjunta. Si un valor
particular de x es menor que X y un valor de y est por debajo de Y , ambas
desviaciones sern negativas y el producto ser positivo. Similarmente si ambas
desviaciones estn por arriba de las correspondientes medias, el producto tambin
ser positivo. En cambio, si la desviacin de una variable est por sobre la media y la
desviacin de la otra est por debajo de la media, el resultado del producto ser
negativo.

Definicin 4.7 Covarianza de dos Variables Aleatorias X e Y. Si X e Y son dos


variables aleatorias discretas con medias X y Y , y con distribucin de
probabilidad conjunta PXY(x,y), la Covarianza de X e Y, denotada por Cov(x,y) se
define como:

Cov( x, y ) = ( x X )( y Y ) PXY ( x, y )
x y

Una frmula corta para calcular la covarianza es


Cov( x, y ) = xyPXY ( x, y ) X Y
x y

Ejemplo 4.12 Computar Cov(X,Y) para la distribucin conjunta dada en la discusin


precedente. Use la definicin primera y luego cheque la frmula corta, verificando
que ambos mtodos dan el mismo resultado.

Solucin: De las probabilidades marginales PX (x) y PY ( y ) , se obtienen las medias


o valores esperados:

x = 8 * 0,1 + 9 * 0,2 + 10 * 0,4 + 11 * 0,2 + 12 * 0,10 = 10

Y = 8 * 0,9 + 9 * 0,22 + 10 * 0,38 + 11 * 0,22 + 12 * 0,09 = 10

Como se puede ver los nmeros de X estn igualmente distribuidos alrededor de 10,
este valor es la media o valor esperado. Lo mismo ocurre con los valores de Y. La
covarianza se puede ahora computar usando la definicin:

Cov( x, y ) = ( x X )( y Y ) PXY ( x, y )
x y

23
Cov ( X , Y ) = (8 10 ) * (8 10 ) * 0,3 + (8 10 ) * (9 10 ) * 0,04 + + (8 10 ) * (10 10 ) * 0,03 +
(8 10 ) * (11 10 ) * 0,0`( 8 10 ) * (12 10 ) * 0,0 + (9 10 ) * (8 10 ) * 0,04 + ....
+ (12 10 ) * (12 10 ) * 0,03 = 0,60

Similarmente, usando la frmula corta:

Cov( x, y ) = ( x X )( y Y ) PXY ( x, y )
x y

8 * 8 * 0,03 + 8 * 9 * 0,04 + 8 * 10 * 0,03 + ... + 12 * 12 * 0,03 10 * 10 =


100,6 100 = 0,60

En una planilla electrnica la covarianza se puede calcular ms fcilmente.

A B C D E F G H I
1 Probabilidades
Conjuntas
2 9 10 11 12 Total
3 8 0,03 0,04 0,03 0,00 0,00 0,10
4 9 0,04 0,06 0,06 0,04 0,00 0,20
5 10 0,02 0,08 0,20 0,08 0,02 0,40
6 11 0,00 0,04 0,06 0,06 0,04 0,20
7 12 0,00 0,00 0,03 0,04 0,03 0,10
8 Total 0,09 0,22 0,38 0,22 0,09 1,00
9
10
11 0,12 0,08 0,00 0,00 0,00
12 0,08 0,06 0,00 -0,04 0,00
13 0,00 0,00 0,00 0,00 0,00
14 0,00 -0,004 0,00 0,06 0,08
15 0,00 0,00 0,00 0,08 0,12
16 0,6

La covarianza de dos variables aleatorias esta estrechamente relacionada a su


correlacin.

24
Definicin 4.8

Correlacin de dos Variables Aleatorias X e Y:

Si X e Y son dos variables aleatorias discretas con desviaciones estndares


respectivas X y Y , su correlacin XY se define como :

Cov( X , Y )
XY =
XY

De aqu se concluye: Cov( X , Y ) = XY X Y

La correlacin entre X e Y esta en el rango -1,00 y +1,00. Un valor -1,00 +1,00


indica prediccin lineal perfecta en la poblacin, mientras que un valor 0 indica que
no existe ninguna prediccin lineal.

Ejemplo 4.13: Encuentre XY para la distribucin discutida en el ejemplo 4.12


reciente.

Solucin: En el ejemplo 4.12 se encontr Cov(X,Y)=0,6 . Para obtener XY se


necesita las desviaciones estndar de X e Y, las cuales pueden ser computadas desde
la perspectiva de probabilidades marginales. La frmula corta para una varianza
puede usarse para computar X2 y Y2 .

X2 = x 2 PX ( x) X2
x

= 8 2 (0,10) + 9 2 (0,20) + 10 2 (0,40) + 112 (0,20) + 12 2 (0,10) 10

= 101,20 100 = 1,20

y X = 1,20 = 1,095 Similarmente se tiene

Y =
y
y 2 PY ( y ) Y2 = 1 ,16

Y = 1,16 = 1,077

Sustituyendo en la definicin de XY , se tiene :

25
Cov( X , Y ) 0,60
XY = = = 0,509
XY 1,095(1,077)

26
5.1 Contando los resultados posibles

Este capitulo contiene una discusin sobre la distribucin de probabilidades que se


aplican en varias situaciones comunes. La mas comn de estas es cuando se toma
una muestra de una poblacin, y se usa la expresin:

numero de resultados favorables


P (evento) =
nmero total de resultados

Para usar esta idea necesitamos un mtodo para contar posibles resultados sin el
trabajo de listar explcitamente los resultados.

Esta seccin contiene una seccin dedicada a frmulas de conteo. Estas frmulas son
necesarias tambin para el desarrollo de la distribucin de probabilidad binomial que
se aborda en la siguiente seccin. Los mtodos de conteo responden a las siguientes
dos preguntas:

1. Cuntas secuencias de k smbolos se pueden formar de un conjunto de r


distintos smbolos, usando cada smbolo no ms de una vez ?
2. Cuntos subconjuntos de k smbolos se pueden formar de un conjunto de r
smbolos distintos, usando cada smbolo no mas de una vez ?

La nica diferencia entre una secuencia y un subconjunto es que el orden importa


para las secuencias y no para los subconjuntos. La secuencia ABC no es la misma
que la secuencia CBA, pero el subconjunto {A,B,C} es el mismo que el subconjunto
{C,B,A}. Como ejemplo considere secuencias y subconjuntos de tres de las primeras
cinco letras del alfabeto. Hay 60 secuencias pero solo 10 subconjuntos. (Tabla 5.1)

{A,B,C} ABC ACB BAC CAB BCA CBA


{A,B,D} ABD ADB BAD DAB BDA DBA
{A,B,E} ABE AEB BAE EAB BEA EBA
{A,C,D} ACD ADC CAD DAC CDA DCA
{A,C,E} ACE AEC CAE EAC CEA ECA
{A,D,E} ADE AED DAE EAD DEA EDA
{B,C,D} BCD BDC CBD DBC CDB DCB
{B,C,E} BCE BEC CBE EBC CEB ECB
{B,D,E} BDE BED DBE EBD DEB EDB
{C,D,E} CDE CED DCE ECD DEC EDC

Nmero de secuencias =r(r-1)(r-k+1)

Por ejemplo, elija una secuencia de k=3 letras de un total de k=5 letras, como en la
tabla 5.1, tenemos 5 elecciones para la primera letra, y 4 elecciones para la segunda y
3 para la tercera. Por lo tanto hay 5x4x3=60 secuencias diferentes.

La frmula de la secuencia aparece como un factorial (r!) excepto que est truncado
en r-k+1 en vez de continuar hasta 1.

27
Los nmeros de secuencias se llaman habitualmente nmero de permutaciones, de k
tomados de r y se denota r Pk y se expresa via factoriales como:

r!
Pk = = r (r 1)...(r k + 1)
(r k )!
r

El nmero de subconjuntos es llamado nmero de combinaciones de k smbolos


r
tomados de r y se denota como r Ck o
k

r r!
=
k k!(r k )!

Por ejemplo, para elegir un subconjunto de k=3 letras de un total de k=5 letras, como
en la tabla 5.1, tenemos

5 5! 5 x 4 x3 x 2 x1
= = = 10
3 3!(5 3)! 3 x 2 x1(2 x1)

r
El smbolo se lee r sobre k, sugiriendo la eleccin de un subconjunto de k
k
cosas de un conjunto de r cosas.

La formula de combinaciones es particularmente til para muestreo aleatorio, porque


elegir un tamao de muestra k sin reemplazo desde una poblacin de tamao r es
exactamente lo mismo que un subconjunto de k cosas tomadas de un conjunto de r
cosas.

Habitualmente no nos importa el orden durante el muestreo de modo que la formula


de permutaciones no es importante en este caso. Frecuentemente se deben contar el
nmero de formas que se pueden obtener dos subconjuntos. Por ejemplo, si tenemos
un total de 920 tems buenos y 80 tems malos, cuantas formas hay de elegir 12
buenos y 4 malos?

920 80
Hay formas de elegir los tems buenos y formas de elegir los malos.
12 4
Cualquier eleccin de tems buenos se puede juntar con la eleccin de tems malos,
luego para encontrar el nmero de formas en que pueden ocurrir ambas cosas, es
decir elegir 12 tems buenos y 4 tems malos, basta multiplicar ambas formulas.
Luego hay
920 80
formas de hacer estas elecciones.
12 4

28
5.2. Distribuciones Discretas de Probabilidad:

Distribucin Binomial

Es una de las distribuciones discretas ms tiles. Sus areas de aplicacin incluyen


inspeccin de calidad, ventas, marketing, medicina, investigacin de mercados, etc.
Para entender esta distribucin se debe imaginar un experimento en el que el
resultado es la ocurrencia o la no ocurrencia de de un evento. Sin prdida de
generalidad, llmese xito a la ocurrencia del evento y fracaso a la no ocurrencia del
evento. Adems sea p la probabilidad de xito y 1-p la probabilidad de fracaso.
Supngase que el experimento se repite n veces, y cada uno de estos experimentos es
independiente de los dems, y sea X la variable aleatoria que representa el nmero de
xitos en los n ensayos. El inters est en la probabilidad de obtener exactamente n
ensayos. Los dos supuestos claves para la distribucin binomial son:

1. La probabilidad de xito p permanece constante para cada ensayo.


2. Los n ensayos son independientes entre si.

Varios problemas parecen adherirse razonablemente a las suposiciones anteriores.


Por ejemplo, un proceso de manufactura produce un determinado producto en el que
algunas unidades se encuentran defectuosas. Si la proporcin de unidades
defectuosas producidas por este proceso es constante durante un perodo razonable y
si como procedimiento de rutina, se seleccionan aleatoriamente un determinado
nmero de unidades, entonces el clculo de probabilidad puede hacerse con la
distribucin binomial, de la siguiente forma:

Sea p la proporcin de unidades defectuosas producidas. Entonces se sacan n


artculos para ver cuantos salen defectuosos. Por ejemplo supongamos que se sacan 5
artculos y se quiere calcular la probabilidad de que 2 de estos 5 artculos sean
defectuosos. Entonces si D es artculo defectuoso y N artculo no defectuoso, se tiene
lo siguiente:

DDNN N o DNDNN o D N N D N o D N N N D o

5
Entonces hay formas o combinaciones de sacar 2 artculos defectuosos en 5
2
artculos sacados.

La probabilidad de sacar 2 artculos defectuosos y 3 no defectuosos en cualquier


orden es

p * p * (1 p ) * (1 p ) * (1 p ) = p 2 * (1 p )
3

n
En general si se quieren obtener k xitos en n ensayos, se tienen formas y cada
k
caso tiene probabilidad p k (1 p ) .
n k

29
Formalicemos ahora estas ideas sobre la distribucin binomial.

Definicin Distribucin Binomial:

Sea X una variable aleatoria que representa el nmero de xitos en n ensayos y p la


probabilidad de xito con cualquiera de stos. Se dice entonces que X tiene una
distribucin binomial con funcin de probabilidad:


p x (1 p )
n! n x
x = 0,1,2,..., n
p (x; n, p ) = (n x )! x!
0 para cualquier otro valor 0 p 1

Los parmetros de la distribucin binomial son n y p. Estos definen una familia de


distribuciones binomiales.

Valor esperado de una variable X distribuida Binomial(n,p)

Si X Bin(n, p) E ( X ) = np

Varianza de una variable X distribuida Binomial(n,p)

Si X Bin(n, p ) V ( X ) = np(1 p )

Ejemplos:

1.- Supngase que para personas de cierta edad, la probabilidad de contagio de cierta
enfermedad invernal es 0,001. Cual es la probabilidad de que se contagien el 30% ?

El 30% puede entenderse como 30 de n=100. Luego lo que se pregunta es por una
variable X que cuenta el nmero de infectados con la enfermedad invernal. Esta
variable distribuye binomial, con parmetros p=0,01 y n=100.

Es decir Pr{X = 30} = 0,0130 (1 0,01)


100! 100 30
= 1,45 E 35
(100 30)!30!
Si la pregunta se cambia a Cual es la probabilidad de que se contagien el 1% ?
Entonces

Pr{X = 1} = 0,011 (1 0,01)


100! 100 1
= 0,369
(100 1)!1!

30
5.3. Distribucin de Poisson

Esta distribucin se aplica cuando una sucesin de eventos ocurren aleatoriamente a


travs del tiempo. Una instalacin elctrica enfrenta ocasionales tormentas que
derriba las lneas de transmisin o daa los transformadores. Aunque la probabilidad
de largo plazo de ocurrencia de una tormenta se puede determinar con total
seguridad, el tiempo en que ocurrir la siguiente tormenta es impredecible. Un
administrador de un centro computacional de una universidad enfrenta variaciones
aleatorias, en los tiempos de llegadas de trabajos.

La distribucin de Poisson es el modelo ms simple y mas ampliamente usado de


eventos que ocurren en el tiempo. Esta distribucin es el resultado matemtico de
una serie de supuestos. Si los supuestos no son correctos, a lo menos
aproximadamente, para una situacin particular, la Distribucin de Poisson puede
hacer un mal modelo de la situacin.

Los supuestos cruciales son los siguientes:

1. Los eventos ocurren uno a la vez. No ocurren dos o ms eventos al mismo


tiempo.

2. La ocurrencia del evento de inters en un perodo dado es independiente de la


ocurrencia del evento en un perodo no traslapado de tiempo. Esto significa
que la ocurrencia (o no ocurrencia) de un evento durante un perodo de
tiempo no cambia la probabilidad de que ocurra un evento en algn perodo
de tiempo posterior.

3. El nmero esperado de eventos en un perodo de tiempo se mantiene


constante, de modo que, el nmero esperado de eventos durante un cierto
perodo de tiempo es el mismo que el de otro perodo de tiempo del mismo
largo.

El tercer supuesto hace la matemtica ms fcil, pero se puede probar que es


irrelevante. Con estos supuestos se llega a la siguiente distribucin de
probabilidades.

Definicin : Distribucin de probabilidades de Poisson


Sea Y una variable con distribucin de Poisson. Esto lo denotaremos como

Y Poisson( )

Entonces :

e y
PY ( y ) =
y!

Donde es el nmero esperado de eventos que ocurrirn en un perodo dado y


adems e = 2,71828 .

31
5.4. Distribuciones Continuas de Probabilidad

Distribucin Uniforme:

Se caracteriza porque todos los intervalos de igual tamao tienen la misma


probabilidad de ocurrir. Es muy utilizada para modelar tiempos de ocurrencia de
eventos, cuando no se tiene informacin adicional, que permita inferir alguna
condicin sobre la frecuencia de ocurrencia de los valores que pueda tomar la
variable.

Definicin formal:

Sea X una variable con distribucin uniforme, con valores reales entre a y b.
Entonces la funcin de densidad de probabilidad (fdp) de X es :

1
fdp X = ; a xb
(b a )
Con esto se puede obtener la Funcin de Probabilidad acumulada F (x) .

x x x
F (x ) = (x a )
1 1 1
fdp X dx = dx = dx =
a a
(b a ) (b a ) a (b a )
Pr{X x} = (x a ) ; a x b
1
Luego
(b a )

32