Está en la página 1de 39

Esquema del TEMA 3. Parámetros de v.

aleatorias

Parámetro de una variable aleatoria. Constante que señala de


manera sintética o resumida una característica de su modelo de
probabilidad.
b bilid d
Valor medio, valor esperado o media de una variable aleatoria.

Ejemplos a modo de introducción


1.) Se consideran x1, x2, … , xn ; n números distintos, con media
aritmética
x1  x2  ....  xn 1 1 1
 x1  x2  ...  xn
n n n n

Si se parte de una variable aleatoria


X:    , con recorrido X()  x1 , x2 ,..., xn  y densidad
1
 , x  X()
f( )  n
f(x)=
0 en el resto de 
la media aritmética se escribe como
1 1 1
x1
n
 x2  ...  xn  x1f(x1)  x 2f(x2 )  ...  xnf(xn ) 
n n

x X()
xif(xi)
i

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 1


Valor medio o valor esperado de una v. aleatoria.

2.) Se considera la secuencia de números x1, x2, x2, x3, x3, x3,…,
xn , xn ,…, xn ; donde xi se repite i veces. En tal caso la media
aritmética se expresa como

x1  x2  x 2  x3  x3  x3  ....  xn  xn  ...  xn 1 2 n
 x1  x2  ...  xn
n(n
(  1) n(n
(  1) n(n
(  1) n(n
(  1)
2 2 2 2

De modo similar al ejemplo anterior, podemos considerar

X:    , con recorrido X()  x1 , x2 ,..., xn  y densidad


 i
 n(n+1) , xi  X()
( +1)
f(xi )= 
 2
0 en el resto de 

1 2 n
x1
n(n  1)
 x2
n(n  1)
 ...  xn
n(n  1)
 
x X()
xif(xi)
i
2 2 2

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 2


Valor medio o valor esperado de una v. aleatoria (2).

3.) En el lanzamiento 10 veces de una moneda legal,


consideramos la variable X = nº de caras obtenidas, cuya función
d d
de densidad
id d es  x 10  x 10
10   1   1  10   1 
          , x  0,1, 2,...,10
f(x)   x   2   2   x 2

0 , en el resto de 

El cálculo realizado en los ejemplos previos, resulta, en este


caso, 10
10   1  1

xX()
xf(x)    x   2 
xX()
x
 
 5  10
2

En la situación general del modelo binomial B(n,p) , se tiene


n
n n
n! n
n((n  1)!)

xX()
xf(x)
( ) 
x 0
x   p x qn  x 
x
x
x 1 x !(n
!(  x)!
)!
p x qn  x   x x((x
x 1 ((  1)!)(
)!)(n  1  (
(x  1))!
p x
qn  x

n
(n  1)! n 1
(n  1)!
  np p x 1qn 1(x 1)   np y !( p y
qn 1 y  np(p  q)n 1=np
x 1 (  1)!(
(x )!(n  1  (
(x  1))! y 0 !(n  1  y)!
)!

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 3


Valor medio o valor esperado de una v. aleatoria (3).

Modelo Binomial
0,25 n=10, p=0.5

0,2

0,15
f(x)

0,1

0,05

0
0 2 4 5 6 8 10
x
Valor
medio: np

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 4


Valor medio o valor esperado de una v. aleatoria (4).

Modelo Binomial
0,4 n=10, p=0.1

f(x) 0,3

0,2

0,1

0
0 1 2 3 4 5 6 7 8 9 10
x

Valor
medio: np

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 5


Valor medio o valor esperado de una v. aleatoria (5).

4.) En relación a X = suma de resultados de dos lanzamientos de


una dado (legal), con función de densidad
x 1
 36 , x  2, 3, 4, 5, 6, 7

13  x
f(x)   , x  8, 9,10,11,12
 36

0 para el resto de 

el cálculo efectuado anteriormente, será:


12
1 2 3 4 5 6 5 1

xX()
xf(x)   xf(x)  2 36  3 36  4 36  5 36  6 36  7 36  8 36  ...  12 36  7
x 2

Obsérvese que esta cantidad no es otra cosa que la media


aritmética de los 36 números siguientes:

2 (1 vez), 3 (2 veces), 4 (3 veces), 5 (4 veces), 6 (5 veces), 7 (6 veces),


8 (5 veces), 9 (4 veces), 10 (3 veces), 11 (2 veces), 12 (1 vez)

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 6


Valor medio o valor esperado de una v. aleatoria (6).

función de densidad
función de densidad
función de densidad

6/36
6/36
6/36

5/36
5/365/36

4/36
4/364/36
f(x)f(x)
f(x)

3/36
3/36
3/36
2/36
2/36
2/36
1/36
1/36
1/36

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
x
0 1 2 3 4 5 6 x 7 8 9 10 11 12 13 14
Valor medio
x

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 7


Valor medio o valor esperado de una v. aleatoria (7).

5) Se realizan sucesivos ensayos (independientes) de una moneda


(o la repetición –en las mismas condiciones- de un experimento, hasta
que un suceso de interés, A, tenga lugar; con p(
p(A)=p)
) p) hasta obtener
cara por primera vez, donde la probabilidad de éxito (cara) es
designada por p, donde la variable, con recorrido infinito, X =
números de ensayos necesarios sigue el modelo de probabilidad
geométrico de parámetro p :

f(x)  (1  p)x 1p  qx 1p , x=1,2,....

El valor medio o valor esperado de X sería:


   
dqx
   x  E(X)
( )  
xX()
xf(x)
( )  xf(x)
x 1
( )   xq
q
x 1
x 1
pp  xqq
x 1
=p 
x 1

x 1 d
dq


q
d( qx ) d( )
1q 1 1
p x 1
p p 
dq dq (1  q)2 p

Observación: si p es la probabilidad de éxito/ensayo (“por


p ), 1/p
unidad de tiempo” /p será
á el nº de
d ensayos
ayo que
qu hemos o de
d
esperar en media hasta el éxito (tiempo medio de espera).
Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 8
Valor medio o valor esperado de una v. aleatoria (8).

Modelo Geométrico
0,5 prob. éxito
0,5
0,4

( ) 0,3
f(x)
0,2

0,1

0
1 2 3 4 5 6 7 8 9 10 11 12 13
x
Valor medio 2 ,1 y 3 son los valores de
máxima p probabilidad

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 9


Valor medio o valor esperado de una v. aleatoria (9).
6) Se considera la variable continua,
continua X,
X con función de densidad
x , 0  x  1

f(x)    x  2 , 1  x  2
0 en el resto de 

llamada modelo de probabilidad triangular sobre [0,2] (este
modelo surge de considerar la suma de dos variables
independientes con modelo uniforme sobre [0,1])

Para obtener, -en este caso, que afecta a un modelo continuo-


el valor medio o valor esperado de X, sustituimos la suma,
empleada en las variables discretas, por la integral (a fin de
cuentas,, la integral
g de una función no es otra cosa que
q una
suma especial):
 1 2
   x  E(X)
( )  xf(x)dx

( )   x xdx   x (x  2))dx 
0 1

1 2
1 2
 x dx   (x
2 2
  2x)dx   1
0 1
3 3

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 10


Valor medio o valor esperado de una v. a. (10).

Modelo Triangular sobre [0,2] con punto medio 1

0.8

0.6
f(x)

0.4

0.2

0
0 04
0.4 08
0.8 1 12
1.2 16
1.6 2
x

Valor medio

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 11


Valor medio o valor esperado de una v. a. (11).

7) Como ya vimos en el tema anterior, el modelo uniforme sobre


[a,b] , tiene como función de densidad:

 1
 ,axb
f(x)   b  a
0 en el resto de 
P ttanto,
Por t  b
1 ba
   x  E(X)   xf(x)dx   x dx 
 a
ba 2

valor que corresponde al punto medio del intervalo [a,b].

Observación:
Si eligiésemos
li ié all azar una cantidad
tid d suficiente
fi i t ded
números en el intervalo [a,b] (realizando sucesivos ensayos)
x1 , x2 , x3 , ....,, xn , .....
y se calculase su media aritmética (media muestral) se obtendría
un número próximo a (a+b)/2 : n

x1  x2  x3  ...  xn  xi ab
 i 1
 (si n  )
n n 2

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 12


Valor medio o valor esperado de una v. a. (12).

8) Si consideramos que el tiempo de espera hasta que un


acontecimiento de interés tenga lugar, es una variable aleatoria,
T, con modelo de probabilidad exponencial de parámetro  (constante
positiva)
ii ),d donde
d  = cadencia
d i media/unidad
di / id d d de tiempo
i = nºº
medio de veces que ocurre/unidad de tiempo, resulta evidente
que el tiempo medio de espera hasta que ocurra debe ser 1/ y
este valor es el que se obtiene:
  s
   T  E(T)   tf(t)dt  0 te
 t
dt  lim  te tdt 
s 
0
s s
s  1  1
 lim -te  t
  lim  e t dt  lim   e t  
0
s  s 
0
s 
  0 
Observación:
a) La técnica de integración por partes, utilizada en este ejemplo,
se obtiene por integración de la derivada de un producto de
funciones : (u(x)v(x))’=(u(x))’v(x)+u(x)(v(x))’
b)  es una tasa instantánea, tal y como ocurre con la tasas de
crecimiento que surge en los modelos determinísticos de
crecimiento poblacional.
Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 13
Valor medio o valor esperado de una v. a. (13).

Modelo exponencial
0,5 

0,4

0,3
f(x)

0,2
0,

0,1

0
0 2 4 6 8 10 12
x

Valor medio

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 14


Valor medio o valor esperado de una v. a. (14).

9) Si X sigue el modelo de probabilidad Normal o de Gauss, N(,),


cuya función de densidad es
1 (x  )2
1 
2 2
f(x)  e , -  x  
 2
, parametros (constantes) ,   0

su valor medio o valor esperado será:


 1 (x  )2  1
 1  1  y2
 x  (   y) 
2 2
   x  E(X)  xf(x)dx  e dx  e 2
 dy

- 2 - 2
x -
que se obtiene haciendo el cambio y

 1  1
1  y2   y2
x    e 2
dy   ye 2 dy  
- 2 - 2
en tanto que
 1
1  y2

- 2
e 2
dy  1 (se trata de la densidad del modelo N(0,1))

 1
  y2

- 2
ye 2
dy  0 (se trata de una funcion impar: f(x)  -f(-x))

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 15


Valor medio o valor esperado de una v. a. (15).

Gráfica de la función de modelo Normal N(77,3.7) :

Modelo Normal o de Gauss


0.12 
  
0.1

0.08
f(x) 0.06

0.04

0.02

0
62 67 72 77 82 87 92
x

Valor medio

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 16


Valor medio o valor esperado de una v. a. (16).
Valor medio,, valor esperado
p o esperanza
p matemática. Dada X,,
variable aleatoria, con función de densidad f(x) ; se define su
valor medio, valor esperado o esperanza matemática como el
parámetro (constante) siguiente:
   x  E(X)  
xX()
xf(x) , en caso de ser X discreta

   x  E(X)   xf(x)dx
f( )d , en caso de
d ser X continua
ti

siempre que, tanto la serie como la integral, existan.


El valor medio es una medida
did dde ttendencia
d t l de la variable
i central
aleatoria, actúa como centro de gravedad de su ley de probabilidad
y suele señalar la zona o el ámbito donde se ubican los valores de
máxima
á probabilidad.
b bld d
Si X es una medida de naturaleza aleatoria sobre individuos de
una
u a población
pob ac ó (estatura,
(estatu a, por
po ejemplo),
eje p o),  representaría
ep ese ta a al a
“individuo medio”, respecto de X. El valor de X en un individuo de
esta población difiere en mayor o menor medida del individuo
medio por causas imputables al azar: esta diferencia se suele
denominar desviación aleatoria o error aleatorio.
Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 17
Valor medio en transformadas de v. aleatorias. (17)
Valor medio de variables aleatorias transformadas. Ejemplo
Se considera la variable X con recorrido
X()={-k,-k+1,...,-1,0,1,...,k-1,k}
y función de densidad f(x). La transformación T(x)=x2, modifica
el recorrido inicial de X y define de modo natural una nueva
variable aleatoria YY=T(X)=X
T(X) X2 (Y() = {0,1,...,(k 1)2 ,k2}). La
{0,1,...,(k-1)
densidad de Y , designada por g(y), viene, obviamente,
determinada por la de X, a saber:
p(Y
(Y  0)  p(X
(X  0)  f(0) , sii y  0
g(y)   2
p(Y  y)  p(X  y)  p(X   y)  p(X   y)  f( y)  f( y) , y  Y() , y  0

Si calculamos el valor medio de Y, se tendría


 Y   T(X)  
yY()
yg(y)  0g(0)  
yY()
y(f( y)  f( y))  0f(0)  
yY()
yf( y)  
yY()
yf( y) 
y 0 y 0 y 0

 02 f(0)  12 f(1)  22 f(2)  ....  k 2f(k)  12 f(1)  22 f(2)  ....  k 2f(k) 
 02 f(0)  (1)2 f(1)  (2)2 f(2)  ....  (k)2 f(k)  12 f(1)  22 f(2)  ....  k 2f(k) 

 
xX()
x2 f(x)
( ) 
xX()
T(x)f(x)
( )( )

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 18


Valor medio en transformadas de v. aleatorias. (18)

Valor medio de transformada de una v v. a.


a univariante.
univariante Sea
X v. a. univariante, con función de densidad f(x) , y T(x) una
función que modifica o transforma X() y genera ,por tal proceso,
Y T(X) una nueva variable
Y=T(X), i bl aleatoria
l i univariante.
i i P
Para calcular
l l ell
valor medio o valor esperado de Y=T(X), no es necesario conocer
explícitamente su recorrido ni su función de densidad:

  T(x)f(x) , si X es discreta
 Y   T(X)   xX()
  T(x)f(x)dx , si X es continua
 - 

Valor medio de transformada de una v. a. multivariante.


Sea (X1, X2,…, Xn), ) v.
v a.
a multivariante
lti i t , con función de densidad
f(x1, x2,…, xn) , y T(x1, x2,…, xn) una función numérica de n
variables que modifica o transforma (X1, X2,…, Xn)() y genera
,por tall proceso, Y=T(X
Y T(X1, X2,…, Xn), ) una nueva variable
i bl
aleatoria univariante. Para calcular el valor medio o valor esperado de
Y=T(X1, X2,…, Xn), no es necesario conocer explícitamente su
recorrido ni su función de densidad:
Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 19
Valor medio en transformadas de v. aleatorias. (19)


  T(x1 , x2 ,..., xn )f(x1 , x 2 ,..., xn ) , si (X1 , X 2 ,..., Xn) es discreta
 Y  (x1 ,x2 ,...,xn )(X1 ,X2 ,...,Xn )()
   ...  T(x , x ,..., x )f(x , x ,..., x )dx dx ...dx , si (X , X ,..., X ) es continua
 -  -  -  1 2 n 1 2 n n n 1 1 1 2 n

Propiedades inmediatas de valor medio en base a lo anterior.


a.) E(X+Y)=E(X)+E(Y) , si X e Y v.a.
b.) E(a+cX)=a+cE(X) , si X v.a.; a, c constantes
c.)) E(a+c
E( + 1X1+ c2X2+...++ + cnXn)=a+c ) + 1E(X1)+c )+ 2 E(X2)+...+
)+ +
cnE(Xn)
donde X1, X2,,...,, Xn v.a.;; a,, c1, c2,,...,, cn constantes.
d.) E(X1X2...Xn)=E(X1) E(X2)...E(Xn) si X1, X2,..., Xn
independientes.
V
Veamos la
l primera
i propiedad,
i d d por ejemplo
j l :
(x  y)f(x, y)dydx     xf(x, y)dy  dx     yf(x, y)dx  dy 
     
E(X+Y)= 
-  - 
   - 
  

  f(x, y)dy  dx   y   f(x, y)dx  dy   xf (x)dx   yf (y)dy  E(X)  E(Y)
 -  
x
 -    - x - y
Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 20
Valor medio en transformadas de v. aleatorias. (20)

Ejemplo sobre
sob e la utilidad
tilidad de estas p opiedades. Al considerar el
propiedades
modelo binomial B(n,p),
en el tema 2, observamos la
descomposición de X en suma de variables dicotómicas (Xi
Bernoulli) : X  X1  X2  ...  Xn , con
1 , si exito , p(Xi  1)  p
Xi  
p( i  0)  1  p
0 , si fracaso , p(X
i  1, 2,...,n

donde, trivialmente, E(Xi)=1p+0q=p , y por ello

E(X)  E(X1  X2  ...  Xn )=E(X1)  E(X2 )  ...  E(Xn)=nE(Xi)  np

un método más rápido y “elegante”


elegante que el expuesto en el ejemplo 3.
Ejemplo. El valor medio de Y/X , si f(x,y)=x(1+3y2)/4 , en
0<x<2, 0<y<1, será:
y x(1  3y2 ) 2  1 y(1  3y ) 
2
Y   y 2 1
E  
X
  x f(x, y)dydx   
0 0 x 4
dydx    
0

0 4
dy dx 

1
2y2  3y 4
2 5
2 5
 ( ) dx   dx 
0 16 0
0 16 8

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 21


Varianza (parámetro de dispersión) de una v. a.
Varianza de una variable aleatoria(“grado
aleatoria( grado o medida de aleatoriedad, de
variabilidad, de dispersión”).

Ejemplos a modo de introducción.


ó

1)Sean X e Y v.a. con recorridos X()={0,1,2,3,4} e


Y()={-2,0,2,4,6} y funciones
f de densidad equiprobables en
ambos casos. De la simple observación de los recorridos, y tenida
en cuenta la equiprobabilidad, se tiene que E(X)=E(Y)=2. Sin
embargo, y a igualdad de condiciones, los valores de Y están
claramente más distanciados, más dispersos que los de X. Existen
distintas formas de poner de manifiesto esta diferencia y una de
ellas partiría, en primer lugar, seleccionando un valor de referencia
y calcular la media de las distancias de éste a cada valor de la
variable Si el valor de referencia es,
variable. es por ejemplo,
ejemplo el valor medio de
la variable aleatoria, entonces resultaría un parámetro de
dispersión denominado desviación media:

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 22


Varianza (parámetro de dispersión) de una v. a. (2)
E(
( X  x )  
xX()
x   x fx (
(x)
)  0  2 fx (0)  1  2 fx (1)  2  2 fx (2)  3  2 fx (3)  4  2 fx (4) 

2 1 0 1 2 6
 
5 5
E( Y   y )  
yY()
y   y fy (y)  2  2 fy (2)  0  2 fy (0)  2  2 fy (2)  4  2 fy (4)  6  2 fy (6) 

4  2  0  2  4 12
 
5 5
Por tanto, la desviación media de Y es el doble que la de X : la
variable Y tiene más contenido en aleatoriedad que X . Sin embargo,
el uso de la desviación media p presenta algunos
g inconvenientes
por el manejo del valor absoluto. Es preferible poner de
manifiesto la variabilidad de una variable, sobre todo a efectos
comparativos con el parámetro varianza (y su raíz cuadrada,
comparativos, cuadrada la
desviación típica) que calcula la media de los cuadrados de las
distancias de los valores de la variable a su valor medio:
4  1  0  1  4 10
2x  Var(X)  E (X   x )2   
xX()
(x   x )2 fx (x) 
5

5
2

16  4  0  4  16 40
2y  Var(Y)  E (Y   y )2   
yY()
(y   y )2 fy (y) 
5

5
8

y  2y  2 2  2 2x  2 x

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 23


Varianza (parámetro de dispersión) de una v. a. (3)
2) Se consideran X= “nºn de caras obtenidas al lanzar 10 veces
una moneda”, e Y= “nº de caras obtenidas al lanzar 10 veces una
moneda”, con probabilidad de cara, en cada ensayo, p=0.5 y
p=0 1 respectivamente; con modelos de probabilidad (Binomial
p=0.1,
B(n,p)); funciones de densidad
10   1  x  1 10  x 10   1 10
     , x  0,1, 2,..., 10
fx (x)   x   2   2   x 2

0 , en el resto de 
10 
  0.1 0.9 
y 10  y
, y  0,1, 2,..., 10
fy (y)   y 
0 , en el resto de 

1
 x  np  10 5 ,  y  np  10  0.1
11
2

Las varianzas de ambas variables serán:


10 10
10 
 x2  E (X   x )2    (x  5)2 fx (x)   (x  5)2   0.5  10  0.5  0.5  2.5  npq
10

x 0 x 0  x 
10 10
10 
 y2  E (Y   y )2    (y  1)2 f (y)   (y  1)2 
y
y
 (0.1) (0.9)
10  y
 10  0.1  0.9  0.9  npq
y 0 y 0  y 

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 24


Varianza (parámetro de dispersión) de una v. a. (4)
Luego,
g , la variabilidad de X es mayor
y que
q la Y: el contenido en
aleatoriedad, en variabilidad, es mayor en X que en Y.
Esta característica se pone de manifiesto si inspeccionamos
detalladamente sus funciones de densidad:
x/y fx(x) fy(y)
0 0,000976563 0,348678
1 0,00976563 0,38742
2 0,0439454 0,19371
3 0,117188 0,0573956
4 ,
0,205078 0,0111603
,
5 0,246094 0,00148803
6 0,205078 0,000137781
7 0,117188 0,000008748
8 0,0439454 0,0000003645
9 0,00976563 0,000000009
10 0,000976563 0,0000000001

p(1  X  9)  0.99 ,es decir, en el “99% de las ocasiones el nº de


caras que se obtenga será un nº entre 1 y 9”.

p(0  Y  3)  0.99, es decir, en el “99% de las ocasiones el nº de


caras que se obtengan será un nº entre 0 y 3”.
Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 25
Varianza (parámetro de dispersión) de una v. a. (5)

3) Retomamos el modelo
d l de
d probabilidad
b bilid d Normal
N l o de
d Gauss
G , N(,)
N( ),
cuya función de densidad es
1 (x  )2
1 
2 2
f(x)  e , -  x  
 2
 ,  parametros (constantes) ,   0

Al tratarse de un modelo continuo, deberemos sustituir, en el


cálculo de la varianza de los ejemplos
j p anteriores,, el “sumatorio”
por la integral correspondiente:
2
1  x  
  1  
2   
( )  E (
Var(X) (X  )2   
(x  )2f(
( f(x)dx
)d  

(x  )2
(
 2
e d
dx

x-
con el cambio y  ( x    y , dx  dy ) se tiene


1 1 1
 1  y2 1  y2 1   y2
Var(X)  
2
 y 2
e 2
dy   2
ye 2   2
e 2 dy  2

2 
2  2
 


 1
0

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 26


Varianza (parámetro de dispersión) de una v. a. (6)

Comparación gráfica de modelos normales con idéntica media


pero distinta varianza:

Modelo Normal o de Gauss


0 12
0,12
=77 , =3.7
0,1 =77 , =7.4

0 08
0,08
f(x)
0,06
0 04
0,04
0,02
0
52 57 62 67 72 77 82 87 92 97 102
x

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 27


Varianza (parámetro de dispersión) de una v. a. (7)
típica Sea X,
Varianza y desviación típica. X variable aleatoria,
aleatoria con función
de densidad f(x) y valor medio  ; se define su varianza, como el
parámetro siguiente:
2  2x  Var(X)  E (X  )2    (x  ) f(x)
xX()
2
, en caso de ser X discreta

    Var(X)  E (X  )  
2 2
x
2
 (x  ) f(x)dx
2
, en caso de ser X continua

La raíz cuadrada positiva de la varianza recibe el nombre de


desviación típica o desviación estándar de X,
X que expresa la medida
de dispersión en las mismas unidades que la variable:

   x   Var(X)

Este parámetro, medida de variabilidad, de dispersión de X, es


una medida del distanciamiento medio de la variable respecto de
su valor medio, señala cómo está repartida o dispersa la función
de probabilidad entre los valores de la variable.

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 28


Varianza (parámetro de dispersión) de una v. a. (8)
Propiedades
p inmediatas.
1) Var(X)  0 (Var(X)  0  X  constante  )
2
2) Var(X)  E(X 2 )  E(X)  E(X 2 )   2
3) Si c es una constante, ( )  c2 Var(X)
Var(cX) ( ) , Var(X
(  c)
)  Var(X)
( )
4) Si X e Y son independientes, entonces Var(X  Y)  Var(X)  Var(Y)
5) Si X1 , X 2 ,..., X n son independientes; a1 , a2 , ...., an , b constantes,
2 2 2
entonces Var(a1 X1  a2 X 2  ...  an X n )  a1 Var(X1 )  a2 Var(X 2 )  ...  an Var(X n )

Ejemplo. Mencionamos de nuevo el caso de una variable X , con


B(n p),
que admite la
modelo de probabilidad binomial B(n,p)
descomposición en suma de variables Bernoulli , independientes:
X  X1  X2  ...  Xn , con
1 , si exito , p(Xi  1)  p
Xi  
0 , si fracaso , p(Xi  0)  1  p
i  1, 2,,...,n
,

Dado que obviamente Var(Xi)=pq, por el punto 5 se tiene que:


( )  Var(X
Var(X) ( 1  X2  ...  Xn) ( 1)  Var(X
)=Var(X ( 2 )  ...  Var(X
( n)
)=npq
pq

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 29


Varianza (parámetro de dispersión) de una v. a. (9)

Estanda i ación o tipificación de una


Estandarización na variable aleato ia. Dada
a iable aleatoria
una variable aleatoria X, con valor medio  y desviación típica ;
la estandarización o tipificación de X , consiste en considerar la
variable
i bl
X
Z , en la que

 X    E(X  )
E(Z) E 
E(Z)=E  0
   
X   V ar(X  ) Var(X)
Var(Z)  Var    1
   2 2
(de esta forma, X    Z)

Dicho proceso
proceso, no modifica básicamente el modelo de
probabilidad de X, sí sus parámetros media y varianza, los
convierte en valores estándares. Veamos, por ejemplo, dicha
estandarización,
t d i ió a nivel
i l gráfico,
áfi en una variable
i bl con modelo
d l de
d
probabilidad normal N(, ) :

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 30


Varianza (parámetro de dispersión) de una v. a. (9)

Modelos N(4,2.3) y N(0,1)

0,4
N(4,2.3)
N(0,1)
0,3

f(x) 0,2

0,1

0
-8 -4 0 4 8 12 16
x

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 31


Covarianza. Coeficiente de correlación.
Covarianza (medida de asociación entre variables aleatorias . Sea
(X,Y) una población bivariante (variable aleatoria bivariante), con
f(x,y) función densidad conjunta; x , y valores medios de X e Y,
respectivamente El parámetro covarianza entre X e Y se define de la
respectivamente.
forma siguiente:

Cov(X Y)  XY  E (X   x )(Y   y )


Cov(X,

Propiedades inmediatas

1) Cov(X, Y)  E(XY)  E(X)E(Y)  E(XY)   x y


2) a) Cov(X,X)=2x
b) Cov(c,
Cov(c X)  0 , si cc=constante
constante
c) Cov(aX  bY, Z)  aCov(X, Z)  bC ov(Y, Z) ; a, b constantes
3) Si X e Y son independientes, entonces cov(X, Y)  0
1
(la inversa no es cierta en general: X, X2 , X()  1, 0,1 , f(x)  )
3
4) Var(X  Y)  Var(X)  Var(Y)  2Cov(X, Y)
5) Si X1 , X2 , ..., Xn son v.a. , entonces

Var(X1  X2  ...  Xn )  Var(X1)  Var(X2 )  ...  Var(Xn )  2 Cov(Xi , X j )


i j

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 32


Covarianza. Coeficiente de correlación.(2)
Observaciones importantes.
p

a.) A la hora de obtener Cov(X,Y), utilizando la propiedad 1), es


preciso calcular E(XY), para lo cual se precisa f(x,y) , función de
densidad conjunta de (X,Y) :

E(XY)
( ) 
(x ,y)(X ,Y)()
xyf(x,
y ( , y) , e
en e
el caso d
discreto
sc eto

 
E(XY)   
 
xyf(x, y)dxdy , en el caso continuo

b.) Si (X,Y) está descrita por el modelo normal bivariante


N(x,y,x,y,) , cuya función de densidad conjunta es
 2 2

1   x   x   2  x   x   y   y    y   y  
2       
1 2(1   )   x    x    y    y  
f(x, y)  e  
2
2  x  y 1  
donde  x ,  y  0 ,  2  1

se p
puede comprobar
p q
que Cov(X,Y)=
( , )  x y .

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 33


Covarianza. Coeficiente de correlación.(3)
c.) Del resultado anterior, se obtiene que

Cov(X, Y)  0  X e Y independientes

De manera que en este modelo de probabilidad el valor de la


covarianza establece de manera definitiva la independencia o no
de ambas variables.

d) Lo que sí asegura, en cualquier situación, el valor de este


parámetro en caso de ser distinto de cero,
parámetro, cero es la dependencia
entre X e Y, hecho que se deriva de la propiedad 3):
Cov(X, Y)  0  X e Y dependientes.

Como en muchas situaciones se desconoce el modelo de


probabilidad de (X,Y), se suele estimar el valor de la covarianza
con la
l covarianza muestral, a partir
i de
d una muestra, (X1,YY1),
)
(X2,Y2),...,(Xn,Yn) , extraída de la población:
n

 ((X i  X)(Y
)( i  Y)
)
Sxy  i 1

n 1
Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 34
Covarianza. Coeficiente de correlación.(4)
Un valor de Sxy significativamente distinto de cero, nos induciría a
admitir que X e Y son dependientes.

e ) Si una v.a.
e.) v a X admite la siguiente descomposición
X  X1  X2  ...  Xn donde Cov(Xi , X j)  0 , i  j

entonces
t por la
l propiedad
i d d 5) se tiene
ti que:
Var(X)  Var(X1)  Var(X2 )  ...  Var(Xn ) y, por tanto,

Var(Xi ) Var(Xi )
0  1
Var(X) Var(X1)  Var(X2 )  ...  Var(Xn )

lluego lla proporción o porcentaje de variabilidad de X debida o explicada


por Xi será
Var(Xi)
Var(X)

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 35


Coeficientes de correlación y determinación.
Coeficiente de correlación . Sea (X,Y) una población bivariante
(variable aleatoria bivariante), con f(x,y) función densidad
conjunta; x , y ,x , y valores medios y desviaciones típicas de
X e Y,
Y respectivamente.
respectivamente El parámetro coeficiente de correlación entre
X e Y se define de la forma siguiente:

Cov(X,
( , Y)
)
   xy 
x y

El cuadrado de dicho coeficiente, 2 , es llamado coeficiente de


determinación.
Interpretación de ambos coeficientes.(Muy importante)
La interpretación se deriva del siguiente resultado: Dada la
variable bivariante (X,Y), podemos encontrar dos constantes,  y
 , de manera que
Y  (   X)  Z , verificándose
ifi á d

1) E(Z)  0
2) Var(Z) sea mínima
3) Cov((   X), Z)  0

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 36


Coeficientes de correlación y determinación. (2)

En efecto:
Se define Z=Y-(+X) , cualesquiera que sean  y . La exigencia
que figura en 1) se traduce en lo siguiente:
E(Z)  E(Y  (   X))   y  (   x )  0     y   x

Además, pretendemos que, para esos valores  y , la varianza


d Z sea lo
de l más
á pequeña
ñ posible:
ibl
Var(Z)  Var(Y  (   X))  Var(Y)  Var(   X)  2Cov(Y,(   X))
 2y  2 2x  2 cov(X, Y)  2y  2 2x  2 x  y
dVar(Z) 
 22x  2 x  y  0     y
d x

y este valor  minimiza Var(Z) (verificadlo).


(verificadlo) Se deja como
ejercicio la comprobación de que la exigencia 3) se cumple para
los valores de  y  encontrados.
Por tanto, Y queda descompuesta en la forma siguiente:
y y   
Y  ( y   x   X)  Z   y   y (X -  x )  Z (1)
x x  x 

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 37


Coeficientes de correlación y determinación. (3)

En decir,
decir la variabilidad de Y viene explicada o es debida a la
variabilidad de término lineal
y
y   (X -  x ) (2)
x

y a la variabilidad de Z .
En caso de ser Var (Z)=0, entonces Z=0, y resultaría que
y
Y  y   (X -  x )
x

significando, entonces, que la variabilidad de Y se debe


totalmente a la variabilidad de X.
Ahora bien
bien, si consideramos (1) ,enen general
general, y establecemos el
porcentaje de variabilidad de Y debida al término lineal (2) (ver
observación e)), se tiene:
y 2 2y
Var( y   (X   y ))  2
2x
x 
 x
2
 2  coeficiente de determinación
Var(Y) y

(Var(Z)  2y (1  2 ))

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 38


Coeficientes de correlación y determinación. (4)

Por tanto: ell coeficiente


fi i t ded correlación
l ió , que varía
í entre
t –11y1
1, (
(asíí
como el coeficiente de determinación) es una medida del grado de
asociación lineal entre X e Y.

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 39

También podría gustarte