Estadistica Aplicada A La Biología Tema 3

Esquema del TEMA 3. Parámetros de v.
aleatorias
Parámetro de una variable aleatoria. Constante que señala de

manera sintética o resumida una característica de su modelo de
probabilidad.
b bilid d
Valor medio, valor esperado o media de una variable aleatoria.
Ejemplos a modo de introducción

1.) Se consideran x1, x2, … , xn ; n números distintos, con media
aritmética
x1  x2  ....  xn 1 1 1
 x1  x2  ...  xn
n n n n
Si se parte de una variable aleatoria

X:    , con recorrido X()  x1 , x2 ,..., xn  y densidad
1
 , x  X()
f( )  n
f(x)=
0 en el resto de 
la media aritmética se escribe como
1 1 1
x1
n
 x2  ...  xn  x1f(x1)  x 2f(x2 )  ...  xnf(xn ) 
n n

x X()
xif(xi)
i
Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 1

Valor medio o valor esperado de una v. aleatoria.
2.) Se considera la secuencia de números x1, x2, x2, x3, x3, x3,…,
xn , xn ,…, xn ; donde xi se repite i veces. En tal caso la media
aritmética se expresa como
x1  x2  x 2  x3  x3  x3  ....  xn  xn  ...  xn 1 2 n
 x1  x2  ...  xn
n(n
(  1) n(n
(  1) n(n
(  1) n(n
(  1)
2 2 2 2
De modo similar al ejemplo anterior, podemos considerar
X:    , con recorrido X()  x1 , x2 ,..., xn  y densidad

 i
 n(n+1) , xi  X()
( +1)
f(xi )= 
 2
1 2 n
x1
n(n  1)
 x2
n(n  1)
 ...  xn
n(n  1)
 
x X()
xif(xi)
i
2 2 2

Valor medio o valor esperado de una v. aleatoria (2).
3.) En el lanzamiento 10 veces de una moneda legal,

consideramos la variable X = nº de caras obtenidas, cuya función
d d
de densidad
id d es  x 10  x 10
10   1   1  10   1 
          , x  0,1, 2,...,10
f(x)   x   2   2   x 2

0 , en el resto de 
El cálculo realizado en los ejemplos previos, resulta, en este

caso, 10
10   1  1

xX()
xf(x)    x   2 
xX()
x
 
 5  10
2
En la situación general del modelo binomial B(n,p) , se tiene

n
n n
n! n
n((n  1)!)

xX()
xf(x)
( ) 
x 0
x   p x qn  x 
x
x
x 1 x !(n
!(  x)!
)!
p x qn  x   x x((x
x 1 ((  1)!)(
)!)(n  1  (
(x  1))!
p x
qn  x
n
(n  1)! n 1
(n  1)!
  np p x 1qn 1(x 1)   np y !( p y
qn 1 y  np(p  q)n 1=np
x 1 (  1)!(
(x )!(n  1  (
(x  1))! y 0 !(n  1  y)!
)!

Modelo Binomial
0,25 n=10, p=0.5
0,2
0,15
f(x)
0,1
0,05
0
0 2 4 5 6 8 10
x
Valor
medio: np

Modelo Binomial
0,4 n=10, p=0.1
f(x) 0,3
0,2
0,1
0
0 1 2 3 4 5 6 7 8 9 10
x
Valor
medio: np

4.) En relación a X = suma de resultados de dos lanzamientos de

una dado (legal), con función de densidad
x 1
 36 , x  2, 3, 4, 5, 6, 7

13  x
f(x)   , x  8, 9,10,11,12
 36

0 para el resto de 

el cálculo efectuado anteriormente, será:

12
1 2 3 4 5 6 5 1

xX()
xf(x)   xf(x)  2 36  3 36  4 36  5 36  6 36  7 36  8 36  ...  12 36  7
x 2
Obsérvese que esta cantidad no es otra cosa que la media

aritmética de los 36 números siguientes:
2 (1 vez), 3 (2 veces), 4 (3 veces), 5 (4 veces), 6 (5 veces), 7 (6 veces),

8 (5 veces), 9 (4 veces), 10 (3 veces), 11 (2 veces), 12 (1 vez)

función de densidad
6/36
6/36
6/36
5/36
5/365/36
4/36
4/364/36
f(x)f(x)
f(x)
3/36
3/36
3/36
2/36
2/36
2/36
1/36
1/36
1/36
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
x
0 1 2 3 4 5 6 x 7 8 9 10 11 12 13 14
Valor medio
x

5) Se realizan sucesivos ensayos (independientes) de una moneda

(o la repetición –en las mismas condiciones- de un experimento, hasta
que un suceso de interés, A, tenga lugar; con p(
p(A)=p)
) p) hasta obtener
cara por primera vez, donde la probabilidad de éxito (cara) es
designada por p, donde la variable, con recorrido infinito, X =
números de ensayos necesarios sigue el modelo de probabilidad
geométrico de parámetro p :
f(x)  (1  p)x 1p  qx 1p , x=1,2,....
El valor medio o valor esperado de X sería:

   
dqx
   x  E(X)
( )  
xX()
xf(x)
( )  xf(x)
x 1
( )   xq
q
x 1
x 1
pp  xqq
x 1
=p 
x 1
x 1 d
dq


q
d( qx ) d( )
1q 1 1
p x 1
p p 
dq dq (1  q)2 p
Observación: si p es la probabilidad de éxito/ensayo (“por

p ), 1/p
unidad de tiempo” /p será
á el nº de
d ensayos
ayo que
qu hemos o de
d
esperar en media hasta el éxito (tiempo medio de espera).
Modelo Geométrico
0,5 prob. éxito
0,5
0,4
( ) 0,3
f(x)
0,2
0,1
0
1 2 3 4 5 6 7 8 9 10 11 12 13
x
Valor medio 2 ,1 y 3 son los valores de
máxima p probabilidad

6) Se considera la variable continua,
continua X,
X con función de densidad
x , 0  x  1

f(x)    x  2 , 1  x  2
0 en el resto de 

llamada modelo de probabilidad triangular sobre [0,2] (este
modelo surge de considerar la suma de dos variables
independientes con modelo uniforme sobre [0,1])
Para obtener, -en este caso, que afecta a un modelo continuo-

el valor medio o valor esperado de X, sustituimos la suma,
empleada en las variables discretas, por la integral (a fin de
cuentas,, la integral
g de una función no es otra cosa que
q una
suma especial):
 1 2
   x  E(X)
( )  xf(x)dx

( )   x xdx   x (x  2))dx 
0 1
1 2
1 2
 x dx   (x
2 2
  2x)dx   1
0 1
3 3

Valor medio o valor esperado de una v. a. (10).
Modelo Triangular sobre [0,2] con punto medio 1
0.8
0.6
f(x)
0.4
0.2
0
0 04
0.4 08
0.8 1 12
1.2 16
1.6 2
x
Valor medio

7) Como ya vimos en el tema anterior, el modelo uniforme sobre

[a,b] , tiene como función de densidad:
 1
 ,axb
f(x)   b  a
P ttanto,
Por t  b
1 ba
   x  E(X)   xf(x)dx   x dx 
 a
ba 2
valor que corresponde al punto medio del intervalo [a,b].
Observación:
Si eligiésemos
li ié all azar una cantidad
tid d suficiente
fi i t ded
números en el intervalo [a,b] (realizando sucesivos ensayos)
x1 , x2 , x3 , ....,, xn , .....
y se calculase su media aritmética (media muestral) se obtendría
un número próximo a (a+b)/2 : n
x1  x2  x3  ...  xn  xi ab
 i 1
 (si n  )
n n 2

8) Si consideramos que el tiempo de espera hasta que un

acontecimiento de interés tenga lugar, es una variable aleatoria,
T, con modelo de probabilidad exponencial de parámetro  (constante
positiva)
ii ),d donde
d  = cadencia
d i media/unidad
di / id d d de tiempo
i = nºº
medio de veces que ocurre/unidad de tiempo, resulta evidente
que el tiempo medio de espera hasta que ocurra debe ser 1/ y
este valor es el que se obtiene:
  s
   T  E(T)   tf(t)dt  0 te
 t
dt  lim  te tdt 
s 
0
s s
s  1  1
 lim -te  t
  lim  e t dt  lim   e t  
0
s  s 
0
s 
  0 
Observación:
a) La técnica de integración por partes, utilizada en este ejemplo,
se obtiene por integración de la derivada de un producto de
funciones : (u(x)v(x))’=(u(x))’v(x)+u(x)(v(x))’
b)  es una tasa instantánea, tal y como ocurre con la tasas de
crecimiento que surge en los modelos determinísticos de
crecimiento poblacional.
Modelo exponencial
0,5 
0,4
0,3
f(x)
0,2
0,
0,1
0
0 2 4 6 8 10 12
x
Valor medio

9) Si X sigue el modelo de probabilidad Normal o de Gauss, N(,),

cuya función de densidad es
1 (x  )2
1 
2 2
f(x)  e , -  x  
 2
, parametros (constantes) ,   0
su valor medio o valor esperado será:

 1 (x  )2  1
 1  1  y2
 x  (   y) 
2 2
   x  E(X)  xf(x)dx  e dx  e 2
 dy

- 2 - 2
x -
que se obtiene haciendo el cambio y

 1  1
1  y2   y2
x    e 2
dy   ye 2 dy  
- 2 - 2
en tanto que
 1
1  y2

- 2
e 2
dy  1 (se trata de la densidad del modelo N(0,1))
 1
  y2

- 2
ye 2
dy  0 (se trata de una funcion impar: f(x)  -f(-x))

Gráfica de la función de modelo Normal N(77,3.7) :
Modelo Normal o de Gauss

0.12 
  
0.1
0.08
f(x) 0.06
0.04
0.02
0
62 67 72 77 82 87 92
x
Valor medio

Valor medio,, valor esperado
p o esperanza
p matemática. Dada X,,
variable aleatoria, con función de densidad f(x) ; se define su
valor medio, valor esperado o esperanza matemática como el
parámetro (constante) siguiente:
   x  E(X)  
xX()
xf(x) , en caso de ser X discreta

   x  E(X)   xf(x)dx
f( )d , en caso de
d ser X continua
ti
siempre que, tanto la serie como la integral, existan.

El valor medio es una medida
did dde ttendencia
d t l de la variable
i central
aleatoria, actúa como centro de gravedad de su ley de probabilidad
y suele señalar la zona o el ámbito donde se ubican los valores de
máxima
á probabilidad.
b bld d
Si X es una medida de naturaleza aleatoria sobre individuos de
una
u a población
pob ac ó (estatura,
(estatu a, por
po ejemplo),
eje p o),  representaría
ep ese ta a al a
“individuo medio”, respecto de X. El valor de X en un individuo de
esta población difiere en mayor o menor medida del individuo
medio por causas imputables al azar: esta diferencia se suele
denominar desviación aleatoria o error aleatorio.
Valor medio en transformadas de v. aleatorias. (17)
Valor medio de variables aleatorias transformadas. Ejemplo
Se considera la variable X con recorrido
X()={-k,-k+1,...,-1,0,1,...,k-1,k}
y función de densidad f(x). La transformación T(x)=x2, modifica
el recorrido inicial de X y define de modo natural una nueva
variable aleatoria YY=T(X)=X
T(X) X2 (Y() = {0,1,...,(k 1)2 ,k2}). La
{0,1,...,(k-1)
densidad de Y , designada por g(y), viene, obviamente,
determinada por la de X, a saber:
p(Y
(Y  0)  p(X
(X  0)  f(0) , sii y  0
g(y)   2
p(Y  y)  p(X  y)  p(X   y)  p(X   y)  f( y)  f( y) , y  Y() , y  0
Si calculamos el valor medio de Y, se tendría

 Y   T(X)  
yY()
yg(y)  0g(0)  
yY()
y(f( y)  f( y))  0f(0)  
yY()
yf( y)  
yY()
yf( y) 
y 0 y 0 y 0
 02 f(0)  12 f(1)  22 f(2)  ....  k 2f(k)  12 f(1)  22 f(2)  ....  k 2f(k) 
 02 f(0)  (1)2 f(1)  (2)2 f(2)  ....  (k)2 f(k)  12 f(1)  22 f(2)  ....  k 2f(k) 
 
xX()
x2 f(x)
( ) 
xX()
T(x)f(x)
( )( )

Valor medio de transformada de una v v. a.

a univariante.
univariante Sea
X v. a. univariante, con función de densidad f(x) , y T(x) una
función que modifica o transforma X() y genera ,por tal proceso,
Y T(X) una nueva variable
Y=T(X), i bl aleatoria
l i univariante.
i i P
Para calcular
l l ell
valor medio o valor esperado de Y=T(X), no es necesario conocer
explícitamente su recorrido ni su función de densidad:

  T(x)f(x) , si X es discreta
 Y   T(X)   xX()
  T(x)f(x)dx , si X es continua
 - 
Valor medio de transformada de una v. a. multivariante.

Sea (X1, X2,…, Xn), ) v.
v a.
a multivariante
lti i t , con función de densidad
f(x1, x2,…, xn) , y T(x1, x2,…, xn) una función numérica de n
variables que modifica o transforma (X1, X2,…, Xn)() y genera
,por tall proceso, Y=T(X
Y T(X1, X2,…, Xn), ) una nueva variable
i bl
aleatoria univariante. Para calcular el valor medio o valor esperado de
Y=T(X1, X2,…, Xn), no es necesario conocer explícitamente su
recorrido ni su función de densidad:

  T(x1 , x2 ,..., xn )f(x1 , x 2 ,..., xn ) , si (X1 , X 2 ,..., Xn) es discreta
 Y  (x1 ,x2 ,...,xn )(X1 ,X2 ,...,Xn )()
   ...  T(x , x ,..., x )f(x , x ,..., x )dx dx ...dx , si (X , X ,..., X ) es continua
 -  -  -  1 2 n 1 2 n n n 1 1 1 2 n
Propiedades inmediatas de valor medio en base a lo anterior.

a.) E(X+Y)=E(X)+E(Y) , si X e Y v.a.
b.) E(a+cX)=a+cE(X) , si X v.a.; a, c constantes
c.)) E(a+c
E( + 1X1+ c2X2+...++ + cnXn)=a+c ) + 1E(X1)+c )+ 2 E(X2)+...+
)+ +
cnE(Xn)
donde X1, X2,,...,, Xn v.a.;; a,, c1, c2,,...,, cn constantes.
d.) E(X1X2...Xn)=E(X1) E(X2)...E(Xn) si X1, X2,..., Xn
independientes.
V
Veamos la
l primera
i propiedad,
i d d por ejemplo
j l :
(x  y)f(x, y)dydx     xf(x, y)dy  dx     yf(x, y)dx  dy 
     
E(X+Y)= 
-  - 
   - 
  

  f(x, y)dy  dx   y   f(x, y)dx  dy   xf (x)dx   yf (y)dy  E(X)  E(Y)
 -  
x
 -    - x - y
Ejemplo sobre
sob e la utilidad
tilidad de estas p opiedades. Al considerar el
propiedades
modelo binomial B(n,p),
en el tema 2, observamos la
descomposición de X en suma de variables dicotómicas (Xi
Bernoulli) : X  X1  X2  ...  Xn , con
1 , si exito , p(Xi  1)  p
Xi  
p( i  0)  1  p
0 , si fracaso , p(X
i  1, 2,...,n
donde, trivialmente, E(Xi)=1p+0q=p , y por ello
E(X)  E(X1  X2  ...  Xn )=E(X1)  E(X2 )  ...  E(Xn)=nE(Xi)  np
un método más rápido y “elegante”

elegante que el expuesto en el ejemplo 3.
Ejemplo. El valor medio de Y/X , si f(x,y)=x(1+3y2)/4 , en
0<x<2, 0<y<1, será:
y x(1  3y2 ) 2  1 y(1  3y ) 
2
Y   y 2 1
E  
X
  x f(x, y)dydx   
0 0 x 4
dydx    
0

0 4
dy dx 

1
2y2  3y 4
2 5
2 5
 ( ) dx   dx 
0 16 0
0 16 8

Varianza (parámetro de dispersión) de una v. a.
Varianza de una variable aleatoria(“grado
aleatoria( grado o medida de aleatoriedad, de
variabilidad, de dispersión”).
Ejemplos a modo de introducción.

ó
1)Sean X e Y v.a. con recorridos X()={0,1,2,3,4} e

Y()={-2,0,2,4,6} y funciones
f de densidad equiprobables en
ambos casos. De la simple observación de los recorridos, y tenida
en cuenta la equiprobabilidad, se tiene que E(X)=E(Y)=2. Sin
embargo, y a igualdad de condiciones, los valores de Y están
claramente más distanciados, más dispersos que los de X. Existen
distintas formas de poner de manifiesto esta diferencia y una de
ellas partiría, en primer lugar, seleccionando un valor de referencia
y calcular la media de las distancias de éste a cada valor de la
variable Si el valor de referencia es,
variable. es por ejemplo,
ejemplo el valor medio de
la variable aleatoria, entonces resultaría un parámetro de
dispersión denominado desviación media:

Varianza (parámetro de dispersión) de una v. a. (2)
E(
( X  x )  
xX()
x   x fx (
(x)
)  0  2 fx (0)  1  2 fx (1)  2  2 fx (2)  3  2 fx (3)  4  2 fx (4) 
2 1 0 1 2 6
 
5 5
E( Y   y )  
yY()
y   y fy (y)  2  2 fy (2)  0  2 fy (0)  2  2 fy (2)  4  2 fy (4)  6  2 fy (6) 
4  2  0  2  4 12
 
5 5
Por tanto, la desviación media de Y es el doble que la de X : la
variable Y tiene más contenido en aleatoriedad que X . Sin embargo,
el uso de la desviación media p presenta algunos
g inconvenientes
por el manejo del valor absoluto. Es preferible poner de
manifiesto la variabilidad de una variable, sobre todo a efectos
comparativos con el parámetro varianza (y su raíz cuadrada,
comparativos, cuadrada la
desviación típica) que calcula la media de los cuadrados de las
distancias de los valores de la variable a su valor medio:
4  1  0  1  4 10
2x  Var(X)  E (X   x )2   
xX()
(x   x )2 fx (x) 
5

5
2
16  4  0  4  16 40
2y  Var(Y)  E (Y   y )2   
yY()
(y   y )2 fy (y) 
5

5
8
y  2y  2 2  2 2x  2 x

2) Se consideran X= “nºn de caras obtenidas al lanzar 10 veces
una moneda”, e Y= “nº de caras obtenidas al lanzar 10 veces una
moneda”, con probabilidad de cara, en cada ensayo, p=0.5 y
p=0 1 respectivamente; con modelos de probabilidad (Binomial
p=0.1,
B(n,p)); funciones de densidad
10   1  x  1 10  x 10   1 10
     , x  0,1, 2,..., 10
fx (x)   x   2   2   x 2

0 , en el resto de 
10 
  0.1 0.9 
y 10  y
, y  0,1, 2,..., 10
fy (y)   y 
0 , en el resto de 

1
 x  np  10 5 ,  y  np  10  0.1
11
2
Las varianzas de ambas variables serán:

10 10
10 
 x2  E (X   x )2    (x  5)2 fx (x)   (x  5)2   0.5  10  0.5  0.5  2.5  npq
10
x 0 x 0  x 
10 10
10 
 y2  E (Y   y )2    (y  1)2 f (y)   (y  1)2 
y
y
 (0.1) (0.9)
10  y
 10  0.1  0.9  0.9  npq
y 0 y 0  y 

Luego,
g , la variabilidad de X es mayor
y que
q la Y: el contenido en
aleatoriedad, en variabilidad, es mayor en X que en Y.
Esta característica se pone de manifiesto si inspeccionamos
detalladamente sus funciones de densidad:
x/y fx(x) fy(y)
0 0,000976563 0,348678
1 0,00976563 0,38742
2 0,0439454 0,19371
3 0,117188 0,0573956
4 ,
0,205078 0,0111603
,
5 0,246094 0,00148803
6 0,205078 0,000137781
7 0,117188 0,000008748
8 0,0439454 0,0000003645
9 0,00976563 0,000000009
10 0,000976563 0,0000000001
p(1  X  9)  0.99 ,es decir, en el “99% de las ocasiones el nº de

caras que se obtenga será un nº entre 1 y 9”.
p(0  Y  3)  0.99, es decir, en el “99% de las ocasiones el nº de

caras que se obtengan será un nº entre 0 y 3”.
3) Retomamos el modelo
d l de
d probabilidad
b bilid d Normal
N l o de
d Gauss
G , N(,)
N( ),
cuya función de densidad es
1 (x  )2
1 
2 2
f(x)  e , -  x  
 2
 ,  parametros (constantes) ,   0
Al tratarse de un modelo continuo, deberemos sustituir, en el

cálculo de la varianza de los ejemplos
j p anteriores,, el “sumatorio”
por la integral correspondiente:
2
1  x  
  1  
2   
( )  E (
Var(X) (X  )2   
(x  )2f(
( f(x)dx
)d  

(x  )2
(
 2
e d
dx
x-
con el cambio y  ( x    y , dx  dy ) se tiene


1 1 1
 1  y2 1  y2 1   y2
Var(X)  
2
 y 2
e 2
dy   2
ye 2   2
e 2 dy  2

2 
2  2
 


 1
0

Comparación gráfica de modelos normales con idéntica media

pero distinta varianza:
Modelo Normal o de Gauss

0 12
0,12
=77 , =3.7
0,1 =77 , =7.4
0 08
0,08
f(x)
0,06
0 04
0,04
0,02
0
52 57 62 67 72 77 82 87 92 97 102
x

típica Sea X,
Varianza y desviación típica. X variable aleatoria,
aleatoria con función
de densidad f(x) y valor medio  ; se define su varianza, como el
parámetro siguiente:
2  2x  Var(X)  E (X  )2    (x  ) f(x)
xX()
2
, en caso de ser X discreta

    Var(X)  E (X  )  
2 2
x
2
 (x  ) f(x)dx
2
, en caso de ser X continua
La raíz cuadrada positiva de la varianza recibe el nombre de

desviación típica o desviación estándar de X,
X que expresa la medida
de dispersión en las mismas unidades que la variable:
   x   Var(X)
Este parámetro, medida de variabilidad, de dispersión de X, es

una medida del distanciamiento medio de la variable respecto de
su valor medio, señala cómo está repartida o dispersa la función
de probabilidad entre los valores de la variable.

Propiedades
p inmediatas.
1) Var(X)  0 (Var(X)  0  X  constante  )
2
2) Var(X)  E(X 2 )  E(X)  E(X 2 )   2
3) Si c es una constante, ( )  c2 Var(X)
Var(cX) ( ) , Var(X
(  c)
)  Var(X)
( )
4) Si X e Y son independientes, entonces Var(X  Y)  Var(X)  Var(Y)
5) Si X1 , X 2 ,..., X n son independientes; a1 , a2 , ...., an , b constantes,
2 2 2
entonces Var(a1 X1  a2 X 2  ...  an X n )  a1 Var(X1 )  a2 Var(X 2 )  ...  an Var(X n )
Ejemplo. Mencionamos de nuevo el caso de una variable X , con

B(n p),
que admite la
modelo de probabilidad binomial B(n,p)
descomposición en suma de variables Bernoulli , independientes:
X  X1  X2  ...  Xn , con
1 , si exito , p(Xi  1)  p
Xi  
0 , si fracaso , p(Xi  0)  1  p
i  1, 2,,...,n
,
Dado que obviamente Var(Xi)=pq, por el punto 5 se tiene que:

( )  Var(X
Var(X) ( 1  X2  ...  Xn) ( 1)  Var(X
)=Var(X ( 2 )  ...  Var(X
( n)
)=npq
pq

Estanda i ación o tipificación de una

Estandarización na variable aleato ia. Dada
a iable aleatoria
una variable aleatoria X, con valor medio  y desviación típica ;
la estandarización o tipificación de X , consiste en considerar la
variable
i bl
X
Z , en la que

 X    E(X  )
E(Z) E 
E(Z)=E  0
   
X   V ar(X  ) Var(X)
Var(Z)  Var    1
   2 2
(de esta forma, X    Z)
Dicho proceso
proceso, no modifica básicamente el modelo de
probabilidad de X, sí sus parámetros media y varianza, los
convierte en valores estándares. Veamos, por ejemplo, dicha
estandarización,
t d i ió a nivel
i l gráfico,
áfi en una variable
i bl con modelo
d l de
d
probabilidad normal N(, ) :

Modelos N(4,2.3) y N(0,1)
0,4
N(4,2.3)
N(0,1)
0,3
f(x) 0,2
0,1
0
-8 -4 0 4 8 12 16
x

Covarianza. Coeficiente de correlación.
Covarianza (medida de asociación entre variables aleatorias . Sea
(X,Y) una población bivariante (variable aleatoria bivariante), con
f(x,y) función densidad conjunta; x , y valores medios de X e Y,
respectivamente El parámetro covarianza entre X e Y se define de la
respectivamente.
forma siguiente:
Cov(X Y)  XY  E (X   x )(Y   y )

Cov(X,
Propiedades inmediatas
1) Cov(X, Y)  E(XY)  E(X)E(Y)  E(XY)   x y

2) a) Cov(X,X)=2x
b) Cov(c,
Cov(c X)  0 , si cc=constante
constante
c) Cov(aX  bY, Z)  aCov(X, Z)  bC ov(Y, Z) ; a, b constantes
3) Si X e Y son independientes, entonces cov(X, Y)  0
1
(la inversa no es cierta en general: X, X2 , X()  1, 0,1 , f(x)  )
3
4) Var(X  Y)  Var(X)  Var(Y)  2Cov(X, Y)
5) Si X1 , X2 , ..., Xn son v.a. , entonces
Var(X1  X2  ...  Xn )  Var(X1)  Var(X2 )  ...  Var(Xn )  2 Cov(Xi , X j )

i j

Covarianza. Coeficiente de correlación.(2)
Observaciones importantes.
p
a.) A la hora de obtener Cov(X,Y), utilizando la propiedad 1), es

preciso calcular E(XY), para lo cual se precisa f(x,y) , función de
densidad conjunta de (X,Y) :
E(XY)
( ) 
(x ,y)(X ,Y)()
xyf(x,
y ( , y) , e
en e
el caso d
discreto
sc eto
 
E(XY)   
 
xyf(x, y)dxdy , en el caso continuo
b.) Si (X,Y) está descrita por el modelo normal bivariante

N(x,y,x,y,) , cuya función de densidad conjunta es
 2 2

1   x   x   2  x   x   y   y    y   y  
2       
1 2(1   )   x    x    y    y  
f(x, y)  e  
2
2  x  y 1  
donde  x ,  y  0 ,  2  1
se p
puede comprobar
p q
que Cov(X,Y)=
( , )  x y .

c.) Del resultado anterior, se obtiene que
Cov(X, Y)  0  X e Y independientes
De manera que en este modelo de probabilidad el valor de la

covarianza establece de manera definitiva la independencia o no
de ambas variables.
d) Lo que sí asegura, en cualquier situación, el valor de este

parámetro en caso de ser distinto de cero,
parámetro, cero es la dependencia
entre X e Y, hecho que se deriva de la propiedad 3):
Cov(X, Y)  0  X e Y dependientes.
Como en muchas situaciones se desconoce el modelo de

probabilidad de (X,Y), se suele estimar el valor de la covarianza
con la
l covarianza muestral, a partir
i de
d una muestra, (X1,YY1),
)
(X2,Y2),...,(Xn,Yn) , extraída de la población:
n
 ((X i  X)(Y
)( i  Y)
)
Sxy  i 1
n 1
Un valor de Sxy significativamente distinto de cero, nos induciría a
admitir que X e Y son dependientes.
e ) Si una v.a.
e.) v a X admite la siguiente descomposición
X  X1  X2  ...  Xn donde Cov(Xi , X j)  0 , i  j
entonces
t por la
l propiedad
i d d 5) se tiene
ti que:
Var(X)  Var(X1)  Var(X2 )  ...  Var(Xn ) y, por tanto,
Var(Xi ) Var(Xi )
0  1
Var(X) Var(X1)  Var(X2 )  ...  Var(Xn )
lluego lla proporción o porcentaje de variabilidad de X debida o explicada

por Xi será
Var(Xi)
Var(X)

Coeficientes de correlación y determinación.
Coeficiente de correlación . Sea (X,Y) una población bivariante
(variable aleatoria bivariante), con f(x,y) función densidad
conjunta; x , y ,x , y valores medios y desviaciones típicas de
X e Y,
Y respectivamente.
respectivamente El parámetro coeficiente de correlación entre
X e Y se define de la forma siguiente:
Cov(X,
( , Y)
)
   xy 
x y
El cuadrado de dicho coeficiente, 2 , es llamado coeficiente de

determinación.
Interpretación de ambos coeficientes.(Muy importante)
La interpretación se deriva del siguiente resultado: Dada la
variable bivariante (X,Y), podemos encontrar dos constantes,  y
 , de manera que
Y  (   X)  Z , verificándose
ifi á d
1) E(Z)  0
2) Var(Z) sea mínima
3) Cov((   X), Z)  0

Coeficientes de correlación y determinación. (2)
En efecto:
Se define Z=Y-(+X) , cualesquiera que sean  y . La exigencia
que figura en 1) se traduce en lo siguiente:
E(Z)  E(Y  (   X))   y  (   x )  0     y   x
Además, pretendemos que, para esos valores  y , la varianza

d Z sea lo
de l más
á pequeña
ñ posible:
ibl
Var(Z)  Var(Y  (   X))  Var(Y)  Var(   X)  2Cov(Y,(   X))
 2y  2 2x  2 cov(X, Y)  2y  2 2x  2 x  y
dVar(Z) 
 22x  2 x  y  0     y
d x
y este valor  minimiza Var(Z) (verificadlo).

(verificadlo) Se deja como
ejercicio la comprobación de que la exigencia 3) se cumple para
los valores de  y  encontrados.
Por tanto, Y queda descompuesta en la forma siguiente:
y y   
Y  ( y   x   X)  Z   y   y (X -  x )  Z (1)
x x  x 

En decir,
decir la variabilidad de Y viene explicada o es debida a la
variabilidad de término lineal
y
y   (X -  x ) (2)
x
y a la variabilidad de Z .
En caso de ser Var (Z)=0, entonces Z=0, y resultaría que
y
Y  y   (X -  x )
x
significando, entonces, que la variabilidad de Y se debe

totalmente a la variabilidad de X.
Ahora bien
bien, si consideramos (1) ,enen general
general, y establecemos el
porcentaje de variabilidad de Y debida al término lineal (2) (ver
observación e)), se tiene:
y 2 2y
Var( y   (X   y ))  2
2x
x 
 x
2
 2  coeficiente de determinación
Var(Y) y
(Var(Z)  2y (1  2 ))

Por tanto: ell coeficiente

fi i t ded correlación
l ió , que varía
í entre
t –11y1
1, (
(asíí
como el coeficiente de determinación) es una medida del grado de
asociación lineal entre X e Y.

Estadistica Aplicada A La Biología Tema 3

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Aplicada A La Biología Tema 3

Cargado por

Copyright:

Formatos disponibles

Esquema del TEMA 3. Parámetros de v.

Parámetro de una variable aleatoria. Constante que señala de

Ejemplos a modo de introducción

Si se parte de una variable aleatoria

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 1

De modo similar al ejemplo anterior, podemos considerar

X:    , con recorrido X()  x1 , x2 ,..., xn  y densidad

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 2

3.) En el lanzamiento 10 veces de una moneda legal,

El cálculo realizado en los ejemplos previos, resulta, en este

En la situación general del modelo binomial B(n,p) , se tiene

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 3

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 4

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 5

4.) En relación a X = suma de resultados de dos lanzamientos de

el cálculo efectuado anteriormente, será:

Obsérvese que esta cantidad no es otra cosa que la media

2 (1 vez), 3 (2 veces), 4 (3 veces), 5 (4 veces), 6 (5 veces), 7 (6 veces),

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 6

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 7

5) Se realizan sucesivos ensayos (independientes) de una moneda

f(x)  (1  p)x 1p  qx 1p , x=1,2,....

El valor medio o valor esperado de X sería:

Observación: si p es la probabilidad de éxito/ensayo (“por

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 9

Para obtener, -en este caso, que afecta a un modelo continuo-

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 10

Modelo Triangular sobre [0,2] con punto medio 1

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 11

7) Como ya vimos en el tema anterior, el modelo uniforme sobre

valor que corresponde al punto medio del intervalo [a,b].

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 12

8) Si consideramos que el tiempo de espera hasta que un

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 14

9) Si X sigue el modelo de probabilidad Normal o de Gauss, N(,),

su valor medio o valor esperado será:

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 15

Gráfica de la función de modelo Normal N(77,3.7) :

Modelo Normal o de Gauss

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 16

siempre que, tanto la serie como la integral, existan.

Si calculamos el valor medio de Y, se tendría

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 18

Valor medio de transformada de una v v. a.

Valor medio de transformada de una v. a. multivariante.

Propiedades inmediatas de valor medio en base a lo anterior.

donde, trivialmente, E(Xi)=1p+0q=p , y por ello

E(X)  E(X1  X2  ...  Xn )=E(X1)  E(X2 )  ...  E(Xn)=nE(Xi)  np

un método más rápido y “elegante”

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 21

Ejemplos a modo de introducción.

1)Sean X e Y v.a. con recorridos X()={0,1,2,3,4} e

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 22

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 23

Las varianzas de ambas variables serán:

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 24

p(1  X  9)  0.99 ,es decir, en el “99% de las ocasiones el nº de

p(0  Y  3)  0.99, es decir, en el “99% de las ocasiones el nº de

Al tratarse de un modelo continuo, deberemos sustituir, en el

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 26

Comparación gráfica de modelos normales con idéntica media

Modelo Normal o de Gauss

Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM 27