Está en la página 1de 2

Interpretaciones geométricas de la media y la varianza.

Si X = (X1 , X2 , . . . , XN ), su media y su varianza son como sabemos


2
P P
X1 + · · · + XN i Xi i (Xi − X)
X= ≡ y Var (X) = ,
N N N
de manera que
2 2 1 X 2 1 X 2

Var (X) = X − X = Xi − ( Xi ) .
N i
N i
02
En la notación habitual del curso escribimos SX en lugar de Var (X).

El objetivo de esta nota es observar los dos hechos que siguen:

I. El vector constante de RN más cercano (en la norma euclı́dea) a X es


el vector (X, X, . . . , X):

La distancia del vector (t, . . . , t) a X, elevada al cuadrado, se expresa


mediante la función f dada por
X
f (t) = (Xi − t)2 .
i

Es derivable, con derivada


X X
0
f (t) = −2 (Xi −t) = −2 Xi +2 N t = −2 N X+2 N t = 2 N (t−X) ,
i i

negativa si t < X y positiva si t > X, ası́ que f es decreciente en


(−∞, X] y es creciente en [X, +∞), y su mı́nimo absoluto se alcanza en
t = X.
El valor de f (t) si t = X es N Var (X). Tomando las raı́ces cuadradas,

resulta que la desviación tı́pica de X multiplicada por N mide en
sentido euclı́deo lo variable que es X, su distancia al espacio de vectores

constantes. En la definición de la desviación tı́pica se divide por N
para normalizar las distancias: independientemente de N , la distancia
normalizada entre (1, 1, . . . , 1) y (0, 0, . . . , 0) es 1.
II. Podemos interpretar la varianza en términos de, literalmente, sumas
de cuadrados:

Supongamos para ello que Xi son números no negativos cuyos valores


podemos cambiar. Pero fijamos la cantidad de ellos, N , y el valor de su
P
suma S = i Xi . Notamos otra vez que S = N X. Como en el dibujo
(en el que N = 6), los valores Xi definen N cuadrados sobre la diagonal
de una cuadrado de lado S. ¿Cuál es el menor valor posible de la suma
de las áreas de dichos cuadrados?

X1 X2 X3 X4 X5 X6

Dicha suma vale i Xi2 , y entonces es fácil ver que su menor valor se
P

da cuando todos los Xi son iguales, o sea cuando Xi = X para todo i


2
(en cuyo caso las áreas suman N X ):
X P X2
2 2

i i
Xi2 −NX =N − X = N Var (X) ≥ 0 ,
i
N
y vale 0 únicamente cuando X es un vector constante.
Visto de esta manera, Var (X) (multiplicada por N ) mide la diferencia
entre la suma de áreas dadas por (Xi ) y la mı́nima suma posible. O sea, la
diferencia entre la suma de los cuadrados de Xi y la menor suma posible
P
si fijamos el valor de Xi .

También podría gustarte