Interpretaciones geométricas de la media y la varianza.
Si X = (X1 , X2 , . . . , XN ), su media y su varianza son como sabemos
2 P P X1 + · · · + XN i Xi i (Xi − X) X= ≡ y Var (X) = , N N N de manera que 2 2 1 X 2 1 X 2
Var (X) = X − X = Xi − ( Xi ) . N i N i 02 En la notación habitual del curso escribimos SX en lugar de Var (X).
El objetivo de esta nota es observar los dos hechos que siguen:
I. El vector constante de RN más cercano (en la norma euclı́dea) a X es
el vector (X, X, . . . , X):
La distancia del vector (t, . . . , t) a X, elevada al cuadrado, se expresa
mediante la función f dada por X f (t) = (Xi − t)2 . i
Es derivable, con derivada
X X 0 f (t) = −2 (Xi −t) = −2 Xi +2 N t = −2 N X+2 N t = 2 N (t−X) , i i
negativa si t < X y positiva si t > X, ası́ que f es decreciente en
(−∞, X] y es creciente en [X, +∞), y su mı́nimo absoluto se alcanza en t = X. El valor de f (t) si t = X es N Var (X). Tomando las raı́ces cuadradas, √ resulta que la desviación tı́pica de X multiplicada por N mide en sentido euclı́deo lo variable que es X, su distancia al espacio de vectores √ constantes. En la definición de la desviación tı́pica se divide por N para normalizar las distancias: independientemente de N , la distancia normalizada entre (1, 1, . . . , 1) y (0, 0, . . . , 0) es 1. II. Podemos interpretar la varianza en términos de, literalmente, sumas de cuadrados:
Supongamos para ello que Xi son números no negativos cuyos valores
podemos cambiar. Pero fijamos la cantidad de ellos, N , y el valor de su P suma S = i Xi . Notamos otra vez que S = N X. Como en el dibujo (en el que N = 6), los valores Xi definen N cuadrados sobre la diagonal de una cuadrado de lado S. ¿Cuál es el menor valor posible de la suma de las áreas de dichos cuadrados?
X1 X2 X3 X4 X5 X6
Dicha suma vale i Xi2 , y entonces es fácil ver que su menor valor se P
da cuando todos los Xi son iguales, o sea cuando Xi = X para todo i
2 (en cuyo caso las áreas suman N X ): X P X2 2 2
i i Xi2 −NX =N − X = N Var (X) ≥ 0 , i N y vale 0 únicamente cuando X es un vector constante. Visto de esta manera, Var (X) (multiplicada por N ) mide la diferencia entre la suma de áreas dadas por (Xi ) y la mı́nima suma posible. O sea, la diferencia entre la suma de los cuadrados de Xi y la menor suma posible P si fijamos el valor de Xi .