Está en la página 1de 4

40 TEMA 2.

ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL

2.7. Medidas de dispersión

Las medidas de posición que acabamos de estudiar tienen como misión, no solo situar
la distribución en el eje real, sino además sintetizar la información que proporciona la
distribución.
El promedio con el que representamos una distribución llevará a cabo esta misión con
mayor o menor fidelidad dependiendo de la relación que exista entre los valores de la
variable y el promedio.
Ası́, si todos los valores fueran iguales, la media, por ejemplo, coincidirı́a con todos
ellos por lo que representarı́a fielmente a la distribución.
A medida que los valores individuales de la variable difieran del promedio, la repre-
sentatividad de este será cada vez menor.
Por ello, para evaluar la representatividad de un promedio, necesitamos un indicador
que, de alguna forma, nos cuantifique el grado de separación de los valores de la variable
respecto al promedio en cuestión.
En este apartado estudiaremos las medidas de dispersión. Hay que tener en cuenta
que existen dos tipos de medidas de dispersión: las absolutas y las relativas.

2.7.1. Medidas de dispersión absoluta

Con las medidas de dispersión absoluta se trata de medir la separación que, por término
medio, existe entre los distintos valores de la variable, por lo que serán medidas que
vendrán expresadas en la misma clase de unidades que la variable.
Las principales medidas de dispersión absoluta son:

El recorrido o rango

El recorrido o rango o amplitud se define como la diferencia entre el mayor y el


menor valor de la variable. Es decir : Re = máx xi − mı́n xi = xk − x1
Si tenemos dos conjuntos de individuos en los que estamos estudiando la caracterı́stica
((peso)), si el recorrido del primer conjunto es Re(1)= 10 kg y el del segundo es Re(2)=5
kg, podemos considerar que la primera población tiene mayor dispersión absoluta que la
segunda.
El inconveniente de esta medida es que solo tiene en cuenta los valores extremos.

La varianza

De todas las medidas de dispersión absoluta, la varianza y su raı́z cuadrada, la des-


viación tı́pica, son las más importantes.
2.7. MEDIDAS DE DISPERSIÓN 41

Hasta ahora, al hablar de dispersión absoluta, no nos hemos referido a la solución que
parece más simple: promediar las desviaciones respecto
Pk a la media aritmética, con el signo
i=1 (xi − x̄)
correspondiente. Es decir, considerar la suma , pero como ya vimos en las
Pk N !
(x
i=1 i − x̄)
propiedades de la media, esta suma es nula = 0 y es por esto por lo que
N
no podemos utilizarla como medida de dispersión.
Ahora bien, si esta suma es igual a cero es porque las desviaciones positivas compen-
san exactamente las negativas, por lo que, podemos eliminar el problema utilizando una
potencia par de las desviaciones.
De todas las potencias pares, elegimos la más sencilla, y surge ası́ la nueva medida de
dispersión denominada varianza, que definimos como la media aritmética de los cuadrados
de las desviaciones de los valores observados de la variable respecto a la media aritmética
de la distribución. Se representa por S02 y es:

Pk
02 − x̄)2 ni
i=1 (xi
S =
N

Evidentemente, el valor numérico de S02 describe el mayor o menor grado de dispersión


de la distribución de frecuencias que se considere.
En general, cuanto más dispersas sean las observaciones, mayores serán las desviaciones
respecto a su media, y mayor por tanto, el valor numérico de la varianza.
Propiedades:

1. La varianza nunca puede ser negativa: S02 ≥ 0


Es evidente ya que es una media de cuadrados.
2. La varianza se puede calcular (desarrollando la expresión anterior) como:
Pk
02 x2 n i
S = i=1 i − x̄2
N
3. La varianza no se altera ante un cambio de origen. Es decir, que si hacemos el
cambio: ui = xi + a, la varianza de la variable U , es la misma que la de la variable
X.
En efecto: como ui = xi + a, sabemos que: ū = x̄ + a y por lo tanto: ui − ū = xi − x̄
Elevando al cuadrado, multiplicando por ni , sumando para todos los valores de i y
dividiendo por N , tenemos que:
Pk 2
Pk
02 (u i − ū) ni (xi − x̄)2 ni
S (U ) = i=1 = i=1 = S02 (X)
N N
4. Si se hace un cambio de origen y de escala, es decir, si se efectúa el cambio de
variable: ui = a + bxi , las varianzas de las dos variables están relacionadas por la
expresión: S02 (U ) = b2 S02 (X).
42 TEMA 2. ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL

En efecto: si hacemos un cambio de origen y de escala tenemos que: ui = a + bxi y


entonces ū = a + bx̄, restando ambas igualdades tenemos que : ui − ū = b(xi − x̄).
Elevando al cuadrado, multiplicando por ni , sumando para todos los valores de i y
dividiendo por N , se obtiene como resultado:
Pk Pk Pk
02 i=1 (ui − ū)2 ni b2 (xi − x̄)2 ni − x̄)2 ni
i=1 (xi
S (U ) = = i=1
= b2 = b2 S02 (X)
N N N

Ejemplos de cálculo de la varianza:


xi x2i Cinco observaciones que no se repiten (frecuencias iguales a 1)
0 0
Pk Pk
x i n i xi 10
1 1 x̄ = i=1 = i=1 = =2
N N 5
2 4
Pk 2
Pk
02 i=1 xi ni x2 30
3 9 S = − x̄ = i=1 i − x̄2 =
2
− 22 = 2
N N 5
4 16
10 30

xi ni xi ni x2i ni Diez observaciones, con cuatro valores distintos que se repiten


0 2 0 0
Pk
i=1 xi ni 17
1 3 3 3 x̄ = = = 1.7
N 10
2 1 2 4
Pk
02 x2i ni 43
3 4 12 36 S = i=1
− x̄2 = − 1.72 = 1.41
N 10
10 17 43

La desviación tı́pica

La varianza de la variable viene expresada en unidades de distinto orden que la variable


a la que se refiere. Ası́, si la variable se refiere a la estatura, expresada en centı́metros, la
varianza será un cierto número expresado en centı́metros cuadrados. Esta es la razón por
la que, para obtener una medida de dispersión, pero expresada en las mismas unidades
que la variable, se emplea la desviación tı́pica o desviación estándar, que es igual a
la raı́z cuadrada de la varianza, con signo positivo. Se representa por S0 :
s
Pk 2
i=1 (xi − x̄) ni
p
0 02
S =+ S =+
N

Al venir expresada en las mismas unidades que la variable, permite su comparación


con los valores de la variable.
Las propiedades de la desviación tı́pica se deducen fácilmente de las de la varianza.
2.7. MEDIDAS DE DISPERSIÓN 43

La cuasivarianza

Es una medida muy similar a la varianza (la única diferencia para el cálculo está en
el denominador):
Pk
(xi − x̄)2 ni
S2 = i=1
N −1
y es muy utilizada en Inferencia Estadı́stica.

La cuasidesviación tı́pica

Es la raı́z cuadrada positiva de la cuasivarianza.


s
Pk 2
i=1 (xi − x̄) ni
p
2
S=+ S =+
N −1

2.7.2. Medidas de dispersión relativa

Con las medidas de dispersión relativa, se trata de medir la dispersión, con indepen-
dencia de la clase de unidades en que venga expresada la variable. Estas medidas, permiten
comparar la dispersión existente en dos distribuciones, cuyas variables vengan expresadas
en distinta clase de unidades.
De entre las medidas de dispersión relativa, llamadas también ı́ndices de dispersión,
las más importantes son:

El recorrido relativo

Se define como el cociente entre el recorrido de la variable y la media aritmética:


Re
Rr =
|x̄|

Nos indica el número de veces que el recorrido contiene a la media aritmética.

El coeficiente de variación o ı́ndice de dispersión de Pearson

Es el más empleado de los ı́ndices de dispersión relativos. Se designa por CV:

S0
CV =
|x̄|

Este número nos indica el número de veces que la desviación tı́pica contiene a la media,
o lo que es lo mismo, el tanto que representa S0 por cada unidad de x̄ (es un tanto por

También podría gustarte