Está en la página 1de 15

MEDIDAS DE DISPERSIÓN

La sección anterior estuvo dedicada al estudio de algunas


medidas de tendencia central. Con mucha frecuencia, resulta de
igual importancia describir la forma en que las observaciones
están dispersas o diseminadas, a cada lado del centro. A estas
medidas se les conoce en general como medidas de dispersión,
variación o variabilidad. En esta sección se estudian las medidas
comúnmente empleadas para describir la dispersión de las
observaciones.

La medida de dispersión es importante debido a que dos muestras


de observaciones con el mismo valor central pueden tener una
variabilidad muy distinta.

La variabilidad de cualquier distribución se contempla


generalmente en términos de la desviación de cada valor
observado (X) con respecto a la media muestral :
X
Si las desviaciones: (X  X )

son pequeñas, obviamente los datos son están menos dispersos,


que si las desviaciones son grandes. Entonces, la desviación
proporciona información acerca del grado de dispersión en una
muestra. A fin de que la variabilidad pueda ser medida resulta
necesaria una fórmula basada en tales desviaciones.Sería de
esperarse que el promedio de éstas serviría para este fin, pero
esto es imposible debido a que algunas de las desviaciones son
negativas, algunas positivas y la suma de todas las desviaciones
es igual a cero.

Una solución posible a este problema consiste en calcular el


promedio de desviaciones.

DEFINICIÓN: El promedio de desviaciones PD (o desviación


promedio) es la media aritmética de los valores absolutos de las
desviaciones a partir de la media.
OBSERVACIONES NO AGRUPADAS:
Si X1, X2, ..., Xn forman una muestra de n observaciones, la
expresión para calcular el promedio de desviaciones es:

X i X
PD  i 1
n
en donde | | significa que los signos de las desviaciones no se
toman en cuenta.
OBSERVACIONES AGRUPADAS:
Si las X1, X2, ..., Xn observaciones ocurren con frecuencias
respectivas: f1, f2, ... , fk, la expresión para calcular el promedio de
desviaciones es:

k 
 X j X f j
j 1
PD 
k
 f j
j 1
EJEMPLO: Calcule el promedio de desviaciones de los siguientes
conjuntos de observaciones:

a) Observaciones sin agrupar:

xi : 0.49, 0.56, 0.53, 0.58, 0.48, 0-46, 0.41, 0.50, 0.40, 0.33

10

X i X
| 0.49  0.474 |  | 0.56  0.474 | ... | 0.33  0.474 |
PD  i 1

10 10
0.592
  0.0592
10
b) Observaciones agrupadas:

xj : 23 28 33 38 43 48 53 58 63
fj : 3 42 21 7 3 2 2 2 1
9

X
j 1
j  X fj
| 23  32.6988 | ( 3) | 28  32.6988 | (42)  ... | 63  32.6988 | (1)
PD  9

f
83
j
j 1

452.8916
  5.4565
83
c) Observaciones agrupadas en una distribución de frecuencias:

Intervalos xj fj fr Fa(Absolutas) Fa(Relativas)


(3.475, 4.375] 3.925 3 3/73 3 3/73
(4.375, 5.275] 4.825 2 2/73 5 5/73
(5.275, 6.175] 5.725 7 7/73 12 12/73
(6.175, 7.075] 6.625 19 19/73 31 31/73
(7.075, 7.975] 7.525 22 22/73 53 53/73
(7.975, 8.875] 8.425 13 13/73 66 66/73
(8.875, 9.775] 9.325 4 4/73 70 70/73
(9.775, 10.625] 10.225 3 3/73 73 73/73
TOTAL ------ 73 -------- -------- --------
8

X
j 1
j  X fj
| 3.925  7.2331 | ( 3) | 4.825  7.2331 | ( 2)  ... | 10.225  7.2331 | ( 3)
PD  8

f
73
j
j 1

76.1109
  1.0426
73

Uno de los defectos más importantes de esta medida es el hecho


de que se deban ignorar los signos de las desviaciones. No tomar
en cuenta los signos hace que el método no sea algebraico y la
medida no resulta conveniente para el manejo matemático.

Una forma de vencer esta dificultad consiste en trabajar con los


cuadrados de las desviaciones.
DEFINICIÓN: El promedio de desviaciones al cuadrado se le conoce
como varianza.

Si la varianza de un conjunto de observaciones es grande, se dice


que los datos tienen mayor variabilidad que un conjunto de datos
que tenga una varianza pequeña.

DEFINICIÓN: La desviación estándar(o típica) de un conjunto de


observaciones, es la raíz cuadrada positiva del promedio de las
desviaciones con respecto a la media elevadas al cuadrado.

La fórmula empleada para calcular la varianza y subsecuentemente


la desviación estándar, depende de silos datos están agrupados. En
primer lugar, se presenta una definición matemática básica del
concepto para datos no agrupados y después una forma más
conveniente de calcular la varianza y la desviación estándar para
tales datos.
OBSERVACIONES NO AGRUPADAS:
Sea X una variable aleatoria. Si se selecciona una muestra de n
observaciones X1, X2, ..., Xn, entonces la expresión para calcular la
varianza de X, representada por el símbolo : s2 , se expresa en la
siguiente forma:
n n

 i
( X  X ) 2
 i
( X  X ) 2

s2  i 1
n
 i 1

X
n
i
i 1

y la desviación estándar de X, denotada por s, es:

 i
( X  X ) 2

s i 1
n
OBSERVACIONES AGRUPADAS:
Si en una distribución de frecuencias las observaciones X1, X2, ..., Xn
ocurren con frecuencias respectivas: f1, f2, ... , fk, la expresión para
calcular la varianza es:
k k

(X j  X ) f j
j 1
2
 j
( X
j 1
 X ) 2
fj
s2  k

f
n
j
j 1

Generalmente la media muestral se emplea para realizar inferencias


acerca de la media de la población, ya que proporciona un buen
estimador de esta. De manera semejante, es razonable esperar que la
varianza muestral, proporcione un buen estimador de la varianza de
la población. Por desgracia, la varianza muestral calculada mediante
cualesquier de las fórmulas anteriores tiende a subestimar a la
varianza de población, es especial, cuando el tamaño de muestra es
pequeño.
Existe otra fórmula para la varianza muestral que proporciona una
estimación más precisa de la varianza de la población, esta se conoce
como varianza muestral insesgada:
n

2  i
( X  X ) 2

s  i 1
n 1
La ecuación de la varianza: s2
2
difiere de la ecuación s
sólo en el denominador: n está sustituida por (n - 1). Cuando el
tamaño de la muestra (n) es grande estas ecuaciones proporcionan
resultados aproximadamente iguales.

Resulta suficiente decir que se utiliza invariablemente esta


ecuación para estimar a la varianza de población.
A partir de las ecuaciones anteriores, podemos establecer la
siguiente relación entre ellas:

2
ns
s2 
( n  1)

Una fórmula adecuada para el cálculo de la varianza insesgada


cuando las observaciones no se encuentran agrupadas es la
siguiente:
n

n
( X i )2
2 X i  i 1
n
s  i 1
n 1
Finalmente, la fórmula correspondiente para el cálculo de la
varianza insesgada, cuando las observaciones se encuentran
agrupadas es:
k

k
( X j f j )2
2

j 1
X2j fj  j 1

n
s 
n 1

EJEMPLO: Calcule la varianza y la desviación estándar de los


siguientes conjuntos de observaciones:

a) Observaciones sin agrupar:

xi : 0.49, 0.56, 0.53, 0.58, 0.48, 0-46, 0.41, 0.50, 0.40, 0.33
10

10
( X i )2
2  Xi  i 1
10
2.3 
22.4676
10
s  i 1
  0.005915
10  1 10  1
s 0.005915  0.0769

b) Observaciones agrupadas:

xj : 23 28 33 38 43 48 53 58 63
fj : 3 42 21 7 3 2 2 2 1

9
( X j f j )2
2
 j fj 
X 2

j 1
j 1

83 93,962 
7,365,796
s   83  63.6277
83  1 82
s  63.6277  7.9767

c) Observaciones agrupadas en una distribución de frecuencias:

Intervalos xj fj fr Fa(Absolutas) Fa(Relativas)


(3.475, 4.375] 3.925 3 3/73 3 3/73
(4.375, 5.275] 4.825 2 2/73 5 5/73
(5.275, 6.175] 5.725 7 7/73 12 12/73
(6.175, 7.075] 6.625 19 19/73 31 31/73
(7.075, 7.975] 7.525 22 22/73 53 53/73
(7.975, 8.875] 8.425 13 13/73 66 66/73
(8.875, 9.775] 9.325 4 4/73 70 70/73
(9.775, 10.625] 10.225 3 3/73 73 73/73
TOTAL ------ 73 -------- -------- --------
8

8
( X j f j )2
2
 j fj 
X 2

j 1
j 1

73 3,953.2808 
278,799.8402
s   73  1.8626
73  1 72
s  1.8626  1.3648