Está en la página 1de 3

Medidas de dispersión

 Miden el grado de variación de los datos


 Indican si los datos están relativamente cercanos o si se encuentran dispersos.

1. Amplitud o rango
2. Varianza
3. Desviación estándar
4. Coeficiente de variación
5. Desviación media con respecto a la mediana
6. Amplitud intercuartílica

• La varianza, desviación estándar y el coeficiente de variación toman a la media


como punto de referencia
• Un valor de cero en cada una de estas medidas indica que no hay dispersión, en
tanto que un incremento del valor de la medida indica que la dispersión
aumenta.

1. Amplitud o rango

Es la diferencia entre el valor más grande y el valor más pequeño en el conjunto de


datos.
Ejemplo: 1 5 7 13 Amplitud = 13 - 1 = 12
Su limitación: sólo considera los valores extremos

2. Varianza

Varianza poblacional para datos no agrupados:


N N
( xi )2 xi2 N 2
2 i 1 i 1
N N

Varianza muestral para datos no agrupados:


n n
( xi x )2 xi2 nx 2
S2 i 1 i 1
n 1 n 1

Ejemplo
Sea X la variable que denota el número de unidades vendidas al día

4 5 12 9 10 8
7 4 5 3 0 1
8 2 15 7 9 11
9 8 7 8 6 12
2. Varianza
n
xi
i 1 170
x 7.08
n 24

n
x2 nx
2
i 1512 - 24(7.08) 2
S2 i 1
n 1 23

S2 13.43

i. La varianza y la desviación estándar no pueden ser negativas.

ii. La varianza y la desviación estándar pueden tomar el valor de cero cuando no


hay variación en los datos.
Sin embargo, los datos son variables por naturaleza y no constantes.

iii. Al calcular la varianza, se obtienen unidades al cuadrado (m2, Kg2, etc).


Es por esta razón que la principal medida de dipersión que se usa es la
desviación estándar, cuyo valor está dado en unidades originales de los datos
(m, Kg, etc.)

iv. Las desviaciones con respecto a la media


Xi X
se elevan al cuadrado porque la media actúa como punto de equilibrio.

La suma de las desviaciones con respecto a la media siempre es igual a cero.


Es decir:
n
( Xi X) 0
i 1

v. Si la varianza o la desviación estándar de una muestra es mayor con respecto a


la de otra, entonces la primera de éstas tiene mayor dispersión que la última.

Ejemplo
• Dos marcas de máquinas (A y B) han sido diseñadas para producir
cierto artículo.
• Tienen igual precio.
• Un fabricante, al decidir cuál comprar, ha observado 10 máquinas
diferentes de cada marca durante una hora de operación
El número de artículos producidos por cada máquina es registrado en la
siguiente tabla, donde:

Xi =número de artículos producidos por la i-ésima máquina de la marca A


Yi =número de artículos producidos por la i-ésima máquina de la marca B
Xi Yi
35 27
36 28
49 53
44 52
43 48
37 29
38 34
42 47
39 45
40 45
403 408

De los datos se obtiene x 40.3 y y 40.8

Por lo tanto, el número medio de artículos producidos por hora difiere en sólo
una fracción de unidad.
Pero, si se calculan las varianzas ambos casos,
S x2 18.233 Sx 4.270

S y2 104.40 Sy 10.218

Dado que la dispersión en el número de artículos producidos en la marca A es


menor que la de la B, el fabricante debe preferir la A

3. Coeficiente de variación

• Es una medida relativa de dispersión.


• Se expresa como porcentaje.
• Es útil, cuando se compara la variabilidad de dos o más conjuntos de datos
expresados en diferentes unidades de medición y cuando sus medias no son
más o menos iguales.

En el caso en que se cuente con los datos de la población, el coeficiente de


variación se obtiene a partir de la siguiente expresión:

.100

s
En el caso muestral, x .100

4. Desviación media con respecto a la mediana


n ~
Xi X
d.m. i 1
n

También podría gustarte