Está en la página 1de 10

MEDIDAS DE DISPERSION

Son valores que tratan de medir el grado de concentración y acercamiento de un conjunto de datos con
respecto a una de las medidas de tendencia central, que generalmente es la media aritmética.

Las principales medidas de dispersión o variabilidad son:


a) Rango o recorrido
b) Varianza
c) Desviación estándar o desviación típica
d) Coeficiente de variación

MEDIDAS DE DISPERSION (Para datos no agrupados)

RANGO
El rango de variación o recorrido, “R”, de un conjunto de datos, es la diferencia entre el valor mayor y
menor. Esto es:
R= X máx− X mín
El uso del rango es muy limitado, porque depende únicamente de los valores extremos, lo que hace que
sea una medida pobre de dispersión.
Su ventaja principal es su simplicidad del cálculo.

Ejemplo: Dado un conjunto de datos: 4, 7, 9, 2, 14, 13, 8, 16, 9, 11


Hallar el rango.
Solución:
R  X máx  X mín  ....  ....  ....
Interpretación: El rango o recorrido de variación de los datos es …… .

VARIANZA
Es una medida que cuantifica el grado de dispersión o de variación de los valores de una variable
cuantitativa con respecto a su media aritmética.
Cuando el resultado de la varianza es un valor grande, se dice que los datos se encuentran bastante
dispersos o alejados de la media aritmética; si el resultado es bastante pequeño los datos estarán bastante
cercanos o concentrados alrededor de la media aritmética.
Se denota:
N
∑ ( X i−μ )2
2 σ 2 = i=1
- σ : Varianza para una POBLACION. N
n
∑ ( X i −X )2
2 S 2 = i=1
- S : Varianza para una MUESTRA. n−1

La varianza se define como la media aritmética de los cuadrados de las diferencias de los datos con
respecto a su media aritmética.
2 2 2
La varianza se mide en unidades cuadradas, por ejemplo, m , Km , Kg , etc.

1
2
Varianza ( S ) para una MUESTRA

La varianza de n valores,
X 1 , X 2 ,..., X n de una variable cuantitativa X cuya media aritmética
es X , es el número:
Fórmula abreviada
n n
∑ ( X i −X )2 ∑ X 2i −n X 2
S 2 = i=1 S 2 = i=1
n−1 ó n−1

Ejemplo:
Los datos siguientes se refieren a las ventas (en miles de soles), de 10 vendedores de una Cía. de
computadores. Calcular la varianza para los datos.
13, 6, 9, 2, 12, 4, 8, 16, 9, 11
Solución:
n
∑ Xi ....
13+6+. . .+ 11   ....
X = i =1 = =
Hallando en primer lugar la media: n 10 ....

Reemplazando en la fórmula de la varianza para una muestra:


n
∑ ( X i −X )2 ( −9 )2 +( −9 )2 +. ..+( −9 )2
S 2 = i=1 = =
n−1 10−1

Luego, la varianza es igual a ……..

Usando la fórmula abreviada para la varianza de una muestra:


n

X
2
2
 nX
i 1
i
......  ......
S2   
n 1 ....

n
∑ X 2i =13 2+62 +.. .+112 =
donde i =1

2
DESVIACION ESTANDAR
La desviación estándar de los datos, es la raíz cuadrada de la varianza.

Se denota:
σ : Para una Población
n

S : Para una Muestra


S=
√ ∑ X 2i −n X 2
i=1
n−1 (Desviación estándar)

La desviación estándar es uno de los estadísticos de mayor uso en el cual las unidades de la variable ya no
están elevadas al cuadrado sino están en unidades originales, el cual representa una medida adecuada de
dispersión.
La desviación estándar representa el alejamiento promedio que tienen los datos con respecto a la media
aritmética.

Ejemplo: Del ejemplo anterior, de las ventas (en miles de soles), de 10 vendedores de una Cía. de
computadores.
13, 6, 9, 2, 12, 4, 8, 16, 9, 11
Hallar la desviación estándar de los datos.

Solución:
n

Utilizamos la fórmula de la desviación estándar:

empleamos los resultados del ejemplo anterior y reemplazamos:


S=
√ ∑ X 2i −n X 2
i=1
n−1

X
2
2
 nX
i
....  ....
S i 1
  .....
n 1 ....

Luego, la desviación estándar es igual a …….. .

Interpretación:
Las ventas en promedio se desvían (alejan) en … soles con respecto a la media aritmética.

3
COEFICIENTE DE VARIACION
Es una medida de dispersión relativa (libre de unidades de medida), que se define como la desviación
estándar dividido por la media aritmética. Esto es,

S
C . V .=
X
Aplicaciones del Coeficiente de Variación
1) El coeficiente de variación se usa para saber si un conjunto de datos es homogéneo o heterogéneo, es
decir, si los datos están concentrados o dispersos. Para esto, se utiliza el siguiente criterio:
Si C . V .<0 . 33 Datos HOMOGENEOS
Si C . V .≥0 .33 Datos HETEROGENEOS
2) El coeficiente de variación también se utiliza para comparar la variabilidad (o dispersión) de 2 o más
conjuntos de datos que tengan unidades de medidas diferentes (por ejemplo, si un conjunto de pesos (en
Kg.) y otro conjunto de sueldos (en soles).
Se recomienda también para la comparación de 2 o más conjunto de datos que tengan las mismas
unidades.
Por ejemplo:
Si C . V A <C . V B : Entonces, los datos del Conjunto A presentan una menor variabilidad
(o dispersión) con respecto a los datos del Conjunto B.

Ejemplo: Del ejemplo anterior, de las ventas (en miles de soles), de 10 vendedores de una Cía. de
computadores.
13, 6, 9, 2, 12, 4, 8, 16, 9, 11
Decir si los datos son homogéneos o heterogéneos.
Solución:
S
C . V .=
Utilizamos la fórmula del coeficiente de variación (C.V.), X
n
∑ Xi
11+13+. . .+12
X = i =1 = = =
hallamos los valores de X y S , n 10 10

X
2
i
2
 nX
S i 1

n 1 …….

S
C . V .= = =
Luego, X ……

Interpretación:

4
Como el C . V .=.. .. . .. 0. 33 , entonces los datos de las ventas son ..……………

MEDIDAS DE DISPERSION (Para datos agrupados)

VARIANZA para datos agrupados


La varianza de n valores de una variable cuantitativa tabulados en m intervalos, con marcas
de clase
x 1 , x 2 , . .. , x m , con frecuencias absolutas simples respectivas
f 1 ,f 2 , .. .,f m , y con media
aritmética X , es el número:
m
∑ ( X i −X )2 f i
S 2 = i=1
n−1 ( Para una MUESTRA )
m
∑ X 2i f i−n X 2
S 2 = i=1
n−1 Fórmula Abreviada

DESVIACION ESTANDAR
m

X
2
f  nX
2
i i
S i 1

Se obtiene por la expresión: n 1

COEFICIENTE DE VARIACION

S
C . V .=
Se obtiene por: X

5
Ejemplo: Se tiene la siguiente información de las edades de 50 visitantes, en una distribución de
frecuencias. Hallar:
a) La varianza de los datos.
b) La desviación estándar. Interpretar.
c) El coeficiente de variación. Interpretar.

[ Linf , Lsup  xi fi xi f i
[ 20 , 30 > 1
[ 30 , 40 > 2
[ 40 , 50 > 5
[ 50 , 60 > 15
[ 60 , 70 > 19
[ 70 , 80 > 6
[ 80 , 90 > 2
Total

Solución:
a) Hallando la varianza
m
∑ xi f i
X = i =1 = =
obteniendo primeramente la mediar, n 50
Reemplazando en la fórmula para hallar la varianza de una muestra:
m
∑ X 2i f i−n X 2
S 2 = i=1 =
n−1
Luego, la varianza es igual a ………

b) Hallando la desviación estándar


m

X
2
2
i i f  nX
S i 1

utilizando la fórmula, n 1 =…….

Interpretación: ………………..

c) Hallando el coeficiente de variación


S
C . V .=
Se utiliza la fórmula, X

6
obteniendo X =…... y S =……

S
C . V .= = =
luego, X ……

Interpretación: ……………………………….

MEDIDAS DE FORMA
Son aquellas que permiten identificar la forma de la distribución del conjunto de datos, permitiendo
identificar la forma en que se separan o agrupan los valores de acuerdo a su representación gráfica. Se
presentan 2 fenómenos, conocidos como:
- Asimetría
- Curtosis

ASIMETRIA
Es el grado de inclinación que adopta la curva estadística respecto al centro de los datos. Esta medida nos
permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central
(Media aritmética). La asimetría presenta tres estados diferentes.

Asimetría negativa Simetría Asimetría positiva

Si la distribución es simétrica, entonces la media, la mediana y la moda coinciden. En contraposición, si


éstos 3 promedios no coinciden la distribución tiene que ser asimétrica.
Existen varias medidas de asimetría, una de ellas es el coeficiente de asimetría de Pearson.
3( X −Me)
As=
El coeficiente de Asimetría de Pearson está dado por: S

Clases de Asimetría
1) Si As >0 : La distribución es Asimétrica negativa.
Cuando la mayoría de los datos se encuentran por encima del valor de la media aritmética,
indica que hay un predominio de valores mayores.
2) Si As=0 : La distribución es Simétrica.
Los datos se distribuyen aproximadamente en la misma cantidad de valores en ambos
lados de la media.
3) Si As <0 : La distribución es Asimétrica positiva.
Cuando la mayor cantidad de datos se encuentran por debajo de la media, indica que hay un
predominio de valores menores.

7
CURTOSIS
Es el grado de elevación (o apuntamiento) que toma la curva estadística con respecto a la curva normal (o
campana de Gauss).

Clases de Curtosis
1.- Leptocúrtica.- Su grado de elevación está por encima de la curva normal. Los datos están bastante
concentrados (poca dispersión). Presenta un elevado grado de concentración alrededor de los valores
centrales de la variable.
2.- Mesocúrtica.- Su grado de elevación coincide con la curva normal (curva simétrica).
3.- Platicúrtica.- Su grado de elevación está por debajo de la curva normal. Toma la forma de un plato
aplanado. Los datos están bastante dispersos (mucha dispersión).

Q3 −Q1
k=
El coeficiente de curtosis esta dado por: 2( P90 −P 10 )

Los resultados obtenidos mediante esta fórmula se comparan e interpretan con los valores de la siguiente
tabla.

Valores Interpretación
k >0 . 263 Leptocúrtica (Curva Apuntada)
k =0 .263 Mesocúrtica (Curva normal)
k <0 . 263 Platicúrtica (Curva Aplanada)

8
Ejemplo: Se tiene la siguiente información de las edades de 50 visitantes, en una distribución de
frecuencias. Hallar:
a) El coeficiente de asimetría. Interpretar.
b) El coeficiente de curtosis. Interpretar.

[ Linf , Lsup  xi fi xi f i Fi
[ 20 , 30 > 1
[ 30 , 40 > 2
[ 40 , 50 > 5
[ 50 , 60 > 15
[ 60 , 70 > 19
[ 70 , 80 > 6
[ 80 , 90 > 2
Total
Solución:
a) Hallando el coeficiente de asimetría
3( X −Me)
As=
utilizando la fórmula, S
obteniendo los valores de,

X , Me  , S ,

3( X  Me) 3(....  ....)


As   
reemplazando, S ..... ….

Interpretación:………………….

b) Hallando el coeficiente de curtosis


Q3 −Q1
k=
utilizando la fórmula: 2( P90 −P 10 )

obteniendo,
Q1  …. , Q3  …. P10  …. P90  ….
, , ,

9
Q3  Q1 ....  ....
k 
reemplazando, 2( P90  P10 ) 2(....  ....) =….

Interpretación:………………….

10

También podría gustarte