Está en la página 1de 13

VICERRECTORADO ACADÉMICO

Decanato de Innovación para el Aprendizaje y Calidad


Educativa (DIACE)
Dirección de Currículo - Coordinación de Apoyo Docente
Núcleo Táchira

MEDIDAS DE DISPERSIÓN

MSc. Jean Carlo Ramírez

San Cristóbal marzo de 2020


Otras medidas necesarias para el análisis de una serie de datos en forma simple o en
forma de una distribución de frecuencias son las llamadas medidas de dispersión. Estas nos
van a permitir medir el grado de variabilidad (dispersión) de los valores de la serie con
relación al valor central que las representa.

Las medidas de dispersión absolutas, que vienen expresados en las mismas unidades
de la variable considerada y en las mismas unidades de su valor promedio, las más usadas
son: El recorrido o amplitud de la serie, la desviación típica o Standard, la desviación
media y la desviación intercuartil.

De las medidas de dispersión relativas, que no vienen expresadas en ninguna clase


de unidades, el más usado es el coeficiente de variación de Pearson, que establece una
relación porcentual entre la desviación típica y su media aritmética.

Dispersión o variación: es el grado en que los datos numéricos tienden a esparcirse


alrededor de un valor promedio.

EN SERIES SIMPLES

Si disponemos de los valores de n observaciones (Xi) X1, X2, X3,…, Xn-1, Xn,
podemos determinar sus medidas de dispersión.

Recorrido, rango o intervalo total de variación: es la medida más sencilla para medir
variación o dispersión de una serie de valores observados.

Si una serie de valores están ordenados por su magnitud y X1 es el valor menor y Xn


el valor mayor, el recorrido será igual a Xn – X1

Ejemplo

En una serie de datos se tiene:

Valor menor: 35
Valor mayor: 105

Recorrido = 105- 35 = 70

No es muy recomendable el uso de esta medida, ya que solo informa sobre la


variación entre el valor mayor y menor de la serie

2
La desviación típica o Standard (s) es la medida de dispersión que más se usa, ya que nos
indica la variabilidad de los valores de las observaciones con relación a su media
aritmética. Queda definida por la expresión:

∑ (X i − X )
2
s=
N

Al elevar los desvíos al cuadrado y extraer la raíz cuadrada de la media de dichos


desvíos, obtenemos un valor para s que viene expresado en las mismas unidades de la
variable y de la media aritmética de la serie. Al cuadrado de la desviación típica, s2, se le
denomina varianza.

Ejemplo:

Determinar la desviación típica o Standard de las siguientes series simples:

1. Salarios (Bs.): 60, 65, 70, 75, 80


2. Salarios (Bs.): 35, 40, 70, 100, 105

1. X =
∑ X i = 350 = 70
Xi Xi - 70 ( Xi - 70)2
N 5 60 -10 100
65 -5 25
70 0 0
75 +5 25
∑ (X i − X )
2
80 +10 100
s= 0 250
N

250
s= = 50 = 7,07 ≈ 7
5

2. X =
∑ X i = 350 = 70
Xi Xi - 70 ( Xi - 70)2
N 5 35 -35 1225
40 -30 900
70 0 0
100 +30 900
∑ (X i − X )
2
105 +35 1225
s= 0 4.250
N

4250
s= = 850 = 29,15 ≈ 29
5

3
Se observa de la comparación de las dos series que ambas tienen el mismo valor
para sus medias aritméticas, pero que la dispersión de la serie 2 es cuatro veces la
dispersión de la serie 1, cosa explicable, ya que los valores de la serie 1 están más próximos
(más concentrados) al valor de su media.

La desviación Media: Otra medida que nos da el grado de la dispersión de una serie de
valores observados con relación a su media aritmética o con relación a la mediana es la
desviación media. Se suele usar en la mayoría de los casos que no se conoce el valor de la
media aritmética de la serie. Esta medida se podrá determinar de acuerdo a las siguientes
expresiones:

n
∑ Xi − X
i =1
DM = ⇒ Desviación media con respecto a la media aritmética.
N
n
∑ X i − Md
i =1
DM = ⇒ Desviación media con respecto a la mediana.
N

Ejemplo: determinar la desviación media con relación a la media aritmética y con relación
a la mediana de las siguientes series simples:

1. Salario (Bs.): 60, 65, 70, 75, 90 ⇒ X = 72 , Md = 70


2. Salario (Bs.): 35, 40, 75, 100, 115 ⇒ X = 73 , Md = 75

n
∑ Xi − X
i =1 42 X −X X − Md
1. D M = = = 8,4 Xi i i
N 5 |Xi – 72| Xi – 70
60 12 10
65 7 5
n 70 2 0
∑ X i − Md 75 3 5
i =1 40 90 18 20
DM = = =8 42 40
N 5

4
n
∑ Xi − X X −X X − Md
Xi
2. D M = i =1 =
142
= 28,4
i
|Xi – 73|
i
Xi – 75
N 5 35 38 40
40 33 35
n 75 2 0
∑ X i − Md 100 27 25
i =1 140 115 42 40
DM = = = 28
N 5 142 140

De los resultados de ambas series se observa que la desviación media con relación a
la mediana es menor que la desviación media con relación a la media aritmética. Esto se
cumplirá siempre en cualquier serie donde la media aritmética y la mediana tengan distinto
valor.

DATOS AGRUPADOS

Desviación Típica: la desviación típica para una distribución de frecuencias se determina


mediante la siguiente expresión:

n
(
∑ X i − X .f i )2
i =1
s=
∑ fi

Ejemplo:

Determinar la desviación típica de la distribución de salarios de 80 obreros en la siguiente


tabla:

Salario en Bs. fi ∑ X i fi 5560


35 – 44 3 X= = = 69.5
45 – 54 12 ∑ fi 80
55 – 64 15
65 – 74 20
75 – 84 15
85 – 94 12
95 – 104 3
∑80

5
Construimos la siguiente tabla.

Salario en Bs. Xi fi Xi . fi (Xi − X ) (X − X)2 (X − X)2 .fi


i i
35 – 44 39.5 3 118.5 -30 900 2700
45 – 54 49.5 12 594 -20 400 4800
55 – 64 59.5 15 892.5 -10 100 1500
65 – 74 69.5 20 1390 0 0 0
75 – 84 79.5 15 1192,5 +10 100 1500
85 – 94 89.5 12 1074 +20 400 4800
95 – 104 99.5 3 298.5 +30 900 2700
∑80 ∑5560 18000

n
(
∑ X i − X .f i )2
i =1 18000
s= = = 225 = 15
∑ fi 80

El cálculo mediante esta fórmula se hace muy laborioso, especialmente si hay


numerosas observaciones y muchas clases, por lo que se prefiere el uso de una fórmula
abreviada como la siguiente:

2
∑ f i.d i
2
 ∑f d 
s= −  i. i  .ic
∑ fi  ∑ fi 

Para el uso de esta fórmula se requiere que la tabla de frecuencias se haya elaborado
con intervalos de clase iguales, de lo contrario hay que emplear la primera fórmula.

Salario en Bs. Xi fi di di2 fi.di fi.di2


35 – 44 39.5 3 -2 4 -6 12
45 – 54 49.5 12 -1 1 -12 12
55 – 64 (59.5) 15 0 0 0 0
65 – 74 69.5 20 +1 1 +20 20
75 – 84 79.5 15 +2 4 +30 60
85 – 94 89.5 12 +3 9 +36 108
95 – 104 99.5 3 +4 16 +12 48
∑=80 ∑=80 ∑=260

6
2
∑ f i.d i
2
 ∑f d 
s= −  i. i  .ic
∑ fi  ∑ fi 

2
260  80 
s= −   .10 = 3,25 − 1 .10 = 1,5 . 10 = 15
80  80 

Una vez calculada la desviación típica o standard de una distribución de frecuencias,


nos podríamos preguntar cuantas frecuencias y qué porcentaje del total caen en los
intervalos:
X ± S; X ± 2S; X ± 3S

Para el ejemplo anterior, calculadas su media aritmética y su desviación típica, nos


dio los siguientes resultados:

X = 70; S = 15

Por lo que los intervalos serán:

1. X ± S _____ 70 ± 1.(15) _____(55;85)


2. X ± 2S ____ 70 ± 2.(15) _____(40;100)
3. X ± 3S ____ 70 ± 3.(15) _____(25;115)

En el intervalo X ± S o sea entre los límites 55 y 85 caen 15 +20 +15 = 50


frecuencias, es decir, 50 obreros que devengan salarios entre Bs. 55 y 85, y que representan
el 62.5 % del total de obreros.

En el intervalo X ± 2S o sea entre los límites 40 y 100 caen 1,5 + 12 + 15 + 20 + 15


+ 12 + 1,5 = 77 frecuencias, es decir, o sea el 96.25 % del total de obreros.

En el intervalo X ± 3S o sea entre los límites 25 y 115, valores que están por debajo
del límite inferior y superior de la distribución y que por lo tanto contienen las 80
frecuencias o sea el 100% de las observaciones.

En la llamada CURVA NORMAL O CURVA DE GAUSS, que es una curva


simétrica en forma de campana se establecen los intervalos:

X±S en el cual caen el 68,27 % de las frecuencias


X ± 2S en el cual caen el 95.45 % de las frecuencias
X ± 3S en el cual caen el 99,73 % de las frecuencias

7
X − s X X + s X − 2s X X + 2s

X − 3s X X + 3s

Si comparamos los porcentajes que caen en los mismos intervalos del ejemplo
anterior, podemos concluir que dicha distribución de salarios, se aproxima bastante bien a
una CURVA DE GAUSS. De acuerdo a esta curva se elaboran tablas que nos dan áreas
(porcentajes de frecuencias) que caen entre dos valores de clase dados.

Desviación media: anteriormente se dijo que la desviación típica es la medida de


dispersión más usada, sin embargo cuando en una distribución de frecuencias no se puede
determinar su media aritmética, por ser una distribución con clases abiertas, o por el simple
hecho de que ya conocemos la mediana, se utiliza la desviación media.

La desviación media puede expresarse por la siguiente fórmula:

n
∑ X i − Md .f
i =1
i
DM =
∑ fi

8
Ejemplo determinar la desviación media del salario de los 80 obreros de la siguiente tabla:

Salario en Bs. Xi fi fa | Xi – Md | | Xi – Md |.fi


| Xi – 70 |
35 – 44 39.5 3 3 30.5 91.5
45 – 54 49.5 12 15 20.5 246
55 – 64 59.5 15 30 10.5 157.5
65 – 74 69.5 20 50 0.5 10
75 – 84 79.5 15 65 9.5 142.5
85 – 94 89.5 12 77 19.5 234
95 – 104 99.5 3 80 29.5 88.5
∑80 970

 ∑ fi 
 − fa 
Md = L i +  2 .c = 65 + 40 − 30 .10 = 65 + 5 = 70
 f Md  20
 
 

n
∑ X i − Md .f
i =1
i 970
DM = = = 12.1 ≈ 12
∑ fi 80

Ahora nos podemos preguntar cuántas frecuencias y que porcentaje del total cae en
el intervalo:

Md ± Dm, entre (70 ± 12) → (58;82)


En el intervalo (58; 82) caen 10.5 + 20 + 10.5 = 41 frecuencias, es decir que 41
obreros devengan salario entre Bs. 58 y 82 lo que significa que un 51.25% del total.

1
Nota: el primer 10.5 se obtiene de .(65 − 58).15
10

9
Desviación Semi - intercuartil: es otra medida que nos da el grado de dispersión de una
distribución de frecuencias pero no a lo largo de la distribución, sino de su parte central. Su
expresión matemática es:

Q 3 − Q1
Q=
2

Donde Q 3 y Q1 son el primer y tercer cuartil de los datos. Algunas veces se usa el rango
intrecuartilar Q3 − Q1 , aunque el rango semi – intercuartilar es más común como media de
dispersión.

Ejemplo:

Determinar la desviación semi – intercuartil del salario de los 80 obreros de la tabla:

Salario en Bs. fi Fa
35 – 44 3 3
45 – 54 12 15
55 – 64 15 30
65 – 74 20 50
75 – 84 15 65
85 – 94 12 77
95 – 104 3 80
∑80

Determinamos Q1 y Q 3

∑ fi − fa
Q1 = l i + 4 ⋅ ic
fq

20 − 15
Q1 = 55 + ⋅ 10
15

5
Q1 = 55 + ⋅ 10
15

50
Q1 = 55 + = 55 + 3.3 = 58.3
15

10
3∑ f i
− fa
Q3 = li + 4 ⋅ ic
fq

60 − 50
Q 3 = 75 + ⋅ 10
15

10
Q 3 = 75 + ⋅ 10
15

100
Q 3 = 75 + = 75 + 6.6 = 81.6
15

Q 3 − Q1 81.6 − 58.3 23.3


la desviación semi – intercuartil es: Q = = = = 11.6
2 2 2

Desviación Percentilar 10 – 90: el rango 10 – 90 de un conjunto de datos se define como:

P = P90 − P10

Donde P90 y P10 son los percentiles 10o y 90o de los datos. También puede utilizarse la
P90 − P10
desviación semi – percentilar 10-90: P = pero no es muy frecuente.
2

Dispersión relativa: las medidas de dispersión relativas nos indican la relación existente
entre la dispersión absoluta de una serie de frecuencias y su medida de tendencia central. El
grado de esta relación la mide un coeficiente que es independiente de las unidades en que se
expresa la variable.

El coeficiente más usado es el llamado Coeficiente de variación de Pearson, que


establece la relación entre la desviación típica y la media aritmética y se expresa
generalmente en porcentaje.

S
Cv = .100
X

11
Ejemplo:

En el ejemplo de los salarios de los 80 obreros obtuvimos como media aritmética de


los salarios X = 70 y como desviación típica S = 15 por lo que su dispersión relativa será:

15
Cv = .100 = 21.4%
70

Relaciones Empíricas entre medidas de dispersión:

Para distribuciones moderadamente sesgadas, se tienen las fórmulas empíricas:

4
1.- Desviación media = (desviación Standard)
5
2
2.- Rango semi – intercuartil = (desviación Standard)
3
Ambas son consecuencia del hecho de que la desviación media y el rango semi –
intercuartilar para la desviación Standard son iguales a 0.7979 y 0.6745 veces la desviación
Standard. Respectivamente.

Corrección de Sheppard: El cálculo de la desviación Standard tiene cierto grado de error


como resultado de la agrupación de los datos en clases (error de agrupación) para corregirlo
se utiliza la fórmula:

c2
Varianza corregida = Varianza de datos agrupados -
12

c2
Donde c es el tamaño del intervalo de clase. La corrección es llamada
12
corrección de Sheppard. Se usa para distribuciones de variables continuas, donde las
“colas” van gradualmente hacia cero en ambas direcciones.

Los estadisticos difieren respecto de cuándo y dónde debe aplicarse la corrección de


Sheppard. Ciertamente no antes de examinar de manera cuidadosa la situación, ya que con
frecuencia se tiende a sobre corregir, reemplazando un error por otro. Para efectos de la
presente cátedra no se utilizará la corrección de Sheppard, a menos que se indique.

12
Ejemplo

Aplique la corrección de Sheppard para determinar la desviación Standard del


salario de los 80 obreros de los ejemplos anteriores.

Obtuvimos para el salario de los 80 obreros:

c2 10 2
S2 = 225, c = 10 , varianza corregida = s2 - = 225 - = 225 – 8.33 = 216, 67
12 12

13

También podría gustarte