Está en la página 1de 30

Medidas de dispersin

Clase dictada por Ana Vigna


Aspirante a Estadstica
Licenciatura en Relaciones Internacionales
8 de noviembre de 2010

Contenidos de la clase:
|

Medidas de dispersin:
z
z

Medidas:
z

Rango o recorrido

Rango o recorrido intercuartlico


Varianza
Desvo estndar o tpico
Coeficiente de variacin

z
z
z
|

qu son?
en qu se diferencian y cmo se relacionan con las
medidas de tendencia central?

Ejercicios de aplicacin

Frmulas para
datos originales y
agrupados
Ventajas y
desventajas

Medidas de dispersin
|

Indican si las puntuaciones


muy parecidas o m
muy distintas entre
p nt aciones son m
s.
Las siguientes distribuciones tienen todas una media de 4. Qu las
diferencia?

7, 6, 3, 3, 1
3, 4, 4, 5, 4
4, 4, 4, 4, 4

Existen dos procedimientos:


z
z

Considerar
ell recorrido
de lla escala
C
id
id o amplitud
lit d d
l en lla que se
distribuyen las puntuaciones;
Describir la variacin por medio de las diferencias que se
producen entre todas las puntuaciones y un ndice de
tendencia central.

Medidas de dispersin
|

En qu se diferencian con las medidas de tendencia


central?
|

Mientras las medidas de tendencia central nos indican dnde


se concentra un grupo de puntuaciones, las medidas de
dispersin refieren a la homogeneidad / heterogeneidad de
una distribucin.

Cmo se relacionan con las medidas de tendencia


central?
|
|

Son complementarias
Para calcular algunas medidas de dispersin es necesario
conocer los valores de otras medidas
Ambos tipos de medidas son necesarias para una
descripcin acabada de una distribucin

Rango o recorrido
ms
SSe calcula
l l restndole
t d l al
l valor
l
alto
lt d
de
una distribucin, el valor ms bajo
| Se aplica tanto a distribuciones de datos
originales,
d como a distribuciones de datos
agrupados.
|

Rango = Valor
.mximo

Valor .mnimo

Rango = Valor
.mximo

Valor
.mnimo

Distribucin de datos originales


Distribucin de encuestados segn edad:
z 20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48
Entre el encuestado de mayor edad y
z Rango = 63 18 = 45 aos
el ms joven, hay una diferencia de
45 aos
| Distribucin de datos agrupados
|

Distribucin de pases segn porcentaje de la


poblacin de 15 y ms aos de edad analfabeta,
Amrica Latina y el Caribe. Ao 2010

L. Inf. L. Sup
Fr(%)
0a5
2,5
5 a 10
7,5
10 a 20
15
20 a 42
31

Xc f
Ai
14
50
8
28
3
11
3
11
n (total)

fr (%)

Fi

14
22
25
28

5
5
10
22

50
78
89
100

Entre el pas con


mayor porcentaje de
analfabetismo y el
pas con menor
porcentaje, hay una
diferencia de 42
28
100

puntos
porcentu
ales
Fuente: Elaboracin propia en base a datos de CEPAL: Anuario estadstico de Amrica Latina y el Caribe, 2009

Rango = 42 0 = 42 puntos porcentuales

MEDIDA

Rango o
recorrido

VENTAJAS

Es fcil de calcular, y tiene


una interpretacin intuitiva

DESVENTAJAS
Es muy general, tan slo nos
da una idea de cun amplia es
la variacin entre puntajes
extremos.
No toma en cuenta los valores
intermedios de la distribucin.

Recorrido o rango intercuartlico


|
|
|

Es la diferencia entre el Q1 y el Q3
Nos indica la dispersin en el 50% central de la distribucin
Es ms sensible a la concentracin de los datos que el
recorrido ordinario
Su clculo es indistinto para datos originales como para datos
agrupados.

RI = Q3 Q
Q1

Rango
intercuartlico
Q1
25%

Q2
25%
25% P25

Q3
25%
P50

P75

RI = Q3 Q1
|
|

Datos originales
20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48

Q1 = 1/
4n

= 0,25* 12 =
3

Q3 = 3/
4n

= 0,75*12 =
9

18, 20, 20, 24, 32, 32, 32, 48, 49, 53, 59, 63
=(20+24)/2
Q1
=(20+24)/2
=22

RI = 51 22 = 29.aos

=(49+53)/2
Q3
=(49+53)/2
=51

oA partir de los 22 aos


hasta los 51 se ubica el
50% central de la
distribucin

o29 aos es la distancia existente


en el 50% central de la
distribucin

RI = Q3 Q1
|

Datos
agrupados

Distribucin de pases segn porcentaje de la


poblacin de 15 y ms aos de edad analfabeta,
Amrica Latina y el Caribe. Ao 2010

L. Inf. L. Sup
Xc f
fr (%)
Fi
Fr(%)
Ai
0a5
2,5
14
50
14
50
5
Lmite inferior del
5 a 10
7,5
8
28
22
78
5
intervalo que contiene
10 a 20
15
3
11
25
89
10
al primer cuartil (Fr%
20 a 42
31
3
11
28
100 22
supera al 25%)
n (total)
28
100
Total de casos
Frecuencia acumulada absoluta de la clase
anterior a la que contiene al primer cuartil

(1/ 4N Fi * Ai
L.Inf
.
Q1 =
fi 1)
+

Q1 = 0 + (1/ 4 * 28 0)
5

= 2,5

14

frecuenci absoluta simple de


a
la clase que

contie
ne al

Q 3 = 5 + (3 / 4 * 28 14)
5
primer cuartil

Amplitud del intervalo que


contiene al primer cuartil

10 20

= 9,4

RI = 9,4
2,5
25

= 6,9

10

MEDIDA

Rango o
recorrido

Rango
intercuartlico

VENTAJAS

DESVENTAJAS

Es fcil de calcular, y tiene


una interpretacin intuitiva

Es muy general, tan slo nos


da una idea de cun amplia es
la variacin entre puntajes
extremos.
No toma en cuenta los valores
intermedios de la distribucin.

Fcil de calcular
No sufre la influencia de los
No
valores extremos

Solo mide la dispersin en el


centro de la distribucin
Solo mide la distancia entre el
Solo
Q1 y Q3, y no la forma en que
los datos estn distribuidos

Varianza
|

Se basa en las diferencias entre la media aritmtica y cada


una de las puntuaciones
Es el promedio de los cuadrados de las distancias de las
observaciones a partir de la media (su valor nunca ser
negativo).
La frmula del clculo depender si la distribucin es de
datos originales o agrupados,
agr pados as como de si se trabaja con
poblaciones (se usa en el denominador N) o con una muestra
(se usa n-1).
N

Datos originales:

i 1

( X X )

i
2

S =

i =1

n 1

i =1

X nX
2
i

n1

Varianza
|

Se basa en las diferencias entre la media aritmtica y cada


una de las puntuaciones
Es el promedio de los cuadrados de las distancias de las
observaciones a partir de la media (su valor nunca ser
negativo).
La frmula del clculo depender si la distribucin es de
agrupados,
datos originales o agr
pados as como de si se trabaja con
poblaciones (se usa en el denominador N) o con una muestra
(se usa n-1).
N

Tabla de frecuencia

( X X ) * fi
n1

X fi nX
2
i

n1

de datos:

S =

i =1

i =1

n1

n1

Varianza
|

Se basa en las diferencias entre la media aritmtica y cada


una de las puntuaciones
Es el promedio de los cuadrados de las distancias de las
observaciones a partir de la media (su valor nunca ser
negativo).
La frmula del clculo depender si la distribucin es de
agrupados,
datos originales o agr
pados as como de si se trabaja con
poblaciones (se usa en el denominador N) o con una muestra
(se usa n-1).
N

Tabla de frecuencia

(
Xci

X)
* fi

22

Xc

de clases:

S =

fi nX
i =1

i =1

S =

x=
48

( X i X ) * fi

i =1

n1

X fi nX
2
i

i =1

n1

Datos originales

20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48

20 + 49 + 59 + 18 + 32 + 32 + 63 + 24 + 20 + 32 + 53 +
=

20
24
32

450 = 37,5.aos
12

12

Edad
18

Xi
1
324
324
2
400
800
1
576
576
3 1024
3072

Xi

*f
48
1
23
04
23
04
49

1
2401
2401
53
2809
2809

59
1
3481
3481
63
1
3969
3969

(Xi2 *fi)=
2

X1 = 1406,25

S =
n (Total)

48

12

19736

2304

19736 12 *
1406,25
11

5 aos

= 260,1

22

( Xci X ) * fi

S =

i =1

Tabla de frecuencia de clases:

Xc i fi nX

i =1

233
= 8,32.puntos.porcentuales
x = 28

L. Inf. L.
Sup Xc fi (Xc*f) Xc2 Xc2*f
0a5
2,5 14
35
6
87,5
5 a 10 7,5 8
60
56
450
10 20
3
225
10 a 20 15 3
45
225 675
20 a 42 31 3
93
961 2883
(Xc*fi)
(Xc2*fi)
n (total)
=
=
n (total)
28 = 233
= 4095,5

S =

4095,5 28 *
2
(8,32)
28

4095,5 28 *

=
(69,2)

28

1
= 77,1

MEDIDA

Rango o
recorrido

Rango
intercuartlico

Varianza

VENTAJAS

DESVENTAJAS

Es fcil de calcular, y tiene


una interpretacin intuitiva

Es muy general, tan slo nos


da una idea de cun amplia es
la variacin entre puntajes
extremos.
No toma en cuenta los valores
intermedios de la distribucin.

Fcil de calcular
No sufre la influencia de los
valores extremos

Solo mide la dispersin en el


centro de la distribucin
Solo mide la distancia entre el
Q1 y 3, y no la forma en que
los datos estn distribuidos

Considera todos los valores

Al expresarse en el cuadrado
de las unidades de los datos, es

de la distribucin

de difcil interpretacin.

Desvo estndar o tpico

Es la medida ms frecuentemente usada de variabilidad,


y se calcula como la raz cuadrada de la varianza.
Expresa la cantidad de variabilidad promedio en una
distribucin.
Nos permite determinar cmo se distribuyen los valores
en relacin con la media
Su frmula es indistinta para distribuciones de datos
originales o agrupados.
N

S=

i =1

S= S
|
|

Datos originales
20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48

22

260,1S = 260,1=
1 16,1.aos
1
=
1

Tabla de frecuencia de clases:

77,1
=

S = 77,1 8,8.puntos.porcentuales
=

MEDIDA

VENTAJAS

DESVENTAJAS

Es fcil de calcular, y tiene


una interpretacin intuitiva

Es muy general, tan slo nos


da una idea de cun amplia es
la variacin entre puntajes
extremos.
No toma en cuenta los valores
intermedios de la distribucin.

Fcil de calcular
No sufre la influencia de los
valores extremos

Solo mide la dispersin en el


centro de la distribucin
S l mide
id lla di
i entre ell
Solo
distancia
Q1 y Q3, y no la forma en que
los datos estn distribuidos

Varianza

Considera todos los valores


de la distribucin

Al expresarse
xpresarse en el cuadrado
Al
de las unidades de los datos, es
de difcil interpretacin.

Desvo
estndar o
tpico

Se expresa en las unidades


originales de la variable

Es sensible a las unidades de


medida

Rango o
recorrido

Rango
intercuartlico

Coeficiente de variacin
|

Hace referencia a la variabilidad relativa, relaciona la


media con el desvo
Nos indica el porcentaje de variacin que existe con
respecto al valor promedio de la distribucin.
Su frmula es igual para datos originales que para datos
agrupados.

S
CV = *100
100
X

S
CV = *100
X
|

Datos originales

16,1 * 100 = 43%


CV =
37,5
Tabla de frecuencia de clases:

8,8 * 100
%
100 = 106%
CV =
8,32

MEDIDA

VENTAJAS

DESVENTAJAS

Es fcil de calcular, y tiene


una interpretacin intuitiva

Es muy general, tan slo nos


da una idea de cun amplia es
la variacin entre puntajes
extremos.
No toma en cuenta los valores
intermedios de la distribucin.

Fcil de calcular
No sufre la influencia de los
valores extremos

Solo mide la dispersin en el


centro de la distribucin
S l mide
id lla di
t
i entre
t ell
Solo
distancia
Q1 y Q3, y no la forma en que
los datos estn distribuidos

Varianza

Considera todos los valores


de la distribucin

xpresarse en el cuadrado
Al expresarse
de las unidades de los datos, es
de difcil interpretacin.

Desvo
estndar o
tpico

Se
S expresa en llas unidades
id d
originales de la variable

Es sensible a las unidades de


medida

Es til para comparar la


Coeficiente de variabilidad entre conjuntos
de datos (de diferentes o
variacin
iguales unidades de medida)

Arrastra las limitaciones que


tiene la media como medida de
tendencia central

Rango o
recorrido

Rango
intercuartlico

Bibliografa
z

Garca Ferrando, M. Socioestadstica.


Introduccin a la estadstica en sociologa

Lind, Marchal, Mason: Estadstica para


Administracin y Economa

Repetto, D. Material de apoyo para el curso de


Estadstica de Relaciones Internacionales