Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Diblasi
CAPTULO III
MEDIDAS DE POSICIN Y DISPERSIN
I- MEDIDAS DE TENDENCIA CENTRAL
Una medida de tendencia central es un nmero que indica el centro de una
serie de datos, o de una distribucin. Se llaman tambin medidas de localizacin.
Si imaginamos los valores de un grupo de datos representados en un eje
horizontal, las medidas de tendencia central y localizacin nos dicen donde est el
centro de la distribucin.
A diario usamos, por ejemplo, la palabra promedio sin hacer ningn clculo
para referirnos al tiempo que demoramos en promedio para ir de nuestra casa al
trabajo, para calcular la cantidad de dinero que gastamos en nafta en el mes; para
ver cunto estamos dispuestos a gastar en promedio para comprar una
determinada prenda; etc. Si bien no hacemos ningn clculo en el momento, la
expresin tiene un significado muy til para transmitir a otros una informacin. Lo
que hacemos
66
Lidia C. Diblasi
Donde i=1 indica que hay que sumar todas las x disponibles desde x1 hasta xn.
Los smbolos i= 1 y N que aparecen abajo y encima del signo s e los conoce
como lmites de la sumatoria. Cuando est claro en el contexto cules son estos
lmites, pueden omitirse y escribir solamente .
Veamos un ejemplo:
Si tenemos las siguientes notas resultado de cuatro parciales y queremos calcular
el promedio, sumamos las cuatro notas y dividimos el resultado por la cantidad de
notas:
Notas: 7; 6,50; 8; 10
Media aritmtica o Promedio: 7+6,50+8+10= 31,50 /4 = 7,875
La diferencia entre las X mayscula y la x minscula se debe a que las
maysculas se refieren a la variable en estudio (como peso, estatura, etc.) y las
minsculas, a cada uno de los valores de la variable X
Si los valores x1+ x2+ x3+......xn ocurren f1+ f2+ f3+......fn respectivamente (es decir
que ocurren con frecuencia f1+ f2+ f3+......fn) la media aritmtica es:
N
67
f
i=1
Lidia C. Diblasi
unidades de anlisis.
Cuando, como resultado de un estudio, tenemos un conjunto de datos sin
organizacin, estos prcticamente no tienen ninguna significacin. Si los
organizamos teniendo en cuenta los valores observados, los ordenamos siguiendo
algn criterio, y tenemos en cuenta la frecuencia o cantidad de veces que se
repite cada uno de esos valores, ello nos permitir analizarlos y trabajarlos para
conocer por ejemplo: cul es el valor ms repetido, cul el menor valor, cul el
mayor, si hay mucha concentracin de los datos en pocos valores, o si por el
contrario estn muy dispersos.
Si la cantidad de datos es pequea y la vamos a trabajar manualmente nos
conviene ordenar los valores construyendo una tabla de frecuencias.
Veamos un ejemplo:
Los siguientes datos hacen referencia a la nota obtenida en un parcial por una
muestra de 20 alumnos
5
10
68
Lidia C. Diblasi
xi
fi
2
4
5
6
7
8
9
10
1
1
1
3
4
5
4
1
x f
i i
i=1
x = ___ ___
N
f
i=1
xi
fi
xi * fi
2
4
5
6
7
8
9
10
1
1
1
3
4
5
4
1
2
4
5
18
28
40
36
10
143
20
69
Lidia C. Diblasi
15
28
17
25
30
32
38
19
25
19
35
41
48
43
33
35
23
24
28
17
21
22
26
29
30
31
40
16
19
21
22
26
25
36
37
52
41
22
33
36
29
27
31
20
29
24
45
54
19
32
70
Lidia C. Diblasi
Intervalo
xi
fi
xi * fi
15 - 19
17
136
20 - 24
22
198
25 - 29
27
11
297
30 - 34
32
256
35 - 39
37
222
40 - 44
42
168
45 - 49
47
94
50 - 54
52
104
x f
i i
x = ___i=1___
N
i=1
x =
1475
50
(x - x)
i
=0
Veamos un ejemplo:
Si tenemos los siguientes valores de una variable X: 1; 3; 5:7; 9
y calculamos la media de esos valores nos da: 5
71
Lidia C. Diblasi
x =
xi
xi - x
-4
-2
= 25
25
= 5
5
=0
(x - x )
i
=0
(x - x ) f = 0
[ x f x fi ] = 0
i
i i
xi fi
[ xi fi - ______
fi ] = 0
fi
x f x f = 0
i i-
i i
72
Lidia C. Diblasi
(x - x )
i
= es un mnimo
xi
xi - x
(xi x )2
-4
16
-2
16
40
= 25 = 0
(x - x )
i
= 40
Supngase que se calculan los desvos con respecto a un punto cualquiera: c< x
c >x
xi
xi - 4
(xi 4)2
-3
-1
25
=5
45
= 25
c= 4
xi
xi - 8
(xi 8)2
-7
49
-5
25
-3
-1
(, )
85
= 25
c= 8
(x - x)
i
( - x)
= 45
= 85
73
Lidia C. Diblasi
los desvos es mayor que cuando los desvos se hacen respecto a la media. Esta
propiedad de la media nos permite el clculo de medidas de dispersin.
De la misma forma se puede demostrar con una serie con frecuencia
(x x )
i
fi. = a un mnimo
Carrera
Sociologa
Ciencia Poltica
Trabajo Social
Comunicacin Social
N (fi)
35
23
52
96
22.49
21.48
20.6
18.79
74
Lidia C. Diblasi
x =
4156,23
206
x = 20,17
75
Lidia C. Diblasi
23
22
21
20
19
18
Sociologa
Ciencia Poltica
Comunic. Social
Trabajo Social
Carreras
Fuente: elaboracin propia con los datos obtenidos de una encuesta realizada para el
proyecto de investigacin sobre los Perfil de los alumnos ingresantes a la Fac. Dir.
Diblasi, Lidia y colaboradores, SeCTyP, UNCuyo, 2007 2009.
76
Lidia C. Diblasi
Me =
11 + 15
2
Me = 13
fi
2
4
5
6
7
8
9
10
1
1
1
3
4
5
4
1
Fa
1
2
3
6
10
15
19
20
Me = 7
77
Lidia C. Diblasi
Donde:
Li: es el lmite inferior del intervalo de clase que en frecuencia acumulada contiene
la mitad de las unidades de anlisis.
Fa: es la frecuencia acumulada hasta el intervalo anterior a la frecuencia
acumulada que contiene la mitad de los valores.
fi: es la frecuencia absoluta correspondiente al intervalo que en frecuencia acumulada
contiene la mitad de las unidades de anlisis.
: es el tamao del intervalo de clase que en frecuencia acumulada contiene la mitad
de las unidades de anlisis.
Veamos un ejemplo:
Intervalo
xi
fi
Fa
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
17
22
27
32
37
42
47
52
8
9
11
8
6
4
2
2
8
17
28
36
42
46
48
50
25 17
Me = 25 + __________. 5
11
78
Lidia C. Diblasi
Me = 25 + 3,64
Me = 28,64
79
Lidia C. Diblasi
fi
2
4
5
6
7
8
9
10
1
1
1
3
4
5
4
1
Mo = 8
En el ejemplo la nota ms comn es 8, por lo tanto la Moda o Modo es igual a 8.
Cuando los valores de la variable, discreta o continua, se presentan en forma de
intervalos de clase, el modo se obtiene por interpolacin utilizando la siguiente
frmula:
Mo = Li +
1
__________ .
1 + 2
80
Lidia C. Diblasi
Donde:
Li: es el lmite del intervalo de clase modal (es decir, del intervalo que cuenta con
la mayor frecuencia)
1: es la diferencia entre la frecuencia modal y la frecuencia anterior.
2: es la diferencia entre la frecuencia modal y la frecuencia posterior.
Intervalo
xi
fi
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
17
22
27
32
37
42
47
52
8
9
11
8
6
4
2
2
Mo = 25 + 2
Mo = 27
81
Lidia C. Diblasi
15
10
Var1
82
Lidia C. Diblasi
MEDIDAS DE POSICION
83
Lidia C. Diblasi
Q1=7,5
Para el segundo cuartil (50 %) quedan seis datos ms pequeos y seis ms
grandes que el Q2 que es igual o coincide con la Me.
Xi: 2; 5; 7; 8; 10; 11; 15; 16; 23; 25; 29; 30
Q2 = 13 = Me
Y en el tercer cuartil quedan nueve datos menores a l y tres mayores:
84
Lidia C. Diblasi
Q3 = 24
Si los datos representan la edad de un conjunto de personas, podemos resumir
diciendo que el 25 % de la distribucin tiene hasta 7,5 aos; que el 50% tiene
hasta 13 aos y que el 75 % tienen hasta 24aos.
Xi: 2; 5; 7; 8; 10; 11; 15; 16; 23; 25; 29; 30
Q1=7,5
Q2 = 13
Q3 = 24
xi
fi
2
4
5
6
7
8
9
10
1
1
1
3
4
5
4
1
Fa
1
2
3
6
10
15
19
20
85
Q1
Q2 y Me
Q3
Lidia C. Diblasi
La frecuencia acumulada seis contiene a las 5 primeras notas por lo que el Q1 es igual
al valor de la variable 6, que en ste caso coincide con el valor de la frecuencia
acumulada
Q2
.w
Donde:
Qi: indica el cuartil en estudio.
Fa: es la frecuencia acumulada hasta el intervalo anterior al que en frecuencia
acumulada contiene la i-sima parte de las unidades de anlisis.
fi: es la frecuencia absoluta correspondiente al intervalo que en frecuencia
acumulada contiene la i-sima parte de las unidades de anlisis.
w: es el tamao del intervalo de clase que en frecuencia acumulada contiene la
i-sima parte de las unidades de anlisis.
Veamos un ejemplo
Seguimos con el ejemplo que usamos con las medidas de tendencia central: edad
al casarse un grupo de mujeres.
Si observamos la frmula vemos que lo primero que tenemos que hacer es
localizar el intervalo donde se encuentra el cuartil, si calculamos el 1 :
86
Lidia C. Diblasi
Qi = 20 +
Intervalo
xi
fi
Fa
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
17
22
27
32
37
42
47
52
8
9
11
8
6
4
2
2
8
17
28
36
42
46
48
50
12,5 8
.5
9
Qi = 20 + 2,5
Qi =
22,5
87
Lidia C. Diblasi
60
55
50
45
40
35
30
25
20
15
Me = 28.5
25%-75%= (22, 35)
Rango = (15, 54)
10
Edad
i. N/10 Fa
Di = Li + __________
fi
Por ejemplo para calcular el decil 4, debemos hacer N/10*4 = 20. Este valor se
encuentra contenido en la Fa = 28 que corresponde al intervalo 25-29
20 17
D4 = 25 + __________
11
.5
88
Lidia C. Diblasi
D4 = 25 + 1,36
D4 = 26,36 El 40% de las mujeres tiene hasta algo ms de 26 aos.
Percentiles: de manera similar a los cuartiles y deciles es posible calcular valores
que dividan al conjunto total en cien partes. Su definicin y forma de clculo son
similares a los deciles.
Veamos un ejemplo:
Calculamos el percentil 65 que es aquel valor que deja por debajo suyo al 65% de
los datos que son menores e iguales que l y, por encima, al 35% de los valores
mayores que el percentil 65. Seguimos con los mismos datos de las mujeres:
i. N/100 Fa
Pi = Li + __________ .
fi
50/100*65 28
P65 = 30 + __________ . 5
8
50/100*65 28
P65 = 30 + __________ . 5
8
P65 = 30 + 2,81
P65 = 32,81 El 65 % de las mujeres tiene aproximadamente hasta 33 aos
al contraer matrimonio.
MEDIDAS DE DISPERSION
89
Lidia C. Diblasi
90
Lidia C. Diblasi
(x x )
i
2=
i=1
______
N
s 2=
(x x )
i
i=1
______
n1
2=
(x x ) . f
i
_ i=1 _________
f
i=1
(x x ) . f
i
s2=
i=1
f
i=1
91
Lidia C. Diblasi
(x x )
i=1
_________
(x x) . f
2
i=1
_________
N
f
i=1
92
Lidia C. Diblasi
2 =
N121 + N222
_____________
N1 + N2
Veamos un ejemplo:
Si tenemos un conjunto de datos pequeo como:
Xi : 1; 3 ; 5; 7; 9
Seguimos los siguientes pasos para calcular la desviacin tpica:
1- se calcula la media o promedio de la distribucin
2- se obtienen los desvos de cada valor de la variable respecto a la media
3- se elevan los desvos al cuadrado
4- se suman todos los resultados
5- se divide la suma por la cantidad de casos, y
6- se calcula la raz cuadrada del resultado.
xi
xi - x
(xi x)2
-4
16
-2
16
= 25 = 0
40
= 2,83
5
93
40
Lidia C. Diblasi
Carrera
Media
Sociologa
22.49
Cia. Polticay Adm. Pblica
21.48
Trabajo Social
20.60
Comunicacin Social
18.79
Desv.
Tpica
8.11
7.56
6.57
1.59
Si analizamos los resultados del cuadro, podemos observar que, si bien los
promedios de edades de los alumnos al ingresar a la facultad de Ciencias Polticas
y Sociales, de la UNCuyo, no son muy diferentes, sin embargo las desviaciones
tpicas si lo son. Las edades de los alumnos de Sociologa estn mucho ms
dispersas respecto a la media que la de las otras carreras. En el otro extremo la
carrera de Comunicacin Social es la ms homognea, en cuanto a las edades,
que cualquier otra carrera, ya que su dispersin es muy pequea y no parece
haber valores extremos. En cambio Sociologa tiene valores muy extremos que
empujan la media hacia las edades mayores y por eso su dispersin es muy
grande.
Como tenemos los datos sin agrupar y dispuestos en una serie simple
hemos usado, para el clculo del desvo, la frmula serie simple, sin frecuencia.
Cuando trabajamos con una serie con frecuencia o datos agrupados en
clases usamos la frmula siguiente:
94
Lidia C. Diblasi
(xi
=
i=1
x )2. fi
_________
N
i=1
Intervalo
xi
fi
(xi - X)
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
17
22
27
32
37
42
47
52
8
9
11
8
6
4
2
2
-12.5
-7.5
-2.5
2.5
7.5
12.5
17.5
22.5
1250
506.25
68.75
50
337.5
625
612.5
1012.5
4462.25
50
= 89.25
95
Lidia C. Diblasi
89,25
CV = ___
x
Observaciones para su uso:
1. Solo se puede utilizar con escalas de razn.
2. No tiene sentido cuando la media es cero.
Veamos el ejemplo de los promedios de edad de los alumnos ingresantes a la
facultad de Ciencias Polticas y Sociales de la UNCuyo en el ao 2008,
Carrera
Sociologa
Cia. Polticay Adm. Pblica
Trabajo Social
Comunicacin Social
Media
22.49
21.48
20.60
18.79
Desv.
Tpica
8.11
7.56
6.57
1.59
CV (Sociologa) =
8.11
___ = ____
= 0.36
22.49
96
36%
Lidia C. Diblasi
CV (Cia. Poltica) =
7.56
___ = ____
6.57
___ = ____
CV (Comun. Social) =
35%
21.48
CV (Trabajo Social) =
= 0.35
= 0.32
20.60
1.59
___ = ____
32%
= 0.085
8.5%
18.79
Lidia C. Diblasi
98
Lidia C. Diblasi
99
Lidia C. Diblasi
Ejercicios propuestos
1- Con los datos que tiene a continuacin que representan la cantidad de horas
de estudio mensuales de los alumnos que ingresan a la universidad, calcular:
a- media b- desviacin tpica. y c- decil 70
Interpretar los resultados
Horas
estudio
5-9
10 - 14
15 - 19
20 - 24
25 - 29
Fi
15
18
9
5
2
2- Con los datos que tiene a continuacin que representan el crecimiento anual
de un grupo de nios de una determinada edad, calcular:
a- Cuartil tres , b- Media y c - desviacin tpica.
Crecimiento
en cm.
3-4
5-6
7-8
9 - 10
11 - 12
fi
5
8
10
15
12
100
Lidia C. Diblasi
Edad
cantidad de
personas
4
8
12
18
13
78
9 - 10
11 - 12
13 - 14
15 - 16
24 23 12 19 - 29 20 - 23
34 33 22 19 - 19 20 - 23
42 34 27 37 32 34 -37
101
Lidia C. Diblasi
Peso en kg
Fi
0,000 0,800
0,800 - 1,600
1,600 2,400
2,400 3,200
3,200 4,000
4,000 - 4,800
8
22
9
6
4
1
7- Con los datos que tiene a continuacin que representan los kilogramos
mensuales de pan consumidos por un grupo de familias calcular:
a) Media, Mediana, Modo y Desviacin tpica.
b) Explique solamente cmo calculara el 60 % central de esta distribucin.
Kg.
5-9
10 - 14
15 - 19
20 - 24
25 - 29
Fi
2
7
15
16
6
cantidad de flias.
5
12
19
38
45
27
12
4
1
3
102
Lidia C. Diblasi
103
Lidia C. Diblasi
Bibliografa consultada:
Ambrosi, Hugo Oscar, La verdad de las Estadsticas. Aprender con los datos
Lumiere, Buenos. Aires, 2008
Bancroft, Huldah, "Introduccin a la Bioestadstica", EUDEBA
Baranger, Denis, Construccin y anlisis de datos Ed. Universitaria, UNM,
Posadas, 1999
Blanch, Nidia y Joekes, Silvia: Estadstica Aplicada a la Investigacin Ndulos 3
y 4- Curso de posgrado; Fac. de Ciencias econmicas, Universidad Nacional de
Crdoba, 1994
Box, G.E.P.; Hunter, William; Stuart Hunter, J. Estadstica para investigadores.
Introduccin al diseo de experimentos, anlisis de datos y construccin de
modelos Ed. Revert, Mxico, 2005
Cea D`Ancona, Mara ngeles, Metodologa Cuantitativa. Estrategias y Tcnicas
de Investigacin Social Ed. Sntesis Sociologa, Madrid, 2001.
Daniel, Wayne: Estadstica con aplicaciones a las Ciencias Sociales y a la
Educacin, McGraw Hill latinoamericana, S.A. Bogot, Colombia. 1981
Garca Ferrando, Manuel: Socioestadstica. Introduccin a la estadstica en
sociologa, Alianza Universidad Textos, Madrid, 1992
Hernandez Sampieri, R.; Fernandez Collado, C.; Baptista Lucio, P. Metodologa
de la Investigacin Mc Graw Hill, Colombia 1994
Hopkins, kenneth; Hopkins, B.R.; Glass, Gene: Estadstica bsica para las
Ciencias Sociales y del Comportamiento Prentice-Hall Hispanoamrica, S.A.,
Mxico, 1997
Spiegel, Murray, " Estadstica", Serie de Compendios Shaum, McGraw Hill
Interamericana de Mxico S.A.,1994
Instituto Nacional de Estadsticas y Censos, Encuesta Permanente de Hogares,
Ministerio de Economa, Gran Buenos Aires Octubre de
1997.
Diblasi, Lidia y Romagnoli, Ricardo, "Medidas de tendencia central y de variacin",
1991.Apuntes de ctedras. Mimeo.
104