Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capítulo III Medidas de Posición y Dispersión. Personalizado
Capítulo III Medidas de Posición y Dispersión. Personalizado
Diblasi
CAPÍTULO III
66
Lidia C. Diblasi
N N
N
Donde Σ i=1 indica que hay que sumar todas las x disponibles desde x1 hasta xn.
Los símbolos i= 1 y N que aparecen abajo y encima del signo ∑ s e los conoce
como límites de la sumatoria. Cuando está claro en el contexto cuáles son estos
límites, pueden omitirse y escribir solamente ∑.
Veamos un ejemplo:
67
Lidia C. Diblasi
N
Donde Σ fi = N es la frecuencia total, es decir el número total valores o de las
i=1
unidades de análisis.
Veamos un ejemplo:
Los siguientes datos hacen referencia a la nota obtenida en un parcial por una
muestra de 20 alumnos
5 8 7 9 6 8 8 9 5 9
2 4 6 9 7 8 7 6 10 8
68
Lidia C. Diblasi
xi fi
2 1
4 1
5 1
6 3
7 4
8 5
9 4
10 1
Σx f i i
i=1
x = ___ ___
N
Σf
i=1
i
xi fi xi * fi
2 1 2
4 1 4
5 1 5
6 3 18
7 4 28
8 5 40
9 4 36
10 1 10
143
x =
20
69
Lidia C. Diblasi
15 28 17 25 30 32 38 19 25 19
35 41 48 43 33 35 23 24 28 17
21 22 26 29 30 31 40 16 19 21
22 26 25 36 37 52 41 22 33 36
29 27 31 20 29 24 45 54 19 32
70
Lidia C. Diblasi
Intervalo xi fi xi * fi
15 - 19 17 8 136
20 - 24 22 9 198
25 - 29 27 11 297
30 - 34 32 8 256
35 - 39 37 6 222
40 - 44 42 4 168
45 - 49 47 2 94
50 - 54 52 2 104
Σx f i i
x = ___i=1___
N
Σf i
i=1
1475
x =
50
Σ (x - x)
i =0
Veamos un ejemplo:
71
Lidia C. Diblasi
25
x = = 5
5
xi xi - x
1 -4
3 -2
5 0
7 2
9 4
∑ = 25 ∑=0
Σ (x - x ) f = 0
i i
Σ [ x f – x Σfi ] = 0
i i
Σ xi fi
Σ [ xi fi - ______ Σfi ] = 0
Σfi
Σx f Σ x f = 0
i i- i i
72
Lidia C. Diblasi
Σ (x - x )
i
2
= es un mínimo
xi xi - x (xi – x )2
1 -4 16
3 -2 4
5 0 0
7 2 4
9 4 16
∑ = 25 ∑ = 0 40
Σ (x - x )
i
2
= 40
Supóngase que se calculan los desvíos con respecto a un punto cualquiera: c< x
óc >x
xi xi - 4 (xi – 4)2
1 -3 9 xi xi - 8 (xi – 8)2
3 -1 1
1 -7 49
5 1 1 3 -5 25
7 3 9 5 -3 9
9 5 25 c= 4 7 -1 1
∑ = 25 ∑ =5 45 9 1 1
∑ = 25 ∑ (ξ,ι − ξ) 85
c= 8
Σ (x - x)
i
2
= 45 Σ ( - x)
i
2
= 85
73
Lidia C. Diblasi
los desvíos es mayor que cuando los desvíos se hacen respecto a la media. Esta
propiedad de la media nos permite el cálculo de medidas de dispersión.
Σ (x – x )
i
2
fi. = a un mínimo
Carrera N (fi) X
Sociología 35 22.49
Ciencia Política 23 21.48
Trabajo Social 52 20.6
Comunicación Social 96 18.79
74
Lidia C. Diblasi
35 + 23 + 52 + 96
4156,23
x = x = 20,17
206
Más allá de las diferencias de medias de cada carrera, la edad promedio del
grupo que ingresó a la Facultad en el año 2008 es de 20,17 años. La Media
Ponderada nos permite dar un solo valor que refleje a todos los grupos involucrados.
La importancia de esta media de medias es que confirma la propiedad de la
media aritmética de ser el centro de gravedad de la distribución ya que tiene en
cuenta el peso que poseen las frecuencias de cada valor de media grupal. En nuestro
ejemplo la Carrera de Comunicación Social tiene una frecuencia que es muy superior
a la de las otras carreras.
Resumiendo podemos decir que la carrera de Comunicación Social tiene
mayor peso, al tener mayor cantidad de alumnos entrevistados y el más bajo
promedio en edad al ingresar a la facultad, por ser el grupo más homogéneo, o
con menor dispersión en esta variable.
Si los grupos tienen, en alguna característica, diferencias importantes es
bueno calcular la media ponderada, que nos da una visión de conjunto y, a su vez,
la media por grupos para mostrar o “revelar” las diferencias.
Podemos hacer el gráfico que nos muestra muy bien las diferencias entre
los grupos y que a su vez nos permite visualizar dónde se ubicaría la media de
medias o media ponderada de todos los subgrupos estudiados:
75
Lidia C. Diblasi
23
22
21
Edad promedio al ingreso
20
19
18
Sociología Ciencia Política Comunic. Social Trabajo Social
Carreras
Fuente: elaboración propia con los datos obtenidos de una encuesta realizada para el
proyecto de investigación sobre los “Perfil de los alumnos ingresantes a la Fac….” Dir.
Diblasi, Lidia y colaboradores, SeCTyP, UNCuyo, 2007 – 2009.
76
Lidia C. Diblasi
11 + 15
Me = Me = 13
2
xi fi Fa
2 1 1
4 1 2
5 1 3
6 3 6
7 4 10
8 5 15
9 4 19
10 1 20
Me = 7
77
Lidia C. Diblasi
N/2 – Fa
Me = Li + __________ . ω
fi
Donde:
Li: es el límite inferior del intervalo de clase que en frecuencia acumulada contiene
la mitad de las unidades de análisis.
Fa: es la frecuencia acumulada hasta el intervalo anterior a la frecuencia
acumulada que contiene la mitad de los valores.
fi: es la frecuencia absoluta correspondiente al intervalo que en frecuencia acumulada
contiene la mitad de las unidades de análisis.
ω: es el tamaño del intervalo de clase que en frecuencia acumulada contiene la mitad
de las unidades de análisis.
Veamos un ejemplo:
Intervalo xi fi Fa
15 - 19 17 8 8
20 - 24 22 9 17
25 - 29 27 11 28
30 - 34 32 8 36
35 - 39 37 6 42
40 - 44 42 4 46
45 - 49 47 2 48
50 - 54 52 2 50
25 – 17
Me = 25 + __________. 5
11
78
Lidia C. Diblasi
Me = 25 + 3,64
Me = 28,64
1- La media aritmética utiliza más información que la mediana, ya que usa todos
los datos, mientras que la mediana solo toma la marca del o de los casos
medios. Si los valores superiores o inferiores a la mediana fueran marcas muy
elevadas o muy bajas (valores extremos), la mediana permanecería inalterable,
mientras que la media aumentaría o disminuiría considerablemente. Por lo
tanto, podemos decir que: la media resulta afectada por cambios de los valores
extremos, en tanto que la mediana permanece inalterada, a menos que cambie
el valor del caso medio.
2- La media es por lo regular una medida más estable que la mediana, en cuanto
varía menos de una muestra a otra. En la Estadística inductiva, el investigador
tendrá interés en generalizar acerca de la población, partiendo de una muestra.
Si bien, no puede tomar todas las muestras posibles de una población, es
importante que sepa, que las medias de las muestras variarán menos de una a
otra que las medianas.
79
Lidia C. Diblasi
Cuando tenemos una serie de datos como la de las notas de un grupo de alumnos
en un examen parcial, la moda es siguiendo su definición el valor “más común”
xi fi
2 1
4 1
5 1
6 3
7 4
8 5
9 4
10 1
Mo = 8
∆1
Mo = Li + __________ . ω
∆1 + ∆2
80
Lidia C. Diblasi
Donde:
Li: es el límite del intervalo de clase modal (es decir, del intervalo que cuenta con
la mayor frecuencia)
∆1: es la diferencia entre la frecuencia modal y la frecuencia anterior.
∆2: es la diferencia entre la frecuencia modal y la frecuencia posterior.
ω: es el tamaño del intervalo de clase modal.
Intervalo xi fi
15 - 19 17 8
20 - 24 22 9
25 - 29 27 11
30 - 34 32 8
35 - 39 37 6
40 - 44 42 4
45 - 49 47 2
50 - 54 52 2
2
Mo = 25 + __________ . 5
2 +3
Mo = 25 + 2 Mo = 27
81
Lidia C. Diblasi
55
50
45
40
35
30
25
20
15 Me = 28.5
25%-75%
10
Var1
82
Lidia C. Diblasi
“La moda es aplicable para cada una de las cuatro escalas de medición. Sólo la
moda tiene significado para variables categóricas como afiliación política, afiliación
religiosa, especialidad académica u ocupación. Sin embargo, para fines
inferenciales, la moda tiene una desventaja distintiva: la moda de una muestra no
es una estimación muy confiable de su moda de población a menos que el tamaño
de la muestra aleatoria sea extremadamente grande. La confiabilidad en
estadística representa la precisión con la cual la estadística estima el parámetro
de población correspondiente. Establecido de forma diferente, hay un gran error
de muestreo asociado con la moda de la muestra; el error de muestreo es la
diferencia entre el estadígrafo de la muestra y el parámetro de población
correspondiente. La mediana de la muestra es más confiable (es decir, tiene un
error de muestreo menor) que la moda de la muestra; la media de la muestra
tiene un error de muestreo menor que la moda o la mediana, lo cual es una razón
del porqué tiende a ser preferida para fines inferenciales” (Hopkins, K; Hopkins,B;
Glass, G. 1997; 44)
MEDIDAS DE POSICION
83
Lidia C. Diblasi
84
Lidia C. Diblasi
xi fi Fa
2 1 1
4 1 2
5 1 3
6 3 6 Q1
7 4 10 Q2 y Me
8 5 15 Q3
9 4 19
10 1 20
85
Lidia C. Diblasi
La frecuencia acumulada seis contiene a las 5 primeras notas por lo que el Q1 es igual
al valor de la variable 6, que en éste caso coincide con el valor de la frecuencia
acumulada
Q1= 6 el 25 % de las notas más bajas de los parciales fue de hasta 6 puntos.
La frecuencias acumulada diez contiene al 50 % de los casos, por lo que el valor del
i. N/4 – Fa
Qi = Li + __________ .w
fi
Donde:
Qi: indica el cuartil en estudio.
Fa: es la frecuencia acumulada hasta el intervalo anterior al que en frecuencia
acumulada contiene la i-ésima parte de las unidades de análisis.
fi: es la frecuencia absoluta correspondiente al intervalo que en frecuencia
acumulada contiene la i-ésima parte de las unidades de análisis.
w: es el tamaño del intervalo de clase que en frecuencia acumulada contiene la
i-ésima parte de las unidades de análisis.
Veamos un ejemplo
Seguimos con el ejemplo que usamos con las medidas de tendencia central: edad
al casarse un grupo de mujeres.
Si observamos la fórmula vemos que lo primero que tenemos que hacer es
localizar el intervalo donde se encuentra el cuartil, si calculamos el 1º :
86
Lidia C. Diblasi
Intervalo xi fi Fa
15 - 19 17 8 8
20 - 24 22 9 17
25 - 29 27 11 28
30 - 34 32 8 36
35 - 39 37 6 42
40 - 44 42 4 46
45 - 49 47 2 48
50 - 54 52 2 50
12,5 − 8
Qi = 20 + .5
9
Qi = 20 + 2,5
87
Lidia C. Diblasi
60
55
50
45
40
35
30
25
20
15 Me = 28.5
25%-75%= (22, 35)
10 Rango = (15, 54)
Edad
i. N/10 – Fa
Di = Li + __________ .ω
fi
Por ejemplo para calcular el decil 4, debemos hacer N/10*4 = 20. Este valor se
encuentra contenido en la Fa = 28 que corresponde al intervalo 25-29
20 – 17
D4 = 25 + __________ .5
11
88
Lidia C. Diblasi
D4 = 25 + 1,36
i. N/100 – Fa
Pi = Li + __________ . ω
fi
50/100*65 – 28
P65 = 30 + __________ . 5
8
50/100*65 – 28
P65 = 30 + __________ . 5
8
P65 = 30 + 2,81
MEDIDAS DE DISPERSION
89
Lidia C. Diblasi
90
Lidia C. Diblasi
Σ (x – x )i
2
σ2= i=1
______
N
Σ (x – x ) i
2
s 2= i=1
______
n–1
El denominador n – 1 nos da una medida más útil para los propósitos inferenciales
como veremos más adelante.
Cuando trabajamos con series con frecuencia las fórmulas a usar serán:
Σ (x – x ) . f
i
2
i
σ2= _ i=1 _________ cuando trabajamos con la población
N
Σf i=1
i
Σ (x – x ) . f
i
2
i
s2= i=1
_ cuando trabajamos con la muestra
n
Σf i=1
i
91
Lidia C. Diblasi
Σ (x – x ) i
2
σ = √ i=1
_________
N
Σ (x – x) . f i
2
i
σ = √ i=1
_________
N
Σf
i=1
i
92
Lidia C. Diblasi
N1σ21 + N2σ22
σ2 = _____________
N1 + N2
Veamos un ejemplo:
xi xi - x (xi – x)2
1 -4 16
3 -2 4
5 0 0
7 2 4
9 4 16
∑ = 25 ∑ = 0 40
40
σ= = 2,83
5
93
Lidia C. Diblasi
Desv.
Carrera Media Típica
Sociología 22.49 8.11
Cia. Políticay Adm. Pública 21.48 7.56
Trabajo Social 20.60 6.57
Comunicación Social 18.79 1.59
Si analizamos los resultados del cuadro, podemos observar que, si bien los
promedios de edades de los alumnos al ingresar a la facultad de Ciencias Políticas
y Sociales, de la UNCuyo, no son muy diferentes, sin embargo las desviaciones
típicas si lo son. Las edades de los alumnos de Sociología están mucho más
dispersas respecto a la media que la de las otras carreras. En el otro extremo la
carrera de Comunicación Social es la más homogénea, en cuanto a las edades,
que cualquier otra carrera, ya que su dispersión es muy pequeña y no parece
haber valores extremos. En cambio Sociología tiene valores muy extremos que
“empujan” la media hacia las edades mayores y por eso su dispersión es muy
grande.
Como tenemos los datos sin agrupar y dispuestos en una serie simple
hemos usado, para el cálculo del desvío, la fórmula “serie simple”, sin frecuencia.
Cuando trabajamos con una “serie con frecuencia” o “datos agrupados” en
clases usamos la fórmula siguiente:
94
Lidia C. Diblasi
Σ (xi – x )2. fi
σ = √ i=1
_________
N
Σf
i=1
i
σ² = 89.25
95
Lidia C. Diblasi
σ = 89,25
σ
CV = ___
Desv.
Carrera Media Típica
Sociología 22.49 8.11
Cia. Políticay Adm. Pública 21.48 7.56
Trabajo Social 20.60 6.57
Comunicación Social 18.79 1.59
σ 8.11
CV (Sociología) = ___ = ____ = 0.36 36%
x 22.49
96
Lidia C. Diblasi
σ 7.56
CV (Cia. Política) = ___ = ____ = 0.35 35%
x 21.48
σ 6.57
CV (Trabajo Social) = ___ = ____ = 0.32 32%
x 20.60
σ 1.59
CV (Comun. Social) = ___ = ____ = 0.085 8.5%
x 18.79
97
Lidia C. Diblasi
Asimetría o sesgo: Si la curva de frecuencias tiene una cola más larga que la
otra, se dice que la distribución es asimétrica o sesgada. Una distribución
simétrica es aquella donde los valores están distribuidos por igual a ambos lados
98
Lidia C. Diblasi
99
Lidia C. Diblasi
Ejercicios propuestos
1- Con los datos que tiene a continuación que representan la cantidad de horas
de estudio mensuales de los alumnos que ingresan a la universidad, calcular:
a- media b- desviación típica. y c- decil 70
Interpretar los resultados
Horas Fi
estudio
5-9 15
10 - 14 18
15 - 19 9
20 - 24 5
25 - 29 2
2- Con los datos que tiene a continuación que representan el crecimiento anual
de un grupo de niños de una determinada edad, calcular:
a- Cuartil tres , b- Media y c - desviación típica.
Crecimiento fi
en cm.
3-4 5
5-6 8
7-8 10
9 - 10 15
11 - 12 12
100
Lidia C. Diblasi
Edad cantidad de
personas
7–8 4
9 - 10 8
11 - 12 12
13 - 14 18
15 - 16 13
5Los siguientes datos representan a tres grupos distintos de amigos cuyas edades
son:
6- Con los datos que tiene a continuación que representan el peso de los niños al
nacer registrados durante un mes en un hospital público:,
101
Lidia C. Diblasi
Peso en kg Fi
0,000 – 0,800 8
0,800 - 1,600 22
1,600 – 2,400 9
2,400 – 3,200 6
3,200 – 4,000 4
4,000 - 4,800 1
7- Con los datos que tiene a continuación que representan los kilogramos
mensuales de pan consumidos por un grupo de familias calcular:
a) Media, Mediana, Modo y Desviación típica.
b) Explique solamente cómo calcularía el 60 % central de esta distribución.
Kg. Fi
5-9 2
10 - 14 7
15 - 19 15
20 - 24 16
25 - 29 6
102
Lidia C. Diblasi
con una desviación de 0.25 puntos, ¿qué grupo de estudiantes tiene menor
variabilidad? ¿Porqué?
103
Lidia C. Diblasi
Bibliografía consultada:
Ambrosi, Hugo Oscar, “La verdad de las Estadísticas. Aprender con los datos”
Lumiere, Buenos. Aires, 2008
Bancroft, Huldah, "Introducción a la Bioestadística", EUDEBA
Baranger, Denis, “Construcción y análisis de datos” Ed. Universitaria, UNM,
Posadas, 1999
Blanch, Nidia y Joekes, Silvia: “Estadística Aplicada a la Investigación” Nódulos 3
y 4- Curso de posgrado; Fac. de Ciencias económicas, Universidad Nacional de
Córdoba, 1994
Box, G.E.P.; Hunter, William; Stuart Hunter, J. “Estadística para investigadores.
Introducción al diseño de experimentos, análisis de datos y construcción de
modelos” Ed. Reverté, México, 2005
Cea D`Ancona, María Ángeles, “Metodología Cuantitativa. Estrategias y Técnicas
de Investigación Social” Ed. Síntesis Sociología, Madrid, 2001.
Daniel, Wayne: “Estadística con aplicaciones a las Ciencias Sociales y a la
Educación”, McGraw Hill latinoamericana, S.A. Bogotá, Colombia. 1981
García Ferrando, Manuel: Socioestadística. “Introducción a la estadística en
sociología”, Alianza Universidad Textos, Madrid, 1992
Hernandez Sampieri, R.; Fernandez Collado, C.; Baptista Lucio, P. “Metodología
de la Investigación” Mc Graw Hill, Colombia 1994
Hopkins, kenneth; Hopkins, B.R.; Glass, Gene: “Estadística básica para las
Ciencias Sociales y del Comportamiento” Prentice-Hall Hispanoamérica, S.A.,
México, 1997
Spiegel, Murray, " Estadística", Serie de Compendios Shaum, McGraw Hill
Interamericana de México S.A.,1994
Instituto Nacional de Estadísticas y Censos, Encuesta Permanente de Hogares,
Ministerio de Economía, Gran Buenos Aires Octubre de
1997.
Diblasi, Lidia y Romagnoli, Ricardo, "Medidas de tendencia central y de variación",
1991.Apuntes de cátedras. Mimeo.
104