Capítulo III Medidas de Posición y Dispersión. Personalizado

Lidia C.
Diblasi
CAPÍTULO III
MEDIDAS DE POSICIÓN Y DISPERSIÓN
I- MEDIDAS DE TENDENCIA CENTRAL
Una medida de tendencia central es un número que indica el centro de una

serie de datos, o de una distribución. Se llaman también medidas de localización.
Si imaginamos los valores de un grupo de datos representados en un eje
horizontal, las medidas de tendencia central y localización nos dicen donde está el
“centro” de la distribución.
A diario usamos, por ejemplo, la palabra promedio sin hacer ningún cálculo
para referirnos al tiempo que demoramos “en promedio” para ir de nuestra casa al
trabajo, para calcular la cantidad de dinero que gastamos en nafta en el mes; para
ver cuánto estamos dispuestos a gastar “en promedio” para comprar una
determinada prenda; etc. Si bien no hacemos ningún cálculo en el momento, la
expresión tiene un significado muy útil para transmitir a otros una información. Lo
que hacemos es una aproximación de la realidad, no significa que sea
exactamente la realidad, pero sí será un valor parecido, cercano, un valor
esperado por alguna causa. Esa causa generalmente está basada en la
experiencia que tenemos como para poder dar un valor aproximado.
Las medidas de tendencia Central son valores que pueden resumir los
datos en un único valor. Representan una síntesis, no puede ser un valor menor al
valor más pequeño de la distribución, ni tampoco un valor mayor a cualquiera de la
distribución. Debe ser un valor que esté en el centro de la misma si los datos están
ordenados. “Un valor semejante que representa todo un conjunto de datos, tiene
que ser un valor central o de posición central a cuyo alrededor se distribuyen todos
los datos del conjunto” (CHAO, Lincoln, 63).
Son varias las medidas de tendencia central, nosotros nos dedicaremos
especialmente a tres de ellas: la media aritmética, la mediana y el modo.
66
Lidia C. Diblasi
La media aritmética: es la medida de tendencia central que se calcula más

frecuentemente; es la que en lenguaje común y corriente se denomina, como ya
vimos, promedio.
Dada una variable discreta, la media aritmética o simplemente la media de un
conjunto x1, x2, x3,...xn se denota por x y se define como:
N
x1+ x2+ x3+.....+.xn xi Σ

i=1
x = ________________ = __ ____
N N
N
Donde Σ i=1 indica que hay que sumar todas las x disponibles desde x1 hasta xn.
Los símbolos i= 1 y N que aparecen abajo y encima del signo ∑ s e los conoce
como límites de la sumatoria. Cuando está claro en el contexto cuáles son estos
límites, pueden omitirse y escribir solamente ∑.
Veamos un ejemplo:
Si tenemos las siguientes notas resultado de cuatro parciales y queremos calcular

el promedio, sumamos las cuatro notas y dividimos el resultado por la cantidad de
notas:
Notas: 7; 6,50; 8; 10
Media aritmética o Promedio: 7+6,50+8+10= 31,50 /4 = 7,875
La diferencia entre las X mayúscula y la x minúscula se debe a que las
mayúsculas se refieren a la variable en estudio (como peso, estatura, etc.) y las
minúsculas, a cada uno de los valores de la variable X
Si los valores x1+ x2+ x3+......xn ocurren f1+ f2+ f3+......fn respectivamente (es decir
que ocurren con frecuencia f1+ f2+ f3+......fn) la media aritmética es:
N
x1 f1+ x2 f2+ x3 f3+......+xn fn Σ xi fi

i=1
x = _______________________ = ___ _____
N
f1+ f2+ f3+.....+ fn Σf

i=1
i
67
Lidia C. Diblasi
N
Donde Σ fi = N es la frecuencia total, es decir el número total valores o de las
i=1
unidades de análisis.
Cuando, como resultado de un estudio, tenemos un conjunto de datos sin

organización, estos prácticamente no tienen ninguna significación. Si los
organizamos teniendo en cuenta los valores observados, los ordenamos siguiendo
algún criterio, y tenemos en cuenta la frecuencia o cantidad de veces que se
repite cada uno de esos valores, ello nos permitirá analizarlos y trabajarlos para
conocer por ejemplo: cuál es el valor más repetido, cuál el menor valor, cuál el
mayor, si hay mucha concentración de los datos en pocos valores, o si por el
contrario están muy dispersos.
Si la cantidad de datos es pequeña y la vamos a trabajar manualmente nos
conviene ordenar los valores construyendo una tabla de frecuencias.
Veamos un ejemplo:
Los siguientes datos hacen referencia a la nota obtenida en un parcial por una
muestra de 20 alumnos
5 8 7 9 6 8 8 9 5 9
2 4 6 9 7 8 7 6 10 8
El recorrido de esta variable (Rango) es desde 2 puntos, el valor más pequeño,

hasta 10 el mayor puntaje de notas de este grupo.
Realizamos los siguiente pasos para calcular la media:

1- ordenamos los valores de la variable: “nota de los alumnos”
2- calculamos la media o promedio teniendo en cuenta la cantidad de veces
que se repite cada valor de la variable (frecuencia absoluta).
68
Lidia C. Diblasi
xi fi
2 1
4 1
5 1
6 3
7 4
8 5
9 4
10 1
Podemos calcular ahora la Media Aritmética teniendo ordenado los valores

con su correspondiente frecuencia. Como cada valor de la variable se repite, en
general, más de una vez, vamos a multiplicar cada valor de la variable por su
frecuencia, antes de sumar. Para ellos usamos la siguiente fórmula:
N
Σx f i i
i=1
x = ___ ___
N
Σf
i=1
i
xi fi xi * fi
2 1 2
4 1 4
5 1 5
6 3 18
7 4 28
8 5 40
9 4 36
10 1 10
Ahora podemos calcular la media
143
x =
20
x = 7,15 es la nota promedio que han obtenido en un

examen parcial los alumnos de ese grupo.
69
Lidia C. Diblasi
Podemos tratar a la variable continua como si fuera discreta, dividiendo los

valores en intervalos de clase. En tal caso, se consideran los valores
comprendidos en el intervalo como si fuesen iguales al punto medio del intervalo
de clase.
Si se denomina xi a los puntos medios de los intervalos de clase y fi a las
frecuencias absolutas de los valores comprendidos en cada intervalo, la media
aritmética puede ser calculada de la misma forma que en el ejemplo anterior,
donde xi pasa a ser el punto medio del intervalo de clase:
Veamos un ejemplo: Los siguientes datos hacen referencia a la edad al contraer

matrimonio en una muestra de 50 mujeres
15 28 17 25 30 32 38 19 25 19
35 41 48 43 33 35 23 24 28 17
21 22 26 29 30 31 40 16 19 21
22 26 25 36 37 52 41 22 33 36
29 27 31 20 29 24 45 54 19 32
El recorrido de esta variable (Rango) es desde 15 años, el valor más pequeño,

hasta 54 años, la edad mayor de este grupo de mujeres en contraer matrimonio.
Realizamos los siguiente pasos:

1- calculamos los intervalos de clase.
2- calculamos los puntos medios de los intervalos, que pasan a ser los valores
representativos de la clase: xi.
3- buscamos la frecuencia absoluta de cada clase o intervalo de clase.
4- calculamos la media o promedio teniendo en cuenta la cantidad de veces
que se repite cada valor de la variable.
70
Lidia C. Diblasi
Intervalo xi fi xi * fi
15 - 19 17 8 136
20 - 24 22 9 198
25 - 29 27 11 297
30 - 34 32 8 256
35 - 39 37 6 222
40 - 44 42 4 168
45 - 49 47 2 94
50 - 54 52 2 104
Ahora podemos calcular la media:
Σx f i i
x = ___i=1___
N
Σf i
i=1
1475
x =
50
x = 29,5 años es la edad promedio al casarse de éste grupo de mujeres.
Algunas propiedades de la media aritmética:
1) La suma algebraica de los desvíos de un conjunto de valores en relación con su

media es cero.
Σ (x - x)
i =0
Veamos un ejemplo:
Si tenemos los siguientes valores de una variable X: 1; 3; 5:7; 9
y calculamos la media de esos valores nos da: 5
71
Lidia C. Diblasi
Luego si a cada valor de la variable le restamos la media:
25
x = = 5
5
xi xi - x
1 -4
3 -2
5 0
7 2
9 4
∑ = 25 ∑=0
Podemos comprobar que la suma de éstos valores es igual a cero: Σ (x - x )

i =0
De igual forma se comprueba cuando trabajamos con frecuencias:
Σ (x - x ) f = 0
i i
Σ [ x f – x Σfi ] = 0
i i
Σ xi fi
Σ [ xi fi - ______ Σfi ] = 0
Σfi
Σx f Σ x f = 0
i i- i i
La razón de que la primera propiedad se verifique se debe a que cuando se

sustrae la media de cada uno de los datos, las diferencias resultantes, son tales
que las marcas negativas se equilibran exactamente con las positivas. Ello nos
está indicando que la media es el centro de gravedad de la distribución y que si
pudiéramos poner los valores de la variable sobre una barra en suspenso y la
levantáramos desde el punto donde se encuentra el valor de la media, la barra no
debería inclinarse, debería mantenerse horizontal.
72
Lidia C. Diblasi
2) La suma de los cuadrados de los desvíos de un conjunto de valores xi respecto

a cualquier valor c es un mínimo si y solo si c = x.
Σ (x - x )
i
2
= es un mínimo
Veamos un ejemplo con los datos del ejercicio anterior:
xi xi - x (xi – x )2
1 -4 16
3 -2 4
5 0 0
7 2 4
9 4 16
∑ = 25 ∑ = 0 40
Σ (x - x )
i
2
= 40
Supóngase que se calculan los desvíos con respecto a un punto cualquiera: c< x
óc >x
xi xi - 4 (xi – 4)2
1 -3 9 xi xi - 8 (xi – 8)2
3 -1 1
1 -7 49
5 1 1 3 -5 25
7 3 9 5 -3 9
9 5 25 c= 4 7 -1 1
∑ = 25 ∑ =5 45 9 1 1
∑ = 25 ∑ (ξ,ι − ξ) 85
c= 8
Σ (x - x)
i
2
= 45 Σ ( - x)
i
2
= 85
Como podemos observar calculando los desvíos respecto a un valor menor a la

media (4) y con un valor mayor a la media (8), vemos que la suma al cuadrado de
73
Lidia C. Diblasi
los desvíos es mayor que cuando los desvíos se hacen respecto a la media. Esta
propiedad de la media nos permite el cálculo de medidas de dispersión.
De la misma forma se puede demostrar con una serie con frecuencia
Σ (x – x )
i
2
fi. = a un mínimo
3) Si f1 valores (ó n1 valores) tienen como media x 1; f2 valores (ó n2 valores)

tienen como media x 2; ....fk valores (ó nk valores) tienen como media x k,
entonces la media de todos los valores es:
x 1 f1+ x 2 f2+ x 3 f3+......+ x k fk

x = _______________________
f1+ f2+ f3+.....+fk
es decir la media aritmética de todas las medias, la llamamos también “Media

Ponderada”
Veamos un ejemplo:
En el siguiente cuadro se muestran las edades promedios al ingresar de los alumnos

de las cuatro carreras de la facultad de Ciencias Políticas y Sociales: Sociología,
Ciencia Política y Administración Pública, Trabajo Social y Comunicación Social y la
cantidad de jóvenes entrevistados.
Para calcular la media general de todos los alumnos ingresantes en el año 2008 a la
facultad debemos usar la fórmula de la media ponderado o media de medias:
Carrera N (fi) X
Sociología 35 22.49
Ciencia Política 23 21.48
Trabajo Social 52 20.6
Comunicación Social 96 18.79
74
Lidia C. Diblasi
22,49 *35 + 21,48 * 23 + 20,6 * 52 + 18,79 * 96

x = ________________________________________
35 + 23 + 52 + 96
4156,23
x = x = 20,17
206
Más allá de las diferencias de medias de cada carrera, la edad promedio del
grupo que ingresó a la Facultad en el año 2008 es de 20,17 años. La Media
Ponderada nos permite dar un solo valor que refleje a todos los grupos involucrados.
La importancia de esta media de medias es que confirma la propiedad de la
media aritmética de ser el centro de gravedad de la distribución ya que tiene en
cuenta el peso que poseen las frecuencias de cada valor de media grupal. En nuestro
ejemplo la Carrera de Comunicación Social tiene una frecuencia que es muy superior
a la de las otras carreras.
Resumiendo podemos decir que la carrera de Comunicación Social tiene
mayor peso, al tener mayor cantidad de alumnos entrevistados y el más bajo
promedio en edad al ingresar a la facultad, por ser el grupo más homogéneo, o
con menor dispersión en esta variable.
Si los grupos tienen, en alguna característica, diferencias importantes es
bueno calcular la media ponderada, que nos da una visión de conjunto y, a su vez,
la media por grupos para mostrar o “revelar” las diferencias.
Podemos hacer el gráfico que nos muestra muy bien las diferencias entre
los grupos y que a su vez nos permite visualizar dónde se ubicaría la media de
medias o media ponderada de todos los subgrupos estudiados:
75
Lidia C. Diblasi
Promedios de edad al ingreso de los estudiantes de Ciencias Políticas y Sociales
23
22
21
Edad promedio al ingreso
20
19
18
Sociología Ciencia Política Comunic. Social Trabajo Social
Carreras
Fuente: elaboración propia con los datos obtenidos de una encuesta realizada para el
proyecto de investigación sobre los “Perfil de los alumnos ingresantes a la Fac….” Dir.
Diblasi, Lidia y colaboradores, SeCTyP, UNCuyo, 2007 – 2009.
La mediana: la mediana (Me) es el valor de la variable que divide el conjunto total

de valores, ordenados en forma creciente o decreciente, en dos partes
numéricamente iguales.
Dada una variable discreta y un número de unidades de análisis pequeño, la
mediana se calcula de la siguiente forma:
1- Se ordenan los valores de la variable estudiada correspondientes a cada una
de las unidades de análisis de menor a mayor (o viceversa) y se determina por
simple recuento el valor central que divide al conjunto total en dos partes
numéricamente iguales.
2- Si el número total es impar, la mediana es el valor central. Si el número total de
unidades es par, la mediana resulta de calcular la media aritmética de los dos
valores centrales.
Veamos un ejemplo:
76
Lidia C. Diblasi
Si tenemos un conjunto de valores y los hemos ordenado:

Xi: 2; 5; 7; 8; 10; 11; 15; 16; 23; 25; 29
El valor 11 es el que representa el centro de la distribución, dejando la misma
cantidad de valores menores y mayores que él.
Me = 11
Si ese conjunto de valores es par y no impar como el caso anterior debemos
buscar los dos valores centrales, sumarlos y dividirlos por 2 para obtener la
mediana
Xi: 2; 5; 7; 8; 10; 11; 15; 16; 23; 25; 29; 30
11 + 15
Me = Me = 13
2
Cuando la variable está ordenada con frecuencias podemos obtener la Mediana

buscando en la frecuencia acumulada aquella que contenga la mitad de los casos
y ver a qué valor representa, ése será el valor de la mediana:
Veamos un ejemplo:
Si usamos los datos de la nota de los parciales que vimos anteriormente al
calcular la media, calculamos las frecuencia acumuladas (Fa), podemos observar
que de los 20 casos la mitad, 10, corresponde al valor 7. Ello significa que el valor
siete, con la serie ordenada es el que deja la misma cantidad de notas menores y
mayores que él.
xi fi Fa
2 1 1
4 1 2
5 1 3
6 3 6
7 4 10
8 5 15
9 4 19
10 1 20
Me = 7
77
Lidia C. Diblasi
Cuando una variable ya sea discreta, o continua, está ordenada en forma de

intervalos de clase, la mediana se obtiene con la siguiente fórmula:
N/2 – Fa
Me = Li + __________ . ω
fi
Donde:
Li: es el límite inferior del intervalo de clase que en frecuencia acumulada contiene
la mitad de las unidades de análisis.
Fa: es la frecuencia acumulada hasta el intervalo anterior a la frecuencia
acumulada que contiene la mitad de los valores.
fi: es la frecuencia absoluta correspondiente al intervalo que en frecuencia acumulada
contiene la mitad de las unidades de análisis.
ω: es el tamaño del intervalo de clase que en frecuencia acumulada contiene la mitad
de las unidades de análisis.
Veamos un ejemplo:
Intervalo xi fi Fa
15 - 19 17 8 8
20 - 24 22 9 17
25 - 29 27 11 28
30 - 34 32 8 36
35 - 39 37 6 42
40 - 44 42 4 46
45 - 49 47 2 48
50 - 54 52 2 50
Podemos observar en la tabla de datos agrupados que la mitad de los casos se

encuentra contenida en la frecuencia acumulada 28 (50/2 = 25), lo que nos está
indicando que en el intervalo de 25 a 29 años se encuentra la mediana, la cual
vamos a calcular siguiendo la fórmula.
25 – 17
Me = 25 + __________. 5
11
78
Lidia C. Diblasi
Me = 25 + 3,64
Me = 28,64
Podemos decir que la edad mediana de las mujeres al contraer matrimonio es de

28,64 años. Esta edad divide a la distribución en dos partes iguales. El 50% de las
mujeres tiene menos de 28,64 años y el 50% tiene más de esa edad.
Comparación de la media aritmética y la mediana:
Hay varias diferencias entre ellas:
1- La media aritmética utiliza más información que la mediana, ya que usa todos
los datos, mientras que la mediana solo toma la marca del o de los casos
medios. Si los valores superiores o inferiores a la mediana fueran marcas muy
elevadas o muy bajas (valores extremos), la mediana permanecería inalterable,
mientras que la media aumentaría o disminuiría considerablemente. Por lo
tanto, podemos decir que: la media resulta afectada por cambios de los valores
extremos, en tanto que la mediana permanece inalterada, a menos que cambie
el valor del caso medio.
2- La media es por lo regular una medida más estable que la mediana, en cuanto
varía menos de una muestra a otra. En la Estadística inductiva, el investigador
tendrá interés en generalizar acerca de la población, partiendo de una muestra.
Si bien, no puede tomar todas las muestras posibles de una población, es
importante que sepa, que las medias de las muestras variarán menos de una a
otra que las medianas.
3- Como la media se ve afectada por los valores extremos, el empleo de la

mediana es menos equívoco cuando estamos en presencia de una distribución
fuertemente asimétrica, o sea, siempre que haya más casos extremos en una
dirección que en otra. La media siempre se verá “empujada” en dirección a la
79
Lidia C. Diblasi
asimetría, o sea, hacia una cola. Si la distribución es fuertemente simétrica,

media y mediana coincidirán. (Ver los gráficos de distribución al final del
capítulo)
Modo o moda: se denomina modo o moda al valor de la variable que más se

repite, el más común, el que se corresponde con la máxima frecuencia.
Dada una variable y un número de unidades de análisis pequeño, el modo se
encuentra directamente aplicando su definición.
Veamos un ejemplo
Xi: 1; 1; 5; 7; 7; 7; 8; 9; 9; 10
Mo = 7 Siete es el valor más común o más repetido de ésta serie de datos.
Cuando tenemos una serie de datos como la de las notas de un grupo de alumnos
en un examen parcial, la moda es siguiendo su definición el valor “más común”
xi fi
2 1
4 1
5 1
6 3
7 4
8 5
9 4
10 1
Mo = 8
En el ejemplo la nota más común es 8, por lo tanto la Moda o Modo es igual a 8.
Cuando los valores de la variable, discreta o continua, se presentan en forma de

intervalos de clase, el modo se obtiene por interpolación utilizando la siguiente
fórmula:
∆1
Mo = Li + __________ . ω
∆1 + ∆2
80
Lidia C. Diblasi
Donde:
Li: es el límite del intervalo de clase modal (es decir, del intervalo que cuenta con
la mayor frecuencia)
∆1: es la diferencia entre la frecuencia modal y la frecuencia anterior.
∆2: es la diferencia entre la frecuencia modal y la frecuencia posterior.
ω: es el tamaño del intervalo de clase modal.
Veamos el ejemplo usado para la media y la mediana: la edad en contraer

matrimonio de un grupo de mujeres.
Intervalo xi fi
15 - 19 17 8
20 - 24 22 9
25 - 29 27 11
30 - 34 32 8
35 - 39 37 6
40 - 44 42 4
45 - 49 47 2
50 - 54 52 2
La mayor frecuencia se encuentra en el intervalo 25 a 29 años, lo que significa que

en él encontraremos a la Moda. Sigamos la fórmula:
∆1 = 11-9
∆2 = 11-8
2
Mo = 25 + __________ . 5
2 +3

Mo = 25 + 2 Mo = 27
En éste grupo la edad de las mujeres más común, al contraer matrimonio, de es

27 años
81
Lidia C. Diblasi
En el ejemplo que hemos seguido para calcular la Media, la Mediana

y el Modo obtuvimos valores medios semejantes, ya que todos se ubican en el
intervalo de clase de 25 a 29 años ( x = 29,5; Me = 28,64; Mo = 27), lo cual nos
está diciendo que la distribución de la variable que estudiamos tiene una
distribución simétrica. Pero al no ser iguales las medidas de tendencia central
quiere decir que no hay una perfecta simetría, si no que hay una leve asimetría, en
éste caso, hacia la derecha y eso nos lo demuestra la media, que tiene el valor
más alto de las tres medidas y es la que se ve empujada por los valores extremos
Edad de un grupo de mujeres al contraer matrimonio, Mendoza, 2005

60
55
50
45
40
35
30
25
20
15 Me = 28.5
25%-75%
10
Var1
En el gráfico podemos observar la asimetría de la distribución ya que la caja

no se encuentra en el centro del recorrido de la variable. La patilla superior es
más larga que la inferior a la caja. La media (29.5) se ha alejado de la mediana
(28.6) por los valores más elevados (52 y 54) que marcan el alargamiento de la
variable hacia arriba del gráfico. El Mo (27) se encuentra en la caja debajo de la
mediana ya que el valor más común es 27, menor a la media y la mediana.
82
Lidia C. Diblasi
MEDIA, MEDIANA Y MODA: ¿CUÁL MEDIDA ELEGIR?
“La moda es aplicable para cada una de las cuatro escalas de medición. Sólo la
moda tiene significado para variables categóricas como afiliación política, afiliación
religiosa, especialidad académica u ocupación. Sin embargo, para fines
inferenciales, la moda tiene una desventaja distintiva: la moda de una muestra no
es una estimación muy confiable de su moda de población a menos que el tamaño
de la muestra aleatoria sea extremadamente grande. La confiabilidad en
estadística representa la precisión con la cual la estadística estima el parámetro
de población correspondiente. Establecido de forma diferente, hay un gran error
de muestreo asociado con la moda de la muestra; el error de muestreo es la
diferencia entre el estadígrafo de la muestra y el parámetro de población
correspondiente. La mediana de la muestra es más confiable (es decir, tiene un
error de muestreo menor) que la moda de la muestra; la media de la muestra
tiene un error de muestreo menor que la moda o la mediana, lo cual es una razón
del porqué tiende a ser preferida para fines inferenciales” (Hopkins, K; Hopkins,B;
Glass, G. 1997; 44)
MEDIDAS DE POSICION
A semejanza de la Mediana que divide a la distribución de una variable en

dos partes iguales, los cuantiles son medidas de posición o localización porque
dividen a la distribución en partes iguales. Los más usados son los cuartiles: la
dividen en cuatro; los deciles, en diez y los percentiles en cien partes iguales.
Cuartiles: son valores de la variable que dividen al conjunto ordenado de datos

en cuatro partes que contienen la misma cantidad de casos.
El cuartil primero (Q1) es el valor de la variable que divide al conjunto ordenado de
valores en dos partes, dejando un 25% de valores menores que él y un 75% de
valores mayores.
83
Lidia C. Diblasi
El cuartil segundo (Q2) es el valor de la variable que divide el conjunto ordenado

de valores en dos partes, dejando un 50% de los valores menores que aquel valor,
y un 50% de valores mayores que él. Por lo tanto, Q2 = Me.
El cuartil tercero (Q3) es el valor de la variable que divide el conjunto ordenado de
valores en dos partes, dejando un 75% de valores menores que él y un 25% de
valores, mayores.
Cómo calcularlo: se ordenan los valores correspondientes a todas las unidades de

análisis de menor a mayor (o viceversa) y se determina por simple recuento el
valor que divide al conjunto total en dos partes, de manera que:
Para definir Q1 quede comprendida la cuarta parte de los valores menores.
Para definir Q2 quede comprendida la mitad de los valores menores.
Para definir Q3 queden comprendidas las tres cuartas partes de los valores
menores.
Veamos un ejemplo: Usemos el mismo ejemplo que para calcular la Mediana.
Si tenemos 12 datos y debemos dividirlos en cuatro partes iguales: 12/4 = 3 lo
que significa que para el primer cuarto (25 %) quedan los tres valores más
pequeños en el primer cuarto y nueve en el 75 % restante: por lo que el primer
cuartil se encuentra entre los valores 7 y 8:
Xi: 2; 5; 7; 8; 10; 11; 15; 16; 23; 25; 29; 30

↓
Q1=7,5
Para el segundo cuartil (50 %) quedan seis datos más pequeños y seis más
grandes que el Q2 que es igual o coincide con la Me.
Xi: 2; 5; 7; 8; 10; 11; 15; 16; 23; 25; 29; 30

↓
Q2 = 13 = Me
Y en el tercer cuartil quedan nueve datos menores a él y tres mayores:
84
Lidia C. Diblasi
Xi: 2; 5; 7; 8; 10; 11; 15; 16; 23; 25; 29; 30

↓
Q3 = 24
Si los datos representan la edad de un conjunto de personas, podemos resumir
diciendo que el 25 % de la distribución tiene hasta 7,5 años; que el 50% tiene
hasta 13 años y que el 75 % tienen hasta 24años.
Xi: 2; 5; 7; 8; 10; 11; 15; 16; 23; 25; 29; 30

↓ ↓ ↓
Q1=7,5 Q2 = 13 Q3 = 24
Si tenemos una serie de datos ordenados con su correspondiente frecuencia,

procedemos de la misma forma que para la mediana, calculando las frecuencias
acumuladas y buscando en ellas el valor que contiene al 25; 50 y 75 % de los
casos.
Veamos un ejemplo:
Usamos el ejemplo de las notas en un parcial de alumnos. Tenemos 20 notas por

lo tanto si las dividimos en cuatro partes iguales, cada parte va a contener 5
valores numéricos o cinco notas: 20/4 = 5
El primer 25% = 5 lo buscamos en la primer frecuencia acumulada que lo
contenga; igual para el 50% y para el 75%
xi fi Fa
2 1 1
4 1 2
5 1 3
6 3 6 Q1
7 4 10 Q2 y Me
8 5 15 Q3
9 4 19
10 1 20
85
Lidia C. Diblasi
La frecuencia acumulada seis contiene a las 5 primeras notas por lo que el Q1 es igual
al valor de la variable 6, que en éste caso coincide con el valor de la frecuencia
acumulada
Q1= 6 el 25 % de las notas más bajas de los parciales fue de hasta 6 puntos.
La frecuencias acumulada diez contiene al 50 % de los casos, por lo que el valor del
Q2 = 7 El 50% de los alumnos obtuvo una nota de hasta 7 puntos.
Y por último el 75 % se encuentra en la frecuencia acumulada 15 que corresponde

al valor de la variable 8, por lo que podemos decir que
Q3 = 8 El 75% de los alumnos obtuvo una nota de hasta 8 puntos.
Trabajando con datos agrupados
Si tenemos una variable, discreta o continua, donde los valores de la variable se

presentan en forma de intervalos de clase, los cuartiles se obtienen por
interpolación utilizando la siguiente fórmula:
i. N/4 – Fa
Qi = Li + __________ .w
fi
Donde:
Qi: indica el cuartil en estudio.
Fa: es la frecuencia acumulada hasta el intervalo anterior al que en frecuencia
acumulada contiene la i-ésima parte de las unidades de análisis.
fi: es la frecuencia absoluta correspondiente al intervalo que en frecuencia
acumulada contiene la i-ésima parte de las unidades de análisis.
w: es el tamaño del intervalo de clase que en frecuencia acumulada contiene la
i-ésima parte de las unidades de análisis.
Veamos un ejemplo
Seguimos con el ejemplo que usamos con las medidas de tendencia central: edad
al casarse un grupo de mujeres.
Si observamos la fórmula vemos que lo primero que tenemos que hacer es
localizar el intervalo donde se encuentra el cuartil, si calculamos el 1º :
86
Lidia C. Diblasi
N/4*1= 50/4 = 12,5

Si buscamos en la frecuencia acumulada la que contienen al valor 12,5 en
ese intervalo de clase se ha de encontrar el primer cuartil o el primer cuarto de la
distribución.
Como 12,5 lo contiene la Fa 17 quiere decir que el intervalo e clase que lo
contiene es 20 a 24. Vamos a calcularlo:
Intervalo xi fi Fa
15 - 19 17 8 8
20 - 24 22 9 17
25 - 29 27 11 28
30 - 34 32 8 36
35 - 39 37 6 42
40 - 44 42 4 46
45 - 49 47 2 48
50 - 54 52 2 50
12,5 − 8
Qi = 20 + .5
9
Qi = 20 + 2,5
Qi = 22,5 El 25 % de las mujeres tienen al momento de contraer

matrimonio hasta 22,5 años.
El gráfico de cajas nos da una visión de conjunto de la variable en estudio

ya que nos informa sobre las medidas de tendencia central, posición, dispersión y
forma de la distribución. Nos indica el lugar de la mediana, del primer cuartil o
25% de la distribución, del tercer cuartil o 75% de la distribución; del rango (valor
menor y valor mayor del recorrido) y la simetría o asimetría de la variable según la
caja se encuentre en el centro del recorrido (simétrica) o asimetría, cuando la caja
se “corre” hacia uno o el otro extremo de la variable.
87
Lidia C. Diblasi
Veamos el gráfico de caja resultante de nuestro ejemplo de la edad de las

mujeres al contraer matrimonio.
60
55
50
45
40
35
30
25
20
15 Me = 28.5
25%-75%= (22, 35)
10 Rango = (15, 54)
Edad
Deciles: por extensión de la idea de mediana es posible pensar en aquellos

valores que dividen al conjunto total en diez partes iguales.
Su definición y forma de cálculo son similares a los cuartiles.
i. N/10 – Fa
Di = Li + __________ .ω
fi
Por ejemplo para calcular el decil 4, debemos hacer N/10*4 = 20. Este valor se
encuentra contenido en la Fa = 28 que corresponde al intervalo 25-29
20 – 17
D4 = 25 + __________ .5
11
88
Lidia C. Diblasi
D4 = 25 + 1,36
D4 = 26,36 El 40% de las mujeres tiene hasta algo más de 26 años.
Percentiles: de manera similar a los cuartiles y deciles es posible calcular valores

que dividan al conjunto total en cien partes. Su definición y forma de cálculo son
similares a los deciles.
Veamos un ejemplo:
Calculamos el percentil 65 que es aquel valor que deja por debajo suyo al 65% de
los datos que son menores e iguales que él y, por encima, al 35% de los valores
mayores que el percentil 65. Seguimos con los mismos datos de las mujeres:
i. N/100 – Fa
Pi = Li + __________ . ω
fi
50/100*65 – 28
P65 = 30 + __________ . 5
8
50/100*65 – 28
P65 = 30 + __________ . 5
8
P65 = 30 + 2,81
P65 = 32,81 El 65 % de las mujeres tiene aproximadamente hasta 33 años

al contraer matrimonio.
MEDIDAS DE DISPERSION
Si estamos interesados en comparar medidas de tendencia central,

necesitamos saber algo acerca de cómo están dispersos o concentrados los
89
Lidia C. Diblasi
valores en los grupos estudiados. Una medida de tendencia central sola no

proporciona generalmente una descripción satisfactoria de un conjunto de datos.
Es importante tener una medida de la forma en que los valores individuales
se desvían del promedio. A esta clase de medidas se las conoce como medidas
de variabilidad. El concepto de variabilidad tiene como sinónimo al de dispersión.
Si queremos dar una definición podemos decir que: las medidas de
dispersión son parámetros que miden la forma en la cual los valores tienden a
extenderse alrededor de un valor de tendencia central.
El rango: la medida más simple de variabilidad es el rango, que es la diferencia

entre el valor máximo y el mínimo de un conjunto de datos.
Tiene un valor limitado ya que solamente toma en cuenta los valores
extremos de un conjunto de datos y no da ningún indicio sobre la forma como
varían los valores en el interior del intervalo.
Como vimos en los capítulos anteriores, se calcula restando al valor mayor
de la variable el valor menor.
Veamos un ejemplo:
El rango de la variable “edad de las mujeres al contraer matrimonio”, donde el
valor más pequeño es 15 años y el más elevado es de 54 años es:
R = v. máximo – v. mínimo
R = 54 – 15
R = 39 El rango de la variable edad de las mujeres al contraer
matrimonio es 39
La varianza: es el promedio de las desviaciones elevadas al cuadrado, con

respecto de la media del conjunto de datos. Se obtiene restando a cada uno de los
valores de la variable la media del conjunto de datos, elevando al cuadrado cada
una de las diferencias resultantes sumándolas y dividiendo este resultado por el
número total de valores. Elevamos al cuadrado los desvíos de cada valor de la
variable respecto a la media para evitar que se anulen los datos ya que, como
vimos en las propiedades de la media, si sumamos los desvío nos da cero (0).
90
Lidia C. Diblasi
Si reunimos esto en una fórmula tenemos:
Σ (x – x )i
2
σ2= i=1
______
N
Cuando trabajamos con una muestra usamos la siguiente fórmula:
Σ (x – x ) i
2
s 2= i=1
______
n–1
El denominador n – 1 nos da una medida más útil para los propósitos inferenciales
como veremos más adelante.
Cuando trabajamos con series con frecuencia las fórmulas a usar serán:
Σ (x – x ) . f
i
2
i
σ2= _ i=1 _________ cuando trabajamos con la población
N
Σf i=1
i
Σ (x – x ) . f
i
2
i
s2= i=1
_ cuando trabajamos con la muestra
n
Σf i=1
i
No vamos a dar un ejemplo de varianza ya que cuando sacamos la raíz cuadrada

de la varianza, para volver a la unidad de medida original de la variable,
obtenemos lo que conocemos con el nombre de desviación típica, con la cual sí
vamos a trabajar.
91
Lidia C. Diblasi
La desviación típica o standard: es la raíz cuadrada positiva de la varianza se

denomina desviación típica y la podemos definir como la medida de dispersión que
nos proporciona un promedio de los desvíos de la variable respecto a la media
aritmética.
Su fórmula de cálculo es:
Σ (x – x ) i
2
σ = √ i=1
_________
N
Σ (x – x) . f i
2
i
σ = √ i=1
_________
N
Σf
i=1
i
Propiedades de la desviación típica:
1. De todas las desviaciones típicas, la mínima es aquella que se calcula con

respecto a media aritmética.
2. Para distribuciones normales resulta que:
a) el 68,26% de los valores están comprendidos en el intervalo definido por la
media aritmética menos una vez la desviación típica y la media aritmética
más una vez la desviación típica.
b) el 95,45% de los valores están comprendidos en el intervalo definido
x – 2σ y x + 2σ .
c) el 99,73% de los valores están comprendidos en el intervalo definido
x – 3σ y x + 3σ .
92
Lidia C. Diblasi
3. Si dos conjuntos de N1 y N2 valores respectivamente tienen varianzas σ21 y

σ22 respectivamente y la misma x, entonces la varianza combinada de
ambas está dada por:
N1σ21 + N2σ22
σ2 = _____________
N1 + N2
Veamos un ejemplo:
Si tenemos un conjunto de datos pequeño como:

Xi : 1; 3 ; 5; 7; 9
Seguimos los siguientes pasos para calcular la desviación típica:
1- se calcula la media o promedio de la distribución
2- se obtienen los desvíos de cada valor de la variable respecto a la media
3- se elevan los desvíos al cuadrado
4- se suman todos los resultados
5- se divide la suma por la cantidad de casos, y
6- se calcula la raíz cuadrada del resultado.
xi xi - x (xi – x)2
1 -4 16
3 -2 4
5 0 0
7 2 4
9 4 16
∑ = 25 ∑ = 0 40
40
σ= = 2,83
5
93
Lidia C. Diblasi
σ= 2,83 Si la variable que estamos trabajando fuese edad podríamos decir

que 2,83 años es lo que se desvían las edades de este grupo respecto al
promedio: 5 años.
Cuando trabajamos con más de un grupo es muy importante acompañar la
media con la desviación típica, ya que nos permite comparar la variabilidad que
hay en cada uno de los grupo.
Veamos un ejemplo:
Los datos que tenemos a continuación corresponden a alumnos ingresantes 2008
Desv.
Carrera Media Típica
Sociología 22.49 8.11
Cia. Políticay Adm. Pública 21.48 7.56
Trabajo Social 20.60 6.57
Comunicación Social 18.79 1.59
Si analizamos los resultados del cuadro, podemos observar que, si bien los
promedios de edades de los alumnos al ingresar a la facultad de Ciencias Políticas
y Sociales, de la UNCuyo, no son muy diferentes, sin embargo las desviaciones
típicas si lo son. Las edades de los alumnos de Sociología están mucho más
dispersas respecto a la media que la de las otras carreras. En el otro extremo la
carrera de Comunicación Social es la más homogénea, en cuanto a las edades,
que cualquier otra carrera, ya que su dispersión es muy pequeña y no parece
haber valores extremos. En cambio Sociología tiene valores muy extremos que
“empujan” la media hacia las edades mayores y por eso su dispersión es muy
grande.
Como tenemos los datos sin agrupar y dispuestos en una serie simple
hemos usado, para el cálculo del desvío, la fórmula “serie simple”, sin frecuencia.
Cuando trabajamos con una “serie con frecuencia” o “datos agrupados” en
clases usamos la fórmula siguiente:
94
Lidia C. Diblasi
Σ (xi – x )2. fi
σ = √ i=1
_________
N
Σf
i=1
i
Vamos a calcular el desvío típico siguiendo con el ejemplo de la edad de las

mujeres al casarse.
Recordemos que los pasos que tenemos que seguir son:
1- Calcular los desvíos: restar la media a cada valor de la variable o punto
medio de cada intervalo de clase.
2- Elevar los desvío al cuadrado
3- Multiplicarlos por la frecuencia correspondiente a cada valor de la variable o
a cada clase
4- Sumar el resultado de las multiplicaciones,
5- Dividir el resultado de la suma por el total de las frecuencias
6- Sacar la raíz cuadrada.
Intervalo xi fi (xi - X) (xi - X)² (xi - X)² *fi

15 - 19 17 8 -12.5 156.25 1250
20 - 24 22 9 -7.5 56.25 506.25
25 - 29 27 11 -2.5 6.25 68.75
30 - 34 32 8 2.5 6.25 50
35 - 39 37 6 7.5 56.25 337.5
40 - 44 42 4 12.5 156.25 625
45 - 49 47 2 17.5 306.25 612.5
50 - 54 52 2 22.5 506.25 1012.5
Siguiendo la fórmula, calculamos σ² y σ (la x de este grupo es 29,5 años)

4462.25
σ² =
50
σ² = 89.25
95
Lidia C. Diblasi
σ = 89,25
σ = 9.44 En promedio las edades de las mujeres al casarse se dispersa de

la media en 9,44 años.
Coeficiente de variación: es una medida de dispersión relativa. Generalmente se

da en porcentaje y nos dice que porcentaje de la media aritmética es un desvío
tipo.
σ
CV = ___
Observaciones para su uso:

1. Solo se puede utilizar con escalas de razón.
2. No tiene sentido cuando la media es cero.
Veamos el ejemplo de los promedios de edad de los alumnos ingresantes a la

facultad de Ciencias Políticas y Sociales de la UNCuyo en el año 2008,
Desv.
Carrera Media Típica
Sociología 22.49 8.11
Cia. Políticay Adm. Pública 21.48 7.56
Trabajo Social 20.60 6.57
Comunicación Social 18.79 1.59
Vamos a calcular los coeficientes de variación para las cuatro carreras:
σ 8.11
CV (Sociología) = ___ = ____ = 0.36 36%
x 22.49
96
Lidia C. Diblasi
σ 7.56
CV (Cia. Política) = ___ = ____ = 0.35 35%
x 21.48
σ 6.57
CV (Trabajo Social) = ___ = ____ = 0.32 32%
x 20.60
σ 1.59
CV (Comun. Social) = ___ = ____ = 0.085 8.5%
x 18.79
Si bien ya habíamos visto la diferencia en la carrera de Comunicación

Social cuando analizamos las desviaciones típicas de las cuatro carreras, con el
Coeficiente de Variación se puede apreciar muy bien las diferencias entre las otras
tres carreras y la de Comunicación. Es indudable que el grupo de alumnos que
ingresó a ésta carrera en el año 2008 es muy homogéneo en cuanto a la edad.
Mientras que en las otras carreras la variabilidad es muy semejante. Ello significa
que las distribuciones son sesgadas a la derecha porque poseen ingresantes con
edades bastante mayores a la moda que es 18 a 19 años, edad en que
generalmente se concluyen los niveles medios de educación.
Medidas de las formas de la distribución
Repasemos nuevamente las formas de las distribuciones que ya vimos en

el capítulo I teniendo ahora eb cuenta las medidas de Tendencia Central ylas de
dispersión. Estas formas de la distribución hacen referencia a cómo están
distribuidos los valores de una variable a lo largo de su recorrido dando diversas
formas a la curva de frecuencias. Se las conoce con el nombre de asimetría o
sesgo, a unas y curtosis, a las otras.
97
Lidia C. Diblasi
Asimetría o sesgo: Si la curva de frecuencias tiene una cola más larga que la
otra, se dice que la distribución es asimétrica o sesgada. Una distribución
simétrica es aquella donde los valores están distribuidos por igual a ambos lados
de la media. En cambio si la distribución tiene una cola más larga hacia la

derecha, es porque hay valores extremos elevados muy alejados a la media.
Supongamos que estamos en un cumpleaños de un niño que cumple 8 años,
están todos sus amigos, compañeros de escuela que tienen aproximadamente la
misma edad, pero también están sus padres y dos abuelos. Imaginemos que hay
20 niños entre 7 y 9 años, sus padres de 32 años y sus abuelos de 64 y 65 años.
Estamos en presencia de una distribución asimétrica positiva. La moda y
la mediana estarán entre los siete y nueve años. La media, en cambio, se corre
hacia el lado de los valores más elevados y se aproxima a los quince años. En
este caso la distribución es asimétrica positiva.
Si la curva tiene la cola de la izquierda más larga es porque hay valores
extremos más pequeños que la media, estamos en presencia de una asimetría
negativa. Pensemos por ejemplo, en el caso del cumpleaños de la abuela, 65
años, que está rodeada de sus amigas y llega una hija (35 años) con sus dos
pequeños nietos (2 y 7 años). La media se corre hacia la izquierda del centro por
estos valores extremos
Cuando el coeficiente de sesgo o asimetría es igual a cero, la distribución
es simétrica. Cuando la distribución es asimétrica positiva, su valor es mayor que
cero, y si es asimétrica negativa su valor es menor que cero.
Un valor superior a 0.8 (positivo o negativo) indica que la asimetría de la
variable es importante. (Cea D`Ancona, M.A. 2001; 330);
98
Lidia C. Diblasi
Curtosis: Se refiere a las distribuciones simétricas y nos informa sobre la mayor o

menor concentración de valores alrededor de la media. Si los valores están muy
concentrados, la distribución será puntiaguda, respecto a la normal, es una
distribución leptocúrtica, como vimos en el capítulo I y ello significa que la media
es una medida muy representativa del conjunto de datos
Si los valores están muy dispersos respecto de la media, la distribución es
platocúrtica y la media no es una medida representativa del conjunto de los
valores.
Si los valores están distribuidos alrededor de la media, sin una gran
dispersión la curva será mesocúrtica, en éste caso la media es representativa del
grupo.
Cuando el coeficiente de curtosis es igual a cero, la distribución es
mesocúrtica. Cuando es mayor la curva es leptocúrtica y cuando es menor es
platocúrtica.
99
Lidia C. Diblasi
Ejercicios propuestos
1- Con los datos que tiene a continuación que representan la cantidad de horas
de estudio mensuales de los alumnos que ingresan a la universidad, calcular:
a- media b- desviación típica. y c- decil 70
Interpretar los resultados
Horas Fi
estudio
5-9 15
10 - 14 18
15 - 19 9
20 - 24 5
25 - 29 2
2- Con los datos que tiene a continuación que representan el crecimiento anual
de un grupo de niños de una determinada edad, calcular:
a- Cuartil tres , b- Media y c - desviación típica.
Crecimiento fi
en cm.
3-4 5
5-6 8
7-8 10
9 - 10 15
11 - 12 12
Interpretar los resultados
3- En los siguientes casos: Dónde ubicaría la media aritmética, la mediana y el

modo y qué tipo de asimetría tendrían estas distribuciones?.
a- Media = 0,20 Mediana = 0,80 y el Modo = 0,90

b- Media = 16; Mediana = 16,80 y Modo = 19,20
c- Media = 23,5 Mediana = 23,8 y Modo = 23,8
Dibújelas
100
Lidia C. Diblasi
4- Un centro de juegos electrónicos del Gran Mendoza quiere estudiar la edad de

los asistentes por día:
Edad cantidad de
personas
7–8 4
9 - 10 8
11 - 12 12
13 - 14 18
15 - 16 13
a- Calcular: a- Cuartil 1; b- Mediana, c- Percentil 75

b- Realice un gráfico de caja
c- Interprete todos los resultados y diga cuáles son los límites del 50 % central de
la distribución .
5Los siguientes datos representan a tres grupos distintos de amigos cuyas edades
son:
Grupo I 24 – 23– 12 –19 - 29 – 20 - 23

Grupo II 34 – 33– 22 –19 - 19 – 20 - 23
Grupo III 42 – 34 –27 –37 – 32 – 34 -37
a- Calcule Media aritmética, Modo, Mediana y Desviación Típica

b- Analice las diferencias entre ambos grupos usando el Coeficiente de
Variación.
c- Realice un diagrama de tallos y hojas para cada grupo.
d- Qué comentarios puede hacer de los grupos con toda la información
obtenida.
6- Con los datos que tiene a continuación que representan el peso de los niños al
nacer registrados durante un mes en un hospital público:,
a- Calcular: a- media aritmética, b- mediana, c- Modo y d- Desviación típica

b- Diga solamente cómo calcularía el 40 % central de esta distribución.
c- Realice un gráfico apropiado.
d- Haga alguna lectura interpretativa del gráfico.
101
Lidia C. Diblasi
Peso en kg Fi
0,000 – 0,800 8
0,800 - 1,600 22
1,600 – 2,400 9
2,400 – 3,200 6
3,200 – 4,000 4
4,000 - 4,800 1
7- Con los datos que tiene a continuación que representan los kilogramos
mensuales de pan consumidos por un grupo de familias calcular:
a) Media, Mediana, Modo y Desviación típica.
b) Explique solamente cómo calcularía el 60 % central de esta distribución.
Kg. Fi
5-9 2
10 - 14 7
15 - 19 15
20 - 24 16
25 - 29 6
9- En la siguiente serie que representa la cantidad de integrantes por familia de

una comunidad barrial del Gran Mendoza, Calcular:
a- dos cuartiles, b- dos deciles y c- dos percentiles
Integrantes por flias. cantidad de flias.

1 5
2 12
3 19
4 38
5 45
6 27
7 12
8 4
9 1
10 3
10- Dos vendedores de un mismo producto tienen el siguiente promedio de venta:

Vendedor A: 800 productos mensuales con un desvío de 50.
Vendedor B: 1.000 mensuales con un desvío de 150
¿Cuál de los dos vendedores parece más constante en las ventas? ¿Porqué?
11- Si un grupo de estudiantes tiene un promedio de 6 puntos en un parcial con

una desviación de 0.25 puntos, y otro grupo tiene un promedio de 7.5 puntos
102
Lidia C. Diblasi
con una desviación de 0.25 puntos, ¿qué grupo de estudiantes tiene menor
variabilidad? ¿Porqué?
12- En una unidad académica, hay mensualmente en promedio 20 docente con

licencias por distintos motivos, con un desvío de 3 docentes. En otra unidad
académica, el promedio es de 12 docentes con un desvío de 6. ¿Qué grupo es
más heterogéneo en sus ausencias? ¿Porqué
103
Lidia C. Diblasi
Bibliografía consultada:
Ambrosi, Hugo Oscar, “La verdad de las Estadísticas. Aprender con los datos”
Lumiere, Buenos. Aires, 2008
Bancroft, Huldah, "Introducción a la Bioestadística", EUDEBA
Baranger, Denis, “Construcción y análisis de datos” Ed. Universitaria, UNM,
Posadas, 1999
Blanch, Nidia y Joekes, Silvia: “Estadística Aplicada a la Investigación” Nódulos 3
y 4- Curso de posgrado; Fac. de Ciencias económicas, Universidad Nacional de
Córdoba, 1994
Box, G.E.P.; Hunter, William; Stuart Hunter, J. “Estadística para investigadores.
Introducción al diseño de experimentos, análisis de datos y construcción de
modelos” Ed. Reverté, México, 2005
Cea D`Ancona, María Ángeles, “Metodología Cuantitativa. Estrategias y Técnicas
de Investigación Social” Ed. Síntesis Sociología, Madrid, 2001.
Daniel, Wayne: “Estadística con aplicaciones a las Ciencias Sociales y a la
Educación”, McGraw Hill latinoamericana, S.A. Bogotá, Colombia. 1981
García Ferrando, Manuel: Socioestadística. “Introducción a la estadística en
sociología”, Alianza Universidad Textos, Madrid, 1992
Hernandez Sampieri, R.; Fernandez Collado, C.; Baptista Lucio, P. “Metodología
de la Investigación” Mc Graw Hill, Colombia 1994
Hopkins, kenneth; Hopkins, B.R.; Glass, Gene: “Estadística básica para las
Ciencias Sociales y del Comportamiento” Prentice-Hall Hispanoamérica, S.A.,
México, 1997
Spiegel, Murray, " Estadística", Serie de Compendios Shaum, McGraw Hill
Interamericana de México S.A.,1994
Instituto Nacional de Estadísticas y Censos, Encuesta Permanente de Hogares,
Ministerio de Economía, Gran Buenos Aires Octubre de
1997.
Diblasi, Lidia y Romagnoli, Ricardo, "Medidas de tendencia central y de variación",
1991.Apuntes de cátedras. Mimeo.
104

Capítulo III Medidas de Posición y Dispersión. Personalizado

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Capítulo III Medidas de Posición y Dispersión. Personalizado

Cargado por

Copyright:

Formatos disponibles

Lidia C.

MEDIDAS DE POSICIÓN Y DISPERSIÓN

I- MEDIDAS DE TENDENCIA CENTRAL

Una medida de tendencia central es un número que indica el centro de una

La media aritmética: es la medida de tendencia central que se calcula más

x1+ x2+ x3+.....+.xn xi Σ

Si tenemos las siguientes notas resultado de cuatro parciales y queremos calcular

x1 f1+ x2 f2+ x3 f3+......+xn fn Σ xi fi

f1+ f2+ f3+.....+ fn Σf

Cuando, como resultado de un estudio, tenemos un conjunto de datos sin

El recorrido de esta variable (Rango) es desde 2 puntos, el valor más pequeño,

Realizamos los siguiente pasos para calcular la media:

Podemos calcular ahora la Media Aritmética teniendo ordenado los valores

Ahora podemos calcular la media

x = 7,15 es la nota promedio que han obtenido en un

Podemos tratar a la variable continua como si fuera discreta, dividiendo los

Veamos un ejemplo: Los siguientes datos hacen referencia a la edad al contraer

El recorrido de esta variable (Rango) es desde 15 años, el valor más pequeño,

Realizamos los siguiente pasos:

Ahora podemos calcular la media:

x = 29,5 años es la edad promedio al casarse de éste grupo de mujeres.

Algunas propiedades de la media aritmética:

1) La suma algebraica de los desvíos de un conjunto de valores en relación con su

Si tenemos los siguientes valores de una variable X: 1; 3; 5:7; 9

y calculamos la media de esos valores nos da: 5

Luego si a cada valor de la variable le restamos la media:

Podemos comprobar que la suma de éstos valores es igual a cero: Σ (x - x )

De igual forma se comprueba cuando trabajamos con frecuencias:

La razón de que la primera propiedad se verifique se debe a que cuando se

2) La suma de los cuadrados de los desvíos de un conjunto de valores xi respecto

Veamos un ejemplo con los datos del ejercicio anterior:

Como podemos observar calculando los desvíos respecto a un valor menor a la

De la misma forma se puede demostrar con una serie con frecuencia

3) Si f1 valores (ó n1 valores) tienen como media x 1; f2 valores (ó n2 valores)

x 1 f1+ x 2 f2+ x 3 f3+......+ x k fk

f1+ f2+ f3+.....+fk

es decir la media aritmética de todas las medias, la llamamos también “Media

En el siguiente cuadro se muestran las edades promedios al ingresar de los alumnos

22,49 *35 + 21,48 * 23 + 20,6 * 52 + 18,79 * 96

Promedios de edad al ingreso de los estudiantes de Ciencias Políticas y Sociales

La mediana: la mediana (Me) es el valor de la variable que divide el conjunto total

Si tenemos un conjunto de valores y los hemos ordenado:

Cuando la variable está ordenada con frecuencias podemos obtener la Mediana

Cuando una variable ya sea discreta, o continua, está ordenada en forma de

Podemos observar en la tabla de datos agrupados que la mitad de los casos se

Podemos decir que la edad mediana de las mujeres al contraer matrimonio es de

Comparación de la media aritmética y la mediana:

Hay varias diferencias entre ellas:

3- Como la media se ve afectada por los valores extremos, el empleo de la

asimetría, o sea, hacia una cola. Si la distribución es fuertemente simétrica,

Modo o moda: se denomina modo o moda al valor de la variable que más se

En el ejemplo la nota más común es 8, por lo tanto la Moda o Modo es igual a 8.

Cuando los valores de la variable, discreta o continua, se presentan en forma de

Veamos el ejemplo usado para la media y la mediana: la edad en contraer

La mayor frecuencia se encuentra en el intervalo 25 a 29 años, lo que significa que

En éste grupo la edad de las mujeres más común, al contraer matrimonio, de es

En el ejemplo que hemos seguido para calcular la Media, la Mediana

Edad de un grupo de mujeres al contraer matrimonio, Mendoza, 2005

En el gráfico podemos observar la asimetría de la distribución ya que la caja

MEDIA, MEDIANA Y MODA: ¿CUÁL MEDIDA ELEGIR?

A semejanza de la Mediana que divide a la distribución de una variable en

Cuartiles: son valores de la variable que dividen al conjunto ordenado de datos

El cuartil segundo (Q2) es el valor de la variable que divide el conjunto ordenado

Cómo calcularlo: se ordenan los valores correspondientes a todas las unidades de

22,49 35 + 21,48 23 + 20,6 * 52 + 18,79 * 96