Módulo 3. Medidas de Tendencia Central y de Dispersión

Medidas de
tendencia central
y de dispersión
Antoni Cosculluela Mas
Albert Fornieles Deu
Jaume Turbany Oset
PID_00214851
© FUOC • PID_00214851 2 Medidas de tendencia central y de dispersión
© FUOC • PID_00214851 Medidas de tendencia central y de dispersión
Índice
Objetivos ................................................................................................... 5
1. Las medidas de tendencia central ................................................. 7

1.1. La mediana o la observación central .............................................. 8
1.2. La media aritmética o valor medio ................................................ 9
2. Medidas de dispersión ...................................................................... 11

2.1. La desviación estándar (s) ............................................................... 13
Resumen de los vídeos ........................................................................... 16
Actividades ............................................................................................... 19
Solucionario ............................................................................................. 21
© FUOC • PID_00214851 Medidas de tendencia central y de dispersión
Objetivos
En los materiales didácticos de este módulo presentamos los contenidos y las

herramientas imprescindibles para conseguir los objetivos siguientes:
1. Conocer las propiedades de los índices de posición, tendencia central
2. Identificar el índice de tendencia central más adecuado en cada caso.
3. Conocer las propiedades de los índices de dispersión.
4. Interpretar los listados Excel.

1. Las medidas de tendencia central
En este apartado veremos dos maneras de resumir un valor típico o medio de

un conjunto de datos que mide el centro de una distribución.
Al final del presente apartado sobre medidas del centro deberéis ser capaces de:
• Saber cómo se calcula la mediana, o valor central, de un conjunto de datos. Véase el resumen del vídeo 4 en el
a
apartado "Resumen de los vídeos" de
• Saber cómo se calcula la media aritmética, o media, de un conjunto de datos. este módulo.
• Conocer qué diferencias hay entre la mediana y la media aritmética.
Los gráficos de tallo y hojas, así como los histogramas, proporcionan una des-
cripción general de un conjunto de datos cuantitativos. Ahora veremos mane-
ras más específicas de resumir los datos cuantitativos en índices estadísticos
numéricos, que nos permitirán comparar con facilidad diferentes conjuntos
de datos (los valores resumen son números obtenidos mediante cálculos a par-
tir de los datos. Estos índices permiten caracterizar la variable que se estudia.
La mediana y la media son dos ejemplos de ello).
Dedicaremos este apartado a estudiar algunos de los índices descriptivos más

importantes. Empezaremos con las medidas de tendencia central: la mediana
y la media aritmética. Como veremos, estos dos índices son diferentes y úni-
camente coincidirán cuando la distribución de la variable sea simétrica.
En primer lugar, tenemos que la mediana es el valor que divide la distribu- Sobre la mediana podéis ver el
a
subapartado 1.1 de este módulo.
ción de los datos en dos partes iguales (deja un 50% por encima y otro 50%
por debajo). Se trata pues de un índice de posición. Para encontrar la me-
diana deberemos ordenar los datos de menor a mayor y contar el número
de elementos hasta encontrar cuál es el valor que está en el medio de la dis-
tribución. Dado que es un índice de posición, la mediana no se ve afectada
por la presencia de valores extremos, por eso decimos que es un índice re-
sistente o robusto.
La media aritmética (promedio), por el contrario, es un índice de peso, ba- a

Sobre la media aritmética podéis ver el
subapartado 1.2 de este módulo.
sado en el momento de la distribución (en realidad, la podemos definir
como el centro de gravedad de la distribución) y se calcula sumando todos
los valores de los datos y dividiendo este sumatorio por el número de ob-
servaciones (n).
En el ejemplo de la figura 1 se encuentran algunos índices que todavía no han

sido expuestos, pero que se explicarán en el próximo apartado (cuartiles y cen-
tiles). Fijándonos en las medidas de tendencia central, es fácil apreciar cómo,
en este caso, los valores de la cola de la distribución asimétrica afectan consi-
derablemente a la media (de hecho, un único valor extremo puede hacer cam-
biar mucho el valor de la media aritmética), desplazándola en la dirección de
dicha cola de la distribución, por lo que este índice no será una buena opción
para describir variables asimétricas y/o con valores extremos. En estos casos es
preferible llevar a cabo la descripción de la distribución de la variable median-
te la mediana (podéis ver el resumen del vídeo 4 del CD).
Figura 1. Distribución de salarios
1.1. La mediana o la observación central
Una manera fácil de conseguir un valor para el centro de una distribución es Véase el resumen del vídeo 4 en el
a
hallar la observación que queda exactamente en el medio, lo que implica que este módulo.
la mitad de las observaciones quedan por debajo de este valor y la otra mitad
por encima de él. Este valor se denomina mediana de la distribución.
Veamos un ejemplo. Supongamos que a lo largo de un período de 27 días ano-

táis el rato que debéis esperar hasta que el autobús llega por la mañana. Los
datos, en minutos, se muestran en la tabla 1.
Tabla 1. Tiempo de espera hasta que llega el autobús, en minutos

9 5 6 8 8 9 12 4 7
3 11 8 4 5 2 6 4 8
17 3 13 11 7 7 4 7 12
Ahora la pregunta es: ¿qué valor podéis usar como típico para describir el tiem-
po que debéis esperar? El gráfico de tallo y hojas de estos datos es:
Si tenemos estos datos, podemos saber a posteriori cuál es la mediana corres-

pondiente.
Al construir el gráfico de tallo y hojas hemos puesto todas las observaciones

en orden ascendente, de la observación menor (2 minutos) a la mayor (17 mi-
nutos). Puesto que hay 27 observaciones, la observación central será la deci-
mocuarta de la lista ordenada, ya que dejará 13 valores anteriores al
decimocuarto y 13 posteriores. El valor decimocuarto es 7 minutos. El hecho
de que haya un cierto número de observaciones de 7 minutos no tiene impor-
tancia (de hecho, en la lista ordenada, el valor duodécimo, decimotercero, de-
cimocuarto y decimoquinto es 7).
Por tanto, la regla para conseguir la mediana pasa por buscar qué posición ha
de ocupar el valor que divide en dos partes iguales la distribución. La fórmula
para buscar esta posición es muy sencilla y consiste en sumar uno al número
total de observaciones y dividirlo por dos.
Formalmente:
n1
Posición de la mediana: Posición 
2
La letra n se emplea convencionalmente para el número de observaciones de a

Sobre la notación que utilizamos, véase
el subapartado 1.1 del módulo
un conjunto de datos. "Organización de los datos de una
muestra: representaciones gráficas".
En el ejemplo, con n = 27 valores, el valor central es el valor de la posición

(27 + 1)/2 = 14 de la lista, que corresponde al valor 7 minutos.
Cuando n es impar, el número de la observación para la mediana es un entero

exacto. Sin embargo, cuando n es un número par, no hay ninguna observa-
ción exactamente central en la lista ordenada. Por ejemplo, si había 26 obser-
vaciones, entonces nuestra fórmula nos da (26 + 1)/2 = 13,5. Lo que hacemos
ahora es tomar como mediana el punto medio entre los números que ocupan
el decimotercero y decimocuarto lugar de la lista ordenada. Esto nos sigue
dando un valor en el que la mitad de las observaciones quedan por debajo y
la otra mitad por encima, de manera que satisface la definición de la mediana.
Los valores resumen como la mediana provocan que sean más fáciles las com-
paraciones entre diferentes grupos de observaciones (el vídeo da un ejemplo
de un conjunto de sueldos para hombres y otro para mujeres. En ambos casos
se ha calculado la mediana de los sueldos y vemos que la mediana de los hom-
bres es superior a la de las mujeres).
1.2. La media aritmética o valor medio (X)
La media aritmética de un conjunto de datos cuantitativos es su valor medio a

Podéis ver un resumen del vídeo 2 en el
(promedio). Para calcular la media aritmética no es necesario empezar orde- este módulo.
nando los valores de los datos (como en el caso de la mediana), simplemente

sumamos todos los valores y dividimos por el número total de datos n. Utili-
zando la notación habitual, la media aritmética es igual a:
X
X i
Para los datos de la tabla 1 del tiempo de espera del autobús los cálculos son
los siguientes:
1) Sumar los 27 valores: 9 + 5 + 6 + ... + 7 + 4 = 200.

2) Dividir la suma por 27: 200 / 27 = 7,41.
La media aritmética de estos valores es, por lo tanto, 7,41 minutos; es decir,
a lo largo de los 27 días habéis tenido que esperar el autobús una media de
7,41 minutos. Fijaos en que la media da un valor ligeramente superior a la
mediana (7 minutos). De ahí que en el caso de la media aritmética se deban
tomar precauciones con los datos alejados o insólitos.
Tanto la mediana como la media aritmética miden el centro de la distribución,

pero lo hacen de manera distinta. Sólo cuando la distribución es simétrica las
dos medidas coinciden. La principal diferencia entre ambas es cómo se ven
afectadas por las asimetrías y/o los datos alejados.
Cuando la distribución es asimétrica, la media aritmética siempre se desplaza

hacia la cola de la distribución. En el caso más común de una distribución que
es asimétrica hacia la derecha, por ejemplo, los datos de los ingresos que he-
mos visto en el vídeo, la media aritmética es más alta que la mediana.
La presencia de un valor muy elevado no afecta a la mediana, pero influye mu-

cho sobre la media aritmética. Decimos que la mediana “resiste” los datos ale-
jados. Por ejemplo, imaginemos que, en lugar de 17 minutos, el valor más alto
en los datos del ejemplo fuese 45 minutos, que es una espera muy larga para
un solo día. Este cambio no afecta a la mediana, de hecho ésta permanecería
igual incluso si lo cambiásemos por un valor mucho más elevado.
La media aritmética, por el contrario, quedaría afectada, ya que la suma de todas

las observaciones ahora sería 228, que dividida por 27 da el valor 8,44 minutos.
Este incremento de una observación hace subir la media aritmética del tiempo
de espera en un minuto, a pesar de que los otros 26 valores permanezcan in-
tactos. En una situación como ésta, la media aritmética pierde la condición de
ser un valor representativo.
2. Medidas de dispersión
Anteriormente hemos considerado varias maneras de representar gráficamente

la distribución de una variable y hemos definido dos modos de calcular los ín-
dices del centro de una distribución. Ahora necesitamos obtener información
sobre hasta qué punto las observaciones se dispersan alrededor del centro. De la
misma manera que existen varios modos de medir el centro de la distribución,
también hay diferentes procedimientos para calcular la dispersión. Igualmente,
la mejor o peor aplicabilidad de éstos índices también depende de si la distribu-
ción es simétrica o no, y de la presencia o no de datos insólitos.
En definitiva, para describir adecuadamente una variable no es suficiente con

las medidas de tendencia central, ya que éstas nos indican dónde se encuen-
tran los valores centrales, pero no nos informan sobre cómo están agrupadas
las observaciones en torno a este centro de la distribución, por lo que podemos
tener variables con medias y/o medianas similares o incluso idénticas que ten-
gan, en realidad, distribuciones completamente diferentes.
Por tanto, para completar la descripción de las variables cuantitativas es pre-

ciso añadir los índices de dispersión. En concreto, valoraremos la posibilitad
de utilizar el rango, la varianza, la desviación típica y los cuartiles.
Al final de este apartado sobre medidas de dispersión deberéis ser capaces de:
• Saber cómo se resume la dispersión de una distribución mediante cinco

números: el mínimo, el primer cuartil, la mediana (segundo cuartil), el
tercer cuartil y el máximo.
• Conocer cómo se representa el resumen de estos cinco números en un

diagrama de caja.
• Saber cómo se calcula la desviación estándar de un conjunto de valores.
El rango de una variable (recorrido o amplitud) se puede calcular con una ope- a
Sobre la notación que utilizamos, véase
el subapartado 1.1 del módulo
ración muy sencilla, ya que únicamente consiste en restar el valor máximo del "Organización de los datos de una
muestra: representaciones gráficas".
mínimo. Por desgracia, se trata de un índice de escasa utilidad, ya que un úni-
co valor extremo o insólito puede hacer que pierda gran parte del su sentido
informativo. En términos de la notación habitual, en el que x(1), x(2),..., x(n) co-
rresponden al orden estadístico de una distribución ordenada: valor mínimo
= x(1), valor máximo = x(n), rango = x(n) – x(1).
La varianza* se puede definir como la media de la suma de los cuadrados de

* Véase el vídeo 6 del CD.
las diferencias que hay entre cada valor y la media aritmética. Esto provoca
que cuanto más grandes sean estas diferencias o distancias (más dispersa o he-
terogénea sea la variable), mayor será el valor de la variancia. El hecho de que
las diferencias se eleven al cuadrado evita la presencia de valores negativos (si
no se elevasen las diferencias al cuadrado, al haber algunos valores por encima
y otros por debajo de la media, su sumatorio sería 0) y provoca que las diferen-
cias más grandes pesen más en el valor del índice.
Por otro lado, también implica que la varianza sea siempre de signo positivo
y esté en la unidad de medida de la variable elevada al cuadrado (por ejemplo,
el cociente de inteligencia (CI) tiene en la población una media  = 100 puntos
de CI y una varianza 2 = 225 puntos2 de CI).
Para facilitar su interpretación, en lugar de la varianza, se suele presentar su

raíz cuadrada, que, por tanto, ya se encuentra en las mismas unidades de me-
dida que la variable. Este índice se denomina desviación tipo (típica) o están-
dar y es uno de los índices de dispersión más utilizados (la desviación tipo del
CI en la población es de  = 15 puntos de CI).
Los cuartiles* son, como la mediana, índices de posición. La lógica que subya-
ce al cálculo de este índice es la siguiente: ordenamos los datos y los dividimos
en cuatro partes del mismo tamaño, por lo que tendremos tres puntos de corte
o cuartiles.
El primer cuartil es el valor que deja el 25% de las observaciones por debajo,
el segundo coincide con la mediana y, por tanto, es el valor que divide la dis-
tribución en dos partes iguales y el tercer cuartil corresponde al valor que deja
el 75% de los valores por debajo (y, lógicamente, queda el 25% por encima).
El cálculo de los cuartiles es muy sencillo, ya que podemos decir que los cuar-
tiles 1.º y 3.º son la mediana de las dos mitades de la distribución que quedan
definidas por la mediana.
Una vez calculados los cuartiles, restando el 3.º del 1.º (Q3 – Q1) podemos ob-
tener el rango intercuartílico, que nos indica cuál es la dispersión del 50%
central de las observaciones.
Como ya hemos señalado anteriormente, la descripción de las variables cuan-

titativas se suele presentar con un índice de tendencia central y uno de disper-
sión. En este sentido, es preciso remarcar que la media aritmética ha de ir
siempre acompañada de la desviación tipo y la mediana de los cuartiles.
Por último, cabe constatar la posibilidad de realizar otro tipo de representa-

ción gráfica que nos puede ayudar a estudiar la distribución de una variable
mediante el resumen de 5 números (máximo, cuartil 3.º, mediana, cuartil 1.º
y mínimo). Este gráfico se denomina gráfico de caja o boxplot* y es de gran
utilidad, ya que, además de ser una representación gráfica de la variable, per-
mite comparar distribuciones de la misma variable provinentes de diferentes

muestras o subgrupos (por ejemplo, podríamos comparar la distribución de las
alturas de chicos y chicas).
2.1. La desviación estándar (s)
A continuación veremos otro índice estadístico de dispersión denominado

desviación estándar, tipo o típica (a lo largo del curso utilizaremos indistin-
tamente cualquiera de estas denominaciones). (Véase el vídeo 6 del CD.)
La desviación estándar es un valor único que se puede utilizar para cuantificar la

dispersión de un conjunto de datos. La alternativa a la desviación tipo más em-
pleada utiliza varios números, como es el caso del resumen de cinco números.
Recordad que ahora estamos interesados en encontrar un único número que

resuma la dispersión de los datos y nos interesa, en concreto, la dispersión al-
rededor de la media aritmética. Este cálculo se realizará de la manera siguiente:
1) El primer paso es encontrar la media y, después, calcular todas las diferen-

cias entre cada observación y la media aritmética del conjunto. Está claro que
cuanto mayores son las diferencias, mayor es la dispersión de los datos, pero
necesitamos combinar todas estas desviaciones en un valor global.
2) Calcular la variancia es el paso siguiente. Elevamos al cuadrado cada una de

las desviaciones, las sumamos y después dividimos la suma resultante por n – 1
(el número de las observaciones menos 1). Hay que dividir por n – 1 y no por
n, a pesar de que pueda parecer más intuitivo dividir por n para obtener la me-
dia del cuadrado de las desviaciones. El resultado de estos cálculos es la varian-
za. Ahora damos la fórmula para el cálculo de la varianza y la desviación típica:
2

(X i  X )2
Variancia de una variable: s x
n 1
2
Desviación típica: s x
 s x
donde, x = variable; x1, x2, x3, ..., xn = valores de la variable; n = número de

observaciones o valores
• Cálculo de la media x.
• Cálculo de las desviaciones xi  x.
• Cálculo de las desviaciones cuadráticas ( xi  x )2 .
Veamos otro ejemplo sencillo. Imaginaos que tenemos los precios de un cierto
producto comprado en seis comercios diferentes: 260, 240, 250, 210, 230 y
250 euros. La suma de estos valores es 1.440, de manera que el valor medio es
1.440/6 = 240 euros. Las desviaciones del valor 240 son 20, 0, 10, 30, 10 y 10
(tomad nota de que las desviaciones respecto a la media aritmética siempre su-
man 0). Los cuadrados de estas desviaciones son: 400, 0, 100, 900, 100 y 100,
y suman 1.600. Finalmente, dividimos por n – 1 = 5 para obtener la varianza
(s2 = 1.600/5 = 320 euros2).
Por tanto, podemos verificar que la varianza es la media aritmética de los cua-
drados de las desviaciones de los datos de una serie con respecto a su media
aritmética.
La desviación estándar es simplemente la raíz cuadrada positiva de la varianza.
Fijaos en que la varianza se calcula en unidades que son los cuadrados de las
unidades de los datos originales. Por tanto, tomando la raíz cuadrada de la
varianza para obtener la desviación estándar la medida de extensión vuelve
a las unidades originales. En nuestro ejemplo, la desviación estándar de los
precios es la raíz cuadrada de 320, es decir, 17,9, pongamos 18 euros. En la
tabla 2 podemos ver esta información estructurada de forma que nos facili-
tará los cálculos (en caso de hacerlos manualmente).
Tabla 2
X XX (X  X )2
260 20 400
240 0 0
250 10 100
210 –30 900
230 –10 100
250 10 100
Sumatorio 1440 1600
Media = 240 Varianza = 320
S= 17,89
Más adelante daremos unos criterios para la interpretación más exacta de la

desviación estándar. De momento, simplemente daos cuenta de que muchas
de las desviaciones con respecto a la media aritmética quedan dentro de una
desviación estándar. Por ejemplo, de los valores absolutos de las seis diferen-
cias calculadas anteriormente 20, 0, 10, 30, 10 y 10, cuatro tienen valores ab-
solutos que no llegan a 18.
El vídeo nos muestra cómo se compara la extensión de diferentes distribucio-

nes simplemente comparando sus respectivas desviaciones estándar, si bien,
cuando se trate de comparar variables medidas en unidades diferentes, hemos
de emplear el coeficiente de variación (CV). El cálculo de este coeficiente es
muy sencillo y con su utilización eliminamos las unidades de las variables, lo

que facilita su comparación.
s
CV   100
x
Por último, ¿cuándo debemos usar desviaciones estándar y cuándo el resumen

de los cinco números? Tanto los cinco números resumen (y su versión gráfica,
el diagrama de caja) como la desviación estándar miden la dispersión, pero de
manera distinta.
La desviación estándar ofrece la ventaja de ser un número único, pero real-

mente debería utilizarse (igual que sucede con la media aritmética) sólo cuan-
do las distribuciones sean más o menos simétricas.
Cuando las distribuciones son asimétricas, la dispersión bajo el centro y la dis-

persión sobre el centro no son las mismas, y esto nos lo indicará el resumen
de los cinco números y no la media aritmética. Como la media aritmética, la
desviación estándar es altamente sensible a las observaciones alejadas. A pesar
de esto, la desviación estándar es el índice de dispersión que se utiliza con más
frecuencia para medir la dispersión, y nosotros la usaremos a menudo a lo lar-
go del resto de esta asignatura.
En ocasiones, cuando los datos son asimétricos, se realiza una serie de ope-
raciones para transformarlos de manera que la distribución de estos valores
transformados sí sea más simétrica. Por ejemplo, para datos positivos con
una cola en la distribución a la derecha, se puede aplicar una transformación
logarítmica de los datos*. La distribución de los datos transformados es más
simétrica y, en este caso, es posible utilizar la media y la desviación estándar
para describir la dispersión de las observaciones transformadas.
Resumen de los vídeos
Vídeo 4
Este vídeo empieza con un ejemplo de las diferencias de sueldo entre hombres
y mujeres.
Vemos en él dos histogramas correspondientes a los sueldos de dos submuestras,

una de hombres y otra de mujeres, que realizan trabajos comparables. Ambos
histogramas son asimétricos por la derecha, pero da la sensación de que el patrón
general de los sueldos de los hombres sea superior al de las mujeres.
Para resumir un valor típico para cada distribución, se presenta la mediana

como punto medio de una distribución. Después vemos que la mediana de los
sueldos de los hombres es también más alta que la mediana para las mujeres.
El vídeo explica la historia de un caso concreto en el que los cálculos de la me-

diana ayudaron a las mujeres trabajadoras a equiparar su salario con los hom-
bres que trabajan en mantenimiento, cuyos trabajos fueron considerados
comparables (mediante una valoración objetiva de puestos de trabajo) con los
de las mujeres.
Vemos una ilustración detallada de cómo se calcula la mediana. Después se in-

troduce y se muestra una medida de centro alternativa, la media aritmética. La
media aritmética es sensible a valores insólitamente altos o bajos en el conjun-
to de datos, mientras que la mediana no lo es, por lo que decimos que la me-
diana es un índice resistente o robusto.
El cálculo de la mediana y la media aritmética provienen de dos ideas diferentes

y, por tanto, no es necesario que den resultados numéricos idénticos, ni siquie-
ra, en muchos casos, parecidos. Vemos que la media aritmética y la mediana se
asemejan sólo si la distribución es simétrica; por el contrario, la media aritméti-
ca tiende más hacia la cola de la distribución asimétrica que la mediana.
Vídeo 6
Vemos cómo los investigadores y las investigadoras estudian los análisis de

sangre automatizados e intentan identificar lecturas de valores anormalmente
altos o bajos. Para averiguar cuándo podemos considerar anormal una obser-
vación, necesitamos saber hasta dónde se extienden las lecturas normales.
Vemos los resultados de un análisis específico practicado a diez personas. Un

gráfico de tallo y hojas muestra que la distribución es aproximadamente simé-
trica, sin datos insólitos. Por lo tanto, podemos utilizar la media aritmética
para describir el centro. Para medir la dispersión alrededor de la media aritmé-
tica, primero calculamos las diferencias entre las observaciones y la media arit-
mética. Hay algunas positivas y otras negativas. Por esta razón, elevamos al
cuadrado estas diferencias, las sumamos y las dividimos por n – 1 (una menos
que el número de observaciones), en este caso 9. Esto nos da la varianza indi-
cada por s2. La desviación estándar, indicada por s, es la raíz cuadrada positiva
de la varianza.
La desviación estándar se emplea para resumir la desviación de las observacio-

nes respecto a la media aritmética y como base para decidir si un análisis de
sangre es anormal o no.
Se presentan algunas propiedades básicas de las desviaciones estándar: s es

siempre positivo o cero; s = 0 únicamente cuando no hay dispersión, es decir,
cuando todas las observaciones tienen el mismo valor; a medida que la disper-
sión aumenta, s también lo hace; como sucede con la media aritmética, las ob-
servaciones extremas influyen mucho sobre s.
Un aspecto curioso de este vídeo es la utilización de la música, por parte de los

investigadores, para “volver a oír” los datos en forma de una melodía conoci-
da, en la que introducen una nota estridente cada vez que el programa en-
cuentra una observación anormal.
Actividades
1. Consultad de nuevo el vídeo 4 del CD.

Véase la solución de esta
actividad en el anexo disponible
en la web de la asignatura.
Centraos en el modo como se calculan la mediana y la media aritmética y cómo adquieren
varias características de la distribución. Observad cómo los datos alejados no afectan a la me-
diana, pero influyen muchísimo en la media aritmética y resolved la actividad siguiente.
Los siguientes datos corresponden a las edades y las puntuaciones de la escala de extraversión
de 20 sujetos (corresponde a las 20 primeras puntuaciones de la matriz general).
Calculad la mediana y la media aritmética de estas dos variables y comentad los resultados.
Caso Edad Extraversión
1 28 13
2 27 15
3 30 5
4 32 7
5 41 6
6 34 13
7 21 15
8 33 2
9 29 20
10 18 11
11 40 14
12 34 11
13 42 6
14 18 18
15 30 6
16 20 10
17 28 12
18 22 7
19 31 13
20 33 12
A continuación, suponed que el último sujeto tiene 96 años (en lugar de 33). ¿En qué afecta
este cambio a la media? ¿Y a la mediana? Razonad por qué ambos valores reaccionan de di-
ferente manera.
2. Consultad de nuevo el vídeo 6 del CD. Centraos en el modo como se calcula la varianza y la
Véase la solución de esta
desviación estándar, y resolved la actividad siguiente. actividad en el anexo disponible
en la web de la asignatura.
Los siguientes datos corresponden a las edades y las puntuaciones de la escala de extraversión
de 20 sujetos (corresponde a las 20 primeras puntuaciones de la matriz general).
Calculad la varianza y la desviación estándar de estas dos variables y comentad los resultados.
Caso Edad Extraversión
1 28 13
2 27 15
3 30 5
4 32 7
5 41 6
6 34 13
7 21 15
8 33 2
9 29 20
10 18 11
11 40 14
12 34 11
13 42 6
14 18 18
15 30 6
16 20 10
17 28 12
18 22 7
19 31 13
20 33 12
Solucionario
1. Los datos corresponden a las edades y a las puntuaciones de extraversión.
Edad Extraversión
Media 29,55 10,80
Mediana 30,00 11,50
Si el último sujeto tuviera 96 años (en lugar de 33). Vemos cómo afecta este cambio a la me-
dia aritmética y a la mediana.
Edad cambiada
Edad
a 96 años
Media 29,55 32,70
Mediana 30,00 30,00
Interpretación: Vemos que la presencia de un solo valor alejado modifica considerablemente

la media, pero no la mediana, puesto que este es un índice robusto.
2.
Edad Extraversión
Varianza 50,89 21,54
Desviación estándar 7,13 4,64

Módulo 3. Medidas de Tendencia Central y de Dispersión

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Módulo 3. Medidas de Tendencia Central y de Dispersión

Cargado por

Copyright:

Formatos disponibles

Medidas de

1. Las medidas de tendencia central ................................................. 7

2. Medidas de dispersión ...................................................................... 11

Resumen de los vídeos ........................................................................... 16

En los materiales didácticos de este módulo presentamos los contenidos y las

1. Conocer las propiedades de los índices de posición, tendencia central

2. Identificar el índice de tendencia central más adecuado en cada caso.

3. Conocer las propiedades de los índices de dispersión.

4. Interpretar los listados Excel.

1. Las medidas de tendencia central

En este apartado veremos dos maneras de resumir un valor típico o medio de

• Conocer qué diferencias hay entre la mediana y la media aritmética.

Dedicaremos este apartado a estudiar algunos de los índices descriptivos más

La media aritmética (promedio), por el contrario, es un índice de peso, ba- a

En el ejemplo de la figura 1 se encuentran algunos índices que todavía no han

Figura 1. Distribución de salarios

1.1. La mediana o la observación central

Veamos un ejemplo. Supongamos que a lo largo de un período de 27 días ano-

Tabla 1. Tiempo de espera hasta que llega el autobús, en minutos

Si tenemos estos datos, podemos saber a posteriori cuál es la mediana corres-

Al construir el gráfico de tallo y hojas hemos puesto todas las observaciones

La letra n se emplea convencionalmente para el número de observaciones de a

En el ejemplo, con n = 27 valores, el valor central es el valor de la posición

Cuando n es impar, el número de la observación para la mediana es un entero

1.2. La media aritmética o valor medio (X)

La media aritmética de un conjunto de datos cuantitativos es su valor medio a

nando los valores de los datos (como en el caso de la mediana), simplemente

1) Sumar los 27 valores: 9 + 5 + 6 + ... + 7 + 4 = 200.

Tanto la mediana como la media aritmética miden el centro de la distribución,

Cuando la distribución es asimétrica, la media aritmética siempre se desplaza

La presencia de un valor muy elevado no afecta a la mediana, pero influye mu-

La media aritmética, por el contrario, quedaría afectada, ya que la suma de todas

Anteriormente hemos considerado varias maneras de representar gráficamente

En definitiva, para describir adecuadamente una variable no es suficiente con

Por tanto, para completar la descripción de las variables cuantitativas es pre-

• Saber cómo se resume la dispersión de una distribución mediante cinco

• Conocer cómo se representa el resumen de estos cinco números en un

• Saber cómo se calcula la desviación estándar de un conjunto de valores.

La varianza* se puede definir como la media de la suma de los cuadrados de

Para facilitar su interpretación, en lugar de la varianza, se suele presentar su

Como ya hemos señalado anteriormente, la descripción de las variables cuan-

Por último, cabe constatar la posibilidad de realizar otro tipo de representa-

mite comparar distribuciones de la misma variable provinentes de diferentes

2.1. La desviación estándar (s)

A continuación veremos otro índice estadístico de dispersión denominado

La desviación estándar es un valor único que se puede utilizar para cuantificar la

Recordad que ahora estamos interesados en encontrar un único número que

1) El primer paso es encontrar la media y, después, calcular todas las diferen-

2) Calcular la variancia es el paso siguiente. Elevamos al cuadrado cada una de

donde, x = variable; x1, x2, x3, ..., xn = valores de la variable; n = número de

La desviación estándar es simplemente la raíz cuadrada positiva de la varianza.

210 –30 900

230 –10 100

Sumatorio 1440 1600

Media = 240 Varianza = 320

Más adelante daremos unos criterios para la interpretación más exacta de la

El vídeo nos muestra cómo se compara la extensión de diferentes distribucio-

muy sencillo y con su utilización eliminamos las unidades de las variables, lo

Por último, ¿cuándo debemos usar desviaciones estándar y cuándo el resumen

La desviación estándar ofrece la ventaja de ser un número único, pero real-

Cuando las distribuciones son asimétricas, la dispersión bajo el centro y la dis-

Resumen de los vídeos

Vemos en él dos histogramas correspondientes a los sueldos de dos submuestras,