Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadísticos Descriptivos
Media Aritmética
La más importante de las medidas de tendencia central es la media, o valor promedio, de una
variable. La media proporciona una medida de localización central de los datos. Si los datos
son datos de una muestra, la media se denota ; si los datos son datos de una población, la
media se denota con la letra griega μ.
En las fórmulas estadísticas se acostumbra denotar el valor de la primera observación de la
variable x con x1, el valor de la segunda observación de la variable x con x2 y así con lo
siguiente.
En general, el valor de la i-ésima observación de la variable x se denota xi. La fórmula para la
media muestral cuando se tiene una muestra de n observaciones es la siguiente.
∑ 𝑥𝑖
𝑥=
𝑛
Para ilustrar el cálculo de la media muestral, considere los siguientes datos que representan
el tamaño de cinco grupos de una universidad.
46 54 42 46 32
Se emplea la notación 𝑥1, 𝑥2, 𝑥3, 𝑥4, 𝑥5 para representar el número de estudiantes en cada uno
de los cinco grupos.
𝑥1 = 46 𝑥2 = 54 𝑥3 = 42 𝑥4 = 46 𝑥5 = 32
∑ 𝑥𝑖 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 46 + 54 + 42 + 46 + 32
𝑥= = = = 44
𝑛 5 5
Para calcular la media de una población use la misma fórmula, pero con una notación
diferente para indicar que trabaja con toda la población. El número de observaciones en una
población se denota N y el símbolo para la media poblacional es μ.
∑ 𝑥𝑖
𝜇=
𝑁
Mediana
MEDIANA
Ordenar los datos de menor a mayor (en forma ascendente).
a. Si el número de observaciones es impar, la mediana es el valor de en medio.
b. Si el número de observaciones es par, la mediana es el promedio de las dos observaciones
de en medio.
Apliquemos esta definición para calcular la mediana del número de alumnos en un grupo a
partir de la muestra de los cinco grupos de universidad. Los datos en orden ascendente son
32 42 46 46 54
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925
Como n = 12 es par, se localizan los dos valores de en medio: 3490 y 3520. La mediana es el
promedio de estos dos valores.
3490 + 3520
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = = 3505
2
Moda
Para ilustrar cómo identificar a la moda, considere la muestra del tamaño de los cinco grupos
de la universidad.
32 42 46 46 54
El único valor que se presenta más de una vez es el 46, por lo que es el valor con mayor
frecuencia, entonces es la moda.
Para ver otro ejemplo, considere la muestra de los sueldos iniciales de los recién egresados.
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925
El único salario mensual inicial que se presenta más de una vez es $3480. Como este valor
tiene la frecuencia mayor, es la moda.
Hay situaciones en que la frecuencia mayor se presenta con dos o más valores distintos.
Cuando esto ocurre hay más de una moda. Si los datos contienen más de una moda se dice
que los datos son bimodales. Si contienen más de dos modas, son multimodales. En los casos
multimodales casi nunca se da la moda, porque dar tres o más modas no resulta de mucha
ayuda para describir la localización de los datos.
Además de las medidas de tendencia central, es muy útil considerar las medidas de
variabilidad o de dispersión.
Rango
La medida de dispersión más sencilla es el rango.
Rango = Valor mayor - Valor menor
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925
Varianza
La varianza es una medida de dispersión que utiliza todos los datos. La varianza está basada
en la diferencia entre el valor de cada observación (xi) y la media. A la diferencia entre cada
valor xi y la media se le llama desviación respecto de la media. Si se trata de una muestra, una
desviación respecto de la media se escribe (𝑥𝑖 − 𝑥), y si se trata de una población se escribe
(𝑥𝑖 − 𝜇). Para calcular la varianza, estas desviaciones respecto de la media se elevan al
cuadrado.
Si los datos son de una población, el promedio de estas desviaciones elevadas al cuadrado es
la varianza poblacional. La varianza poblacional se denota con la letra griega 𝜎2. En una
población en la que hay N observaciones y la media poblacional es μ, la varianza poblacional se
define como sigue.
∑(𝑥𝑖 − 𝜇)2
𝜎2 =
𝑁
En la mayor parte de las aplicaciones de la estadística, los datos a analizar provienen de una
muestra. Aunque en este texto no se detalla, es posible demostrar que la varianza muestral se
obtiene dividiendo la suma de los promedios al cuadrado para (n-1) en lugar de n. La varianza
muestral se simboliza con 𝑠2, y se la obtiene de la siguiente forma:
∑(𝑥𝑖 − 𝑥)2
𝑠2 = 𝑛−1
Para ilustrar el cálculo de la varianza muestral, se emplean los datos de los tamaños de cinco
grupos de una universidad
32 42 46 46 54
∑(𝑥𝑖 − 𝑥)2 = (32 − 44)2 + (42 − 44)2 + (46 − 44)2 + (46 − 44)2 + (54 − 44)2 = 256
Desviación estándar
Recuerde que la varianza muestral para los tamaños de cinco grupos de una universidad es
𝑠2 = 64. Por tanto, la desviación estándar muestral es
𝑠 = √64 = 8
En la mayor parte de los casos, las medidas de tendencia central y dispersión se calculan
mediante los valores individuales de los datos. Sin embargo, otras veces sólo se tienen datos
agrupados o datos en una distribución por clases. A continuación, se aborda la forma de
obtener las medidas de tendencia central para datos agrupados.
Primero se debe hallar la clase en la cual se encuentra la mediana. La clase mediana es la clase
𝑛
cuya FAA es mayor o igual a .
2
Una vez ubicada la clase mediana se calcula la mediana utilizando la siguiente fórmula:
𝑛
−𝐹
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 𝐿𝑚𝑑 + [ 2 ]∙𝐶
𝑓𝑚𝑑
Donde
Ejemplo 2.4.1
La siguiente tabla se refiere al número de pasajeros que abordan al día una compañía de
transporte. Estos datos se los ha tomado durante 50 días. Se pide calcular las medidas de
tendencia central y de dispersión.
En este caso en lugar de trabajar con la población asumiremos que estamos trabajando con
una muestra, entonces:
Población: todos los días del año en los cuales opera la compañía de transporte.
Muestra: fracción de los días del año de operación, es decir, una parte de la población
n = 50 (es decir que se toman como muestra 50 días de todos los días del año). Este valor, por
definición, se lo puede obtener de la suma de las frecuencias absolutas dadas en la tabla.
Variable: número de pasajeros que abordan diariamente para transportarse con esa compañía.
Media
∑(𝑓𝑖 ∙ 𝑀𝑖) 3 ∗ 54.5 + 7 ∗ 64.5 + 18 ∗ 74.5 + 12 ∗ 84.5 + 8 ∗ 94.5 + 2 ∗ 104.5
𝑥= =
𝑛 50
𝑥 = 78.7 𝑝𝑎𝑠𝑎𝑗𝑒𝑟𝑜𝑠
Mediana
𝑛
En primer lugar ubicamos la clase mediana calculando
2
𝑛 50
= = 25
2 2
De acuerdo a lo señalado, hay que buscar en la columna FAA un valor mayor o igual a 25, lo
cual nos ayuda a identificar la clase mediana. En este caso la clase que cumple con esta
condición es la 3º clase (o tercera fila de la tabla).
50
− 10
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 70 + [ 2 ] ∙ 10
18
Moda
Ubicamos la clase modal a través del mayor valor de fi como se lo ha señalado, y nos resulta
para este caso que la mayor frecuencia absoluta es 18, lo que nos dice que la clase modal es la
3º.
Varianza
Para agilitar los cálculos podemos utilizar el programa Excel, creando algunas columnas de
cálculos previos como se presenta en la tabla aumentada a continuación
𝑠2 = 147.31 𝑝𝑎𝑠𝑎𝑗𝑒𝑟𝑜𝑠2
Desviación estándar
𝑠 = √𝑠2 = √147.31
𝑠 = 12.14 𝑝𝑎𝑠𝑎𝑗𝑒𝑟𝑜𝑠