Está en la página 1de 28

SESIÓN 3: MEDIDAS DE TENDENCIA CENTRAL

Hemos visto cómo se pueden resumir los datos


obtenidos del estudio de una muestra (o una
población) en una tabla estadística o un
grafico. No obstante, tras la elaboración de la
tabla y su representación gráfica, en la
mayoría de las ocasiones resulta más eficaz
“condensar” dicha información en algunos
números que la expresen de forma clara y
concisa.
 En este sentido pueden examinarse varias
características, siendo las más comunes:
 La tendencia central de los datos
 La dispersion o variación con respecto a este
centro;
 Los datos que ocupan ciertas posiciones.
 La simetría de los datos.
 La forma en la que los datos se agrupan.
 Buscamos obtener valores “centrales” en los
datos presentados. Las medidas más
comunes y relevantes son:
◦ Media Aritmética
◦ Mediana
◦ Moda
 Representa el valor promedio de un conjunto de
observaciones (datos)
 Se define como la suma de todos sus posibles
valores, ponderada por las frecuencias de los
mismos
 Puede presentar inconvenientes o poca
representatividad de los datos en las siguientes
situaciones:
◦ Es muy sensible a valores extremos por lo cuál no es
recomendable para distribuciones con alta “asimetría”
◦ Si consideramos una variable discreta, por ejemplo, el
número de hijos en las familias españolas el valor de la
media puede no pertenecer al conjunto de valores de la
variable; Por ejemplo x = 1, 2 hijos.
 Llamaremos mediana (Med) al primer valor de la
variable que deja por debajo de sí al 50% de las
observaciones.
 Entre las propiedades de la mediana, vamos a
destacar las siguientes:
◦ Como medida descriptiva, tiene la ventaja de no estar
afectada por las observaciones extremas, ya que no
depende de los valores que toma la variable, sino del orden
de las mismas. Por ello es adecuado su uso en
distribuciones asimétricas.
◦ Es de cálculo rápido y de interpretación sencilla.
◦ A diferencia de la media, la mediana de una variable
discreta es siempre un valor de la variable que estudiamos
(ej. La mediana de una variable número de hijos toma
siempre valores enteros).
Llamaremos moda a cualquier máximo relativo
de la distribución de frecuencias, es decir,
cualquier valor de la variable que posea una
frecuencia mayor a las demás o bien el valor
más recurrente entre las observaciones
De la moda destacamos las siguientes
propiedades:
 Es muy fácil de calcular.
 Puede no ser única.
 Existe para variables cualitativas
Para variables cualitativas no es posible
calcular aquellas medidas sobre las cuales los
valores sean numéricos o dependan de la
posición de los datos (debido a que no
existen pesos en este tipo de variables)
Por lo tanto el único estadígrafo posible de
interpretar es la moda, donde simplemente
buscaremos la observación (u observaciones)
de mayor frecuencia
Para las variables cuantitativas el cálculo
dependerá de dos características básicas:
 La agrupación de datos
 El tipo de variable (discreta o contínua)
Si los datos no están agrupados en una tabla de
distribución de frecuencias calcularemos los
estadísticos de tendencia central como sigue:
- Media Aritmética: Sumaremos todas las
observaciones y dividiremos el resultado por el
número total de datos. Esto es:

Por ejemplo: Si tenemos los datos: 3, 4 , 5 ,6, 3 , 2,


3, 4 ,5 ,6. Calculamos la media aritmética como:

3  4  5  6  3  2  3  4  5  6 41
x   4,1
10 10
- Mediana: Ordenaremos los datos y
tomaremos el dato central (o centrales), por
ejemplo si nuestros datos son:
3, 4 , 5 ,6, 3 , 2, 3, 4 ,5 ,6
Ordenamos los datos:
2, 3, 3, 3, 4, 4 ,5 ,5, 6 , 6
Buscamos el valor central
2, 3, 3, 3, 4, 4 ,5 ,5, 6 , 6
Si los datos son diferentes tomamos el mayor
de ellos, en este caso:
Med= 4
- Moda: Para calcularla simplemente
buscaremos el valor o valores que más se
repitan.
Por ejemplo si nuestros datos son:
3, 4 , 5 ,6, 3 , 2, 3, 4 ,5 ,6
La moda es el dato que más se repita, para
este caso:
3, 4 , 5 ,6, 3 , 2, 3, 4 ,5 ,6
Mo = 3
Nótese que esta medida no necesariamente es
central para los datos debido a que no
depende del peso de ellos, además note que
pueden haber varias modas.
Si bien es cierto que las medidas de tendencia
central son supremamente fáciles de calcular
para datos sin agrupar también lo es que
exigen un trabajo que llega a ser sumamente
arduo cuando se trata de muchos datos.
Para los datos agrupados es fundamental
realizar diferenciación sobre si nuestra
variable es discreta o continua y dependiendo
de tal naturaleza proceder con el cálculo
En el caso de la variable discreta calcularemos
las medidas de tendencia central así:

Media aritmética:
1 n x n  x n  ...  xn nn
x   xi ni  1 1 2 2
n i 1 N

Es decir debemos multiplicar cada modalidad


de clase por su frecuencia absoluta y sumar
dichos resultados, por último dividirlos por el
total de observaciones
xi ni Ni hi Hi xini
1 2 2 0.1 0.1 2
2 4 6 0.2 0.3 8
3 6 12 0.3 0.6 18
4 4 16 0.2 0.8 16
5 4 20 0.2 1 20
TOTAL 20 1 49

5
x
1
 xini 
1
2  8  18  16  20  64  3.2
N i 1 20 20

Es decir que el valor promedio de los datos es de


3.2, nótese que pese a ser una variable discreta
el valor de la media aritmética no es entero.
Dado que definimos la mediana como el primer
valor que deja tras de sí al 50% de las
observaciones lo primero que debemos saber
es cuál es ese 50% para esto dividiremos por
2 al total de datos.
Luego buscaremos en la frecuencia absoluta
acumulada el primer valor que supere dicho
resultado e identificamos su valor de
modalidad de clase
xi ni Ni hi Hi xini
1 2 2 0.1 0.1 2
2 4 6 0.2 0.3 8
3 6 12 0.3 0.6 18
4 4 16 0.2 0.8 16
5 4 20 0.2 1 20
TOTAL 20 1 49

Dividimos el total de datos por 2: N/2= 20/2=10


Buscamos el primer valor que supere a 10 en la frecuencia
acumulada (en este caso 12) y procedemos a identificar
a que modalidad pertenece ese valor de frecuencia
acumulada, para este caso:
Med= 3
Dado que definimos la moda como el valor
más recurrente buscaremos en la frecuencia
absoluta más alta e identificamos su valor de
modalidad de clase
xi ni Ni hi Hi xini
1 2 2 0.1 0.1 2
2 4 6 0.2 0.3 8
3 6 12 0.3 0.6 18
4 4 16 0.2 0.8 16
5 4 20 0.2 1 20
TOTAL 20 1 49

Buscamos la frecuencia absoluta más alta y


procedemos a identificar a que modalidad
pertenece ese valor de frecuencia acumulada
(puede ser más de una modalidad), para este
caso:
Mo= 3
En el caso de la variable continua calcularemos
las medidas de tendencia central así:

Media aritmética:
1 n x n  x n  ...  xn nn
x   xi ni  1 1 2 2
n i 1 N

Es decir debemos multiplicar cada marca de


clase por su frecuencia absoluta y sumar
dichos resultados, por último dividirlos por el
total de observaciones
Li-1 - Xi ni Ni hi Hi xini
Li
0-10 5 2 2 0.1 0.1 10
10-20 15 4 6 0.2 0.3 60
20-30 25 6 12 0.3 0.6 150
30-40 35 4 16 0.2 0.8 140
40-50 45 4 20 0.2 1 180
TOTAL 20 1 540
5
x
1
 xini 
1
10  60  150  140  180  540  27
N i 1 20 20

Es decir que el valor promedio de los


datos es de 27
Dado que definimos la mediana como el primer
valor que deja tras de sí al 50% de las
observaciones lo primero que debemos saber es
cuál es ese 50% para esto dividiremos por 2 al
total de datos.
Luego buscaremos en la frecuencia absoluta
acumulada el primer valor que supere dicho
resultado, hasta acá es el mismo procedimiento
que en variable discreta, sin embargo la mediana
es un único valor no un grupo de valores, por lo
tanto ese valor está en esa modalidad que supera
al 50% de las observaciones; para saber
exactamente cuál es el valor procederemos a
aplicar la siguiente fórmula:
Una vez identificamos la modalidad que contiene a la
mediana aplicaremos:

N
 N i 1
M ed  Li 1  2 *C
Donde: ni
Li-1 es el límite inferior de la modalidad que contiene a la
mediana
N es el total de datos
Ni-1 es la frecuencia acumulada de la clase anterior a la que
contiene a la mediana
ni es la frecuencia de la clase que contiene a la mediana
C es el tamaño de clase
Li-1 -
xi Xi ni ni Ni Ni hi hi Hi
Hi xini
xini
Li
1 2 2 0.1 0.1 2
0-10
2 5 4 2 6 2 0.2 0.1 0.1
0.3 10
8
10-20
3 156 4 12 6 0.3 0.2 0.3
0.6 60
18
20-30
4 254 6 16 12 0.2 0.3 0.6
0.8 150
16
30-40 35 4 16 0.2 0.8 140
5 4 20 0.2 1 20
40-50 45 4 20 0.2 1 180
TOTAL 20 1 49
TOTAL 20 1 540

Dividimos el total de datos por 2: N/2= 20/2=10


Buscamos el primer valor que supere a 10 en la frecuencia
acumulada (en este caso 12) y procedemos a identificar a que
modalidad pertenece ese valor de frecuencia acumulada, para
este caso el intervalo 20-30, identificamos los valores de las
variables que nos pide la fórmula:
Li-1= 20 , N/2 = 10, Ni-1= 6 , ni = 6, C = 30-20 =10
Ahora aplicámos la fórmula:
Li-1= 20 , N/2 = 10, Ni-1= 6 , ni = 6,
C = 30-20 =10
N
 N i 1
2 10  6 4 40
M ed  Li 1  * C  20  *10  20  *10  20   20  6.66  26.66
ni 6 6 6

Por lo tanto Med = 26.66


Dado que definimos la moda como el valor más recurrente
buscaremos en la frecuencia absoluta más alta e
identificamos la modalidad de clase (que llamaremos clase
modal), debido a que la moda es uno o más valores exactos y
no grupos de valores aplicaremos la siguiente fórmula para
calcularla:
ni  ni 1
M o  Li 1  *C
(ni  ni 1 )  (ni  ni 1 )

Donde: Li-1 es el límite superior de la clase modal


ni= frecuencia absoluta de la clase modal
ni-1= frecuencia absoluta de la clase anterior a la clase modal
ni+1= frecuencia absoluta de la clase siguiente a la clase modal
C= tamaño de clase
Li-1 -
xi Xi ni ni Ni Ni hi hi Hi
Hi xini
xini
Li
1 2 2 0.1 0.1 2
0-10
2 5 4 2 6 2 0.2 0.1 0.1
0.3 10
8
10-20
3 156 4 12 6 0.3 0.2 0.3
0.6 60
18
20-30
4 254 6 16 12 0.2 0.3 0.6
0.8 150
16
30-40 35 4 16 0.2 0.8 140
5 4 20 0.2 1 20
40-50 45 4 20 0.2 1 180
TOTAL 20 1 49
TOTAL 20 1 540

Buscamos la frecuencia absoluta más alta y procedemos a


identificar a que modalidad pertenece ese valor de
frecuencia acumulada (puede ser más de una modalidad),
para este caso la clase modal es 20-30, identificamos cada
variable en la fórmula:
Li-1 = 20, ni= 6, ni-1= 4, ni+1= 4, C= 30-20=10
Ahora aplicamos la fórmula:
Li-1 = 20, ni= 6, ni-1= 4, ni+1= 4, C= 30-
20=10
ni  ni 1 64 2
M o  Li 1  * C  20  *10  20  *10
(ni  ni 1 )  (ni  ni 1 ) (6  4)  (6  4) 22
2 20
 20  *10  20   20  5  25
4 4
Por lo tanto M0 = 25

También podría gustarte