Está en la página 1de 9

_ 1

MATERIAL DE PROFUNDIZACIÓN

MEDIDAS DE TENDENCIA CENTRAL


_ 2

Dirección de Planificación y Desarrollo Online - INACAP Online


Universidad Tecnológica de Chile - INACAP
www.inacap.cl
Santiago de Chile

Equipo recopilador

Experto disciplinar: Sebastián Herrera de la Piedra


Diseñador instruccional: Mauricio Méndez Saldaña
Editor de contenidos: Camila Oróstica Alarcón
Diseñador gráfico: Sebastián Cifuentes Torres

Enero, 2019. Propiedad de INACAP


Versión: 1.0 (01/2019)
Palabras claves: estadística, medidas de tendencia central, media, moda, mediana.

_Material de profundización
_ 3

1. MEDIDAS DE TENDENCIA CENTRAL


El siguiente es un esquema de medidas de tendencia central elaborado a partir de la referencia bibliográfica:

Medidas de tendencia central

Se encargan de: Se dividen en:

Moda Media Mediana


Resumir información de
conjunto de datos ES
ES ES
numéricos.

Número con
Por medio de: mayor frecuencia Promedio de Centro de
dentro del conjunto de conjunto de
conjunto de datos numéricos. datos numéricos.
Números datos.

Figura 1: Medidas de tendencia central. Fuente: Quioscomatematico (2018).

Las medidas de tendencia central o de resumen son valores que generalmente se ubican en la parte central de la
distribución de datos. Fundamentalmente, estas medidas se usan para variables cuantitativas, aportando una idea
acerca del comportamiento de la variable, por ejemplo, el promedio de un conjunto de datos.
Revisemos en detalle las medidas de tendencia central a continuación:

1.1. Media o promedio


Es una de las medidas de tendencia central de mayor uso. Dada una colección de datos X1, X2, ...Xn. Entonces el
promedio se define como la suma de los datos dividida por el total de la muestra y se denota por: X

_Material de profundización
_ 4

Por ejemplo. Se tienen las notas de 20 estudiantes de un curso.


Estas son:

6.8 5.1 6.2 5.8 4.5 5.0 6.0 5.7 4.2 3.8
3.8 5.8 3.7 5.0 4.8 5.9 5.7 6.1 5.8 6.2

6,8 + 5,1 + 6,2 + 5,8 + 4,5 + 5,0 + 6,0 + 5,7 + 4,2 + 3,8 + 3,8 + 5,8 + 3,7 + 5,0 + 4,8 + 5,9 + 5,7 + 6,1 + 5,8 + 6,2
X =
20
105,9
X = = 5,295 𝐿𝐿𝐿𝐿 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 5,3
20

1.1.1. Media o promedio para datos agrupados en intervalos


Si los datos están agrupados en una tabla de frecuencias, se calcula la media multiplicando la marca de clase por la
frecuencia de cada intervalo. Se suman los resultados de cada multiplicación y se dividen por el número total de datos.

Por ejemplo, consideremos las proteínas totales del plasma en prematuros normales de 15 días de edad, presentadas
en la siguiente tabla:

Proteínas (g/l) Frecuencia Marca de Clase (xi) fi* xi


absoluta (fi)
40 – 45 2 42,5 85
45 – 50 6 47,5 285
50 – 55 12 52,5 630
55 – 60 13 57,5 747,5
60 – 65 5 62,5 312,5
65 – 70 2 67,5 135
Total 40 2195

Tabla 1: Medida o promedio para datos agrupados en intervalos. Fuente: elaboración propia.

(2𝑥𝑥42,5) + (6𝑥𝑥47,5) + (12𝑥𝑥52,5) + (13𝑥𝑥57,5) + (5𝑥𝑥62,5) + (2𝑥𝑥67,5)


X =
40
X = 2.195 = 54,9 El promedio de concentración de proteínas en el plasma, en niños prematuros normales, es de 54,9 gramos
40

_Material de profundización
_ 5

¿Cuáles son las ventajas y desventajas de la media aritmética?

Puede verse afectada por la


El concepto de media aritmética presencia de valores extremos o
es familiar para mucha gente e atípicos que no son
intuitivamente claro. representativos del conjunto de

DESVENTAJAS
datos. En estos casos podría
VENTAJAS

Es un valor único que resultar más representativo


generalmente representa mejor calcular la media sin tomar en
a una distribución, ya que en su cuenta el valor extremo.
cálculo se consideran todos los
datos. Puede ser poco representativa
en distribuciones que presentan
mucha asimetría.

Figura 2: Ventajas y desventajas de la media aritméticas. Fuente: elaboración propia.

1.2. Moda
Es aquel valor que más se repite en una muestra y se denota por Mo.

Veamos el siguiente ejemplo para determinar la moda para datos no agrupados. Consideremos las siguientes notas
como las correspondientes a un curso de 20 estudiantes:

3.7 3.8 3.8 4.2 4.5 4.8 5.0 5.0 5.0 5.2
5.3 5.5 5.8 5.8 6.0 6.2 6.4 6.4 6.6 6.8

La nota más frecuente en el curso fue 5.0.


La moda es el estadístico de centralización adecuado si la variable está medida en escala nominal:

Distribución de trabajadores por género


Si la variable es continua, formalmente la moda no
Sexo Frecuencia Porcentaje
Masculino 63 18,42% existe, pues es muy difícil que, al sacar una muestra
Femenino 279 81,58% de números reales, dos o más de ellos coincidan
Total 342 100%

Tabla 2: Moda. Fuente: elaboración propia.

_Material de profundización
_ 6

También se utiliza la moda si la variable está medida en escala ordinal o numérica discreta:

Distribución del número de hijos en mujeres después de la menopausia

Número de hijos Frecuencia Porcentaje

0 14 4,17%

1 83 24,70%

2 193 57,44%

3 46 13,69%

Total 336 100%


Tabla 3: Moda. Fuente: elaboración propia.

1.2.1. Moda para datos agrupados en intervalos


Para su cálculo, debe ubicarse el intervalo que tiene la mayor frecuencia:

∆1
𝑀𝑀𝑀𝑀 = 𝐿𝐿𝐿𝐿 + � � ∗ 𝐴𝐴
∆1 + ∆2

Donde:

Li: Límite inferior del intervalo que contiene la frecuencia más alta.
Δ1: Diferencia entre la frecuencia más alta y la del intervalo anterior.
Δ2: Diferencia entre la frecuencia más alta y la del intervalo siguiente.
A: Amplitud del intervalo.

Veamos el siguiente ejemplo:

Edad fi
16-20 8 La moda o dato más
20-24 10 5
24-28 15
𝑀𝑀𝑀𝑀 = 24 + �
5+3
� ∗ 4 = 26,5 frecuente de edad en este
28-32 12 grupo de datos es de 26,5
32-36 5

Li: 24.
Δ1: 15-10=5.
Δ2: 15-12=3.
A: 4.

_Material de profundización
_ 7

¿Cuáles son las ventajas y desventajas de la moda?

No se ve afectada por la Puede no existir o puede que


presencia de valores extremos exista más de una moda

DESVENTAJAS
VENTAJAS

bajos o altos. (bimodal: 2 modas; polimodal:


más de 2 modas). Esto significa
Puede también aplicarse a datos que pierde utilidad y dificulta su
cualitativos. interpretación.

Figura 3: Ventajas y desventajas de la moda. Fuente: elaboración propia.

1.3. Mediana
Es aquel valor que divide la muestra en dos partes iguales. De este modo, la mediana es el primer valor de la variable
que deja por debajo de sí al 50% de las observaciones. La mediana corresponde al percentil 50 o cuartil 2,
(mediana=P50=Q2). Notemos que la mediana es tanto un estadígrafo de posición y de centralización.

Veamos el siguiente ejemplo donde se determina la mediana para datos no agrupados.

Si n es impar, utilizamos la siguiente fórmula:


𝑋𝑋 (𝑛𝑛 + 1)
𝑀𝑀𝑀𝑀 = � �
2

Entonces, si tenemos los siguientes datos: 5 7 7 10 12 18 25, podemos decir que el valor que divida la muestra en dos
partes iguales es 10.

Para ello, la fórmula quedaría de la siguiente manera:


𝑋𝑋 (7 + 1)
𝑀𝑀𝑀𝑀 = � � = 𝑋𝑋4
2
X4= 10

Si n es par, la mediana es igual al promedio de las dos posiciones centrales. Por ejemplo, si tenemos 5 7 7 10 12 18 25
32, la mediana será 11.

_Material de profundización
_ 8

1.3.1. Mediana para datos agrupados en intervalos


Para ello debemos dividir el total de la muestra en dos (n/2) y buscar el intervalo que contenga la frecuencia absoluta
acumulada igual o mayor a n/2.

𝑛𝑛
− (𝐹𝐹𝐹𝐹 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎)
𝑀𝑀𝑀𝑀 = 𝐿𝐿𝐿𝐿 + ��2 � ∗ 𝐴𝐴�
𝑓𝑓𝑓𝑓

Donde:
Li: Límite inferior del intervalo de la clase mediana
n: Número total de observaciones
Fi anterior: Frecuencia acumulada hasta el intervalo anterior a que contiene la mediana.
fi: Frecuencia absoluta de la clase mediana.
A: Amplitud de la clase mediana.
n/2: Muestra/2. Clase mediana

Veamos el siguiente ejemplo, en donde tenemos una distribución por edad de 975 personas:

Edad fi Fi Donde:
15-25 40 40 Li: 55
25-35 67 107 n: 975
35-45 143 250 Fi anterior: 430
fi: 270
45-55 180 430
A: 10
55-65 270 700 n/2: 975/2= 487,5
65-75 275 975

La fórmula quedaría de la siguiente manera:


487,5 − 430
𝑀𝑀𝑀𝑀 = 55 + �� � ∗ 10� = 57,1
270

El 50% de los individuos tiene 57,1 años o menos. El valor que divide la muestra en dos partes iguales, es 57,1.

_Material de profundización
_ 9

¿Cuáles son las ventajas y desventajas de la mediana?

La más importante es que no se


ve afectada por datos con
valores extremos, como la El ordenar los datos en forma
media. Por lo tanto, al existir creciente para calcular su valor,

DESVENTAJAS
VENTAJAS

valores extremos, la mediana es puede implicar un mayor tiempo,


más representativa que la media si se trabaja con una gran
aritmética. número de datos y no se cuenta
con un ordenador.
La facilidad para entenderla
conceptualmente.

Figura 4: Ventajas y desventajas de la mediana. Fuente: elaboración propia.

Te invitamos a resolver el ejercicio práctico asociado a este


recurso, disponible en el aula virtual.

REFERENCIAS BIBLIOGRÁFICAS

Quioscomatematico. (2018). Medidas de tendencia central. Recuperado el 21 de enero de 2018, de:


https://quioscomatematico.wordpress.com/2018/06/10/medidas-de-tendencia-central/

Spiegel, M. R. y Stephens, L. J. (2009). Estadística. Recuperado el 14 de octubre de 2020, de:


https://ezproxy.dnb-inacap.cl/login?url=http://search.ebscohost.com/login.aspx?
direct=true&db=cat02940a&AN=inacap.b1048632&lang=es&site=eds-live&scope=site

_Material de profundización

También podría gustarte