Está en la página 1de 14

1.

Medidas de Tendencia Central y Dispersión


1.1 Medidas de Tendencia Central
Las Medidas de Tendencia Central son medidas que nos indican si la mayoría de los
valores de los datos de un conjunto de datos se encuentran próximos al valor central de
los mismos o por el contrario, la mayoría se encuentran ubicados en alguno de los dos
valores extremos del conjunto, las medidas de tendencia central más utilizadas son la
Media, la Mediana y la Moda.

1.1.1 Media
La Media es una de las medidas estadísticas más utilizada, también es conocida
bajo el nombre de Promedio o Promedio Aritmético. Se obtiene sumando todos
los datos y dividiendo el resultado dentro de la cantidad de datos. Se representa
con:
• 𝑥̅ ó M cuando se trate de datos tomados de una muestra.
• µ cuando se trate de datos tomados de una población.

Por ejemplo si tenemos las siguientes notas de un examen de estadística:

80, 90, 60, 70, 75, 50, 60, 55, 40, 80, 70, 65, 60, 55, 70

La sumatoria Ʃ = 980, ahora la dividimos entre la cantidad de notas, que son 15

∑ 𝑛𝑜𝑡𝑎𝑠 980
M = 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑛𝑜𝑡𝑎𝑠 = 15
= 65.33

Es importante tener cuidado con la Media pues hay ocasiones en que no


representa a la mayoría de los datos, por ejemplo digamos que una empresa
tiene los siguientes salarios:
• El Gerente General Q90,000 mensuales
• El Sub Gerente General Q80,000 mensuales
• 10 empleados menores con Q3,000 mensuales cada uno

En promedio estos 12 empleados de la empresa ganan:

90,000 + 80,000 + 10 (3,000) = 200,000

200,000
𝑀= = 𝑄16,666.67
12
Entonces si alguien le pregunta a un empleado incauto que cuánto ganan en esa
empresa, este diría: “Mirá, en promedio ganamos casi Q17,000.00”, siendo su
realidad Q14,000.00 diferente si es de los que ganan Q3,000.00.

2 | e-Learning
Es necesario ver el cuadro completo y para ello nos apoyaremos en las otras
medidas de tendencia central que veremos más adelante.

Ahora bien cuando contamos con muchos datos y estos han sido tratados con una
Tabla de Distribución de Frecuencias nos apoyaremos en Excel para su cálculo, pero
tal y como se señaló en la introducción de esta unidad en este curso no estaremos
haciendo cálculos sino que comprendiendo lo que es la Media o Promedio así como
las demás medidas a estudiar.

Continuando con el caso utilizado en la Unidad No. 01 la Media de ese conjunto de


datos es 68.72 años el cual por razones de simpleza redondeamos
matemáticamente a 69 años, este dato debe de ser analizado comparativamente
con la Tabla de Distribución de Frecuencias de ese caso, la cual mostramos a
continuación:

CLASES
f F fr xi
Límite inferior Límite superior
1 38 50 4 4 0.08 44
2 51 63 12 16 0.24 57
3 64 76 19 35 0.38 70
4 77 89 11 46 0.22 83
5 90 102 4 50 0.08 96
n= 50 1
Observaciones:
• Podemos ver que el resultado 69 cae dentro de la clase número 3 y está a
una sola unidad de la marca de clase que es 70, recordemos que la marca
de clase es el dato que mejor representa la clase y la clase 3 es la clase con
mayor frecuencia o sea que este valor de Media si está representando
adecuadamente al conjunto de datos.

• Otra observación importante es ver donde cae este valor de Media en el


Polígono de Frecuencias, lo cual mostramos a continuación:

y=f "Participantes Programa de Servicio Social"

20
18
16
14
12
10
8
6
4
2

clase 1 clase 2 clase 3 clase 4 clase 5 x = edad (años)


37.5 50.5 63.5 76.5 89.5 102.5
3 | e-Learning
Observaciones:
• El punto amarillo representa la Media y ha sido dibujado sobre el
valor 69 del eje de las x. Cómo se puede ver gráficamente, se podría
decir “está buscando el centro”.

1.1.2. Mediana
La Mediana es una Medida de Tendencia Central que nos da el valor del
dato que está a la mitad de los datos cuando estos están ordenados y se
simboliza con Me.

Un aspecto muy importante para tomar en cuenta es que el valor de la


Mediana normalmente está entre los valores de la Media y la Moda y en
alguna ocasiones toma el valor de uno de ellos.

Para el caso del Programa de Servicio Social la Mediana tiene un valor de 68


años exactos. Como podemos ver un poco más bajo que los 68.72 de la
Media, pero prácticamente el mismo valor. En el Polígono de Frecuencias
prácticamente quedaría un punto sobre el otro, esto indica que la Mediana
también está buscando el centro de la gráfica.

Les recuerdo que en este curso estaremos dando los valores de las medidas
para analizarlas y así alcanzar conclusiones del conjunto de datos.

1.1.3. Moda
La Moda es una Medida de Tendencia Central que nos da el valor del dato
que más se repite y se simboliza con Mo.

Nuevamente para el caso del Programa de Servicio Social el valor de la


Moda es 68 años exactos. Como podemos ver un poco más bajo que los
68.72 de la Media e idéntico a la Mediana. En el Polígono de Frecuencias
nuevamente quedarían los puntos uno sobre otro, indicando que todos
están buscando el centro de los datos.

Análisis de las Medidas de Tendencia Central:

Tomando el caso del Programa de Servicio Social tenemos las siguientes


Medidas de Tendencia Central:
• Media = 69 años
• Mediana = 68 años

4 | e-Learning
• Moda = 68 años
Como se puede ver prácticamente comparten el mismo valor y esto salta a
la vista en el Polígono de Frecuencia.

El punto amarillo que se encuentra sobre el 69 (pues se marcó la Media)


también abarca el 68 debido a la escala tan pequeña, pero esto resalta que
prácticamente tienen el mismo valor.

Entonces esto permite deducir que cuándo un conjunto de datos tiene


Medidas de Tendencia Central con el mismo valor o casi el mismo valor, su
Polígono de Frecuencias tendrá la forma del polígono de nuestro ejemplo o
sea tendrá una forma simétrica.

Cuando veamos un polígono de un conjunto de datos con la forma del de


nuestro caso es decir, simétrico, podemos concluir que las Medidas de
Tendencia Central tienen un mismo valor o casi un mismo valor y para
conocer el valor del dato solo es necesario leerlo del eje de las x.
1.1.4. Sesgo

Ya vimos que cuando las Medidas de Tendencia Central tienen el mismo


valor, el Polígono de Frecuencias es simétrico, es decir, es alto en el centro
de la gráfica con colas más o menos iguales hacia cada lado, tal y como se
muestra a continuación:

5 | e-Learning
Ahora bien, cuando las Medidas de Tendencia Central NO son iguales y la
diferencia es significativa el Polígono se deforma y toma un sesgo, ya sea a
la izquierda o hacia la derecha tal y como se muestra en el gráfico siguiente:

A esto es a lo que se le llama “Sesgo”, ya sea “sesgada a la izquierda” o


“sesgada a la derecha”, también se puede decir para la sesgada a la
izquierda que tiene “sesgo negativo” pues la cola está buscando la parte
negativa del eje de las x y para la sesgada a la derecha que tienen “sesgo
positivo” pues está buscando el lado positivo del eje de las x.

Observaciones importantes:
• La Mediana siempre está “en medio” de la Media y la Moda tanto
para el polígono con sesgo a la izquierda como para el que tiene
sesgo a la derecha.
• La Moda siempre está bajo la parte alta del polígono, esto es así
para los tres casos.
• La Media siempre está del lado de la cola tanto para el polígono con
sesgo a la izquierda como para el que tiene sesgo a la derecha.

Ejemplo No. 01:

Se nos presenta un conjunto de datos de las edades en años de los pacientes


de un puesto de salud en el interior del país y se nos indican las Medidas de
Tendencia Central siguientes:
• Media = 50 años
• Mediana = 70 años
• Moda = 90 años

Conclusiones:

6 | e-Learning
• Debido a que los valores difieren por bastantes años, el polígono de
frecuencias es sesgado.
• Debido a que la Media es el valor menor entonces es sesgada a la
izquierda. (En el eje de las x el cero está a la izquierda y por lo tanto
los números menores están hacia ese lado y los mayores hacia la
derecha).
• Debido a que la Moda es el valor mayor nos confirma el sesgo a la
izquierda y en el valor de la Moda encontraremos la parte más alta
del polígono.
• Podemos dibujar un polígono “aproximado” sin necesidad de la
Tabla de Distribución de Frecuencias, como el siguiente:

• Concluimos que el puesto de salud debe de estar preparado para


atender personas de muy avanzada edad (alrededor de los 90 años)
pues es la edad de mayor frecuencia. Ojo: no conocemos la
frecuencia, solo sabemos por la Moda, que son los que más hay.

Ejemplo No. 02:

Se nos dan las siguientes Medidas de Tendencia Central sobre los salarios
de cierta empresa:
• Media = Q14,000
• Mediana = Q8,000
• Moda = Q3,000

Dibuje un Polígono de Frecuencias aproximado y realice un comentario


sobre los datos:

7 | e-Learning
La mayoría de los empleados están casi en el sueldo mínimo, pero hay unos
pocos empleados que ganan más de Q14,000 mensuales.

Ejemplo No. 03:

Debido a los constantes accidentes en cierta curva de la carretera a


Barberena se realiza una estadística de velocidades de los vehículos al pasar
por dicha curva (Curva del Chilero), obteniendo las siguientes Medidas de
Tendencia Central (datos ficticios):
• Media = 90 km/hora
• Mediana = 91 km/hora
• Moda = 92 km/hora

Dibuje un Polígono de Frecuencias aproximado y realice un comentario


sobre los datos:

La gran mayoría de vehículos transita por el lugar a 90 km/h, hay algunos


vehículos que van a menor velocidad pero también hay algunos vehículos
que van a más de los 90 km/h.

1.2 Medidas de Dispersión

Las Medidas de Dispersión nos indican que tan dispersos son los datos de un conjunto
de datos es decir nos indica que tan alejados están los valores de los datos del valor de
la Media, la Medida de Dispersión más utilizada es la Desviación Estándar.

1.2.1 Desviación Estándar

La Desviación Estándar nos indica que tan separados se encuentran todos los
datos de su Media. La desviación estándar suele ser positiva y solamente puede

8 | e-Learning
ser cero si el valor de todos los datos son el mismo, es decir no hay variación
entre un dato y otro. Entre más variación hay entre los datos, más grande es la
desviación estándar. El valor de la desviación estándar tiene las mismas
dimensionales que los datos y se representa con la letra S ó SD para muestras y
con la letra griega σ para poblaciones.

La forma más fácil de comprender la Desviación Estándar es viéndolo


gráficamente:

Observaciones:
• Cada polígono de frecuencia representa un conjunto diferente de
datos, lo que tienen en común es su media y que son simétricos.
• El valor de cero en la gráfica ocupa la posición de la media de un
polígono de frecuencias simétrico, el valor de la media puede ser cero
como en la gráfica o cualquier otro valor.
• La diferencia entre polígonos es su valor de Desviación Estándar.
• Como se puede ver el polígono más alto (SD = 0.5) es el más estrecho
por lo tanto no existen datos ni muy a la izquierda de la media ni muy a
la derecha de esta, la mayoría de los datos de ese conjunto de datos se
encuentran amontonados alrededor de la media. Por lo tanto su
desviación estándar es pequeña, tal y como lo señala el gráfico.
• El polígono de frecuencia más bajo (SD = 2) es el más ancho de los tres
implicando que hay datos lejanos de la media tanto a la izquierda como
a la derecha y por eso su deviación estándar es la más alta.

9 | e-Learning
• El polígono con SD = 1 tiene una desviación estándar intermedia, ese
conjunto de datos no tiene tan amontonados su datos alrededor de la
media y tampoco los tiene muy dispersos.
• Por cierto, la altura de los polígonos es indiferente, se les ha dado
diferente altura solo para poder diferenciarlos y porque ya indicamos
que son conjuntos de datos diferentes.

Ejemplo No. 01:

Un hijo presenta a sus padres las notas mensuales de tres de sus cursos, ¿en
cuál curso tuvo mayor éxito sobre sus compañeros? (los tres conjuntos de datos
presentan polígonos simétricos)

CURSO NOTA MEDIA S


Matemática 92 90 2
Física 90 70 20
Estadística 80 60 10

A pesar de que estadística es su nota más baja es en la que tuvo mayor éxito
“en comparación” a sus compañeros pues supera a la media por 20 puntos y la
desviación estándar es de 10 puntos lo cual nos indica que hay bastantes
reprobados, pues la media es de 60 puntos y él está en el extremo derecho
probablemente con la nota más alta. Ahora bien en Física también supera a la
media por 20 puntos pero la desviación estándar es de 20 puntos, esto nos
indica que hay más estudiantes que les fue mejor en física y por último su nota
más alta es de 92 puntos en matemática, pero es la de menor éxito en
comparación con los demás, pues la desviación estándar tan baja indica que
casi todos sacaron la misma nota alrededor de los 90 puntos.

1.2.1.1. Regla Empírica

Otra aplicación muy práctica del valor de la Desviación Estándar de un conjunto


de datos es la llamada “Regla Empírica”, esta regla solo es aplicable si el
conjunto de datos tiene un polígono de frecuencias de forma simétrica.

La regla indica:
• Aproximadamente el 68% de todos los valores de los datos están dentro
de UNA desviación estándar hacia cada lado de la media.
• Aproximadamente el 95% de todos los valores de los datos están dentro
de DOS desviaciones estándar hacia cada lado de la media.
• Aproximadamente el 99.7% de todos los valores de los datos están
dentro de TRES desviaciones estándar hacia cada lado de la media.

10 | e-Learning
Esto nos permite clasificar un dato dentro de ciertos límites, estos límites
establecen un grupo él cual cumple con ciertas características.

Esto se comprende mejor a través del siguiente gráfico:

Ejemplo No. 02:

La Media del Coeficiente Intelectual para adultos es 100 punto con un polígono
de frecuencias simétrico, su desviación estándar es de 15 puntos. Utilizando la
Regla Empírica que indica que el 68% de cualquier conjunto de datos está
dentro de una Desviación Estándar hacia cada lado de la Media podemos
calcular los valores de CI que determinan las fronteras de la “normalidad”.

𝑀𝑒𝑑𝑖𝑎 − 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟 = 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑧𝑞𝑢𝑖𝑒𝑟𝑑𝑜

𝑀𝑒𝑑𝑖𝑎 + 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟 = 𝑙í𝑚𝑖𝑡𝑒 𝑑𝑒𝑟𝑒𝑐ℎ𝑜

Sustituimos valores:

100 − 15 = 85

100 + 15 = 115

Entonces:

𝑙í𝑚𝑖𝑡𝑒 𝑖𝑧𝑞𝑢𝑖𝑒𝑟𝑑𝑜 = 85

𝑙í𝑚𝑖𝑡𝑒 𝑑𝑒𝑟𝑒𝑐ℎ𝑜 = 115

Por lo tanto una persona “normal” tiene un CI entre 85 y 115 puntos y forma
parte del 68% de la población tal y como se muestra en el gráfico siguiente:

11 | e-Learning
La Asociación Internacional de Superdotados MENSA, exige que para poder
formar parte de la asociación es necesario tener un coeficiente intelectual
mayor a las tres desviaciones estándar a partir de la media, ¿qué valor de CI
necesitamos tener para poder formar parte de MENSA?

100 + 15(3) = 145

Se necesita tener como mínimo un CI de 145 puntos para poder formar parte
de MENSA, ¿clasifica usted?, solamente un 0.15% de la población mundial
clasifica, es decir la pequeña cola de la derecha del gráfico mostrado abajo
(señalada con la flecha roja), esto implica que el 99.85% de la población
quedamos fuera.

Siguiendo con el CI, si una persona evaluada obtuviera un puntaje de 72 puntos,


¿a qué porcentaje de población pertenecería?

100 − 15 = 85 − 15 = 70

12 | e-Learning
Entonces vemos que el puntaje de la persona está a la izquierda de la media
entre la primera desviación estándar y la segunda desviación estándar, lo cual
coloca a la persona entre el 13.5% inferior a lo normal, tal y como se muestra:

Ejemplo No. 03:

Los recién nacidos varones en Guatemala tienen una media de peso de 6 libras con
una desviación estándar de 1.3 libras, para que un recién nacido reciba tratamiento
especial en un hospital por falta de peso, su peso debe estar entre el 2.35% inferior
de la gráfica. ¿Cuál es el peso que determina si un bebe recibe tratamiento especial
o no?

Vemos que el área 2.35% a la izquierda de la media tiene una frontera a la derecha
que está determinada por dos desviaciones estándar, por lo tanto:

6 − 1.3 = 4.7 − 1.3 = 𝟑. 𝟒 𝒍𝒊𝒃𝒓𝒂𝒔

13 | e-Learning
1.2.2 Coeficiente de Variación

En el ejemplo No. 01 hicimos comparaciones de desviaciones estándar de conjuntos


de datos diferentes, pero los tres conjuntos de datos eran compuestos por punteos
de cursos es decir las mismas dimensionales y el mismo tipo de datos, pero que
sucede si comparamos velocidades con punteos de notas, son dos cosas
completamente distintas y hasta con diferentes dimensionales, entonces no es
correcto comparar directamente sus desviaciones estándar, lo que se debe de hacer
es calcular sus coeficientes de variación y por ser estos adimensionales ya se puede
realizar una comparación entre ellos.

El coeficiente de variación es un porcentaje y se simboliza con las letras CV, se


calcula con la siguiente fórmula:

𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟
𝐶𝑉 = × 100
𝑀𝑒𝑑𝑖𝑎

Ejemplo No. 04:

Se tiene un conjunto de datos de estaturas de hombres con una media de 1.60


metros y una desviación estándar de 6 cm; tenemos otro conjunto de datos de los
pesos de hombres con una media de 172 libras y una desviación estándar de 26
libras. Entonces como la estatura y el peso son cosas distintas y hasta tienen
dimensionales diferentes se procede a calcular los coeficientes de variación de cada
conjunto para poder comparar la variación que hay dentro de cada conjunto de
datos:

0.06
𝐶𝑉 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎 = × 100 = 3.75%
1.6
26
𝐶𝑉 𝑝𝑒𝑠𝑜 = × 100 = 15.72%
172

Observaciones:
• Podemos concluir que hay una mayor variación en los pesos de los hombres
que en sus estaturas puesto que 15.72% es mucho mayor que 3.75%, lo cual
es lógico pues en lo que respecta a pesos podemos encontrar con facilidad
hombres que pesan hasta el doble que otros hombres, pero este no es el
caso en las estaturas, no es común encontrar a un hombre con el doble de
estatura que otro.

14 | e-Learning

También podría gustarte