Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Puntajes (x) f Pm f Pm
28-32 10 30 300
33-37 15 35 525
38-42 20 40 800
43-47 35 45 1575
48-52 19 50 950
53-57 12 55 660
58-62 9 60 540
P
120 5350
Una vez calculados los puntos medios de clase, se efectúa el producto fPm (la fre-
cuencia por el punto medio de cada clase) y se suman los productos parciales, nos
da 5350, luego dividimos esta suma entre 120, y se obtiene:
P
f P m 5350
X= = = 44.58
N 120
20
4. MEDIDAS DE TENDENCIA CENTRAL
Ahora calcularemos las desviaciones de cada valor de la serie con respecto a la me-
dia. El calculo de las desviaciones se presenta en la tabla 12. Nótese que la suma de
las desviaciones es cero, tal cual lo enuncia la propiedad.
Xi Xi − X
4 4-6=-2
5 -1
6 0
7 +1
8 +2
P
0
Propiedad 2
Se cumple la propiedad para cualquier valor que se le asigne a A (¡ Pruebe con otros
valores !)
21
4. MEDIDAS DE TENDENCIA CENTRAL
Propiedad 3
Donde:
X T = media aritmética total.
ni = tamaño de la muestra i (i=1,2,...,k)
X i = media aritmética de la muestra i.
N = n1 + n2 + n3 + ... + nk
Ejemplo. En una escuela de San Salvador, hay tres secciones de noveno grado, se les
pasó un examen de matematica, con los siguientes resultados:
Secciones ni Xi
A 25 68
B 30 70
C 45 60
Determinar la media aritmética total del rendimiento de los alumnos en dicho examen:
Propiedad 4
M(k) = K
siendo K una constante
Propiedad 5
La media aritmética del producto de una constante por una variable es igual
al producto de la constante por la media de la variable, es decir:
M(Kx) = KM(x)
22
4. MEDIDAS DE TENDENCIA CENTRAL
8 + 10 + 12 + 14 + 16
= 12
5
este valor puede observarse que es el producto de 2x6, es decir M(Kx) = KM(x)
Propiedad 6
M(X + K) = M(X) + K
6 + 7 + 8 + 9 + 10
=8
5
este valor puede observarse que es la suma de 2 + 6 = 8, donde K=2 y 6 es la media
original; es decir, M(X + K) = M(X) + K
4.2. Mediana
Al calcular la media de un conjunto de datos que forman una muestra, los valores
extremos (valores muy grandes o muy pequeños en relación con los demás) pueden
influenciar fuertemente en el resultado, desvirtuando de este modo la utilidad de la
media aritmética como valor que caracteriza a los datos.
Considere los datos de la tabla 15 que muestran los salarios mensuales de 11 traba-
jadores de una finca en Santa Ana.
Sueldos (Xi ) f f xi
100 4 400
120 5 600
2000 1 2000
3000 1 3000
P
11 6000
23
4. MEDIDAS DE TENDENCIA CENTRAL
indica que la media no representa bien a los 11 sueldos. Los valores extremos 2,000
y 3,000 han influido fuertemente en el resultado ( en estos casos se dice que la
distribución tiene un sesgo a la derecha).
Si una distribución de datos tiene un sesgo (valores muy grandes o muy pequeños
con respecto a los demás) es mejor utilizar una medida de tendencia central que no
sea sensible a los valores extremos. Una de estas medidas es la mediana.
Mediana
La mediana en un conjunto de datos es el valor que ocupa el lugar central, de
tal forma que aquel valor deja el 50 % de las observaciones por debajo de él y
el otro 50 % por encima de él. Para la ubicación de la posición de la mediana
se deben ordenar los datos de forma ascendente o descendente. La mediana
se denota por Me o bien por x̃.
24
4. MEDIDAS DE TENDENCIA CENTRAL
La mediana para una distribución de clases y frecuencias se puede encontrar por dos
métodos: por interpolación y por un método gráfico.
Método de interpolación
Parte del supuesto de que los datos son continuos y que los valores de la serie se
distribuyen regularmente dentro de los intervalos de clase.
Procedimiento para calcular la mediana por el método de interpolación
Minutos f fa
[ 45 - 50 ] 2 2
( 50 - 55 ] 9 11
( 55 - 60 ] 12 23
( 60 - 65 ] 11 34
( 65 - 70 ] 9 43
( 70 - 75 ] 7 50
P
50
25
4. MEDIDAS DE TENDENCIA CENTRAL
N
2 − f aa 25 − 23
Me = li + ( ) × ic = 60 + ( ) × 5 = 60 + 0.91 = 60.91minutos
fm 11
Tabla 17: Distribución de clases y frecuencias de las calificaciones obtenidas por 120
alumnos en un examen de admisión
N
2 − f aa 60 − 45
Me = li + ( ) × ic = 42.5 + ( ) × 5 = 42.5 + 2.14 = 44.64
fm 35
26
4. MEDIDAS DE TENDENCIA CENTRAL
¡ADVERTENCIA!
Cuando se está calculando la mediana y la moda de una distribución de clases y frecuencias
es sumamente fundamental tener claridad sobre si se está trabajando con lı́mites reales (como
en el primer ejemplo) o con limites aparentes (como en el segundo ejemplo).
La diferencia entre usar uno u otro tipo de limite radica en dos aspectos:
1. Lı́mite inferior (li)
En las formulas de mediana y moda, el lı́mite inferior (li) debe ser un lı́mite real.
Por ello, cuando se trabaja con limites aparentes es necesario convertirlo a lı́mite real
restandole 0.5 (es por eso que en el segundo ejemplo, el lı́mite inferior fue 42.5 y no
43).
2. Ancho de clase o intervalo de clase (ic )
- Cuando se trabaja con limites reales el intervalo de clase es la diferencia entre el limite
superior y el limite inferior de alguna de las clases, es decir ic = ls − li
- Cuando se trabaja con lı́mites aparentes, el cálculo del intervalo de clase es ası́:
ic = (ls − li) + 1
Un procedimiento para calcular el intervalo de clase que funciona para ambos tipos de
lı́mites es restar dos limites inferiores consecutivos (ó bien, dos intervalos superiores
consecutivos); asi, en el segundo ejemplo, el intervalo de clase pudo obtenerse como la
diferencia entre los lı́mites inferiores de la tercera y cuarta clase (43 − 38 = 5).
Método gráfico.
Para obtener un valor aproximado de la mediana por el método gráfico se procede
en la forma siguiente:
1. Se construye la ojiva de la distribución de frecuencias.
2. En el eje vertical se localiza el punto correspondiente al 50 % de la frecuencia
total, es decir el punto N2 en el eje Y.
3. Se traza una horizontal desde este punto de la ojiva, se baja una perpendicular
desde el punto en que esta horizontal corta a la ojiva hasta la escala X. La
intersección con el eje X constituye la mediana.
27
4. MEDIDAS DE TENDENCIA CENTRAL
4.3. Moda
En la vida cotidiana se escucha la expresión “está de moda” cuando algo se observa o
se presenta repetidamente. En estadı́stica, el concepto de la moda no se aleja de esta
apreciación y, efectivamente, se denomina moda de un conjunto de datos al valor
que más se presenta, es decir, el atributo o el valor de mayor frecuencia. La moda
se representa por Mo y puede ser aplicada a las variables cualitativas y cuantitativas
discretas o continuas.
Moda
Es el valor más frecuente en una serie de datos.
La moda de la serie: 100, 125, 130, 130, 130, 145, 150 es 130, ya que es el valor que
más veces se repite. Si en las series hay dos términos que se repiten igual número de
veces, decimos que la serie es bimodal; por ejemplo, si la serie fuera: 100, 125, 130,
130, 130, 145, 145, 145, 150; la moda la constituyen 130 y 145; es decir, la serie
tiene dos valores modales. Cuando una serie tiene tres o más valores que se repiten
igual número de veces, se dice que la serie es polimodal. Estas últimas series son
poco comunes, y cuando se presentan de deben a factores extraños introducidos en
la serie.
Método aproximado
La moda por este método, es el punto medio de la clase que contiene la mayor
frecuencia (clase modal). Este método solo es recomendable cuando la serie tiene
un gran número de términos y se emplea un intervalo de clase pequeño.
Ejemplo. Considere los datos de la tabla 16 que muestra el tiempo requerido (en
minutos) por 50 estudiantes para resolver un examen parcial. Calcule la moda
de esta distribución por el método aproximado.
La clase que tiene mayor frecuencia (clase modal) es la tercera (55-60) por
tanto, la moda de esta distribución es la marca de clase (punto medio) de este
intervalo.
55 + 60
Mo = = 57.5
2
28
4. MEDIDAS DE TENDENCIA CENTRAL
Método de interpolación
Procedimiento para calcular la moda por el método de interpolación
li = 55, ∆1 = 12 − 9 = 3, ∆2 = 12 − 11 = 1, ic = 60 − 55 = 5
Por tanto la moda serı́a:
3
Mo = 55 + ( ) × 5 = 55 + 3.75 = 58.75minutos
3+1
Sustituyendo tenemos:
15
Mo = 42.5 + ( ) × 5 = 42.5 + 2.42 = 44.92
15 + 16
Este valor se interpreta diciendo que el puntaje más frecuente fue 44.92 o
aproximadamente 45.
29
4. MEDIDAS DE TENDENCIA CENTRAL
X < Me < Mo
X = Me = Mo
Mo < Me < X
X − Mo 3(X − Me)
30
5. MEDIDAS DE VARIABILIDAD
5. Medidas de variabilidad
Además de las medidas de tendencia central que posibilitan la representación del
conjunto de datos por medio de un valor, es necesario conocer la variabilidad o la
dispersión que los datos pueden tener en relación a una medida central.
Una medida de variabilidad (también conocida como medida de dispersión) es un
número que indica el grado de separación de los datos con respecto a un valor
central. Si este valor es pequeño (respecto a la unidad de medida) entonces hay una
gran uniformidad entre los datos. Por el contrario, un gran valor nos indica poca
uniformidad. Cuando es cero quiere decir que todos los datos son iguales.
En los análisis estadı́sticos, las medidas de variabilidad más representativas son:
rango, desviación media, varianza, desviación estándar y coeficiente de variación.
31
5. MEDIDAS DE VARIABILIDAD
La desviación media para una distribución de frecuencias simple (sin clases) se cal-
cula de la siguiente manera:
P
f Xi − X
DM = (7)
N
32
5. MEDIDAS DE VARIABILIDAD
P
f P m − X
DM = (8)
N
33
5. MEDIDAS DE VARIABILIDAD
5.3. Varianza
La varianza, denotada por σ 2 , es una medida que cuantifica el grado de disper-
sión o de variación de los valores de una serie de datos con respecto a su media
aritmética. Si los valores tienden a concentrarse alrededor de su media, la varianza
será pequeña. Si los valores tienden a distribuirse lejos de la media, la varianza será
grande.
La varianza se define como la media aritmética de los cuadrados de las diferen-
cias de los datos con respecto a su media aritmética.
(Xi − X)2
P
2
σ = (9)
N
La varianza es una medida de variabilidad importante que se utiliza en algunos
métodos estadı́sticos relevantes, como el análisis de varianza. Para nuestros propósi-
tos, la varianza tiene una gran desventaja: las unidades de la varianza son diferentes
de las unidades del conjunto original de datos. Por ejemplo, si estamos estudiando
los tiempos de espera en una ventanilla bancaria los datos originales están dados en
minutos, mientras que las unidades de varianza están dadas en minutos cuadrados
( min2 ). ¿Qué es un minuto cuadrado? Como la varianza utiliza unidades distintas
(unidades cuadradas), es sumamente difı́cil comprenderla si la relacionamos con el
conjunto original de datos. En consecuencia, en la mayorı́a de los análisis estadı́sticos
se emplea la varianza como una medida que permite comparar la dispersión entre
dos o más variables, identificando la de mayor varianza como aquella que posee
mayor dispersión o variabilidad. La importancia de la varianza está en que es una
medida transitoria para el cálculo de la desviación tı́pica o estándar de un conjunto
de datos.
Propiedad 1
Propiedad 2
V (K) = 0
Propiedad 3
34
5. MEDIDAS DE VARIABILIDAD
Propiedad 4
Si cada uno de los datos x1 , ..., xn es multiplicado por una constante K, entonces
la varianza de los datos transformados Kx1 , ..., Kxn es igual a la varianza de los
datos originales por el cuadrado de la constante K.
V (KX) = K 2 V (X)
35
5. MEDIDAS DE VARIABILIDAD
rP
f (P m − X)2
σ= (12)
N
5.4.2. Método abreviado para calcular la desviación tı́pica para una distribu-
ción de clases y frecuencias
rP
f P m2 2
σ= −X (13)
N
formula que es parecida a la que se utilizó para calcular la desviación tı́pica para una
serie simple, por el método abreviado.
36
5. MEDIDAS DE VARIABILIDAD
σ
C.V = × 100 % (14)
X
37
REFERENCIAS REFERENCIAS
σ 8.13
C.V = × 100 % = × 100 % = 18.24 %
X 44.58
La interpretación de este coeficiente es igual al de las otras medidas de dispersión.
El grado de representatividad de la media detectado por medio del coeficiente de
variabilidad, se presenta en la tabla 18.
Referencias
[1] Gildaberto Bonilla. Estadı́stica. Elementos de estadı́stica descriptiva y probabili-
dad. UCA Editores, 2015.
[2] Lincoln L Chao and Jesús Marı́a Castaño. Estadı́stica para las ciencias adminis-
trativas, volume 3. McGraw-Hill, 1993.
[3] Manuel Córdova Zamora. Estadı́stica descriptiva e inferencial. Edit. Moshera
SRL. 5ª edición. Lima-Perú, 2003.
[4] Douglas A Marchal Lind, William G Wathen, Samuel A Douglas A Lind, Wi-
lliam G Marchal, and Samuel A Wathen. Estadı́stica aplicada a los negocios y la
economı́a. McGraw-Hill, 2012.
[5] Gabriel Jaime Posada Hernández. Elementos básicos de estadı́stica descriptiva
para el análisis de datos. Fundación Universitaria Luis Amigó, 2016.
[6] Mario F Triola. Probabilidad y estadı́stica. Pearson educación, 2004.
38