Documentos de Académico
Documentos de Profesional
Documentos de Cultura
m2 microobjetivos
m2 contenidos
Medidas de Resumen
El gerente general de una cadena de comida rápida
está interesado en el comportamiento de las ventas
de las 55 sucursales que se encuentran en el depar-
tamento central y ha construido la siguiente distribu-
ción de frecuencia para las ventas mensuales
A continuación le presento la siguiente tabla con
datos referentes al tema introductorio:
Al gerente le gustaría comparar las ventas del departamento central, con las
ventas de las ciudades de Encarnación y Ciudad del Este. Para llevar a cabo esto,
podemos ayudar al gerente elaborando un resumen de la distribución, poniendo
especial cuidado en el acopio de información sobre la tendencia central de los
datos, pero también es importante medir la variabilidad de la distribución, para
sacar una conclusión mucho mejor a partir de los datos.
Para ayudar a la gerencia del ejemplo anterior y para muchas otras situaciones
que se presentan a menudo en los negocios u otras actividades que requieren
toma de decisiones, las medidas de tendencia central sirven como soporte, pues
éstas tienen como objetivo, sintetizar los datos en un valor representativo com-
plementándose con las medidas de dispersión que indican hasta qué punto estas
medidas de tendencia central son representativas como síntesis de la informa-
Donde:
f i : es la frecuencia de la i-ésima clase
Xi.: es la marca de clase
Tabla Nº 1
Para obtener el puntaje promedio, primero hay que hallar la marca de clase de
cada intervalo, posteriormente multiplicar este resultado por las frecuencias y
hallar la suma de la misma.
Recordemos que la marca de clase se obtiene por medio de la semisuma de los
La tercera columna se obtiene multiplicando los datos de la 2da columna con los
de la 3ra. columna de la tabla, luego se suman estos valores para obtener
n
f X
∑fX i i = 3.172,5, luego aplicando la fórmula x = ∑ i i
fi
se obtiene
i =1
que es puntaje promedio o la calificación media del
grupo.
♦ La Media Aritmética Ponderada: es cuando se asocia con los valores x1, x2,
... , xn, ciertos factores o pesos n1, n2, . . . , nn, dependientes de la relevancia
asignada a cada número, en este caso se tiene:
♦ La Moda (Mo): es el valor que ocurre con mayor frecuencia, la moda puede
no existir, e incluso no ser única en caso de existir. Las series que no tienen
modas se denominan “amodales”, las que tienen una moda se denominan
“unimodales”, las que tienen dos modas “bimodales” y las que tienen más de
dos modas “multimodales”
Analizando los datos de la tabla, vemos que la 3ra clase es la que tiene mayor
frecuencia (ésa se elige como la clase modal), por tanto: el limite inferior de la
clase modal es: 41, ∆1 = 15 – 5 = 10 y ∆2 = 15 - 8 = 7 luego, aplicando la fórmula
∆1
M o = li + c , tenemos
∆1 + ∆ 2
Ejemplo: la mediana de 10, 11, 14, 16, 17 es: 14; en cambio la mediana de: 10, 11,
buscamos la 1ra clase cuya frecuencia acumulada sea mayor que 27,5, en este
caso es la 4ta clase (cuya frec acum.. es 31 > 27,5) por tanto el limite inferior de
la clase mediana es: li 51, y la suma de frecuencias inferiores a la clase mediana
es: (Σf)1 = 23, la frecuencia de la clase mediana es: ƒMe = 8, luego se aplica la
fórmula:
n
− (∑ f )1
M e = li + 2 .c = ≈ 57
f Me
Este resultado nos indica que aproximadamente el 50% de los alumnos obtuvieron
una calificación inferior a 57 puntos.
• Medidas de Posición: conocidas también como cuantiles son valores de
la distribución que la dividen en partes iguales, es decir, en intervalos, que
comprenden el mismo número de valores. Los más usados son los cuartiles,
los deciles y los percentiles, estas medidas se parecen mucho a la mediana,
porque también, subdividen a una distribución de mediciones de acuerdo con
la proporción de frecuencias.
• Cuartiles: son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes iguales, son un caso particular de los percentiles:
- El primer cuartil Q1 es el menor valor que es mayor que una cuarta parte
de los datos
- El segundo cuartil Q2 (la mediana), es el menor valor que es mayor que
la mitad de los datos
- El tercer cuartil Q3 es el menor valor que es mayor que tres cuartas partes
Solución:
n
Primer cuartil Q1: , buscar la primera Fi > = 39 luego Q1= 2
4
2n
Segundo cuartil Q2: , buscar la primera Fi > = 65 luego Q2= 3
4
3n
Tercer cuartil Q3: , buscar la primera Fi > = 85 luego Q3= 4
4
buscamos la 1ra clase cuya frecuencia acumulada sea mayor que 33, en este
caso es la 5ta clase (cuya frec acum.. es 42 > 33) por tanto el limite inferior de la
clase decil es: li = 61, y la suma de frecuencias inferiores a la clase cuartil es: (Σf)1
= 31, la frecuencia de la clase cuartil es: ƒD = 11, luego se aplica la fórmula:
= ≈ 63
Este resultado nos indica que aproximadamente el 60% de los alumnos obtuvieron
una calificación inferior a 63 puntos.
y buscamos la 1ra clase cuya frecuencia acumulada sea mayor que 23,1 en este
caso es la 4ta clase (cuya frec acum.. es 31 > 23,1) por tanto el limite inferior de
la clase percentil es: li = 51, y la suma de frecuencias inferiores a la clase percentil
es: (Σf)1 = 23, la frecuencia de la clase percentil es: ƒMe = 8, luego se aplica la
fórmula:
= ≈ 51
Este resultado nos indica que aproximadamente el 42% de los alumnos obtuvieron
una calificación inferior a 5 puntos.
a. LA MEDIA ARITMÉTICA
VENTAJAS DESVENTAJAS
Concepto familiar Se afecta por valores extremos
Todo conjunto de datos tiene una Cálculo podría ser tedioso
media
Considera todas las observaciones No se puede calcular con “clases
abiertas”
Muy utilizada en inferencia
b. MODA
VENTAJAS DESVENTAJAS
No se afecta por valores extremos No siempre existe
Se calcula para todo tipo de datos Puede encontrarse más de una
Se usa aún con clases abiertas.
c. MEDIANA
VENTAJAS DESVENTAJAS
No se afecta por valores extremos Complica procesos estadísticos
Se calcula para todo tipo de datos Es necesario ordenar los datos
Medidas de Dispersión
Como hemos dicho anteriormente, las medidas de tendencia central tienen como
objetivo sintetizar los datos en un valor representativo y las medidas de disper-
sión nos dicen hasta qué punto estas medidas de tendencia central son represen-
tativas como síntesis de la información. Las medidas de dispersión cuantifican la
separación, la dispersión, la variabilidad de los valores de la distribución respecto
al valor central.
Si el valor de estas medidas de dispersión es pequeño, nos indica que los datos
están estrechamente agrupados alrededor de la Media, entonces la media se
considera representativa de los datos, es decir, la Media es un promedio confia-
ble. Inversamente, una medida de dispersión grande indica que la Media no es
confiable, no es representativa de los datos.
Para entender mejor esto, supongamos que tenemos tres muestras A, B y C
A: 3, 3, 3, 3 → x = 3 (no existe dispersión)
B: 2, 3, 3, 4 → x = 3 (existe cierto grado de variabilidad)
C: 1, 5, 0, 6 → x = 3 (existe mayor dispersión)
La media aritmética de las tres muestras es 3, sin embargo, existe una diferencia
esencial entre ellas, puesto que los valores de la muestra C se encuentran más
separados que los de la muestra B, en cambio en la muestra A los datos no se
encuentran separados.
El grado de dispersión hacia un valor central, se puede obtener mediante medi-
das designadas como medidas de dispersión, distinguiremos entre medidas de
dispersión absolutas, que no son comparables entre diferentes muestras y las
relativas que nos permitirán comparar varias muestras.
Las medidas de dispersión más utilizadas son:
• El Alcance o Rango (R ): es la diferencia entre el más alto y el más pequeño
de los valores observados: R = x M – x m
Ej.: el rango entre: 2, 3, 3, 5, 5, 5, 8, 10, 12, es:
R = x M – x m =12 – 2 == R = 10
El rango es fácil de entender y encontrar, pero su utilidad como medida de
dispersión es limitada, pues sólo toma en cuenta los valores más altos y más
bajos de una distribución y no considera ninguna otra observación más del
conjunto de datos, como consecuencia de ésto se ve muy influenciado por
o Desviación Tìpica
muestral
o Desviación Tìpica
poblacional
o Varianza poblacional
xi
(x i −x ) (x i −x )
2
Solución
La dispersión absoluta del tubo B es: s B = 310 hs., mayor que la dispersión
absoluta del tubo A , s A = 280 hs.
Para la dispersión relativa calculamos el coeficiente de variación para ambos
tubos:
sA 280 sB 310
CVA= = = 0,1872 x 100 = 18,7%, CVB= = = 0,1653 x 100 =
xA 1.495 x B 1.875
16,5% la dispersión relativa del tubo tipo A, tuvo mayor dispersión relativa.
En este módulo estudiamos las medidas resumen para datos simples y agrupa-
dos. Vimos cómo éstos pueden tener varios tipos de promedio y, excepto algunas
situaciones específicas, estos promedios tienen valores diferentes para el mismo
grupo de datos y cada uno tiene su significado único y propio. A causa de estas
consideraciones se plantea un problema muy importante y a menudo difícil ¿Qué
promedio debe usarse para representar los datos en estudio? Recordemos, por
ejemplo, que la media es una medida de tendencia central y, a menos que los
datos muestren una concentración clara de las observaciones, un promedio
puede ser no significativo para ese estudio particular. Posteriormente, abordamos
el tema de la variación de los datos y formas de medirla para conocer cuán repre-
sentativo de la distribución de los datos es, por ejemplo, el promedio. En general,
el término “variación” significa alejamiento de una norma y, por tanto, una medida
de variabilidad es la que mide el alcance de las diferencias entre observaciones
individuales y algún valor central o medio.
m2 material
Material Básico:
• SIEGEL, M. y STEPHENS, L.: Estadística. México, Editorial MacGraw Hill,
(2002).
Material Complementario:
• LEVÍN, R.: Estadística para Administradores. México, Editorial Prentice Hall
Hispanoamericana, (1996).
• DIAZ MATA, K.: Estadística aplicada a la Administración y a la Economía.
México, Editorial MacGraw Hill, (1993).
A
Alcance o Rango: es la diferencia entre el más alto y el más pequeño de los
valores observados
C
Cuantiles: son los valores de la distribución que la dividen en partes iguales.
Cuartiles: son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes iguales.
Coeficiente de Asimetría de Pearson: indica la forma de la distribución, su valor
es cero cuando la distribución es simétrica.
Coeficiente de Variación de Pearson: representa el número de veces que la
desviación típica contiene a la media aritmética, y mide la dispersión relativa de
un colectivo de datos.
D
Deciles: son los nueve valores que dividen al conjunto de datos ordenados en
diez partes iguales.
Desviación Típica o Estándar: mide la distancia promedio de cualquier observa-
ción del conjunto de datos con respecto a la media de la distribución.
F
Fractiles: es una fracción o proporción dada de los datos cae en un fractil o por
debajo de éste.
M
Mediana: es el valor de la variable que separa la serie de datos objeto de análisis,
una vez ordenados, en dos partes iguales.
Medidas de centralización: sirven para describir un aspecto de los datos, e
indican su valor central
Media aritmética o Promedio: indica el valor central de los datos
Medidas de dispersión: indican el grado de alejamiento de los datos con res-
pecto a un valor central.
Moda: es el valor que ocurre con mayor frecuencia.
P
Percentiles: son los 99 valores que dividen en cien partes iguales el conjunto de
datos ordenados.
V
Variancia o varianza: es una medida de que tan cerca, o que tan lejos están los
diferentes valores de su propia media aritmética.