Está en la página 1de 56

Características de Una Distribución de Frecuencias

Estadística descriptiva. Jóse Maria Montero Lorenzo. Madrid: Paraninfo, 2007. p17-61.
Copyright: COPYRIGHT 2007 Cengage Learning Paraninfo, S.A.
Escuchar

Página 17

Características de Una Distribución de


Frecuencias
 2.1. Introducción
 2.2. Medidas de posición.
 2.2.1. Medidas de posición central
 2.2.2. Medidas de posición no central
 2.3. Medidas de dispersión
 2.3.1. Medidas de dispersión absolutas
 2.3.2. Medidas de dispersión relativas
 2.3.3. Variable tipificada
 2.3.4. Desigualdad de Tchebicheff
 2.4. Medidas de forma
 2.4.1. Medidas de asimetría
 2.4.2. Medidas de apuntamiento o curtosis
 2.5. Box and whisker plots (Gráficos de caja y bigotes)
 Apéndice. Momentos potenciales

Página 18 | Inicio del artículo

2.1. Introducción
Como ya se comentó en el Capítulo 1, la información que suministra una
tabla de frecuencias acerca de un carácter estadístico puede ser
representada en un gráfico, o sintetizada en unas medidas numéricas que
describan de manera más precisa el comportamiento del carácter analizado.
En este capítulo se van a estudiar las denominadas medidas de posición,
medidas de dispersión y medidas de forma. Para ello, se hará referencia a
los caracteres cuantitativos, es decir, se utilizarán los
términos variable y valor, aunque algunas de estas medidas (posición)
también son de aplicación para el caso de los caracteres cualitativos o
atributos.
Las medidas de posición permiten situar la distribución, es decir, fijan el
comportamiento global de una variable a partir de los valores individuales
recogidos en la tabla. Las primeras medidas de interés son las medidas de
posición o tendencia central de la distribución que, en cierta manera,
reflejan el centro o punto sobre el que gravita el conjunto de valores de la
distribución. Otras medidas de posición más generales son las no centrales.
Las medidas de dispersión determinan la variabilidad existente en los
valores de la variable. Las medidas de forma informan, sin necesidad de
representar gráficamente la distribución, sobre la deformación horizontal
(medidas de asimetría) y vertical (medidas de curtosis o apuntamiento) de la
misma.

2.2. Medidas de posición


2.2.1. MEDIDAS DE POSICIÓN CENTRAL

Las medidas de posición central más importantes son las medias


(aritmética, geométrica y armónica), la mediana y la moda.

2.2.1.1. Media aritmética

Dada una distribución de frecuencias (xi; ni), la media aritmética, o


simplemente media, que se denota por x¯, viene definida por la expresión

Como , la media aritmética también puede expresarse como:

Página 19 | Inicio del artículo

Como puede apreciarse, en la media aritmética cada valor de la variable va


ponderado por su importancia relativa en la distribución. No obstante, no
tiene por qué coincidir con ningún valor de la distribución, siendo su centro
de gravedad.
Si los datos estuvieran agrupados en intervalos, la expresión de la media
aritmética sería la misma, pero utilizando, esta vez, la marca de clase (x'i).

Recuadro: Ocultar

EJEMPLO 2.1

Las pensiones mensuales de jubilación de 50 personas, trabajadores


autónomos, son las siguientes:

La pensión mensual será:

Recuadro: Ocultar

EJEMPLO 2.2

Agrupando la distribución del ejemplo anterior en cinco intervalos de igual


amplitud, se tiene:
Página 20 | Inicio del artículo

y la media aritmética toma el valor:

En el primer intervalo, se observa que hay 15 personas que perciben una


pensión comprendida entre 450 y 500 euros; sin embargo, al utilizar la
marca de clase lo que se hace es suponer que la pensión de todas esas
personas es de 475 euros; lo mismo ocurre en los demás intervalos. Como
puede observarse, la pensión media de esta distribución no coincide con la
del Ejemplo 2.1, es decir, se ha cometido un error, denominado error de
agrupamiento. Con las distribuciones agrupadas se simplifican mucho los
cálculos pero también se pierde información, o, dicho de otra manera, la
información es menos exacta (lo que lleva en nuestro ejemplo a una
pensión media ligeramente inferior a la real), por lo que habrá que ver hasta
qué punto compensa el agrupar o no los valores de la distribución en
intervalos.

Las principales propiedades de la media aritmética son las siguientes:

1. La suma de las desviaciones de los valores de la variable respecto a su


media aritmética es cero:

2. La media aritmética del cuadrado de las desviaciones de los valores de la


variable respecto a una constante k cualquiera se hace mínima cuando
dicha constante es igual a la media aritmética (Teorema de König). En
efecto,

por lo que se hace mínima cuando , ya que en ese


caso se anula.

3. Si de un conjunto de valores se pueden obtener dos o más subconjuntos


disjuntos, la media aritmética de todo el conjunto se encuentra relacionada
con las medias aritméticas de los subconjuntos disjuntos. Considérese la
distribución expuesta en la tabla de la página siguiente, de donde se han
obtenido k subconjuntos disjuntos de tal manera que

Página 21 | Inicio del artículo


La media aritmética del conjunto total será:

Esta propiedad es muy útil cuando se incorpora algún valor a la distribución,


porque no hace falta calcular nuevamente la media de todos los valores. Si
a la distribución del Ejemplo 2.1 se le añaden las pensiones de 5
trabajadores más, cada una de 600 euros, la pensión media de los 55
trabajadores es
Página 22 | Inicio del artículo

4. Si a todos los valores xi de una distribución (xi; ni) se les suma (resta) una
constante b, la media aritmética de la nueva distribución (yi; ni) queda
aumentada (disminuida) en esa constante. En otros términos, a la media
aritmética le afectan los cambios de origen.

Si yi = xi ± b, la media aritmética de la variable y será:

5. Si a todos los valores xi, de una distribución (xi; ni) se les multiplica
(divide) por una constante a, distinta de cero, la media aritmética de la
nueva distribución (yi; ni) queda multiplicada (dividida) por esa constante. Es
decir, a la media aritmética le afectan los cambios de escala.

Si yi = axi, la media aritmética de la variable y será

6. Como consecuencia de las dos propiedades anteriores, si a una variable


se le aplica un cambio de origen b y un cambio de escala a, la media de la
nueva variable y = ax ± b será

La media aritmética tiene una serie de ventajas:

 En su cálculo intervienen todos los valores de la distribución, lo cual


parece un requisito indispensable de un promedio.
 Es fácil de calcular y siempre se puede determinar. En distribuciones
agrupadas es necesario que los intervalos estén perfectamente
definidos; si los intervalos son del tipo menor que o mayor que, al no
poderse calcular la marca de clase tampoco se puede calcular la
media.
 Es única.
 La media aritmética es el centro de gravedad de la distribución, en
virtud de la primera propiedad.

Página 23 | Inicio del artículo

Recuadro: Ocultar

EJEMPLO 2.3

Considérense las siguientes tres distribuciones de salarios anuales (miles


de euros):

Estas distribuciones tienen idéntica media aritmética: 70 (en otros términos,


idéntico centro de gravedad, representado por ▴). Sin embargo, en las dos
primeras este valor es el resultado de promediar valores muy parecidos
entre sí, y en la tercera valores muy grandes con valores muy pequeños.

El principal inconveniente de la media aritmética es la escasa


representatividad que puede tener, como valor central de la distribución, en
el caso de que la variable tome valores anormalmente extremos (como
ocurre en la tercera distribución del Ejemplo 2.3), dando lugar a
conclusiones no muy fiables.
2.2.1.2. Media geométrica

La media geométrica de una distribución de frecuencias (xi; ni), que se


representa por G, se define como la raíz N-ésima del producto de los
valores de la variable elevados a sus correspondientes frecuencias
absolutas.

Página 24 | Inicio del artículo

Nótese que

y utilizando las propiedades de los logaritmos,

Por tanto:

es decir, el logaritmo de la media geométrica es igual a la media aritmética


de los logaritmos de los valores de la variable.

Como puede observarse, en el cálculo de la media geométrica también


intervienen todos los valores de la distribución. Sin embargo, uno de los
grandes inconvenientes de esta medida central es su no representatividad
cuando uno (o varios) de los valores sea cero, ya que G se anula. Por otra
parte, cuando algunos de los valores de la variable son negativos, existen
determinados casos en los cuales no se puede calcular la media
geométrica; esto no significa que no exista sino que no se puede
determinar.
La media geométrica se suele utilizar para promediar, por ejemplo, tipos de
interés, tasas de variación, porcentajes y números índice, es decir, cuando
los valores de la variable presentan variaciones acumulativas.

Recuadro: Ocultar

EJEMPLO 2.4

Un individuo invirtió 12.000 euros en un plan de pensiones. Durante los


cinco años siguientes las tasas de revalorización fueron del 5,6%, 2,25%,
4,15%, 8% y 9%, respectivamente. Calcúlese la tasa de revalorización
media anual de esos cinco años.

Si a la cantidad inicial invertida, S0, se le aplican sucesivamente las tasas de


revalorización anuales, r1, r2, r3, r4, r5, se obtienen las cantidades resultantes
para los cinco años:

Página 25 | Inicio del artículo

La tasa media anual que ha de calcularse (r), que debido a su naturaleza se


conoce como tasa media anual acumulativa, debe ser tal que, aplicada
sucesivamente durante cinco años a la cantidad inicial, proporcione el
montante del último año considerado. Es decir, se debe verificar

o bien

Por tanto,
expresión que involucra la media geométrica de (1 + ri), siendo G = 1 + r.

Despejando la tasa media anual r, ésta resulta ser

Por tanto, al individuo le es indiferente que su dinero se incremente un


porcentaje distinto cada año o que aumente todos los años un 5,77%, ya
que al final del quinto año la cuantía de su plan de pensiones va a ser la
misma:

Si se hubiese utilizado la media aritmética, el incremento sería

resultado no realista, pues 12.000(1 + 0,058)5 = 15.907,78 euros, cifra que


no coincide con la cantidad total que el individuo en cuestión tiene al final
del quinto año: 15.886,13 euros.

2.2.1.3. Media armónica

La media armónica H de una distribución de frecuencias (xi; ni) se define


como la inversa de la media aritmética de los inversos de los valores de la
variable; esto es,
Página 26 | Inicio del artículo

Igual que las dos medias anteriores, la media armónica tiene la ventaja de
que en su cálculo intervienen todos los valores de la variable; sin embargo,
no tiene sentido su utilización cuando algún valor de la distribución sea nulo.

La media armónica se suele utilizar para promediar rendimientos,


productividades, etc., es decir, cuando las unidades de medida de la
variable analizada vienen dadas en forma de cociente.

Recuadro: Ocultar

EJEMPLO 2.5

Una empresa de equipos electrónicos tiene tres talleres de montaje con las
siguientes cifras mensuales:

La productividad media del trabajo (número de equipos por empleado) se


calcula de la siguiente forma:

Nótese que 4.500/30 es el número de empleados del taller A:

Análogamente, 2.400/15 y 3.000/25 son los empleados de los talleres B y C,


respectivamente, esto es, 160 y 120.
Si se calcula la media aritmética de las productividades, se llega a:

resultado erróneo, pues, si se toma como productividad media 23,33


equipos por empleado, el número total de equipos producidos sería 430 x
23,33 = 10.032, cuando la cifra real es de 9.900.

Página 27 | Inicio del artículo

2.2.1.4. Medias ponderadas

Cuando la ponderación de los valores de la variable (wi) es distinta de la


frecuencia (absoluta o relativa) se tienen las denominadas medias
(aritmética, geométrica y armónica) ponderadas, definidas, respectivamente,
como

2.2.1.5. Mediana

Suponiendo que los valores de la variable están ordenados de menor a


mayor, la mediana se define como aquel valor que divide la distribución de
frecuencias de forma que el número de frecuencias que quedan a su
izquierda es igual al número de las que quedan a su derecha.

Distribuciones no agrupadas en intervalos

Si el número total de datos es impar, la definición proporciona siempre un


único valor, ya que denominando k al número de observaciones inferiores y
superiores a la mediana resulta que
siendo la mediana el valor que ocupa el lugar k + 1 de la distribución.

Sin embargo, si el número de datos es par, habrá dos valores medianos: el

que ocupa el lugar el que ocupa el lugar puesto que

Página 28 | Inicio del artículo

En este caso, se conviene en tomar como valor mediano la media aritmética


de ambos. No obstante, esto no es sino un convenio. Perfectamente podría
tomarse como mediana uno u otro.

Distribuciones agrupadas en intervalos


En el caso en que la distribución se encontrase agrupada en intervalos, no
se tendrá un valor mediano sino un intervalo mediano. Una vez establecido
dicho intervalo mediano, hay que determinar un valor dentro de él que se
corresponda con la mediana, valor que no se puede calcular de forma
exacta puesto que se desconocen los diferentes valores que toma la
variable en cada uno de los intervalos. Existen varios criterios para
aproximar el valor mediano:

a) Si se asigna ni a un punto, se puede considerar que la mediana es


cualquier valor del intervalo, exceptuando Li-1, puesto que los intervalos se
consideran abiertos por la izquierda y cerrados por la derecha.

b) Si no se asigna ni a un punto sino que se considera que todos los valores


del intervalo están distribuidos de manera uniforme dentro de él, se puede
aproximar la mediana de la forma siguiente:

▪ Número de datos impar

Como se ha visto en distribuciones no agrupadas en intervalos, si el número


de datos es impar la mediana es aquel valor de la variable, supuesta una
ordenación de menor a mayor, que ocupa el lugar:

Página 29 | Inicio del artículo

Siguiendo este mismo criterio, el intervalo mediano será aquel que contenga

la frecuencia . Si el intervalo mediano es Li-1 – Li y se observa el


histograma acumulativo de frecuencias del Gráfico 2.1 se tiene:
Gráfico 2.1

Evidentemente, Me = Li-1 + m, y m se determina mediante la siguiente


reglade tres:

despejando m se tiene que

con lo que

Página 30 | Inicio del artículo


▪ Número de datos par

En este caso se dispone de dos valores medianos, que son los que ocupan
las posiciones

Si ambos valores están en el mismo intervalo Li-1 – Li (intervalo mediano) se


tiene que

pudiéndose tomar como mediana cualquiera de ellos o la media de los dos:

es decir, la misma expresión que la obtenida para el caso de que la


frecuencia total sea impar.

Si los dos valores medianos se encuentran en distintos intervalos, se


procedería de forma análoga.

La mediana, como medida de posición central, resulta de gran utilidad en


los casos siguientes:

 Cuando existan valores anormalmente bajos o elevados. La mediana


es menos sensible que la media aritmética a estos valores extremos
porque en su determinación no intervienen todos los valores de la
variable sino los que ocupan las posiciones centrales.
 Cuando en las distribuciones agrupadas en intervalos el primero sea
del tipo menor que o el último del tipo mayor que, siempre y cuando
ninguno de estos intervalos sea el intervalo mediano.
 Cuando se analizan variables cualitativas que vienen dadas en escala
ordinal. En este caso, no se puede determinar la media aritmética,
siendo la mediana la medida de tendencia central más representativa.
Página 31 | Inicio del artículo

Recuadro: Ocultar

EJEMPLO 2.6

Se dispone de la siguiente información acerca de las prestaciones


mensuales por desempleo (euros) percibidas por 15 personas:

Como el número de datos es impar, la prestación mensual mediana es el


valor que ocupa el lugar

es decir, Me = 631 euros.

Si la distribución anterior tuviera un número par de observaciones como, por


ejemplo,
donde

el primer valor mediano sería 631 y el segundo 644, siendo la media


aritmética de ambos 637,5.

Página 32 | Inicio del artículo

Recuadro: Ocultar

EJEMPLO 2.7

El número de beneficiarios de prestaciones de nivel contributivo por


desempleo en España en 2004, según la edad de los mismos, viene
recogido en la siguiente tabla:

Como se dispone de un número par de datos, los dos valores medianos


ocupan, respectivamente, las posiciones:
Dado que ambos se encuentran en el mismo intervalo mediano (35-40), la
mediana es

Recuadro: Ocultar

EJEMPLO 2.8

Según la «Estadística de Accidentes de Trabajo» del Ministerio de Trabajo y


Asuntos Sociales, entre enero y septiembre de 2005 los accidentes
laborales con baja registrados en España durante la jornada de trabajo
fueron, según su gravedad: leves: 675.190; graves: 7.508; mortales: 770.

Página 33 | Inicio del artículo

Igual que ocurre en el caso de las variables, al ser el número de


observaciones par, los dos valores medianos corresponderán a aquellas
dos modalidades que ocupen los lugares:

es decir, en cualquier caso, a los accidentes leves. En caso de dos


modalidades medianas distintas, es obvio que no se puede calcular la
media aritmética de ambas, debiéndose proceder con un juicio razonable. Si
el número de observaciones es impar, existiría con una única modalidad
central.

2.2.1.6. Moda

La moda es aquel valor de la variable que presenta mayor frecuencia


absoluta, es decir, aquel que más veces se repite. Puede darse el caso de
que existan varios valores que presenten la máxima frecuencia absoluta,
teniéndose entonces una distribución bimodal, trimodal, etc.

Si la distribución está agrupada en intervalos, en primer lugar habrá que


determinar el intervalo modal y, posteriormente, elegir como moda un valor
de dicho intervalo. Se distinguen dos casos:

A. La amplitud de los intervalos es la misma

En este caso, el intervalo modal es aquel que presenta mayor frecuencia


absoluta y, como se desconocen los valores incluidos en dicho intervalo, se
puede aproximar la moda siguiendo varios criterios:

A.1. Si se asigna ni a un punto, se puede elegir cualquier valor del intervalo


como moda (descartando el extremo inferior por considerar el intervalo
abierto por la izquierda).

A.2. Si se considera que todos los valores del intervalo están distribuidos de
manera uniforme dentro de él y el intervalo modal es Li–1 – Li, la moda
estará más cerca (lejos) del intervalo de la derecha cuanto mayor (menor)
frecuencia tenga este intervalo y menor (mayor) tenga el izquierdo (Grífico
2.2).

Página 34 | Inicio del artículo


Gráfico 2.2.

La semejanza de los triángulos y permite hallar la longitud del


segmento (cantidad que se debe sumar a Li–1, para obtener el valor de
la moda).

Por la semejanza de los triángulos, se verifica que

de donde se deduce que

siendo

Por tanto,
B. La amplitud de los intervalos es distinta

En este caso, el intervalo modal no es el que tiene mayor frecuencia


absoluta sino el que tiene mayor frecuencia por unidad de intervalo, es

decir, mayor densidad de frecuencia . Una vez determinado el


intervalo modal se puede aproximar la moda siguiendo los criterios vistos en
el caso anterior, siendo el más razonable el último

Página 35 | Inicio del artículo

con

Por último, la moda es la mejor medida de tendencia central en el análisis


de los atributos dados en escala nominal, ya que sus modalidades no son
susceptibles de ser ordenadas y tampoco admiten ningún tipo de operación
algebraica.

Recuadro: Ocultar

EJEMPLO 2.9

Los contratos registrados en España durante los ejercicios 2004 y 2005,


según modalidad de contratación y duración del contrato, fueron
El tipo de contrato más frecuente en nuestro país, tanto en el ejercicio 2004
como en 2005, fue el eventual por circunstancias de la producción, puesto
que es el que presenta en ambos años la mayor frecuencia absoluta.

Página 36 | Inicio del artículo

Recuadro: Ocultar

EJEMPLO 2.10

Las prestaciones mensuales por desempleo (euros) de un determinado


número de individuos son las que se recogen en la siguiente tabla:
El intervalo con mayor densidad de frecuencia es (500-600) y la moda sería

2.2.2. MEDIDAS DE POSICIÓN NO CENTRAL

Estas medidas, como su nombre indica, no reflejan ninguna tendencia


central. Se denominan genéricamente cuantiles y son aquellos valores de la
variable, odenados en sentido creciente, que dividen la distribución en
partes, de tal manera que cada una de ellas contiene el mismo número de
frecuencias. Si la mediana divide la distribución en dos partes con idéntico
número de observaciones, por extensión, los cuartiles (Ci), deciles (Di) y
percentiles (Pi) dividen a la misma en 4, 10 y 100 partes, respectivamente,
con el mismo número de frecuencias.

A. Distribuciones no agrupadas en intervalos

La explicación se centrará en los cuartiles, si bien es fácilmente


generalizable a los deciles y percentiles.

Los cuartiles quedan perfectamente determinados si el número total de


observaciones es inferior en una unidad a cualquier múltiplo de 4. Sin
embargo, en otros casos es necesario recurrir a procedimientos que
permitan determinar un valor concreto. Los procedimientos que se proponen
son los siguientes:

a) Si el número total de observaciones es múltiplo de 4: el primer y tercer


cuartil quedan perfectamente determinados; sin embargo, como segundo
cuartil se tienen dos valores medianos, ya que el número total de
observaciones es par, optando por calcular la media aritmética de ambos.

Página 37 | Inicio del artículo


El primer cuartil ocupa el lugar:

El segundo cuartil o mediana: media aritmética de los dos valores


medianos.

Los dos valores medianos ocupan los lugares:

El tercer cuartil ocupa el lugar

b) Si el número total de observaciones es inferior en una unidad a un


múltiplo de 4:

Los cuartiles C1 C2 y C3 son los valores que ocupan los lugares:


c) Si el número total de observaciones es inferior en 2 unidades a un
múltiplo de 4: en este caso, existen dos valores para cada cuartil, por lo que
se considera la media aritmética de ambos.

Página 38 | Inicio del artículo

El primer y segundo valor del primer cuartil ocupan los lugares

El primer y segundo valor del segundo cuartil o mediana ocupan los lugares

El primer y segundo valor del tercer cuartil ocupan los lugares


d) Si el número total de observaciones es inferior en 3 unidades a un
múltiplo de 4: como el número total de observaciones es impar se tomará un
valor mediano y dos valores para el primer y tercer cuartil, y se procede
posteriormente a promediar éstos.

El primer y segundo valor del primer cuartil ocupan los lugares

Página 39 | Inicio del artículo

El segundo cuartil o mediana ocupa el lugar

El primer y segundo valor del tercer cuartil ocupan los lugares

B. Distribuciones agrupadas en intervalos


Como en el caso anterior, se hará referencia a los cuartiles, si bien se
puede proceder de forma similar para la determinación de deciles y
percentiles.

En primer lugar, hay que establecer el intervalo que contiene a cada uno de
ellos y, posteriormente, asignar un valor de dicho intervalo al cuartil
correspondiente. De manera análoga a como se procedía en la
determinación de la mediana, se puede tomar como cuartil cualquier valor
del intervalo excepto el correspondiente al extremo inferior, por considerarse
los intervalos abiertos por la izquierda, o bien aplicar la siguiente expresión:

siendo NCi el lugar que ocupa el cuartil i-ésimo.

Recuadro: Ocultar

EJEMPLO 2.11

A partir de la siguiente distribución de salarios mensuales (euros),


determínese el primer cuartil:

Como N es inferior en dos unidades a un múltiplo de cuatro, hay dos


primeros cuartiles. Para el primero:

Página 40 | Inicio del artículo

y, para el segundo:
es decir, 12 y 13, respectivamente. Por tanto, el primer y segundo valor del
primer cuartil son

por lo que, promediando ambos, se considera como primer cuartil 1.550


euros.

2.3. Medidas de dispersón


Supóngase, por ejemplo, que el coste extra salarial (en euros) que cuatro
trabajadores de una empresa A y otros cuatro de una empresa B les
suponen a ambas un determinado mes es:

pudiéndose apreciar que en la empresa B los valores de la variable varían


poco y en la A mucho. Si se calcula el coste extra salarial medio de ambas
distribuciones, el resultado obtenido es 235 euros. Sin embargo, estas dos
distribuciones son bien distintas, ya que a la empresa A ningún trabajador le
supone un coste extra salarial próximo a 235 euros y a la B sí. Es decir, se
puede considerar que el coste extra salarial medio de los cuatro
trabajadores de la empresa B es más representativo que el de los cuatro de
la empresa A.

Esto indica que, para caracterizar una distribución, además de calcular las
medidas de posición, también resulta necesario analizar su variabilidad.
Dicha variabilidad, habitualmente, se mide respecto a una medida de
posición central, pretendiendo, de esta manera, conocer la representatividad
de los valores centrales de la distribución, es decir, si estos valores
sintetizan de forma satisfactoria o no toda la información de la distribución.

Página 41 | Inicio del artículo

Existen dos tipos de medidas de dispersión: las absolutas y las relativas.


Las primeras se utilizan cuando se trata de analizar la variabilidad de,
únicamente, una distribución de frecuencias y, las segundas, cuando se
pretende comparar la variabilidad de dos o más.

2.3.1. MEDIDAS DE DISPERSIÓN ABSOLUTAS

A Medidas de dispersión obtenidas por comparación directa entre los


valores de la variable

Recorrido o rango

Se define como la diferencia entre el máximo y mínimo valor de la variable:

En el ejemplo anterior, el recorrido de la distribución de la empresa A es 270


euros y en la empresa B 20 euros. Al tener ambas el mismo número de
observaciones y ser el recorrido de la distribución de la empresa B mucho
más pequeño, en principio, se puede suponer que esta distribución está
menos dispersa que la de la empresa A; o dicho de otra manera, las
diferencias entre sus valores son menores.

Esta medida tiene la ventaja de ser muy sencilla de calcular. Sin embargo,
el inconveniente que presenta es que sólo depende de los valores
extremos, por lo que si éstos se encuentran alejados del resto de los valores
de la distribución (es decir, son valores anómalos) puede dar lugar a
conclusiones erróneas.

Recorrido o rango intercuartílico

Para evitar el problema de los valores anómalos, se suele emplear el


denominado recorrido o rango intercuartílico, que se define como la
diferencia entre el tercer y primer cuartil
donde el intervalo de longitud RI contiene el 50% de lo valores centrales de
la distribución. Cuanto mayor sea el recorrido intercuartílico mayor será la
variabilidad o dispersión de la distribución de frecuencias.

Diferencia media de Gini

Se define como

Página 42 | Inicio del artículo

esto es, el promedio de las diferencias (en valor absoluto) entre cada par de
valores de la distribución. Su principal incoveniente radica en la tediosidad
de su cálculo.

B Medidas de dispersión obtenidas por comparación entre los valores de la


variable y una medida de posición central

Si lo que se pretende es analizar la mayor o menor representatividad de los


valores centrales de la distribución, es necesario utilizar otro tipo de
medidas que hagan referencia a algún promedio. De todos los promedios
estudiados se ha elegido la media aritmética, porque es la medida de
posición central por excelencia habida cuenta de sus propiedades y
ventajas. Dentro de las medidas de dispersión absolutas respecto a la
media aritmética, la varianza y la desviación típica son las más utilizadas.

Varianza

Para determinar la mayor o menor separación entre los valores de la


variable y la media aritmética, se podrían promediar las desviaciones de
cada valor respecto a la media aritmética
sin embargo, por la primera propiedad de la media aritmética, esta
expresión es nula ya que las desviaciones positivas se compensan con las
negativas. Una forma de evitar esta circunstancia es considerar las
desviaciones elevadas al cuadrado, con lo cual tiene que

Esta expresión se denomina varianza y se define como la media aritmética


de los cuadrados de las desviaciones entre los valores de la variable y la
media aritmética, siendo, por la segunda propiedad de la media aritmética,
una medida de dispersión óptima.

La varianza mide la mayor o menor dispersión de los valores de la variable


respecto a la media aritmética. Cuanto mayor sea la varianza mayor
dispersión existirá y, por tanto, menor representatividad tendrá la media
aritmética.

Las propiedades de la varianza son las siguientes:

1. La varianza siempre es mayor o igual a cero.

Página 43 | Inicio del artículo

2. La varianza se puede expresar como:

3. Si de un conjunto de valores se pueden obtener dos o más subconjuntos


disjuntos, la varianza de todo el conjunto se encuentra relacionada con las
varianzas de los subconjuntos disjuntos. Considerése la siguiente
distribución:

de donde se han obtenido k subconjuntos disjuntos de tal manera que

Página 44 | Inicio del artículo

La varianza del conjunto total será

Ya se vio que es la media total de los k grupos


De la misma forma se podría expresar

Por tanto,

Pero los dos últimos términos de la expresión anterior no son sino la


varianza de una distribución cuyos valores son las medias de los grupos y
sus frecuencias absolutas los tamaños de los mismos. En consecuencia, la
varianza global de la distribución se puede expresar como la media
ponderada de la varianza de los grupos más la varianza de la distribución
de medias anteriormente citada.

O, en otros términos, como

ya que la media de la distribución de medias grupales es la media de la


variable.

Página 45 | Inicio del artículo

Por consiguiente, la varianza global se puede obtener como una suma


ponderada de las varianzas de cada grupo (primer sumando) más una suma
ponderada de las diferencias cuadráticas de las medias de cada grupo con
respecto a la media global. En definitiva, la varianza global se puede
descomponer en dos sumandos: el primero hace referencia a la variabilidad
intrínseca de cada grupo (variabilidad intragrupos) y el segundo a la
variabilidad de las medias de cada grupo (variabilidad intergrupos).

4. Si a todos los valores (xi) de una distribución (xi; ni) se les suma (resta)
una constante b, la varianza de la nueva distribución (yi; ni) no varía, es
decir, a la varianza no le afectan los cambios de origen (si por ejemplo a
todos los trabajadores de una empresa les suben el sueldo mensual 100
euros, la variabilidad de los salarios sigue siendo la misma).

Si yi = xi ± b, la varianza de la variable y será

5. Si a todos los valores xi de una distribución (xi; ni) se les multiplica (divide)
por una constante a, distinta de cero, la varianza de la nueva distribución (yi;
ni) queda multiplicada (dividida) por esa constante al cuadrado; es decir, a la
varianza le afectan los cambios de escala.

Si yi = axi, la varianza de la variable y será

6. Teniendo en cuenta las dos propiedades anteriores, si a una variable se


le aplica un cambio de origen b y un cambio de escala a, la varianza de la
nueva variable yi = axi + b es

Desviación típica o estándar

La varianza viene expresada en las mismas unidades de medida que la


variable analizada pero elevadas al cuadrado, lo que dificulta su
interpretación (piénsese que en una distribución de salarios la varianza
vendrá dada en euros2). Ante esta situación, es necesario definir otra
medida que venga expresada en las mismas unidades de medida que la
variable. Esta medida es la desviación típica o estándar.

Página 46 | Inicio del artículo

Se define la desviación típica como la raíz cuadrada con signo positivo de la


varianza, esto es,

Cuanto mayor sea la desviación típica, mayor dispersión existirá entre los
valores de la distribución y la media aritmética y, por tanto, la media
aritmética será menos representativa.

Las propiedades de la desviación típica se deducen directamente de las de


la varianza:

1. La desviación típica siempre es mayor o igual que cero.

2. La desviación típica también puede expresarse como

3. A la desviación típica no le afectan los cambios de origen: si yi = xi ± b,


entonces

4. A la desviación típica le afectan los cambios de escala: si yi = axi,


entonces

5. Si a una variable se le aplica un cambio de origen b y un cambio de


escala a, la desviación típica pasa a ser
6. La desviación típica, igual que la varianza, es una medida de dispersión
óptima.

Recuadro: Ocultar

EJEMPLO 2.12

La siguiente tabla contiene la distribución de altas diarias de afiliados a la


Seguridad Social en España durante el mes de enero de 2006 (en miles).
Calcúlese la media diaria de dichas altas, así como su desviación típica.

Página 47 | Inicio del artículo

El núimero medio de altas diarias, en miles, será

y su desviación típica, también en miles,


2.3.2. MEDIDAS DE DISPERSIÓN RELATIVAS

Supóngase, por ejemplo, que se dispone de las distribuciones de edades de


los trabajadores afiliados a la Seguridad Social en los regímenes especiales
agrícola y marítimo: en el agrícola la edad media es de 43 años y la
desviación típica de 5 años, y en el marítimo la edad media también es de
43 años pero la desviación es de 8 años. Evidentemente, puesto que la
edad media es la misma en ambos regímenes, la distribución del régimen
marítimo presenta mayor dispersión, ya que tiene mayor desviación típica y,
por tanto, la edad media es menos representativa que en el régimen
agrícola. Sin embargo, si las edades medias fueran distintas, no se podría
utilizar la desviación típica para determinar la representatividad de las
mismas, ni tampoco enPágina 48 | Inicio del artículoel caso de que las
unidades de medida fuesen diferentes (por ejemplo, si se tiene una
distribución de salarios y otra de edades).

Para evitar estos inconvenientes, hay que poner en relación la medida de


dispersión con la de tendencia central, y ello en forma de cociente para que
la medida resultante sea adimensional. Este tipo de cocientes son las
denominadas medidas de dispersión relativas, de las que existen varias en
la literatura estadística, siendo la más utilizada el coeficiente de variación de
Pearson.

Este coeficiente se define como el cociente entre la desviación típica y el


valor absoluto de la media aritmética

Se puede apreciar que:

 Como las unidades de medida de la desviación típica y de la media


aritmética son las mismas, este cociente es adimensional; por tanto,
es útil para comparar varias distribuciones.
 Como el coeficiente de variación representa el número de veces que
la desviación típica contiene a la media, cuanto mayor sea este
coeficiente, mayor dispersión existirá (más veces contendrá la
desviación típica a la media aritmética), por lo que menor será la
representatividad de la media aritmética y menor será la
homogeneidad de los valores de la distribución.
 El coeficiente de variación utiliza toda la información de la
distribución.
 El coeficiente de variación se anula cuando la desviación típica es
cero. En este caso no existiría dispersión y todos los valores de la
distribución son iguales.
 Cuando la media aritmética es cero, no tiene sentido su cálculo.
 Este coeficiente puede expresarse también en porcentaje,
simplemente multi-plicando la expresión anterior por 100.

Recuadro: Ocultar

EJEMPLO 2.13

En el Ejemplo 2.12 se ha procedido al cálculo de la media y la desviación


típica de las altas diarias de afiliados a la Seguridad Social en España
durante el mes de enero de 2006. Ahora, en la tabla adjunta, se presenta la
información relativa a las bajas diarias de afiliados en España durante dicho
mes (también en miles). ¿Cuál de las dos medias diarias, la de altas o la de
bajas, es más representativa?

Página 49 | Inicio del artículo


Procediendo de la misma manera que en el ejemplo anterior, el número
medio de bajas, en miles, seraá

y su variabilidad en torno a este valor medio, también en miles,

Para determinar cuál de las dos medias es más representativa, se procede


al cálculo de los coeficientes de variación de ambas distribuciones de
frecuencias,

llegándose a la conclusión de que, si bien ambos son muy similares, la


media de las bajas diarias en los registros de afiliación a la Seguridad Social
es ligeramente más representativa.

Página 50 | Inicio del artículo

2.3.3. VARIABLE TIPIFICADA

Supóngase que se dispone de una distribución de frecuencias (xi; ni) con


una determinada media y desviación típica. Si a todos los valores de la
distribución se les resta la media y se les divide por la desviación típica, la
variable resultante se denomina variable tipificada:
y se caracteriza porque su media es cero y su varianza uno, como puede
comprobarse fácilmente aplicando las propiedades de la media y varianza.

Recuadro: Ocultar

EJEMPLO 2.14

Un individuo tiene que elegir entre dos ofertas de trabajo: una propuesta por
una empresa española y la otra por una americana. La empresa española le
ofrece un sueldo anual bruto de 53.000 euros, mientras que la oferta de la
americana es de 50.000 $. Por otro lado, esta persona tiene información
sobre el sueldo medio y la desviación típica salarial de las distribuciones de
ambas empresas:

¿En cuál de las dos empresas la posición relativa de este individuo es mejor
respecto a los demás trabajadores?

Como las unidades de medida de ambas distribuciones no son iguales, no


se pueden comparar las remuneraciones de las dos empresas, por lo que
habrá que transformar estos valores de manera que las distribuciones
tengan la misma media y la misma desviación típica, es decir, habrá que
tipificar los salarios.

En el caso de los salarios ofertados al individuo en cuestión, se tiene que

Como las distribuciones de los salarios tipificados tienen media igual a cero
y desviación típica igual a 1, se observa que en ambas empresas la
remuneración de ese individuo está por encima de la media. Sin embargo,
en la empresa española estaría 3,71 desviaciones típicas por encima de la
media, mientras que en la americana su salario sería 7,82 desviaciones
típicas superior al salario medio, lo que refleja que su posición relativa frente
a los demás trabajadores es mejor en la empresa americana.
Página 51 | Inicio del artículo

2.3.4. DESIGUALDAD DE TCHEBICHEFF

En caso de no disponer de la distribución de frecuencias nada se puede


saber sobre el número de frecuencias mayores que un determinado valor de
la variable, o menores que él, o comprendidos entre dos valores de la
variable. Sin embargo, si se conocen la media y la desviación típica de
dicha distribución es posible conocer el número mínimo de frecuencias
contenidas en un intervalo simétrico respecto de la media, aunque no se
disponga de la distribución de frecuencias. Tal aportación, sin duda
importante, se debe al matemático ruso Tchebicheff.

Sea una distribución de frecuencias (xi; ni). Se divide en dos clases: la


primera, C1, contiene los valores de la variable que distan de la media de la
distribución (en valor absoluto) más que una distancia k positiva. La
segunda, C2, contiene el resto de valores.

En consecuencia:

y como en C1 resulta que , se tiene que

y despejando se obtiene que


o bien,

Página 52 | Inicio del artículo

En el caso particular en que k = k*Sx, siendo k* una constante mayor que


cero, se tiene que

La interpretación de este resultado es como sigue: el porcentaje del total de


valores de la distribución que se encuentran comprendidos entre la media
aritmética ± k* veces la desviación típica de la distribución es, como mínimo,
1 – 1/k*2. De este resultado se desprende que, para cualquier distribución de
frecuencias:

— Entre están comprendidas, al menos, el 75% de las


frecuencias de la distribución.

— Entre están comprendidas, al menos, el 89% de las


frecuencias de la distribución.

— Entre están comprendidas, al menos, el 94% de las


frecuencias de la distribución.

2.4. Medidas de forma


Para realizar un resumen completo de la variable objeto de estudio se
deben analizar, además de las medidas de posición y dispersión, otra serie
de medidas que caracterizan de forma más precisa el comportamiento de
dicha variable, ya que pueden existir distribuciones que presenten el mismo
valor central e igual grado de dispersión, y diferir, sin embargo, en la forma
o aspecto de sus histogramas o diagramas de barras. Estas medidas se
conocen con el nombre de medidas de formay pueden ser de dos tipos: de
asimetría y de apuntamiento o curtosis.
2.4.1. MEDIDAS DE ASIMETRÍA

El objetivo de estas medidas es determinar, sin necesidad de dibujar la


distribución de frecuencias, la deformación horizontal de los valores de la
variable analizada respecto a un valor central, generalmente la media
aritmética.

Una distribución es simétrica cuando a la izquierda y derecha de su media


existe el mismo número de valores, de manera que equidisten dos a dos de
la media y tengan, además, cada uno de ellos la misma frecuencia. Sin
embargo, no siempre ocurre esto; por ello, resulta necesario el uso de
medidas que determinen la mayor o menor asimetría de los valores de la
variable respecto a la media aritmética, siendo deseable que estas medidas
vengan dadas en forma de cociente y, por tanto, sean adimensionales.

Página 53 | Inicio del artículo

Para ver el grado y la dirección de la asimetría de una distribución se


podrían promediar las desviaciones de los valores de la variable respecto a
la media aritmética, ya que podría pensarse que un promedio negativo
implicaría asimetría a la izquierda, un promedio positivo asimetría a la
derecha, un promedio grande mucha asimetría y un promedio pequeño
poca asimetría. Pero, como ya se ha visto, dicho promedio es cero. Como
interesa mantener los signos de estas desviaciones, no pueden elevarse a
un número par pues se perderían; por tanto, habrá que elevarlas al número
impar más pequeño: 3. Por último, se dividen por la desviación típica al
cubo con el fin de que la medida resultante sea adimensional, es decir,

La expresión resultante, la más habitual por otra parte, es conocida como


el coeficiente de asimetría de Fisher.

Para calcular m3 se utiliza la expresión del Apéndice del final de este


capítulo:
El Gráfico 2.3 recoge los tres casos posibles que pueden darse:

Gráfico 2.3
Página 54 | Inicio del artículo

 Si la distribución es simétrica: g1 = 0.
 Si la distribución es asimétrica positiva o a la derecha: g1 > 0.
 Si la distribución es asimétrica negativa o a la izquierda: g1 < 0.

También se puede señalar que:

 Si la distribución es simétrica: .
 Si la distribución es asimétrica positiva o a la derecha: .
 Si la distribución es asimétrica negativa o a la
izquierda: .

2.4.2. MEDIDAS DE APUNTAMIENTO O CURTOSIS

El coefíciente de curtosis de una distribución determina el grado de


apuntamiento que ésta tiene respecto a otra distribución denominada
distribución normal1 , que, por otra parte, es la que sigue una gran mayoría
de distribuciones económicas.
Este coefíciente se utiliza cuando las distribuciones son simétricas o
ligeramente asimétricas, ya que en este tipo de distribuciones
frecuentemente se da el caso de que las más altas que la normal en las
colas también lo son en el centro.

Igual que ocurre con el coeficiente de asimetría, el de curtosis también es


adimensional y su expresión es la siguiente:

Para calcular m4 se utiliza la expresión del Apéndice del final de este


capítulo:

El coeficiente de curtosis de la distribución normal es nulo, de tal forma que:

 Si la distribución es mesocúrtica o igual de apuntada que la


normal: g2 = 0.
 Si la distribución es platicúrtica o menos apuntada que la
normal2 : g2 < 0.
 Si la distribución es leptocúrtica o más apuntada que la normal: g2 >
0.

Página 55 | Inicio del artículo


Gráfico 2.4.

Las denominaciones de mesocúrtica, platicúrtica y leptocúrtica fueron dadas


originariamente porque entre ciertas distribuciones simétricas regulares se
podía percibir que las que tenían frecuencias relativas más elevadas en las
colas eran también las que tenían mayores frecuencias relativas en la parte
central. Evidentemente, esto no tiene por qué ocurrir para otro tipo de
distribuciones simétricas o para las asimétricas y, aunque la nomenclatura
anterior es útil, debe ser entendida como que describe el signo del
coeficiente de apuntamiento más que la forma de la distribución.

Algunas particularidades importantes relativas al coeficiente de


apuntamiento son las siguientes:

1. El coeficiente de apuntamiento es siempre mayor que – 2.

Considérese la desigualdad de Cauchy

salvo que ai y bi sean proporcionales, en cuyo caso la relación es de


igualdad.

Hágase
Entonces, se tiene que

Página 56 | Inicio del artículo

siendo sólo la relación de igualdad cuando la distribución de frecuencias se


encuentra concentrada en dos valores.

Es decir,

y, por consiguiente,

2. En distribuciones regulares, simétricas y unimodales el coeficiente de


apuntamiento es siempre menor que 1,2.

3. Existe una relación entre los coeficientes de asimetría y apuntamiento,


que viene dada por

Recuadro: Ocultar

EJEMPLO 2.15
En una empresa con 150 empleados, el número de horas
extraordinarias/año de los mismos sigue la distribución expuesta en las dos
primeras columnas de la tabla:

Determínense los coeficientes de asimetría y curtosis.

Los momentos m3 y m4 se calculan en función de los momentos respecto al


origen, utilizando las expresiones del Apéndice de este capítulo.

Página 57 | Inicio del artículo


El coeficiente de asimetría de Fisher es:

y la distribución es asimétrica positiva o a la derecha.

Por otra parte, el coeficiente de curtosis resulta:

y la distribución es leptocúrtica (más apuntada que la normal).

2.5. Box and whisker plots (Gráficos de caja y


bigotes)
Un box and whisker plot permite determinar fácilmente de forma visual la
tendencia central, la variabilidad, la asimetría y la existencia de valores
anómalos en una distribución de frecuencias.

Página 58 | Inicio del artículo

Un box and whisker plot incluye las siguientes características de la


distribución (véase Ejemplo 2.16):

1. Box (caja): la línea interior de la caja representa la mediana, la de la


izquierda el primer cuartil y la de la derecha el tercer cuartil. La caja,
que recoge el 50% de las observaciones centrales de la distribución,
se determina uniendo los extremos de estas tres líneas por dos
segmentos paralelos.
2. Whiskers (bigotes): la observación más grande (pequeña) que no se
aleja más de 1,5 veces el recorrido intercuartílico (C3 – C1) desde el
tercer (primer) cuartil se encuentra unida a la caja por el
denominado whisker derecho (izquierdo).
3. Valores sospechosos de ser anómalos (o): los puntos que
sobrepasan los extremos de los whiskers pero no están a más de 3
veces el recorrido intercuartílico desde el lado derecho (izquierdo) de
la caja.
4. Valores anómalos (*): puntos que se alejan del lado derecho
(izquierdo) de la caja 3 o más veces el recorrido intercuartílico.
Como ya se ha visto, la mediana proporciona una idea de la tendencia
central de la distribución y el recorrido intercuartílico indica la variabilidad de
la misma (a mayor/menor recorrido intercuartílico mayor/menor variabilidad).

La proximidad de la mediana a los extremos de la caja y la longitud de


los whiskers indicarán la asimetría de la distribución: si la asimetría es a
derechas la mediana estará próxima al extremo de la derecha de la caja y/o
la longitud del whisker derecho será mayor que la del izquierdo. Si la
asimetría es a izquierdas, la mediana estará próxima al extremo izquierdo
de la caja y/o la longitud del whisker izquierdo será mayor que la del
derecho. Si la distribución es simétrica, la mediana se ubicará en el centro
de la caja y los whiskers serán simétricos respecto de la mediana.

Los extremos de los whiskers representan los valores más grandes y más
pequeños de la distribución que no son considerados anómalos. Los valores
sospechosos de ser anómalos deberán ser considerados con prudencia y
los anómalos pueden no considerarse como pertenecientes a la distribución
en cuestión.

Recuadro: Ocultar

EJEMPLO 2.16

Se dispone de la distribución sobre las bajas laborales (en días) de los


trabajadores de una empresa (véase la tabla de la página siguiente).

Si se observa el Gráfico 2.5, la mediana es de 2 días de baja laboral, no


pudiéndose considerar excesiva la dispersión de la distribución ya que el
recorrido intercuartílico es también 2. La asimetría de la distribución es
hacia la derecha ya que la longitud del whisker derecho es mayor que la del
izquierdo (g1 = 1,506).

La longitud de los whiskers es, como máximo, de 1,5 veces el recorrido


intercuartílico (1,5 x 2 = 3) desde ambos extremos de la caja, es decir, los
valores que no son considerados

Página 59 | Inicio del artículo


Gráfico 2.5. Box and whisker plot.

anómalos son los comprendidos entre – 2 y 6. En este caso, como la


variable no toma valores negativos ni tampoco el valor 6, se consideran
como mínimo y máximo valor no anómalos de la distribución el 0 y el 5,
respectivamente.

Por otra parte, existe un valor sospechoso de ser anómalo, el


correspondiente a la observación 30 (x = 7), pues sobrepasa
al whisker derecho y está entre 1,5 y 3 veces el recorrido intercuartílico
desde el extremo derecho de la caja.

Finalmente, existen dos valores anómalos, que son los correspondientes a


las observaciones 31 y 32 (x = 9 y x = 10), ya que se alejan más de 3 veces
el recorrido intercuartílico desde el extremo derecho de la caja.
Como ya se había avanzado, el valor sospechoso de ser anómalo deberá
ser considerado con prudencia, mientras que los dos anómalos pueden ser
considerados no representativos de la distribución.

Página 60 | Inicio del artículo

APÉNDICE. Momentos potenciales


Los momentos de una distribución son valores característicos de la misma
deducidos a partir de todos los valores de la distribución, de modo que si
dos distribuciones son iguales, todos sus momentos son también iguales.

Los momentos potenciales se definen como:

donde c es un número real cualquiera y r el orden del momento.

En función de los valores que tome c, se pueden considerar dos tipos de


momentos: momentos respecto al origen y momentos respecto a la media
aritmética o momentos centrales.

A) MOMENTOS RESPECTO AL ORIGEN

Generalmente se representan por ar y se obtienen cuando c = 0, es decir,

Los primeros momentos respecto al origen son:


B) MOMENTOS RESPECTO A LA MEDIA ARITMÉTICA O
MOMENTOS CENTRALES

Se representan por mr y se obtienen cuando , por lo que

Página 61 | Inicio del artículo

Los primeros momentos centrales son

A efectos prácticos, una cuestión relevante de los momentos centrales es


que se pueden expresar, utilizando el binomio de Newton3 , en función de
los momentos respecto al origen:

Casos particulares
1 La representación gráfica de la distribución normal es una campana
(campana de Gauss) que se caracteriza por ser simétrica respecto al eje de
abscisas. El coeficiente de apuntamiento de este tipo de distribuciones, tal y
como se ha definido, es nulo.

2 No obstante, como se verá posteriormente, este coeficiente no puede


tomar valores inferiores a – 2.

3 .

Cita de fuente (MLA 8.a edición)


Montero Lorenzo, Jóse Maria. "Características de Una Distribución de
Frecuencias." Estadística descriptiva, Paraninfo, 2007, pp. 17-61. Gale
Virtual Reference
Library, http://link.galegroup.com/apps/doc/CX4052100008/GVRL?u=unad&sid=GVR
L&xid=d49ed557. Accessed 16 Oct. 2018.

También podría gustarte