Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Existen dos tipos de medidas de dispersión: las absolutas y las relativas. Las
primeras se utilizan cuando se trata de analizar la variabilidad de, únicamente, una
distribución de frecuencias y, las segundas, cuando se pretende comparar la
variabilidad de dos o más.
Recorrido o rango
Esta medida tiene la ventaja de ser muy sencilla de calcular. Sin embargo, el
inconveniente que presenta es que sólo depende de los valores extremos, por lo
que si éstos se encuentran alejados del resto de los valores de la distribución (es
decir, son valores anómalos) puede dar lugar a conclusiones erróneas.
esto es, el promedio de las diferencias (en valor absoluto) entre cada par de
valores de la distribución. Su principal incoveniente radica en la tediosidad de su
cálculo.
Varianza
Pero los dos últimos términos de la expresión anterior no son sino la varianza de
una distribución cuyos valores son las medias de los grupos y sus frecuencias
absolutas los tamaños de los mismos. En consecuencia, la varianza global de la
distribución se puede expresar como la media ponderada de la varianza de los
grupos más la varianza de la distribución de medias anteriormente citada.
Por consiguiente, la varianza global se puede obtener como una suma ponderada
de las varianzas de cada grupo (primer sumando) más una suma ponderada de
las diferencias cuadráticas de las medias de cada grupo con respecto a la media
global. En definitiva, la varianza global se puede descomponer en dos sumandos:
el primero hace referencia a la variabilidad intrínseca de cada grupo (variabilidad
intragrupos) y el segundo a la variabilidad de las medias de cada grupo
(variabilidad intergrupos).
4. Si a todos los valores (xi) de una distribución (xi; ni) se les suma (resta) una
constante b, la varianza de la nueva distribución (yi; ni) no varía, es decir, a la
varianza no le afectan los cambios de origen (si por ejemplo a todos los
trabajadores de una empresa les suben el sueldo mensual 100 euros, la
variabilidad de los salarios sigue siendo la misma).
5. Si a todos los valores xi de una distribución (xi; ni) se les multiplica (divide) por
una constante a, distinta de cero, la varianza de la nueva distribución (yi; ni) queda
multiplicada (dividida) por esa constante al cuadrado; es decir, a la varianza le
afectan los cambios de escala.
Recuadro: Ocultar
EJEMPLO 2.12
La siguiente tabla contiene la distribución de altas diarias de afiliados a la
Seguridad Social en España durante el mes de enero de 2006 (en miles).
Calcúlese la media diaria de dichas altas, así como su desviación típica.
Como las unidades de medida de la desviación típica y de la media aritmética son las
mismas, este cociente es adimensional; por tanto, es útil para comparar varias
distribuciones.
Como el coeficiente de variación representa el número de veces que la desviación típica
contiene a la media, cuanto mayor sea este coeficiente, mayor dispersión existirá (más
veces contendrá la desviación típica a la media aritmética), por lo que menor será la
representatividad de la media aritmética y menor será la homogeneidad de los valores de
la distribución.
El coeficiente de variación utiliza toda la información de la distribución.
El coeficiente de variación se anula cuando la desviación típica es cero. En este caso no
existiría dispersión y todos los valores de la distribución son iguales.
Cuando la media aritmética es cero, no tiene sentido su cálculo.
Este coeficiente puede expresarse también en porcentaje, simplemente multi-plicando la
expresión anterior por 100.
Recuadro: Ocultar
EJEMPLO 2.13
En el Ejemplo 2.12 se ha procedido al cálculo de la media y la desviación típica de
las altas diarias de afiliados a la Seguridad Social en España durante el mes de
enero de 2006. Ahora, en la tabla adjunta, se presenta la información relativa a las
bajas diarias de afiliados en España durante dicho mes (también en miles). ¿Cuál
de las dos medias diarias, la de altas o la de bajas, es más representativa?
Recuadro: Ocultar
EJEMPLO 2.14
Un individuo tiene que elegir entre dos ofertas de trabajo: una propuesta por una
empresa española y la otra por una americana. La empresa española le ofrece un
sueldo anual bruto de 53.000 euros, mientras que la oferta de la americana es de
50.000 $. Por otro lado, esta persona tiene información sobre el sueldo medio y la
desviación típica salarial de las distribuciones de ambas empresas:
¿En cuál de las dos empresas la posición relativa de este individuo es mejor
respecto a los demás trabajadores?
Como las distribuciones de los salarios tipificados tienen media igual a cero y
desviación típica igual a 1, se observa que en ambas empresas la remuneración
de ese individuo está por encima de la media. Sin embargo, en la empresa
española estaría 3,71 desviaciones típicas por encima de la media, mientras que
en la americana su salario sería 7,82 desviaciones típicas superior al salario
medio, lo que refleja que su posición relativa frente a los demás trabajadores es
mejor en la empresa americana.
Sea una distribución de frecuencias (xi; ni). Se divide en dos clases: la primera, C1,
contiene los valores de la variable que distan de la media de la distribución (en
valor absoluto) más que una distancia k positiva. La segunda, C2, contiene el resto
de valores.
En consecuencia:
y como en C1 resulta que , se tiene que
o bien,
En el caso particular en que k = k*Sx, siendo k* una constante mayor que cero, se
tiene que
Para calcular m3 se utiliza la expresión del Apéndice del final de este capítulo:
El Gráfico 2.3 recoge los tres casos posibles que pueden darse:
Gráfico 2.3
Página 54 | Inicio del artículo
Si la distribución es simétrica: g1 = 0.
Si la distribución es asimétrica positiva o a la derecha: g1 > 0.
Si la distribución es asimétrica negativa o a la izquierda: g1 < 0.
Si la distribución es simétrica: .
Si la distribución es asimétrica positiva o a la derecha: .
Si la distribución es asimétrica negativa o a la izquierda: .
2.4.2. MEDIDAS DE APUNTAMIENTO O CURTOSIS
El coefíciente de curtosis de una distribución determina el grado de apuntamiento
que ésta tiene respecto a otra distribución denominada distribución normal1 , que,
por otra parte, es la que sigue una gran mayoría de distribuciones económicas.
Para calcular m4 se utiliza la expresión del Apéndice del final de este capítulo:
Hágase
Entonces, se tiene que
Es decir,
y, por consiguiente,
Recuadro: Ocultar
EJEMPLO 2.15
En una empresa con 150 empleados, el número de horas extraordinarias/año de
los mismos sigue la distribución expuesta en las dos primeras columnas de la
tabla:
Determínense los coeficientes de asimetría y curtosis.
Los extremos de los whiskers representan los valores más grandes y más
pequeños de la distribución que no son considerados anómalos. Los valores
sospechosos de ser anómalos deberán ser considerados con prudencia y los
anómalos pueden no considerarse como pertenecientes a la distribución en
cuestión.
Recuadro: Ocultar
EJEMPLO 2.16
Se dispone de la distribución sobre las bajas laborales (en días) de los
trabajadores de una empresa (véase la tabla de la página siguiente).
Finalmente, existen dos valores anómalos, que son los correspondientes a las
observaciones 31 y 32 (x = 9 y x = 10), ya que se alejan más de 3 veces el
recorrido intercuartílico desde el extremo derecho de la caja.
Casos particulares