Distribución de Frecuencias

Página 41 | Inicio del artículo
Existen dos tipos de medidas de dispersión: las absolutas y las relativas. Las
primeras se utilizan cuando se trata de analizar la variabilidad de, únicamente, una
distribución de frecuencias y, las segundas, cuando se pretende comparar la
variabilidad de dos o más.
2.3.1. MEDIDAS DE DISPERSIÓN ABSOLUTAS

A Medidas de dispersión obtenidas por comparación directa entre los valores de la
variable
Recorrido o rango
Se define como la diferencia entre el máximo y mínimo valor de la variable:
En el ejemplo anterior, el recorrido de la distribución de la empresa A es 270 euros

y en la empresa B 20 euros. Al tener ambas el mismo número de observaciones y
ser el recorrido de la distribución de la empresa B mucho más pequeño, en
principio, se puede suponer que esta distribución está menos dispersa que la de la
empresa A; o dicho de otra manera, las diferencias entre sus valores son
menores.
Esta medida tiene la ventaja de ser muy sencilla de calcular. Sin embargo, el
inconveniente que presenta es que sólo depende de los valores extremos, por lo
que si éstos se encuentran alejados del resto de los valores de la distribución (es
decir, son valores anómalos) puede dar lugar a conclusiones erróneas.
Recorrido o rango intercuartílico
Para evitar el problema de los valores anómalos, se suele emplear el denominado

recorrido o rango intercuartílico, que se define como la diferencia entre el tercer y
primer cuartil
donde el intervalo de longitud RI contiene el 50% de lo valores centrales de la

distribución. Cuanto mayor sea el recorrido intercuartílico mayor será la
variabilidad o dispersión de la distribución de frecuencias.
Diferencia media de Gini

Se define como
esto es, el promedio de las diferencias (en valor absoluto) entre cada par de
valores de la distribución. Su principal incoveniente radica en la tediosidad de su
cálculo.
B Medidas de dispersión obtenidas por comparación entre los valores de la

variable y una medida de posición central
Si lo que se pretende es analizar la mayor o menor representatividad de los

valores centrales de la distribución, es necesario utilizar otro tipo de medidas que
hagan referencia a algún promedio. De todos los promedios estudiados se ha
elegido la media aritmética, porque es la medida de posición central por
excelencia habida cuenta de sus propiedades y ventajas. Dentro de las medidas
de dispersión absolutas respecto a la media aritmética, la varianza y la desviación
típica son las más utilizadas.
Varianza
Para determinar la mayor o menor separación entre los valores de la variable y la

media aritmética, se podrían promediar las desviaciones de cada valor respecto a
la media aritmética
sin embargo, por la primera propiedad de la media aritmética, esta expresión es

nula ya que las desviaciones positivas se compensan con las negativas. Una
forma de evitar esta circunstancia es considerar las desviaciones elevadas al
cuadrado, con lo cual tiene que
Esta expresión se denomina varianza y se define como la media aritmética de los
cuadrados de las desviaciones entre los valores de la variable y la media
aritmética, siendo, por la segunda propiedad de la media aritmética, una medida
de dispersión óptima.
La varianza mide la mayor o menor dispersión de los valores de la variable

respecto a la media aritmética. Cuanto mayor sea la varianza mayor dispersión
existirá y, por tanto, menor representatividad tendrá la media aritmética.
Las propiedades de la varianza son las siguientes:
1. La varianza siempre es mayor o igual a cero.
2. La varianza se puede expresar como:
3. Si de un conjunto de valores se pueden obtener dos o más subconjuntos

disjuntos, la varianza de todo el conjunto se encuentra relacionada con las
varianzas de los subconjuntos disjuntos. Considerése la siguiente distribución:
de donde se han obtenido k subconjuntos disjuntos de tal manera que
La varianza del conjunto total será
Ya se vio que es la media total de los k grupos
De la misma forma se podría expresar

Por tanto,
Pero los dos últimos términos de la expresión anterior no son sino la varianza de
una distribución cuyos valores son las medias de los grupos y sus frecuencias
absolutas los tamaños de los mismos. En consecuencia, la varianza global de la
distribución se puede expresar como la media ponderada de la varianza de los
grupos más la varianza de la distribución de medias anteriormente citada.
O, en otros términos, como
ya que la media de la distribución de medias grupales es la media de la variable.
Por consiguiente, la varianza global se puede obtener como una suma ponderada
de las varianzas de cada grupo (primer sumando) más una suma ponderada de
las diferencias cuadráticas de las medias de cada grupo con respecto a la media
global. En definitiva, la varianza global se puede descomponer en dos sumandos:
el primero hace referencia a la variabilidad intrínseca de cada grupo (variabilidad
intragrupos) y el segundo a la variabilidad de las medias de cada grupo
(variabilidad intergrupos).
4. Si a todos los valores (xi) de una distribución (xi; ni) se les suma (resta) una
constante b, la varianza de la nueva distribución (yi; ni) no varía, es decir, a la
varianza no le afectan los cambios de origen (si por ejemplo a todos los
trabajadores de una empresa les suben el sueldo mensual 100 euros, la
variabilidad de los salarios sigue siendo la misma).
Si yi = xi ± b, la varianza de la variable y será
5. Si a todos los valores xi de una distribución (xi; ni) se les multiplica (divide) por
una constante a, distinta de cero, la varianza de la nueva distribución (yi; ni) queda
multiplicada (dividida) por esa constante al cuadrado; es decir, a la varianza le
afectan los cambios de escala.
Si yi = axi, la varianza de la variable y será
6. Teniendo en cuenta las dos propiedades anteriores, si a una variable se le

aplica un cambio de origen b y un cambio de escala a, la varianza de la nueva
variable yi = axi + b es
Desviación típica o estándar
La varianza viene expresada en las mismas unidades de medida que la variable

analizada pero elevadas al cuadrado, lo que dificulta su interpretación (piénsese
que en una distribución de salarios la varianza vendrá dada en euros 2). Ante esta
situación, es necesario definir otra medida que venga expresada en las mismas
unidades de medida que la variable. Esta medida es la desviación típica o
estándar.
Se define la desviación típica como la raíz cuadrada con signo positivo de la

varianza, esto es,
Cuanto mayor sea la desviación típica, mayor dispersión existirá entre los valores
de la distribución y la media aritmética y, por tanto, la media aritmética será menos
representativa.
Las propiedades de la desviación típica se deducen directamente de las de la

varianza:
1. La desviación típica siempre es mayor o igual que cero.
2. La desviación típica también puede expresarse como
3. A la desviación típica no le afectan los cambios de origen: si yi = xi ± b, entonces
4. A la desviación típica le afectan los cambios de escala: si yi = axi, entonces
5. Si a una variable se le aplica un cambio de origen b y un cambio de escala a, la

desviación típica pasa a ser
6. La desviación típica, igual que la varianza, es una medida de dispersión óptima.
Recuadro: Ocultar
EJEMPLO 2.12
La siguiente tabla contiene la distribución de altas diarias de afiliados a la
Seguridad Social en España durante el mes de enero de 2006 (en miles).
Calcúlese la media diaria de dichas altas, así como su desviación típica.
El núimero medio de altas diarias, en miles, será
y su desviación típica, también en miles,
2.3.2. MEDIDAS DE DISPERSIÓN RELATIVAS

Supóngase, por ejemplo, que se dispone de las distribuciones de edades de los
trabajadores afiliados a la Seguridad Social en los regímenes especiales agrícola y
marítimo: en el agrícola la edad media es de 43 años y la desviación típica de 5
años, y en el marítimo la edad media también es de 43 años pero la desviación es
de 8 años. Evidentemente, puesto que la edad media es la misma en ambos
regímenes, la distribución del régimen marítimo presenta mayor dispersión, ya que
tiene mayor desviación típica y, por tanto, la edad media es menos representativa
que en el régimen agrícola. Sin embargo, si las edades medias fueran distintas, no
se podría utilizar la desviación típica para determinar la representatividad de las
mismas, ni tampoco enPágina 48 | Inicio del artículoel caso de que las unidades
de medida fuesen diferentes (por ejemplo, si se tiene una distribución de salarios y
otra de edades).
Para evitar estos inconvenientes, hay que poner en relación la medida de

dispersión con la de tendencia central, y ello en forma de cociente para que la
medida resultante sea adimensional. Este tipo de cocientes son las denominadas
medidas de dispersión relativas, de las que existen varias en la literatura
estadística, siendo la más utilizada el coeficiente de variación de Pearson.
Este coeficiente se define como el cociente entre la desviación típica y el valor

absoluto de la media aritmética
Se puede apreciar que:
 Como las unidades de medida de la desviación típica y de la media aritmética son las
mismas, este cociente es adimensional; por tanto, es útil para comparar varias
distribuciones.
 Como el coeficiente de variación representa el número de veces que la desviación típica
contiene a la media, cuanto mayor sea este coeficiente, mayor dispersión existirá (más
veces contendrá la desviación típica a la media aritmética), por lo que menor será la
representatividad de la media aritmética y menor será la homogeneidad de los valores de
la distribución.
 El coeficiente de variación utiliza toda la información de la distribución.
 El coeficiente de variación se anula cuando la desviación típica es cero. En este caso no
existiría dispersión y todos los valores de la distribución son iguales.
 Cuando la media aritmética es cero, no tiene sentido su cálculo.
 Este coeficiente puede expresarse también en porcentaje, simplemente multi-plicando la
expresión anterior por 100.
Recuadro: Ocultar
EJEMPLO 2.13
En el Ejemplo 2.12 se ha procedido al cálculo de la media y la desviación típica de
las altas diarias de afiliados a la Seguridad Social en España durante el mes de
enero de 2006. Ahora, en la tabla adjunta, se presenta la información relativa a las
bajas diarias de afiliados en España durante dicho mes (también en miles). ¿Cuál
de las dos medias diarias, la de altas o la de bajas, es más representativa?
Procediendo de la misma manera que en el ejemplo anterior, el número medio de

bajas, en miles, seraá
y su variabilidad en torno a este valor medio, también en miles,
Para determinar cuál de las dos medias es más representativa, se procede al

cálculo de los coeficientes de variación de ambas distribuciones de frecuencias,
llegándose a la conclusión de que, si bien ambos son muy similares, la media de
las bajas diarias en los registros de afiliación a la Seguridad Social es ligeramente
más representativa.

2.3.3. VARIABLE TIPIFICADA
Supóngase que se dispone de una distribución de frecuencias (xi; ni) con una
determinada media y desviación típica. Si a todos los valores de la distribución se
les resta la media y se les divide por la desviación típica, la variable resultante se
denomina variable tipificada:
y se caracteriza porque su media es cero y su varianza uno, como puede

comprobarse fácilmente aplicando las propiedades de la media y varianza.
Recuadro: Ocultar
EJEMPLO 2.14
Un individuo tiene que elegir entre dos ofertas de trabajo: una propuesta por una
empresa española y la otra por una americana. La empresa española le ofrece un
sueldo anual bruto de 53.000 euros, mientras que la oferta de la americana es de
50.000 $. Por otro lado, esta persona tiene información sobre el sueldo medio y la
desviación típica salarial de las distribuciones de ambas empresas:
¿En cuál de las dos empresas la posición relativa de este individuo es mejor
respecto a los demás trabajadores?
Como las unidades de medida de ambas distribuciones no son iguales, no se

pueden comparar las remuneraciones de las dos empresas, por lo que habrá que
transformar estos valores de manera que las distribuciones tengan la misma
media y la misma desviación típica, es decir, habrá que tipificar los salarios.
En el caso de los salarios ofertados al individuo en cuestión, se tiene que
Como las distribuciones de los salarios tipificados tienen media igual a cero y
desviación típica igual a 1, se observa que en ambas empresas la remuneración
de ese individuo está por encima de la media. Sin embargo, en la empresa
española estaría 3,71 desviaciones típicas por encima de la media, mientras que
en la americana su salario sería 7,82 desviaciones típicas superior al salario
medio, lo que refleja que su posición relativa frente a los demás trabajadores es
mejor en la empresa americana.

2.3.4. DESIGUALDAD DE TCHEBICHEFF
En caso de no disponer de la distribución de frecuencias nada se puede saber
sobre el número de frecuencias mayores que un determinado valor de la variable,
o menores que él, o comprendidos entre dos valores de la variable. Sin embargo,
si se conocen la media y la desviación típica de dicha distribución es posible
conocer el número mínimo de frecuencias contenidas en un intervalo simétrico
respecto de la media, aunque no se disponga de la distribución de frecuencias. Tal
aportación, sin duda importante, se debe al matemático ruso Tchebicheff.
Sea una distribución de frecuencias (xi; ni). Se divide en dos clases: la primera, C1,
contiene los valores de la variable que distan de la media de la distribución (en
valor absoluto) más que una distancia k positiva. La segunda, C2, contiene el resto
de valores.
En consecuencia:
y como en C1 resulta que , se tiene que
y despejando se obtiene que
o bien,
En el caso particular en que k = k*Sx, siendo k* una constante mayor que cero, se
tiene que
La interpretación de este resultado es como sigue: el porcentaje del total de

valores de la distribución que se encuentran comprendidos entre la media
aritmética ± k* veces la desviación típica de la distribución es, como mínimo, 1 –
1/k*2. De este resultado se desprende que, para cualquier distribución de
frecuencias:
— Entre están comprendidas, al menos, el 75% de las

frecuencias de la distribución.

2.4. MEDIDAS DE FORMA

Para realizar un resumen completo de la variable objeto de estudio se deben
analizar, además de las medidas de posición y dispersión, otra serie de medidas
que caracterizan de forma más precisa el comportamiento de dicha variable, ya
que pueden existir distribuciones que presenten el mismo valor central e igual
grado de dispersión, y diferir, sin embargo, en la forma o aspecto de sus
histogramas o diagramas de barras. Estas medidas se conocen con el nombre
de medidas de forma y pueden ser de dos tipos: de asimetría y de apuntamiento o
curtosis.
2.4.1. MEDIDAS DE ASIMETRÍA

El objetivo de estas medidas es determinar, sin necesidad de dibujar la
distribución de frecuencias, la deformación horizontal de los valores de la variable
analizada respecto a un valor central, generalmente la media aritmética.
Una distribución es simétrica cuando a la izquierda y derecha de su media existe

el mismo número de valores, de manera que equidisten dos a dos de la media y
tengan, además, cada uno de ellos la misma frecuencia. Sin embargo, no siempre
ocurre esto; por ello, resulta necesario el uso de medidas que determinen la mayor
o menor asimetría de los valores de la variable respecto a la media aritmética,
siendo deseable que estas medidas vengan dadas en forma de cociente y, por
tanto, sean adimensionales.
Para ver el grado y la dirección de la asimetría de una distribución se podrían

promediar las desviaciones de los valores de la variable respecto a la media
aritmética, ya que podría pensarse que un promedio negativo implicaría asimetría
a la izquierda, un promedio positivo asimetría a la derecha, un promedio grande
mucha asimetría y un promedio pequeño poca asimetría. Pero, como ya se ha
visto, dicho promedio es cero. Como interesa mantener los signos de estas
desviaciones, no pueden elevarse a un número par pues se perderían; por tanto,
habrá que elevarlas al número impar más pequeño: 3. Por último, se dividen por la
desviación típica al cubo con el fin de que la medida resultante sea adimensional,
es decir,
La expresión resultante, la más habitual por otra parte, es conocida como
el coeficiente de asimetría de Fisher.
Para calcular m3 se utiliza la expresión del Apéndice del final de este capítulo:
El Gráfico 2.3 recoge los tres casos posibles que pueden darse:
Gráfico 2.3
 Si la distribución es simétrica: g1 = 0.
 Si la distribución es asimétrica positiva o a la derecha: g1 > 0.
 Si la distribución es asimétrica negativa o a la izquierda: g1 < 0.
También se puede señalar que:
 Si la distribución es simétrica: .
 Si la distribución es asimétrica positiva o a la derecha: .
 Si la distribución es asimétrica negativa o a la izquierda: .
2.4.2. MEDIDAS DE APUNTAMIENTO O CURTOSIS
El coefíciente de curtosis de una distribución determina el grado de apuntamiento
que ésta tiene respecto a otra distribución denominada distribución normal1 , que,
por otra parte, es la que sigue una gran mayoría de distribuciones económicas.
Este coefíciente se utiliza cuando las distribuciones son simétricas o ligeramente

asimétricas, ya que en este tipo de distribuciones frecuentemente se da el caso de
que las más altas que la normal en las colas también lo son en el centro.
Igual que ocurre con el coeficiente de asimetría, el de curtosis también es

adimensional y su expresión es la siguiente:
Para calcular m4 se utiliza la expresión del Apéndice del final de este capítulo:
El coeficiente de curtosis de la distribución normal es nulo, de tal forma que:
 Si la distribución es mesocúrtica o igual de apuntada que la normal: g2 = 0.

 Si la distribución es platicúrtica o menos apuntada que la normal2 : g2 < 0.
 Si la distribución es leptocúrtica o más apuntada que la normal: g2 > 0.
Gráfico 2.4.
Las denominaciones de mesocúrtica, platicúrtica y leptocúrtica fueron dadas

originariamente porque entre ciertas distribuciones simétricas regulares se podía
percibir que las que tenían frecuencias relativas más elevadas en las colas eran
también las que tenían mayores frecuencias relativas en la parte central.
Evidentemente, esto no tiene por qué ocurrir para otro tipo de distribuciones
simétricas o para las asimétricas y, aunque la nomenclatura anterior es útil, debe
ser entendida como que describe el signo del coeficiente de apuntamiento más
que la forma de la distribución.
Algunas particularidades importantes relativas al coeficiente de apuntamiento son

las siguientes:
1. El coeficiente de apuntamiento es siempre mayor que – 2.
Considérese la desigualdad de Cauchy
salvo que ai y bi sean proporcionales, en cuyo caso la relación es de igualdad.
Hágase
Entonces, se tiene que
siendo sólo la relación de igualdad cuando la distribución de frecuencias se

encuentra concentrada en dos valores.
Es decir,
y, por consiguiente,
2. En distribuciones regulares, simétricas y unimodales el coeficiente de

apuntamiento es siempre menor que 1,2.
3. Existe una relación entre los coeficientes de asimetría y apuntamiento, que

viene dada por
Recuadro: Ocultar
EJEMPLO 2.15
En una empresa con 150 empleados, el número de horas extraordinarias/año de
los mismos sigue la distribución expuesta en las dos primeras columnas de la
tabla:
Determínense los coeficientes de asimetría y curtosis.
Los momentos m3 y m4 se calculan en función de los momentos respecto al

origen, utilizando las expresiones del Apéndice de este capítulo.
El coeficiente de asimetría de Fisher es:

y la distribución es asimétrica positiva o a la derecha.
Por otra parte, el coeficiente de curtosis resulta:
y la distribución es leptocúrtica (más apuntada que la normal).
2.5. BOX AND WHISKER PLOTS (GRÁFICOS DE CAJA Y

BIGOTES)
Un box and whisker plot permite determinar fácilmente de forma visual la
tendencia central, la variabilidad, la asimetría y la existencia de valores anómalos
en una distribución de frecuencias.
Un box and whisker plot incluye las siguientes características de la distribución

(véase Ejemplo 2.16):
1. Box (caja): la línea interior de la caja representa la mediana, la de la izquierda el primer

cuartil y la de la derecha el tercer cuartil. La caja, que recoge el 50% de las observaciones
centrales de la distribución, se determina uniendo los extremos de estas tres líneas por
dos segmentos paralelos.
2. Whiskers (bigotes): la observación más grande (pequeña) que no se aleja más de 1,5
veces el recorrido intercuartílico (C3 – C1) desde el tercer (primer) cuartil se encuentra
unida a la caja por el denominado whisker derecho (izquierdo).
3. Valores sospechosos de ser anómalos (o): los puntos que sobrepasan los extremos de
los whiskers pero no están a más de 3 veces el recorrido intercuartílico desde el lado
derecho (izquierdo) de la caja.
4. Valores anómalos (*): puntos que se alejan del lado derecho (izquierdo) de la caja 3 o
más veces el recorrido intercuartílico.
Como ya se ha visto, la mediana proporciona una idea de la tendencia central de

la distribución y el recorrido intercuartílico indica la variabilidad de la misma (a
mayor/menor recorrido intercuartílico mayor/menor variabilidad).
La proximidad de la mediana a los extremos de la caja y la longitud de

los whiskers indicarán la asimetría de la distribución: si la asimetría es a derechas
la mediana estará próxima al extremo de la derecha de la caja y/o la longitud
del whisker derecho será mayor que la del izquierdo. Si la asimetría es a
izquierdas, la mediana estará próxima al extremo izquierdo de la caja y/o la
longitud del whisker izquierdo será mayor que la del derecho. Si la distribución es
simétrica, la mediana se ubicará en el centro de la caja y los whiskers serán
simétricos respecto de la mediana.
Los extremos de los whiskers representan los valores más grandes y más
pequeños de la distribución que no son considerados anómalos. Los valores
sospechosos de ser anómalos deberán ser considerados con prudencia y los
anómalos pueden no considerarse como pertenecientes a la distribución en
cuestión.
Recuadro: Ocultar
EJEMPLO 2.16
Se dispone de la distribución sobre las bajas laborales (en días) de los
trabajadores de una empresa (véase la tabla de la página siguiente).
Si se observa el Gráfico 2.5, la mediana es de 2 días de baja laboral, no

pudiéndose considerar excesiva la dispersión de la distribución ya que el recorrido
intercuartílico es también 2. La asimetría de la distribución es hacia la derecha ya
que la longitud del whisker derecho es mayor que la del izquierdo (g1 = 1,506).
La longitud de los whiskers es, como máximo, de 1,5 veces el recorrido

intercuartílico (1,5 x 2 = 3) desde ambos extremos de la caja, es decir, los valores
que no son considerados

Gráfico 2.5. Box and whisker plot.
anómalos son los comprendidos entre – 2 y 6. En este caso, como la variable no

toma valores negativos ni tampoco el valor 6, se consideran como mínimo y
máximo valor no anómalos de la distribución el 0 y el 5, respectivamente.
Por otra parte, existe un valor sospechoso de ser anómalo, el correspondiente a la

observación 30 (x = 7), pues sobrepasa al whisker derecho y está entre 1,5 y 3
veces el recorrido intercuartílico desde el extremo derecho de la caja.
Finalmente, existen dos valores anómalos, que son los correspondientes a las
observaciones 31 y 32 (x = 9 y x = 10), ya que se alejan más de 3 veces el
recorrido intercuartílico desde el extremo derecho de la caja.
Como ya se había avanzado, el valor sospechoso de ser anómalo deberá ser

considerado con prudencia, mientras que los dos anómalos pueden ser
considerados no representativos de la distribución.
APÉNDICE. MOMENTOS POTENCIALES

Los momentos de una distribución son valores característicos de la misma
deducidos a partir de todos los valores de la distribución, de modo que si dos
distribuciones son iguales, todos sus momentos son también iguales.
Los momentos potenciales se definen como:

donde c es un número real cualquiera y r el orden del momento.
En función de los valores que tome c, se pueden considerar dos tipos de

momentos: momentos respecto al origen y momentos respecto a la media
aritmética o momentos centrales.
A) MOMENTOS RESPECTO AL ORIGEN

Generalmente se representan por ar y se obtienen cuando c = 0, es decir,
Los primeros momentos respecto al origen son:
B) MOMENTOS RESPECTO A LA MEDIA ARITMÉTICA O

MOMENTOS CENTRALES
Se representan por mr y se obtienen cuando , por lo que
Los primeros momentos centrales son

A efectos prácticos, una cuestión relevante de los momentos centrales es que se
pueden expresar, utilizando el binomio de Newton3 , en función de los momentos
respecto al origen:
Casos particulares
1 La representación gráfica de la distribución normal es una campana (campana

de Gauss) que se caracteriza por ser simétrica respecto al eje de abscisas. El
coeficiente de apuntamiento de este tipo de distribuciones, tal y como se ha
definido, es nulo.
2 No obstante, como se verá posteriormente, este coeficiente no puede tomar

valores inferiores a – 2.

Distribución de Frecuencias

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Distribución de Frecuencias

Cargado por

Copyright:

Formatos disponibles

Página 41 | Inicio del artículo

2.3.1. MEDIDAS DE DISPERSIÓN ABSOLUTAS

Se define como la diferencia entre el máximo y mínimo valor de la variable:

En el ejemplo anterior, el recorrido de la distribución de la empresa A es 270 euros

Recorrido o rango intercuartílico

Para evitar el problema de los valores anómalos, se suele emplear el denominado

donde el intervalo de longitud RI contiene el 50% de lo valores centrales de la

Diferencia media de Gini

Página 42 | Inicio del artículo

B Medidas de dispersión obtenidas por comparación entre los valores de la

Si lo que se pretende es analizar la mayor o menor representatividad de los

Para determinar la mayor o menor separación entre los valores de la variable y la

sin embargo, por la primera propiedad de la media aritmética, esta expresión es

La varianza mide la mayor o menor dispersión de los valores de la variable

Las propiedades de la varianza son las siguientes:

1. La varianza siempre es mayor o igual a cero.

Página 43 | Inicio del artículo

2. La varianza se puede expresar como:

3. Si de un conjunto de valores se pueden obtener dos o más subconjuntos

Página 44 | Inicio del artículo

La varianza del conjunto total será

Ya se vio que es la media total de los k grupos

De la misma forma se podría expresar

O, en otros términos, como

ya que la media de la distribución de medias grupales es la media de la variable.

Página 45 | Inicio del artículo

Si yi = xi ± b, la varianza de la variable y será

Si yi = axi, la varianza de la variable y será

6. Teniendo en cuenta las dos propiedades anteriores, si a una variable se le

Desviación típica o estándar

La varianza viene expresada en las mismas unidades de medida que la variable

Página 46 | Inicio del artículo

Se define la desviación típica como la raíz cuadrada con signo positivo de la

Las propiedades de la desviación típica se deducen directamente de las de la

1. La desviación típica siempre es mayor o igual que cero.

2. La desviación típica también puede expresarse como

3. A la desviación típica no le afectan los cambios de origen: si yi = xi ± b, entonces

4. A la desviación típica le afectan los cambios de escala: si yi = axi, entonces

5. Si a una variable se le aplica un cambio de origen b y un cambio de escala a, la

6. La desviación típica, igual que la varianza, es una medida de dispersión óptima.

Página 47 | Inicio del artículo

El núimero medio de altas diarias, en miles, será

y su desviación típica, también en miles,

2.3.2. MEDIDAS DE DISPERSIÓN RELATIVAS

Para evitar estos inconvenientes, hay que poner en relación la medida de

Este coeficiente se define como el cociente entre la desviación típica y el valor

Se puede apreciar que:

Página 49 | Inicio del artículo

Procediendo de la misma manera que en el ejemplo anterior, el número medio de

y su variabilidad en torno a este valor medio, también en miles,

Para determinar cuál de las dos medias es más representativa, se procede al

Página 50 | Inicio del artículo

y se caracteriza porque su media es cero y su varianza uno, como puede

Como las unidades de medida de ambas distribuciones no son iguales, no se

En el caso de los salarios ofertados al individuo en cuestión, se tiene que

Página 51 | Inicio del artículo

y despejando se obtiene que

Página 52 | Inicio del artículo

La interpretación de este resultado es como sigue: el porcentaje del total de

— Entre están comprendidas, al menos, el 75% de las

— Entre están comprendidas, al menos, el 89% de las

2.4. MEDIDAS DE FORMA

2.4.1. MEDIDAS DE ASIMETRÍA