Está en la página 1de 11

DISPERSIÓN Y VARIABILIDAD

Las medidas de dispersión miden la variabilidad de la variable objeto de estudio,


que a su vez está relacionada de manera inversa con la representatividad de las
medidas resumen que se proporcionen. Cuanto más variabilidad tenga una
variable (más dispersión) peor será el resumen proporcionado por la medida
elegida (menos representatividad)

Medición de la dispersión

Medición de Medición de la
la variabilidad representatividad de
la medida resumen

Relación inversa con los errores


cometidos con respecto a ella

En lugar de trabajar con


Errores elevados poca representatividad
todos los errores cometidos,
por falta de operatividad, se Errores pequeños mucha representatividad
trabaja con una medida
resumen de los mismos
MEDIDAS DE DISPERSIÓN ABSOLUTAS. RECORRIDOS
Las medidas de dispersión más intuitivas son los recorridos. Su valor es
siempre mayor o igual que cero, y un aumento de valor significa, en
principio, una mayor variabilidad (y por tanto una mayor dispersión).

Recorrido: es la diferencia entre el valor máximo y el mínimo


R = X max − X min observado en la variable

Recorrido interpercentílico: es la longitud del intervalo


RP = P99 − P1 comprendido entre el Percentil 1 y el Percentil 99. Por tanto,
comprende al 98% de la distribución alrededor de la mediana,
dejando el 1% por la izquierda y el 1% por la derecha
Recorrido interdecílico: es la longitud del intervalo comprendido
RD = D9 − D1 entre el decil primero y noveno. Comprende al 80% de la
distribución alrededor de la mediana, dejando el 10% por debajo y
el 10% por encima
Recorrido intercuartílico: es la longitud del intervalo
RQ = Q3 − Q1 comprendido entre el cuartil primero y tercero. Comprende al
50% de la distribución alrededor de la mediana, dejando el
25% por debajo y el 25% por encima
MEDIDAS DE DISPERSIÓN ABSOLUTAS. VARIANZA
En general se suelen utilizar los errores con respecto a una medida resumen para
medir la dispersión de la variable, de manera que, después de calcular dichos
errores, es necesario proporcionar una única medida resumen de los mismos.
ei = X i − a i = 1,..., k

DESVIACIÓN MEDIA: se toma A priori el signo del error no es


el valor absoluto de los errores importante (error por exceso o por
y luego se calcula su media defecto), de manera existen dos
aritmética opciones
k
DM ( a ) = X − a = ∑ xi − a ⋅ f i
i =1
ERROR CUADRÁTICO MEDIO: se
toma el cuadrado de los errores y
luego se calcula su media
VARIANZA: es el error cuadrático aritmética
k
medio calculado con respecto a la
ECM ( a ) = ( X − a ) = ∑ ( X i − a ) ⋅ fi
2 2

media i =1
k
S X2 = ECM ( x ) = ( X − x ) = ∑ ( X i − x ) ⋅ f i
2 2

i =1
MEDIDAS DE DISPERSIÓN ABSOLUTAS. PROPIEDADES

•Al promediar valores no negativos son siempre mayores o iguales


que cero
•Se anulan si la variable es degenerada (toma un único valor)
•Mayores valores significan una mayor dispersión (mayor variabilidad
y menor representatividad de la medida resumen)
•La desviación media se mide en las mismas unidades que la
variable, y la varianza en sus cuadrados

•Forma de cálculo de la varianza:


k k
S = ∑ ( xi − x ) ⋅ f i = ∑ ( xi 2 + x 2 − 2 ⋅ xi ⋅ x ) ⋅ f i =
2 2

i =1 i =1
k k k k
= ∑ ( xi ⋅ fi + x ⋅ fi − 2 ⋅ xi ⋅ x ⋅ f i ) = ∑ xi ⋅ f i + ∑ x ⋅ f i − ∑ 2 ⋅ xi ⋅ x ⋅ fi =
2 2 2 2

i =1 i =1 i =1 i =1
k k k
= ∑ xi ⋅ fi + x ⋅ ∑ fi − 2 ⋅ x ⋅ ∑ xi ⋅ f i = x 2 + x 2 − 2 ⋅ x ⋅ x = x 2 − x 2
2 2

i =1 i =1 i =1
VARIANZA Y DESVIACIÓN TÍPICA

•Comportamiento de la varianza ante cambio de origen y de escala


Y = a +b⋅ X

( ) = ( b ⋅ ( x − x ) ) = b2 ⋅ ( x − x ) =
2
S = ( y − y) = a +b⋅ x − a −b⋅ x
2 2 2 2
Y

= b ⋅ ( x − x ) = b 2 ⋅ S X2
2 2
El cambio de origen no afecta a la varianza, y
el cambio de escala la aumenta si es mayor
que uno en valor absoluto, y la disminuye si
es menor que uno en valor absoluto.

La principal desventaja de la Al estar en las unidades de la variable


al cuadrado no permite establecer una
varianza nace de trabajar con
comparación con la media
los cuadrados de los errores

El trabajar con cuadrados Para corregir este problema se


magnifica los errores grandes y
define la DESVIACIÓN TÍPICA O
minimiza los errores pequeños
ESTÁNDAR
S X = + S X2
PROPIEDADES DE LA DESVIACIÓN TÍPICA
PROPIEDADES:
Es siempre mayor o igual que cero al ser la raíz cuadrada positiva de la varianza
Sólo se anula cuando se anula la varianza (es decir, si la variable es degenerada)
Se define en las mismas unidades de la variable
Su comportamiento ante cambios de origen y escala es como el de la varianza

Y = a +b⋅ X El cambio de origen no afecta a la desviación


var (Y ) = b 2 ⋅ var ( X ) típica. El cambio de escala la aumenta si es
mayor que uno en valor absoluto, y la
desv.est. (Y ) = b ⋅ desv.est. ( X ) disminuye en caso contrario

La desviación típica tiene las mismas x = 10kg S X = 1kg


unidades de la variable, con lo cual no es y = 1000cm SY = 10cm
válida para establecer comparaciones entre
distintas distribuciones SY > S X ⇒ mayor dispersion?

SX 1 Solución: relativizar el significado de la


CVX = = = 0.1
x 10 desviación típica relacionándolo con el
S 10 valor de la media
CVY = Y = = 0.01
y 1000
MEDIDAS DE DISPERSIÓN RELATIVAS
COEFICIENTE DE No tiene unidades, por lo que permite
VARIACIÓN: se define establecer comparaciones entre distintas
como el cociente entre la distribuciones
desviación típica y la media A mayor coeficiente de variación, mayor
CV = S X x dispersión relativa (en relación a la propia
media de la distribución)
Y = b⋅ X b>0
S b ⋅ SX SX Es invariante ante cambios
CVY = Y = = = CVX de escala positivos y varía
y b⋅ x x
Y = a +b⋅ X b > 0 ante cambios de origen
(disminuye si se le suma una
 b ⋅ SX SX
< = = CVX a>0 constante y aumenta si se le
SY b ⋅ S X  b⋅ x x
CVY = =  resta)
y a +b⋅ x  b ⋅ SX SX
> = = CVX a<0
 b⋅ x x

VARIABLE TIPIFICADA O TÍPICA: No tiene unidades


mide cuántas desviaciones típicas dista Su media es nula y su
un valor de la variable de su media desviación típica es 1
Z X = ( X − x ) SX
SIMETRÍA Y MEDIDAS CENTRALES
Si la distribución es simétrica y unimodal (con una única
moda), el centro de simetría debe coincidir con la moda.
Por tanto, si existe la esperanza, en caso de
distribuciones simétricas y unimodales, el centro de
simetría coincide con la media, la mediana y la modal.
Si hubiera más de una moda, deben estar situadas de
manera equidistante con respecto al centro de simetría
(la mediana o la media, si existe).
Si la distribución tiene más peso en su parte derecha se dice que es
ASIMÉTRICA LA DERECHA y si tiene más peso en su parte izquierda se
dice que es ASIMÉTRICA A LA IZQUIERDA.
Dist. Simétrica y unimodal: M = media
Dist. Asimétrica a la M < media
derecha y unimodal:
Dist. Asimétrica a la M > media
izquierda y unimodal:

M ≤m≤ x x ≤m≤M
COEFICIENTES DE ASIMETRÍA
media − Moda
Coeficiente de Asimetría de Pearson: CAP =
desv.tipica
Es un coeficiente sin unidades. No
cambia ante cambios de origen y de En el caso de simetría es nulo,
escala positivos. Ante cambios de si hay asimetría a la derecha
escala negativos cambia de signo. es positivo y si hay asimetría a
la izquierda es negativo.

Si una distribución es simétrica respecto a la


media, los posibles valores de la variable son
equidistantes por parejas respecto de la media,
y dichos valores son tomados con la misma
probabilidad (o frecuencia). Por tanto, los
errores por exceso se compensan con los x1 x2 x3 x x4 x5 x6
errores por defecto
e1 = x1 − x < 0 e6 = x6 − x > 0 e1 = −e6 f1 = f 6
e2 = x2 − x < 0 e5 = x5 − x > 0 e2 = −e5 f 2 = f5
e3 = x3 − x < 0 e4 = x4 − x > 0 e3 = −e4 f3 = f 4
∑e ⋅ f
i
i i = 0 ⇔ ∑ ei ⋅ ni = 0 ⇔ e = 0
i
COEFICIENTES DE ASIMETRÍA
El error total (o medio) cometido
con respecto a la media es
Para obtener un coeficiente sin siempre nulo. Como es
unidades se divide este error necesario trabajar con los
cúbico por el cubo de la signos de los errores, si la
desviación típica (ambas distribución es simétrica
medidas tienen las mismas respecto a la media, se verifica
unidades) y se define el que las medias de las potencias
COEFICIENTE DE ASIMETRÍA impares de los errores serán
DE FISHER: nulas. En concreto, la media de
orden 3.

∑ ( xi − x )
3
⋅ fi
e3 = 0 ⇔ ∑ ei3 ⋅ fi = 0 ⇔ ∑ ( xi − x ) ⋅ fi = 0
3
g1 = i

S X3 i i

Este coeficiente no se ve afectado por cambios de


origen ni de escala positivos. Si el cambio de escala
es negativo, cambia de signo.
COEFICIENTES DE ASIMETRÍA

Si la distribución es asimétrica a la derecha,


tienen más peso los errores por exceso y, por
tanto, la media cúbica de los errores será
positiva
Si la distribución es asimétrica a la izquierda,
tienen más peso los errores por defecto y, por
tanto, la media cúbica de los errores será
negativa

Simetría: c.a.Fisher nulo


Como la desviación típica es
siempre positiva, el signo del Asimetría a la derecha: c.a.Fisher positivo
coeficiente depende del Asimetría a la izquierda: c.a.Fisher negativo
signo del numerador

También podría gustarte