Está en la página 1de 15

Tema.5.Variabilidad. Concepto.

Principales
estadsticos: varianza, cuasivarianza y
desviacin tpica y cuasidesviacin.
Caractersticas. Otras medidas de variabilidad.
Medidas robustas de variabilidad.

Concepto de variabilidad
En el tema anterior vimos las medidas de tendencia
central (media, mediana, etc). Claramente, para
saber cun representativo es el valor de tal medida
de tendencia central es necesario tener una medida
de variabilidad.

Por ejemplo, alguien puede tener una media de 5


con los siguientes datos (5, 4, 6, 5, 5) y otro tener
una media de 5 con los datos (10, 0, 5, 9, 1).
Evidentemente el primer sujeto es mucho ms
consistente, muestra menos variabilidad.

Cmo podemos medir la


variabilidad?
Una primera estrategia sera emplear la frmula
n

X
i 1

X
n

El problema es que siempre vale cero....

X
i 1

X 0

Una segunda estrategia es emplear valores absolutos


n

X
i 1

Esta es la llamada Desviacin Media, cuyo problema es que lo


problemtico del uso de valores absolutos.
qu nos queda, pues? Emplear la suma de diferencias al cuadrado....Es
el primer paso para la varianza

Varianza
Frmula

s2

X
i 1

Como veremos en el segundo semestre (Estadstica inferencial), la


varianza es un estimador sesgado de la varianza poblacional; por ello se
prefiere el uso de la cuasivarianza que es igual que la varianza
excepto en que se divide por n-1; la cuasivarianza es un estimador
insesgado de la varianza poblacional:
n

2
s%

X
i 1

n 1

Desviacin tpica y cuasidesviacin


tpica
Frmulas

X
i 1

s%

X
i 1

n 1

Una ventaja obvia de la desviacin tpica sobre la varianza es que la


desviacin tpica viene dada en las mismas unidades de medida que los
datos originales (en la varianza las unidades estn al cuadrado).

Por eso, en estadstica descriptiva se suele dar la media acompaada


de la (cuasi)desv.tpica, ms que con la (cuasi)varianza.

NOTA: El SPSS cuando indica varianzas o desviaciones tpicas, en


realidad calcula cuasivarianzas y cuasidesviaciones tpicas

Algunas propiedades de la varianza y


desviacin tpica
1. La varianza y la desv. Tpica son valores
esencialmente positivos.
(Observad que las diferencias sobre la media estn
al cuadrado)
2. Ni la varianza ni la desv.tpica se alteran cuando a
los datos se les aade una constante a.
Yi a X i

Entonces, sabemos que

Y a X

Yi a X i

s y2

Y Y
i 1

Y a X

Entonces, sabemos que

(a X ) (a X )
i 1

X
i 1

X )

sx2

Claro est que lo mismo se aplica a la desv.tpica (y a la cuasivarianza y


la cuasidesv.tpica

3. Si los datos se multiplican por una constante a


cualquiera, la desv.tpica queda multiplicada por el
valor absoluto de dicha constante, y la varianza por
el cuadrado de dicha constante

Y aX

Yi aX i
n

s y2

Y Y
i 1

aX
i 1

i aX

s y a sx

a2 X i X )
i 1

a 2 sx2

4. Dados k grupos con n1, n2, ..., nk observaciones


2
2
2
X
X
s
s
s
1
2
X
con medias
, ,..., k y con varianzas 1 , 2 ,...., k
Se demuestra que la varianza del total de las n1+n2+...+nk=n
observaciones
es igual a la media ponderada de las varianzas parciales ms la varianza
ponderada de las medias parciales.
k

sT2

n s

2
j j

j 1

nj X j XT

j 1

Esta propiedad adquiere un sentido muy importante en el segundo


semestre: en la tcnica llamada Anlisis de Varianza (ANOVA). La idea es
que la varianza total se puede descomponer en un componente intra-grupo
(que es la primera parte de la expresin de arriba) y un componente entregrupos (que es la segunda parte de la expresin de arriba).

Otras medidas de variabilidad


1. Amplitud total (AT)
Es la diferencia entre los valores extremos

AT X max X min

Su ventaja es la sencillez de clculo; el problema es que es


nicamente sensible a los valores extremos (e insensible a los
intermedios).
2. Desviacin media (DM)
n

DM

X
i 1

El problema del empleo de la DM es la dificultad que tiene trabajar con


valores absolutos. La DM es poco frecuente encontrarla en la prctica.

Otras medidas de variabilidad


3. Amplitud semi-intercuartil (Q)
Est basada en el primer y tercer cuartil, lo que la hace un
estadstico resistente

Q3 Q1
2

Se emplea relativamente en alguna reas de la psicologa; se


suele emplear cuando la mediana sea el ndice de tendencia
central.

Cmo ver la variabilidad en un grfico


Si bien es posible emplear diferentes grficos para evaluar la variabilidad (y
tendencia central, asimetra, etc), es interesante el uso de los diagramas de
caja y bigotes.
La caja viene definida por el primer cuartil y el tercer cuartil, con la mediana
tambin indicada. Esto lo veremos en detalle en las prcticas.

Pero mejor veamos un ejemplo (Ratcliff, Perea, Colangelo y Buchanan, en


prensa, Brain & Cognition), en el que se examinan ciertas caractersticas en
una tarea de decisin lxica (decidir si un estmulo era palabra o no; se
mide el Tiempo de Reaccin) con un grupo de controles y un grupo de
personas con dao cerebral (afsicos).
Lo que se meda era
1) un ndice de cun conservador eran las personas en la tarea (boundary
separation)
2) un ndice correspondiente a procesos no-decisionales (non-decision
component).
3) un ndice correspondiente a la calidad de informacin (drift rate)

Cmo ver la variabilidad en un grfico (2)


La Mediana es el trazo grueso
dentro de las cajas (entre los
cuartiles primero y tercero).
Las puntuaciones atpicas estn
presentadas individualmente (ver
que hay dos tipos de datos
atpicos).

Observad que los controles son


claramente diferentes a los
pacientes en boundary separation
y en el non-decision component,
mientras que hay bastante ms
solapamiento en la calidad de
informacin.

Medidas robustas de variabilidad


1. La MEDA (Mediana de las diferencias absolutas frente a la
mediana)

MEDA mediana X i Md
Ejemplo de clculo: 3,4,4,5,5,6,7,8,9,11 (Md=5.5)

MEDA=1.5

Es la Mediana de 05, 05, 05, 15, 15, 15, 25, 25, 35, 55

Medidas robustas de variabilidad


2. La desviacin pseudotpica

Es un ndice de variabilidad que permite estimar la desviacin tpica (que como


sabemos es muy susceptible a la influencia de puntuaciones atpicas, como
tambin ocurre con la media aritmtica) que cabra esperar de la muestra si
sta perteneciera a una poblacin en el que la distribucin subyacente sea la
normal.

También podría gustarte