Está en la página 1de 4

CAP 5: ÍNDICES DE VARIABILIDAD Y SESGO O ASIMETRÍA

INTRODUCCIÓN

“El asunto central de las ciencias de la vida es el estudio de la variación. ¿En que grado los
individuos o grupos de individuos difieren unos de otros? ¿Cuáles son las razones de la
variabilidad? ¿Se puede controlar o manipular la variabilidad?”
La variabilidad que se observa en cualquier organismo es una propiedad que refleja el hecho
incuestionable de las diferencias individuales. Una de las labores del investigador será
descubrir las fuentes de dicha variabilidad. Pero antes habrá de cuantificarla y para ello
cuenta con una serie de índices.

ÍNDICES DE VARIABILIDAD

Muchas veces, necesitamos disponer de información sobre en qué medida las puntuaciones
en una determinada variable están próximas o alejadas del índice de tendencia central que
representa a la distribución.

AMPLITUD TOTAL
La amplitud total, AT, de un conjunto de puntuaciones es la distancia que hay en la escala
numérica entre los valores que representan la puntuación máxima y la puntuación mínima. Es
decir:
AT = Xmax – Xmin
Hay que distinguir entre dos tipos de amplitud total:
1. La amplitud total excluyente, que toma los valores informados
2. La amplitud total incluyente, que toma los valores reales.

Este índice tiene el inconveniente de tomar en consideración sólo dos puntuaciones: la mas
alta y la mas baja, por lo que, siempre que estas permanezcan constantes, es insensible a
las variaciones del resto de puntuaciones. La amplitud total también suele ser denominada
rango o recorrido.

AMPLITUD SEMI-INTERCUARTIL
La amplitud semi-intercuartil, Q, o rango semi-intercuartil es la distancia media entre el
tercer y el primer cuartil.
La amplitud semi-intercuartil es un índice muy útil cuando las distribuciones presentan
valores extremos, con los consiguientes efectos de asimetrización. En el ámbito de la
psicología, este índice se utiliza con frecuencia, sobre todo cuando se quiere evaluar la
variabilidad de características en las que el índice de centralidad mas adecuado es la
mediana en lugar de la media. Es el caso, por ejemplo, de la evaluación y selección de ítems
en las escalas de actitudes. A este índice de variabilidad se le conoce también como índice
de ambigüedad.
DESVIACIÓN MEDIA
Es la media de las diferencias en valor absoluto de n puntuaciones respecto de su media
aritmética.
El hecho de que en este índice se tomen las diferencias en valor absoluto de cada
puntuación respecto de la media aritmética se deriva de la primera propiedad de este
índice de tendencia central.
Este no es un índice de variabilidad muy empleado, porque los valores absolutos son poco
manejables matemáticamente, y apenas hay técnicas de análisis estadístico que estén
basadas en él.

VARIANZA Y DESVIACIÓN TÍPICA


Otra solución a la descripción de la variabilidad de una distribución consiste en establecer
un promedio de las diferencias de cada puntuación respecto a su media, pero elevadas al
cuadrado, ya que la suma de las diferencias de cada puntuación respecto a su media es cero
(primera propiedad de la media). Al índice así definido se le denomina varianza, y se
representa por S2. habitualmente, y sobre todo cuando se consideran varias variables, suele
acompañarse como subíndice el nombre de la variable considerada.

Cálculo
Cuando los datos están agrupados en intervalos, la varianza es la media, ponderada por la
frecuencia, de las diferencias cuadráticas del punto medio de cada intervalo respecto a la
media aritmética del conjunto de puntuaciones.
Cuando un estudiante se acerca por primera vez al concepto de varianza, el resultado le
puede sugerir una total falta de relación entre el valor que se obtiene y los datos de la
distribución sobre la que se calcula. La razón de esta aparente falta de relación es que la
distancia de los puntos medios de cada intervalo a la media está elevada al cuadrado , para
evitar el inconveniente de la primera propiedad de la media aritmética. Esto significa que la
varianza está expresada en términos del cuadrado de las unidades en que está medida la
variable (si la variable está medida, por ejemplo, en gramos, la varianza estará expresada
en gramos al cuadrado). Para retornar a las unidades originales se extrae la raíz cuadrada
de la varianza, obteniendo así un índice que sí está expresado en las unidades originales en
que fuera medida la variable. Este índice se conoce como desviación típica o desviación
estándar (Sx).
La varianza, por ser un índice definido en función de las distancias cuadráticas de cada
puntuación respecto de la media, solo puede tomar valores positivos. El valor mínimo de la
varianza es cero, y este valor se obtendrá solo cuando todas las puntuaciones sean iguales.
Para la desviación típica, al ser la raíz cuadrada de la varianza, se toma siempre su valor
positivo, pues de lo que informa este índice es de distancias, y no tiene sentido hablar de
distancias negativas.
En el tema anterior se mencionó que la media muestral es el mejor estimador de la
tendencia central de la población de la que se ha extraído la muestra. En cambio, para el
caso de la varianza poblacional, su mejor estimador es la cuasivarianza. Para el calculo de la
cuasivarianza, tomaremos el sumatorio de las diferencias de cada puntuación con respecto
a su media elevadas al cuadrado, pero dividido por n –1.
Para las mismas muestras, la cuasivarianza será siempre mayor que la varianza. No
obstante, a medida que el tamaño de las muestras aumenta, los valores de ambos índices
son muy similares (par muestras, por ejemplo, de tamaño 100 la cuasivarianza es 1’010101
veces mayor que la varianza).
Propiedades de la varianza y la desviación típica
1. si a un conjunto de puntuaciones medidas en la variable X se le suma una constante
a, la varianza y la desviación típica de las nuevas puntuaciones es idéntica a la
varianza y la desviación típica de las puntuaciones originales.
2. si a un conjunto de puntuaciones medidas en la variable X se le multiplica por una
constante b, la varianza de las nuevas puntuaciones es igual a la varianza de las
puntuaciones originales multiplicada por el cuadrado de b. Es decir, si
Yi = b · Xi
Entonces,
Sy2 = b2 · Sx2
Por consiguiente la desviación típica será:
Sy = b· Sx
La razón de tomar el valor absoluto es que, en el caso de que b < 0, la desviación
típica de las puntuaciones transformadas tendría un valor negativo, y como ya se ha
señalado, no tiene sentido hablar de desviaciones típicas negativas.

Estas dos propiedades se pueden resumir en una sola: si X es una variable, con varianza S x2,
la varianza de una nueva variable Y que es una transformación lineal de X, es decir,
Y = bXi +a
será:
Sy2 = b2Sx2
3. La varianza y la desviación típica, por depender de la media, son sensibles a la
variación de cada una de las puntuaciones. Cuando las puntuaciones están agrupadas
en intervalos, la varianza y desviación típica están en función de los intervalos
elegidos (de su amplitud y de sus limites).
4. La varianza total de r grupos de puntuaciones, de los que se conoce el tamaño n j, la
media y la varianza es igual a la media ponderada de las varianzas mas la varianza
ponderada de las medias.

COEFICIENTE DE VARIACIÓN
La desviación típica viene expresada en la unidad en que se haya medido una característica
concreta. Si se comparan la variabilidad de dos muestras mas o menos homogéneas en
cuento a la composición de sus miembros, el empleo de la varianza o de la desviación típica
no plantea ningún inconveniente. El problema surge cuando se trata de comparar
características muestrales de distinta naturaleza. No se puede, por ejemplo, comparar la
variabilidad de la altura, expresada en centímetros, con la variabilidad del peso, expresada
en gramos. Una desviación típica de 3 cm no es mayor, igual ni menor que otra de 3 gramos.
Incluso cuando se mide la misma característica en dos muestras de diferente naturaleza,
tampoco tiene sentido comparar la variabilidad mediante la varianza o la desviación típica.
Imaginemos una muestra de 100 mariposas y otra de 100 osos. Una misma desviación típica
de, por ejemplo, 5 gramos en los dos grupos, implicaría que los osos tienen prácticamente el
mismo peso sin que apenas exista variabilidad y para las mariposas, por su parte, la
variabilidad seria tan alta que alguna de ellas podría parecer un oso. Por tanto, la
comparación de las desviaciones típicas de la misma variable en grupos de distinta
naturaleza resulta siempre equivoca.
Una forma de comparar variabilidades de características de diferente naturaleza, o de la
misma naturaleza en diferentes grupos, es tomar como medida de variabilidad el cociente
entre la desviación típica y la media. El resultado de este cociente es un numero abstracto
que indica el numero de veces que el numerador (la desviación típica) contiene al
denominador (la media), con independencia de la unidad en que haya sido medida la variable.
A este índice así obtenido, multiplicado por cien, se le denomina coeficiente de variación.

ÍNDICES DE SESGO O ASIMETRÍA

La representación grafica de una distribución de frecuencias permite detectar si es


simétrica o presenta algún grado de asimetría. Si la distribución es simétrica, la media, la
mediana y la moda coinciden, y también las distancias entre los cuartiles. Si la distribución
es asimétrica, estos valores difieren. Pues bien, sobre esta base se pueden construir
algunos índices que permiten cuantificar el grado de asimetría de una distribución dada.
Además, todos los índices de asimetría que vamos a tratar son adimensionales, es decir, no
tienen unidad de medida, por lo que pueden ser utilizados para comparar el grado de
asimetría de distribuciones diferentes.

ÍNDICE DE ASIMETRÍA INTERCUATÍLICO


Si una distribución es simétrica, la distancia que hay entre el primer y el segundo cuartil es
idéntica a la que hay entre el segundo y el tercer cuartil:
Q3 – Q 2 = Q 2 – Q 1
En las distribuciones con asimetría positiva Q 3 – Q2 > Q2 – Q1, y en las de asimetría negativa
Q3 – Q2 < Q2 – Q1, la diferencia aumentará a medida que aumente el grado de asimetría. Si
se toma como diferencia de variación el rango intercuartílico Q 3 – Q1, se obtiene el índice
de asimetría (As) intercuatílico.
Si la distribución tiene asimetría positiva , el índice de asimetría es mayor que cero: A s > 0.
Si tiene asimetría negativa, es menor que cero: A s < 0. y si es simétrico, es igual que cero:
As = 0. además, por su propia construcción, este índice sólo puede tomar valores en el
intervalo (-1, +1), ya que al tender a cero las diferencias entre dos cuartiles consecutivos,
(Q3 – Q2) o ( Q2 – Q1) el cociente tiende a –1 o a +1, respectivamente. Una ultima propiedad
de este índice es que su valor es invariante frente a transformaciones lineales de las
puntuaciones originales.

ÍNDICE DE ASIMETRÍA DE PEARSON


Este índice se basa en la relación entre la media y la moda. Se define como la resta de la
moda a la media, dividido por la desviación típica.
Este índice sólo se puede calcular cuando la distribución es unimodal.

ÍNDICE DE ASIMETRÍA DE FISHER


Este índice se basa en las distancias de las puntuaciones respecto de su media, elevadas al
cubo, por lo que su valor puede ser positivo, negativo o cero. Su definición es el sumatorio
del las diferencias de cada puntuación respecto de su media elevadas al cubo, partido por n
multiplicado por la desviación típica al cubo, para datos no agrupados.
Al tomar en consideración todas y cada una de las puntuaciones es el mejor de los índices
de asimetría. Su valor, igual que los anteriores índices, será 0 si la distribución es
simétrica, menor que 0 si la distribución es asimétrica negativa y mayor que cero si la
asimetría es positiva.

También podría gustarte