Está en la página 1de 3

¿Para qué sirven las medidas de dispersión?

En un estudio estadístico, a la hora de generalizar los datos de una muestra de una población las medidas

de dispersión son muy importantes ya que condicionan de manera directa el error con el que trabajemos. Así,

cuanta más dispersión recojamos en una muestra, más tamaño necesitaremos para trabajar con el mismo error.

Por otro lado, estas medidas nos ayudan a determinar si nuestros datos se alejan mucho del valor central.

Con ello, nos dan información de si este valor central es adecuado para representar la población de estudio. Esto

es muy útil para comparar distribuciones y comprender los riesgos en la toma de decisiones (1).

Estas medidas son muy útiles para comparar distribuciones y comprender los riesgos en la toma de

decisiones. A mayor dispersión, menos representativo es el valor central. Estas son las más utilizadas:

Las más utilizadas son:

1. Rango

En primer lugar, el rango está recomendado para una comparación primaria. De esta manera,

considera solo las dos observaciones extremas. Por eso se recomienda solo para muestras pequeña. Se

define como la diferencia entre el último valor de la variable y el primero.

Es la diferencia entre el mayor valor de los datos y el menor.

Re = Max {xi} - Min {xi}

La principal ventaja del rango es su fácil cálculo, aunque su valor es poco significativo, ya que sólo

tiene en cuenta los dos valores extremos.


2. Rango o Recorrido Intercuartílico

Es la diferencia entre el tercer cuartil y el primero, el rango donde se encuentra el 50% central de los

datos.

RI = Q3 - Q1

En ocasiones también se suele usar como valor la mitad del rango intercuartílico, hablando en este

caso de recorrido semi-intercuartil.

Estas dos primeras medidas de dispersión se suelen utilizar cuando el cálculo de la media no es posible

o ésta no es significativa (ver medidas de centralización)

Las siguientes medidas que vamos a analizar se basan en medir la diferencia de los datos con la media.

3. Desviación estadística

Por su parte, la desviación media indica dónde estarían concentrados los datos si todos estuvieran a la

misma distancia de la media aritmética. Consideramos la desviación de un valor de la variable como

la diferencia en valor absoluto entre ese valor de la variable y la media aritmética de la serie. Así pues,

se considera como la media aritmética de las desviaciones.

Por tanto, la varianza va a ser la media del cuadrado de la distancia de los valores de los datos a la

media.

∑(𝑥𝑖 −𝜇)2 ∑(𝑥𝑖 −𝑥̅ )2 ∗𝑓𝑖


Poblacional: 𝜎 2 = o 𝜎2 =
𝑁 𝑛

∑(𝑥𝑖 −𝑥̅ )2
Muestral: 𝜎 2 =
𝑛−1

4. Desviación Típica

Para muestras extraídas de la misma población, la desviación estándar es de las más utilizadas (1). Se

trata de la raíz cuadrada de la varianza.

∑(𝑥𝑖 −𝜇)2 ∑(𝑥𝑖 −𝑥̅ )2 ∗𝑓𝑖


Poblacional: 𝜎 = √ o 𝜎=√
𝑁 𝑛
2
∑(𝑥 −𝑥
̅)
Muestral: 𝑠 = √ 𝑛−1
𝑖

El hecho de realizar la raíz cuadrada tiene por objetivo que la medida de dispersión esté expresada en

la misma unidad que la variable.

5. Coeficiente de Variación (De Pearson)

Dado que la desviación típica es una medida que está expresada en las mismas unidades que la

variable, si queremos comparar dispersiones a escalas distintas necesitamos un parámetro

adimensional. En estas situaciones usaremos el coeficiente de variación que se expresa tanto de forma

decimal como en tanto por ciento, y nos expresaría la desviación típica como porcentaje con respecto

a la media.

𝑆
𝐶𝑉 =
𝑥̅

TALLER 2

Desarrollar los ejercicios de los hipervínculos (realizados en Yotube) con el Excel

Qué es la Desviación Estándar - Típica - YouTube

Varianza, Desviación Estandar y Coeficiente de Variación | Datos agrupados puntualmente -

YouTube

También podría gustarte