Está en la página 1de 7

Medidas de Dispersión

Medidas de dispersión

Las medidas de dispersión o variabilidad son números que miden el grado de separación de los datos con
respecto a un valor central, que generalmente es la media aritmética.
Las principales medidas de dispersión son: el rango, el rango intercuartil, la varianza, la desviación estándar, y el
coeficiente de variación.

1. Rango o recorrido de una variable (𝑹)


Definición.- El rango de variación o recorrido, 𝑅, de una serie de datos, es la diferencia entre sus valores máximo
y mínimo. Esto es:
𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛
siendo 𝑥𝑚á𝑥 el valor máximo y 𝑥𝑚í𝑛 el valor mínimo.
El rango es una medida de dispersión muy fácil de calcular, pero muy inestable, ya que sólo depende de los dos
valores extremos. Su valor puede cambiar grandemente si se añade o elimina un sólo dato. Por tanto su uso es
muy limitado.

Cálculo del rango

A. Rango para datos no agrupados

Primero se ordenan los datos en forma creciente y luego se calcula usando la definición.

EJEMPLO: Calcular el rango de los 12 salarios de los trabajadores de una empresa (en dólares)

54 37 63 65 71 73 49 55 54 61 71 45

Solución:

37 45 49 54 54 55 61 63 65 71 71 73

𝑅 = 73 − 37 = 36

A. Rango para datos agrupados


B1. Rango para datos agrupados de variable cuantitativa discreta

Primero se ordenan los datos en forma creciente y luego se calcula usando la definición.

Ejemplo: Hallar el rango de la distribución de frecuencias del número de hijos por familia

𝒙𝒊 𝒇𝒊
0 1
1 4
2 7
3 6
4 2
Total 20
Solución:

𝑥: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 ℎ𝑖𝑗𝑜𝑠 𝑝𝑜𝑟 𝑓𝑎𝑚𝑖𝑙𝑖𝑎

𝑅 =4−0 =4
B2. Rango para datos agrupados por intervalos

Hay dos formas de hallar el rango, la primera es usando las marcas de clase y la segunda usando el límite inferior
del primer intervalo y el límite superior del ultimo intervalo.

Ejemplo: Hallar el rango de una muestra de 45 salarios quincenales agrupados en la siguiente distribución de
frecuencias:

Intervalos mi fi
[26,34[ 30 1
[34,42[ 38 2
[42,50[ 46 4
[50,58[ 54 10
[58,66[ 62 16
[66,74[ 70 8
[74,82] 78 4
Total 45
Solución

𝑅1 = 78 − 30 = 48

𝑅2 = 82 − 26 = 56

2. Rango Intercuartil (𝑹𝑰)

Definición.- El rango intercuartil 𝑅𝐼, es el número que resulta de la diferencia entre sus cuartiles tercero y
primero. Esto es,

𝑅𝐼 = 𝑄3 − 𝑄1 = 𝑃75 − 𝑃25

El rango intercuartil es una medida que excluye el 25 % más alto (cuarto superior) y el 25 % más bajo (cuarto
inferior), dando un rango dentro del cual se encuentra el 50% central de los datos observados y a diferencia del
rango de los datos no se encuentra afectada por los valores extremos.

Si el rango intercuartil es muy pequeño entonces describe alta uniformidad o pequeña variabilidad de los valores
centrales.

NOTA. Si la distribución de frecuencias tiene marcada asimétrica, el rango intercuartil es preferible a la desviación
estándar como medida de la dispersión.

Cálculo del Rango Intercuartil

A. Rango Intercuartil para datos no agrupados

Primero se ordenan los datos en forma creciente y luego se calcula usando la posición del percentil.

EJEMPLO: Calcular el rango intercuartil de los 12 salarios de los trabajadores de una empresa (en dólares)

54 37 63 65 71 73 49 55 54 61 71 45

Solución:

37 45 49 54 54 55 61 63 65 71 71 73

12(25) 49 + 54
𝑃𝑜𝑠(𝑃25 ) = + 0.5 = 3.5 ⇒ 𝑃25 = = 51.5
100 2
12(75) 65 + 71
𝑃𝑜𝑠(𝑃75 ) = + 0.5 = 9.5 ⇒ 𝑃75 = = 68
100 2

𝑅𝐼 = 68 − 51.5 = 16.5

B. Rango Intercuartil para datos agrupados


B1. Rango Intercuartil para datos agrupados de variable cuantitativa discreta

Primero se ordenan los datos en forma creciente y luego se calcula los percentiles usando la posición de cada
percentil.

Ejemplo: Hallar el rango intercuartil de la distribución de frecuencias del número de hijos por familia

𝒙𝒊 𝒇𝒊 𝑭𝒊
0 1 1
1 4 5
2 7 12
3 6 18
4 2 20
Total 20
Solución:

𝑥: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 ℎ𝑖𝑗𝑜𝑠 𝑝𝑜𝑟 𝑓𝑎𝑚𝑖𝑙𝑖𝑎

20(25) 1+2
𝑃𝑜𝑠(𝑃25 ) = + 0.5 = 5.5 ⇒ 𝑃25 = = 1.5
100 2
20(75) 3+3
𝑃𝑜𝑠(𝑃75 ) = + 0.5 = 15.5 ⇒ 𝑃75 = =3
100 2

𝑅𝐼 = 3 − 1.5 = 1.5

B2. Rango Intercuartil para datos agrupados por intervalos

Primero se ordenan los datos en forma creciente y luego se calcula usando la posición del percentil.

Ejemplo: Hallar el rango intercuartil de una muestra de 45 salarios quincenales agrupados en la siguiente
distribución de frecuencias:

Intervalos mi fi Fi
[26,34[ 30 1 1
[34,42[ 38 2 3
[42,50[ 46 4 7
[50,58[ 54 10 17
[58,66[ 62 16 33
[66,74[ 70 8 41
[74,82] 78 4 45
Total 45
Solución

45(25)
45(25) −7
𝑃𝑜𝑠(𝑃25 ) = + 0.5 = 11.75 ⇒ 𝑃25 = 50 + 100 (8) = 53.4
100 10
45(75)
45(75) − 33
𝑃𝑜𝑠(𝑃75 ) = + 0.5 = 34.25 ⇒ 𝑃75 = 66 + 100 (8) = 66.75
100 8

𝑅𝐼 = 66.75 − 53.4 = 13.35


3. Varianza (𝑺𝟐 )

Definición.- La varianza se define como la media aritmética de los cuadrados de las diferencias de los datos con
respecto a su media aritmética.

La varianza es una medida de dispersión con unidades de medición al cuadrado, por ejemplo, $2 , 𝐾𝑚2 , etc.

4. Desviación estándar (𝑺)

Definición.- La desviación estándar es la raíz cuadrada positiva de la varianza, Esto es:

𝑆 = √𝑆 2

Cálculo de la varianza

A. Varianza para datos no agrupados


La varianza de 𝑛 valores 𝑥1 , 𝑥2 , … , 𝑥𝑛 , de alguna variable cuantitativa 𝑋 cuya media es 𝑥̅ , es el número real:
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑆2 =
𝑛−1

EJEMPLO: Calcular la varianza de los 12 salarios de los trabajadores de una empresa (en dólares)

54 37 63 65 71 73 49 55 54 61 71 45

Solución:

37 45 49 54 54 55 61 63 65 71 71 73
𝑥̅ = 58.17

(37 − 58.17)2 + (45 − 58.17)2 + ⋯ + (73 − 58.17)2


𝑆2 = = 125.24
12 − 1

B. Varianza para datos agrupados


B1. Varianza para datos agrupados de variable cuantitativa discreta
La varianza de 𝑛 valores de una variable estadística discreta 𝑋 que se clasifican en 𝑘 valores distintos 𝑥1 , 𝑥2 , … , 𝑥𝑘
con frecuencias absolutas respectivas 𝑓1 , 𝑓2 , … , 𝑓𝑘 y cuya media aritmética es 𝑥̅ se calcula utilizando la fórmula:

∑𝑘𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2
𝑆2 =
𝑛−1

Ejemplo: Hallar la varianza de la distribución de frecuencias del número de hijos por familia

𝒙𝒊 𝒇𝒊
0 1
1 4
2 7
3 6
4 2
Total 20
Solución:

𝑥: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 ℎ𝑖𝑗𝑜𝑠 𝑝𝑜𝑟 𝑓𝑎𝑚𝑖𝑙𝑖𝑎

𝑥̅ = 2.2

1(0 − 2.2)2 + 4(1 − 2.2)2 + ⋯ + 2(4 − 2.2)2


𝑆2 = = 9.72
20 − 1
B2. Varianza para datos agrupados por intervalos

La varianza de 𝑛 valores de una variable estadística continua 𝑋 son agrupados en 𝑘 intervalos, con marcas de
clase 𝑚1 , 𝑚2 , … , 𝑚𝑘 con frecuencias absolutas respectivas 𝑓1 , 𝑓2 , … , 𝑓𝑘 y cuya media aritmética es 𝑥̅ se calcula
utilizando la fórmula:

∑𝑘𝑖=1 𝑓𝑖 (𝑚𝑖 − 𝑥̅ )2
𝑆2 =
𝑛−1

Ejemplo: Hallar la varianza de una muestra de 45 salarios quincenales agrupados en la siguiente distribución de
frecuencias:

Intervalos mi fi
[26,34[ 30 1
[34,42[ 38 2
[42,50[ 46 4
[50,58[ 54 10
[58,66[ 62 16
[66,74[ 70 8
[74,82] 78 4
Total 45
Solución

𝑥̅ = 59.87

1(30 − 59.87)2 + 2(38 − 59.87)2 + ⋯ + 4(78 − 59.87)2


𝑆2 = = 117.53
45 − 1

Propiedad

Si cada uno de los 𝑛 valores 𝑥¡ es transformado en: 𝑌 = 𝑎 𝑋 + 𝑏 , siendo 𝑎 y 𝑏 constantes, entonces, la varianza
de los 𝑛 valores 𝑌, es:

𝑆 2 𝑌 = 𝑎2 𝑆 2 𝑋

5. Coeficiente de variación (𝑪𝑽)

Definición.- El coeficiente de variación, CV, es una medida de dispersión relativa (libre de unidades de medidas),
que se define como el cociente entre la desviación estándar y la media aritmética. Esto es:

𝑆
𝐶𝑉 =
𝑥̅

El coeficiente de variación se utiliza para comparar la variabilidad de dos o más series de datos que tengan medias
iguales o diferentes o que tengan unidades de medidas iguales o diferentes (por decir, una serie en kilogramos y
otra serie en metros).

Ejemplo: Si dos secciones L y R de Estadística I, tienen la misma desviación estándar igual a 14, no podemos
concluir que los dos horarios tienen la misma variabilidad.
Así mismo, si las desviaciones estándares de L y R son iguales a 2 y 4 respectivamente no podemos concluir que
las notas de R son más dispersas que las de L. La variabilidad depende de las medias de los dos grupos.
Si la media del horario L es 16 y la media del horario R es 11, los coeficientes de variación respectivos son:
2
𝐶𝑉1 = = 0.125 = 12.50%
16
4
𝐶𝑉2 = = 0.3636 = 36.36%
11
La sección R presenta mayor variabilidad que la sección L.

6. Valor Estándar (𝒛)


Cuando se necesiten comparar valores observados que pertenecen a diferentes distribuciones de datos, las que
difieren en su media aritmética o en su varianza, o difieren en el tipo de unidad de medida, entonces se usa el
valor estandar 𝑧 que se define como:
𝑥 − 𝑥̅
𝑧=
𝑠

Ejemplo: En una evaluación de Matemáticas y Estadística resultan las medias 13 y 17 y la desviaciones estándar 3
y 4, respectivamente. Si un estudiante obtiene 14 en Matemáticas y 16 en Estadística, ¿en cuál de los dos cursos
tiene mejor rendimiento relativo?

𝑥 − 𝑥̅ 14 − 13
𝑧1 = = = 0.3333
𝑠 3
𝑥 − 𝑥̅ 16 − 17
𝑧2 = = = −0.25
𝑠 4

Tiene mejor rendimiento en el curso de Matemática.

PROBLEMA

Los siguientes datos muestran los calificativos de 20 personas sometidos a una prueba de aptitud. Los 20
estudiantes fueron divididos en dos grupos, al grupo 1 se calificó de 0 a 100 y al grupo 2 de 0 a 20 :

Grupo 1: 86, 81, 79, 73, 95, 8 6 , 94, 90, 86 , 88 .

Grupo 2: 16, 19, 13, 20, 14, 16, 19, 18, 17, 15.

a) Calcule la media y la desviación estándar en cada grupo, ¿cuál de los grupos es más homogéneo?

𝑥̅1 = 85.8 𝑆1 = 6.73

𝑥̅2 = 16.7 𝑆2 = 2.31

6.73
𝐶𝑉1 = = 0.0784 = 7.84%
85.8
2.31
𝐶𝑉2 = = 0.1383 = 13.83%
16.7
El grupo más homogéneo es el grupo 1.

b) ¿Se puede aceptar que el estudiante con 73 puntos del grupo 1 tiene mayor aptitud que el estudiante con 13
puntos del grupo 2?

𝑥 − 𝑥̅1 73 − 85.8
𝑧1 = = = −1.9019
𝑠 6.73
𝑥 − 𝑥̅2 13 − 16.7
𝑧2 = = = −1.6017
𝑠 2.31

No se puede aceptar pues el estudiante del segundo grupo tiene mayor aptitud.

También podría gustarte