Está en la página 1de 14

MEDIDAS DE DISPERSIÓN

ALTA DISPERSIÓN BAJA DISPERSIÓN


A DESCENTRADO B CENTRADO

ALTA DISPERSIÓN BAJA DISPERSIÓN


C CENTRADO D DESCENTRADO

Dispersión y centrado de datos

• ¿Cuál es el mejor escenario de los cuatro posibles? ¿Por qué?


• ¿Cuál es el segundo mejor escenario? ¿Por qué?
• ¿Cuál es el peor escenario? ¿Por qué?
• ¿Cuál es el segundo peor escenario? ¿Por qué?
• ¿Cuál de los cuatro casos presenta mayor dispersión?

Grupos por rendimiento académico de un curso

RENDIMIENTO ACADÉMICO
ESTUDIANTES
GRUPO 1 GRUPO 2 GRUPO 3 GRUPO 4 GRUPO 5 GRUPO 6 GRUPO 7
Estudiante 1 91 72 54 79 70 44 94
Estudiante 2 90 72 51 74 75 49 99
Estudiante 3 65 44 53 65 73 47 97
Estudiante 4 51 37 54 71 72 46 96
Estudiante 5 100 56 38 85 72 46 96
Estudiante 6 40 15 60 77 76 50 97
Estudiante 7 64 55 61 72 68 42 92
Estudiante 8 99 78 58 77 73 47 97
Suma
Promedio
Rango
Desv. Est. 21,52 19,80 6,76 5,59 2,39 2,39 2,00
Aprobados

8
• ¿Cuál es el mejor grupo? ¿Por qué?
• ¿Cuál es el segundo mejor grupo? ¿Por qué?
• ¿Cuál tiene mejor rendimiento, el grupo 2 o el 3?
• ¿Cuál es el peor grupo? ¿Por qué?
• ¿Cuál es el segundo peor grupo? ¿Por qué?
• ¿Cuál de los siete grupos presenta mayor dispersión?
• ¿Cuál de los siete grupos presenta menor dispersión?

Gráfico: Diagrama de cajas de los grupos por rendimiento académico

Para interpretar de mejor manera un conjunto de datos y facilitar la toma de decisiones, no basta con
analizar las medidas de tendencia central, sino que necesitamos conocer también la desviación que
presentan los datos en su distribución respecto de la media aritmética de dicha distribución, o de otro
valor tomado como referente.

Las medidas de dispersión muestran la variabilidad de una distribución, indicando por medio de un
número, si las diferentes puntuaciones de una variable están muy alejadas del centro de los datos
ordenados o de un valor que sirve de referente. Cuanto mayor sea el valor de la dispersión, mayor será la
variabilidad, cuanto menor sea, más homogénea será a la población. Así se sabe si todos los casos son
parecidos o varían mucho entre ellos.

9
Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula el promedio de
las desviaciones de las puntuaciones. Pero la suma y/o el promedio de las desviaciones es siempre cero,
así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las
desviaciones en valor absoluto (desviación media) y otra es tomando las desviaciones al cuadrado
(varianza). Entre las medidas de desviación que se estudiarán en este curso están:

• El Rango
• La varianza
• La desviación estándar
• El coeficiente de variación.

RANGO

El rango o recorrido estadístico es la diferencia entre el valor máximo y el valor mínimo en un grupo de
números aleatorios. Es la primera medida que proporciona información del estado de la variabilidad de
los datos, sin embargo, ante datos extremos, muy altos o bajos, puede proporcionar información no tan
útil. Se le suele simbolizar con R.

Ejemplo: Para el conjunto de datos A, los datos son 8, 7, 7, 2, 6, 7, 3, 9, 4, 5, el dato menor es 2 y el dato
mayor es 9. Sus valores se encuentran en un rango de:

R = Max – Min = 9–2= 7

10
Ejemplo: Para el conjunto de datos B: 8, 8, 7, 6, 6, 7, 7, 6, 8, 8, 7, el rango sería:

R = Max – Min = 8–6= 2

Para esta medida de dispersión no es importante cuántos datos hay, sólo se necesita conocer el valor
mayor y el menor, el resultado permite apreciar cuánto están distribuidos los datos en la recta numérica.

Se observa que los datos están más concentrados (juntos) en el ejemplo 2, pero más repartidos
(dispersos) en el ejemplo 1.

DESVIACIÓN MEDIA

Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las
desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es
siempre cero, así que para salvar este problema se toma las desviaciones en valor absoluto. Un valor
absoluto no tiene signo positivo ni negativo. La desviación media está medida en las mismas unidades
distintas de las de la variable: metros, centímetros, litros, minutos, etc. Para calcular la desviación media
se sigue el siguiente procedimiento:

a. Calcular el promedio (media aritmética)


b. Restar cada uno de los datos de la media
c. Convertir los resultados en valores absolutos
d. Sumar el resultado de cada una de las restas realizadas en paso anterior
e. Dividir el resultado de la suma entre el número de datos

𝑎𝑏𝑠 ∑(𝑥 − 𝑥̅ )2
𝑫𝑴 =
𝑁

Ejemplo: Calcular la desviación media de los siguientes valores: 12, 14, 17, 11, 19, 16

DESVIACIÓN MEDIA
N 𝒙 (𝒙 − 𝒙
̅) ̅)
ABS(𝒙 − 𝒙
1 12 -2,83 2,83
2 14 -0,83 0,83
3 17 2,17 2,17
4 11 -3,83 3,83
5 19 4,17 4,17
6 16 1,17 1,17
suma 89,00 15,00
N 6 6
promedio 14,83 2,50 DESVIACIÓN MEDIA

11
VARIANZA

La varianza de una población, que suele representarse como , es una medida de dispersión definida
como el promedio de las desviaciones al cuadrado de dicha variable respecto a su media, este símbolo
aplica para casos de varianza poblacional. Cuando se trata de la varianza de una muestra el símbolo es
S2.
La varianza está medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una
distancia en metros, la varianza se expresa en metros al cuadrado.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores poco comúns y no se
aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales
casos se recomienda el uso de otras medidas de dispersión más robustas. La varianza de una población
tiene la siguiente fórmula:

∑(𝑥 − µ)2
𝛔𝟐 =
𝑁
La varianza de una muestra tiene la siguiente fórmula:

∑(𝑥 − 𝑥̅ )2
𝐬𝟐 =
𝑁−1

Donde,
σ 2 = Varianza de la población
s 2 = Varianza de la muestra
x = Cada uno de los datos o mediciones
µ = Media de la población
𝑥̅ = Media de la muestra
N = Número de datos

Ejemplo: Se ha tomado una muestra de 10 jóvenes para determinar el número de horas al día que
dedican a redes sociales. Los datos tomados son los siguientes: 2, 1, 5, 1, 3, 2, 2 4, 3, 6. Calcular la
varianza.

N 𝒙 (𝒙 − 𝒙̅) ̅)𝟐
(𝒙 − 𝒙
1 2 -0.90 0.81
2 1 -1.90 3.61
3 5 2.10 4.41
4 1 -1.90 3.61
5 3 0.10 0.01
6 2 -0.90 0.81
7 2 -0.90 0.81
8 4 1.10 1.21
9 3 0.10 0.01
10 6 3.10 9.61
SUMA 29 0.00 24.90
promedio 2.90 varianza 2.77 horas2

Observe que la suma de las desviaciones (24.90) se divide para 9 -1 = 10.

El resultado se expresa en horas2.

12
Si los datos del ejercicio anterior se hubieran referido a una población en vez de a una muestra, el
resultado sería el siguiente:

N 𝒙 (𝒙 − 𝒙̅) ̅)𝟐
(𝒙 − 𝒙
1 2 -0.90 0.81
2 1 -1.90 3.61
3 5 2.10 4.41
4 1 -1.90 3.61
5 3 0.10 0.01
6 2 -0.90 0.81
7 2 -0.90 0.81
8 4 1.10 1.21
9 3 0.10 0.01
10 6 3.10 9.61
SUMA 29 0.00 24.90
promedio 2.90 varianza 2.49 horas2

La suma de las desviaciones (24.90) ahora se dividen para 10.

DESVIACIÓN ESTÁNDAR

La desviación estándar, conocida también como Desviación Típica, suyo símbolo es σ o s, dependiendo
de la procedencia del conjunto de datos: población o muestra, respectivamente, es la raíz cuadrada de la
varianza, es una medida de dispersión expresada en las mismas unidades de los datos de la variable
objeto de estudio. La varianza tiene como valor mínimo 0.

Ejemplo: Calcular la desviación estándar de los siguientes valores (población): 12, 14, 17, 11, 19, 16

µ= 14,83
σ² = 7,81
σ = √7,81 = 2,794

Ejemplo: Calcular la desviación estándar de los siguientes valores (población): 12, 14, 17, 11, 19, 16

̅ = 14,83
𝒙
s ² = 9,37
s = √9,37 = 3,06

Posteriormente se explicará las aplicaciones, reglas y más información relacionada con la desviación
estándar.

Medidas de dispersión utilizando software estadístico

En SPSS el cálculo de las Medidas de dispersión (MD) es muy sencillo. Cabe mencionar que, por
defecto, este programa calcula las MD como si los datos correspondieran a una muestra. El
procedimiento es el siguiente:

Analizar > Estadísticos descriptivos > Frecuencias: introducir a Variables las variables numéricas
para el análisis; deshabilitar la opción de Mostrar tablas de frecuencias > Estadísticos: en Dispersión
seleccionar las MD correspondientes > Continuar > Aceptar.
13
Estadísticos
horas redes sociales
N Válido 10
Perdidos 0
Desv. Desviación 1.66333
Varianza 2.767
Rango 5.00

El cálculo de medidas de dispersión en Excel es también sencillo. Para calcular la varianza con los
mismos datos del ejercicio anterior:

Se debe observar que, a diferencia de SPSS,


para el cálculo de Varianza y Desviación estándar,
Excel presenta dos opciones de funciones: para
población y para muestra. Si la necesidad del
investigador es calcular la varianza de una
muestra, la función será:

= VAR.S( : )

Si, por el contrario, se requiere trabajar los datos


como si fueran de una población, la función será:

= VAR.P( : )

Lo propio ocurre en el cálculo de la Desviación


estándar. La función de la Desviación estándar
para una muestra es:

=DESVEST.M( : )

Y, para la población:

=DESVEST.P( : )

14
COEFICIENTE DE VARIACIÓN

Es una medida de dispersión que resulta de la división de la desviación estándar entre el promedio. El
coeficiente de variación se expresa generalmente en porcentaje, puede servir para comparar las
dispersiones de grupos de datos.

Normalmente, el coeficiente de variación se expresa como resultado de la división de la desviación


estándar para la media, en decimales, por ejemplo 0.5724, pero, es común representarlo como
porcentaje, por esta razón se suele multiplicar por 100 al resultado de la división.

Para facilitar la comprensión del coeficiente de variación se sugiere realizar el siguiente ejercicio:

Tabla. Rendimiento académico de 8 estudiantes

RENDIMIENTO ACADÉMICO
ESTUDIANTES
BASE 10 BASE 5 BASE 20 BASE 100
Estudiante 1 8,50
Estudiante 2 7,00
Estudiante 3 9,00
Estudiante 4 10,00
Estudiante 5 8,50
Estudiante 6 6,20
Estudiante 7 7,30
Estudiante 8 4,00
Prom.
Desv. Est.
coef. Var.

Instrucciones:

15
1. Convertir los datos de la columna “Base 10” en datos de Base 5, base 20 y base 100,
respectivamente.
2. Calcular el promedio de los datos de cada columna.
3. Calcular la desviación estándar de los datos de cada columna.
4. Comparar la variación de los datos utilizando la desviación estándar.
5. Calcular el coeficiente de variación.
6. Comparar la variación de los datos utilizando el coeficiente de variación.

INTERPRETACIÓN Y COMPRENSIÓN DE LA DESVIACIÓN ESTÁNDAR

Es necesario recordar que la desviación estándar mide la variación entre los valores (datos). Los valores
cercanos o muy parecidos producirán una desviación estándar pequeña, mientras que los datos muy
dispersos o distintos entre sí, darán como resultado una desviación estándar más grande. Triola M.
(2009) registra algunas características de la desviación estándar que ayudarán a la interpretación de esta
medida de dispersión.

• La desviación estándar es una medida de variación de todos los valores con respecto a la media.
• El valor de la desviación estándar s es positivo. Sólo es igual a cero cuando todos los valores de los
datos son el mismo número (nunca es negativo). Además, valores grandes de s implican mayores
cantidades de variación.
• El valor de la desviación estándar s puede aumentar de manera drástica con la inclusión de uno o
más valores extremos (valores de datos que se encuentran muy lejos de los demás).
• Las unidades de la desviación estándar s (como minutos, pies, libras, etcétera) son las mismas de los
datos originales.

Regla empírica para datos con distribución normal

Otra regla que ayuda a la interpretación de la desviación estándar es la Regla empírica para datos con
distribución normal. Esta regla establece que para casos de datos con distribución normal aplican las
siguientes propiedades:

• Aproximadamente el 68% de todos los valores se encuentran dentro de una desviación estándar de
la media, esto es a una desviación estándar a cada lado de la media.

Entre (𝑥̅ − 𝑠) y (𝑥̅ + 𝑠)

16
• Aproximadamente el 95% de todos los valores se encuentran dentro de 2 desviaciones estándar de
la media, esto es a 2 desviaciones estándar a cada lado de la media.

Entre (𝑥̅ − 2𝑠) y (𝑥̅ + 2𝑠)

• Aproximadamente el 99,7% de todos los valores se encuentran dentro de 3 desviaciones estándar de


la media, esto es a 3 desviaciones estándar a cada lado de la media.

Entre (𝑥̅ − 3𝑠) y (𝑥̅ + 3𝑠)

17
Triola M. (2009) indica que en el lenguaje estadístico suele decirse frases tales como “dentro de 2
desviaciones estándar de la media”. Expresiones como esta se explican aplicando el siguiente cuadro:

N° FRASE SIGNIFICADO
1 Dentro de 1 desviación estándar de la media Entre (𝒙̅ − 𝒔) 𝑦 (𝒙
̅ + 𝒔)
2 Dentro de 2 desviaciones estándar de la Entre (𝒙̅ − 𝟐𝒔) 𝑦 (𝒙
̅ + 𝟐𝒔)
media
3 Dentro de 3 desviaciones estándar de la Entre (𝒙̅ − 𝟑𝒔) 𝑦 (𝒙
̅ + 𝟑𝒔)
media

La distribución normal implica que los datos se distribuyen en un histograma de manera tal que adoptan
una forma de campana (ver figura 4), donde hay pocos datos con valores bajos, muchos datos con
valores medios y pocos con valores altos.

Curva de distribución normal


Regla empírica para datos con distribución normal

18
Regla práctica del intervalo

Se trata de una herramienta sencilla para entender la desviación estándar, se basa en el principio básico
de que, en muchos casos, la mayoría de los datos muestrales (un 95% aproximadamente) se ubican
dentro de 2 desviaciones estándar a partir de la media. Sacrificando un poco la precisión del resultado se
podría estimar el valor de la desviación estándar aplicando la siguiente fórmula:

rango
𝑠≈
4
Esto implica que valores menores a 𝑥̅ − 2𝑠 se consideren “poco comunes”, de igual manera, los
valores mayores a 𝑥̅ + 2𝑠 se consideran poco comunes. A su vez, los valores que se encuentran
dentro de (𝑥̅ − 2𝑠) y (𝑥̅ + 2𝑠) se consideran valores “comunes”.

EJERCICIOS
19
A partir de la tabla de datos “Muestra adolescentes y tipos de sangre”, realizar las siguientes
actividades:

1. Calcular el rango, la varianza y la desviación estándar del Peso 1 de los estudiantes.

2. Calcular el rango, la varianza y la desviación estándar del IMC 1 (calculado con el Peso 1 y la
Estatura 1) de los estudiantes.

IMC = Peso / (Estatura2)


IMC = Peso / (Estatura * Estatura)

3. Presentar mediante un cuadro, el rango, la varianza y la desviación estándar del Peso 1 y la


Estatura 1.
4. Calcular el coeficiente de variación (s/media) de la Estatura 1 de los estudiantes.
5. Calcular el coeficiente de variación del Peso 1 de los estudiantes.
6. Elaborar un cuadro del rango, la varianza, la desviación estándar y el coeficiente de variación de
la edad 2018 de los estudiantes con tipo de sangre O+.
7. Elaborar un cuadro del rango, la varianza, la desviación estándar y el coeficiente de variación de
la edad 2018 de los estudiantes con tipo de sangre A+.
8. Comparar la media, mediana, moda, el rango, la varianza, la desviación estándar y el coeficiente
de variación de la Estatura 1, en los estudiantes que tienen tipo de sangre O+ y A+.
9. Comparar mediante un cuadro, el rango, la varianza y la desviación estándar del Peso 2 y las
Estaturas 2 de los estudiantes varones y mujeres.
10. Elaborar un cuadro comparativo del rango, la varianza, la desviación estándar y el coeficiente de
variación del IMC 2 de los varones y las mujeres.
11. Calcular el rango, la varianza y la desviación estándar de la Edad en 2018 de los estudiantes, en
cada una de las categorías del IMC 1: Bajo peso, Peso normal, Sobrepeso, Obesidad, Obesidad
extrema.

INTERPRETACIÓN IMC
Grupo INTERPRETACIÓN L. inf L. sup.

1 BAJO PESO 0 18,49

2 NORMAL 18.50 24.99

3 SOBRE PESO 25.00 29.99

4 OBESIDAD 30.00 49.99

5 OBESIDAD EXTREMA 50.00 > 50

12. Calcular el rango, la varianza y la desviación estándar del IMC 2 de los estudiantes, en cada una
de las categorías del IMC: Bajo peso, Peso normal, Sobrepeso, Obesidad, Obesidad extrema.
13. Comprobar el cumplimiento de la regla práctica del intervalo en la variable Estatura 1.
14. Comprobar el cumplimiento de la regla práctica del intervalo en el Peso 1.
15. ¿La estatura 1 de IÑAGUAZO MONTERO ALVARO FERNANDO se considera valor común?
Justificar.

20
16. ¿La estatura 1 de CAMPOVERDE CASTILLO PAMELA ESTEFANIA se considera valor común?
Justificar.
17. ¿El Peso 1 de MORA GRANDA KATHERINE LISSETH se considera valor poco común?
18. ¿El Peso 1 de LOAIZA CUENCA CARLOS BRYAN se considera valor poco común?
19. ¿Hay valores poco comunes en el IMC 1 de los estudiantes? Justificar.
20. ¿Hay valores poco comunes en el IMC 2 de los estudiantes? Justificar.
21. ¿Qué porcentaje de valores poco comunes hay en el Peso 2?
22. ¿Qué porcentaje de estudiantes mujeres tiene valores poco comunes en la Estatura 2?
23. ¿Qué porcentaje de estudiantes tiene calificaciones dentro de una desviación estándar de la
media en la Estatura 1?
24. ¿Qué porcentaje de estudiantes tiene datos dentro de una desviación estándar de la media en la
Estatura 2?
25. ¿Qué porcentaje de estudiantes está dentro de dos desviaciones estándar de la media en la
Estatura 1?
26. ¿Qué porcentaje de estudiantes está dentro de dos desviaciones estándar de la media en la
Estatura 2?
27. ¿Qué porcentaje de estudiantes está dentro de tres desviaciones estándar de la media en la
Estatura 1?
28. ¿Qué porcentaje de estudiantes está dentro de tres desviaciones estándar de la media en la
Estatura 2?

21

También podría gustarte