Está en la página 1de 12

Sesión 18

MEDIDAS DE DISPERSIÓN EN EL ANÁLISIS DE DATOS PARA LA TOMA DE DECISIONES

En muchos ámbitos del quehacer laboral y de la investigación es frecuente escuchar frases como,
“la desviación típica del peso de los estudiantes es muy grande” o “la media de las estaturas
presenta poca desviación”, estas medidas de dispersión estadística entre otras se utilizan para
tomar decisiones y constituyen importantes fuentes para el análisis de datos y variables, a
continuación veamos un caso.

Caso 1: La prueba de Historia


Nro Sexo Notas
Las notas de una prueba de Historia de un grupo de estudiantes
de 5to año se muestran en la tabla siguiente. 1 M 14
2 H 16
a) El profesor cree que el rango de las notas obtenidas en la 3 M 14
prueba es muy grande. ¿Cuál es el rango de las notas 4 H 12
obtenidas en la prueba de historia? 5 M 17
6 M 10
……………………………………………………………………. 7 M 16
……………………………………………………………………. 8 M 12
……………………………………………………………………. 9 M 17
……………………………………………………………………. 10 M 17
…………………………………………………………………….

b) El profesor del curso ha señalado que si la desviación media de dicha prueba es mayor de 2
les dará otra oportunidad y tomarán otra prueba ¿Tomarán otra prueba de Historia los
estudiantes de 5to? (se sabe que la media de los datos es 14,5)

……………………………………………………………………………………………………………….
……………………………………………………………………………………………………………….
……………………………………………………………………………………………………………….
……………………………………………………………………………………………………………….

c) Al ver la media de la prueba (14,5), el profesor del curso ha señalado que, “una varianza de
hasta 4,5 indicaría buenos resultados. ¿Cuál es la varianza de las notas en la prueba de
Historia?

……………………………………………………………………………………………………………….
……………………………………………………………………………………………………………….
……………………………………………………………………………………………………………….
……………………………………………………………………………………………………………….

d) Con la finalidad de estar seguro de la distribución de las notas, el profesor de Historia decide
que será la desviación estándar la que defina si se toma o no otro examen, por ello ha
señalado que, “si el doble de la desviación estándar es mayor que 4,5 se tomará otro examen.

……………………………………………………………………………………………………………….
……………………………………………………………………………………………………………….
……………………………………………………………………………………………………………….
……………………………………………………………………………………………………………….
Aprendemos

Rango.- El rango es una medida de dispersión de datos, se calcula a partir de la diferencia entre
el mayor y el menor de todos ellos. Hay 2 maneras de expresar esta medida.

- La diferencia entre los valores. (mayor y menor)


- Los valores mayor y menor del grupo.

Limitaciones del rango:

- Considera sólo los valores extremos de un conjunto, y no proporciona mayor


información respecto a los demás valores del mismo

- Tiene una limitada utilidad para los distintos tipos de análisis estadísticos

Desviación media (DM).- Mide la desviación promedio de valores con respecto a la media del
grupo, sin tomar en cuenta el signo de la desviación.

es la media aritmética de los números y |xj - | es el valor absoluto de la desviación de xj


respecto de . (El valor absoluto de un número es el número sin signo y se denota con dos barras
verticales)

DM

Varianza (S2).- La varianza es la media aritmética del cuadrado de las desviaciones respecto a la
media de una distribución estadística.

Propiedades de la varianza
- La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean
iguales.
- Si a todos los valores de la variable se les suma un número la varianza no varía.
- Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada
por el cuadrado de dicho número.
- Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas
se puede calcular la varianza total.
Limitaciones de la varianza
- La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.
- En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.
- La varianza no viene expresada en las mismas unidades que los datos, ya que las
desviaciones están elevadas al cuadrado.

Desviación estándar (DS).- También conocida como desviación típica, es la raíz cuadrada de la
varianza. Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de
desviación.

DS

Propiedades de la desviación típica

- La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones
sean iguales.
- Si a todos los valores de la variable se les suma un número la desviación típica no varía.
- Si todos los valores de la variable se multiplican por un número la desviación típica queda
multiplicada por dicho número.
- Si tenemos varias distribuciones con la misma media y conocemos sus respectivas
desviaciones típicas se puede calcular la desviación típica total.

Observaciones sobre la desviación estándar

- La desviación típica, al igual que la media y la varianza, es un índice muy sensible a las
puntuaciones extremas.
- En los casos que no se pueda hallar la media tampoco será posible hallar la desviación típica.
- Cuanta más pequeña sea la desviación típica mayor será la concentración de datos alrededor
de la media.
ANALIZAMOS

Caso 2: Colesterol Nivel de colesterol


Código Género
Antes Después
La compañía farmacéutica "Mediplus" llevó a cabo un 1 2 230 173
2 2 267 173
estudio clínico con 20 personas, para probar la efectividad 3 1 312 168
del medicamento “Radinul”, el cual se ha diseñado para 4 1 314 168
5 1 306 169
ser un potente y seguro tratamiento para reducir los 6 1 292 169
elevados niveles de colesterol. Este estudio se llevó a cabo 7 1 249 162
8 1 230 162
en 12 semanas, en las cuales los participantes ingirieron 9 1 232 165
una pastilla diaria de “Radinul”. -La base de datos obtenida 10 1 269 165
11 2 230 168
en este estudio se muestra en la tabla adjunta, en la cual 12 2 267 169
se muestran los niveles de colesterol “Antes” y “Después” 13 2 312 168
14 2 314 169
del tratamiento. Se sabe que las medias del nivel de 15 2 306 176
colesterol “Antes” y “Después” del tratamiento 16 2 292 176
17 2 249 168
respectivamente son 264,4 y 167,1 18 2 230 168
19 1 118 153
20 1 269 153

a) ¿Cuál es el rango del nivel de colesterol antes del tratamiento con Radinul?

Solución

Se sabe: Rango = Máximo – Mínimo

Luego:

Máximo = 314; Mínimo = 118

==> Rango = 314 – 118 = 196

b) Con la finalidad de determinar el intervalo que agrupe los datos alrededor de la media “antes
del tratamiento”. Los responsables del estudio, han decidido utilizar la DM. ¿Cuál es el
intervalo que agrupa los datos alrededor de la media utilizando la DM?

Solución

El intervalo solicitado tendría la siguiente forma:

[Media – DM ; Media + DM]

Luego, se requiere calcular la Desviación Media DM del nivel de colesterol antes del
tratamiento.
1. Se calculan x i  x * ni
Se sabe por dato que la antes = 264.4
Xi ni Ni [|Xi - |]*ni
118 1 1 146,40
230 4 5 137,60
232 1 6 32,40
249 2 8 30,80
267 2 10 5,20
269 2 12 9,20
292 2 14 55,20
306 2 16 83,20
312 2 18 95,20
314 2 20 99,20

2. Se suman los valores [|Xi - |]*ni, en este caso


Σ [|Xi - X|]*ni = 694,40

3. Se divide el valor hallado entre el total de datos, en este caso “n = 20”

 xi  x 694,40
DM    34,72
n 20

Finalmente como el intervalo solicitado es [Media –DM ; Media + DM]

Entonces: [264,40 – 34,72 ; 264,40 + 34,72] = [229,68 ; 299,12]

c) Ordene de forma creciente los niveles de colesterol de cada persona y elabore un gráfico de
dispersión de puntos de dichos niveles en el siguiente plano cartesiano.
d) En el gráfico anterior grafique la línea de tendencia que mejor se ajuste a los puntos.

e) Según un informe de la Asociación Americana del Corazón1 los niveles de colesterol son:

Nivel Situación
Menos de 200 mg/dL Deseable (menor riesgo)
200 a 239 mg/dL Límite elevado (mayor riesgo)
Elevado (más del doble de
240 mg/dL y superior
riesgo que el nivel deseable)

Y como se sabe ( antes = 264,4), por tanto se sabe que en promedio las personas
que participan del estudio tienen nivel elevado de colesterol, por lo que l os
responsables del estudio, esperan que la varianza sea menor a 1800. ¿Cuál es la varianza
del nivel de colesterol antes del tratamiento en las personas que participan de este estudio?

Solución

1. Se calculan [Xi - ]2*ni


Xi ni Ni [Xi - ]2*ni
118 1 1 21 432,96
230 4 5 4 733,44
232 1 6 1 049,76
249 2 8 474,32
267 2 10 13,52
269 2 12 42,32
292 2 14 1 523,52
306 2 16 3 461,12
312 2 18 4 531,52
314 2 20 4 920,32

1
https://www.heart.org/idc/groups/heart-public/@wcm/@hcm/documents/downloadable/ucm_316249.pdf
2. Se suman los valores [Xi - ]2*ni, en este caso
Σ [Xi - X]2*ni = 42 182,80

3. Se divide el valor hallado entre el total de datos, en este caso “n = 20”

 [Xi - X] 2 * ni 42 182,80
s2    2 109,14
n 20

Finalmente la Varianza del nivel de colesterol antes del tratamiento es 2 109,14

f) ¿Cuál es la diferencia de medias “Antes y después” del estudio? Qué significa esta
diferencia? Explique.

Solución

Como se sabe:

Mediaantes= 264,40

Mediadespués= 167,10

Luego la diferencia de medias es: 264,40 – 167,10 = 97,30

Luego, esta diferencia significa que los participantes del estudio redujeron en promedio 97,30
puntos en los niveles de colesterol después del tratamiento.

g) Halle las medidas de dispersión (Rango, DM, varianza y DS) de los niveles de colesterol
después del tratamiento con “Radinul”.

Solución

Hallando el rango:

Se sabe: Rango = Máximo – Mínimo

Luego:

Máximo = 176; Mínimo = 153

==> Rango = 176 – 153 = 23


Hallando la DM

1. Se calculan xi  x * ni

Xi ni Ni [|Xi - X|]*ni
153 2 2 28,20
162 2 4 10,20
165 2 6 4,20
168 6 12 5,40
169 4 16 7,60
173 2 18 11,80
176 2 20 17,80

2. Se suman los valores [|Xi - |]*ni, en este caso


Σ [|Xi - |]*ni = 85,20

3. Se divide el valor hallado entre el total de datos, en este caso “n = 20”

 xi  x 85,20
DM    4,26
n 20

Hallando la varianza

1. Se calculan [Xi - ]2*ni


Xi ni Ni [Xi - X]2*ni
153 2 2 397,62
162 2 4 52,02
165 2 6 8,82
168 6 12 4,86
169 4 16 14,44
173 2 18 69,62
176 2 20 158,42

2. Se suman los valores [Xi - ]2*ni, en este caso


Σ [Xi - X]2*ni = 705,80

3. Se divide el valor hallado entre el total de datos, en este caso “n = 20”

 [Xi - X] 2 * ni 705,80
S2    35,29
n 20

Hallando la desviación estándar

Se sabe que la desviación estándar DS = √𝑆 2

Entonces DS = √35,29 = 5,94


Practicamos

Tabla 1
Inteligencia
Nro Nombres Sexo Agresividad
Emocional
Caso 3: Agresividad e Inteligencia
emocional 1 José H 0,68 38
2 Marcos H 0,54 53
Una encuesta anónima para determinar los 3 David H 0,70 35
4 Roberto H 0,30 66
niveles de agresividad e inteligencia emocional 5 María M 0,54 54
se llevó a cabo en un grupo de estudiantes de 6 Rosmeri M 0,66 50
7 Luis H 0,83 28
5to de secundaria de un colegio secundario. En
8 Carla M 0,63 47
la tabla adjunta se muestran los puntajes 9 Regina M 0,73 31
obtenidos en cada variable. Asimismo se 10 Mercedes M 0,66 45
11 Pedro H 0,43 50
conoce el sexo (M: Mujer y H: Hombre) de 12 Juan H 0,67 44
dichos estudiantes. Asimismo, se sabe que las 13 Celia M 0,74 26
14 Matías H 0,71 33
medias de dichas variables son, agresividad =
15 Jesús H 0,73 27
0,65; int.emoc = 41,95 16 Ramiro H 0,67 42
17 Noé H 0,69 39
18 Ricardo H 0,72 36
1. ¿Cuál es el rango del nivel de agresividad 19 Rocío M 0,65 48
de los estudiantes de 5to de secundaria? 20 Felicia M 0,64 47

a) 0,04
b) 0,40
c) 0,50
d) 0,53

2. Los responsables de la encuesta, han señalado que, “si la desviación media de los niveles de
agresividad, es menor o igual a 0,05 (DM ≤ 0,05), puede considerarse que la agresividad en
dicho grupo de estudiantes requiere ser atendida por un psicólogo, mientras que si es
superior a dicho valor bastaría que su tutor converse con ellos. ¿Cuál de las dos decisiones
deberá tomarse con los estudiantes encuestados de 5to de secundaria?

a) Deberán ser atendidos por un psicólogo.


b) El tutor deberá conversar con los estudiantes.
c) No se puede determinar la DM de agresividad.
d) Debería intervenir el Director.

3. Con la finalidad de determinar la dispersión de los niveles de agresividad, los responsables de


la encuesta deciden tomar en cuenta la varianza. ¿Cuál es el valor de la varianza del nivel de
agresividad en los estudiantes de 5to de secundaria?

a) 0,01
b) 0,10
c) 0,26
d) 2,60
4. Considerando los valores de agresividad e inteligencia emocional de la Tabla 1
elabore un gráfico de dispersión de puntos de dichos valores en el siguiente plano
cartesiano.

0 0,2 0,4 0,6 0,80 1,00

5. En el gráfico anterior grafique la línea de tendencia que mejor se ajuste a los puntos
dados.

0 0,2 0,4 0,6 0,80 1,00

6. ¿Qué puede concluir de la gráfica anterior, en relación a la agresividad y la inteligencia


emocional de los estudiantes?
a) Existe relación inversa entre la agresividad y la inteligencia emocional.
b) Existe relación directa entre la agresividad y la inteligencia emocional.
c) No existe relación entre la agresividad y la inteligencia emocional.
d) No se puede llegar a ninguna conclusión.
7. Con la finalidad de establecer la amplitud de puntajes en inteligencia emocional, se desea
calcular el rango de dichos valores para el grupo de estudiantes de la Tabla 1. ¿Cuál es el
rango de puntajes de inteligencia emocional mostrados en la Tabla 1?
a) 30
b) 40
c) 42
d) 45

8. Con la finalidad de establecer diferencias por sexo para la variable agresividad, los
responsables de la encuesta desean saber si el rango presenta diferencias cuando se agrupa
por sexo a los estudiantes. Determine si el rango de los puntajes de agresividad mostrados en
la Tabla 1 es mayor en los hombres o en las mujeres.

a) El rango es mayor en los hombres


b) El rango es mayor en las mujeres
c) Es igual en ambos
d) No se puede determinar.

9. A partir de los resultados hallados en el problema anterior. En relación a los rangos de los
hombres y mujeres para la variable agresividad, puede concluirse lo siguiente:

a) Los puntajes de agresividad de los hombres tienen menor dispersión que en las mujeres.
b) Los puntajes de agresividad de los hombres tienen mayor dispersión que en las mujeres.
c) Los puntajes de agresividad de los hombres y mujeres son iguales.
d) No se puede determinar diferencias en el rango entre hombres y mujeres.

10. Con la finalidad de establecer diferencias por sexo para la variable inteligencia emocional, los
responsables de la encuesta desean saber si el rango presenta diferencias cuando se agrupa
por sexo a los estudiantes. Determine si el rango de los puntajes de inteligencia emocional es
mayor en los hombres o en las mujeres.

a) El rango es mayor en los hombres


b) El rango es mayor en las mujeres
c) Es igual en ambos
d) No se puede determinar.

11. Con la finalidad de precisar la dispersión de datos entre las variables “agresividad” e
“inteligencia emocional” se ha dispuesto, hallar las desviaciones estándar de ambas variables
y determinar ¿cuál de las dos tiene mayor desviación?

a) La agresividad tiene mayor desviación estándar que la inteligencia emocional.


b) La agresividad tiene menor desviación estándar que la inteligencia emocional.
c) La agresividad y la inteligencia emocional tienen la misa desviación estándar.
d) No se puede determinar la desviación estándar de ambas variables.
12. Con relación a los puntajes de agresividad e inteligencia emocional de los 20 estudiantes
considerados en el estudio de referencia, y considerando sus respectivas desviaciones
estándar halladas en la pregunta anterior. ¿Cuál de las siguientes afirmaciones es correcta?

a) Los puntajes de agresividad están más concentrados alrededor de su media que los
puntajes de inteligencia emocional.
b) Los puntajes de agresividad están menos concentrados alrededor de su media que los
puntajes de inteligencia emocional.
c) Los puntajes de inteligencia emocional y agresividad presentan la misma dispersión
d) Existe una aparente diferencia en las desviaciones estándar

13. Según se aprecia en la Tabla 1, el conjunto de puntajes de agresividad es bimodal, es decir


presenta 2 modas (0,66 y 0,73). si a partir de la media se construye un intervalo cuyo radio es
1 SD (Desviación estándar). Cuál de las siguientes afirmaciones en relación a las modas es
correcta?

a) Sólo la moda 0,66 pertenece al intervalo definido por la desviación estándar.


b) Sólo la moda 0,73 pertenece al intervalo definido por la desviación estándar.
c) Ambas modas 0,66 y 0,73 pertenecen al intervalo definido por la desviación estándar.
d) Ninguna de las modas 0,66 y 0,73 pertenecen al intervalo definido por la desviación
estándar.

14. Se sabe que la mediana de puntajes de agresividad es 0,675. Considerando el


intervalo hallado en la pregunta anterior. Grafique en la recta numérica dicho intervalo
y los siguientes valores, Rango, Media, Mediana, Moda para la variable agresividad.

15. Según se aprecia en la Tabla 1, el conjunto de puntajes de inteligencia emocional es


polimodal, ya que presenta 4 modas (27, 45, 48, 50). Si a partir de la media se construye un
intervalo cuyo radio es 1 DS (Desviación estándar). ¿Cuál de las siguientes afirmaciones en
relación a las modas es correcta?

a) Todas las modas pertenecen al intervalo definido por la desviación estándar.


b) Sólo la moda 50 no pertenece al intervalo definido por la desviación estándar.
c) Las modas 27 y 50 no pertenecen al intervalo definido por la desviación estándar.
d) Sólo la moda 27 no pertenece al intervalo definido por la desviación estándar.

También podría gustarte