Está en la página 1de 29

Medidas de

dispersión
RANGO, VARIANZA, DESVIACIÓN
ESTÁNDAR, COEFICIENTE DE VARIACIÓN

SEMANA 05
RESULTADO DE APRENDIZAJE DE LA SESIÓN

Al finalizar la sesión, el estudiante interpreta


medidas de dispersión en datos agrupados y
no agrupados usando las fórmulas correctas
REFLEXIÓN DESDE LA EXPERIENCIA
TÍTULO

https://bit.ly/366hiHG

En estos casos las medias no


No se puede decidir aportan suficiente información,
Se debe MEDIDAS
Se necesita un indicador de
comparando las cómo están diseminados los recurrir DE
medias. datos alrededor del centro de la DISPERSIÓN
distribución.
REFLEXIÓN DESDE LA EXPERIENCIA

Responde en el padlet las


siguientes preguntas

• ¿Qué es una medida de dispersión ?


• ¿Para que sirve las medidas de dispersión ?
MEDIDAS DE DISPERSIÓN
SECCIÓN DE REFERENCIA

INTRODUCCIÓN
Todos los valores representativos discutidos en las clases anteriores han sido una especie de
promedio o medida de posición.

Sin embargo, el uso de un solo valor para describir una distribución oculta muchos hechos
importantes.

Por ejemplo, dos grupos separados de datos puede contener la misma media, pero un grupo
puede estar mas disperso o esparcido alrededor de la media que el otro.

Por lo que es necesario una medida de dispersión, esparcimiento o variación para ayudar a
definir completamente la distribución.

Mientras menor es la dispersión, mas típico es el valor de la media para toda la distribución.
MEDIDAS DE DISPERSIÓN
SECCIÓN DE REFERENCIA

CONCEPTO
Llamadas también medidas de variabilidad, miden el grado de
separación de los datos respecto a un valor central.

Son útiles porque:


1. Permiten juzgar la confiabilidad de la medida de tendencia central.
2. Los datos demasiados dispersos tienen un comportamiento especial.
3. Es posible comparar dispersión de diversas muestras.
4. Permite determinar el tipo de población, tipo muestreo.
5. Mide la bondad de ajuste en un análisis de regresión.
6. Cuantifica los riesgo en toma de decisiones.
MEDIDAS DE DISPERSIÓN

ABSOLUTAS RELATIVAS

Rango Coeficiente de
Variación
Rango Intercuartílico

Varianza

Desviación Estándar
MEDIDAS DE DISPERSIÓN: Absolutas

RANGO o AMPLITUD: R
Se define como la diferencia entre el valor máximo y el valor
mínimo de un conjunto de datos, es decir:

Indica intuitivamente la mayor


distancia, diferencia o variación que
R = X máx. – X mín. existe en un conjunto de datos entre
el valor máximo y el valor mínimo

CARACTERÍSTICAS:

• Solo usa dos datos para su cálculo.


• Hace referencia al recorrido que hace la variable desde el valor mínimo hasta
el valor máximo.
• Es afectado por valores atípicos, por lo que no se recomienda su uso.
• Es la medida de dispersión mas sencilla de calcular.
• El rango aumenta o se mantiene al incrementar el número de datos.
• Se usa cuando el número de datos es pequeño.
MEDIDAS DE DISPERSIÓN: Absolutas
SECCIÓN DE REFERENCIA

RANGO o AMPLITUD: R
EJEMPLO EJEMPLO
Se tiene el tiempo de espera (en minutos), de los Los siguientes datos corresponden a las
pacientes que acudieron al servicio de medicina notas del curso de Estadística General de
en el Hospital San Pedro. Diciembre 2020. la UCSUR
10 12 15 08 15 18 17 16 11 12 07 18 17 16
10 13 22 26 16 23 35 43 17 32 15 10 11 13 14 15 16 10 10 18 12 07 12 14
41 35 24 23 27 16 20 50 48 16 16 14 13 15 17 10 15 12 15 17 16 12
14 18 17 10 16 13 11
Determine la variabilidad total de los tiempos de espera. Determine la variabilidad total de las notas.

X mín. = 10 X máx. = 50 X mín. = 07 X máx. = 18

R = 50 – 10 = 40 min. R = 18 – 7 = 11 ptos
MEDIDAS DE DISPERSIÓN: Absolutas

RANGO INTERCUARTÍLICO
Se define como la diferencia entre el primer y tercer cuartil, es
decir:

Indica la variabilidad total del


RIC = Q3 – Q1 50% de los datos centrales
entre el cuartil 1 y cuartil 3

CARACTERÍSTICAS:
https://bit.ly/3vQ1EuP
• Su cálculo es sencillo, solo usa dos cuartiles.
• Hace referencia al recorrido que hace la variable desde el cuartil 1 hasta el
cuartil 3.
• No es afectado por valores atípicos o extremos, se recomienda su uso.
• El rango aumenta o se mantiene al incrementar el número de datos.
• Excluye el 25% mas alto y el 25% mas bajo.
• Se usa cuando la mediana es representativa a un conjunto de datos
MEDIDAS DE DISPERSIÓN: Absolutas

RANGO INTERCUARTÍLICO
EJEMPLO
Si Q1=8,82 años; Q3=15,65 años corresponde la experiencia (en
años) del personal que labora en el Hospital María Auxiliadora.

a.-¿Entre qué valores se El 50% de los trabajadores con


encuentra el 50% experiencia intermedia se
intermedio de estos datos? encuentran entre 8,82 y 15,65 años.

b.- ¿Cuál es el rango intercuartílico?

RIC = 15.65 – 8.82 = 6.83 años


MEDIDAS DE DISPERSIÓN: Absolutas

VARIANZA
Es una medida de Dispersión que indica cómo las observaciones se
separan de la Media Aritmética.

Se define como el promedio de las desviaciones al cuadrado de cada uno


de los datos con respecto a la media.

Indica el grado de variabilidad de


los datos con respecto a la media.

CARACTERÍSTICAS:

• Sus unidades están elevadas al cuadrado.


• Se usa cuando la media es representativa a un conjunto de datos.
• Esta medida de dispersión será grande si las observaciones están distantes de la
media y pequeña si están cerca.
• Es mayor o igual a cero.
MEDIDAS DE DISPERSIÓN: Absolutas
SECCIÓN DE REFERENCIA

VARIANZA
POBLACIÓN MUESTRA
σ (𝑥𝑖 − µ)2 σ(𝑥𝑖 − 𝑥)ҧ 2
DATOS NO 117 161 116 σ2 = 𝑠2 =
AGRUPADOS 353 123 376 𝑁 𝑛−1

Sin 2 2
σ(𝑥𝑖 − µ) ∗ 𝑓𝑖 σ(𝑥𝑖 − 𝑥)
ҧ ∗ 𝑓𝑖
Intervalos 2
σ = 𝑠2 =
𝑁 𝑛−1
Para obtener (Xi : valor de la variable)
sus valores
depende como
se presentan los DATOS
datos.
AGRUPADOS

σ 2 ∗ 𝑓𝑖 σ(𝑥 − 𝑥)
ҧ 2 ∗ 𝑓𝑖
(𝑥𝑖 − µ) 𝑖
Con σ2 = 𝑠2 =
𝑁 𝑛−1
Intervalos
(Xi : marca de clase)
MEDIDAS DE DISPERSIÓN: Absolutas

VARIANZA
EJEMPLO
Los siguientes son tiempos de hospitalización en días de una muestra
aleatoria de 10 pacientes. 5, 7, 6, 4, 5, 7, 8, 5, 3, 5
Interés: Determine el grado de variabilidad del tiempo de hospitalización
σ (𝑥𝑖 − 𝑥)
ҧ 2
𝑛 ෌ 𝑥𝑖2
𝑠2 = 𝑠2 = − 𝑥ሶ ҧ 2
𝑛−1 𝜂−1 𝑛
Realizando los cálculos 55
preliminares: σ 𝑥𝑖 = 55 ; 𝜂 = 10 ; 𝑥ҧ = = 5.5 ; ෌ 𝑥𝑖2 = 323
10

10 323
𝑠2 = − 5.52 = 2.78 dias2
10−1 10

NOTA: AL TRABAJAR CON LA VARIANZA LAS UNIDADES ESTAN


ELEVADAS AL CUADRADO POR LO QUE DIFICULTAD SU
INTERPRETACION, OSEA NO ES RECOMENDABLE USAR LA VARIANZA
PARA ANALIZAR DATOS, EN ESTE CASO RECURRIREMOS A SU
ALTERNATIVA LA DESVIACION ESTANDAR.
MEDIDAS DE DISPERSIÓN: Absolutas

VARIANZA
EJEMPLO
Un pediatra registra en una tabla el número de meses que los niños tardan
en dar sus primeros pasos luego de haber nacido y considera una muestra
aleatoria de 50 niños.

Meses Niños
Xi fi
9 1
10 4 Interés: Determine el grado de variabilidad
11 9 de los meses que los niños
12 16 tardan en dar sus primeros pasos
13 11
14 8
15 1
Total 50
MEDIDAS DE DISPERSIÓN: Absolutas

VARIANZA
EJEMPLO

Meses Niños
Xi fi
𝒙 𝒊 ∗ 𝒇𝒊 𝒙𝟐𝒊 ∗ 𝒇𝒊
σ (𝑥 − 𝑥)
ҧ 2∗ 𝑓 𝑛 ෌ 𝑥𝑖2 ∗ 𝑓𝑖
𝑖 𝑖 𝑠2 = − 𝑥ҧ 2
9 1 9 81
𝑠2 = 𝜂−1 𝑛
10 4 40 400 𝑛−1
11 9 99 1089
12 16 192 2304
13 11 143 1859 σ 𝑥𝑖 ∗𝑓𝑖 610
𝑥ҧ = = = 12.2 meses
14 8 112 1568 𝑛 50
15 1 15 225
Total 50 610 7526

𝑛 ෍ 𝒙𝒊 ∗ 𝒇𝒊 ෍ 𝑥𝑖2 ∗ 𝑓𝑖
50 7526
𝑠2 = − 12.22 = 𝟏. 𝟕𝟏 𝒎𝒆𝒔𝒆𝒔𝟐
50 − 1 50

En la muestra el grado de variabilidad de los meses que tardan los niños en


dar sus primeros pasos es 1.7 𝒎𝒆𝒔𝒆𝒔𝟐 con respecto a la media.
MEDIDAS DE DISPERSIÓN: Absolutas
VARIANZA
EJEMPLO:
Las calorías que se pierden en una hora de gimnasio, en una muestra
aleatoria de 80 personas se presentan a continuación en la siguiente tabla.

Marca de
Calorías fi Interés:
clase Xi
90-130 110 15 Determine el grado de variabilidad
130-170 150 22 de las calorías que se pierde en
170-210 190 24 una hora de gimnasio.
210-250 230 15
250-290 270 4
Total 80
MEDIDAS DE DISPERSIÓN: Absolutas
SECCIÓN DE REFERENCIA

VARIANZA
EJEMPLO

Marca de
Calorías fi 𝒙𝒊 ∗ 𝒇𝒊 𝒙𝟐𝒊 ∗ 𝒇𝒊 σ 2∗ 𝑓 ෌ 𝑥𝑖2 ∗ 𝑓𝑖
clase (Xi) (𝑥𝑖 − 𝑥)
ҧ 𝑖 𝑠2 =
𝑛
− 𝑥ҧ 2
𝑠2 = 𝜂−1 𝑛
90-130 110 15 1650 181500 𝑛−1
(Xi : marca de clase)
130-170 150 22 3300 495000
170-210 190 24 4560 866400
210-250 230 15 3450 793500 σ 𝑥𝑖 ∗𝑓𝑖 614040
250-290 270 4 1080 291600 𝑥ҧ = = = 175.5 𝑐𝑎𝑙 2 .
𝑛 80
Total 80 14040 2628000

𝑛 ෍ 𝒙𝒊 ∗ 𝒇𝒊 ෍ 𝑥𝑖2 ∗ 𝑓𝑖 80 2628000
𝑠2 = − 175.52 = 𝟐𝟎𝟕𝟓. 𝟕 𝒄𝒂𝒍𝟐
80−1 80

En la muestra el grado de variabilidad de las calorías que se pierde en una hora de gimnasio es de
𝟐𝟎𝟕𝟓. 𝟕 𝒄𝒂𝒍𝟐 con respecto a la media.
MEDIDAS DE DISPERSIÓN: Absolutas

DESVIACIÓN ESTÁNDAR
La desviación estándar o desviación típica es una medida de variabilidad
de los datos respecto a la media aritmética.

Se define como la raíz cuadrada de la varianza.

Indica la dispersión promedio de


los datos con respecto a la media.

CARACTERÍSTICAS:

• Sus unidades no están elevadas al cuadrado.


• Se usa cuando la media es representativa a un conjunto de datos.
• Cuanto menor sea la desviación estándar, menor será la dispersión (más
homogénea) y cuanto mayor sea la desviación típica, mayor dispersión (menos
homogénea).
• Es mayor o igual a cero.
MEDIDAS DE DISPERSIÓN: Absolutas
SECCIÓN DE REFERENCIA

DESVIACIÓN ESTÁNDAR
POBLACIÓN MUESTRA
σ(𝑋𝑖 −𝜇)2 ത 2
σ(𝑋𝑖 −𝑋)
DATOS NO 117 161 116 𝜎= 𝜎2 = 𝑁 𝑆= 𝑆2 = 𝑛−1
AGRUPADOS 353 123 376

Sin
σ(𝑋𝑖 −𝜇)2 ∗𝑓𝑖 ത 2 ∗𝑓𝑖
σ(𝑥𝑖 −𝑋)
Intervalos 𝜎= 𝜎2 = 𝑁
𝑆= 𝑆2 = 𝑛−1

Para obtener
sus valores (Xi : valor de la variable)
depende como
se presentan los DATOS
datos.
AGRUPADOS

σ(𝑋𝑖 −𝜇)2 ∗𝑓𝑖 ത 2 ∗𝑓𝑖


σ(𝑥𝑖 −𝑋)
Con 𝜎= 𝜎2 = 𝑁
𝑆= 𝑆2 = 𝑛−1
Intervalos
(Xi : marca de clase)
MEDIDAS DE DISPERSIÓN: Absolutas
SECCIÓN DE REFERENCIA

DESVIACIÓN ESTÁNDAR
EJEMPLO
Retomando el ejemplo de los tiempos de hospitalización en días de una
muestra aleatoria de 10 pacientes. 5, 7, 6, 4, 5, 7, 8, 5, 3, 5
Interés: Determine la desviación estándar de los tiempo de hospitalización.

Indica la dispersión promedio


𝑆 = 𝑆2 =
ഥ 2
σ(𝑋𝑖 −𝑋)
= 2.78 = 1.67 días
del tiempo de hospitalización en
𝑛−1
la muestra es de 1,67 días con
respecto al promedio.

NOTA: EL RESULTADO 1,67 DIAS SOLO INDICA LA DISPERSIÓN PROMEDIO DE LOS TIEMPO DE ESPERA,
PERO NO PODEMOS ATRIBUIRLE UNA CUALIDAD QUE INDIQUE SI ES POCA DISPERSION, DISPERSION
ACEPTABLE, DISPERSION ALTA O MUY ALTA, EN ESTE CASO RECURRIREMOS AL COEFICIENTE DE
VARIACION.
MEDIDAS DE DISPERSIÓN: Relativas

COEFICIENTE DE VARIACIÓN
Es una MEDIDA RELATIVA de variabilidad de los datos entre la media y
la desviación estándar de una población. Expresa qué tanto por ciento la
desviación estándar representa de la media aritmética.

Se obtiene: Indica la variabilidad


𝑫𝒆𝒔𝒗𝒊𝒂𝒄𝒊ó𝒏 𝒆𝒔𝒕á𝒏𝒅𝒂𝒓 promedio de los datos
𝐂𝐕 = *100% con respecto a la media
𝑴𝒆𝒅𝒊𝒂 𝒂𝒓𝒊𝒕𝒎é𝒕𝒊𝒄𝒂 aritmética expresada en
porcentajes.

Población Muestra
σ 𝑺
𝐂𝐕 = *100% 𝐂𝐕 = *100%
µ ഥ
𝑿
MEDIDAS DE DISPERSIÓN: Relativas

COEFICIENTE DE VARIACIÓN

Si 00 < C.V. ≤ 10%, poca dispersión. Si CV ≤ 33%, Población


HOMOGÉNEA
Si 10 < C.V. ≤ 33%, dispersión aceptable.
Si 33 < C.V. ≤ 50%, alta dispersión. Si CV > 33%, Población
Si C.V. > 50%, dispersión muy alta. HETEROGÉNEA

Además, es útil para comparar la variabilidad relativa de datos


de dos o más distribuciones expresados en unidades iguales o
diferentes. Habrá mayor dispersión en la distribución que tenga
mayor coeficiente de variación y viceversa.
MEDIDAS DE DISPERSIÓN: Relativas

COEFICIENTE DE VARIACIÓN
EJEMPLO
Retomando el ejemplo de los tiempos de hospitalización en días de una
muestra aleatoria de 10 pacientes. 5, 7, 6, 4, 5, 7, 8, 5, 3, 5
Interés: Determine el porcentaje de variación de los tiempo de hospitalización
con respecto a la media.

𝑺 𝟏.𝟔𝟕 𝒅𝒊𝒂𝒔
𝐂𝐕 = ഥ *100% = *100% = 30.4%
𝑿 𝟓.𝟓 𝒅𝒊𝒂𝒔

En la muestra la desviación estándar es el 30.4% de la


media, es decir, el 30.4% de la variación de los tiempos de
hospitalización respecto de la media.
Además, la dispersión de los tiempos de hospitalización es
aceptable y se trata de una población homogénea.
MEDIDAS DE DISPERSIÓN: Relativas

COEFICIENTE DE VARIACIÓN
EJEMPLO
Supongamos que de dos poblaciones se han obtenido los
siguientes datos: Grupo 1 Grupo 2

Edad μ = 25 años 21 años


PESO TALLA Interés: ¿Qué grupo es más
μ = 72.5 Kg 165 cm
homogéneo o menos variable?
 = 5 Kg 5 cm
N = 15 15

𝟓 𝒌𝒈.
𝐂𝐕𝟏 = *100% = 6.9% La dispersión de las tallas
𝟕𝟐.𝟓 𝒌𝒈.
del grupo 2 es menor que
la dispersión de los pesos
𝟓 𝒄𝒎. del grupo 1.
𝐂𝐕𝟐 = *100% = 3.03%
𝟏𝟔𝟓 𝒄𝒎.
APLIQUEMOS LO APRENDIDO
1.- Cierta fábrica tiene un departamento de producción y otro de ventas. Las
tablas que se muestran a continuación muestran los salarios percibidos
hasta fines de mayo de este año (expresado en miles de soles):

Dpto. producción Dpto. ventas


Nº Nº
Intervalos Intervalos
trabajadores trabajadores
1 – 1.5 12 6-8 4
1.5 – 2 28 8 – 10 6
2 – 2.5 32 10 – 12 12
2.5 – 3 24 12 – 14 15
3 – 3.5 12 14 – 16 3
a) Hallar la desviación típica correspondiente a cada departamento.
b) Determinar cuál de los departamentos presenta mayor
dispersión relativa.
APLIQUEMOS LO APRENDIDO

2.-Los siguientes valores son los niveles de hemoglobina(g/100ml) de 8


niños que reciben tratamiento para anemia hemolítica:

9.2 10 11 9.8 13 11.4 12 13.4

Halle la varianza y el coeficiente de variación


APLIQUEMOS LO APRENDIDO
3.-La siguiente tabla muestra la distribución de edades de casos de una
cierta enfermedad reportadas durante un año en un estado particular.

Edades fi
30 – 34 6
34 – 38 2
38 – 42 8
42 – 46 3
46 – 50 10

Halle la varianza y el coeficiente de variación


APLIQUEMOS LO APRENDIDO
4.- La Dirección General de ESSALUD está interesada en estudiar los casos de varicela
en los niños. Para ello selecciona una muestra aleatoria de niños que acaban de salir del
proceso de la enfermedad (grupo I) del distrito de Miraflores y otro grupo de niños (grupo
II) del distrito de Breña. Se registró la edad en que se presentó la mencionada
enfermedad en ambos grupos de niños. Los datos se muestran a continuación:

Grupo I
1 2 4 1 ഥ𝟏 = 𝟐
𝒙 𝒔𝟐𝟏 = 𝟏. 𝟓

ഥ𝟐 = 𝟐
𝒙 𝒔𝟐𝟐 = 𝟓. 𝟓
Grupo II 2 7 7 8

Determine el coeficiente de variación e indique que grupo es más


homogéneo.

También podría gustarte