Está en la página 1de 37

ESTADÍSTICA

GENERAL
MEDIDAS DE
DISPERSIÓN
RANGO, VARIANZA, DESVIACIÓN
ESTÁNDAR, COEFICIENTE DE VARIACIÓN

SEMANA 05
SESION 9-10
SECCIÓN DE REFERENCIA

RESULTADO DE APRENDIZAJE DE LA SESIÓN

Al finalizar la sesión, el estudiante interpreta


medidas de dispersión en datos agrupados y
no agrupados usando las fórmulas correctas
REFLEXIÓN DESDE LA EXPERIENCIA
TÍTULO

https://bit.ly/366hiHG

En estos casos las medias no


No se puede decidir aportan suficiente información,
Se debe MEDIDAS
Se necesita un indicador de
comparando las cómo están diseminados los recurrir DE
medias. datos alrededor del centro de la DISPERSIÓN
distribución.
REFLEXIÓN DESDE LA EXPERIENCIA

Responde en el padlet las


siguientes preguntas:

• ¿Qué es una medida de dispersión ?


• ¿Para que sirve las medidas de dispersión ?
Medidas de dispersión
SECCIÓN DE REFERENCIA

Introducción
Todos los valores representativos discutidos en las clases anteriores han sido una especie de
promedio o medida de posición.

Sin embargo, el uso de un solo valor para describir una distribución oculta muchos hechos
importantes.

Por ejemplo, dos grupos separados de datos puede contener la misma media, pero un grupo
puede estar mas disperso o esparcido alrededor de la media que el otro.

Por lo que es necesario una medida de dispersión, esparcimiento o variación para ayudar a
definir completamente la distribución.

Mientras menor es la dispersión, mas típico es el valor de la media para toda la distribución.
Medidas de dispersión
SECCIÓN DE REFERENCIA

Concepto
Llamadas también medidas de variabilidad, miden el grado de
separación de los datos respecto a un valor central.

Son útiles porque:


1. Permiten juzgar la confiabilidad de la medida de tendencia central.
2. Los datos demasiados dispersos tienen un comportamiento especial.
3. Es posible comparar dispersión de diversas muestras.
4. Permite determinar el tipo de población, tipo muestreo.
5. Mide la bondad de ajuste en un análisis de regresión.
6. Cuantifica los riesgo en toma de decisiones.
MEDIDAS DE DISPERSIÓN

ABSOLUTAS RELATIVAS

Rango Coeficiente de
Variación
Rango Intercuartílico

Varianza

Desviación Estándar
Medidas de dispersión: absolutas
Rango o amplitud: R
Se define como la diferencia entre el valor máximo y el valor mínimo de un
conjunto de datos, es decir:
Indica intuitivamente la mayor
distancia, diferencia o variación que
R = X máx. – X mín. existe en un conjunto de datos entre
el valor máximo y el valor mínimo

CARACTERÍSTICAS:

• Solo usa dos datos para su cálculo.


• Hace referencia al recorrido que hace la variable desde el valor mínimo hasta
el valor máximo.
• Es afectado por valores atípicos, por lo que no se recomienda su uso.
• Es la medida de dispersión mas sencilla de calcular.
• El rango aumenta o se mantiene al incrementar el número de datos.
• Se usa cuando el número de datos es pequeño.
Medidas de dispersión: absolutas
SECCIÓN DE REFERENCIA

Rango o amplitud: R
EJEMPLO EJEMPLO
Se tiene el tiempo de espera (en minutos), de los Los siguientes datos corresponden a las
pacientes que acudieron al servicio de medicina notas del curso de Estadística General de
en el Hospital San Pedro. Diciembre 2020. la UCSUR
10 12 15 08 15 18 17 16 11 12 07 18 17 16
10 13 22 26 16 23 35 43 17 32 15 10 11 13 14 15 16 10 10 18 12 07 12 14
41 35 24 23 27 16 20 50 48 16 16 14 13 15 17 10 15 12 15 17 16 12
14 18 17 10 16 13 11
Determine la variabilidad total de los tiempos de espera. Determine la variabilidad total de las notas.

X mín. = 10 X máx. = 50 X mín. = 07 X máx. = 18

R = 50 – 10 = 40 min. R = 18 – 7 = 11 ptos
Medidas de dispersión: absolutas
Rango intercuartílico
Se define como la diferencia entre el primer y tercer cuartil, es decir:

Indica la variabilidad total del


RIC = Q3 – Q1 50% de los datos centrales
entre el cuartil 1 y cuartil 3

CARACTERÍSTICAS:
https://bit.ly/3vQ1EuP
• Su cálculo es sencillo, solo usa dos cuartiles.
• Hace referencia al recorrido que hace la variable desde el cuartil 1 hasta el
cuartil 3.
• No es afectado por valores atípicos o extremos, se recomienda su uso.
• El rango aumenta o se mantiene al incrementar el número de datos.
• Excluye el 25% mas alto y el 25% mas bajo.
• Se usa cuando la mediana es representativa a un conjunto de datos
Medidas de dispersión: absolutas
Rango intercuartílico
EJEMPLO
Si Q1=8,82 años; Q3=15,65 años corresponde la experiencia (en años) del
personal que labora en el Hospital María Auxiliadora.

a.-¿Entre qué valores se El 50% de los trabajadores con


encuentra el 50% experiencia intermedia se
intermedio de estos datos? encuentran entre 8,82 y 15,65 años.

b.- ¿Cuál es el rango intercuartílico?

RIC = 15.65 – 8.82 = 6.83 años


Medidas de dispersión: absolutas
Varianza
Es una medida de Dispersión que indica cómo las observaciones se
separan de la Media Aritmética.

Se define como el promedio de las desviaciones al cuadrado de cada uno


de los datos con respecto a la media.

Indica el grado de variabilidad de


los datos con respecto a la media.

CARACTERÍSTICAS:

• Sus unidades están elevadas al cuadrado.


• Se usa cuando la media es representativa a un conjunto de datos.
• Esta medida de dispersión será grande si las observaciones están distantes de la
media y pequeña si están cerca.
• Es mayor o igual a cero.
Medidas de dispersión: absolutas
SECCIÓN DE REFERENCIA

Varianza
POBLACIÓN MUESTRA

DATOS NO 117 161 116 σ 2


=
∑ (𝑥 𝑖 − µ)2
𝑠=
∑ ( 𝑥𝑖 − 𝑥)2
2

AGRUPADOS 353 123 𝑁 𝑛− 1


376

Sin
Intervalos σ
2
=
∑ (𝑥 𝑖 − µ)2 ∗ 𝑓𝑖
𝑠=
2∑ ( 𝑥𝑖 − 𝑥)2 ∗ 𝑓𝑖
𝑁 𝑛 −1
Para obtener (Xi : valor de la variable)
sus valores
depende como
se presentan los DATOS
datos.
AGRUPADOS

σ
2
=
∑ (𝑥 𝑖 − µ)2 ∗ 𝑓𝑖 2
𝑠=
∑ ( 𝑥𝑖 − 𝑥)2 ∗ 𝑓𝑖
Con 𝑁 𝑛 −1
Intervalos
(Xi : marca de clase)
Medidas de dispersión: absolutas
Varianza
EJEMPLO
Los siguientes son tiempos de hospitalización en días de una muestra
aleatoria de 10 pacientes. 5, 7, 6, 4, 5, 7, 8, 5, 3, 5
Interés: Determine el grado de variabilidad del tiempo de hospitalización

2
𝑠 =
∑ ( 𝑥𝑖 − 𝑥)2

𝑛− 1
Realizando los 55
cálculos preliminares: ∑ 𝑥 𝑖=55 ;𝜂 =10 ; 𝑥=
10
=5 .5

= 2.28 dias2

NOTA: AL TRABAJAR CON LA VARIANZA LAS UNIDADES ESTAN ELEVADAS AL CUADRADO POR LO QUE
DIFICULTAD SU INTERPRETACION, OSEA NO ES RECOMENDABLE USAR LA VARIANZA PARA ANALIZAR
DATOS, EN ESTE CASO RECURRIREMOS A SU ALTERNATIVA LA DESVIACION ESTANDAR.
Medidas de dispersión: absolutas
Varianza
EJEMPLO
Un pediatra registra en una tabla el número de meses que los niños tardan
en dar sus primeros pasos luego de haber nacido y considera una muestra
aleatoria de 50 niños.
Meses Niños
Xi fi
9 1
10 4 Interés: Determine el grado de variabilidad
11 9 de los meses que los niños
12 16 tardan en dar sus primeros pasos
13 11
14 8
15 1
Total 50
Medidas de dispersión: absolutas
Varianza
EJEMPLO

Meses Niños
xifi   𝑥=12.2𝑚𝑒𝑠𝑒𝑠
Xi fi
9
10
1
4
9
40
10.24
19.36
2
𝑠=
∑ 𝑖
( 𝑥 − 𝑥)2
∗𝑓𝑖
11 9 99 12.96 𝑛 −1
12 16 192 0.64
13 11 143 7.04
14 8 112 25.92 2 84 𝟐
15 1 15 7.84 𝑠 = =𝟏 . 𝟕𝟏 𝒎𝒆𝒔𝒆𝒔
Total 50 610 84
( 50 −1 )

𝑛 ∑ 𝒙 𝒊 ∗ 𝒇 𝒊 ∑ (𝑥𝑖−𝑥) ∗𝑓 𝑖
2

En la muestra el grado de variabilidad del tiempo que tardan los niños en dar sus primeros
pasos es 1.7 con respecto a la media.
Medidas de dispersión: absolutas
Varianza
EJEMPLO:
Las calorías que se pierden en una hora de gimnasio, en una muestra
aleatoria de 80 personas se presentan a continuación en la siguiente tabla.

Marca de
Calorías fi Interés:
clase Xi
90-130 110 15 Determine el grado de variabilidad
130-170 150 22 de las calorías que se pierde en
170-210 190 24 una hora de gimnasio.
210-250 230 15
250-290 270 4
Total   80
Medidas de dispersión: absolutas
SECCIÓN DE REFERENCIA

Varianza
EJEMPLO

Marca
Calorías de clase fi xifi    = 175.5
(Xi)
90-130 110 15 1650 64353.75
130-170 150 22 3300 14305.5
170-210 190 24 4560 5046 2
𝑠=
∑ ( 𝑥 𝑖 − 𝑥)2
∗𝑓𝑖 (Xi : marca de clase)
210-250 230 15 3450 44553.75 𝑛 −1
250-290 270 4 1080 35721
Total   80 14040 163980

𝑛 ∑ 𝒙 𝒊 ∗ 𝒇 𝒊 ∑ (𝑥𝑖 −𝑥) ∗𝑓 𝑖2

En la muestra el grado de variabilidad de las calorías que se pierde en una hora de gimnasio es de con
respecto a la media.
Medidas de dispersión: absolutas
Desviación estándar
La desviación estándar o desviación típica es una medida de variabilidad
de los datos respecto a la media aritmética.
Se define como la raíz cuadrada de la varianza.

Indica la dispersión promedio de


los datos con respecto a la media.

CARACTERÍSTICAS:

• Sus unidades no están elevadas al cuadrado.


• Se usa cuando la media es representativa a un conjunto de datos.
• Cuanto menor sea la desviación estándar, menor será la dispersión (más
homogénea) y cuanto mayor sea la desviación típica, mayor dispersión
(menos homogénea).
• Es mayor o igual a cero.
Medidas de dispersión: absolutas
SECCIÓN DE REFERENCIA

Desviación estándar
POBLACIÓN MUESTRA

DATOS NO
AGRUPADOS
117

376
161
353
116
123
𝜎 =√ 𝜎 =
2
√ ∑ ( 𝑋 𝑖 −𝜇)2
𝑁
𝑆=√ 𝑆 =
2
√ ∑ (𝑋 𝑖 − 𝑋)2
𝑛− 1

Sin


Intervalos

Para
sus
obtener
valores
𝜎 =√ 𝜎 =
2
√ ∑ (𝑋 𝑖 −𝜇)2 ∗ 𝑓𝑖
𝑁
𝑆=√ 𝑆 =
2 ∑ (𝑥𝑖 − 𝑋 )2 ∗ 𝑓𝑖
𝑛− 1

depende como
se presentan los DATOS
datos. (Xi : valor de la variable)
AGRUPADOS

Con
Intervalos
𝜎 =√ 𝜎 =2
√ ∑ (𝑋 𝑖 −𝜇)2 ∗ 𝑓𝑖
𝑁
𝑆=√ 𝑆 = 2
√ ∑ (𝑥𝑖 − 𝑋 )2 ∗ 𝑓𝑖
𝑛− 1

(Xi : marca de clase)


Medidas de dispersión: absolutas
SECCIÓN DE REFERENCIA

Desviación estándar
EJEMPLO
Retomando el ejemplo de los tiempos de hospitalización en días de una
muestra aleatoria de 10 pacientes. 5, 7, 6, 4, 5, 7, 8, 5, 3, 5
Interés: Determine la desviación estándar de los tiempo de hospitalización.

Indica la dispersión promedio


= 1.51 días del tiempo de hospitalización en
la muestra es de 1,51 días con
respecto al promedio.

NOTA: EL RESULTADO 1,51 DIAS SOLO INDICA LA DISPERSIÓN PROMEDIO DE LOS TIEMPO DE ESPERA,
PERO NO PODEMOS ATRIBUIRLE UNA CUALIDAD QUE INDIQUE SI ES POCA DISPERSION, DISPERSION
ACEPTABLE, DISPERSION ALTA O MUY ALTA, EN ESTE CASO RECURRIREMOS AL COEFICIENTE DE
VARIACION.
Medidas de dispersión: relativas
Coeficiente de variación
Es una MEDIDA RELATIVA de variabilidad de los datos entre la media y
la desviación estándar de una población. Expresa qué tanto por ciento la
desviación estándar representa de la media aritmética.

Se obtiene: Indica la variabilidad


promedio de los datos con
*100% respecto a la media
aritmética expresada en
porcentajes.

Población Muestra

*100% *100%
Medidas de dispersión: relativas
Coeficiente de variación

Si 00 < C.V. ≤ 10%, poca dispersión. Si CV ≤ 33%, Población


HOMOGÉNEA
Si 10 < C.V. ≤ 33%, dispersión aceptable.
Si 33 < C.V. ≤ 50%, alta dispersión. Si CV > 33%, Población
Si C.V. > 50%, dispersión muy alta. HETEROGÉNEA

Además, es útil para comparar la variabilidad relativa de datos de dos o


más distribuciones expresados en unidades iguales o diferentes. Habrá
mayor dispersión en la distribución que tenga mayor coeficiente de
variación y viceversa.
Medidas de dispersión: relativas
Coeficiente de variación
EJEMPLO
Retomando el ejemplo de los tiempos de hospitalización en días de una
muestra aleatoria de 10 pacientes. 5, 7, 6, 4, 5, 7, 8, 5, 3, 5
Interés: Determine el porcentaje de variación de los tiempo de
hospitalización con respecto a la media.

*100% *100% = 27.2%

En la muestra la desviación estándar es el 27.2% de la media, es decir, el


27.2% de la variación de los tiempos de hospitalización respecto de la media.
Además, la dispersión de los tiempos de hospitalización es aceptable y se trata
de una población homogénea.
Medidas de dispersión: relativas
Coeficiente de variación
EJEMPLO
Supongamos que de dos poblaciones se han obtenido los
siguientes datos: Grupo 1 Grupo 2

Edad μ = 25 años 21 años


PESO TALLA Interés: ¿Qué grupo es más
μ = 72.5 Kg 165 cm homogéneo o menos variable?
 = 5 Kg 5 cm
N = 15 15

*100% 6.9% La dispersión de las tallas


del grupo 2 es menor que
la dispersión de los pesos
*100% 3.03% del grupo 1.
APLIQUEMOS LO APRENDIDO

1) Los siguientes valores representa la cantidad


de hemoglobina(g/100ml) presente en una muestra
de 8 niños que reciben tratamiento para anemia
hemolítica:
9.2 10 11 9.8 13 11.4 12 13.4
https://bit.ly/3tsve7u

Indique si la cantidad de hemoglobina es homogénea en la muestra.


2) Se desea estudiar la satisfacción general de los
clientes de una cadena de restaurantes mediante
una encuesta que arroja una puntuación en una
escala ascendente de agrado con la sucursal respec­
tiva. Se tomaron muestras aleatorias de 100 clientes
de cada una de las cuatro sucursales de la ca­dena
de restaurantes y se obtuvieron los siguientes datos. https://bit.ly/3xn62jR

¿Cuál sucursal tiene puntuaciones menos dispersas con respecto al promedio?


Justique su procedimiento.
3) La Dirección General de ESSALUD está interesada en estudiar
los casos de varicela en los niños. Para ello selecciona una
muestra aleatoria de niños que acaban de salir del proceso de la
enfermedad (grupo I) del distrito de Miraflores y otro grupo de
niños (grupo II) del distrito de Breña. Se registró la edad en que se
presentó la mencionada enfermedad en ambos grupos de niños.
Los datos se muestran a continuación:
 
Grupo I https://bit.ly/3NFo87L
1 2 4 1

Grupo II 2 7 7 8

Indique en que grupo las edades son menos dispersas.


SECCIÓN DE REFERENCIA

4) En la rutina de un laboratorio, se toma una muestra de 13


píldoras de cada uno de los lotes que recibe y se calcula la
media del componente activo (medido en miligramos), la cual
debe ser lo más parecida posible a un valor deseado
(supongamos 0.62 mg). ¿De cuál de las siguientes dos
farmacéuticas convenientes comprar un lote de medicamentos?

https://bit.ly/3mJICQZ
SECCIÓN DE REFERENCIA

5) Cierta fábrica tiene un departamento de producción y otro de ventas, las


siguientes tablas que se muestran a continuación reflejan los salarios percibidos
hasta fines de mayo de este año (expresado en miles de soles):

Dpto. producción   Dpto. ventas


Nº Nº
Intervalos   Intervalos
trabajadores trabajadores
1 – 1.5 12   6-8 4
1.5 – 2 28   8 – 10 6
2 – 2.5 32   10 – 12 12
2.5 – 3 24   12 – 14 15
3 – 3.5 12   14 – 16 3
a) Hallar la desviación típica correspondiente a cada departamento.
b) Determinar en que departamento los salarios presenta mayor dispersión respecto al
promedio.
INTEGREMOS LO APRENDIDO

https://bit.ly/3pKZIzI

• ¿Qué es una medida de dispersión?


• Si el CV es mayor al 50%, la media es
una medida representativa?
Actividad Asincrónica

Resolver el
cuestionario de la
semana 5.
SECCIÓN DE REFERENCIA

Referencias bibliográficas
SECCIÓN DE REFERENCIA

También podría gustarte