Está en la página 1de 40

ESTADÍSTICA GENERAL

Departamento Académico de Cursos Básicos


MEDIDAS DE
DISPERSION

Semana 05
Sesión 10
Resultado de aprendizaje de la sesión

Al finalizar la sesión, el estudiante interpreta medidas de dispersión en datos agrupados


y no agrupados usando las fórmulas correctas
Reflexión desde la experiencia
A continuación se presentan los
sueldos mensuales de los enfermeros Los siguientes resultados corresponden a
en dos clínicas son los siguientes: dos muestras formadas por varones

https://bit.ly/366hiHG

En estos casos las medias no


aportan suficiente información,
No se puede decidir
Se necesita un indicador de Se debe MEDIDAS DE
comparando las cómo están diseminados los DISPERSIÓN
recurrir
medias. datos alrededor del centro de la
distribución.
Reflexión desde la experiencia

Responde en el padlet las siguientes


preguntas:

• ¿Qué es una medida de dispersión ?


• ¿Para que sirven las medidas de dispersión ?
Desarrollo del tema
Rango
Rango intercuartílico
Varianza
Desviación estándar
Coeficiente de variación
Medidas de dispersión

Todos los valores representativos discutidos en las clases anteriores han sido una
especie de promedio o medida de posición.

Sin embargo, el uso de un solo valor para describir una distribución oculta muchos
hechos importantes.

Por ejemplo, dos grupos separados de datos puede contener la misma media, pero
un grupo puede estar mas disperso o esparcido alrededor de la media que el otro.

Por lo que es necesario una medida de dispersión, esparcimiento o variación para


ayudar a definir completamente la distribución.

Mientras menor es la dispersión, mas típico es el valor de la media para toda la


distribución.
Medidas de dispersión

Llamadas también medidas de variabilidad, miden el grado de separación de los


datos respecto a un valor central.

Son útiles porque:

1. Permiten juzgar la confiabilidad de la medida de tendencia central.


2. Los datos demasiados dispersos tienen un comportamiento especial.
3. Es posible comparar dispersión de diversas muestras.
4. Permite determinar el tipo de población, tipo muestreo.
5. Mide la bondad de ajuste en un análisis de regresión.
6. Cuantifica los riesgo en toma de decisiones.
Medidas de dispersión

MEDIDAS DE DISPERSIÓN

ABSOLUTAS RELATIVAS

Rango Coeficiente de Variación

Rango Intercuartílico

Varianza

Desviación Estándar
Rango o amplitud

Se define como la diferencia entre el valor máximo y el valor mínimo de un conjunto de


datos, es decir:
Indica intuitivamente la mayor
R = X máx. – X mín. distancia, diferencia o variación
que existe en un conjunto de datos
CARACTERÍSTICAS: entre el valor máximo y el valor
mínimo
• Solo usa dos datos para su cálculo.
• Hace referencia al recorrido que hace la variable desde el valor mínimo
hasta el valor máximo.
• Es afectado por valores atípicos, por lo que no se recomienda su uso.
• Es la medida de dispersión mas sencilla de calcular.
• El rango aumenta o se mantiene al incrementar el número de datos.
• Se usa cuando el número de datos es pequeño.
Rango o amplitud

Ejemplo
Se tiene el tiempo de espera (en minutos), de Los siguientes datos corresponden a
los pacientes que acudieron al servicio de las notas del curso de Estadística
medicina en el Hospital San Pedro en el mes General de la UCSUR
de Diciembre 2020. 10 12 15 08 15 18 17 16 11 12 07
18 17 16 15 10 11 13 14 15 16 10
8 13 22 26 16 23 35 43 17 32 10 18 12 07 12 14 16 16 14 13 15
41 35 24 23 27 16 20 60 48 17 10 15 12 15 17 16 12 14 18 17
Determine la variabilidad total de los tiempos 10 16 13 11
de espera.
Determine la variabilidad total de las
X mín. = 8 X máx. = 60 notas.
X mín. = 07 X máx. = 18
R = 60 – 8 = 52 min. R = 18 – 7 = 11 ptos
Rango intercuartílico

Se define como la diferencia entre el primer y tercer cuartil, es decir:

Indica la variabilidad total del 50%


RIC = Q3 – Q1 de los datos centrales entre el
cuartil 1 y cuartil 3
CARACTERÍSTICAS:
• Su cálculo es sencillo, solo usa dos cuartiles.
• Hace referencia al recorrido que hace la variable desde el cuartil 1 https://bit.ly/3vQ1EuP

hasta el cuartil 3.
• No es afectado por valores atípicos o extremos, se recomienda su uso.
• El rango aumenta o se mantiene al incrementar el número de datos.
• Excluye el 25% mas alto y el 25% mas bajo.
• Se usa cuando la mediana es representativa a un conjunto de datos
Rango intercuartílico

Ejemplo
Si Q1=8,82 años; Q3=15,65 años corresponde la experiencia (en años) del personal
que labora en el Hospital María Auxiliadora.

a.-¿Entre qué valores se El 50% de los trabajadores con


encuentra el 50% intermedio de experiencia intermedia se
estos datos? encuentran entre 8,82 y 15,65 años.

b.- ¿Cuál es el rango intercuartílico?

RIC = 15,65 – 8,82 = 6,83 años


Varianza

Es una medida de dispersión que indica cómo las observaciones se separan de la media
aritmética.
Se define como el promedio de las desviaciones al cuadrado de cada uno de los datos
con respecto a la media.
Indica el grado de variabilidad de los
datos con respecto a la media.
CARACTERÍSTICAS:

• Sus unidades están elevadas al cuadrado.


• Se usa cuando la media es representativa a un conjunto de datos.
• Esta medida de dispersión será grande si las observaciones están distantes de la
media y pequeña si están cerca.
• Es mayor o igual a cero.
Varianza

POBLACIÓN MUESTRA

σ(𝑥 − µ) 2 σ 2
DATOS NO 117 161 116 𝑖 (𝑥𝑖 − 𝑥)
ҧ
AGRUPADOS 353 123 376 σ2 = 𝑠2 =
𝑁 𝑛−1

Para Sin 2 2
obtener 2
σ (𝑥𝑖 − µ) ∗ 𝑓𝑖 2
σ(𝑥𝑖 − 𝑥)
ҧ ∗ 𝑓𝑖
sus
Intervalos σ = 𝑠 =
𝑁 𝑛−1
valores
depende
como se
DATOS
(Xi : valor de la
presentan variable)
los datos. AGRUPADOS

2 ∗ 𝑓𝑖 σ(𝑥 − 𝑥)
ҧ 2 ∗ 𝑓𝑖
Con σ (𝑥𝑖 − µ) 2 = 𝑖
Intervalos
2
σ = 𝑠
𝑁 𝑛−1
(Xi : marca de clase)
Varianza

Ejemplo
Los siguientes son tiempos de hospitalización en días de una muestra aleatoria de
10 pacientes. 5, 7, 6, 4, 5, 7, 8, 5, 3, 5
Interés: Determine el grado de variabilidad del tiempo de hospitalización
σ (𝑥 − 𝑥)
ҧ 2
𝑖
𝑠2 =
𝑛−1
Realizando los cálculos
55
preliminares: ෍ 𝑥𝑖 = 55 ; n = 10 ; 𝑥ҧ = = 5,5 días
10
(5−5,5)2 +(7−5,5)2 +(6−5,5)2 +(4−5,5)2 +(5−5,5)2 +(7−5,5)2 +(8−5,5)2 +(5−5,5)2 +(3−5,5)2 +(5−5,5)2
𝑠2 =
10−1
𝑠 2 = 2,28 dias2
Nota: Al trabajar con la varianza las unidades están elevadas al cuadrado por lo que
dificultad su interpretación, ósea no es recomendable usar la varianza para analizar datos,
en este caso recurriremos a su alternativa la desviación estándar.
Varianza

A continuación se presentan los ingresos semanales de los trabajadores de la empresa A.

Ingresos Número de
(Soles) personas(fi)
Interés: Determine el grado de variabilidad de los ingresos
300 10 semanales de los trabajadores de la empresa A.
330 15
350 20
360 5
Varianza

Ingresos (Xi) Número de xifi ഥ)𝟐 𝒇𝒊


(𝒙𝒊 − 𝒙 𝑥ҧ = 335 𝑠𝑜𝑙𝑒𝑠
personas (fi)
300 10 3000 (𝟑𝟎𝟎 − 𝟑𝟑𝟓)𝟐 . 𝟏𝟎 = 𝟏𝟐𝟐𝟓𝟎 σ(𝑥 − 𝑥)
ҧ 2∗ 𝑓
2 𝑖 𝑖
330 15 4950 (𝟑𝟑𝟎 − 𝟑𝟑𝟓)𝟐 . 𝟏𝟓 = 𝟑𝟕𝟓 𝑠 =
350 20 7000 (𝟑𝟓𝟎 − 𝟑𝟑𝟓)𝟐 . 𝟐𝟎 = 𝟒𝟓𝟎𝟎 𝑛−1
360 5 1800 (𝟑𝟔𝟎 − 𝟑𝟑𝟓)𝟐 . 𝟓 = 𝟑𝟏𝟐𝟓
Total 50 16750 20250
𝑛 ෍ 𝒙𝒊 ∗ 𝒇𝒊 ෍(𝑥𝑖 − 𝑥)ҧ 2 ∗ 𝑓𝑖

20250
𝑠2 = = 𝟒𝟏𝟑, 𝟐𝟕𝒔𝒐𝒍𝒆𝒔𝟐
50 − 1
En la muestra el grado de variabilidad los ingresos semanales de los trabajadores de la
empresa A es 413,27 𝒔𝑜𝑙𝑒𝑠 𝟐 con respecto a la media.
Varianza

Ejemplo:
La siguiente tabla representa la distribución de la edades de una muestra de 50
trabajadores.

https://bit.ly/35qEJeO

Interés:
Determine el grado de variabilidad de las edades de los trabajadores
Varianza

Edades Marca de clase (Xi) fi xifi ഥ)𝟐 ∗ 𝒇𝒊


(𝒙𝒊 − 𝒙
20-30 25 6 150 (𝟐𝟓 − 𝟑𝟕)𝟐 ∗ 𝟔=864
𝑥ҧ = 37 𝑎ñ𝑜𝑠
30-40 35 30 1050 (𝟑𝟓 − 𝟑𝟕)𝟐 ∗ 𝟑𝟎=120
40-50 45 12 540 (𝟒𝟓 − 𝟑𝟕)𝟐 ∗ 𝟏𝟐=768
50-60 55 2 110 (𝟓𝟓 − 𝟑𝟕)𝟐 ∗ 𝟐=648
Total 50 1850 2400
𝑛 ෍ 𝒙𝒊 ∗ 𝒇𝒊 ෍(𝑥𝑖 − 𝑥)ҧ 2 ∗ 𝑓𝑖

σ (𝑥 − 𝑥)
ҧ 2∗ 𝑓 2400
𝑖 𝑖 2
𝑠2 = 𝑠 = = 𝟒𝟗, 𝟗𝟖𝒂ñ𝒐𝒔𝟐
𝑛−1 50 − 1
(Xi : marca de clase)

En la muestra el grado de variabilidad de las edades de los trabajadores es de


49,98 𝒂ños𝟐 con respecto a la media.
Desviación estándar

La desviación estándar o desviación típica es una medida de variabilidad de los


datos respecto a la media aritmética.
Se define como la raíz cuadrada de la varianza.

Indica la dispersión promedio de los datos


con respecto a la media.
CARACTERÍSTICAS:

• Sus unidades no están elevadas al cuadrado.


• Se usa cuando la media es representativa a un conjunto de datos.
• Cuanto menor sea la desviación estándar, menor será la dispersión (más
homogénea) y cuanto mayor sea la desviación típica, mayor dispersión (menos
homogénea).
• Es mayor o igual a cero.
Desviación estándar

DATOS NO 117 161 116 𝜎= 𝜎2 = σ(𝑋𝑖 −𝜇)2


𝑁 𝑆= 𝑆2 =
ത 2
σ(𝑋𝑖 −𝑋)
𝑛−1
AGRUPADOS 353 123 376

Sin
Intervalos σ(𝑋𝑖 −𝜇)2 ∗𝑓𝑖 ത 2 ∗𝑓𝑖
σ(𝑥𝑖 −𝑋)
𝜎= 𝜎2 = 𝑁 𝑆= 𝑆2 = 𝑛−1
Para obtener
sus valores
depende (Xi : valor de la variable)
como se
presentan DATOS
los datos. AGRUPADOS

σ(𝑋𝑖 −𝜇)2 ∗𝑓𝑖 ത 2 ∗𝑓𝑖


σ(𝑥𝑖 −𝑋)
Con 𝜎= 𝜎2 = 𝑁
𝑆= 𝑆2 = 𝑛−1

Intervalos
(Xi : marca de clase)
Desviación estándar

Retomando el ejemplo de los tiempos de hospitalización en días de una muestra


aleatoria de 10 pacientes. 5, 7, 6, 4, 5, 7, 8, 5, 3, 5
Interés: Determine la desviación estándar de los tiempo de hospitalización.

Indica la dispersión promedio del


tiempo de hospitalización en la
ഥ 2
σ(𝑋𝑖 −𝑋)
𝑆= 𝑆2 = 𝑛−1
= 2,28𝑑í𝑎𝑠 2 = 1,51 días muestra es de 1,51 días con
respecto al promedio.

Nota: El resultado 1,51 días solo indica la dispersión promedio de los tiempo de espera,
pero no podemos atribuirle una cualidad que indique si es poca dispersión, dispersión
aceptable, dispersión alta o muy alta, en este caso recurriremos al coeficiente de
variación.
Coeficiente de variación

Es una MEDIDA RELATIVA de variabilidad de los datos entre la media y la


desviación estándar de una población. Expresa qué tanto por ciento la
desviación estándar representa de la media aritmética.
Se obtiene:
Indica la variabilidad promedio
𝑫𝒆𝒔𝒗𝒊𝒂𝒄𝒊ó𝒏 𝒆𝒔𝒕á𝒏𝒅𝒂𝒓 de los datos con respecto a la
𝐂𝐕 = *100% media aritmética expresada en
𝑴𝒆𝒅𝒊𝒂 𝒂𝒓𝒊𝒕𝒎é𝒕𝒊𝒄𝒂
porcentajes.

Población Muestra
σ 𝑺
𝐂𝐕 = *100% 𝐂𝐕 = *100%
µ ഥ
𝑿
Coeficiente de variación

Si: 0% < C.V. ≤ 10%, poca dispersión. Si CV ≤ 33%, Población


Si: 10% < C.V. ≤ 33%, dispersión aceptable. HOMOGÉNEA
Si: 33% < C.V. ≤ 50%, alta dispersión. Si CV > 33%, Población
Si: C.V. > 50%, dispersión muy alta. HETEROGÉNEA

Además, es útil para comparar la variabilidad relativa de datos de dos o más


distribuciones expresados en unidades iguales o diferentes. Habrá mayor
dispersión en la distribución que tenga mayor coeficiente de variación y
viceversa.
Coeficiente de variación

Ejemplo
Retomando el ejemplo de los tiempos de hospitalización en días de una muestra
aleatoria de 10 pacientes. 5, 7, 6, 4, 5, 7, 8, 5, 3, 5
Interés: Determine el porcentaje de variación de los tiempo de hospitalización
con respecto a la media.

𝑺 𝟏,𝟓𝟏 𝒅𝒊𝒂𝒔
𝐂𝐕 = ഥ
*100% = *100% = 27,5%
𝑿 𝟓,𝟓 𝒅𝒊𝒂𝒔

En la muestra la desviación estándar es el 27,5% de la media, es decir, el 27,5% de la


variación de los tiempos de hospitalización respecto de la media. Además, la dispersión
de los tiempos de hospitalización es aceptable y se trata de una población homogénea.
Coeficiente de variación

Ejemplo
Supongamos que de dos poblaciones se han obtenido los siguientes datos:
Grupo 1 Grupo 2
Edad μ = 25 años μ = 21 años
PESO TALLA
Interés: ¿Qué grupo es
μ = 72.5 Kg μ = 165 cm
mas homogéneo o menos
 = 5 Kg  = 5 cm
variable?
N = 15 N = 15

𝟓 𝒌𝒈. La dispersión de las tallas del grupo 2 es


𝐂𝐕𝟏 = *100% = 6,9%
𝟕𝟐.𝟓 𝒌𝒈. menor que la dispersión de los pesos del
grupo 1.
𝟓 𝒄𝒎. Por lo tanto el grupo mas homogéneo es
𝐂𝐕𝟐 = *100% = 3,03%
𝟏𝟔𝟓 𝒄𝒎. grupo 2.
Apliquemos lo aprendido
Apliquemos lo aprendido
Integremos lo aprendido
Integremos lo aprendido

1)¿Cuándo un grupo de datos es homogéneo?


2)¿ Cuándo un grupo de datos es heterogéneo?

https://bit.ly/3pKZIzIc
EVALUACIÓN CONTINUA 1

Semana 5
Sesión 9
EVALUACIÓN CONTINUA 1
La Evaluación Continua 1 (EC1) es un examen de desarrollo cuyo propósito es establecer el nivel
de logro de los aprendizajes considerados en el curso. Se realizará en la semana 5.
La Evaluación Continua 1 representa el 18 % del sistema de evaluación establecido en el silabo.

Descripción de la actividad

Los estudiantes recibirán la Evaluación continua 1 y luego de leer las situaciones planteadas
podrán empezar con el desarrollo de la evaluación.
La duración para esta actividad será de 110 minutos y deberá rendirse de manera individual.
El estudiante entregará la prueba adjuntando el proceso de resolución de cada pregunta
planteada.
La Evaluación continua 1 consta de 4 preguntas de desarrollo.
Actividad complementaria
Actividad complementaria

Resuelve la autoevaluación 5
en el aula virtual
Referencias Bibliográficas
Referencias Bibliográficas
Cárdenas, R. (2014). Estadística en la educación. Digital UNID. bit.ly/3GSn1kB

Celis de la Rosa, A. y Labrada, V. (2014). Bioestadística. El Manual Moderno. http://bit.ly/3Uh9VR2

De Oteyza, E., Lam, E., Hernández, C. y Carrillo, A. (2015). Probabilidad y estadística. Pearson.
http://bit.ly/3Vw7JGs

Martínez, C. (2012). Estadística y muestreo. Eco ediciones. http://bit.ly/3UjMG8E

Obando, J. y Arango, N. (2013). Probabilidad y estadística. Fondo Editorial Universidad EIA.


http://bit.ly/3FehZxG

Posada, G. (2016). Elementos básicos de estadística descriptiva para el análisis de datos. Fundación
Universitaria Luis Amigó. http://bit.ly/3AYplmh

Rodríguez, J., Pierdant, A. y Rodríguez, C.(2014) . Estadística para administración. Grupo editorial patria,
http://bit.ly/3Ud3Vso
Referencias Bibliográficas
Ross, M. (2014). Introducción a la estadística. REVERTÉ. http://bit.ly/3ua4AjA

Warr, R. y Erich, R. (2019). Should the Interquartile Range Divided by the Standard Deviation be
Used to Assess Normality? The American Statistician, 67(4), 242–244. http://bit.ly/3XUJKCK

DE CONSULTA

Anderson, D., Sweeney, D. y Williams, T. (2008). Estadística para administración y economía.


Cengage Learning Editores. http://bit.ly/3XJPpv3

Triola, M. (2018). Estadística. Pearson educación. http://bit.ly/3UhadHC

Walpole, R., Myers, R., Myers, S. y Ye, K. (2012). Probabilidad y estadística para ingeniería y ciencias.
Pearson educación. http://bit.ly/3GUBdJV

También podría gustarte