Documentos de Académico
Documentos de Profesional
Documentos de Cultura
4 Tema Medidas de Dispersion
4 Tema Medidas de Dispersion
MEDIDAS DE DISPERSIÓN
4.1 CONCEPTO.
4.2 RANGO O RECORRIDO. (R)
4.3 DESVIACIÓN MEDIA O PROMEDIO.
4.4 VARIANZA Y DESVIACION ESTANDAR O TIPICA
4.1 CONCEPTO.
Llamados también estadígrafos de dispersión, determinan como se agrupan o dispersan
los datos alrededor de un promedio escriben el grado de dispersión de los datos, es decir,
cuán separados se encuentran, como opuesto a datos que están muy concentrados o
cercanos entre sí.
Iindican lo representativa que es la medida de posición a mayor dispersión menor
representatividad de la medida de posición y viceversa.
Podemos preguntarnos ¿Por qué estudiar la dispersión? - Un promedio como la media o la
mediana solamente localiza el centro de los datos y esto es importante desde ese punto de
vista, pero un promedio no dice nada acerca de la diseminación de los datos.
Por ejemplo, usted es el Administrador o Contador de un gran comercio y una sucursal.
Le solicitan analizar las ventas del último año. Saca una muestra de datos en ambos, la
describe y determina que el monto de venta promedio en ambos comercio es el mismo.
¿Usted se conformaría solo con ese dato? y le diría al Gerente que ambos comercio andan
bien.- Seguramente no, trataría además de buscar alguna medida que le pueda indicar que
paso con todas las ventas respecto a su promedio.-
Por Ejemplo. - Peso promedio del varon en Sucre 70 kg, estatura promedio 1,56
RELATIVAS:
Son las que están expresadas en porcentajes. Se estudiará únicamente:
El Coeficiente de Variación.
R = Xi máximo – Xi mínimo.
R = 96 – 28 = 68
R = 68
X f
Rango R = Xi máx – Xi mín
3 12
R= 6-3 = 3
4 15
Para el Rango no interesa la reiteración de algún dato
5 13
6 10
50
Xj f
Peso Kg [Linf, Rango R = Xi máx – Xi mín
Marca Frecuencia
Lsup [ R= 70-40 = 30
de clase de Clase
Para el Rango no interesa la reiteración de algún dato
[40, 46[ 43 4
[46 , 52[ 49 5 Ocasionalmente se toma como rango a la diferencia de la
[52 , 58[ 55 7 marca de clase R= 67-43 = 24
[58, 64[ 61 6
[64 , 70[ 67 3
25
Ejemplo 3
En la ciudad de Sucre durante el verano 7 vendedores de una empresa de equipos de
calefacción y aire acondicionado vendieron las siguientes cantidades de unidades de aire
acondicionado 7 10 2 15 6 8 y 5 ¿Cuál es el recorrido de esta variable, unidades de aire
acondicionado ?
Ejemplo 4
La desviación media de los números 12,14,17,18,19 es:
∑ 𝗅X − X𝗅 𝗅12 − 16𝗅 + 𝗅14 − 16𝗅 + 𝗅17 − 16𝗅 + 𝗅18 − 16𝗅 + 𝗅19 − 16𝗅
DM = =
n 5
Xj f
Peso Kg [Linf,
Marca Frecuencia
Lsup [ Calculando previamente la media aritmética X Luego
de clase de Clase
[55, 59[ 57 3 aplicando la definición de desviación media de datos
[59, 63[ 61 7 clasificados Note que los cálculos se hacen con las marcas
[63, 67[ 65 8 de clase
[67, 71[ 69 5
[71, 75[ 73 1
24
∑ 𝑓𝑥𝑗 − 3 ∗ 57 + 7 ∗ 61 + 8 ∗ 65 + 5 ∗ 69 + 1 ∗ 73 1.536
𝑋= = = = 𝟔𝟒
∑ 𝑓𝑗 3+7+8+5+1 24
∑ 𝑓𝑗𝘭𝑋𝑗 − 𝑋𝘭 𝟑𝗹𝟓𝟕 − 𝟔𝟒𝗹 + 7𝗅61 − 64𝗅 + 𝟖𝗹𝟔𝟓 − 𝟔𝟒𝗹 + 5𝗅69 − 64𝗅 + 𝟏𝗹𝟕𝟑 − 𝟔𝟒𝗹 84
𝐷𝑀 = = = = 𝟑, 𝟓
∑ 𝑓𝑗 3+7+8+5+1 24
Agencia A 13 20 12
Agencia B 1 1 43
A x-X aux
13 2 ( 13 - 15) =2
20 5 ( 20 - 15) =5
12 3 ( 12 - 15) =3
45 10 10
X = 45 = 15 DE AHÍ SALE
3
DM = / x - X / = 10 = 3.33
N 3
B x-X aux.
1 14 (1 - 15) = 14
1 14 (1 - 15) = 14
43 28 (43 - 15) = 28
45 56 56
DM = 56 = 18.67 Tiene Mayor Dispersión
3
EJEMPLO 7
Hallar la desviación media de: 4,6,12,16,22.
Solución:
__
x = 4 + 6+12+16+22 = 12
5
4 - 12 8
6 - 12 6
𝟐𝟖
𝑫𝑴 = 12- 12 0 = 𝟓, 𝟔
𝟓
16- 12 4
22- 12 10
∑ 28
Varianza
la varianza (que es el cuadrado de la desviación estándar: sigma σ2) se define así:
Es la media de las diferencias con la media elevadas al cuadrado.
En otras palabras, sigue estos pasos:
Elevar cada diferencia al cuadrado hace que todos los números sean positivos (para evitar
que los números negativos reduzcan la varianza)
Y también hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es
mucho más grande que 502=2,500.
Pero elevarlas al cuadrado hace que la respuesta sea muy grande, así que lo deshacemos
(con la raíz cuadrada) y así la desviación estándar es mucho más útil.
Aquí tenemos 6 rectángulos cuya altura es de 8 centímetros (todos tienen la misma base)
¿Existe alguna variación respecto de su altura entre estos rectángulos?
¿Cuál es el promedio de la altura de estos rectángulos?
8 + 8 + 8 + 8 + 8 + 8 48
= =8
6 6
La Varianza
1
8 8 0 8 8
6
8 Cms
8 + 8 + 10 + 8 + 6 + 8 48
= =8
6 6
¡El mismo promedio! Pero….. ¿Ha habido variación?
El tercer rectángulo tiene + dos cmts sobre el promedio y el 5to rectángulo tiene – 2 cms
bajo el promedio. Los otros rectángulos tienen cero diferencias respecto al promedio
Si sumamos estas diferencias de la altura respecto del promedio, tenemos
0+0+2+0-2+0+0 = 0
Este valor nos parece indicar que no habido Variabilidad y sin embargo, ante nuestros ojos
sabemos que existe variación
8
02 + 02 +22 + 02 (−2)2 + 22 = = 1.3333
6
La varianza fue 1.33333
Varianza
Para UNA ORDENACIÓN DE DATOS X1,X2,X3, ………..Xn la varianza se calcula como
VARIANZA POBLACIONAL
(1) ∑𝑁
𝐽=1(𝑋𝑗 − 𝑢)
2 ∑ (𝑥 − 𝑢)2
б2 = = = (𝑥 − 𝑢)2
𝑁 𝑁
VARIANZA MUESTRAL
(2) ∑𝑁
𝐽=1(𝑋𝑗 − 𝑥)
2 ∑ (𝑥 − 𝑥)2 𝑛 ∑ 𝑥 2 − (∑ 𝑥)2
𝑠2 = = =
𝑛−1 𝑛−1 𝑛(𝑛 − 1)
VARIANZA POBLACIONAL
VARIANZA MUESTRAL
Ejemplo 8
∑𝑁
𝐽=1 𝑋𝑗 ∑𝑁
𝐽=1 𝑋𝑗 12 + 14 + 17 + 18 + 19 80
𝑢2 = = = = = 16
𝑁 5 5 5
∑𝑁
𝐽=1(𝑋𝑗 − 𝑢)
2 ∑5𝐽=1(𝑋𝑗 − 16)2
б2 = =
𝑁 5
(12 − 16)2 + (14 − 16)2 + (17 − 16)2 +(18 − 16)2 + (19 − 16)2 34
𝑢2 = = = 6,8
5 5
A su vez asumiendo que los datos representan a una muestra se calcula su varianza
∑𝑁
𝐽=1 𝑋𝑗 ∑5𝐽=1 𝑋𝑗 12 + 14 + 17 + 18 + 19 80
𝑥 = = = = = 16
𝑁 5 5 5
∑𝑁𝐽=1(𝑋𝑗 − 𝑥)
2 ∑5𝐽=1(𝑋𝑗 − 16)2
𝑠2 = = =
𝑛−1 5−1
(12 − 16)2 + (14 − 16)2 + (17 − 16)2 +(18 − 16)2 + (19 − 16)2 34
𝑠2 = = = 8,5
4 4
Muchas de las operaciones se reiteran en ambos cálculos ya que la diferencia básica entre
la varianza poblacional y muestral radica en que un caso se divide entre el total (n) y en el
otro caso entre eses total menos uno (n-1)
∑𝑘
𝐽=1 𝑓𝑗 (𝑋𝑗−𝑥)
2 ∑5𝐽=1 𝑓𝑗 (𝑋𝑗−3.5)2
𝑠2 = ∑𝑘
= ∑𝑘
Por definición de varianza muestral
𝑗=1 𝑓−1 𝑗=1 𝑓−1
Método abreviado
El calculo de un modo mas rápido de la varianza poblacional requiere de las expresiones
2
∑𝑁
𝐽=1(𝑋𝑗−𝑥)
2 ∑𝑘
𝐽=1 𝑓𝑗(𝑋𝑗−𝑋)
б2 = = 𝑋2 − 𝑋2 ; б2 = ∑𝑘
= 𝑋2 − 𝑋2
𝑗=1 𝑓
𝑁
Ejemplo 9
La varianza poblacional de los números 12,14,17,18,19 por la expresión abreviada es:
∑𝑁
𝐽=1 𝑋𝑗
2 ∑5𝐽=1 𝑋𝑗 2 122 + 142 + 172 + 182 + 192 1314
𝑋2 = = = = = 262.8
𝑁 5 5 5
Luego la media aritmética de los datos que se elevara al cuadrado
Reemplazando en la expresión abreviada de б2 sigma se verifica el mismo resultado del
ejemplo …….
∑𝑁
𝐽=1 𝑋𝑗
2 ∑5𝐽=1 𝑋𝑗 2 12 + 14 + 17 + 18 + 19 80
𝑋 = = = = = 16 ↦ 162 = 256
𝑁 5 5 5
2 2
б2 = 𝑋 − 𝑋 = 262.8 − 256 = 6.8
∑𝑵
𝑱=𝟏(𝑿𝒋 − 𝒖)
𝟐 𝑲
(1) б=√ = √(𝑿 − 𝒖)𝟐 ; 𝑵 = ∑ 𝒇𝒋
𝑵 𝒋=𝟏
∑𝑵
𝑱=𝟏(𝑿𝒋 − 𝑿)
𝟐 𝑲
(2) 𝒔 =√ = √(𝑿 − 𝑿)𝟐 ; 𝑵 = ∑ 𝒇𝒋
𝒏−𝟏 𝒋=𝟏
Donde u son la media aritmética de una población o una muestra (poseen el mismo valor)
Donde los f son las frecuencias .Para una tabulación discreta los Xj son los datos
deferentes entre si Para una clasificación los Xj son las marcas de clase
Cuando no se especifica si se trata de población o muestra, se asume que es muestra (
Cuando se calcula la desviación estándar en una calculadora o en una pc se obtiene la
desviación estándar muestral )
Ejemplo 10
a) De los números 12,14,17,18,19 ; La desviación estándar poblacional es:
∑ 𝑋𝑗 ∑ 𝑋𝑗 12 + 14 + 17 + 18 + 19 80
𝑢= = = = = 16
𝑁 5 5 5
𝟏𝟔 + 𝟒 + 𝟏 + 𝟒 𝟗 𝟑𝟒
б= √ = √ = 𝟐. 𝟔𝟏
𝟓 𝟓
Para la desviación estándar muestral se considera que los datos representan a una
muestra, La media de una población o de una muestra es la misma: u X = 6
∑(𝑿𝒋 −)𝟐 (𝟏𝟐 − 𝟏𝟔)𝟐 + (𝟏𝟒 − 𝟏𝟔)𝟐 + (𝟏𝟕 − 𝟏𝟔)𝟐 + (𝟏𝟖 − 𝟏𝟔)𝟐 + (𝟏𝟗 − 𝟏𝟔)𝟐
𝒔=√ = √
𝒏−𝟏 𝟓−𝟏
𝟑𝟒
𝒔= √ = 𝟐. 𝟗𝟐
𝟒
Los datos están clasificados en 5 clases (k=5) se indica la marca y frecuencia de clase
La frecuencia total es N = ∑ f = 24
𝟐(𝟒𝟒 − 𝟔𝟐)𝟐 + 𝟒(𝟓𝟐 − 𝟔𝟐)𝟐 + 𝟖(𝟔𝟎 − 𝟔𝟐)𝟐 + 𝟔(𝟔𝟖 − 𝟔𝟐)𝟐 + 𝟒(𝟕𝟔 − 𝟔𝟐)𝟐 𝟐𝟎𝟖𝟎
=√ = √ = 𝟗. 𝟑𝟏
𝟐+𝟒+𝟖+𝟔+𝟒 𝟐𝟒
𝟐(𝟒𝟒 − 𝟔𝟐)𝟐 + 𝟒(𝟓𝟐 − 𝟔𝟐)𝟐 + 𝟖(𝟔𝟎 − 𝟔𝟐)𝟐 + 𝟔(𝟔𝟖 − 𝟔𝟐)𝟐 + 𝟒(𝟕𝟔 − 𝟔𝟐)𝟐 𝟐𝟎𝟖𝟎
=√ = √ = 𝟗. 𝟓𝟏
( 𝟐 + 𝟒 + 𝟖 + 𝟔 + 𝟒) − 𝟏 𝟐𝟑
Las medidas de dispersión desviación estándar y varianza usan los mismos procedimientos
de calculo ya que la segunda es al cuadrado de la primera el porque de que se emplean
ambas se debe a que frecuentemente se precisa de homogeneidad en las dimensiones
Por ejemplo si los datos son las estaturas en cm la desviación estándar estará en cm la
varianza estará en cm2 Por tanto para fines de comparación será adecuada la desviación
estándar, sin embargo para otros análisis matemáticos se precisa de la varianza.
Para una gran cantidad de datos (n grande) la desviación muestral y desviación muestral
sesgada son prácticamente idénticos