Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Aula C4 - Séptimo Semestre: Alumnos
Aula C4 - Séptimo Semestre: Alumnos
ALUMNOS:
https://drive.google.com/file/d/1hWqMcG2jlH7dlPjffLRp7G2CGA8tnPzr/view?usp=drivesdk
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión miden cuánto se aleja una distribución de datos del valor de
una medida central, como puede ser la media o promedio aritmético. Su valor siempre es
positivo y normalmente distinto de 0, salvo en el caso de datos idénticos.
Si una medida de dispersión arroja un valor pequeño, significa que los datos se ubican
muy cercanos al promedio, pero si es grande, quiere decir que los datos están más
dispersos, por lo tanto, alejados de la media.
Las medidas de dispersión son muy importantes desde el punto de vista estadístico, no
solo como indicadores aritméticos de la variación de los datos, sino como una ayuda
inestimable cuando se quiere mejorar la calidad, tanto en la manufactura de productos
como en la prestación de servicios.
Ejemplo de ello son las filas de atención en los bancos. El tiempo promedio que demoran
los clientes cuando hacen una fila única y luego se distribuyen en las taquillas, es el mismo
que si hacen líneas individuales frente a cada una.
Sin embargo, la dispersión es menor en la fila única, lo que significa que el tiempo de
atención individual es muy parecido para cada cliente. Los clientes han declarado que se
sienten más a gusto de esta manera, aun si el tiempo de atención promedio sea el mismo
en cualquiera de las dos modalidades.
El rango es rápido de calcular, pero es muy sensible a los valores extremos, y tiene la
desventaja de no tomar en cuenta a los valores intermedios. Por ello se emplea únicamente
para tener una idea inicial, bastante aproximada, de la dispersión de los datos.
Ejemplo de rango
Esta es una lista del número de huracanes ocurridos en el Atlántico durante los últimos
14 años:
8; 9; 7; 8; 15; 9; 6; 5; 8; 4; 12; 7; 8; 2
Varianza
Esta medida se utiliza para comparar a cada uno de los datos con la media del conjunto,
y se calcula sumando las diferencias, elevadas al cuadrado, entre cada valor con la media
y dividiendo entre el número total de valores.
Sea:
-La media: μ
Denotando a la varianza de una población como σ2, la expresión para calcularla es:
Donde la varianza muestral se ha denotado con s, y la media como X con barra, para dejar
el uso de letras griegas a la población. La razón de dividir entre n–1, en vez de n, es para
que la varianza muestral no subestime a la poblacional, lo que siempre sucede cuando se
divide entre n.
Por otro lado, la idea de elevar al cuadrado cada diferencia entre el dato y la media, es
para evitar que al sumarlas resulte 0, ya que algunas diferencias serán positivas y otras
negativas, lo que tiende a cancelar la suma. En cambio, los cuadrados siempre son
positivos.
De allí que la varianza siempre sea positiva, aún si la diferencia entre x i y la media es
negativa, y su principal ventaja de la varianza es que toma en cuenta a cada dato del
conjunto.
Pero tiene el inconveniente de que sus unidades no son las mismas que las de los datos,
por ejemplo, si estos consisten en tiempos, medidos en minutos, la varianza del conjunto
vendrá dada en minutos al cuadrado.
Ejemplo de varianza
El cálculo de la varianza requiere hallar la media. Tomando los datos del número de
huracanes, la media se calcula mediante:
Desviación estándar
Para subsanar el problema de la falta de concordancia entre las unidades, se define la
desviación estándar σ, como la raíz cuadrada de la varianza:
Existe una regla empírica para estimar el valor de la desviación estándar de un conjunto
de datos muestrales, partiendo del rango. Según esta regla, la desviación estándar es,
aproximadamente, la cuarta parte de R:
s ≈ R/4
Tiene la ventaja de permitir una rápida estimación de la desviación estándar, dado que las
operaciones son mucho más sencillas.
La desviación estándar es, con mucho, la medida de dispersión más utilizada, por eso vale
la pena destacar sus principales características:
s = 13 / 4 = 3.25
Coeficiente de variación
Fila única
Filas individuales
Como este último valor es mayor, ello indica que hay más variabilidad en los tiempos de
atención a los clientes cuando hacen filas individuales que cuando hacen una fila única,
aunque el tiempo promedio es el mismo en cada caso.
DESARROLLO EJERCICIOS
RANGO O RECORRIDO
Xi
6
n= 8
6
R = Máxx – Mínx
VALOR Máximo
= 7
VALOR
Mínimo= 2
R = 7-2
R = 5
VARIANZA
( )2
∑ 𝑥𝑖 − 𝑥̅
𝑠2 =
𝑛−1
𝒙𝒊 ̅
𝒙𝒊 − 𝒙 ̅)𝟐
(𝒙𝒊 − 𝒙
2 -2,5 6,25
3 -1,5 2,25
3 -1,5 2,25
4 -0,5 0,25
5 0,5 0,25
6 1,5 2,25
6 1,5 2,25
7 2,5 6,25
36 0 22
n= 8
= 36 S2= 22
8 7
= 4,5 S2= 3,14
DESVIACIÓN ESTÁNDAR
Desviación
Varianza Estándar
S = √S2
S=√ 3.14
COEFICIENTE DE VARIACION
𝐒
𝐜. 𝐯. = 𝐱̅ ∗ 𝟏𝟎𝟎
𝟏, 𝟕𝟕
𝐜. 𝐯. = ∗ 𝟏𝟎𝟎
𝟒, 𝟓
𝐜. 𝐯. = 0.39 * 100
𝐜. 𝐯. = 39%
EJERCICIO 2 DE APLICACIÓN DATOS AGRUPADOS
Aplicar en los siguientes ejercicios las medidas de dispersión (Rango, Varianza, Desviación Estándar y Co
RANGO O RECORRIDO
Yi fi
4 1
5 1
6 2
10 1
11 2
12 3
13 2
RANGO = VALOR MÁXIMO - VALOR MÍNIMO
V. Máx= 13
V. Min= 4
R= 14 - 4
R= 9
VARIANZA
2
∑(𝑥𝑖 − 𝑥̅ )2
𝑠 =
𝑛−1
Yi fi Y i fi yi-ӯ (yi-ӯ)2 (yi-ӯ)2 fi
4 1 4 -5,58 31,17 31,17
5 1 5 -4,58 21,01 21,01
6 2 12 -3,58 12,84 25,68
10 1 10 0,42 0,17 0,17
11 2 22 1,42 2,01 4,01
12 3 36 2,42 5,84 17,52
13 2 26 3,42 11,67 23,35
TOTAL 12 115 122,92
ӯ= 115
12 S2= 122,92
11
ӯ= 9,58
S2= 11,17
n-1= 11
6 2 12 -3,58 12,84 25,68
10 1 10 0,42 0,17 0,17
2
Yi 11 fi 2 Yif22
i 1,42yi-ӯ 2,01 (yi-ӯ)
4,01 (yi-ӯ)2 fi
4 12 1 3 4 36 2,42-5,585,84 31,1717,52 31,17
5 13 1 2 5 26 3,42-4,58
11,67 21,0123,35 21,01
6
TOTAL2 12 12
115 -3,58
122,92
12,84 25,68
10 1 10 0,42 0,17 0,17
ӯ= 115
11 2 22 1,42
12 2=
S 122,922,01 4,01
12 3 36 2,42 115,84 17,52
13 2ӯ = 9,58 26 3,42 11,67 23,35
2=
TOTAL 12 115 S 11,17 122,92
n-1= 11
DESVIACIÓN ESTÁNDAR
√ 2 √
S= 11,17
S= 3,34
COEFICIENTE DE VARIACION
CV = 3,34 * 100
9,58
CV = 0,35 * 100
CV = 35
Bibliografía