Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Lectura Semana 2 PDF
Lectura Semana 2 PDF
MEDIDAS DE DISPERSIÓN
OBJETIVOS
Amplitud
La amplitud es la diferencia entre los valores mayor y menor en un conjunto de datos.
AMPLITUD = valor mayor - valor menor
Ejemplo 1
Una muestra de cinco recién graduados indicó los siguientes salarios iniciales: $22000,
$28000, $31000, $23000, $24 000.
La amplitud es $31000 - $22000 = $9000.
Desviación media:
La desviación media es la media aritmética de los valores absolutos de las desviaciones
respecto a la media aritmética.
Σ Xi − X
DM =
n
Ejemplo
Los pesos de una muestra de 5 canecas de pintura son (en lb) 103, 97, 101, 106 y 103.
X=
∑X i
= 510/5 = 102 lb. X =
∑X i
n n
∑X i − X = 1 + 5 + 1 + 4 + 1 = 12
DM = 12/5 = 2.4
Por lo común los pesos de las canecas están a 2.4 lb del peso medio de 102 lb.
Varianza de la población
Σ( X i − µ ) 2
σ2 =
N
Ejemplo 1
Las edades de la familia Pérez son 2, 18, 34, y 42 años. ¿Cuál es la varianza de la
población?
µ=
ΣX i / N ==
96 / 4 24
σ2 =
Σ( X i − µ ) 2 / N =
944 / 4 =
236
= σ2
ΣX i 2 ΣX i 2
−( ) =
∑ X i2 − µ 2
N N N
Varianza muestral
−
Σ( X i − X ) 2
2
Fórmula conceptual =S =
n −1
Ejemplo 2
Una muestra de cinco salarios por hora para varios trabajadores en el área es: $7, $5,
$11, $8, $6. Encuentre la varianza.
X=
∑X i
= 37/5 = 7.40
n
−
Σ( X i − X ) 2
Fórmula conceptual =S 2 = = 21.2/(5-1) = 5.3
n −1
( ΣX i f i ) 2
ΣX i2 fi −
=
S2
∑
=
(X − X ) f
i
2
i n
n −1 n −1
Propiedades de la varianza
Dispersión relativa
s
CV = (100%)
X
Asimetría
Asimetría (sesgo) es la medida de la falta de simetría en una distribución.
El coeficiente de asimetría se calcula mediante la siguiente fórmula:
n
− F j −1
Q1 = Y j −1 + C j 4
fj
Donde Yj-1 = límite de la clase se que contienen Q1, Fj-1 = frecuencia acumulada que
precede a la clase que contiene a Q1, fj = frecuencia de la clase que contiene Q1, Cj=
tamaño de la clase que contiene Q1.
donde Yj-1 = límite inferior de la clase que contiene a Q3, Fj-1 = frecuencia acumulada
precedente a la clase que contiene a Q3, fj = frecuencia de la clase que contiene a Q3,
Cj = tamaño de la clase que contiene a Q3.
Desviación cuartílica
Pk= A la observación que corresponde a la parte entera del FL, más la diferencia
entre la observación siguiente al FL y la observación del FL, multiplicada dicha diferencia
por la parte decimal del FL.
Ejemplo 5
Los siguientes datos corresponde a la edad, en años cumplidos de 15 estudiantes de una
universidad: 18, 16, 20, 22, 19, 24, 17, 17, 23, 20, 19, 25, 30, 27, 24. Se desea
conocer cuál es la edad máxima del 30 % de los estudiantes muestreado.
La pregunta anterior en forma explicita, está solicitando calcular el percentil de orden 30, P30.
Para obtener este percentil, lo primero es ordenar los datos en forma ascendente, de menor a
mayor: 16, 17, 17, 18, 19, 19, 20, 20, 22, 23, 24, 24, 25, 27, 30. Luego de
ordenarlos se calcula el factor de localización, FL = (15+1)*30/100 = 4.8 = FL. La parte entera
de FL es 4, por tanto la cuarta observación es 18 y el P30 = 18+ (19-18)*0.8 = 18.8. El 30% de
los estudiantes encuestados tiene una edad máxima de 18.8 años
Los percentiles dividen en 100 partes iguales la distribución, por tanto, se tiene
equivalencia entre los percentiles , los cuartiles y la mediana:
P25 = Q1; P50 = Q2 = Me; P75 = Q3. Las anteriores relaciones se cumplen tanto
para datos agrupados como para datos sin agrupar.
Diagramas de caja
Un diagrama de caja es una ilustración gráfica, basada en cuartiles, que ayuda a
visualizar un conjunto de datos.
Se requieren cinco tipos de datos para construir un diagrama de caja: el valor mínimo, el
primer cuartil, la mediana, el tercer cuartil, y el valor máximo.
Ejemplo
Con base en una muestra de 20 entregas, una tienda de entregas a domicilio determinó la
siguiente información: tiempo mínimo de entrega = 13 minutos, Q1 = 15 minutos, mediana =
18 minutos, Q3 = 22 minutos, tiempo máximo de entrega = 30 minutos. Desarrolle un
diagrama de caja para los tiempos de entrega.
13 16 19 22 25 28 31
Tiempo de entrega