Está en la página 1de 28

Capítulo cuatro: ¿Descripción de los datos:

medidas de dispersión
Competencias: Al terminar este capítulo el estudiante
podrá:

UNO
Calcular e interpretar la amplitud de variación, la desviación media,
la variancia, y la desviación estándar de los datos originales.
DOS
Calcular e interpretar la amplitud de variación, la variancia y la
desviación estándar de datos agrupados.
TRES
Explicar las características, usos, ventajas y desventajas de cada
medida de dispersión.
Capítulo cuatro: ¿Descripción de los datos:
medidas de dispersión
Competencias: Al terminar este capítulo el estudiante
podrá:
CUATRO
Calcular y explicar los cuartiles y la amplitud de variación intercuartílica
CINCO
Elaborar e interpretar los diagramas de caja.
SEIS
Calcular y entender el coeficiente de variación y el coeficiente de
asimetría
Capítulo cuatro: ¿Descripción de los datos:
medidas de dispersión

Son parámetros que miden la separación


de los datos de una distribución respecto
a su media
4-3

DESVIACIÓN MEDIA
• DESVIACIÓN MEDIA: media aritmética de
los valores absolutos de las desviaciones
respecto a la media aritmética.

X−X
MD =
n
4-4

EJEMPLO 1

• Los pesos de una muestra de cajas con libros


en una librería son (en lb) 103, 97, 101, 106 y
103.
• X = 510/5 = 102 lb
• = 1 + 5 + 1 + 4 + 1 = 12
• MD = 12/5 = 2.4
• Por lo común los pesos de las cajas están a 2.4
lb del peso medio de 102 lb.
4-5

VARIANCIA DE LA
POBLACIÓN
• La varianza de la población para datos no
agrupados es la media aritmética de las
desviaciones cuadráticas respecto a la
media de la población.

( X −  ) 2

 =
2
N
4-6

EJEMPLO 2

• Las edades de la familia Dunn son 2, 18, 34, y


42 años. ¿Cuál es la variancia de la población?

 = X / N = 96 / 4 = 24

 = ( X − ) / N = 944 / 4 = 236
2 2
4-7

VARIANCIA POBLACIONAL
Continuación

• Una fórmula alternativa para la variancia


poblacional es:

X 2
X 2
 2
= −( )
N N
4-8

DESVIACIÓN ESTÁNDAR
POBLACIONAL
• La desviación estándar poblacional ( ) es la
raíz cuadrada de la variancia de la población.

• Para el EJEMPLO 2, la desviación estándar


poblacional es 15.19 (raíz cuadrada de
230.81).
4-9

VARIANCIA MUESTRAL
• La variancia muestral estima la variancia de la
población.

Σ ( X X ) 2
Fórmula conceptual = S 2 =
n 1
( ΣX ) 2
ΣX 2
Fórmula operativa = S 2 = n
n 1
4-10

EJEMPLO 3

• Una muestra de cinco salarios por hora para


varios trabajos en el área es: $7, $5, $11,
$8, $6. Encuentre la variancia.
• X = 37/5 = 7.40
2
• s = 21.2/(5-1) = 5.3
4-11

DESVIACIÓN ESTÁNDAR
MUESTRAL
• La DESVIACIÓN ESTÁNDAR MUESTRAL
es la raíz cuadrada de la variancia muestral.

• En el EJEMPLO 3, la desviación estándar de


la muestra es = 2.30
4-12

MEDIDAS DE DISPERSIÓN:
DATOS NO AGRUPADOS
• Para datos no agrupados, la AMPLITUD es la
diferencia entre los valores mayor y menor en un
conjunto de datos.
• AMPLITUD = valor mayor - valor menor

• EJEMPLO 4: una muestra de cinco graduados de


contaduría indicó los siguientes salarios iniciales: $22
000, $28 000, $31 000,
$23 000, $24 000. La amplitud es $31 000 - $22 000
= $9 000.
4-13

VARIANCIA MUESTRAL PARA


DATOS AGRUPADOS
• La fórmula de la variancia para datos
agrupados usada como estimador de la
variancia poblacional es:

• donde fi es la frecuencia de clase y Xi es el


punto medio de la clase.
4-15

INTERPRETACIÓN Y USOS DE LA
DEVIACIÓN ESTÁNDAR
• REGLA EMPÍRICA: para una distribución
de frecuencias simétrica de campana, cerca
de 68% de las observaciones estará dentro
de ±1 de la media ( ); cerca de 95% de las
observaciones estará dentro de ±2 de la
media ( ); alrededor de 99.7% estará
dentro de ±3 de la media ( ).
Curva en forma de campana que muestra la relación entre y

−3 −2 −1  +1 +2 +3


© 2001 Alfaomega Grupo Editor
4-17

DISPERSIÓN RELATIVA
• El COEFICIENTE DE VARIACIÓN es la
razón de la desviación estándar a la media
aritmética, expresada como porcentaje:

s
CV = (100%)
X
4-18

ASIMETRÍA
• ASIMETRÍA (SESGO) es la medida de la
falta de simetría en una distribución.
• El coeficiente de asimetría se calcula
mediante la siguiente fórmula:

Sk = 3(media - mediana)
desviación estándar
4-19

AMPLITUD
INTERCUARTÍLICA
• La amplitud intercuartílica es la distancia
entre el tercer cuartil Q3 y el primer
cuartil Q1.
• Amplitud intercuartílica
= tercer cuartil - primer cuartil
= Q3 - Q1
4-20

PRIMER CUARTIL
• El primer cuartil es el valor correspondiente
al punto debajo del cual se encuentra el
25% de las observaciones en un conjunto
ordenado de datos.
n
− CF
Q1 = L + 4 (i )
f
• donde L = límite de las clases que contienen Q1,
CF = frecuencia acumulada que precede a la clase que
contiene a Q1, f = frecuencia de la clase que contiene
Q1, i= tamaño de la clase que contiene Q1.
4-21

TERCER CUARTIL
• El TERCER CUARTIL es el valor
correspondiente al punto debajo del cual se
encuentra 75% de las observaciones en un
conjunto ordenado de datos:
3n
CF
Q3 = L + 4 (i )
f
donde L = límite inferior de la clase que contiene a Q3,
CF = frecuencia acumulada precedente a la clase que
contiene a Q3, f = frecuencia de la clase que contiene a
Q3, i = tamaño de la clase que contiene a Q3.
4-22

DESVIACIÓN CUARTÍLICA
• La desviación cuartílica es la mitad de la
distancia entre el tercer cuartil, Q3, y el
primero, Q1.

• QD = [Q3 - Q1]/2
4-23

EJEMPLO 5
• Si el tercer cuartil = 24 y el primer cuartil = 10,
¿cuál es la desviación cuartílica? La amplitud
intercuartílica es 24 - 10 = 14;
por lo tanto, la desviación cuartílica es
14/2 = 7.
4-24

AMPLITUD CUARTÍLICA
• Cada conjunto de datos tiene 99
PERCENTILES, que dividen el conjunto en
100 partes iguales.

• La AMPLITUD CUARTÍLICA es la distancia


entre dos percentiles establecidos. La amplitud
cuartílica 10 a 90 es la distancia entre el 10º y
90º percentiles.
4-25

FÓRMULA PARA
PERCENTILES

P
Lp = ( n + 1)
100
4-26

DIAGRAMAS DE CAJA
• Un diagrama de caja es una ilustración gráfica,
basada en cuartiles, que ayuda a visualizar un
conjunto de datos.

• Se requieren cinco tipos de datos para


construir un diagrama de caja: el valor mínimo,
el primer cuartil, la mediana, el tercer cuartil,
y el valor máximo.
4-27

EJEMPLO 6
• Con base en una muestra de 20 entregas,
Marco’s Pizza determinó la siguiente
información: valor mínimo = 13 minutos,
Q1 = 15 minutos, mediana = 18 minutos,
Q3 = 22 minutos, valor máximo = 30 minutos.
Desarrolle un diagrama de caja para los
tiempos de entrega.
4-28

EJEMPLO 6 continuación

mediana

mín Q1 Q3 máx

• 12 14 16 18 20 22 24 26 28 30 32

También podría gustarte