Documentos de Académico
Documentos de Profesional
Documentos de Cultura
NOTA
Si se conocen dos promedios de una
distribución de frecuencias con sesgo
moderado, el tercero se puede
aproximar.
moda = media - 3(media - mediana)
media = [3(mediana) - moda]/2
mediana = [2(media) + moda]/3
Medidas de Dispersión
Miden el grado de dispersión (variabilidad) de los
datos, independientemente de su causa.
El rango La diferencia entre las
observaciones extremas.
2,1,4,3,8,4. El rango es 8 – 1 = 7
Es muy sensible a los valores extremos
X
2
2
X n2
s
n 1
Ventajas del Coeficiente de
Variación
CV = Desviación estándar / promedio
CV= S / X
Es una medida muy útil cuando:
Los datos están en unidades diferentes (como
dólares y días de inasistencia
Los datos están en las mismas unidades, pero
las medidas muy distantes (como sucede son
los ingresos de los ejecutivos superiores y los
ingresos de los empleados no calificados)
Es la razón entre la desviación típica y la media.
– Mide la desviación típica en forma de
“qué tamaño tiene con respecto a la media”
3media mediana
C . A.
Desviación estándar
Es una medida de dispersión para evaluar
el sesgo o hacia donde se dispersan los
datos.
El coeficiente de asimetría por lo general
se encuentra entre – 3 y + 3.
Asimetría o Sesgo
Una distribución es simétrica si la
mitad izquierda de su distribución
es la imagen especular de su
mitad derecha.
Frecuencia
60
Mesocúrtica: curtosis = 0
40
45 48 51 54 57 60 63 66 69 72 75 78 81 84
400
300
apuntamiento.
En el curso serán de especial 100
100
Frecuencia
Frecuencia
simétricas (parecidas a la 0
0
normal). 3
16
27
32
37
42
47
52
57
62
67
72
77
82
87
92
97 108
102 138
27 37 45 53 61 69 77 85 93
32 41 49 57 65 73 81 89 99
Leptocúrtica Mesocúrtica
4-14
Interpretación y usos de la
desviación estándar
Teorema de Chebyshev: para
cualquier conjunto de observaciones,
la proporción mínima de valores que
Interpretación y usos de la
deviación estándar
Regla empírica: para una distribución
de frecuencias simétrica de campana,
cerca de 68% de las observaciones
estará dentro de ±1 de la media ();
cerca de 95% de las observaciones
estará dentro de ±2 de la media ();
alrededor de 99.7% estará dentro de
±3 de la media ().
Curva en forma de campana que muestra la relación entre y
Amplitud intercuartílica
La amplitud intercuartílica es la
distancia entre el tercer cuartil Q3 y el
primer
cuartil Q1.
Amplitud intercuartílica
= tercer cuartil - primer
cuartil
= Q3 - Q 1
4-20
Primer cuartil
El primer cuartil es el valor correspondiente al
punto debajo del cual se encuentra el 25% de
las observaciones en un conjunto ordenado
de datos. n
CF
Q1 L 4 (i )
f
donde L = límite de las clasese que contienen Q1,
CF = frecuencia acumulda que precede a la clase
que contiene a Q1, f = frecuencia de la clase que
contiene Q1, i= tamaño de la clase que contiene Q1.
4-21
Tercer cuartil
El tercer cuartil es el valor
correspondiente al punto debajo del cual
se encuentra 75% de las observaciones
en un conjunto ordenado de datos:
3n
CF
Q3 = L + 4 (i )
f
Desviación cuartílica
La desviación cuartílica es la mitad
de la distancia entre el tercer cuartil,
Q3, y el primero, Q1.
QD = [Q3 - Q1]/2
4-23
EJEMPLO 5
Si el tercer cuartil = 24 y el primer
cuartil = 10, ¿cuál es la desviación
cuartílica? La amplitud
intercuartílica es 24 - 10 = 14;
por lo tanto, la desviación
cuartílica es
14/2 = 7.
4-24
Amplitud cuartílica
Cada conjunto de datos tiene 99
porcentiles, que dividen el conjunto en
100 partes iguales.
La amplitud cuartílica es la distancia
entre dos porcentiles establecidos. La
amplitud cuartílica 10 a 90 es la
distancia entre el 10º y 90º porcentiles.
4-25
P
Lp = ( n + 1)
100
4-26
Diagramas de caja
Un diagrama de caja es una ilustración
gráfica, basada en cuartiles, que ayuda
a visualizar un conjunto de datos.
Se requieren cinco tipos de datos para
construir un diagrama de caja: el valor
mínimo, el primer cuartil, la mediana, el
tercer cuartil, y el valor máximo.
4-27
EJEMPLO 6
Con base en una muestra de 20 entregas,
Marco’s Pizza determinó la siguiente
información: valor mínimo = 13 minutos,
Q1 = 15 minutos, mediana = 18 minutos,
Q3 = 22 minutos, valor máximo = 30
minutos. Desarrolle un diagrama de caja
para los tiempos de entrega.
4-28
EJEMPLO 6 continuación
mediana
mín Q1 Q3 máx
12 14 16 18 20 22 24 26 28 30 32