Está en la página 1de 30

CAPÍTULO IV:

OTRAS MEDIDAS DESCRIPTIVAS

ESTADÍSTICA I
ING. MANUEL SAMANIEGO ZAMORA, MGS
MEDIDAS DE DISPERSIÓN

¿Por qué estudiar la dispersión?


Un promedio, como la media o la mediana, solamente localiza el centro de los
datos, y esto es importante desde ese punto de vista; pero un promedio nada
indica acerca de la diseminación de los datos.

Un valor pequeño en una medida de dispersión indica que los datos se acumulan
estrechamente, por ejemplo, alrededor de la media aritmética. En consecuencia, el
valor medio se considera representativo de los datos.
Una segunda razón para estudiar dispersión de un conjunto de datos es comparar
la dispersión en dos o más distribuciones.
Ahora se considerarán varias medidas de dispersión. La amplitud de variación o
intervalo se basa en la localización de los valores más grande y más pequeño de un
conjunto de datos.

La desviación media, la varianza y desviación estándar se basan en las desviaciones


respecto de la media.
Amplitud de variación
La medida de dispersión más sencilla es la amplitud de variación. Se trata de la
diferencia entre el valor más grande y el más pequeño de un conjunto de datos.
Expresada como ecuación:

Amplitud de variación = Valor más grande – Valor más pequeño


Desviación media
La desviación media es el promedio aritmético de los valores absolutos de las
desviaciones con respecto a la media aritmética.
EJERCICIO 1: El número de pacientes atendidos en la sala de urgencias del
Hospital St. Luke para una muestra de 5 días el año pasado fue: 103, 97, 101, 106 y
103. Determine e interprete la desviación media.

EJERCICIO 2: El peso de un grupo de cajas que se van a enviar a Irlanda son (en
libras):

a) ¿Cuál es la amplitud de variación de los pesos?


b) Calcule la media aritmética de los valores.
c) Determine la desviación media de los pesos.
Varianza y desviación estándar
La varianza es la media aritmética de las desviaciones cuadráticas con respecto a la
media y la desviación estándar es la raíz cuadrada positiva de la varianza.
EJERCICIO 1: Las edades de los pacientes del pabellón de aislados en el Hospital
Yellowstone, son 38, 26, 13, 41 y 22 años. ¿Cuál es la varianza de esa población?
EJERCICIO 2: La oficina en Filadelfia de la empresa Price Waterhouse Coopers
LLP, contrató a cinco pasantes de contabilidad este año. Sus sueldos mensuales
iniciales fueron (en dólares): $2 536; $2 173; $2 448; $2 121; y $2 622 dólares.

a) Calcule la media de la población.


b) Determine la varianza.
e) Obtenga la desviación estándar poblacional.
d) La oficina en Pittsburgh contrató 6 pasantes. Su sueldo mensual promedio fue de
$2.550 (dólares), y la desviación estándar, $250. Compare ambos grupos.
EJERCICIO 1: Los salarios por hora en una muestra de operarios de medio tiempo
en la empresa Fruit Packers, lnc., son (en dólares): $2, $10, $6, $8 y $9. ¿Cuál es la
varianza muestral?

EJERCICIO 2: Los pesos del contenido de varios frascos pequeños de aspirina (en
gramos) son: 4, 2, 5, 4, 5, 2 y 6. ¿Cuál es la varianza muestral?
Calcule también la desviación estándar muestral.
MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS EN UNA
DISTRIBUCIÓN DE FRECUENCIAS

Amplitud de variación
Recordar que la amplitud (o intervalo de variación) se define como la diferencia
entre el valor más grande y el más pequeño de una población. Para calcular la
amplitud de datos agrupados en una distribución de frecuencia, se resta el limite
inferior de la clase más baja, del limite superior de la case más alta.
EJERCICIO
Una muestra de las cantidades que los empleados de Dupree Paint Company invierten
quincenalmente en el plan de participación de utilidades, se organizó en una distribución de
frecuencias para su estudio. (Ver la tabla) ¿Cuál es la desviación estándar de estos datos? ¿Cuál es la
varianza muestral?
TABLA Muestra de las inversiones quincenales (en dólares) realizadas por empleados de acuerdo con

el plan de participación de utilidades.


EJERCICIO: Los tiempos de uso de una muestra de brocas de un cuarto de pulgada
para alquiler, disponibles en Tool Renta, Inc., se organizaron en la siguiente
distribución de frecuencias.

a) Calcule la amplitud de variación.


b) Evalúe la desviación estándar muestral.
c) Detennine la varianza de la muestra.
INTERPRETACIÓN Y USOS DE LA DESVIACIÓN ESTÁNDAR
En general, la desviación estándar se emplea como una medida para comparar la
dispersión en dos o más conjuntos de observaciones.
 
Teorema de Chebyshev
Para un conjunto cualquiera de observaciones (muestra o población), la proporción
mínima de los valores que se encuentran dentro de k desviaciones estándar desde la
media es por lo menos 1 – 1/k2, donde k es una constante mayor que 1.
EJERCICIO: En el ejemplo anterior y su solución, la media aritmética ele la
cantidad quincenal que depositan los empleados de la empresa Dupree Paint en el
plan de participación de utilidades fue $51.54 (dólares) y se obtuvo una desviación
estándar de $7.51. Al menos, ¿qué porcentaje de las contribucio1es se encuentra
entre más 3.5 desviaciones estándar, y menos 3.5 desviaciones estándar, respecto de
la media?
Regla empírica
En una distribución de frecuencias simétrica, con forma de campana, aproximadamente
68% de las observaciones estarán entre más una y menos una desviación estándar desde la
media; aproximadamente 95% de las observaciones se encontrarán entre más dos y menos
dos desviaciones estándar desde la media; prácticamente todas las observaciones (99.7%)
se hallarán entre más tres y menos tres desviaciones estándar, a partir del valor medio.
EJERCICIO: Una muestra de las cantidades mensuales de dinero que destina a sus
alimentos un ciudadano de la tercera edad que vive solo sigue aproximadamente una
distribución de frecuencias simétrica, del tipo de campana. La media muestral es $150
(dólares), y la desviación estándar es $20. Utilizando la regla empírica indique:

1. Aproximadamente, ¿entre qué cantidades está 68% de los gastos mensuales en


alimentos?
2. Aproximadamente, ¿entre qué cantidades se halla 95% de los gastos mensuales por
alimentos?
3. Aproximadamente, ¿entre qué montos están todos los gastos mensuales?
Dispersión relativa
Resulta imposible una comparación directa de dos o más medidas de dispersión (por
ejemplo, la desviación estándar de una distribución de ingresos anuales y la desviación
estándar de una distribución de inasistencias, ambas del mismo grupo de empleados.)
Se necesita convertir todas esas medidas a un valor relativo.
Es útil cuando:
1. Los datos están en unidades diferentes.
2. Los datos están en las mismas unidades, pero los valores medios están muy
distantes.
Coeficiente de variación
Es la razón (cociente) de la desviación estándar y la media aritmética, expresada como un
porcentaje, en términos de una fórmula para una muestra:
EJERCICIO 1: Un estudio sobre el monto de bonos pagados y los años de servicio
de varios empleados, dio como resultado los siguientes datos estadísticos: la media
de los bonos pagados fue $200 (dólares), y la desviación estándar fue $40. La media
del número de años de servicio ·fue 20 años, y la desviación estándar, 2 años.
Compare las dispersiones relativas de !as dos distribuciones empleando el
coeficiente de variación.

EJERCICIO 2: Se va a comparar la variación en los ingresos anuales de varios


ejecutivos con la variación en los ingresos de trabajadores no calificados. En una
muestra de ejecutivos, X= $500.000 (dólares) y s = $50.000, Para una muestra de
empleados no calificados, X=$32.000 y s = $3.200.
Asimetría
Otras medidas de dispersión
Cuartiles, deciles y centiles
Para formalizar el procedimiento de cálculo, sea Lc, la ubicación del centil deseado. Por lo

tanto, si se quiere obtener el centil 33 se utilizará el símbolo L33, y si se deseara la

mediana, el centil 50, se usa L50. El número de observaciones es n; por lo tanto, si se


requiere ubicar la observación central, su localización estará en (n + 1)/2. Esto se puede
representar como (n + 1)/(C/100), donde C es un centil deseado.
Diagramas de caja
Un diagrama de caja es una representación gráfica basada en los cuartiles, que ayuda a
ilustrar un conjunto de datos. Para elaborar tal diagrama solamente se necesitan cinco
valores estadísticos: el valor mínimo; Q1 (el primer cuartil); la mediana; Q3 (el tercer
cuartil), y el valor máximo.
EJERCICIO
El restaurante Alexander´s Pizza ofrece el servicio de entrega a domicilio sin cargo extra en un
radio de 15 millas. Alex, el propietario, desea obtener información acerca del tiempo de
entrega. ¿Cuánto tiempo toma una entrega típica? ¿Dentro de qué intervalo de tiempos se
efectúa la mayor parte de las entregas? Para una muestra de 20 de ellas se determinó la
siguiente información:

Valor mínimo = 13 min (minutos)


Q1 = 15 min
Mediana = 18 min
Q3 = 22 min
Valor máximo = 30 min
Desarrolle un diagrama de caja para los tiempos de entrega. ¿A qué conclusiones se puede llegar
acerca de los tiempos en cuestión?
El primer paso para elaborar un diagrama de caja es establecer una escala adecuada en el eje
horizontal. Después se dibuja un rectángulo (o caja), que parte de Q 1 (15 min) y termina en Q3
(22 min). Dentro de la caja se marca un segmento vertical para representar la mediana (18 min).
Finalmente se trazan dos líneas horizontales, una desde la caja hasta el valor mínimo (13 min), y
otra hasta el valor máximo (30 min.) Estas líneas horizontales que sobresalen de la caja, se
llaman salientes de la caja.
En el diagrama de caja muestra el 50% central de las entregas toma entre 15 a 22 minutos. La
distancia o intervalo entre los extremos de la caja, que es de 7 min, se denomina amplitud
cuartílica (o intercuartílica). Dicho intervalo es la distancia entre el primer cuartil y el tercero.

También podría gustarte