Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cap3-Descripción de Datos Medidas Numéricas
Cap3-Descripción de Datos Medidas Numéricas
Medidas numéricas
Capítulo 3
Copyright © 2015 McGraw-Hill Education. All rights reserved. No reproduction or distribution without the prior written consent o f McGraw-Hill Education.
Objetivos de aprendizaje
Presentar formas numéricas de describir los datos cuantitativos:
Medidas de Dispersión:
Rango, Desviación Media,
Varianza y Desviación Estándar (basadas en las desviaciones de la
Media Artimética).
3-2
Objetivos de aprendizaje
O3-1 Calcular e interpretar la Media Aritmética: población
y muestra. Mediana y Moda.
O3-2 Calcular una Media Ponderada.
O3-3 Calcular e interpretar la Media Geométrica.
O3-4 Calcular e interpretar el Rango, la Varianza y la
Desviación Estándar.
O3-5 Explicar y aplicar el teorema de Chebyshev y la
Regla empírica.
O3-6 Calcular la Media y la Desviación Estándar de
datos agrupados.
3-3
O3-1
Medidas de Ubicación
El propósito de una medida de ubicación es localizar el centro
de una distribución de datos. Se las conoce también como
promedios
Ejemplos:
El hogar estadounidense promedio tiene más TVs que
personas: hay 2.73 TVs y 2.55 en el hogar típico.
El precio promedio de un boleto de teatro en USA es de $7.50
3-4
O3-1
Medidas de Ubicación
◼ Si solo se toman en cuenta las medidas de ubicación de un
conjunto de datos o se compara varios conjuntos de datos, la
solución no será correcta porque hay que tomar en cuenta la
dispersion de los datos es decir su variación.
Ejemplo:
❖ Ingreso Anual Promedio Ejecutivos empresas de internet $80.000
❖ Ingreso Anual Promedio Ejecutivos empresas farmacéuticas
$80.000
Son iguales aparentemente pero los rangos son diferentes.
❖ Salarios empresas de internet oscilan entre $70.000 y $90.000
❖ Salarios empresas farmacéuticas oscilan entre $40.000 y $120.000,
en este último los valores están más dispersos.
Por lo tanto el promedio $80.000 no es correcto.
3-5
O3-1
Media Aritmética
◼ Es un valor de referencia central de los datos.
◼ Es la medida de ubicación más utilizada.
◼ Se aplica a la población o la muestra.
◼ Requiere la escala de intervalos.
◼ Características principales:
Se utilizan todos los valores.
Es única.
La suma de las desviaciones de la media es 0.
Se calcula sumando todas las observaciones y
dividiendo por el número total.
3-6
O3-1
Media de la Población
Para los datos en bruto o no agrupados en una distribución de
frecuencias, la media de la población (media artimética) es la suma
de todos los valores observados de la población divididos entre el
número total de la población, se utiliza la siguiente fórmula:
3-7
O3-1
3-8
LO3-1
Media de la Muestra
Dado que los datos de la población son muy amplios, con frecuencia
se selecciona una muestra. Para datos no agrupados, la media de la
muestra es la suma de todos los valores observados de la muestra
divididos por el número total de la muestra, se utiliza la misma
fórmula con la diferencia de la identificación de muestra (x barra).
3-10
O3-1
3-12
O3-1
3-13
O3-1
La Mediana
MEDIANA El punto medio de los valores después de que se hayan
ordenado desde el valor mínimo hasta el valor máximo.
3-15
O3-1
Propiedades de la Mediana
3-16
O3-1
3-17
O3-1
La Moda
MODA El valor de la observación que aparece con
más frecuencia, es de especial utilidad para resumir
datos de nivel nominal.
3-18
O3-1
Ejemplo - Moda
Usando los datos que
miden la distancia en millas
entre las salidas en I-75 a
través de Kentucky, ¿cuál
es la distancia modal?
3-19
O3-1
Media Ponderada
Cuando existen varias observaciones con el mismo valor se utiliza la
media Ponderada, es un caso especial de la media aritmética. Las
ponderaciones son conteos de frecuencia, se calcula multiplicando el
número de veces que aparece en la frecuencia por las
observaciones. Se utiliza la siguiente fórmula:
3-24
O3-2
3-25
O3-3
La Media Geométrica
◼ Útil para encontrar el cambio promedio de porcentajes,
proporciones, índices o tasas de crecimiento de un
conjunto de datos a lo largo del tiempo.
◼ Tiene una amplia aplicación en los negocios y la
economía porque a menudo estamos interesados en
encontrar los cambios porcentuales en las ventas, los
salarios o las cifras económicas, como el PIB.
◼ La media geométrica siempre será menor o igual (nunca
mayor) que la media aritmética, todos los datos deben ser
positivos.
3-26
O3-3
La Media Geométrica: incremento porcentual
anual promedio.
3-27
O3-3
Ejemplo:
Durante la década de 1990, y en la década de 2000, las Vegas,
Nevada, fue la ciudad de más rápido crecimiento poblacional en los
Estados Unidos. La población aumentó de 258.295 (v.inicial) en
1990 a 584.539 (v.final) en 2011. Esto es un aumento de 326.244
personas, o un aumento del 126,3 por ciento durante el período.
¿Cuál es el aumento promedio anual?
3-29
O3-4
Medidas de Dispersión
Una medida de ubicación, como la media o la mediana, sólo
describe el centro de los datos, pero no nos dice nada acerca de
la dispersión de los datos.
Por ejemplo, si tienen que cruzar un río que le indican que en
promedió tiene 3 pies de profundidad, ¿Pasaría a pie sin
información adicional? Probablemente no. Usted querría saber
algo sobre la variación en la profundidad que puede ser de 3.25
a 2.75 pies o puede ser de o.50 a 5.5 pies para tomar la decisión
de cruzar.
Una medida pequeña de dispersión indica que los datos se
acumulan con proximidad alrededor de la media aritmética y es
representativa, pero una medida grande de dispersión indica que
la media no es confiable.
3-30
O3-4
Medidas de Dispersión
Los 100 empleados de una compañía que fabrica acero se organiza
en función del número de años que cada uno labora en la cía. La
media es de 4.9 años, pero la dispersion va de 6 meses a 16.8 años
por lo tanto la media no es representativa.
3-31
O3-4
Medidas de Dispersión
Otra razón para estudiar la dispersión es conocer el rango en que fluctúan
las observaciones para determinar qué medida es más confiable.
Ejemplo:
Un nuevo monitor de computadora es armado por dos empresas a la vez,
la producción media aritmética por hora en ambas plantas es 50, sin
embargo los registros de producción muestran que Baton Rouge el rango
va de 48 a 52 montajes por hora y Tucson el rango va de 40 a 60, la
primera empresa está más cerca de la media menos dispersa y la otra es
más dispersa. La primera es más confiable.
3-32
O3-4
Medidas de Dispersión
La medida más simple de dispersión es el rango. Representa la
diferencia entre los valores máximo y mínimo de un conjunto de
datos.
En el ejercicio anterior:
◼ Baton Rouge tiene un rango de 52 – 48 = 4
◼ Tucson tiene un rango de 60 – 40 = 20
Se ratifica que la producción media de 50 de Baton Rouge es una
medida de ubicación más representativa, porque la producción se
acumula más alrededor de 50 con un rango menor (4) existe menos
dispersion que en Tucson que tiene un rango muy amplio (20) hay
más dispersión y no es confiable.
Varianza
La varianza supera la debilidad del rango, utiliza todos los
valores, mide la cantidad media respecto de la cual los valores
de una población o muestra varían.
Su unidad de medida corresponde al cuadrado de la unidad de
medida de la variable.
3-34
O3-4
Desviación Media
Es una medida de dispersión poco usada debido a la dificultad de
hacer cálculos con la función valor absoluto. Es llamada también
desviación promedio de la media o desviación absoluta promedio.
Donde:
•x̄: media aritmética de los datos.
•x1, x2, x3, …, xn: datos.
•xi: cada uno de los datos.
•n: número de datos.
3-35
O3-4
Desviación Media
Ejemplo 1:
Calcular la desviación media de los siguientes datos: 2, 4, 6 y 8.
Solución:
Empezamos calculando la media aritmética de los datos, teniendo en cuenta que tenemos 4 datos (n = 4).
3-36
O3-4
Varianza
Ejemplo: Pag. 62: Calcular Media, Mediana, Rango y Desviación con respecto
a la media, elevar al cuadrado la Desviación aplicar formula de la Varianza.
3-37
O3-4
Varianza
3-38
O3-4
Varianza de la Población
La Varianza de la población es la media de las diferencias elevadas
al cuadrado entre cada valor y la media.
3-39
O3-4
= =
x 19 + 17 + ... + 34 + 10 348
= = 29
N 12 12
3-40
O3-4
2
=
( X − ) 2
=
1,488
= 124
N 12
3-41
O3-4
3-42
O3-4
Cálculo:
Paso 1: Encuentre la media.
3-43
O3-4
Varianza de la Muestra
La conversión de una varianza poblacional en una muestral no es
tan directa, requiere de un cambio en el denominador (n – 1).
3-44
O3-4
Varianza de la Muestra
Los salarios por hora
para una muestra de
empleados a tiempo
parcial en Home
Depot son: $12, $20,
$16, $18 y $19.
La media de la
muestra es $17.
¿Cuál es la varianza
de la muestra?
3-45
O3-4
where :
donde:
s 2 is
esthe
la varianza de la muestra
sample variance
x isesthe
el valor
valuedeof cada
eachobservación
observatioen
n inlathe
muestra
sample
esthe
x is la media de la
mean of themuestra
sample
esthe
n is el numero
numberdeofobservaciones
observationsen
in la
themuestra
sample
3-46
O3-4
3-47
O3-5
Teorema de Chebyshev
Una desviación estándar pequeña de un conjunto de valores
indica que estos se localizan cerca de la media, al contrario una
desviación estándar grande revela que las observaciones se
encuentran muy dispersas con respecto a la media.
El Teorema de Chebyshev que señala que independientemente
de la forma de distribución:
1.- Por lo menos 3 de 4 valores, esto es un 75% deben
encontrarse entre la media más 2 desviaciones estándares y la
media menos 2 desviaciones estándares.
2.- Por lo menos 8 de 9 valores, esto es un 88,9% se encontrará a
más de 3 desviaciones estándares y a menos 3 desviaciones
estándares de la media.
3.- Por lo menos 24 de 25 valores, esto es un 96% se encontrará
entre más y menos 5 desviaciones estándares de la media.
3-48
O3-5
Teorema de Chebyshev
3-49
O3-5
3-50
O3-5
3-51
O3-6
3-52
O3-6
3-53
O3-6
3-54
O3-6
3-55
O3-6
3-56
O3-6
3-57