Está en la página 1de 57

Descripción de Datos:

Medidas numéricas

Capítulo 3

Copyright © 2015 McGraw-Hill Education. All rights reserved. No reproduction or distribution without the prior written consent o f McGraw-Hill Education.
Objetivos de aprendizaje
Presentar formas numéricas de describir los datos cuantitativos:

Medidas de Ubicación o de Localización (promedios):


Media aritmética: Poblacional y muestra,
Media ponderada, Mediana, Moda y Media Geométrica.

Medidas de Dispersión:
Rango, Desviación Media,
Varianza y Desviación Estándar (basadas en las desviaciones de la
Media Artimética).

3-2
Objetivos de aprendizaje
O3-1 Calcular e interpretar la Media Aritmética: población
y muestra. Mediana y Moda.
O3-2 Calcular una Media Ponderada.
O3-3 Calcular e interpretar la Media Geométrica.
O3-4 Calcular e interpretar el Rango, la Varianza y la
Desviación Estándar.
O3-5 Explicar y aplicar el teorema de Chebyshev y la
Regla empírica.
O3-6 Calcular la Media y la Desviación Estándar de
datos agrupados.

3-3
O3-1

Medidas de Ubicación
El propósito de una medida de ubicación es localizar el centro
de una distribución de datos. Se las conoce también como
promedios
Ejemplos:
El hogar estadounidense promedio tiene más TVs que
personas: hay 2.73 TVs y 2.55 en el hogar típico.
El precio promedio de un boleto de teatro en USA es de $7.50

Hay muchas medidas de ubicación. Consideraremos tres:


1. La Media Aritmética
2. La Mediana
3. La Moda

3-4
O3-1

Medidas de Ubicación
◼ Si solo se toman en cuenta las medidas de ubicación de un
conjunto de datos o se compara varios conjuntos de datos, la
solución no será correcta porque hay que tomar en cuenta la
dispersion de los datos es decir su variación.

Ejemplo:
❖ Ingreso Anual Promedio Ejecutivos empresas de internet $80.000
❖ Ingreso Anual Promedio Ejecutivos empresas farmacéuticas
$80.000
Son iguales aparentemente pero los rangos son diferentes.
❖ Salarios empresas de internet oscilan entre $70.000 y $90.000
❖ Salarios empresas farmacéuticas oscilan entre $40.000 y $120.000,
en este último los valores están más dispersos.
Por lo tanto el promedio $80.000 no es correcto.
3-5
O3-1

Media Aritmética
◼ Es un valor de referencia central de los datos.
◼ Es la medida de ubicación más utilizada.
◼ Se aplica a la población o la muestra.
◼ Requiere la escala de intervalos.
◼ Características principales:
 Se utilizan todos los valores.
 Es única.
 La suma de las desviaciones de la media es 0.
 Se calcula sumando todas las observaciones y
dividiendo por el número total.

3-6
O3-1

Media de la Población
Para los datos en bruto o no agrupados en una distribución de
frecuencias, la media de la población (media artimética) es la suma
de todos los valores observados de la población divididos entre el
número total de la población, se utiliza la siguiente fórmula:

Cualquier característica medible de una población se denomina


parámetro, por lo tanto la media es un parámetro.

3-7
O3-1

Ejemplo – Media Poblacional


Hay 42 salidas en la I-75 a través del estado de
Kentucky. A continuación se enumeran las distancias
entre las salidas (en millas).

1. ¿Por qué es esta información es una población?


2. ¿Cuál es la media aritmética de millas entre las
salidas?

3-8
LO3-1

Ejemplo – Media Poblacional

¿Por qué es esta información una población?


Esta es una población porque se consideran todas las
salidas de la carretera I-75 que atraviesa Kentucky.
¿Cuál es el número medio de millas entre las salidas?
Se suman las distancias entre cada una de las 42 salidas,
total 192 millas. Se aplica fórmula de media poblacional.

La media aritmética de la población: 4.57 es el número


promedio de millas entre salidas de la autopista de
Kentucky, por lo tanto es un parámetro poblacional. 3-9
O3-1

Media de la Muestra
Dado que los datos de la población son muy amplios, con frecuencia
se selecciona una muestra. Para datos no agrupados, la media de la
muestra es la suma de todos los valores observados de la muestra
divididos por el número total de la muestra, se utiliza la misma
fórmula con la diferencia de la identificación de muestra (x barra).

3-10
O3-1

Ejemplo: Media Muestral

La media aritmética de la muestra: 97.5 es el valor promedio de


minutos consumidos el mes anterior por los usuarios de Verizon,
que cuentan con un plan tarifario para sus celulares. Es un
estadístico de la muestra.
3-11
O3-1

Parámetro versus estadístico


PARÁMETRO Una característica medible de
una población.

ESTADÍSTICO Una característica medible de


una muestra.

3-12
O3-1

Propiedades de la Media aritmética


1. Para calcular la media, los datos deben pertenecer al nivel de
intervalo o de razón.
2. Todos los valores se incluyen en el calculo de la media.
3. La media es única, sólo existe una media para un conjunto de datos
y puede aparecer dos o más veces en un conjunto de datos.
4. La suma de las desviaciones de cada valor respecto a la media es
cero

Por lo tanto, la media es un punto de equilibrio de un conjunto de datos.

3-13
O3-1

Propiedades de la Media aritmética


Si en una regla del 1 al 9 espaciados de manera uniforme, se colocan
sobre la regla tres barras del mismo peso en los números 3, 4 y 8 y el
punto de equilibrio se colocara en 5, que es la media de los tres
números, se descubriría que la regla se equilibra perfectamente y que
las desviaciones por debajo de la media (-3) son iguales a las
desviaciones por encima de la media (+3).

Debilidad de la media: Cuando los valores de la muestra o la


población son extremadamente grandes o pequeños en
comparación con la mayoría de los datos , la media no es adecuada
para representar los datos, para ello se usa la Mediana.
3-14
O3-1

La Mediana
MEDIANA El punto medio de los valores después de que se hayan
ordenado desde el valor mínimo hasta el valor máximo.

3-15
O3-1

Propiedades de la Mediana

❖ Hay una mediana única para un conjunto de datos.

❖ No se ve afectada por valores extremadamente grandes


o pequeños y por lo tanto es una medida valiosa de
tendencia central cuando se producen tales valores.

❖ Se calcula para datos de nivel de razón, intervalo y


ordinal.

3-16
O3-1

Mediana en datos pares e impares

Las edades para una muestra Los pesos de cuatro


de cinco estudiantes jugadores de basketball son:
universitarios son:
21, 25, 19, 20, 22 76, 73, 80, 75

La organización de los datos La organización de los datos


en orden ascendente da: en orden ascendente da:

19, 20, 21, 22, 25. 73, 75, 76, 80.

Por lo tanto, la mediana es Por lo tanto, la mediana es


21. 75.5.

3-17
O3-1

La Moda
MODA El valor de la observación que aparece con
más frecuencia, es de especial utilidad para resumir
datos de nivel nominal.

3-18
O3-1

Ejemplo - Moda
Usando los datos que
miden la distancia en millas
entre las salidas en I-75 a
través de Kentucky, ¿cuál
es la distancia modal?

Organice las distancias en


una tabla de frecuencias y
seleccione la distancia con
la frecuencia más alta, la
distancia que más se repite
es 1 milla (8veces), es
decir hay 8 salidas
separadas por una milla.

3-19
O3-1

Ventajas y desventajas de la Moda


❖ No se afectada por valores extremadamente grandes o
pequeños.

❖ Es posible determinarla para todos los niveles de


medición especialmente datos de nivel nominal.

❖ En muchos conjuntos de datos no existe porque ningún


valor se presenta más de una vez, en estos casos se
podría decir que cada valor es una moda.

❖ En conjuntos de datos donde la repetición de datos


coincide existirían dos modas (bimodal).
3-20
O3-1

Las posiciones relativas de la Media, la Mediana y la Moda

Distribución Simétrica, con forma de campana, tiene la misma


forma de cualquier lado, si se dobla las mitades son iguales, por
lo tanto media, mediana y moda son siempre iguales, cualquier
medida es apropiada, un lado de la campana es positivo y el otro
negativo.
O3-1

Las posiciones relativas de la Media, la Mediana y la Moda

Distribución asimétrica o sesgada, las medidas cambian


En una distribución con sesgo positivo, la media aritmética
es la mayor, porque en ella influyen valores extremadamente
altos, le sigue la mediana y la moda es la menor de las tres.
Cuando hay sesgos la media no representa los datos moda
y mediana si.
O3-1

Las posiciones relativas de la Media, la Mediana y la Moda

Distribución asimétrica o sesgada, las medidas cambian


En una distribución con sesgo negativo, la media artimética es la
menor, porque es sensible a valores extremadamente pequeños, la
mediana es mayor que la media y la moda es la mayor de las tres,
moda y mediana son más representativas.
O3-3

Media Ponderada
Cuando existen varias observaciones con el mismo valor se utiliza la
media Ponderada, es un caso especial de la media aritmética. Las
ponderaciones son conteos de frecuencia, se calcula multiplicando el
número de veces que aparece en la frecuencia por las
observaciones. Se utiliza la siguiente fórmula:

En donde w es la frecuencia con que se repiten las x que


corresponden a las observaciones

3-24
O3-2

Ejemplo: Media Ponderada


La compañía de construcción Carter paga a sus
empleados por hora $16,50, $19,00, o $25,00 por hora.
Hay 26 empleados por hora: 14 se pagan a la tarifa de
$16,50, 10 a la tarifa de $19,00, y 2 en la tarifa $25,00.

¿Cuál es la tasa horaria media pagada por los 26


empleados?

3-25
O3-3

La Media Geométrica
◼ Útil para encontrar el cambio promedio de porcentajes,
proporciones, índices o tasas de crecimiento de un
conjunto de datos a lo largo del tiempo.
◼ Tiene una amplia aplicación en los negocios y la
economía porque a menudo estamos interesados en
encontrar los cambios porcentuales en las ventas, los
salarios o las cifras económicas, como el PIB.
◼ La media geométrica siempre será menor o igual (nunca
mayor) que la media aritmética, todos los datos deben ser
positivos.

3-26
O3-3
La Media Geométrica: incremento porcentual
anual promedio.

3-27
O3-3

La Media Geométrica: cambio porcentual


promedio en el tiempo

Ejemplo:
Durante la década de 1990, y en la década de 2000, las Vegas,
Nevada, fue la ciudad de más rápido crecimiento poblacional en los
Estados Unidos. La población aumentó de 258.295 (v.inicial) en
1990 a 584.539 (v.final) en 2011. Esto es un aumento de 326.244
personas, o un aumento del 126,3 por ciento durante el período.
¿Cuál es el aumento promedio anual?

El crecimiento anual promedio durante el periodo fue de 3.97%, es


decir que la población de Las Vegas creció a una de 3.97% por año de
1990 a 2011.
3-28
O3-3

La Media Geométrica: tasa media de retorno a


lo largo del tiempo

3-29
O3-4

Medidas de Dispersión
Una medida de ubicación, como la media o la mediana, sólo
describe el centro de los datos, pero no nos dice nada acerca de
la dispersión de los datos.
Por ejemplo, si tienen que cruzar un río que le indican que en
promedió tiene 3 pies de profundidad, ¿Pasaría a pie sin
información adicional? Probablemente no. Usted querría saber
algo sobre la variación en la profundidad que puede ser de 3.25
a 2.75 pies o puede ser de o.50 a 5.5 pies para tomar la decisión
de cruzar.
Una medida pequeña de dispersión indica que los datos se
acumulan con proximidad alrededor de la media aritmética y es
representativa, pero una medida grande de dispersión indica que
la media no es confiable.

3-30
O3-4

Medidas de Dispersión
Los 100 empleados de una compañía que fabrica acero se organiza
en función del número de años que cada uno labora en la cía. La
media es de 4.9 años, pero la dispersion va de 6 meses a 16.8 años
por lo tanto la media no es representativa.

3-31
O3-4

Medidas de Dispersión
Otra razón para estudiar la dispersión es conocer el rango en que fluctúan
las observaciones para determinar qué medida es más confiable.
Ejemplo:
Un nuevo monitor de computadora es armado por dos empresas a la vez,
la producción media aritmética por hora en ambas plantas es 50, sin
embargo los registros de producción muestran que Baton Rouge el rango
va de 48 a 52 montajes por hora y Tucson el rango va de 40 a 60, la
primera empresa está más cerca de la media menos dispersa y la otra es
más dispersa. La primera es más confiable.

3-32
O3-4

Medidas de Dispersión
La medida más simple de dispersión es el rango. Representa la
diferencia entre los valores máximo y mínimo de un conjunto de
datos.

En el ejercicio anterior:
◼ Baton Rouge tiene un rango de 52 – 48 = 4
◼ Tucson tiene un rango de 60 – 40 = 20
Se ratifica que la producción media de 50 de Baton Rouge es una
medida de ubicación más representativa, porque la producción se
acumula más alrededor de 50 con un rango menor (4) existe menos
dispersion que en Tucson que tiene un rango muy amplio (20) hay
más dispersión y no es confiable.

Un problema que presenta el rango es que no toma en cuenta todos


los valores, sólo considera dos el mínimo y el máximo, por ello se usa
la Varianza.
3-33
O3-4

Varianza
La varianza supera la debilidad del rango, utiliza todos los
valores, mide la cantidad media respecto de la cual los valores
de una población o muestra varían.
Su unidad de medida corresponde al cuadrado de la unidad de
medida de la variable.

Forma de cálculo: Paso 1: Encontrar la media.

Paso 2: Calcule la diferencia entre cada observación y la media y


eleve al cuadrado esa diferencia.
Paso 3: Sume las diferencias elevadas al cuadrado en el paso 2.
Paso 4: Divida la suma de las diferencias elevadas al cuadrado entre
el número de elementos de la población.

3-34
O3-4
Desviación Media
Es una medida de dispersión poco usada debido a la dificultad de
hacer cálculos con la función valor absoluto. Es llamada también
desviación promedio de la media o desviación absoluta promedio.

Donde:
•x̄: media aritmética de los datos.
•x1, x2, x3, …, xn: datos.
•xi: cada uno de los datos.
•n: número de datos.

3-35
O3-4

Desviación Media
Ejemplo 1:
Calcular la desviación media de los siguientes datos: 2, 4, 6 y 8.
Solución:
Empezamos calculando la media aritmética de los datos, teniendo en cuenta que tenemos 4 datos (n = 4).

El valor de la media aritmética es de 5.

Ahora aplicamos la fórmula de la desviación media:

l valor de la desviación media, es de 2.

3-36
O3-4

Varianza
Ejemplo: Pag. 62: Calcular Media, Mediana, Rango y Desviación con respecto
a la media, elevar al cuadrado la Desviación aplicar formula de la Varianza.

3-37
O3-4

Varianza

3-38
O3-4

Varianza de la Población
La Varianza de la población es la media de las diferencias elevadas
al cuadrado entre cada valor y la media.

3-39
O3-4

Cálculo de la Varianza de la Población


El número de multas de tráfico emitidas durante los últimos doce meses
en el Condado de Beaufort, Carolina del sur, se divulga a continuación:

¿Cuál es la varianza de la población?

Paso 1: Encontrar la media.

= =
x 19 + 17 + ... + 34 + 10 348
= = 29
N 12 12

3-40
O3-4

Cálculo de la Varianza de la Población


¿Cuál es la varianza de la población?

Paso 2: encuentre la diferencia entre cada


observación y la media de 29 y eleve al
cuadrado esa diferencia.

Paso 3: sume todas las diferencias elevadas al


cuadrados encontradas en el paso 2.

Paso 4: divida la suma de las diferencias elevadas


al cuadrado entre el número de elementos de la
población.

 2
=
 ( X − ) 2

=
1,488
= 124
N 12
3-41
O3-4

Desviación Estándar de la Población


Al calcular la varianza no se está utilizando la misma unidad de
medida “multas mensuales” porque las multas se elevan al
cuadrado.

Para convertir a las mismas unidades de medición que emplean los


datos originales, se extrae la raíz cuadrada de la varianza de la
población. En el ejemplo anterior la raíz cuadrada de 124 es 11.4
multas. Por lo tanto la desviación estándar de la población es la raíz
cuadrada de la varianza de la población:

La desviación estándar se utiliza como medida para comparar la


dispersión de dos o más conjuntos de observaciones.

3-42
O3-4

Pasos para calcular la Varianza de la Muestra

Cálculo:
Paso 1: Encuentre la media.

Paso 2: Calcule la diferencia entre cada observación y la


media, y eleve al cuadrado esa diferencia.
Paso 3: Sume todas las diferencias elevadas al cuadrado
en el paso 2.
Paso 4: Divida la suma de las diferencias elevadas al
cuadrado entre el número de elementos de la población .

3-43
O3-4

Varianza de la Muestra
La conversión de una varianza poblacional en una muestral no es
tan directa, requiere de un cambio en el denominador (n – 1).

3-44
O3-4

Varianza de la Muestra
Los salarios por hora
para una muestra de
empleados a tiempo
parcial en Home
Depot son: $12, $20,
$16, $18 y $19.

La media de la
muestra es $17.

¿Cuál es la varianza
de la muestra?

3-45
O3-4

Desviación Estándar de la Muestra

where :
donde:
s 2 is
esthe
la varianza de la muestra
sample variance
x isesthe
el valor
valuedeof cada
eachobservación
observatioen
n inlathe
muestra
sample
esthe
x is la media de la
mean of themuestra
sample
esthe
n is el numero
numberdeofobservaciones
observationsen
in la
themuestra
sample

3-46
O3-4

Varianza y Desviación Estándar

◼ La varianza y la desviación estándar no son no


negativas y son cero sólo si todas las
observaciones son las mismas.
◼ Para las poblaciones cuyos valores están cerca
de la media, la varianza y la desviación estándar
serán pequeñas.
◼ Para las poblaciones cuyos valores se dispersan
de la media, la varianza de la población y la
desviación estándar serán grandes

3-47
O3-5

Teorema de Chebyshev
Una desviación estándar pequeña de un conjunto de valores
indica que estos se localizan cerca de la media, al contrario una
desviación estándar grande revela que las observaciones se
encuentran muy dispersas con respecto a la media.
El Teorema de Chebyshev que señala que independientemente
de la forma de distribución:
1.- Por lo menos 3 de 4 valores, esto es un 75% deben
encontrarse entre la media más 2 desviaciones estándares y la
media menos 2 desviaciones estándares.
2.- Por lo menos 8 de 9 valores, esto es un 88,9% se encontrará a
más de 3 desviaciones estándares y a menos 3 desviaciones
estándares de la media.
3.- Por lo menos 24 de 25 valores, esto es un 96% se encontrará
entre más y menos 5 desviaciones estándares de la media.

3-48
O3-5

Teorema de Chebyshev

La media aritmética de la cantidad quincenal aportada por los


empleados de Dupree Paint al plan de reparto de beneficios de la
compañía es de $51,54, y la desviación estándar es $7,51. ¿Por
lo menos qué porcentaje de las contribuciones se encuentran a
más de 3,5 desviaciones estándar y menos 3,5 desviaciones
estándar de la media?

3-49
O3-5

La Regla Empírica o Normal


En una distribución simétrica es posible ser más precisos para explicar
la dispersión en torno a la media. Estas relaciones se encuentran
descritas en:

3-50
O3-5

La Regla Empírica o Normal

3-51
O3-6

La Media Aritmética de los Datos Agrupados


La mayoría de las medidas de ubicación como la media y las medidas
de dispersión como la desviación estándar se determinan utilizando
valores individuales, pero si sólo se cuenta con la distribución de
frecuencias y se desea calcular estas medidas, se procede a realizar
una aproximación de los valores reales correspondientes.
Para aproximar la media aritmética hay que suponer que las
observaciones en cada clase se representan a través del punto medio.

3-52
O3-6

Ejemplo de Media Aritmética de los


Datos Agrupados
En el capítulo 2, construimos
una distribución de
frecuencias para los datos
de ganancia de Applewood
Auto Group para 180
vehículos vendidos.
Determinar la ganancia media
aritmética por vehículo.

3-53
O3-6

Ejemplo de Media Aritmética de los Datos


Agrupados

3-54
O3-6

Ejemplo Desviación Estándar de Datos


Agrupados
Para calcular la desviación estándar de datos agrupados en una
distribución de frecuencias se requiere la siguiente fórmula:

3-55
O3-6

Ejemplo Desviación Estándar de Datos


Agrupados
Utilizando los mismos datos de Applewood Auto Group, se calcula
la desviación estándar de las ganancias del vehículo.

3-56
O3-6

Ejemplo Desviación Estándar de Datos


Agrupados

◼ La media y la desviación estándar que se calculan a partir de datos


agrupados en una distribución de frecuencias se encuentran cerca
de los valores calculados a partir de los datos en bruto y originan
pérdida de alguna información.
◼ La solución encontrada con el uso de software es para la media
1.843,17 y para la desviación estándar es 643,63.
◼ Los valores encontrados a partir de los datos agrupados en una
distribución de frecuencias son 1851,11 y 652,33.
◼ Existe una diferencia entre medias de 7,94 aproximadamente un
0.4% y la diferencia en las desviaciones estándares es de 8,70 es
decir 1.4%, porcentualmente las aproximaciones se acercan mucho
a los valores reales.

3-57

También podría gustarte