Está en la página 1de 28

SEGUNDA UNIDAD

Cul es la importancia de las


medidas de resumen?

Orientaciones y propsitos
La presente unidad tiene como propsito conocer las medidas de tendencia
central y de dispersin, herramientas descriptivas numricas o medidas
descriptivas para resumir la informacin recolectada a travs de ciertos
valores numricos o indicadores, que permita transmitir informacin valiosa
de manera concisa e informativa. Es decir, cmo puede describirse las
caractersticas de los datos, con unos cuantos nmeros.

Sumario
1. Qu son las medidas de tendencia central?
2. Cules son las principales medidas de tendencia central?
3. Qu son las medidas de dispersin?
4. Cules son las principales medidas de dispersin?
536.Cules son lo usos ms frecuentes de la desviacin estndar?

34
Leccin 1

MEDIDAS DE TENDENCIA CENTRAL PARA


DATOS NO AGRUPADOS Y AGRUPADOS

1. Concepto (Webster,p.40)

Una medida de tendencia central o de posicin, ubica e identifica el punto o valor


numrico del cual se centran los datos.

Existen tres mtodos comunes para identificar el centro de un conjunto de datos: la


media, la mediana y la moda.

Datos no agrupados son los datos que no han sido organizados en tablas de
distribucin de frecuencias.

Al trabajar con datos que han sido agrupados en una distribucin de frecuencia, no se
conoce cules son las observaciones individuales. En una tabla de frecuencia para los
consumidores del restaurant, la tabla 1.2, se sabe solamente que en 16 horas, entre
11 y 14 clientes se presentaban en el restaurant. No se tienen las cifras exactas de
esas 16 horas. Sin los valores especficos, los procedimientos mostrados
anteriormente para calcular las medidas descriptivas, simplemente no se aplican.
Deben encontrarse mtodos alternativos. Debe tenerse en mente que los clculos
hechos utilizados datos agrupados son solo aproximaciones. Por tanto, las
observaciones individuales no agrupadas deberan utilizarse cuando sea posible.

2. La media o promedio aritmtico para datos no agrupados

Media aritmtica o media o promedio se define y calcula dividiendo la suma de todos


los valores de la variable entre el nmero de observaciones o valores.

La media es afectada por los valores extremos

2.1 Media poblacional

La media de una poblacin es el parmetro (que se pronuncia mu). Si hay N


observaciones en el conjunto de datos de la poblacin entonces la media
poblacional se calcula as:

35
2.2 Media muestral

La media de una muestra es un estadstico (que se lee Xbarra). Si hay n


observaciones en el conjunto de datos de la muestra, la media muestral se
determina as:

Ejemplo

Se supone que una muestra de los costos mensuales de una empresa en miles
de dlares para seis meses es de 85, 94, 78, 82, 90, 91. La media se calcula as:

3. La media para datos agrupados ( Webster,p.53)

Al calcular la media de datos agrupados, se supone que las observaciones en cada


clase son iguales al punto medio de la clase. Aunque esto puede ser una suposicin
heroica, probablemente se compensa debido a que posiblemente algunas de las
observaciones superan al punto medio, mientras que otros queden por debajo de l.
Dada esta suposicin, se debe tener en cuenta la frecuencia y los puntos medios de
cada clase cuando se calcula utilizando datos agrupados.

Frmula para calcular la media para datos agrupados:

En donde:

f es la frecuencia absoluta o nmero de observaciones en cada clase.


M es el punto medio de cada intervalo de clase
n es el tamao de la muestra y es igual a las frecuencias absolutas sumadas en
todas las clases

Ejemplo

Utilizando los datos organizados en la tabla 1.2 de consumidores del restaurant, se


tiene:

36
Tabla 2.1 Distribucin de frecuencia para consumidores del restaurant Sabor a Ti

Utilizando la frmula de la
media

= 593 = 14.83
40

4. La media ponderada ( ) (Webster,p.43)

Definicin
La media ponderada toma en cuenta la importancia relativa de las observaciones.
La media ponderada se calcula mediante la siguiente frmula:

En donde:

es la media ponderada
X es la observacin individual
W es el peso o ponderacin asignada a cada observacin
Ejemplo
Se asume que se obtuvo un puntaje de 89, 92 y 79 en los exmenes parciales y 94 en
el examen final. Estos puntajes y sus respectivas ponderaciones estn reflejados en la
tabla 2.2.
Tabla 2.2 Clculo de la media ponderada

Nota (X) Peso(W X


) W
89 1 89
92 1 92
79 1 79
94 2 18
8
5 44
8

37
5. La media geomtrica (MG) (Webster,p.44)

Definicin
La media geomtrica puede utilizarse para mostrar los cambios porcentuales promedio
en una serie de nmeros positivos.
La media geomtrica se utiliza con ms frecuencia para calcular la tasa de crecimiento
porcentual promedio de algunas series dadas, a travs del tiempo.
La media geomtrica (MG) se halla tomando la raz ensima del producto de n
nmeros. As:

Ejemplo

Considerar las cifras sobre ingresos de White-Knuckle Airlines, la principal


competencia de P&P durante los ltimos cinco aos.
El director ejecutivo de White-Knuckle Airlines desea determinar la tasa de crecimiento
promedio en los ingresos con base en las cifras dadas en la siguiente tabla. Si la tasa
de crecimiento promedio es menor que el promedio industrial del 10%, se asumir una
nueva campaa publicitaria.

Ao Ingresos $ Porcentaje del ao anterior


1992 50,000 -----
1993 55,000 55/50=1.10
1994 66,000 66/55=1.20
1995 60,000 60/66=0.91
1996 78,000 78/60=1.30

Tomando la media geomtrica (MG) de estos porcentajes da

Restando 1 para convertirlo a un incremento anual promedio da 0.1179.

Interpretacin:

La compaa area ha tenido un crecimiento promedio anual en sus ingresos de


11.79% para el periodo de cinco aos. O los ingresos se han incrementado
anualmente a un ritmo promedio de 11.79%.

38
6. La mediana para datos no agrupados (Me) (Webster,p.42)

Definicin:
La mediana o valor mediano o media posicional, porque queda exactamente en la
mitad del conjunto de datos despus de que las n observaciones se han colocado en
serie ordenada. La mitad de las observaciones (el 50%) estar por encima de la
mediana, la otra mitad (el otro 50%) estar por debajo de ella.

La mediana no es afectada por los valores extremos

Clculo de la mediana:
1 Ordenar los datos en forma creciente o decreciente.
2 Si n es impar entonces la Me = valor central
Si n es par entonces la Me = Promedio de los dos valores centrales

Ejemplo

Dado los datos sobre los ingresos por ventas mensuales: 56, 67, 52, 45, y 67

1 Se ordenan los datos en forma creciente: 45, 52, 56, 67, 67


2 Como n=5 es impar, entonces la Me =56 (valor central)

Ejemplo

Si a los datos sobre los ingresos por ventas mensuales fueran: 56, 67, 52, 45, 67 y 35

1 Se ordenan los datos en forma creciente: 35, 45, 52, 56, 67, 67
2 Como n=6 es par, entonces la Me =(52+56)/2 =54

7. La mediana para datos agrupados (Webster,p.54)

Para determinar la mediana para datos agrupados se debe tener en cuenta lo


siguiente:

1 Determinar la clase mediana, que contiene el valor de la mediana


La clase mediana es la primera clase cuya frecuencia absoluta acumulada es
mayor que o igual a n/2.

2 Se determina el valor de la mediana mediante la siguiente frmula:

En donde:
Lmd es el lmite de la clase de la mediana (11)

39
F es la frecuencia absoluta acumulada de la clase que antecede a la clase
mediana (4)
fmd es la frecuencia absoluta de la clase mediana (16)
C es el intervalo de clase (3)
n tamao de la muestra (40)

Ejemplo

Se suministra la tabla de frecuencia de pasajeros de los consumidores del restaurant


la tabla 1.2. En este caso, debido a que n es 40, la clase mediana, se localiza en la
primera clase cuya frecuencia acumulada es igual o mayor a 20. La tercera clase tiene
una frecuencia acumulada de F=2920=n/2. Entonces el valor de la mediana se
calcula en la segunda clase.

Tabla 2.3 Distribucin de frecuencia para pasajeros los consumidores del restaurant
Sabor a Ti

TABLA DE FRECUENCIAS
INTERV FREC.
MARCA FREC. FREC.R Utilizando la
ALOS AC.
S(X') AB. (f) EL (h)
frmula (X) (F) de la mediana:
Clase 8 11 9.5 4 4
mediana
11 14 12.5 16 20 F=29>20=n/2
14 17 15.5 9 29
17 20 18.5 8 37
20 23 21.5 2 39
23 26 24.5 1 40

Interpretacin

Se puede concluir que en 20 horas la mitad de las 40 horas estudiadas menos de 14


clientes consumieron en el restaurant, y en las otras 20 horas, ms de 14.00 clientes
consumieron en el restaurant.

8. La moda para datos no agrupados (Mo) (Webster,p.42)

Definicin

La observacin modal es la observacin que ocurre con mayor frecuencia.

Ejemplo
40
Utilizando las seis observaciones anteriores de 35, 45, 52, 56, 67, 67, la moda es 67.
Si la sptima observacin es 56 se agregar, el conjunto de datos sera bimodal, con
modas de 56 y 67.

9. La moda para datos agrupados (Webster,p.55)

Ya que por definicin la moda es la observacin que ocurre con mayor frecuencia,
considerar lo siguiente:

1 Determinar la clase modal, que contiene el valor de la moda.


La clase modal es la clase que tiene la mayor frecuencia absoluta.

2 Se determina el valor de la moda mediante la siguiente frmula:

En donde

Lmo es el lmite inferior de la clase modal (11)


Da es la diferencia entre la frecuencia absoluta de la clase modal y la clase
que la antecede (16-4).
Db es la diferencia entre la frecuencia absoluta de la clase modal y la clase
que le sigue (16-9)
C es el intervalo de clase de la clase modal (3)

Ejemplo

Utilizando los datos organizados en la tabla 1.2 de los clientes del restaurant, se tiene:

Tabla 2.4. Distribucin de frecuencia para consumidores del restaurant Sabor a Mi

Clase
Modal

fmo

41
Interpretacin

El nmero de clientes que consumieron en el restaurant con mayor frecuencia fue 12.89
clientes.

10. Comparacin de la media, mediana y moda

La media es la medida ms comn de tendencia central. Se presta para mayor


manipulacin e interpretacin algebraica. Desafortunadamente, la media se ve
afectada por valores extremos o valores atpicos y a diferencia de la mediana puede
ser sesgada por las observaciones que estn muy por encima o muy por debajo de
sta.

Por ejemplo para los datos 4, 5, 6, 6, 7, 8 la media y la mediana son ambas 6 y


representa una excelente medida del punto central de los datos. Si la ltima
observacin fuera 80 en lugar de 8, la media sera 18 pero la mediana todava sera 6.
Debido a que la mediana todava se afectada por este valor extremo, representa mejor
las seis observaciones.

La moda tambin es menos afectada por unas pocas observaciones atpicas y sigue
siendo 6 an cuando el ltimo valor sea 80. Sin embargo, si no hay moda, o si el
conjunto de datos es binomial, su uso puede ser confuso.

11. Ejercicios propuestos

1. Una empresa grande de equipos deportivos est probando el efecto de dos planes
publicitarios sobre las ventas de los ltimos 4 meses. Dadas las ventas en dlares
que se ven aqu cul programa de publicidad parece producir el crecimiento
promedio ms alto en ventas mensuales?

Solucin: Media geomtrica:

2. Como gerente de ventas usted desea calcular las medidas de tendencia central
para los niveles de utilidad de su firma, durante los ltimos doce meses, ya que
las siguientes utilidades mensuales estn dadas en miles de dlares:

12.3 14.3 25.7


21.6 21.6 -12.8
22.3 18.0 23.1
-3.4 17.9 22.3
----------------------------------------------------------------------------------------

42
Solucin
Media:
Mediana:
Moda:

3. Los encargados de atender un programa especial, desean evaluar sus servicios


de atencin a enfermos confinados en casa, el cual llevan comidas calientes. El
nmero de comidas diarias que suministran aparece en la siguiente tabla de
frecuencia.

Nmero de Nmero de M fM
comidas por da das f F
0 5 3 3 2.5 7.5
6 11 6 9 8.5 51.0
12 17 5 14 14.5 72.5
18 23 8 22 20.5 164.0
24 29 2 24 26.5 53.0
30 35 3 27 32.5 97.5
n=27 445.5

Solucin:
La media, la mediana y el nmero modal de comidas son:

Leccin 2

MEDIDAS DE DISPERSIN PARA DATOS


NO AGRUPADOS Y AGRUPADOS

1. Concepto (Mitacc, p.104, Avila,p.117, Webster,p.47)

Las medidas de dispersin o variabilidad permiten cuantificar el grado de


concentracin o de dispersin de los valores de la variable en torno de un promedio o
valor central de la distribucin. Miden el grado de concentracin o dispersin de las
observaciones alrededor de un valor central. Miden que tanto se dispersan las
observaciones alrededor de su media.

Al trabajar con datos que han sido agrupados en una distribucin de frecuencia, no se
conoce cules son las observaciones individuales. En una tabla de frecuencia para
consumidores de un restaurant, la tabla 3.2, se sabe solamente que en 16 horas, entre
11 y 14 consumieron en el restaurant. No se tienen las cifras exactas de esas 16
horas. Sin los valores especficos, los procedimientos mostrados anteriormente para
calcular las medidas descriptivas, simplemente no se aplican. Deben encontrarse
mtodos alternativos. Debe tenerse en mente que los clculos hechos utilizados datos
agrupados son solo aproximaciones. Por tanto, las observaciones individuales no
agrupadas deberan utilizarse cuando sea posible.

43
2. Rango o recorrido (R) (Webster,p.48)

Definicin

La medida de dispersin ms simple (y menos til) es el rango recorrido. El rango es


simplemente la diferencia o distancia entre la observacin ms alta y ms baja. Su
ventaja es que es fcil de calcular. Su desventaja es que considera slo dos de los
cientos de observaciones que hay en un conjunto de datos. El resto de las
observaciones se ignoran. Los rangos de los tres conjuntos de datos anteriores son
10, 2 y 0 respectivamente.

3. Varianza y desviacin estndar de una poblacin

3.1. La varianza (Webster,p.48)


La varianza es el promedio de las observaciones individuales respecto a su
media elevadas al cuadrado.

3.1.1 La varianza de una poblacin (2)

En donde:
X1, X2, X3, . , XN son las observaciones individuales de la poblacin
= Es la media poblacional
N = Es el nmero de observaciones en la poblacin

3.2. La desviacin estndar de una poblacin ():

Ejemplo
A manera de ilustracin, una compaa vende cinco plizas de seguro diferentes;
sus respectivas primas mensuales son de US$110, US$145, US$125, US$95,
US$150. La prima promedio es:

44
La varianza se halla: (1) restando la media de US$125 de cada una de las
observaciones, (2) elevado al cuadrado estas desviaciones, y (3) hallando el
promedio de estas desviaciones al cuadrado. Al seguir estos tres pasos resulta:

A pesar del uso comn de la varianza, sta presenta dos problemas: es un


nmero muy grande con respecto a las observaciones. Como se puede ver, es
varia veces mayor incluso que la observacin ms grande. Debido a su gran
tamao, con frecuencia la varianza se vuelve difcil para trabajar.

Un problema an ms angustioso es que debido a que las desviaciones son


elevadas al cuadrado, la varianza siempre se expresa en trminos de los datos
originales elevados al cuadrado. En el caso de las plizas, debido a que elev al
cuadrado las desviaciones de la media, entonces se convierte en 430 dlares al
cuadrado, - una unidad de medida que no tiene sentido. En la mayora de los
casos la varianza se expresa en trminos que no tienen significado o
interpretacin lgica.

Sin embargo, ambas complicaciones pueden resolverse rpidamente. Tan solo


con hallar la desviacin estndar , sacando la raz cuadrada de la varianza:

As de fcil, se solucionan ambos problemas. Ahora se un tiene nmero ms


pequeo con el cual es ms fcil trabajar, y ms importante an, ahora est
expresado en dlares ya que se tom la raz cuadrada de los dlares elevados al
cuadrado.

El concepto de desviacin estndar es muy importante en los negocios y en la


economa. Por ejemplo, en finanzas la desviacin estndar se utiliza como
medida de riesgo relacionada con varias oportunidades de inversin. El analista
financiero puede medir el nivel de riesgo que tiene cada activo financiero.

Generalmente, entre mayor sea la desviacin estndar de la tasa de rendimiento


de una inversin en particular, mayor ser el grado de riesgo.

4. Varianza y desviacin estndar de una muestra

Rara vez se puede calcular parmetros. En la mayora de los casos ms bien se


estimaran tomando una muestra y calculando los estadsticos correspondientes.
Teniendo este presente, esta seccin analiza la forma como se calcula estas
importantes medidas de dispersin en la medida en que se relacionan con las
muestras.

La varianza y la desviacin estndar para una muestra representan medidas de


dispersin alrededor de la media. Se calculan de manera parecida a aquellas para una
poblacin. La varianza de la muestra o varianza muestral s2 es:

45
4.1. La varianza muestral (s2)

En donde:
X1, X2, X3, . ,Xn son las observaciones individuales de la muestra.
X = es la media de la muestra

N = es el nmero de observaciones de la muestra.


4.2. La desviacin estndar de la muestra (s)

Ejemplo

El gerente de una empresa desea determinar la estabilidad del precio de una


accin en particular. Decide basar su juicio en la estabilidad de la desviacin
estndar del precio de cierre diario de dicha accin. Al revisar las pginas
financieras, el gerente sabe que la accin ha sido transada en la bolsa durante
algn tiempo y que hay muchos precios de cierre desde hace varios meses. En
lugar todos estos precios, decide simplificar su aritmtica y seleccionar una
muestra aleatoria de n = 7 das. (Aunque 7 probablemente es una muestra muy
pequea, servir por el momento para los propsitos que se tiene), los precios
de cierre son:

$87, $120, $54, $92, $73, $80 y $63

Solucin

46
Interpretacin

El gerente ha estimado que la media del precio de cierre de la accin es de


$81.29, con una tendencia a variar por encima o por debajo de dicho precio en
$21.58. El gerente puede interpretar siempre de la desviacin estndar de
$21.58 como una medida de tendencia de los precios de cierre que tienden a
fluctuar alrededor de su media de $81.29 dlares.

5. La varianza y desviacin estndar muestral para


datos agrupados. (Webster,p.55)

Si los datos estn agrupados en una tabla de frecuencia, la varianza muestral y la


desviacin estndar muestral pueden calcularse como:

5.1 La varianza muestral para datos agrupados.


Tiene la siguiente frmula:

5.2 La desviacin estndar muestral para datos agrupados.

Tiene la siguiente frmula:

Ejemplo: Medidas de dispersin con datos agrupados.

El gerente del restaurant requiere informacin sobre la dispersin del nmero de


comensales, las decisiones se toman con respecto a la programacin y a la cantidad
eficiente de insumos, esto depender de la fluctuacin en el nmero de clientes. Si
sta variacin es significativa, se puede necesitar una compra mayor de insumos para
evitar el desabastecimiento en los das en que la demanda del restaurant es mayor.

Tabla 2.5 Distribucin de frecuencias para nmero de clientes del restaurant Sabor aTi

47
Solucin

1 Se calcula la media con los datos de la tabla 2.5 cuadro en:

2 Con la frmula de la varianza:

3 La desviacin estndar ser:

Interpretacin

El gerente del restaurante ahora puede decidir si los insumos que se estn utilizando
actualmente pueden acomodar fluctuaciones en el nmero de comensales tal y como
lo mide una desviacin estndar de 3.54. Si no, quiz se proveern de mayor cantidad
de insumos para acomodar cualquier excedente que pueda ocurrir en esos das de
mayor demanda

48
6. Ejercicios propuestos.

1. Los encargados de atender un programa especial, desean evaluar sus servicios de


atencin a enfermos confinados en casa, el cual llevan comidas calientes. El
nmero de comidas diarias que suministran aparece en la siguiente tabla de
frecuencia.

Nmero de comidas Nmero de das F M fM fM2


por da f
0 5 3 3 2.5 7.5 18.75
6 11 6 9 8.5 51.0 433.50
12 17 5 14 14.5 72.5 1,051.25
18 23 8 22 20.5 164.0 3,360.00
24 29 2 24 26.5 53.0 1,404.50
30 35 3 27 32.5 97.5 3,168.75
n=27 445.5 9,438.75

Solucin: La media, la mediana y el nmero modal de comidas son:

2. El ausentismo diario en su oficina parece ir en aumento. El ao pasado un


promedio de 47.8 empleados estuvo ausente algunos das, con una desviacin
estndar de 14.7. Se recolect una muestra de datos para el ao en curso y se
ubicaron en la tabla de frecuencias que se muestra de datos para el ao en curso y
se ubicaron en la tabla de frecuencias que se muestra a continuacin. Calcule la
media, la mediana, la moda, y la desviacin estndar para estos datos y
compralos con los del ao anterior. A qu conclusiones llega? Completar

Nmero de Das en los que ese


empleados nmero estuvo F M fM f M2
ausentes ausente

20 - 29 5 5
30 - 39 9 14
40 - 49 8 22
50 - 59 10 32
60 - 69 12 44
70 - 79 11 55
80 - 89 8 63
90 - 99 3 66
n=66 3,887 254,146.50

49
Leccin 3

USOS FRECUENTES DE
LA DESVIACIN ESTNDAR
1. Concepto (Webster,p.59)

Como se ha enfatizado, la desviacin estndar es til para describir un conjunto de


datos midiendo el grado de las observaciones individuales alrededor de su media.
Existen dos aplicaciones adicionales para la desviacin estndar: (1) Teorema de
Chebyshev y (2) la Regla emprica.

2. Teorema de Chebyshev (Webster,p.59)

Definicin

El teorema de Chebyshev, establece que para todo conjunto de datos, por lo menos 1
1/K2 % de las observaciones estn dentro de K desviaciones estndar de la media,
en donde K es cualquier nmero mayor que 1.

Ejemplo

Si se forma un intervalo de K = tres desviaciones estndar por encima de la media


hasta tres desviaciones estndar por debajo de la media, entonces por lo menos:

de todas las observaciones estarn dentro de dicho intervalo.

3. La distribucin normal y la regla emprica (Webster,p.60)

La desviacin estndar puede utilizarse para sacar ciertas conclusiones si el conjunto


de datos es cuestin est distribuido normalmente. El concepto de una distribucin
normal se encuentra usualmente en anlisis estadstico y es de importancia
considerable. Una discusin minuciosa de la distribucin normal se presenta en
captulos posteriores. Sin embargo, una introduccin a todo este concepto importante
50
permitir demostrar un uso prctico para la desviacin estndar, y establecer la base
para una futura investigacin ms completa.
Una distribucin normal es una distribucin de datos continuos (no discretos) que
produce una curva simtrica en forma de campana, como la que muestra la figura
siguiente:

Figura 2.1 Una distribucin normal (Webster,p.60)

Se asume que se tiene un nmero grande de observaciones para el tiempo, en


minutos, que le toma a los esquiadores terminar un trayecto en particular. Si los datos
estn distribuidos normalmente, una grfica de la frecuencia con la cual ocurre cada
observacin tomara la forma de la figura 2.1. Las observaciones en cada extremo
ocurrirn relativamente de forma poco frecuente, pero las observaciones que estn
ms cerca de la mitad ocurrirn con una frecuencia alta, por tanto se produce la curva
simtrica en forma de campana. La observacin modal, 10 en este caso, es la que
ocurre con la mayor frecuencia y por tanto esta en el pico de la distribucin. En una
distribucin normal, la media, la mediana y la moda son todas iguales.

Es de importancia que la mitad de las observaciones est por encima de la media y la


mitad est por debajo. Esto significa que la mitad del rea que est bajo la curva esta
ala izquierda de la media y la otra mitad del rea que est debajo de la curva est a la
derecha de la media.

Para ilustrar como se aplica la desviacin estndar en la distribucin normal, se asume


que 1,000 esquiadores de slalom bajan una pendiente empinada. Los tiempos para
todos los esquiadores parecen estar distribuidos normalmente, con una media de =10
minutos y una desviacin estndar de =2 minutos. La regla emprica dice que si se
incluyen todas las observaciones que estn a una desviacin estndar de la media
(una desviacin estndar por encima de la media y una desviacin estndar por
debajo de la media) estas sern el 68.3% de todas las observaciones. Es decir, que no
importa cul es la media ni cul es la desviacin estndar, se puede estar seguro de
que el 68.3%de las observaciones quedan a una desviacin estndar de la media si
las observaciones estn distribuidas normalmente.

Debido a que el promedio de los esquiadores se toma 10 minutos para completar el


trayecto, mover una desviacin estndar (es decir, 2 minutos) por encima y por debajo
de esa media de 10 produce un rango de 8 a 12 minutos para bajar la montaa.

51
Claro que si se mueve ms de una desviacin estndar por encima y por debajo de la
media, se comprender un porcentaje ms grande de observaciones.

La regla emprica especifica que:

El 68.3% de las observaciones estn dentro de ms o menos una desviacin estndar


de la media.

El 95.5% de las observaciones estn dentro de ms o menos dos desviaciones


estndar de la media.

El 99.7% de las observaciones estn dentro de ms o menos dos desviaciones


estndar de la media

Dados los tiempos de los esquiadores, una desviacin estndar (2 minutos) por
encima y por debajo de la media de 10 da un rango de 8 a 12 minutos. Dos
desviaciones estndar (4 minutos) por encima y por debajo de la media de 10 da un
rango de 6 a 14 minutos. Tres desviaciones estndar (6 minutos) de un rango de 4 a
16 minutos. Esto se muestra en la figura 2.2.

Figura 2.2 Tiempos distribuidos normalmente de los 1,000 esquiadores (Webster,p.61)

De acuerdo con la regla emprica, 997 de los 1,000 esquiadores se tomaron entre 4 y
16 minutos para terminar el trayecto. As, solo 3 de los 1,000 esquiadores fueron o
muy buenos esquiadores y tomaron menos de 4 minutos o eran muy malos y se
tomaron ms de 16 minutos.

Tambin es importante recordar que la regla emprica describe el rea total bajo la
curva normal que se encuentra dentro de un rango dado. No solo el 68.3% de todos
los esquiadores se toman entre 8 y 12 minutos para bajar de forma segura la montaa,
sino que, adems, el 68.3% de toda el rea que est bajo la curva normal est dentro
del mismo rango de 8 a 12 minutos.

Si las observaciones estn altamente dispersas, la curva en forma de campana se


aplanara y se esparcir.

Se asume que un segundo grupo de esquiadores tambin hizo un promedio de 10


minutos, pero tuvo una desviacin de 4 minutos. Los tiempos del segundo grupo estn
ms dispersos que los del primero. Los tiempos ms rpidos en aqu estaban por
debajo de 10, y los ms lentos estaban muy por encima de 10, comparados con los del

52
primer grupo. Esta dispersin mayor se reflejara en una curva de distribucin normal
ms extensa, tal y como se muestra en la figura 2.3

Figura 2.3 Dos distribuciones normales con medias iguales pero con
desviacin estndar diferentes (Webster,p.62)

4. El sesgo de Pearson

No todas las distribuciones son normales. Algunas estn sesgadas a la izquierda o a la


derecha. En la figura 2.4, se encuentran las curvas de distribucin para el peso de las
personas. En la figura 2.4 (a) se dice que la distribucin esta sesgada a la derecha.
Parecera que las pocas personas ms pesadas que estn en el extremo superior en
la escala de peso (quiz algunos hombres ms grandes) halan la cola de la
distribucin hacia la derecha. En una segunda distribucin de pesos que se muestra
en la figura 2.4 (b), unas cuantas mujeres diminutas halan la distribucin hacia el
extremo inferior, haciendo que se desvi hacia la izquierda.

Figura 2.4 Distribucin sesgada del peso de las personas (Webster,p.62)

53
En la tercera distribucin 2.4 (c) no hay valores extremos que desven la cola de la
distribucin hacia un solo lado, en este caso coincidirn la media, mediana y moda.

En todos los casos, la moda es por definicin la observacin que ocurre con mayor
frecuencia.

Por tanto, est en el pico de la distribucin. Sin embargo, como se dijo anteriormente,
por su sola naturaleza, la media se ve ms afectada por las observaciones extremas.
Por tanto, es halada en la direccin del sesgo, ms de lo que est en la mediana, la
cual est en algn sitio entre la media y la moda.

El sesgo puede medirse mediante el coeficiente de sesgo de Pearson.

Si P<0, entonces los datos estn sesgados a la izquierda


Si P>0, entonces estn sesgados a la derecha;
Si P=0 estn distribuidos normalmente.

Ejemplo Sesgo para los comensales del restaurant Sabor a mi

Utilizando los datos agrupados de los comensales del restaurant, se calcula =14.83,
s=3.54 y la mediana =14. Dada esta informacin, el dueo del restaurant puede ver
claramente que los datos estn sesgados a la derecha, debido a que la media excede
a la mediana. Adems, tambin desea una medida del grado de sesgo.

Solucin:

Interpretacin
Debido a que P>0, los datos para el restaurant estn, como se presumi, sesgados a
la derecha. El grado hasta el cual estn sesgados se refleja en el valor del coeficiente
de Pearson. Si se fuera a hacer la grfica de los datos, apareceran como en la figura
2.4 (a).

5. Coeficiente de variacin (Webster,p.63)

54
Cuando se consideran dos o ms distribuciones que tiene medias significativamente
diferentes, o que estn medidas en unidades distintas, es peligroso sacar conclusiones
respecto a la dispersin slo con base en la desviacin estndar.

Por tanto, con frecuencia debemos considerar el Coeficiente de Variacin (CV), el cual
sirve como medida relativa de dispersin. El coeficiente de variacin determina el
grado de dispersin de un conjunto de datos relativo a su media. Se calcula dividiendo
la desviacin estndar de una distribucin por su media y multiplicando por 100.

A mayor coeficiente de variacin, mayor dispersin de datos y viceversa.

Ejemplo

Los datos agrupados para el restaurant Sabor a ti una media de =14.83


comensales por hora con una desviacin estndar s=3.54 clientes. Se supone que
Sabor a ti tiene al frente una competencia llamada Sabor a mi cuya desviacin

estndar es de s=7.56 y su media =18.78. La desviacin estndar ms alta de la


competencia puede sugerir que estos datos presentan una variacin mucho mayor.

Sin embargo, si se calcula el coeficiente de variacin para Sabor a ti, se encuentra que
es:

Mientras que para Sabor a mi es solamente

Es claro que al comparar la variacin en dos conjuntos de datos muy diferentes, es


sabio utilizar el coeficiente de variacin y no slo la desviacin estndar.

6. Ejercicios propuestos

1. Un conjunto de datos distribuidos normalmente tiene una media de 5,000 y una


desviacin estndar de 450. Qu porcentaje de las observaciones estn: (Usar la
regla emprica)

55
a. Entre 4550 y 5450? Rpta. ( %)
b. Entre 4100 y 5900? Rpta. (.%)
c. Entre 3650 y 6350? Rpta. (%)

2. Una compaa corta troncos a una longitud media de 20 pies, con una desviacin
estndar de 3.5 pies. Si los cortes estn distribuidos normalmente, qu porcentaje
de troncos tienen menos de: (Usar la regla emprica)

a. 16.5 pies?
b. 13 pies?

3. Datos sobre las edades de los 100 mejores ejecutivos de las mejores 500 firmas
de una revista revelan una edad media de 56.2 aos y una desviacin estndar de
12.7 aos. Su ingreso medio es US$89,432, con s = US$16,097. Cul variable,
edad o ingreso, presenta la mayor variacin? (Usar coeficiente de variacin).

4. Si el ingreso mediano del ejercicio 3 es de $87,567 dlares,

a. Los datos estn sesgados a la derecha, a la izquierda o distribuidos normalmente?


b. Cul es el coeficiente de sesgo de Pearson? (Rpta. 0.3476)

RESUMEN

En sta unidad hemos definido, calculado y comparado los tres ndices de tendencia
central que se emplean ms frecuentemente en la descripcin de las distribuciones de
frecuencia: la media, la mediana y la moda para datos agrupados y no agrupados.

Para describir por completo una distribucin de valores, necesitamos algo ms que las
medidas de tendencia central. Debemos ser capaces de describir cmo se dispersan
estos valores con respecto a la tendencia central, por eso hemos estudiado: varianza,
la desviacin estndar, los percentiles y el rango intercuartil. As como el teorema de
Chebyshev, la regla emprica de la distribucin normal, el sesgo y el coeficiente de
variacin.

TEXTO PARA LEER

Gmez, Doris y otros (2006) Estadstica descriptiva. Con soporte de spss y matlab.
Lima, Fondo editorial UNMSM.

56
ACTIVIDADES

1. El director de la planta de Intel desea que usted compare los salarios promedio en
su planta de Palo Alto con las de la competencia que queda ubicada en las
cercanas de San Jos. De los 6,012 empleados que supervisa 1,212 ganan
US$12.30 la hora; a 650 se les paga US$15.50; 3,098 ganan US$23.50, y al resto
se les paga US$17.12. De los 5,634 empleados que hay en la otra planta 1,654
gana US$12.75; 815 reciben US$17.80 y los otros US$20.10. Escriba un breve
informe para que el director obtenga detalladamente la informacin que desea.

2. Todos estos estadsticos importantes pueden obtenerse en los computadores


utilizando varios paquetes. La pantalla 2.1 muestra una copia impresa en Excel
para los datos brutos de pasajeros P&P del Webster, pag.21., (para datos no
agrupados. Presentar adems en SPSS, Minitab y Statgraphics.

Pantalla 2.1
Estadsticos descriptivos de P&P

Mean(Media) 78.36
Standard error (Error estndar) 1.599938
Median (Mediana) 78.5
Mode (Moda) 83
Standard deviation (Desviacin estndar) 11.31327
Sample variance (Varianza de la muestra) 127.9902
Kurtosis (Curtosis) 0.036918
Skewness (Sesgo) 0.052259
Range (Rango) 52
Minimum (Mnimo) 50
Maximum (Mximo) 102
57
Sum (Suma) 3918
Count (Conteo) 50

3. Anteriormente, el tiempo para completar un trabajo determinado en las oficinas de


una compaa haba arrojado las siguientes estadsticas en horas: una media de
12.2, una mediana de 13.2, y una moda de 14.5. La varianza fue de 8.21. Se
reflejan datos ms recientes en la siguiente tabla de frecuencias. El gerente de la
compaa lo contrata como consultor externo para evaluar los cambios en la
eficiencia de los empleados. Calcule los estadsticos correspondientes con base
en estos datos y prepare un breve informe. Qu conclusiones obtiene?

Horas tomadas hasta la Nmero de veces que dicho


finalizacin del trabajo trabajo se tom este tiempo
5 y menos de 7 4
7 y menos de 9 8
9 y menos de 11 12
11 y menos de 13 8
13 y menos de 15 5
15 y menos de 17 2

AUTOEVALUACIN

1. Debido a que las tasas de inters cayeron a comienzos de 1997, se encontr que
una muestra de las tasas de hipotecarias para hipotecas a 15 aos de las
instituciones de crdito en Peoria, Illinois, era: 7.1%, 7.3%, 7.0%, 6.9%, 6.6%,
6.9%, 6.5%, 7.3%, 6.85%

Estos datos estn sesgaos a la izquierda, a la derecha, o estn distribuidos


normalmente? Calcule el coeficiente de Pearson como medida de sesgo.

Alternativas:
a) 0.243, der. b) -0.332, der. c) -0.543, izq. d) 0.423, der.

2. Alan Color fabrica una pintura sellante para automviles. l utiliza cuatro qumicos
diferentes en el proceso de produccin. Para hacer su producto, Color debe
utilizar 2 galones de calcimina que cuesta US$2.50 el galn, galn de kalsolita a
US$1.25 por galn, 1 galn de aglunitante que cuesta US$0.75 el galn y 3
galones de aceite secante a US$2.00 por galn. Calcule el costo de un galn de
sellante.

Alternativas: a) 2.80 b) 3.85 c)1.90 d) 2.90

3. La compaa Cerka vende cuatro tipos de cercas a los barrios residenciales de las
afueras de la ciudad. El grado A le cuesta a Cerka US$5.00 por pie lineal de
instalacin, el grado B cuesta US$3.50, el grado C cuesta US$2.50 y el grado D
cuesta US$2.00. Ayer, Cerka instal 100 yardas de grado A, 150 del grado B, 75
yardas del grado C y 200 yardas del grado D. Cul fue el promedio de instalacin
por pie lineal?

Alternativas: a) 2.80 b) 3.07 c) 4.16 d)3.78


58
4. Un inversionista compr 20 acciones a US$15 cada una, 50 acciones a US$20
cada una, 100 acciones a US$30 cada una y 75 acciones a US$35 cada una.

1. Cul es el monto total de su inversin?


2. Cul es el precio promedio por accin?

Alternativas: a) 5,333 y 26.777 b) 5,989 y 25.257

c) 6,925 y 28.265 d) 7,969 y 27.777

5. Las edades de cincuenta de los directores ejecutivos de las mejores


corporaciones de la nacin, aparecen en la siguiente tabla de frecuencias.
Calcular el Coeficiente de Pearson

Edades Frecuencias
50 y menos de 55 8
55 y menos de 60 13
60 y menos de 65 15
65 y menos de 70 10
70 y menos de 75 3
75 y menos de 80 1

Alternativas: a) -2.809 b) 0.081 c) 1.465 d) -1.258

6. Tambin se proporcion datos sobre los salarios en miles de dlares. Result la


siguiente tabla de frecuencia. Calcular el Coeficiente de Pearson

Salario (en miles de dlares Frecuencias


90 y menos de 440 9
440 y menos de 790 11
790 y menos de 1140 10
1140 y menos de 1490 8
1490 y menos de 1840 4
1840 y menos de 2190 3
2190 y menos de 2540 5

Alternativas: a) 0.511 b) 1.511 c) -1.321 d) -1.222

7. Quienes ponen los discos en una emisora A claman que ponen ms canciones
cada hora que sus rivales de la emisora B de otro pueblo. Durante las ltimas 24
horas se recolectaron y tabularon los datos sobre el nmero de canciones puestas
por ambas estaciones. Utilice los datos para preparar un reporte que compare las
dos referencias respecto a sus medidas de dispersin. Calcular el Coeficiente de
variacin.

Nmero de canciones por hora Emisora A Emisora B

59
5 - 10 2 4
11 - 16 4 5
17 - 22 6 7
23 - 28 8 5
29 - 34 2 2
35 - 40 3 1

Alternativas: a) CVA= 0.368 y CVB=0.426

b) CVA= 1.543 y CVB= 2.599


c) CVA= 2.876 y CVB= 2.123
d) CVA= 3.684 y CVB= 2.357

Respuestas de control
1. d, 2. c, 3.b, 4. c, 5. b, 6. a, 7. a

EXPLORACIN ON LINE

1. http://es.wikipedia.org/wiki/Medidas_de_tendencia_central
2. http://uptprobest.files.wordpress.com/2008/02/act-04-medidas-tendencia-central.pdf
3. http://thales.cica.es/rd/Recursos/rd99/ed99-0278-01/est_des5.html
4. http://es.wikipedia.org/wiki/Medidas_de_dispersi%C3%B3n
5. http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt152.html
6. http://www.hiru.com/es/matematika/matematika_06000.html

REFERENCIAS BIBLIOGRFICAS

Avila Acosta, Roberto (2003) Estadstica elemental. Lima, Estudios y Ediciones RA,
pp.102, 106, 108, 117,

Gmez, Doris y otros (2006) Estadstica descriptiva. Con soporte de spss y matlab.
Lima, Fondo editorial UNMSM, pp. 16,18

Kazmier, Leonard y Alfredo Daz Mata (1993) Estadstica aplicada a la administracin


y a la economa. 2da. Ed. Revisada. Mxico, McGraw-Hill, p.37

Mitacc, Mximo (1995) Tpicos de estadstica descriptiva y probabilidad. 1ra. Ed.


Lima, Per, Editorial San Marcos, p.104.

60
Webster, Allen L (2000) Estadstica aplicada a los negocios y la economa. 3ra. Ed.
Santa Fe de Bogot, Irwin MacGraw-Hill, pp. 40-64.

REFERENCIAS COMENTADA

Webster, Allen L (2000) Estadstica aplicada a los negocios y la economa. 3ra. Ed.
Santa Fe de Bogot, Irwin MacGraw-Hil.
Este autor desarrolla esta unidad de la manera ms sencilla y clara.

61

También podría gustarte