Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Orientaciones y propsitos
La presente unidad tiene como propsito conocer las medidas de tendencia
central y de dispersin, herramientas descriptivas numricas o medidas
descriptivas para resumir la informacin recolectada a travs de ciertos
valores numricos o indicadores, que permita transmitir informacin valiosa
de manera concisa e informativa. Es decir, cmo puede describirse las
caractersticas de los datos, con unos cuantos nmeros.
Sumario
1. Qu son las medidas de tendencia central?
2. Cules son las principales medidas de tendencia central?
3. Qu son las medidas de dispersin?
4. Cules son las principales medidas de dispersin?
536.Cules son lo usos ms frecuentes de la desviacin estndar?
34
Leccin 1
1. Concepto (Webster,p.40)
Datos no agrupados son los datos que no han sido organizados en tablas de
distribucin de frecuencias.
Al trabajar con datos que han sido agrupados en una distribucin de frecuencia, no se
conoce cules son las observaciones individuales. En una tabla de frecuencia para los
consumidores del restaurant, la tabla 1.2, se sabe solamente que en 16 horas, entre
11 y 14 clientes se presentaban en el restaurant. No se tienen las cifras exactas de
esas 16 horas. Sin los valores especficos, los procedimientos mostrados
anteriormente para calcular las medidas descriptivas, simplemente no se aplican.
Deben encontrarse mtodos alternativos. Debe tenerse en mente que los clculos
hechos utilizados datos agrupados son solo aproximaciones. Por tanto, las
observaciones individuales no agrupadas deberan utilizarse cuando sea posible.
35
2.2 Media muestral
Ejemplo
Se supone que una muestra de los costos mensuales de una empresa en miles
de dlares para seis meses es de 85, 94, 78, 82, 90, 91. La media se calcula as:
En donde:
Ejemplo
36
Tabla 2.1 Distribucin de frecuencia para consumidores del restaurant Sabor a Ti
Utilizando la frmula de la
media
= 593 = 14.83
40
Definicin
La media ponderada toma en cuenta la importancia relativa de las observaciones.
La media ponderada se calcula mediante la siguiente frmula:
En donde:
es la media ponderada
X es la observacin individual
W es el peso o ponderacin asignada a cada observacin
Ejemplo
Se asume que se obtuvo un puntaje de 89, 92 y 79 en los exmenes parciales y 94 en
el examen final. Estos puntajes y sus respectivas ponderaciones estn reflejados en la
tabla 2.2.
Tabla 2.2 Clculo de la media ponderada
37
5. La media geomtrica (MG) (Webster,p.44)
Definicin
La media geomtrica puede utilizarse para mostrar los cambios porcentuales promedio
en una serie de nmeros positivos.
La media geomtrica se utiliza con ms frecuencia para calcular la tasa de crecimiento
porcentual promedio de algunas series dadas, a travs del tiempo.
La media geomtrica (MG) se halla tomando la raz ensima del producto de n
nmeros. As:
Ejemplo
Interpretacin:
38
6. La mediana para datos no agrupados (Me) (Webster,p.42)
Definicin:
La mediana o valor mediano o media posicional, porque queda exactamente en la
mitad del conjunto de datos despus de que las n observaciones se han colocado en
serie ordenada. La mitad de las observaciones (el 50%) estar por encima de la
mediana, la otra mitad (el otro 50%) estar por debajo de ella.
Clculo de la mediana:
1 Ordenar los datos en forma creciente o decreciente.
2 Si n es impar entonces la Me = valor central
Si n es par entonces la Me = Promedio de los dos valores centrales
Ejemplo
Dado los datos sobre los ingresos por ventas mensuales: 56, 67, 52, 45, y 67
Ejemplo
Si a los datos sobre los ingresos por ventas mensuales fueran: 56, 67, 52, 45, 67 y 35
1 Se ordenan los datos en forma creciente: 35, 45, 52, 56, 67, 67
2 Como n=6 es par, entonces la Me =(52+56)/2 =54
En donde:
Lmd es el lmite de la clase de la mediana (11)
39
F es la frecuencia absoluta acumulada de la clase que antecede a la clase
mediana (4)
fmd es la frecuencia absoluta de la clase mediana (16)
C es el intervalo de clase (3)
n tamao de la muestra (40)
Ejemplo
Tabla 2.3 Distribucin de frecuencia para pasajeros los consumidores del restaurant
Sabor a Ti
TABLA DE FRECUENCIAS
INTERV FREC.
MARCA FREC. FREC.R Utilizando la
ALOS AC.
S(X') AB. (f) EL (h)
frmula (X) (F) de la mediana:
Clase 8 11 9.5 4 4
mediana
11 14 12.5 16 20 F=29>20=n/2
14 17 15.5 9 29
17 20 18.5 8 37
20 23 21.5 2 39
23 26 24.5 1 40
Interpretacin
Definicin
Ejemplo
40
Utilizando las seis observaciones anteriores de 35, 45, 52, 56, 67, 67, la moda es 67.
Si la sptima observacin es 56 se agregar, el conjunto de datos sera bimodal, con
modas de 56 y 67.
Ya que por definicin la moda es la observacin que ocurre con mayor frecuencia,
considerar lo siguiente:
En donde
Ejemplo
Utilizando los datos organizados en la tabla 1.2 de los clientes del restaurant, se tiene:
Clase
Modal
fmo
41
Interpretacin
El nmero de clientes que consumieron en el restaurant con mayor frecuencia fue 12.89
clientes.
La moda tambin es menos afectada por unas pocas observaciones atpicas y sigue
siendo 6 an cuando el ltimo valor sea 80. Sin embargo, si no hay moda, o si el
conjunto de datos es binomial, su uso puede ser confuso.
1. Una empresa grande de equipos deportivos est probando el efecto de dos planes
publicitarios sobre las ventas de los ltimos 4 meses. Dadas las ventas en dlares
que se ven aqu cul programa de publicidad parece producir el crecimiento
promedio ms alto en ventas mensuales?
2. Como gerente de ventas usted desea calcular las medidas de tendencia central
para los niveles de utilidad de su firma, durante los ltimos doce meses, ya que
las siguientes utilidades mensuales estn dadas en miles de dlares:
42
Solucin
Media:
Mediana:
Moda:
Nmero de Nmero de M fM
comidas por da das f F
0 5 3 3 2.5 7.5
6 11 6 9 8.5 51.0
12 17 5 14 14.5 72.5
18 23 8 22 20.5 164.0
24 29 2 24 26.5 53.0
30 35 3 27 32.5 97.5
n=27 445.5
Solucin:
La media, la mediana y el nmero modal de comidas son:
Leccin 2
Al trabajar con datos que han sido agrupados en una distribucin de frecuencia, no se
conoce cules son las observaciones individuales. En una tabla de frecuencia para
consumidores de un restaurant, la tabla 3.2, se sabe solamente que en 16 horas, entre
11 y 14 consumieron en el restaurant. No se tienen las cifras exactas de esas 16
horas. Sin los valores especficos, los procedimientos mostrados anteriormente para
calcular las medidas descriptivas, simplemente no se aplican. Deben encontrarse
mtodos alternativos. Debe tenerse en mente que los clculos hechos utilizados datos
agrupados son solo aproximaciones. Por tanto, las observaciones individuales no
agrupadas deberan utilizarse cuando sea posible.
43
2. Rango o recorrido (R) (Webster,p.48)
Definicin
En donde:
X1, X2, X3, . , XN son las observaciones individuales de la poblacin
= Es la media poblacional
N = Es el nmero de observaciones en la poblacin
Ejemplo
A manera de ilustracin, una compaa vende cinco plizas de seguro diferentes;
sus respectivas primas mensuales son de US$110, US$145, US$125, US$95,
US$150. La prima promedio es:
44
La varianza se halla: (1) restando la media de US$125 de cada una de las
observaciones, (2) elevado al cuadrado estas desviaciones, y (3) hallando el
promedio de estas desviaciones al cuadrado. Al seguir estos tres pasos resulta:
45
4.1. La varianza muestral (s2)
En donde:
X1, X2, X3, . ,Xn son las observaciones individuales de la muestra.
X = es la media de la muestra
Ejemplo
Solucin
46
Interpretacin
Tabla 2.5 Distribucin de frecuencias para nmero de clientes del restaurant Sabor aTi
47
Solucin
Interpretacin
El gerente del restaurante ahora puede decidir si los insumos que se estn utilizando
actualmente pueden acomodar fluctuaciones en el nmero de comensales tal y como
lo mide una desviacin estndar de 3.54. Si no, quiz se proveern de mayor cantidad
de insumos para acomodar cualquier excedente que pueda ocurrir en esos das de
mayor demanda
48
6. Ejercicios propuestos.
20 - 29 5 5
30 - 39 9 14
40 - 49 8 22
50 - 59 10 32
60 - 69 12 44
70 - 79 11 55
80 - 89 8 63
90 - 99 3 66
n=66 3,887 254,146.50
49
Leccin 3
USOS FRECUENTES DE
LA DESVIACIN ESTNDAR
1. Concepto (Webster,p.59)
Definicin
El teorema de Chebyshev, establece que para todo conjunto de datos, por lo menos 1
1/K2 % de las observaciones estn dentro de K desviaciones estndar de la media,
en donde K es cualquier nmero mayor que 1.
Ejemplo
51
Claro que si se mueve ms de una desviacin estndar por encima y por debajo de la
media, se comprender un porcentaje ms grande de observaciones.
Dados los tiempos de los esquiadores, una desviacin estndar (2 minutos) por
encima y por debajo de la media de 10 da un rango de 8 a 12 minutos. Dos
desviaciones estndar (4 minutos) por encima y por debajo de la media de 10 da un
rango de 6 a 14 minutos. Tres desviaciones estndar (6 minutos) de un rango de 4 a
16 minutos. Esto se muestra en la figura 2.2.
De acuerdo con la regla emprica, 997 de los 1,000 esquiadores se tomaron entre 4 y
16 minutos para terminar el trayecto. As, solo 3 de los 1,000 esquiadores fueron o
muy buenos esquiadores y tomaron menos de 4 minutos o eran muy malos y se
tomaron ms de 16 minutos.
Tambin es importante recordar que la regla emprica describe el rea total bajo la
curva normal que se encuentra dentro de un rango dado. No solo el 68.3% de todos
los esquiadores se toman entre 8 y 12 minutos para bajar de forma segura la montaa,
sino que, adems, el 68.3% de toda el rea que est bajo la curva normal est dentro
del mismo rango de 8 a 12 minutos.
52
primer grupo. Esta dispersin mayor se reflejara en una curva de distribucin normal
ms extensa, tal y como se muestra en la figura 2.3
Figura 2.3 Dos distribuciones normales con medias iguales pero con
desviacin estndar diferentes (Webster,p.62)
4. El sesgo de Pearson
53
En la tercera distribucin 2.4 (c) no hay valores extremos que desven la cola de la
distribucin hacia un solo lado, en este caso coincidirn la media, mediana y moda.
En todos los casos, la moda es por definicin la observacin que ocurre con mayor
frecuencia.
Por tanto, est en el pico de la distribucin. Sin embargo, como se dijo anteriormente,
por su sola naturaleza, la media se ve ms afectada por las observaciones extremas.
Por tanto, es halada en la direccin del sesgo, ms de lo que est en la mediana, la
cual est en algn sitio entre la media y la moda.
Utilizando los datos agrupados de los comensales del restaurant, se calcula =14.83,
s=3.54 y la mediana =14. Dada esta informacin, el dueo del restaurant puede ver
claramente que los datos estn sesgados a la derecha, debido a que la media excede
a la mediana. Adems, tambin desea una medida del grado de sesgo.
Solucin:
Interpretacin
Debido a que P>0, los datos para el restaurant estn, como se presumi, sesgados a
la derecha. El grado hasta el cual estn sesgados se refleja en el valor del coeficiente
de Pearson. Si se fuera a hacer la grfica de los datos, apareceran como en la figura
2.4 (a).
54
Cuando se consideran dos o ms distribuciones que tiene medias significativamente
diferentes, o que estn medidas en unidades distintas, es peligroso sacar conclusiones
respecto a la dispersin slo con base en la desviacin estndar.
Por tanto, con frecuencia debemos considerar el Coeficiente de Variacin (CV), el cual
sirve como medida relativa de dispersin. El coeficiente de variacin determina el
grado de dispersin de un conjunto de datos relativo a su media. Se calcula dividiendo
la desviacin estndar de una distribucin por su media y multiplicando por 100.
Ejemplo
Sin embargo, si se calcula el coeficiente de variacin para Sabor a ti, se encuentra que
es:
6. Ejercicios propuestos
55
a. Entre 4550 y 5450? Rpta. ( %)
b. Entre 4100 y 5900? Rpta. (.%)
c. Entre 3650 y 6350? Rpta. (%)
2. Una compaa corta troncos a una longitud media de 20 pies, con una desviacin
estndar de 3.5 pies. Si los cortes estn distribuidos normalmente, qu porcentaje
de troncos tienen menos de: (Usar la regla emprica)
a. 16.5 pies?
b. 13 pies?
3. Datos sobre las edades de los 100 mejores ejecutivos de las mejores 500 firmas
de una revista revelan una edad media de 56.2 aos y una desviacin estndar de
12.7 aos. Su ingreso medio es US$89,432, con s = US$16,097. Cul variable,
edad o ingreso, presenta la mayor variacin? (Usar coeficiente de variacin).
RESUMEN
En sta unidad hemos definido, calculado y comparado los tres ndices de tendencia
central que se emplean ms frecuentemente en la descripcin de las distribuciones de
frecuencia: la media, la mediana y la moda para datos agrupados y no agrupados.
Para describir por completo una distribucin de valores, necesitamos algo ms que las
medidas de tendencia central. Debemos ser capaces de describir cmo se dispersan
estos valores con respecto a la tendencia central, por eso hemos estudiado: varianza,
la desviacin estndar, los percentiles y el rango intercuartil. As como el teorema de
Chebyshev, la regla emprica de la distribucin normal, el sesgo y el coeficiente de
variacin.
Gmez, Doris y otros (2006) Estadstica descriptiva. Con soporte de spss y matlab.
Lima, Fondo editorial UNMSM.
56
ACTIVIDADES
1. El director de la planta de Intel desea que usted compare los salarios promedio en
su planta de Palo Alto con las de la competencia que queda ubicada en las
cercanas de San Jos. De los 6,012 empleados que supervisa 1,212 ganan
US$12.30 la hora; a 650 se les paga US$15.50; 3,098 ganan US$23.50, y al resto
se les paga US$17.12. De los 5,634 empleados que hay en la otra planta 1,654
gana US$12.75; 815 reciben US$17.80 y los otros US$20.10. Escriba un breve
informe para que el director obtenga detalladamente la informacin que desea.
Pantalla 2.1
Estadsticos descriptivos de P&P
Mean(Media) 78.36
Standard error (Error estndar) 1.599938
Median (Mediana) 78.5
Mode (Moda) 83
Standard deviation (Desviacin estndar) 11.31327
Sample variance (Varianza de la muestra) 127.9902
Kurtosis (Curtosis) 0.036918
Skewness (Sesgo) 0.052259
Range (Rango) 52
Minimum (Mnimo) 50
Maximum (Mximo) 102
57
Sum (Suma) 3918
Count (Conteo) 50
AUTOEVALUACIN
1. Debido a que las tasas de inters cayeron a comienzos de 1997, se encontr que
una muestra de las tasas de hipotecarias para hipotecas a 15 aos de las
instituciones de crdito en Peoria, Illinois, era: 7.1%, 7.3%, 7.0%, 6.9%, 6.6%,
6.9%, 6.5%, 7.3%, 6.85%
Alternativas:
a) 0.243, der. b) -0.332, der. c) -0.543, izq. d) 0.423, der.
2. Alan Color fabrica una pintura sellante para automviles. l utiliza cuatro qumicos
diferentes en el proceso de produccin. Para hacer su producto, Color debe
utilizar 2 galones de calcimina que cuesta US$2.50 el galn, galn de kalsolita a
US$1.25 por galn, 1 galn de aglunitante que cuesta US$0.75 el galn y 3
galones de aceite secante a US$2.00 por galn. Calcule el costo de un galn de
sellante.
3. La compaa Cerka vende cuatro tipos de cercas a los barrios residenciales de las
afueras de la ciudad. El grado A le cuesta a Cerka US$5.00 por pie lineal de
instalacin, el grado B cuesta US$3.50, el grado C cuesta US$2.50 y el grado D
cuesta US$2.00. Ayer, Cerka instal 100 yardas de grado A, 150 del grado B, 75
yardas del grado C y 200 yardas del grado D. Cul fue el promedio de instalacin
por pie lineal?
Edades Frecuencias
50 y menos de 55 8
55 y menos de 60 13
60 y menos de 65 15
65 y menos de 70 10
70 y menos de 75 3
75 y menos de 80 1
7. Quienes ponen los discos en una emisora A claman que ponen ms canciones
cada hora que sus rivales de la emisora B de otro pueblo. Durante las ltimas 24
horas se recolectaron y tabularon los datos sobre el nmero de canciones puestas
por ambas estaciones. Utilice los datos para preparar un reporte que compare las
dos referencias respecto a sus medidas de dispersin. Calcular el Coeficiente de
variacin.
59
5 - 10 2 4
11 - 16 4 5
17 - 22 6 7
23 - 28 8 5
29 - 34 2 2
35 - 40 3 1
Respuestas de control
1. d, 2. c, 3.b, 4. c, 5. b, 6. a, 7. a
EXPLORACIN ON LINE
1. http://es.wikipedia.org/wiki/Medidas_de_tendencia_central
2. http://uptprobest.files.wordpress.com/2008/02/act-04-medidas-tendencia-central.pdf
3. http://thales.cica.es/rd/Recursos/rd99/ed99-0278-01/est_des5.html
4. http://es.wikipedia.org/wiki/Medidas_de_dispersi%C3%B3n
5. http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt152.html
6. http://www.hiru.com/es/matematika/matematika_06000.html
REFERENCIAS BIBLIOGRFICAS
Avila Acosta, Roberto (2003) Estadstica elemental. Lima, Estudios y Ediciones RA,
pp.102, 106, 108, 117,
Gmez, Doris y otros (2006) Estadstica descriptiva. Con soporte de spss y matlab.
Lima, Fondo editorial UNMSM, pp. 16,18
60
Webster, Allen L (2000) Estadstica aplicada a los negocios y la economa. 3ra. Ed.
Santa Fe de Bogot, Irwin MacGraw-Hill, pp. 40-64.
REFERENCIAS COMENTADA
Webster, Allen L (2000) Estadstica aplicada a los negocios y la economa. 3ra. Ed.
Santa Fe de Bogot, Irwin MacGraw-Hil.
Este autor desarrolla esta unidad de la manera ms sencilla y clara.
61