Está en la página 1de 56

Tema

5
PROMEDIOS
Un motivo para hacer sospechar
que la Estadstica es ms un arte
que una ciencia, gira en torno a la
ambigedad con que se usa el
trmino promedio.
OBJETIVOS

Al finalizar la Tema 5, el participante ser capaz de:

1. Diferenciar los diversos tipos de medidas de


resumen que se pueden aplicar a un conjunto de
datos

2. Calcular e interpretar las principales medidas de


tendencia central

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


CONTENIDO

1. La estadstica de resumen
2. Propiedades de la sumatoria
3. Principales medidas de tendencia central
3.1 Medias
3.2 Mediana
3.3 Moda
3.4 Cuartiles
3.5 Percentiles
3

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


5.1 La estadstica de resumen

Despus de construir tablas y grficos, a partir


de una coleccin de datos, se requieren
medidas ms exactas.
La estadstica de resumen, proporciona
medidas para describir un conjunto de datos.
Existen tres tipos de medidas de resumen:
De tendencia central.

De dispersin.

De la forma de la distribucin.

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


(A) Las medidas de tendencia central
Se refieren al punto medio de una distribucin
Se conocen como medidas de posicin
Ejemplo: A partir del grfico siguiente, se observa que
la posicin central de la curva B est a la derecha de la
posicin central de las curvas A y C. Observese que la
posicin central de la curva A es la misma que la curva
C.

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


(B) Las medidas de dispersin
1. Se refieren a la extensin o amplitud de los
datos de una distribucin
2. Representan el grado de variabilidad de los
datos.
Ejemplo: Observe que la curva A en el siguiente
grfico tiene una mayor dispersin que la curva
B, a pesar que la posicin central es la misma.

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


(C) Las medidas de la forma de la curva

Las curvas que representan a un conjunto de


datos, pueden ser analizadas de acuerdo a su:
a) Simetra b) Curtsis

Las curvas simtricas, tienen una forma tal que


con una lnea vertical que pase por el punto ms
alto de la curva, dividir el rea de esta en dos
partes iguales.

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Las curvas sesgadas son aquellas cuyos valores
estn concentrados en el extremo inferior o
superior de la escala de medicin del eje
horizontal. La cola indica el tipo de sesgo.

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Cuando medimos la curtsis nos referimos al grado de
agudeza. Pueden ser: leptocrtica (concentracin al
centro) mesocrtica distribuidos simtricamente) o
platicrtica (aplanada).

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


5.2 Propiedades de la sumatoria
1ra Regla: La suma de los n trminos de una serie
constante, es igual a n veces la constante.
n

c
i 1
i nc

Ejemplo:
C = 10, n=3
3

c = 10 + 10 + 10 =
i 1
3 (10) = 30
10

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


2da Regla: La suma de los productos de una
constante por una variable, es igual a la constante
multiplicada por la suma de la variable.
n n

cx
i 1
i c x i
i 1

Ejemplo:
C = 5, X1 = 2, X2 = 4, X3 = 6
3

cx
i 1
i
5(2) + 5(4) + 5(6) = 60
11

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


3ra Regla: La suma de los valores de una variable ms una
constante es igual a la suma de los valores de la variable ms n
veces esa constante.

n n
(x i c) x i nc
i
1 i 1

Ejemplo:
C =2, x1 =5, x2 =3, x3 =2
3

(x i c) (5 + 2) + (3 + 2) + (2 + 2) = 16
i 1

= (5 + 3 + 2) + 3(2) = 16
12

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


5.3 Las medidas de tendencia central
1. En general se denominan promedios.
2. Los ms importantes son la media, la mediana y la
moda.
Aritmtica
Media Geomtrica
Medidas de Mediana Armnica
tendencia central Moda

3. Tambin es til conocer los percentiles (o fractiles).

13

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


POR QU SON IMPORTANTES LAS MEDIDAS
DE TENDENCIA CENTRAL?
Porque la mayor parte de los conjuntos de datos
muestran una tendencia a agruparse alrededor de
un dato central.
Las medidas de tendencia central son puntos en
una distribucin, los valores medios o centrales
de sta y nos ayudan a ubicarla dentro de la
escala de medicin.
14

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


5.3.1 La Media
(A) La media aritmtica ( x)
a) Obtencin: Se obtiene sumando los valores
registrados y dividindolos entre el nmero de datos.
Ejemplo:
La siguiente tabla muestra el nmero de reclamos
y quejas presentadas por pacientes en el
Servicio de Emergencias a lo largo de una semana.
Calcule e interprete la media .

Da/Semana Lun Mar Mier Jue Vier Sab


Reclamos/da 8 10 5 12 10 15
15

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


8 10 5 12 10 15 60
Media aritmtica =
6 6
x = 10 reclamos
b) Interpretacin: Si elige al azar un da de la
semana, se espera que los pacientes del servicio
de emergencia realicen 10 reclamos en ese da.
c) Simbologa:
Tamao Media aritmtica
Muestra n x (equis barra)
Poblacin N (mu)
16

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


d) Clculos a partir de datos no agrupados, se
utilizan las siguientes formulas.
Para una muestra
n donde: x : media muestral
x
Xi
i 1 i

X : suma de todos los datos
n n : nmero de datos (muestra)
Para una poblacin
N
donde: : media poblacional
Xi Xi : suma de todos los datos
i 1 N : nmero de datos (poblacin)
N 17

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Se puede calcular la media aritmtica utilizando Excel.

Media
aritmetica

18

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


e) Clculo a partir de datos agrupados.
El clculo de la media aritmtica, cuando los
datos disponibles se encuentran en tablas de
distribucin de frecuencias, se realiza utilizando
la formula siguiente n
fi Xi
x i 1
n
fi
i 1

donde: x :media muestral


fi :frecuencia absoluta de la clase i
:marca de la clase i
Xi
19

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Ejemplo:
La distribucin de frecuencias siguiente, representa los
puntajes obtenidos en una evaluacin del desempeo,
aplicado al personal tcnico de un Centro de Salud. El
puntaje mximo en la prueba es 50. Calcule e interprete en
media.

20

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Primero se calcularn las marcas de clase ( Xi);
es decir, el valor intermedio de cada clase
Marca de Frecuencia
clase
clase ( i) x absoluta(fi)
12 - 16 14 4
17 - 21 19 8
22 - 26 24 15
27 - 31 29 23
32 - 36 34 10
Total 60

x 14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10) x 1575


60
4 + 8 + 15 + 23 + 10
x 26.25
21

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Interpretacin: Si se elige al azar a un trabajador tcnico
de este hospital, se espera que tenga un puntaje de 26,25
en su evaluacin de desempeo.

f) La media aritmtica ponderada ( x p )


donde:
n

wX i i wi = factor de ponderacin
xp i 1
n

w
i 1
i X i = datos

22

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Ejemplo: Una empresa comercializadora de Seguros
Mdicos dispone de 3 representantes para la zona de
Miraflores, cada uno de los cuales cobra diferente comisin
por pliza vendida, y realiza diferente nmero de contratos.
Calcule e interprete el valor medio de la comisin

wi Xi

23

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


30(30) 25(40) 20(50) 2900
xp $38.67
30 25 20 75

Interpretacin:

Si se elige al azar un representante se espera que


cobre una comisin de $38.67 por pliza vendida.

24

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


g)Ventajas y desventajas de la media aritmtica
Ventajas:
Concepto familiar para muchas personas
Es nica para cada conjunto de datos
Es posible comparar medias de diferentes
muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no estn
agrupados, su clculo es tedioso
Si los datos estn agrupados en clases con
extremos abiertos, no es posible calcular
la media.
25

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


(B) La media geomtrica ( xg )
Se utiliza para calcular tasas medias de variacin,
como la tasa media de crecimiento poblacional, la
tasa media de inflacin mensual, la tasa media de
mortalidad, entre otros.

a) Obtencin Se obtiene extrayendo la raz ensima


del producto de los n valores de una serie.

xg n X1 X 2 X 3 .........X n

26

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Ejemplo:
La siguiente tabla muestra la tasa de aumento en las
quejas durante los ltimos meses. Calcule e interprete la
tasa media mensual.

La tasa 2,6% tambin se puede expresar como 0,026 , y


puesto que se refiere a un aumento a partir de una base
de 100%, el factor de variacin ser 1,026. Para los
otros datos se opera igual.
27

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


b) Clculos

Por lo tanto, la media geomtrica se calcula:


xg n x1, x 2, x 3,...... x
x g 5 (1.026) (1.054) (1.038) (1.005)(1.014)
x g 5 1.143903377
x g 1,0272540 ( Factor de crecimiento medio)

Tasa media = (x g 1) 100


de variacin
28

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


= (1,0272540 - 1) x 100 = 2,72%

c) Interpretacin

Si se selecciona al azar un mes entre enero y


mayo, se espera que las ventas se hayan
incrementado 2.72% con respecto al mes
anterior.

29

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


(C) La media armnica ( xh )
Se utiliza para calcular el tiempo medio, velocidad
y aceleracin media, como por ejemplo, el tiempo
medio para realizar determinada ciruga.
a) Obtencin: se obtiene calculando el inverso de
la media aritmtica de los inversos de una serie.

1
xh n 1

i 1
X
i
n 30

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Ejemplo:
Los siguientes datos registran el tiempo que utilizan
cuatro mdicos al realizar una cierta intervencin
quirrgica. Calcule e interprete el tiempo medio.

Conocer el tiempo medio permite contar con una


herramienta til en la planeacin de los recursos,
como la Sala de Operaciones. Adems de poder
comparar nuestro desempeo con los estndares
de calidad internacionales. 31

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


4 4
xh 1 1 1 1

1976 2340 1710 2223

45 38 52 40 88920

xh 4 88920 43.117953 minutos


8249

xh 43 minutos 7 segundos
b) Interpretacin:

Si se selecciona al azar a uno de los cuatro


mdicos, se espera que realice este tipo de ciruga
en 43 minutos aproximadamente.

32

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


5.3.2 La Mediana
Es la medida que divide en dos subconjuntos
iguales a datos, de tal manera que 50% de los
datos es menor a la mediana y el otro 50% es
mayor a la mediana.

a) Obtencin: Se obtiene ordenando la serie de


datos (en forma ascendente o descendente) y
ubicando el dato central.

33

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Ejemplo:
Los siguientes datos se refieren al nmero de
pacientes que llegaron a su cita, despus de la hora
programada durante los ltimos 11 das en el
Servicio de Pediatra. Calcule e interprete la
mediana.
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16

Primero se ordenan lo datos:


5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17
5 datos menores 5 datos mayores
mediana
34

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


b) Interpretacin: Durante 5 das llegaron menos de 11
pacientes tarde a su cita y durante 5 das, ms de 11
pacientes llegaron tarde a su cita.

c) Reglas

1 Si la serie es impar, la mediana ocupa el lugar


central de la serie previamente ordenada.

Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24

35

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


2 Si la serie es par, la mediana se obtiene de la
semisuma de los dos valores centrales de la serie
previamente ordenada.
Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34
18 23
mediana 20.5
2
3 Sea la serie par o impar, la mediana ocupa el
lugar n 1 ,de la serie previamente ordenada.
2

36

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


d) Clculo a partir de datos agrupados.
n 1
2 F 1
Md Li c
f Md
donde:
Md : mediana
Li : limite real (o frontera) inferior de la clase
mediana.
: nmero total de datos.
n
: suma de todas las frecuencias hasta, pero
F
sin incluir, la clase mediana.
: frecuencia de la clase mediana
f Md
: amplitud de clase
c
37

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Ejemplo: La tabla siguiente muestra la experiencia
laboral (aos) del personal de seguridad que labora en
un gran hospital. Calcule e interprete la mediana.
Lugar de la mediana:
n 1 69 1
35o
2 2
69 1
(16 )

Md 7 ,5
2 4
24

7 ,5
35 16
4
24
Mediana = 10,5 aos
38

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Interpretacin:

La mitad del personal de seguridad que


labora en este hospital tienen una experiencia
laboral igual o menor a 10 aos 6 meses. La
otra mitad de este personal tiene una
experiencia laboral igual o mayor a 10 aos y
6 meses.

39

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


e) Ventajas y desventajas
Ventajas:
Los valores extremos no afectan a la mediana
como en el caso de la media aritmtica.
Es fcil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos,
registrados bajo una escala ordinal.
Desventajas:
Como valor central, se debe ordenar primero la
serie de datos.
Para una serie amplia de datos no agrupados, el
proceso de ordenamiento de los datos demanda
tiempo y usualmente provoca equivocaciones.

40

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


5.3.3 La Moda
La moda es el valor que ms se repite dentro de un
conjunto de datos.
a) Obtencin: se obtiene organizando la serie de
datos y seleccionando el o los datos que ms se
repiten.

Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38


41

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


b) Clculo a partir de datos agrupados

Mo L
1
c
i
donde: 1 2
Mo : moda
L : limite real (o frontera) inferior de la clase
i modal (la de mayor frecuencia)
: frecuencia de la clase modal menos la

1 frecuencia de la clase anterior

: frecuencia de la clase modal menos la



2 frecuencia de la clase siguiente
: amplitud de clase
c
42

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Las clases mediana y modal pueden coincidir pero
conceptualmente son diferentes.
Ejemplo: La tabla siguiente muestra los errores de
facturacin durante un mes, en una Clnica. Calcule e
interprete la moda.
Errores de
facturacin Das
0-3 6 6
1
Clase Clase moda : (4 - 7)
4-7 12
Modal
6
8 - 11 8 4 Mo 3.5 4
64
2
12 - 15 3
16 - 19 1
Total 30 Mo = 5,9
Interpretacin: Durante un mes, el nmero ms frecuente
de errores de facturacin en esta clnica es 6. 43

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


e) Ventajas y desventajas de la moda.
Ventajas:
Se puede utilizar tanto para datos cualitativos
como cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan una o
ms clases abiertas.
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribucin
amodal).
En otros casos la distribucin tiene varias
modas, lo que dificulta su interpretacin.
44

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


5.3.4 Los Percentiles
Son los valores que dividen en 100 partes iguales
a un conjunto de datos

a) Clculo: para datos agrupados.


Kn F 1
100 i

P L c
K i f
P
K

45

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


donde:
P : percentil
K
K : el percentil buscado
n : nmero de datos
Fi : frecuencia acumulativa hasta la clase
anterior a la clase donde se ubica el percentil K
f : frecuencia absoluta de la clase donde se ubica
P
K
el percentil K
c : amplitud de clase

46

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Ejemplo:
La tabla muestra la experiencia (en aos) de las
enfermeras de un gran centro hospitalario

Experiencia Trabajadores
(aos)
0-3 18
4-7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334 47

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Sobre qu edad se ubica el 25% de las enfermeras de
mayor experiencia?

75 % 25 %

P75
Menor Mayor
Experiencia Experiencia
K = 75

Kn 75(334)
Lugar del P75 250,5o (de los nmeros ordenados)
100 100

Para saber en cul clase se halla este dato, se


calcul la frecuencia acumulativa. 48

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Experiencia N Trabajadores Frec. Acumulada
(aos) fi Fi
0-3 18 18
4-7 42 60 F=248
8 - 11 68 128
12 - 15 120 248
En esta clase
16 - 19 40 288 se localizan del
20 - 23 34 322 249 - 288
24 - 27 12 334
334

75(334) 248 1
100 P 15.65 aos
P 15.5
75 40 4 75

Interpretacin: Para que una enfermera est


comprendida dentro del 25% de mayor experiencia
laboral debe tener al menos 15 aos, 7 meses y 24
das. 49

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Hoja de Comprobacin
1. El valor de cada observacin del conjunto de datos se toma en cuenta
cuando calculamos su mediana
2. Cuando la poblacin esta sesgada positiva o negativamente, a menudo es
preferible utilizar la mediana como mejor medida de posicin, debido a
que siempre cae entre la media y la moda
3. Las medidas de tendencia central de un conjunto de datos se refieren al
grado en que las observaciones estn dispersas

4. Una medida de la agudeza de una curva de distribucin es el sesgo

5. Con un conjunto de datos no agrupados, la moda se utiliza con mas


frecuencia como medida de tendencia central
6. Si organizamos las observaciones de un conjunto de datos en orden
descendente, el punto de datos que se encuentra en medio es la mediana
del conjunto de datos 50

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


7. Cuando se trabaja con datos agrupados, podemos calcular una
media aproximada si suponemos que cada valor de una clase dada es igual a
su punto medio

8. El valor que ms se repite en un conjunto de datos se conoce como media


aritmtica

9.Para un arreglo de datos con 50 observaciones, la mediana ser el valor de la


observacin numero 25 del arreglo

10.La desviacin estndar se mide en las mismas unidades que las


observaciones del conjunto de datos

11.La varianza indica la distancia promedio de cualquier observacin del


conjunto de datos con respecto a la media

51

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


12. Si la curva de una cierta distribucin tiene el extremo mas largo
hacia la izquierda de la escala de medicin del eje horizontal, se
dice que la distribucin esta negativamente sesgada
13.Despus de agrupar un conjuntos de datos en un cierto numero de clases,
podemos identificar la clase mediana como la que tiene el mayor numero de
observaciones

14.Una media calculada a partir de un conjunto de datos agrupados siempre da


una buena estimacin del valor real, aunque rara vez es exacto

15.Podemos calcular una media para cualquier conjunto de datos, si se nos da su


distribucin de frecuencias

16.La moda siempre se encuentra en el punto mas alto de una grfica de un


arreglo de datos

17. El numero de elementos de una poblacin se denota con n 52

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


18.Los valores extremos de un conjunto de datos tienen un fuerte efecto
sobre la mediana

19.La diferencia entre las observaciones mas alta y mas baja de un conjunto de
datos se conoce como media geomtrica

20.La dispersin de un conjunto de datos da una cierta visin de la confiabilidad


de la medida de tendencia central

21.La desviacin estndar es igual a la raz cuadrada de la varianza

22. .La diferencia entre las observaciones mas alta y mas baja de un conjunto de
datos se conoce como el alcance cuartil

23. El alcance intercuartil esta basado solamente en dos valores tomados del
conjunto de datos 53

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


24.Un fractil es una posicin en una distribucin de frecuencias en la
que una determinada fraccin (o porcin) de los datos esta situada
en ella o por encima
25.La varianza, al igual que la desviacin estndar, toma en cuenta cada
una de las observaciones del conjunto de datos

26. .El coeficiente de variacin es una medida absoluta de la dispersin

27. La medida de dispersin que con mas frecuencia utilizan los


especialistas en estadstica es la desviacin estndar
28.Una de las ventajas de las medidas de dispersin es que cualquier
estadstica que mide variacin absoluta, tambin mide variacin relativa
29. Una desventajas de utilizar el alcance para medir la dispersin es que no
toma en cuenta la naturaleza de las variaciones entre la mayora de las
54
observaciones
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
30. Cada poblacin tiene una varianza que se simboliza con S2

31.De acuerdo con el teorema de Chebyshev, no mas de 11% de las


observaciones de una poblacin puede tener resultados estndar de la
poblacin mayores que 3 o menores que -3

32.El alcance intercuartil es un ejemplo especifico de un alcance interfractil

33.Es posible medir el alcance de una distribucin de extremo abierto

34.El alcance intercuartil mide el alcance promedio de la cuarta parte ms


baja de una distribucin.
55

Material de Clases Jorge Crdova Egocheaga. Febrero 2003


Algunas personas
suean con
alcanzar grandes logros...
mientras que otros
permanecen despiertos
y los realizan!

56

Material de Clases Jorge Crdova Egocheaga. Febrero 2003

También podría gustarte