Está en la página 1de 56

Tema

5
PROMEDIOS
Un motivo para hacer sospechar
que la Estadística es más un arte
que una ciencia, gira en torno a la
ambigüedad con que se usa el
término “promedio”.
OBJETIVOS

Al finalizar la Tema 5, el participante será capaz de:

1. Diferenciar los diversos tipos de medidas de


resumen que se pueden aplicar a un conjunto de
datos

2. Calcular e interpretar las principales medidas de


tendencia central

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


CONTENIDO

1. La estadística de resumen
2. Propiedades de la sumatoria
3. Principales medidas de tendencia central
3.1 Medias
3.2 Mediana
3.3 Moda
3.4 Cuartiles
3.5 Percentiles
3

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


5.1 La estadística de resumen

Después de construir tablas y gráficos, a partir


de una colección de datos, se requieren
medidas más exactas.
La estadística de resumen, proporciona
medidas para describir un conjunto de datos.
Existen tres tipos de medidas de resumen:
• De tendencia central.

• De dispersión.

• De la forma de la distribución.

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


(A) Las medidas de tendencia central
Se refieren al punto medio de una distribución
Se conocen como medidas de posición
Ejemplo: A partir del gráfico siguiente, se observa
que la posición central de la curva B está a la
derecha de la posición central de las curvas A y C.
Observese que la posición central de la curva A es la
misma que la curva C.

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


(B) Las medidas de dispersión
1.Se refieren a la extensión o amplitud de los
datos de una distribución
2.Representan el grado de variabilidad de los
datos.
Ejemplo: Observe que la curva A en el siguiente
gráfico tiene una mayor dispersión que la curva
B, a pesar que la posición central es la misma.

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


(C) Las medidas de la forma de la curva
Las curvas que representan a un conjunto de
datos, pueden ser analizadas de acuerdo a su:
a) Simetría b) Curtósis

Las curvas simétricas, tienen una forma tal que


con una línea vertical que pase por el punto más
alto de la curva, dividirá el área de esta en dos
partes iguales.

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Las curvas sesgadas son aquellas cuyos valores
están concentrados en el extremo inferior o
superior de la escala de medición del eje
horizontal. La “cola” indica el tipo de sesgo.

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Cuando medimos la curtósis nos referimos al grado de
agudeza. Pueden ser: leptocúrtica (concentración al
centro) mesocúrtica distribuidos simétricamente) o
platicúrtica (aplanada).

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


5.2 Propiedades de la sumatoria
1ra Regla: La suma de los n términos de una serie
constante, es igual a n veces la constante.
n

c
i 1
i  nc

Ejemplo:
C = 10, n=3
3

 c = 10 + 10 + 10 =
i 1
3 (10) = 30
10

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


2da Regla: La suma de los productos de una
constante por una variable, es igual a la constante
multiplicada por la suma de la variable.
n n

 cx
i 1
i  c x i
i 1

Ejemplo:
C = 5, X1 = 2, X2 = 4, X3 = 6
3

 cx
i 1
i 
5(2) + 5(4) + 5(6) = 60
11

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


3ra Regla: La suma de los valores de una variable más
una constante es igual a la suma de los valores de la
variable más n veces esa constante.

n n
 (x i  c)   x i  nc
1
i i 1

Ejemplo:
C =2, x1 =5, x2 =3, x3 =2
3

 (x i  c)  (5 + 2) + (3 + 2) + (2 + 2) = 16
i 1

= (5 + 3 + 2) + 3(2) = 16
12

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


5.3 Las medidas de tendencia central
1. En general se denominan promedios.
2. Los más importantes son la media, la mediana y la
moda.
Aritmética
Media Geométrica
Medidas de Mediana Armónica
tendencia central Moda

3. También es útil conocer los percentiles (o fractiles).

13

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


¿POR QUÉ SON IMPORTANTES LAS MEDIDAS
DE TENDENCIA CENTRAL?
Porque la mayor parte de los conjuntos de datos
muestran una tendencia a agruparse alrededor de
un dato central.
Las medidas de tendencia central son puntos en
una distribución, los valores medios o centrales
de ésta y nos ayudan a ubicarla dentro de la
escala de medición.
14

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


5.3.1 La Media
(A) La media aritmética ( x )
a) Obtención: Se obtiene sumando los valores
registrados y dividiéndolos entre el número
de datos.
Ejemplo:
La siguiente tabla muestra el número de
reclamos y quejas presentadas por pacientes en
el Servicio de Emergencias a lo largo de una
semana. Calcule e interprete la media.

Día/Semana Lun Mar Mier Jue Vier Sab


Reclamos/día 8 10 5 12 10 15
15

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


8  10  5  12  10  15 60
Media aritmética = 
6 6
x = 10 reclamos
b) Interpretación: Si elige al azar un día de la
semana, se espera que los pacientes del servicio
de emergencia realicen 10 reclamos en ese día.
c) Simbología:
Tamaño Media aritmética
Muestra n x (equis barra)
Población N  (mu)
16

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


d) Cálculos a partir de datos no agrupados, se
utilizan las siguientes formulas.
Para una muestra
n donde: x : media muestral
 Xi
x  i 1 
X
i
: suma de todos los datos
n n : número de datos (muestra)
Para una población
N
donde:  : media poblacional
 Xi  X i : suma de todos los datos
  i 1 N : número de datos (población)
N 17

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Se puede calcular la media aritmética utilizando Excel.

Media
aritmetica

18

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


e) Cálculo a partir de datos agrupados.
El cálculo de la media aritmética, cuando los
datos disponibles se encuentran en tablas de
distribución de frecuencias, se realiza utilizando
la formula siguiente n
 fi Xi
x  i 1
n
 fi
i 1

donde: x :media muestral


fi :frecuencia absoluta de la clase i
:marca de la clase i
Xi
19

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Ejemplo:
La distribución de frecuencias siguiente, representa los
puntajes obtenidos en una evaluación del desempeño,
aplicado al personal técnico de un Centro de Salud. El
puntaje máximo en la prueba es 50. Calcule e interprete en
media.
Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60 20

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Primero se calcularán las marcas de clase ( Xi);
es decir, el valor intermedio de cada clase
Marca de Frecuencia
clase x
clase ( i) absoluta(fi)
12 - 16 14 4
17 - 21 19 8
22 - 26 24 15
27 - 31 29 23
32 - 36 34 10
Total 60

x
14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10) x  1575
4 + 8 + 15 + 23 + 10 60
x  26.25
21

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Interpretación: Si se elige al azar a un trabajador técnico
de este hospital, se espera que tenga un puntaje de 26,25
en su evaluación de desempeño.

f) La media aritmética ponderada ( x p )


donde:
n

w X i i wi = factor de ponderación
xp  i 1
n

w
i 1
i X i = datos

22

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Ejemplo: Una empresa comercializadora de Seguros
Médicos dispone de 3 representantes para la zona de
Miraflores, cada uno de los cuales cobra diferente
comisión por póliza vendida, y realiza diferente número de
contratos. Calcule e interprete el valor medio de la
comisión

Nº de polizas de Comisión
Vendedor Seguro Médico por venta $
wi Xi
Pedro 30 30
Juan 25 40
Pablo 20 50
23

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


30(30)  25(40)  20(50) 2900
xp    $38.67
30  25  20 75

Interpretación:

Si se elige al azar un representante se espera que


cobre una comisión de $38.67 por póliza vendida.

24

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


g)Ventajas y desventajas de la media aritmética
Ventajas:
Concepto familiar para muchas personas
Es única para cada conjunto de datos
Es posible comparar medias de diferentes
muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no están
agrupados, su cálculo es tedioso
Si los datos están agrupados en clases con
extremos abiertos, no es posible calcular la
media.
25

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


(B) La media geométrica ( xg )
Se utiliza para calcular tasas medias de variación,
como la tasa media de crecimiento poblacional, la
tasa media de inflación mensual, la tasa media de
mortalidad, entre otros.

a) Obtención Se obtiene extrayendo la raíz enésima


del producto de los n valores de una serie.

xg  n X1  X2  X3  .........Xn

26

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Ejemplo:
La siguiente tabla muestra la tasa de aumento en las
quejas durante los últimos meses. Calcule e interprete la
tasa media mensual.

Meses Enero Febrero Marzo Abril Mayo


Aumento de
2.6% 5.4% 3.8% 0.5% 1.4%
quejas

La tasa 2,6% también se puede expresar como 0,026 , y


puesto que se refiere a un aumento a partir de una base
de 100%, el factor de variación será 1,026. Para los
otros datos se opera igual.
27

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


b) Cálculos

Por lo tanto, la media geométrica se


calcula:
x  n x1, x 2, x3,......x
g

x g  5 (1.026) (1.054) (1.038) (1.005)(1.014)


x g  5 1.143903377
x g  1,0272540 ( Factorde crecim iento m edio)

Tasa media
= (x g  1) 100
de variación

28

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


= (1,0272540 - 1) x 100 = 2,72%

c) Interpretación

Si se selecciona al azar un mes entre enero y


mayo, se espera que las ventas se hayan
incrementado 2.72% con respecto al mes
anterior.

29

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


(C) La media armónica ( xh )
Se utiliza para calcular el tiempo medio, velocidad
y aceleración media, como por ejemplo, el tiempo
medio para realizar determinada cirugía.
a) Obtención: se obtiene calculando el inverso de
la media aritmética de los inversos de una serie.

1
xh  n 1

i 1
X
i
n 30

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Ejemplo:
Los siguientes datos registran el tiempo que utilizan
cuatro médicos al realizar una cierta intervención
quirúrgica. Calcule e interprete el tiempo medio.

Médico A B C D
Tiempo
45 38 52 40
(minutos)

Conocer el tiempo medio permite contar con una


herramienta útil en la planeación de los recursos,
como la Sala de Operaciones. Además de poder
comparar nuestro desempeño con los estándares
de calidad internacionales. 31

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


4 4
xh  1 1 1 1

1976  2340  1710  2223
  
45 38 52 40 88920

4  88920
xh   43.117953 minutos
8249

xh  43 minutos 7 segundos

b) Interpretación:

Si se selecciona al azar a uno de los cuatro


médicos, se espera que realice este tipo de
cirugía en 43 minutos aproximadamente.

32

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


5.3.2 La Mediana
Es la medida que divide en dos subconjuntos
iguales a datos, de tal manera que 50% de los
datos es menor a la mediana y el otro 50% es
mayor a la mediana.

a) Obtención: Se obtiene ordenando la serie de


datos (en forma ascendente o descendente) y
ubicando el dato central.

33

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Ejemplo:
Los siguientes datos se refieren al número de
pacientes que llegaron a su cita, después de la hora
programada durante los últimos 11 días en el
Servicio de Pediatría. Calcule e interprete la
mediana.
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16

Primero se ordenan lo datos:


5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17
5 datos menores 5 datos mayores
mediana
34

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


b) Interpretación: Durante 5 días llegaron menos de 11
pacientes tarde a su cita y durante 5 días, más de 11
pacientes llegaron tarde a su cita.

c) Reglas

1º Si la serie es impar, la mediana ocupa el lugar


central de la serie previamente ordenada.

Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24

35

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


2º Si la serie es par, la mediana se obtiene de la
semisuma de los dos valores centrales de la serie
previamente ordenada.
Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34
18  23
mediana   20.5
2
3º Sea la serie par o impar, la mediana ocupa el
lugar n  1 ,de la serie previamente ordenada.
 
 2 

36

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


d) Cálculo a partir de datos agrupados.

 n 1 
 2   F  1 
Md  Li   c
 f Md 
donde:  
: mediana
Md
: limite real (o frontera) inferior de la clase
Li
mediana.
: número total de datos.
n : suma de todas las frecuencias hasta, pero
F sin incluir, la clase mediana.
: frecuencia de la clase mediana
f Md : amplitud de clase
c
37

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Ejemplo: La tabla siguiente muestra la experiencia
laboral (años) del personal de seguridad que labora en un
gran hospital. Calcule e interprete la mediana.
Lugar de la mediana:
Experiencia Número de n  1 69  1
laboral trabajadores   35o
(años) de seguridad 2 2
 69  1  (16) 
0-3 4
4-7 12
Clase Md  7,5   2 4
8 - 11 24  24 
Mediana  
12 - 15 16
16 - 19 10
 7 ,5 
 35  16  4
20 - 23 3
69
 24 
Mediana = 10,5 años
38

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Interpretación:

La mitad del personal de seguridad que


labora en este hospital tienen una experiencia
laboral igual o menor a 10 años 6 meses. La
otra mitad de este personal tiene una
experiencia laboral igual o mayor a 10 años y
6 meses.

39

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


e) Ventajas y desventajas
Ventajas:
Los valores extremos no afectan a la mediana
como en el caso de la media aritmética.
Es fácil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos,
registrados bajo una escala ordinal.
Desventajas:
Como valor central, se debe ordenar primero la
serie de datos.
Para una serie amplia de datos no agrupados, el
proceso de ordenamiento de los datos demanda
tiempo y usualmente provoca equivocaciones.

40

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


5.3.3 La Moda

La moda es el valor que más se repite dentro de un


conjunto de datos.
a) Obtención: se obtiene organizando la serie de
datos y seleccionando el o los datos que más se
repiten.

Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38


41

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


b) Cálculo a partir de datos agrupados

 1 
Mo  L    c
donde:  
i
 1 2
Mo : moda
: limite real (o frontera) inferior de la clase
L
i modal (la de mayor frecuencia)
: frecuencia de la clase modal menos la
 frecuencia de la clase anterior
1
: frecuencia de la clase modal menos la
 frecuencia de la clase siguiente
2
: amplitud de clase
c
42

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Las clases mediana y modal pueden coincidir pero
conceptualmente son diferentes.
Ejemplo: La tabla siguiente muestra los errores de
facturación durante un mes, en una Clínica. Calcule e
interprete la moda.
Errores de
facturación Días
0-3 6
 6
1
Clase
Clase moda : (4 - 7)
4-7 12
Modal
 6 
8 - 11 8  4 Mo  3.5    4
12 - 15 3
2
64
16 - 19 1
Total 30 Mo = 5,9
Interpretación: Durante un mes, el número más frecuente
de errores de facturación en esta clínica es 6.
43

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


e) Ventajas y desventajas de la moda.
Ventajas:
Se puede utilizar tanto para datos cualitativos
como cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan una o
más clases abiertas.
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribución
amodal).
En otros casos la distribución tiene varias
modas, lo que dificulta su interpretación.

44

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


5.3.4 Los Percentiles
Son los valores que dividen en 100 partes iguales
a un conjunto de datos

a) Cálculo: para datos agrupados.

 Kn  F  1 
 100 i 
 
P L  c
K i  f 
 P
K


45

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


donde:
P : percentil
K
K : el percentil buscado
n : número de datos
Fi : frecuencia acumulativa hasta la clase
anterior a la clase donde se ubica el percentil K
f
P : frecuencia absoluta de la clase donde se ubica
K
el percentil K
c : amplitud de clase

46

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Ejemplo:
La tabla muestra la experiencia (en años) de las
enfermeras de un gran centro hospitalario

Experiencia Trabajadores
(años)
0-3 18
4-7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334 47

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


¿Sobre qué edad se ubica el 25% de las enfermeras de
mayor experiencia?

75 % 25 %

P75
Menor Mayor
Experiencia Experiencia
K = 75

Kn 75(334)
Lugar del P75    250,5o (de los números ordenados )
100 100

Para saber en cuál clase se halla este dato, se


calculó la frecuencia acumulativa. 48

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Experiencia Nº Trabajadores Frec. Acumulada
(años) fi Fi
0-3 18 18
4-7 42 60 F=248
8 - 11 68 128
12 - 15 120 248 En esta clase
16 - 19 40 288 se localizan del
20 - 23 34 322 249º - 288º
24 - 27 12 334
334

 75(334)  248  1


 100  P  15.65 años
P  15 .5  4
75  40  75
 
Interpretación: Para que una enfermera esté
comprendida dentro del 25% de mayor experiencia
laboral debe tener al menos 15 años, 7 meses y 24
días. 49

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Hoja de Comprobación
1. El valor de cada observación del conjunto de datos se toma en cuenta
cuando calculamos su mediana
2. Cuando la población esta sesgada positiva o negativamente, a menudo es
preferible utilizar la mediana como mejor medida de posición, debido a
que siempre cae entre la media y la moda
3. Las medidas de tendencia central de un conjunto de datos se refieren al
grado en que las observaciones están dispersas

4. Una medida de la agudeza de una curva de distribución es el sesgo

5. Con un conjunto de datos no agrupados, la moda se utiliza con mas


frecuencia como medida de tendencia central
6. Si organizamos las observaciones de un conjunto de datos en orden
descendente, el punto de datos que se encuentra en medio es la mediana
50
del conjunto de datos
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
7. Cuando se trabaja con datos agrupados, podemos calcular una
media aproximada si suponemos que cada valor de una clase dada es igual a
su punto medio

8. El valor que más se repite en un conjunto de datos se conoce como media


aritmética

9.Para un arreglo de datos con 50 observaciones, la mediana será el valor de la


observación numero 25 del arreglo

10.La desviación estándar se mide en las mismas unidades que las


observaciones del conjunto de datos

11.La varianza indica la distancia promedio de cualquier observación del


conjunto de datos con respecto a la media

51

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


12. Si la curva de una cierta distribución tiene el extremo mas largo
hacia la izquierda de la escala de medición del eje horizontal, se
dice que la distribución esta negativamente sesgada
13.Después de agrupar un conjuntos de datos en un cierto numero de clases,
podemos identificar la clase mediana como la que tiene el mayor numero de
observaciones

14.Una media calculada a partir de un conjunto de datos agrupados siempre da


una buena estimación del valor real, aunque rara vez es exacto

15.Podemos calcular una media para cualquier conjunto de datos, si se nos da su


distribución de frecuencias

16.La moda siempre se encuentra en el punto mas alto de una gráfica de un


arreglo de datos

17. El numero de elementos de una población se denota con n 52

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


18.Los valores extremos de un conjunto de datos tienen un fuerte efecto
sobre la mediana

19.La diferencia entre las observaciones mas alta y mas baja de un conjunto de
datos se conoce como media geométrica

20.La dispersión de un conjunto de datos da una cierta visión de la confiabilidad


de la medida de tendencia central

21.La desviación estándar es igual a la raíz cuadrada de la varianza

22. .La diferencia entre las observaciones mas alta y mas baja de un conjunto de
datos se conoce como el alcance cuartil

23. El alcance intercuartil esta basado solamente en dos valores tomados del
53
conjunto de datos
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
24.Un fractil es una posición en una distribución de frecuencias en la
que una determinada fracción (o porción) de los datos esta situada
en ella o por encima
25.La varianza, al igual que la desviación estándar, toma en cuenta cada
una de las observaciones del conjunto de datos

26. .El coeficiente de variación es una medida absoluta de la dispersión

27. La medida de dispersión que con mas frecuencia utilizan los


especialistas en estadística es la desviación estándar
28.Una de las ventajas de las medidas de dispersión es que cualquier
estadística que mide variación absoluta, también mide variación relativa
29. Una desventajas de utilizar el alcance para medir la dispersión es que no
toma en cuenta la naturaleza de las variaciones entre la mayoría de las
54
observaciones
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
30. Cada población tiene una varianza que se simboliza con S2

31.De acuerdo con el teorema de Chebyshev, no mas de 11% de las


observaciones de una población puede tener resultados estándar de la
población mayores que 3 o menores que -3

32.El alcance intercuartil es un ejemplo especifico de un alcance interfractil

33.Es posible medir el alcance de una distribución de extremo abierto

34.El alcance intercuartil mide el alcance promedio de la cuarta parte más


baja de una distribución.
55

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Algunas personas
sueñan con
alcanzar grandes logros...
mientras que otros
permanecen despiertos
y los realizan!

56

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003

También podría gustarte