Está en la página 1de 44

MEDIDAS DE

TENDENCIA
CENTRAL
Mg. Miguel Angel
Macetas Hernndez
7/17/15
Mg. Miguel Angel Macetas Hernndez

Medidas Estadsticas

Que pueden ser

Univariantes

Bivariantes

Como

Medidas de
tendencia
central
Como

Media aritmtica
Mediana
Moda
Percentiles

Medidas de
dispersin

Como

Rango
Varianza
Desviacin
estndar
Desviacin media

Como

Medidas de
asimetra y
apuntamiento

Regresin y
correlacin

Como

Como

Regresin lineal simple


Regresin lineal ponderada
Regresin lineal mltiple
Correlacin lineal
Coeficiente de correlacin

Asimetra
Curtosis

7/17/15
Mg. Miguel Angel Macetas Hernndez

POR QU SON IMPORTANTES


MEDIDAS DE TENDENCIA CENTRAL?

LAS

Porque la mayor parte de los conjuntos de


datos muestran una tendencia a agruparse
alrededor de un dato central.
Las medidas de tendencia central son puntos
en una distribucin, los valores medios o
centrales de sta y nos ayudan a ubicarla
dentro de la escala de medicin.
7/17/15
Mg. Miguel Angel Macetas Hernndez

Facultad de Estudios de la Empresa

MEDIA O PROMEDIO
Esta es una de las medidas de tendencia central ms
usadas. Existen 3 tipos de medias: Media aritmtica,
Media geomtrica, Media harmnica
La media aritmtica tal como se define, se puede calcular
a partir de:
a) Datos No Agrupados:
La media que se obtiene a partir de n datos originales Xi
se denomina MEDIA ARITMETICA SIMPLE.

Simbologa:
Tamao
Media aritmtica
Muestra
n
(equis barra)
Poblacin
N
(mu)

CADECO
Lic. Adm.
Aldo Romero
CorreaHernndez
7/17/15
Mg. Miguel
Angel
Macetas

Clculos a partir de datos no agrupados, se


utilizan las siguientes formulas.
Para una muestra
donde:
:xmedia muestral
n
: suma
de todos los datos
Xi
X
i
:
x i 1
n de datosn(muestra)
nmero
Para una poblacin
donde: : media poblacional
N
X datos
: suma
todos
los

de
i
X
i
i 1
: nmero
N de datos (poblacin)

7/17/15
Mg. Miguel Angel Macetas Hernndez

Ejemplo

En una muestra de presupuestos familiares, se ha obtenido


la siguiente informacin respecto al numero de hijos de 21
familias
3 2 2 2 1 1 4 1 2 1 2 3 3 3 3 0 2 3 1 3 2
La variable es el numero de Hijos por familias, es decir Xi= N
de hijos/ familia, donde los 21 valores de la variable serian X 1,
X2 ... X21
21

Xi 44
i 1

N = 21

21

Xi
i 1

21

44

2.095
21

7/17/15
Mg. Miguel Angel Macetas Hernndez

Entonces el valor de la media


(N de los hijos) ser:
Redondeando por se variable
discreta, se tiene que el
numero de hijos promedio por
familia es = 2
6

Calculo en Excel

7/17/15
Mg. Miguel Angel Macetas Hernndez

b) DATOS AGRUPADOS EN TABLAS


Los datos se pueden presentar o agrupar en
tablas sin intervalos y en tablas con intervalos ,
en ambos casos se usa la Media Aritmtica
Tablas sin Intervalo (Ejemplo)
Pondera. m

Xin i

M(y) X

i 1

M(y) X

X n
i

i 1

44
2.095
21

Hijos por
familia

7/17/15
Mg. Miguel Angel Macetas Hernndez

N hijos
Xi

N de
familias
ni

Xi*ni

14

21

TOTAL

21

44

Clculo a partir de datos agrupados.


El clculo de la media aritmtica, cuando
los
datos disponibles se encuentran en
tablas de distribucin de frecuencias, se
realiza utilizando lanformula
siguiente
nX

x i 1
n

ni
i 1

donde:

:media
muestral
ni
:frecuencia absoluta de la clase i
Xi
:marca de la clase i

7/17/15
Mg. Miguel Angel Macetas Hernndez

Ejemplo:
La
distribucin
de
frecuencias
siguiente,
representa los puntajes obtenidos en una
evaluacin del desempeo, aplicado al personal
tcnico de un Centro de Salud. El puntaje mximo
en la prueba es 50. Calcule e interprete en media.

7/17/15
Mg. Miguel Angel Macetas Hernndez

10

Primero se calcularn las marcas de clase ( X i);


es decir, el valor intermedio de cada clase
Intervalo

Marca de
Clase (Xi)

Frecuencia
Absoluta

12
16
16
21
21
26
26
31
31
36
Total

14.0
18.5
23.5
28.5
33.5

4
8
15
23
10
60

=25.78
7/17/15
Mg. Miguel Angel Macetas Hernndez

11

Interpretacin: Si se elige al azar a un trabajador


tcnico de este hospital, se espera que tenga un
puntaje de 25.93 en su evaluacin de desempeo.

La media aritmtica ponderada ( x p )


donde:
n

xp

wX
i 1
n

w
i 1

=wfactor
de ponderacin
i
=Xdatos
i

7/17/15
Mg. Miguel Angel Macetas Hernndez

12

Ejemplo: Una empresa comercializadora de


Seguros Mdicos dispone de 3 representantes para
la zona de Miraflores, cada uno de los cuales cobra
diferente comisin por pliza vendida, y realiza
diferente nmero de contratos. Calcule e interprete
el valor medio de la comisin

wi

7/17/15
Mg. Miguel Angel Macetas Hernndez

Xi

13

30(30) 25(40) 20(50) 2900


xp

$38.67
30 25 20
75
Interpretacin:
Si se elige al azar un representante se espera
que cobre una comisin de $38.67 por pliza
vendida.

7/17/15
Mg. Miguel Angel Macetas Hernndez

14

Tablas con intervalos


El calculo de la media es a partir del uso de la
marca de clase Yi para representar el valor de
cada elemento incluido en su respectivo
Marca
N de
N de
intervalo.
N de
cromosomas

de
clase

herbce
as

cromosomas
ponderadas

(Li-1 - Li]

Xi

nI

Xini

23

26

24,5

122,5

26

29

27,5

40

1100

29

32

30,5

27

823,5

32

35

33,5

11

368,5

35

38

36,5

109,5

38

41

39,5

118,5

41

44

42,5

42,5

total
90
2685
7/17/15
Mg. Miguel Angel Macetas Hernndez

M(y) X

X n
i

i 1

2685.00
29.8 crom.
90

15

Ventajas y desventajas de la media aritmtica


Ventajas:
Concepto familiar para muchas personas
Es nica para cada conjunto de datos
Es posible comparar medias de diferentes
muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no estn
agrupados, su clculo es tedioso
Si los datos estn agrupados en clases con
extremos abiertos, no es posible
calcular la media.
7/17/15
Mg. Miguel Angel Macetas Hernndez

16

La Mediana
Es la medida que divide en dos
subconjuntos iguales a datos, de tal
manera que 50% de los datos es
menor a la mediana y el otro 50% es
mayor a la mediana.
a) Obtencin: Se obtiene ordenando la
serie de datos (en forma ascendente o
descendente) y ubicando el dato
central.
7/17/15
17
Mg. Miguel Angel Macetas Hernndez

Ejemplo:
Los siguientes datos se refieren al sueldo de 7
trabajadores . Calcule e interprete la mediana.
425, 440, 500, 323, 445, 428, 432
Interpretacin Significa
Primero se ordenan lo datos:
que
de
los
7
x1
x2 x3 x4 x5 x6 x7 trabajadores, hay 4
trabajadores (50% de n)
323, 425, 428, 432, 440, 445, 500
7 datos menores
n 1 7 1

2 2

Me

4 datos

mediana

7/17/15
Mg. Miguel Angel Macetas Hernndez

que
tienen
sueldos
inferiores o iguales a
mayores
432 dlares, en tanto
que los 4 trabajadores
restantes (el otro 50%
de n) tienen sueldo
superior a 432 dlares
18

Calculo en Excel

7/17/15
Mg. Miguel Angel Macetas Hernndez

19

2 Si la serie es par, la mediana se obtiene de la


semisuma de los dos valores centrales de la serie
previamente ordenada.
Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34

18 23
mediana
20.5
2
3 Sea la serie par o impar, la mediana ocupa el
lugar, de la serie previamente ordenada.
n 1
2

7/17/15
Mg. Miguel Angel Macetas Hernndez

20

Calculo en Excel

7/17/15
Mg. Miguel Angel Macetas Hernndez

21

Clculo a partir de datos agrupados.


n

N
i 1
2
Me Li 1 c

n
Md

donde:
Md : mediana
Li 1 : limite real (o frontera) inferior de la clase
nmediana.
N : nmero total de datos.
: suma de todas las frecuencias hasta, pero
nMd sin incluir, la
clase mediana.
c : frecuencia de la clase mediana
: amplitud de clase
7/17/15
Mg. Miguel Angel Macetas Hernndez

22

Ejemplo: La tabla siguiente muestra la


experiencia laboral (aos) del personal de
seguridad que labora en una compaa. Calcule e
interprete la mediana.
Lugar de la mediana:
n 69

34.5
2 2

Md

69
2

8 4

8 4

7/17/15
Mg. Miguel Angel Macetas Hernndez

(16 )

24

34,5 16
24

Mediana = 11,08
aos
23

Interpretacin:
La mitad del personal de seguridad que
labora en esta compaa tienen una
experiencia laboral igual o menor a 11 aos.
La otra mitad de este personal tiene una
experiencia laboral igual o mayor a 11 aos.

7/17/15
Mg. Miguel Angel Macetas Hernndez

24

Ventajas y desventajas
Ventajas:

Los valores extremos no afectan a la


mediana como en el caso de la media
aritmtica.
Es fcil de calcular, interpretar y
entender.
Se puede determinar para datos
cualitativos, registrados bajo una escala
ordinal.
Desventajas:

Como valor central, se debe ordenar


primero la serie de datos.
Para
una Hernndez
serie amplia de
7/17/15
25 datos no
Mg. Miguel
Angel Macetas

La Moda
La moda es el valor que ms se repite dentro
de un conjunto de datos.
a) Obtencin: se obtiene organizando la
serie de datos y seleccionando el o los datos
que ms se repiten.

Ejemplo:

4, 5, 7, 8, 8 , 10, 12, 15
4, 7, 12,12 , 15, 16, 20, 20 , 24, 27
7, 12, 15, 18, 25, 30, 31, 38
7/17/15
Mg. Miguel Angel Macetas Hernndez

26

7/17/15
Mg. Miguel Angel Macetas Hernndez

27

b) Clculo a partir de datos agrupados

Mo L

i 1

d
1

donde:

2
Mo: moda
: limite real (o frontera) inferior de la
Lclase
i 1
modal (la de mayor frecuencia)
d : frecuencia de la clase modal menos la
1
frecuencia de la clase anterior
d : frecuencia de la clase modal menos la
2
frecuencia de la clase siguiente
c : amplitud de clase

7/17/15
Mg. Miguel Angel Macetas Hernndez

d
1

28

Las clases mediana y modal pueden coincidir pero


conceptualmente son diferentes.
Ejemplo: La tabla siguiente muestra los errores de
facturacin durante un mes, en una Compaa.
Calcule e interprete
la moda.
d 12 6 6
1

d 12 8 4
2

Clase moda : (4 - 7)
6
Mo 3 4

64

Mo = 5,4
Interpretacin: Durante un mes, el nmero ms
7/17/15
29
Mg. Miguel Angel
Hernndez
frecuente
de Macetas
errores
de facturacin
en esta

e) Ventajas y desventajas de la moda.


Ventajas:
Se puede utilizar tanto para datos
cualitativos como cuantitativos.
No se ve afectada por los valores
extremos.
Se puede calcular, a pesar de que existan
una o ms clases abiertas.
Desventajas:
No tiene un uso tan frecuente como la
media.
Muchas veces no existe moda (distribucin
amodal).
7/17/15
30
Mg. Miguel Angel Macetas Hernndez
En otros casos la distribucin tiene
varias

Los Percentiles
Son los valores que dividen en 100 partes iguales
a un conjunto de datos
a) Clculo: para datos agrupados.

P L
K

i 1

Kn F

100
i
f
P

7/17/15
Mg. Miguel Angel Macetas Hernndez

31

donde:
P : percentil
K
K : el percentil buscado

n : nmero de datos
Fi : frecuencia acumulativa hasta la clase
anterior a la clase donde se ubica el percentil K
f

: frecuencia absoluta de la clase donde se ubica


el percentil K

c : amplitud de clase
7/17/15
Mg. Miguel Angel Macetas Hernndez

32

Sobre qu edad se ubica el 25% de las


enfermeras de mayor experiencia?
75 %

25 %

P75

Menor
Experiencia

Mayor
Experiencia

K = 75

Lugar del P75

Kn 75(334)

250,5o (de los nmeros ordenados )


100
100

Para saber en cul clase se halla este dato, se


calcul la frecuencia acumulativa.

7/17/15
Mg. Miguel Angel Macetas Hernndez

33

Experiencia
(aos)
0-3
4-7
8 - 11
12 - 15
16 - 19
20 - 23
24 - 27

N Trabajadores
fi
18
42
68
120
40
34
12
334

75(334) 248 1

Frec. Acumulada
Fi
18
60
128
248
288
322
334

100

P 15 .5

75

40

F=248
En esta clase
se localizan del
249 - 288

P 15 .65 aos
75

Interpretacin: Para que una enfermera est


comprendida dentro del 25% de mayor experiencia
laboral debe tener al menos 15 aos, 7 meses y 24
7/17/15
34
Mg. Miguel Angel Macetas Hernndez
das.

MEDIDAS
DE
DISPERSIN
7/17/15
Mg. Miguel Angel Macetas Hernndez

35

Varianza
Es el estadgrafo de dispersin ms importante. y
expresa el grado de dispersin de las observaciones
respecto a la media aritmtica. Se denota por s2; V(X);
V(Y); 2; etc.
La varianza se define como:
"La varianza es la media o promedio del cuadrado de las
desviaciones de la variable respecto a su media".
La expresin de la definicin, tambin se escribe:

x x

n 1

ni
s2

7/17/15
Mg. Miguel Angel Macetas Hernndez

x ni
2
i

xn

n 1
36

Ejemplo: Varianza para datos no


agrupados
La siguiente muestra representa las
edades de 25 personan sometidas a un
anlisis de preferencias para un estudio
de mercado.

7/17/15
Mg. Miguel Angel Macetas Hernndez

37

Ejemplo: Varianza para datos


agrupados
Calcular la varianza a partir de la siguiente
tabla de frecuencia (suponga que los
datos son poblacionales).

7/17/15
Mg. Miguel Angel Macetas Hernndez

38

[Li-1 Li)
0,2 7,2
7,2 14,2

Xi
3,7
10,7

ni
3
5

xi ni
11,1
53,5

14,2 21,2

17,7

141,6

21,2 28,2

24,7

123,5

28,2 35,2

31,7

10

317

35,2 42,2

38,7

154,8

228,5

40

1030

42,2 49,2
2
s

Total

1030
32652,4

45,7

40 1

40

157,1769

7/17/15
Mg. Miguel Angel Macetas Hernndez

39

xi2 ni
41,07
572,45
2506,3
2
3050,4
5
10048,
9
5990,7
6
10442,
45
32652,
4

Desviacin Estndar o Tpica (s)


La desviacin estndar o tpica, se define como la raz
cuadrada de la varianza

V X s

157,1769 12,5370221
Es uno de los estadgrafos de dispersin de mayor uso,
en si cual las unidades de la variable ya no estn
elevadas al cuadrado. La desviacin estndar, al igual
que la varianza, es no negativa (s 0), puesto que es la
raz cuadrada positiva de la varianza. A mayor dispersin
le corresponder una mayor desviacin estndar
7/17/15
Mg. Miguel Angel Macetas Hernndez

40

Coeficiente de Variacin (CV)


Est definido por la expresin:

S
CV 100
x

El valor se expresa en trminos porcentuales. Una regla emprica, cuando el


CV < 33% los datos no presentan dispersin en los datos recolectados los
datos son ms homogneos

12,537 100
CV
48,68746446%
25,75

Datos presentan dispersin


0%<CV<5%,
5%<CV<10%,
10%<CV<15%,
15%<CV<30%,
CV>30%,

Altamente representativa.
Representativa de su serie.
moderadamente representativa
Bajo grado de representatividad.
No tiene ningn grado de representatividad

7/17/15
Mg. Miguel Angel Macetas Hernndez

41

7/17/15
Mg. Miguel Angel Macetas Hernndez

42

Relacin entre la media, la mediana y


la moda

Cuando
losMacetas
datos son
sesgados es mejor emplear
7/17/15
43 la Md
Mg. Miguel
Angel
Hernndez

7/17/15
Mg. Miguel Angel Macetas Hernndez

44