Está en la página 1de 44

23/02/2014 1 CADECO

Facultad de Estudios de la Empresa


MEDIDAS DE
TENDENCIA CENTRAL
Mg. Miguel Angel Macetas
Hernndez
23/02/2014 2 CADECO
Facultad de Estudios de la Empresa
Media aritmtica
Mediana
Moda
Percentiles
Rango
Varianza
Desviacin
estndar
Desviacin media
Asimetra
Curtosis
Regresin lineal simple
Regresin lineal ponderada
Regresin lineal mltiple
Correlacin lineal
Coeficiente de correlacin
Medidas Estadsticas
Que pueden ser
Univariantes
Como
Medidas de
tendencia
central
Medidas de
dispersin
Medidas de
asimetra y
apuntamiento
Como Como
Bivariantes
Regresin y
correlacin
Como
Como
Como
23/02/2014 3 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
POR QU SON IMPORTANTES LAS
MEDIDAS DE TENDENCIA CENTRAL?

Porque la mayor parte de los conjuntos de
datos muestran una tendencia a agruparse
alrededor de un dato central.
Las medidas de tendencia central son puntos
en una distribucin, los valores medios o
centrales de sta y nos ayudan a ubicarla
dentro de la escala de medicin.
23/02/2014 4 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
CADECO Lic. Adm. Aldo Romero Correa
Facultad de Estudios de la Empresa
MEDIA O PROMEDIO
Esta es una de las medidas de tendencia central ms
usadas. Existen 3 tipos de medias: Media aritmtica,
Media geomtrica, Media harmnica
La media aritmtica tal como se define, se puede calcular
a partir de:
a) Datos No Agrupados:
La media que se obtiene a partir de n datos originales Xi
se denomina MEDIA ARITMETICA SIMPLE.
Simbologa:
Tamao Media aritmtica
Muestra n (equis barra)
Poblacin N (mu)
23/02/2014 5 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Clculos a partir de datos no agrupados, se utilizan las
siguientes formulas.
Para una muestra
donde: : media muestral
: suma de todos los datos

: nmero de datos (muestra)
n
n
i
i
x

=
=1
X

Para una poblacin
donde: : media poblacional
: suma de todos los datos
: nmero de datos (poblacin)

i
X
x
n

i
X
N
N
i
i

=
=1
X

N
23/02/2014 6 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Ejemplo
En una muestra de presupuestos familiares, se ha obtenido
la siguiente informacin respecto al numero de hijos de 21
familias


3 2 2 2 1 1 4 1 2 1 2 3 3 3 3 0 2 3 1 3 2
La variable es el numero de Hijos por familias, es decir X
i
= N
de hijos/ familia, donde los 21 valores de la variable serian X
1,
X
2
... X
21
44
21
1
=

= i
Xi
N = 21
Entonces el valor de la media
(N de los hijos) ser:
095 . 2
21
44
21
21
1
= = =

= i
Xi
X
Redondeando por se variable
discreta, se tiene que el
numero de hijos promedio por
familia es = 2
23/02/2014 7 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Calculo en Excel
23/02/2014 8 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
b) DATOS AGRUPADOS EN TABLAS
Los datos se pueden presentar o agrupar en tablas sin
intervalos y en tablas con intervalos , en ambos casos se usa
la Media Aritmtica Pondera.
n
n X
M(y)
m
1 i
i i
=
= = X
Tablas sin Intervalo (Ejemplo)
N hijos
X
i
N de
familias
n
i
X
i
*n
i

0 1 0
1 5 5
2 7 14
3 7 21
4 1 4
TOTAL 21 44
095 . 2
21
44
n
n X
M(y)
m
1 i
i i
= = = =

=
X
Hijos por
familia
23/02/2014 9 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Clculo a partir de datos agrupados.
El clculo de la media aritmtica, cuando los datos
disponibles se encuentran en tablas de distribucin de
frecuencias, se realiza utilizando la formula siguiente




donde: :media muestral
:frecuencia absoluta de la clase i
:marca de la clase i

=
=
=
n
n
n
n
x
i
i
i
i i
1
1
X
x
i
n
i
X
23/02/2014 10 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Ejemplo:
La distribucin de frecuencias siguiente, representa los
puntajes obtenidos en una evaluacin del desempeo,
aplicado al personal tcnico de un Centro de Salud. El puntaje
mximo en la prueba es 50. Calcule e interprete en media.
Desempeo Nmero de
(puntos) tcnicos
12 - 16 4
16 - 21 8
21 - 26 15
26 - 31 23
31 - 36 10
TOTAL 60
23/02/2014 11 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Primero se calcularn las marcas de clase ( );
es decir, el valor intermedio de cada clase

i
X
Intervalo
Marca de Clase
(Xi)
Frecuencia
Absoluta
12 16 14.0 4
16 21 18.5 8
21 26 23.5 15
26 31 28.5 23
31 36 33.5 10
Total 60

=
14 4 +18.5 8 +23.5 15 +28.5 23 +33.5 10
60
=25.78
23/02/2014 12 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Interpretacin: Si se elige al azar a un trabajador tcnico de este
hospital, se espera que tenga un puntaje de 25.93 en su
evaluacin de desempeo.
La media aritmtica ponderada ( )
donde:

= factor de ponderacin



= datos

=
=
=
n
i
i
n
i
i i
w
w
p
x
1
1
X
p
x
i
w
i
X
23/02/2014 13 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Ejemplo: Una empresa comercializadora de Seguros Mdicos
dispone de 3 representantes para la zona de Miraflores, cada
uno de los cuales cobra diferente comisin por pliza vendida, y
realiza diferente nmero de contratos. Calcule e interprete el
valor medio de la comisin







N de polizas de Comisin
Vendedor Seguro Mdico por venta $
Pedro 30 30
Juan 25 40
Pablo 20 50
i
w
i
X
23/02/2014 14 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Interpretacin:
Si se elige al azar un representante se espera que cobre una
comisin de $38.67 por pliza vendida.
67 . 38 $
75
2900
20 25 30
) 50 ( 20 ) 40 ( 25 ) 30 ( 30
= =
+ +
+ +
=
p
x
23/02/2014 15 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Tablas con intervalos
El calculo de la media es a partir del uso de la marca de
clase Y
i
para representar el valor de cada elemento incluido
en su respectivo intervalo.
N de
cromosomas
Marca
de
clase
N de
herbce
as
N de
cromosomas
ponderadas
(L
i-1
- L
i
] X
i
n
I
X
i
n
i

23 26 24,5 5 122,5
26 29 27,5 40 1100
29 32 30,5 27 823,5
32 35 33,5 11 368,5
35 38 36,5 3 109,5
38 41 39,5 3 118,5
41 44 42,5 1 42,5
total 90 2685
8 . 29
90
00 . 2685
n
n X
M(y)
m
1 i
i i
=
= = =

=
X
crom.
23/02/2014 16 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Ventajas y desventajas de la media aritmtica
Ventajas:
Concepto familiar para muchas personas
Es nica para cada conjunto de datos
Es posible comparar medias de diferentes
muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no estn
agrupados, su clculo es tedioso
Si los datos estn agrupados en clases con
extremos abiertos, no es posible calcular la
media.
23/02/2014 17 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
La Mediana
Es la medida que divide en dos subconjuntos iguales
a datos, de tal manera que 50% de los datos es
menor a la mediana y el otro 50% es mayor a la
mediana.

a) Obtencin: Se obtiene ordenando la serie de
datos (en forma ascendente o descendente) y
ubicando el dato central.

23/02/2014 18 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Ejemplo:
Los siguientes datos se refieren al sueldo de 7
trabajadores . Calcule e interprete la mediana.
425, 440, 500, 323, 445, 428, 432
Primero se ordenan lo datos:
x
1
x
2
x
3
x
4
x
5
x
6
x
7
323, 425, 428, 432, 440, 445, 500
7 datos menores 4 datos mayores
mediana
4
2
1 7
2
1
=
(

+
=
(

+
=
n
Me
Interpretacin Significa
que de los 7
trabajadores, hay 4
trabajadores (50% de n)
que tienen sueldos
inferiores o iguales a
432 dlares, en tanto
que los 4 trabajadores
restantes (el otro 50%
de n) tienen sueldo
superior a 432 dlares
23/02/2014 19 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Calculo en Excel
23/02/2014 20 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34



3 Sea la serie par o impar, la mediana ocupa el lugar, de la
serie previamente ordenada.
(

+
2
1 n
5 . 20
2
23 18
=
+
= mediana
2 Si la serie es par, la mediana se obtiene de la
semisuma de los dos valores centrales de la serie
previamente ordenada.
23/02/2014 21 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Calculo en Excel
23/02/2014 22 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Clculo a partir de datos agrupados.



donde:
: mediana
: limite real (o frontera) inferior de la clase mediana.
: nmero total de datos.
: suma de todas las frecuencias hasta, pero sin incluir, la
clase mediana.
: frecuencia de la clase mediana
: amplitud de clase
( )
(
(
(


+ =

Md
i
n
N
n
c Me
i
1
2
L
1
Md
1
L
i
n
N
Md
n
c
23/02/2014 23 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Ejemplo: La tabla siguiente muestra la experiencia laboral
(aos) del personal de seguridad que labora en una compaa.
Calcule e interprete la mediana.
Experiencia Nmero de
laboral trabajadores
(aos) de seguridad
0 - 4 4
4
4 - 8 12
16
Clase
Mediana
8 - 12 24 40
12 - 15 16
56
16 - 19 10
66
20 - 23 3
69
69
Frecuencia
Acumulada
Lugar de la mediana:
( )
(
(
(


+ =
24
) 16 (
2
69
4 8 d M
( )
(


+ =
24
16 5 , 34
4 8
Mediana = 11,08 aos
5 . 34
2
69
2
= =
n
23/02/2014 24 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Interpretacin:

La mitad del personal de seguridad que
labora en esta compaa tienen una
experiencia laboral igual o menor a 11 aos.
La otra mitad de este personal tiene una
experiencia laboral igual o mayor a 11 aos.
23/02/2014 25 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Ventajas y desventajas
Ventajas:
Los valores extremos no afectan a la mediana
como en el caso de la media aritmtica.
Es fcil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos,
registrados bajo una escala ordinal.
Desventajas:
Como valor central, se debe ordenar primero la
serie de datos.
Para una serie amplia de datos no agrupados, el
proceso de ordenamiento de los datos demanda
tiempo y usualmente provoca equivocaciones.
23/02/2014 26 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
La Moda
La moda es el valor que ms se repite dentro de un
conjunto de datos.
a) Obtencin: se obtiene organizando la serie de datos y
seleccionando el o los datos que ms se repiten.
4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38
Ejemplo:


23/02/2014 27 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
23/02/2014 28 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
b) Clculo a partir de datos agrupados


donde:
: moda
: limite real (o frontera) inferior de la clase
modal (la de mayor frecuencia)
: frecuencia de la clase modal menos la
frecuencia de la clase anterior
: frecuencia de la clase modal menos la
frecuencia de la clase siguiente
: amplitud de clase
(

+
+

=
2 1
1
1
L o M
d
c
i d
d
o M
1
L
i
1
d
2
d
c
23/02/2014 29 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Las clases mediana y modal pueden coincidir pero
conceptualmente son diferentes.
Ejemplo: La tabla siguiente muestra los errores de facturacin
durante un mes, en una Compaa. Calcule e interprete la moda.






Interpretacin: Durante un mes, el nmero ms frecuente de
errores de facturacin en esta Compaa es 5.
Errores de
f acturacin Das
0 - 3 6
3 - 8 12
Clase
Modal
8 - 12 8
12 - 16 3
16 - 19 1
Total 30
Clase moda : (4 - 7)



Mo = 5,4
6 6 12
1
= = d
4 8 12
2
= = d

4 6
6
4 3 Mo
|
.
|

\
|
+
+ =
23/02/2014 30 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
e) Ventajas y desventajas de la moda.
Ventajas:
Se puede utilizar tanto para datos cualitativos como
cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan una o ms
clases abiertas.
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribucin amodal).
En otros casos la distribucin tiene varias modas, lo
que dificulta su interpretacin.
23/02/2014 31 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Los Percentiles
Son los valores que dividen en 100 partes iguales
a un conjunto de datos

a) Clculo: para datos agrupados.
( )
c
f
i
n
i K
(
(
(

=
K
P
1
F
100
K
L P
23/02/2014 32 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
donde:
: percentil
: el percentil buscado
: nmero de datos
: frecuencia acumulativa hasta la clase
anterior a la clase donde se ubica el percentil K
: frecuencia absoluta de la clase donde se ubica
el percentil K
: amplitud de clase
K
P
c
K
n
i
F
K
f
P
23/02/2014 33 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Sobre qu edad se ubica el 25% de las
enfermeras de mayor experiencia?
Para saber en cul clase se halla este dato, se
calcul la frecuencia acumulativa.
Menor
Experiencia
Mayor
Experiencia
75 % 25 %
P
75

K = 75
) ordenados nmeros los de ( 5 , 250
100
) 334 ( 75
100
Kn
P del Lugar
o
75
= = =
23/02/2014 34 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Experiencia N Trabajadores Frec. Acumulada
(aos)
0 - 3 18 18
4 - 7 42 60
8 - 11 68 128
12 - 15 120 248
16 - 19 40 288
20 - 23 34 322
24 - 27 12 334
334
Interpretacin: Para que una enfermera est
comprendida dentro del 25% de mayor experiencia
laboral debe tener al menos 15 aos, 7 meses y 24
das.
( )
4
40
1 248
100
75(334)
5 . 15
75
P
(
(
(

+
+ =
aos 65 . 15
75
P =
i
F
i
f
En esta clase
se localizan del
249 - 288
F=248
23/02/2014 35 CADECO
Facultad de Estudios de la Empresa
MEDIDAS
DE
DISPERSIN
23/02/2014 36 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Varianza
Es el estadgrafo de dispersin ms importante. y
expresa el grado de dispersin de las observaciones
respecto a la media aritmtica. Se denota por s
2
; V(X);
V(Y); o
2
; etc.
La varianza se define como:
"La varianza es la media o promedio del cuadrado de las
desviaciones de la variable respecto a su media".
La expresin de la definicin, tambin se escribe:
( )
1
2
2

=

n
n x x
s
i i
( )
1
2
2
2

n
n
n x
n x
s
i i
i i
23/02/2014 37 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Ejemplo: Varianza para datos no
agrupados
La siguiente muestra representa las edades de 25
personan sometidas a un anlisis de preferencias
para un estudio de mercado.
23/02/2014 38 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Ejemplo: Varianza para datos agrupados
Calcular la varianza a partir de la siguiente tabla de
frecuencia (suponga que los datos son
poblacionales).
23/02/2014 39 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
[L
i-1
L
i
) X
i
n
i
x
i
n
i
x
i
2

n
i

0,2 7,2 3,7 3 11,1 41,07
7,2 14,2 10,7 5 53,5 572,45
14,2 21,2 17,7 8 141,6 2506,32
21,2 28,2 24,7 5 123,5 3050,45
28,2 35,2 31,7 10 317 10048,9
35,2 42,2 38,7 4 154,8 5990,76
42,2 49,2 45,7 5 228,5 10442,45
Total 40 1030 32652,4
( )
1769 , 157
1 40
40
1030
4 , 32652
2
2
=

= s
23/02/2014 40 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Desviacin Estndar o Tpica (s)

( ) s X V =
5370221 12 1769 157 , , =
La desviacin estndar o tpica, se define como la raz
cuadrada de la varianza

Es uno de los estadgrafos de dispersin de mayor uso,
en si cual las unidades de la variable ya no estn
elevadas al cuadrado. La desviacin estndar, al igual
que la varianza, es no negativa (s 0), puesto que es la
raz cuadrada positiva de la varianza. A mayor dispersin
le corresponder una mayor desviacin estndar
23/02/2014 41 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Coeficiente de Variacin (CV)
Est definido por la expresin:
( ) 100
x
S
CV =
El valor se expresa en trminos porcentuales. Una regla emprica, cuando el
CV < 33% los datos no presentan dispersin en los datos recolectados los
datos son ms homogneos
( )( )
% 68746446 , 48
75 , 25
100 537 , 12
= = CV
Datos presentan dispersin

0%<CV<5%, Altamente representativa.
5%<CV<10%, Representativa de su serie.
10%<CV<15%, moderadamente representativa
15%<CV<30%, Bajo grado de representatividad.
CV>30%, No tiene ningn grado de representatividad
23/02/2014 42 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
23/02/2014 43 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa
Relacin entre la media, la mediana y la
moda
Cuando los datos son sesgados es mejor emplear la Md
23/02/2014 44 CADECO
Facultad de Estudios de la Empresa
CADECO
Facultad de Estudios de la Empresa