Medidas de Tendencia Central

Universidad Nacional de San Antonio Abad del Cusco
Maestría en Contabilidad
Mención Finanzas Empresariales
MEDIDAS DE TENDENCIA
CENTRAL
Jorge Diaz Ugarte

Métodos Cuantitativos en Negocios
Parámetros y estadísticos
 Parámetro: Es una cantidad numérica
calculada sobre una población
 La altura media de los individuos de un país
 La idea es resumir toda la información que
hay en la población en unos pocos números
(parámetros).
 Estadístico: Es una cantidad numérica calculada sobre una muestra
 La altura media de los que estamos en esta aula.
Normalmente nos interesa conocer un parámetro, pero por la

dificultad que conlleva estudiar a “toda” la población, calculamos un
estadístico sobre una muestra y “confiamos” en que sean próximos.
Más adelante veremos como elegir muestras para que el error sea
“confiablemente” pequeño.
CARACTERÍSTICAS DE LOS DATOS
Resumen de estadísticos
 Tendencia Central
 Indican valores con respecto a los que los datos parecen agruparse.
 Media, mediana y moda
 Posición
 Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
 Cuartiles, Deciles, Percentiles.
 Dispersión
 Indican la mayor o menor concentración de los datos con respecto
a una medida de tendencia central.
 Desviación estándar, coeficiente de variación, rango, varianza
 Forma
 Asimetría
 Curtosis
Medidas de tendencia central
Son medidas que buscan posiciones (valores) con respecto a
los cuales los datos muestran tendencia a agruparse.
Datos sin agrupar:

x1, x2, ..., xn x
xi i
n
Datos agrupados en tabla:
Usar como xi las marcas de clase (Yi) x
 Yn
i i i
n
 Mediana (Me):
Es un valor que divide a las observaciones en dos grupos con el
mismo número de individuos (percentil 50). Si el número de
datos es par, se elige la media de los dos datos centrales.
 Mediana de 1,2,4,5,6,6,8 es 5
 Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5
 Es conveniente cuando los datos son asimétricos.
 No es sensible a valores extremos
Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7!
Altura mediana
 Mediana de datos agrupados:
Intervalo Y1 ni Ni
L0 – L 1 Y1 n1 N1
L1 – L 2 Y2 n2 N2
...
Lk-1 – Lk Yk nk Nk
n
 Moda (Mo):
Es el valor que mas se repite
Es el valor donde la distribución de frecuencias alcanza un
máximo.
La moda puede no existir en un conjunto de datos. Si existe,
puede no ser única.
 Moda de datos agrupados: Se encuentra en la clase que contiene
la frecuencia mayor
Intervalo Y1 ni Ni
L0 – L 1 Y1 n1 N1
L1 – L 2 Y2 n2 N2
...
Lk-1 – Lk Yk nk Nk
n
Ejemplo
Peso M. Clase Fr. Fr. ac.

Y1 ni Ni
40 – 50 45 5 5
50 – 60 55 10 15
60 – 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
100 – 130 115 3 58
58
Ejemplo
Peso M. frec Fr.
Clase acum.
40 – 50 45 5 5
50 – 60 55 10 15
60 – 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
100 – 130 115 3 58
Para calcular la media es

necesario elegir un punto
representante del intervalo:
La marca de clase.
La media se desplaza hacia

los valores extremos. No
coincide con la mediana.
Estadísticos de posición
 Cuartiles: Dividen a la muestra en 4 grupos con frecuencias
similares.
 Primer cuartil = Percentil 25
 Segundo cuartil = Percentil 50 = Mediana
 Tercer cuartil = Percentil 75
Para datos no agrupados: Posición del i-esimo cuartil: Qi =
Cuartil 1 (Q1) de 1,2,4,5,6,6,8,9 es:
Posición del cuartil 1: Q1 = =2.25

Q1 = 2 + 0.25(4-2) = 2.5
 Cuartiles:
Para datos agrupados: Posición del k-esimo cuartil: Qk =
Qk = Li + C* Y1 ni Ni
40 – 50 45 5 5
k = 1,2 y 3 50 – 60 55 10 15
60 – 70 65 21 36
Posición del cuartil 1: 70 - 80 75 11 47
80 - 90 85 5 52
Q1 = =14.75
90 - 100 95 3 55
100 – 130 115 3 58
58
Q1 = 50 + 10* = 59.5
 Deciles: Dividen a la muestra en 10 grupos con frecuencias
similares. Donde k = 1, 2, 3, 4, ……….., 8, 9
 La mediana es el Decil 5
Para datos no agrupados: Posición del i-esimo decil: Di =
Decil 3 (D3) de 1,2,4,5,6,6,8,9 es:
Posición del decil 3: D3 = = 2.70

D3 = 2 + 0.70(4-2) = 3.4
 Deciles:
Para datos agrupados: Posición del k-esimo decil: Dk =
Dk = Li + C* Y1 ni Ni
40 – 50 45 5 5
k = 1,2,3,4,5,6,7,8 y 9 50 – 60 55 10 15
60 – 70 65 21 36
Posición del decil 3: 70 - 80 75 11 47
80 - 90 85 5 52
D3 = =17.70
90 - 100 95 3 55
100 – 130 115 3 58
58
D3 = 60 + 10* = 61.14
 Percentil: Dividen a la muestra en 100 grupos con frecuencias
similares. Donde k = 1, 2, 3, 4, ………..98, 99
 La mediana es el percentil 50
 El percentil de orden 15 deja por debajo al 15% de las
observaciones. Por encima queda el 85%
Para datos no agrupados: Posición del i-esimo percentil: Pi =
Percentil 83 (P83) de 1,2,4,5,6,6,8,9 es:
Posición del percentil 83: P83 = = 7.47

P83 = 8 + 0.47(9-8) = 8.47
 Percentiles:
Para datos agrupados: Posición del k-esimo percentil: Pk =
Pk = Li + C* Y1 ni Ni
40 – 50 45 5 5
k = 1,2,3………98 y 99 50 – 60 55 10 15
60 – 70 65 21 36
Posición del percentil 83: 70 - 80 75 11 47
80 - 90 85 5 52
P83 = =48.97
90 - 100 95 3 55
100 – 130 115 3 58
58
P83 = 80 + 10* = 82.28
Ejemplos
 El 5% de los recién nacidos tiene un peso demasiado bajo. ¿Qué peso se
considera “demasiado bajo”?
 Percentil 5
Percentil 5 del peso

25
20
frecuencia
15
10
5
0
1 2 3 4 5
Peso al nacer (Kg) de 100 niños

Ejemplos
¿Qué peso es superado sólo por el 25% de los individuos?
 Percentil 75 o tercer cuartil
Percentil 75 del peso
30
25
20
frecuencia
15
10
5
0
50 55 60 65 70 75 80 85
Peso (Kg) de 100 deportistas

Ejemplos
 En una distribución del colesterol. Supongamos que se consideran patológicos los
valores extremos. El 90% de los individuos son normales ¿Entre qué valores se
encuentran los individuos normales?
Percentiles 5 y 95
20
15
frecuencia
10
5
0
180 200 220 240 260
Colesterol en 100 personas

Ejemplos
 ¿Entre qué valores se encuentran la mitad de los individuos “más normales” de
una población?
 Entre el cuartil 1º y 3º
Percentiles 25 y 75
20
15
frecuencia
10
5
0
150 160 170 180 190
Altura (cm) en 100 varones

Diagramas de Caja Diagrama de cajas de Tukey: Resumen en 5 números
0.08
 Resumen :
0.06
 Mínimo, cuartiles y máximo.
densidad
0.04
 Suelen dar una buena idea de la
distribución. P25 P50 P75
0.02
Mín. Máx.
0.00
 La zona central, ‘caja’, contiene al 40 45 50 55 60 65
50% central de las observaciones. Velocidad (Km/h) de 200 vehículos en ciudad
 Su tamaño se llama ‘rango

intercuartílico’ (R.I.)
Diagrama de cajas de Tukey: Resumen en 5 números

 Es costumbre que ‘los bigotes’, no
lleguen hasta los extremos, sino
0.04
hasta las observaciones que se

separan de la caja en no más de
0.03
1,5 R.I.
densidad
0.02
 Más allá de esa distancia se

consideran anómalas, y así se Mín. P25 P50 P75 Máx
0.01
marcan.
0.00
80 90 100 110 120 130 140
Velocidad (Km/h) de 200 vehículos en autovía

Medidas de dispersión
Miden el grado de dispersión (variabilidad) de los datos,
independientemente de su causa.
0.05
 Amplitud o Rango (R): Mín. P25 P50 P75 Máx.
Diferencia entre observaciónes extremas.
0.04
 2,1,4,3,8,4. El rango es 8-1=7
0.03
 Es muy sensible a los valores extremos.
25% 25% 25% 25%
0.02
Rango intercuartílico
 Rango intercuartil (RI):
0.01
 Es la distancia entre el primer y Rango
tercer cuartil.
0.00
 Rango intercuartil = P75 - P25 150 160 170 180 190
 Parecida al rango, pero eliminando las observaciones más

extremas inferiores y superiores.
 No es tan sensible a valores extremos.
 Varianza (S2): Mide el promedio de las desviaciones (al cuadrado) de
las observaciones con respecto a la media.
 Es sensible a valores extremos (alejados de la media).
Para datos simples (n<60)
 Para datos simples (n≥60)
 Para datos agrupados (n<60)
 Para datos agrupados (n≥60)

 Varianza (S2):
 Formulas de recurrencia.

Desviación estándar (S) 50
Es la raíz cuadrada de la varianza
40
30
S S 2
20
10
Desv. típ. = 568,43
Media = 2023
0 50 N = 407,00
90
1.
1.
2.
2.
2.
3.
30
70
10
30
50
90
0
0
0
0
Peso recién nacidos en partos gemelares
La desviación estándar de los siguientes datos 2,4,5,6,8 es:
x
 x i i
n = = =5
= =5
= 2.2361
La desviación estándar de la siguiente distribución es:
x
 Yn
i i i
n
M. Clase Frecuencia
Peso
Yi ni Yini 𝑛 (𝑌 − 𝑋 )
40 – 50 45 5 225 2955
50 – 60 55 10 550 2048
60 – 70 65 21 1365 390
70 - 80 75 11 825 356
80 - 90 85 5 425 1231
90 - 100 95 3 285 1980
= 267.06 100 – 130 115 3 345 6263
58 4020 15222
= 16.34
Dispersión en distribuciones ‘normales’
0.05
0.05
0.04
0.04
0.03
0.03
0.02
0.02
0.01
0.01
xs x  2s
68.5 % 95 %
0.00
0.00
150 160 170 180 190 150 160 170 180 190
 Centrado en la media y a una desviación estándar de distancia hay

aproximadamente el 68% de las observaciones.
 A dos desviaciones estándar tenemos el 95% (aprox.)
 A tres desviaciones estándar tenemos el 99.7% (aprox.)
Coeficiente de variación (CV)
S
Es la razón entre la desviación estándar y la media.
CV 
x
 Mide la desviación estándar en forma de
“qué tamaño tiene con respecto a la media”
 También se la denomina variabilidad relativa.
 Es frecuente mostrarla en porcentajes
Si la media es 80 y la desviación estándar 20 entonces
CV=20/80=0,25=25% (variabilidad relativa)
 Es una cantidad interesante para comparar la variabilidad de

diferentes variables.
 Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos
presentan más dispersión en peso que en altura.
Asimetría o Sesgo
 Una distribución es simétrica
si la mitad izquierda de su
distribución es la imagen
especular de su mitad
derecha.
 En las distribuciones
simétricas media, mediana y
moda coinciden.
 La asimetría es positiva o
negativa en función de a qué
lado se encuentra la cola de
la distribución.
 La media tiende a
desplazarse hacia los valores
extremos (colas).
Asimetría o Sesgo
 Hay diferentes estadísticos que sirven para detectar asimetría.
 Basado en diferencia entre estadísticos de tendencia central.
 Basado en la diferencia entre el 1º y 2º cuartiles y 2º y 3º.
 Basados en desviaciones con signo al cubo con respecto a la media.
 Los calculados con ordenador. Es pesado de hacer a mano.
 En función del signo del estadístico diremos que la asimetría es

positiva o negativa.
0.20
0.5
0.20
0.4
0.15
0.15
0.3
0.10
0.10
0.2
0.05
0.05
0.1
x s x s
x s
66 % 78 %
78 %
0.00
0.00
0.0
8 10 12 14 16 18 20 -2 -1 0 1 2 3 0 2 4 6 8 10 12 14
x x x
Apuntamiento o curtosis
La curtosis nos indica el grado de apuntamiento (aplastamiento) de
una distribución con respecto a la distribución normal o gaussiana.
Platicúrtica (aplanada): curtosis < 0
Mesocúrtica (como la normal): curtosis = 0 En el curso serán de especial

interés las mesocúrticas y
simétricas (parecidas a la
Leptocúrtica (apuntada): curtosis > 0 normal).
Aplanada Apuntada como la normal Apuntada

2.0
0.8
0.3
1.5
0.6
0.2
1.0
0.4
0.1
0.5
0.2
x s
xs x s
68 %
57 % 82 %
0.0
0.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 -3 -2 -1 0 1 2 3 -2 -1 0 1 2

Ejercicio: descriptiva con SPSS
28%
Descriptivos para Número de hijos n=419
25%
Estadístico Error típ. n=375

Media 1,90 ,045 25%
Intervalo de Límite
1,81 17%
confianza para la inferior
20%
media al 95% Límite n=255 14%
Porcentaje
superior 1,99 n=215
15%
Media recortada al 5% 8%
1,75 10%
n=127
4%
Mediana 2,00 n=54 2% 2% 1%
5%
Varianza 3,114 n=24 n=23 n=17
Desv. típ. 1,765
Mínimo 0
0 1 2 3 4 5 6 7 Ocho o más
Máximo 8
Número de hijos
Rango 8
Amplitud intercuartil
3,00
Asimetría 1,034 ,063

Curtosis 1,060 ,126
SPSS - Inicio
Hoja principal de ingreso de datos
3.-
4.- Variables
Casos
1.- Etiqueta
Vista de 2.- Etiqueta: Vista
datos de variables
Seguir
35
SPSS - variables
El ingreso de variables debe hacerse de acuerdo al tipo de datos que se
tienen; estos pueden ser:
Nombre de la variable
Dígitos en el
nombre
Valores de la
variable 36
SPSS – variables cualitativas
Esta variable se puede programar
Hacer
CLICK
Dar el valor 1
Ingresar
nombre de la
variable
Añadir
Nombres
largos
Nombres
cortos 37
SPSS – variables cualitativas
38
SPSS – Ingreso de datos
Retornar
39
SPSS – Estadísticas descriptivas
Solamente
para datos
numéricos
40
Ingresar las
variables que se
desean estudiar
41
 Hoja de salida de resultados
42
SPSS – Frecuencias
Variables
cualitativas
43
Frecuencias
porcentajes
44
Gráfica
45
Frecuencias con datos

continuos (numéricos)
46
47
SPSS – Borrado de resultados
Seleccionar de la ventana
CONTENIDO, todo aquello
que se desea borrar
48
SPSS – Importar datos
Copiar con
comando
y Pegar
49
¿Qué hemos visto?
 Parámetros
 Estadísticos y estimadores
 Clasificación
 Posición (cuartiles, percentiles,...)
 Diagramas de cajas
 Medidas de tendencia central: Media, mediana y moda
 Diferenciar sus propiedades.
 Medidas de dispersión
 con unidades: rango, rango intercuartíl, varianza, desv.
estándar
 sin unidades: coeficiente de variación
 ¿Qué usamos para comparar dispersión de dos
poblaciones?
 Asimetría
 positiva
 negativa
 Medidas de apuntamiento (curtosis)

Métodos Cuantitativos en Negocios
ESTADISTICA DESCRIPTIVA
Medidas de forma:
Las medidas de forma permiten conocer que forma tiene la curva que
representa la serie de datos de la muestra
a) Concentración: mide si los valores de la variable están más o menos

uniformemente repartidos a lo largo de la muestra.
b) Asimetría: mide si la curva tiene una forma simétrica, es decir, si

respecto al centro de la misma (centro de simetría) los segmentos de
curva que quedan a derecha e izquierda son similares.
c) Curtosis: mide si los valores de la distribución están más o menos

concentrados alrededor de los valores medios de la muestra.
51
Medidas de forma: Grado de concentración
a) Concentración
Para medir el nivel de concentración de una distribución de frecuencia
se pueden utilizar distintos indicadores, entre ellos el Indice de Gini.
S ( pi  qi )
IG 
Spi
n1  n2  ...  ni ( x1n1 )  ( x2 n2 )  ...  ( xi ni )
pi  *100 qi  *100
n ( x1n1 )  ( x2 n2 )  ...  ( xn nn )
En donde pi mide el porcentaje de individuos de la muestra que
presentan un valor igual o inferior al de xi.
El Indice Gini (IG) puede tomar valores entre 0 y 1:
IG = 0 : concentración mínima. La muestra está unifomemente repartida
a lo largo de todo su rango.
IG = 1 : concentración máxima. Un sólo valor de la muestra acumula el
100% de los resultados.
52
Medidas de forma: Coeficiente de Asimetría
b) Asimetría
Se refiere a si la curva que forman los valores de la serie presenta la
misma forma a izquierda y derecha de un valor central (media
aritmética). Para medir el nivel de asimetría se utiliza el llamado
Coeficiente
1 de Asimetría de Fisher:
 x  x  n
i
3
i
g1  n
3
1 
   xi  x  ni 
2
2 g1 = 0 (distribución simétrica; existe la misma
n  concentración de valores a la derecha y a la
izquierda de la media)
g1 > 0 (distribución asimétrica positiva; existe
mayor concentración de valores a la derecha
de la media que a su izquierda)
g1 < 0 (distribución asimétrica negativa;
existe mayor concentración de valores a la
izquierda de la media que a su derecha) 53
Medidas de forma: Coeficiente de Curtosis
c) Curtosis
El Coeficiente de Curtosis analiza el grado de concentración que
presentan los valores alrededor de la zona central de la distribución.
Distribución mesocúrtica: presenta un grado de concentración medio
alrededor de los valores centrales de la variable (el mismo que presenta
una distribución normal).
Distribución leptocúrtica: presenta un elevado grado de concentración
alrededor de los valores centrales de la variable.
Distribución platicúrtica: presenta un reducido grado de concentración
alrededor de los valores centrales de la variable.
g2 = 0 (distribución
1
mesocúrtica).   xi  x 4
ni
g2 > 0 (distribución g 2  n 2
3
leptocúrtica). 1 
   xi  x  ni 
2
g2 < 0 (distribución n 
platicúrtica).
54

Medidas de Tendencia Central

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Medidas de Tendencia Central

Cargado por

Copyright:

Formatos disponibles

Universidad Nacional de San Antonio Abad del Cusco

Jorge Diaz Ugarte

Universidad Nacional de San Antonio Abad del Cusco

Normalmente nos interesa conocer un parámetro, pero por la

Datos sin agrupar:

Peso M. Clase Fr. Fr. ac.

Para calcular la media es

La media se desplaza hacia

Para datos no agrupados: Posición del i-esimo cuartil: Qi =

Cuartil 1 (Q1) de 1,2,4,5,6,6,8,9 es:

Posición del cuartil 1: Q1 = =2.25

Para datos no agrupados: Posición del i-esimo decil: Di =

Decil 3 (D3) de 1,2,4,5,6,6,8,9 es:

Posición del decil 3: D3 = = 2.70

Para datos no agrupados: Posición del i-esimo percentil: Pi =

Percentil 83 (P83) de 1,2,4,5,6,6,8,9 es:

Posición del percentil 83: P83 = = 7.47

Percentil 5 del peso

Peso al nacer (Kg) de 100 niños

Peso (Kg) de 100 deportistas

180 200 220 240 260

Colesterol en 100 personas

150 160 170 180 190

Altura (cm) en 100 varones

 Su tamaño se llama ‘rango

Diagrama de cajas de Tukey: Resumen en 5 números

hasta las observaciones que se

 Más allá de esa distancia se

80 90 100 110 120 130 140

Velocidad (Km/h) de 200 vehículos en autovía

Diferencia entre observaciónes extremas.

 Parecida al rango, pero eliminando las observaciones más

Para datos simples (n<60)

 Para datos simples (n≥60)

 Para datos agrupados (n<60)

 Para datos agrupados (n≥60)

 Centrado en la media y a una desviación estándar de distancia hay

 Es una cantidad interesante para comparar la variabilidad de

 En función del signo del estadístico diremos que la asimetría es

Platicúrtica (aplanada): curtosis < 0

Mesocúrtica (como la normal): curtosis = 0 En el curso serán de especial

Aplanada Apuntada como la normal Apuntada

0.0 0.2 0.4 0.6 0.8 1.0 -3 -2 -1 0 1 2 3 -2 -1 0 1 2

Estadístico Error típ. n=375

Asimetría 1,034 ,063

Frecuencias con datos

Universidad Nacional de San Antonio Abad del Cusco

a) Concentración: mide si los valores de la variable están más o menos

b) Asimetría: mide si la curva tiene una forma simétrica, es decir, si

c) Curtosis: mide si los valores de la distribución están más o menos

También podría gustarte