Está en la página 1de 54

Universidad Nacional de San Antonio Abad del Cusco

Maestría en Contabilidad
Mención Finanzas Empresariales

MEDIDAS DE TENDENCIA
CENTRAL

Jorge Diaz Ugarte

Universidad Nacional de San Antonio Abad del Cusco


Métodos Cuantitativos en Negocios
Parámetros y estadísticos
 Parámetro: Es una cantidad numérica
calculada sobre una población
 La altura media de los individuos de un país
 La idea es resumir toda la información que
hay en la población en unos pocos números
(parámetros).
 Estadístico: Es una cantidad numérica calculada sobre una muestra
 La altura media de los que estamos en esta aula.

Normalmente nos interesa conocer un parámetro, pero por la


dificultad que conlleva estudiar a “toda” la población, calculamos un
estadístico sobre una muestra y “confiamos” en que sean próximos.
Más adelante veremos como elegir muestras para que el error sea
“confiablemente” pequeño.
CARACTERÍSTICAS DE LOS DATOS
Resumen de estadísticos
 Tendencia Central
 Indican valores con respecto a los que los datos parecen agruparse.
 Media, mediana y moda
 Posición
 Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
 Cuartiles, Deciles, Percentiles.
 Dispersión
 Indican la mayor o menor concentración de los datos con respecto
a una medida de tendencia central.
 Desviación estándar, coeficiente de variación, rango, varianza
 Forma
 Asimetría
 Curtosis
Medidas de tendencia central
Son medidas que buscan posiciones (valores) con respecto a
los cuales los datos muestran tendencia a agruparse.

Datos sin agrupar:


x1, x2, ..., xn x
xi i

n
Datos agrupados en tabla:
Usar como xi las marcas de clase (Yi) x
 Yn
i i i

n
Medidas de tendencia central
 Mediana (Me):
Es un valor que divide a las observaciones en dos grupos con el
mismo número de individuos (percentil 50). Si el número de
datos es par, se elige la media de los dos datos centrales.
 Mediana de 1,2,4,5,6,6,8 es 5
 Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5
 Es conveniente cuando los datos son asimétricos.
 No es sensible a valores extremos
Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7!

Altura mediana
Medidas de tendencia central
 Mediana de datos agrupados:
Intervalo Y1 ni Ni

L0 – L 1 Y1 n1 N1

L1 – L 2 Y2 n2 N2

...

Lk-1 – Lk Yk nk Nk

n
Medidas de tendencia central
 Moda (Mo):
Es el valor que mas se repite
Es el valor donde la distribución de frecuencias alcanza un
máximo.
La moda puede no existir en un conjunto de datos. Si existe,
puede no ser única.
Medidas de tendencia central
 Moda de datos agrupados: Se encuentra en la clase que contiene
la frecuencia mayor
Intervalo Y1 ni Ni

L0 – L 1 Y1 n1 N1

L1 – L 2 Y2 n2 N2

...

Lk-1 – Lk Yk nk Nk

n
Ejemplo

Peso M. Clase Fr. Fr. ac.


Y1 ni Ni
40 – 50 45 5 5
50 – 60 55 10 15
60 – 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
100 – 130 115 3 58
58
Ejemplo
Peso M. frec Fr.
Clase acum.
40 – 50 45 5 5
50 – 60 55 10 15
60 – 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
100 – 130 115 3 58

Para calcular la media es


necesario elegir un punto
representante del intervalo:
La marca de clase.

La media se desplaza hacia


los valores extremos. No
coincide con la mediana.
Estadísticos de posición
 Cuartiles: Dividen a la muestra en 4 grupos con frecuencias
similares.
 Primer cuartil = Percentil 25
 Segundo cuartil = Percentil 50 = Mediana
 Tercer cuartil = Percentil 75

Para datos no agrupados: Posición del i-esimo cuartil: Qi =

Cuartil 1 (Q1) de 1,2,4,5,6,6,8,9 es:

Posición del cuartil 1: Q1 = =2.25


Q1 = 2 + 0.25(4-2) = 2.5
Estadísticos de posición
 Cuartiles:
Para datos agrupados: Posición del k-esimo cuartil: Qk =
Peso M. Clase Fr. Fr. ac.
Qk = Li + C* Y1 ni Ni
40 – 50 45 5 5
k = 1,2 y 3 50 – 60 55 10 15
60 – 70 65 21 36
Posición del cuartil 1: 70 - 80 75 11 47
80 - 90 85 5 52
Q1 = =14.75
90 - 100 95 3 55
100 – 130 115 3 58
58
Q1 = 50 + 10* = 59.5
Estadísticos de posición
 Deciles: Dividen a la muestra en 10 grupos con frecuencias
similares. Donde k = 1, 2, 3, 4, ……….., 8, 9
 La mediana es el Decil 5

Para datos no agrupados: Posición del i-esimo decil: Di =

Decil 3 (D3) de 1,2,4,5,6,6,8,9 es:

Posición del decil 3: D3 = = 2.70


D3 = 2 + 0.70(4-2) = 3.4
Estadísticos de posición
 Deciles:
Para datos agrupados: Posición del k-esimo decil: Dk =
Peso M. Clase Fr. Fr. ac.
Dk = Li + C* Y1 ni Ni
40 – 50 45 5 5
k = 1,2,3,4,5,6,7,8 y 9 50 – 60 55 10 15
60 – 70 65 21 36
Posición del decil 3: 70 - 80 75 11 47
80 - 90 85 5 52
D3 = =17.70
90 - 100 95 3 55
100 – 130 115 3 58
58
D3 = 60 + 10* = 61.14
Estadísticos de posición
 Percentil: Dividen a la muestra en 100 grupos con frecuencias
similares. Donde k = 1, 2, 3, 4, ………..98, 99
 La mediana es el percentil 50
 El percentil de orden 15 deja por debajo al 15% de las
observaciones. Por encima queda el 85%

Para datos no agrupados: Posición del i-esimo percentil: Pi =

Percentil 83 (P83) de 1,2,4,5,6,6,8,9 es:

Posición del percentil 83: P83 = = 7.47


P83 = 8 + 0.47(9-8) = 8.47
Estadísticos de posición
 Percentiles:
Para datos agrupados: Posición del k-esimo percentil: Pk =
Peso M. Clase Fr. Fr. ac.
Pk = Li + C* Y1 ni Ni
40 – 50 45 5 5
k = 1,2,3………98 y 99 50 – 60 55 10 15
60 – 70 65 21 36
Posición del percentil 83: 70 - 80 75 11 47
80 - 90 85 5 52
P83 = =48.97
90 - 100 95 3 55
100 – 130 115 3 58
58
P83 = 80 + 10* = 82.28
Ejemplos
 El 5% de los recién nacidos tiene un peso demasiado bajo. ¿Qué peso se
considera “demasiado bajo”?
 Percentil 5

Percentil 5 del peso


25
20
frecuencia

15
10
5
0

1 2 3 4 5

Peso al nacer (Kg) de 100 niños


Ejemplos
¿Qué peso es superado sólo por el 25% de los individuos?
 Percentil 75 o tercer cuartil
Percentil 75 del peso
30
25
20
frecuencia

15
10
5
0

50 55 60 65 70 75 80 85

Peso (Kg) de 100 deportistas


Ejemplos
 En una distribución del colesterol. Supongamos que se consideran patológicos los
valores extremos. El 90% de los individuos son normales ¿Entre qué valores se
encuentran los individuos normales?

Percentiles 5 y 95
20
15
frecuencia

10
5
0

180 200 220 240 260

Colesterol en 100 personas


Ejemplos
 ¿Entre qué valores se encuentran la mitad de los individuos “más normales” de
una población?
 Entre el cuartil 1º y 3º
Percentiles 25 y 75
20
15
frecuencia

10
5
0

150 160 170 180 190

Altura (cm) en 100 varones


Diagramas de Caja Diagrama de cajas de Tukey: Resumen en 5 números

0.08
 Resumen :

0.06
 Mínimo, cuartiles y máximo.

densidad

0.04
 Suelen dar una buena idea de la
distribución. P25 P50 P75

0.02
Mín. Máx.

0.00
 La zona central, ‘caja’, contiene al 40 45 50 55 60 65
50% central de las observaciones. Velocidad (Km/h) de 200 vehículos en ciudad

 Su tamaño se llama ‘rango


intercuartílico’ (R.I.)

Diagrama de cajas de Tukey: Resumen en 5 números


 Es costumbre que ‘los bigotes’, no
lleguen hasta los extremos, sino
0.04

hasta las observaciones que se


separan de la caja en no más de
0.03

1,5 R.I.
densidad

0.02

 Más allá de esa distancia se


consideran anómalas, y así se Mín. P25 P50 P75 Máx
0.01

marcan.
0.00

80 90 100 110 120 130 140

Velocidad (Km/h) de 200 vehículos en autovía


Medidas de dispersión
Miden el grado de dispersión (variabilidad) de los datos,
independientemente de su causa.

0.05
 Amplitud o Rango (R): Mín. P25 P50 P75 Máx.

Diferencia entre observaciónes extremas.

0.04
 2,1,4,3,8,4. El rango es 8-1=7

0.03
 Es muy sensible a los valores extremos.
25% 25% 25% 25%

0.02
Rango intercuartílico
 Rango intercuartil (RI):

0.01
 Es la distancia entre el primer y Rango

tercer cuartil.

0.00
 Rango intercuartil = P75 - P25 150 160 170 180 190

 Parecida al rango, pero eliminando las observaciones más


extremas inferiores y superiores.
 No es tan sensible a valores extremos.
Medidas de dispersión
 Varianza (S2): Mide el promedio de las desviaciones (al cuadrado) de
las observaciones con respecto a la media.
 Es sensible a valores extremos (alejados de la media).

Para datos simples (n<60)

 Para datos simples (n≥60)

 Para datos agrupados (n<60)

 Para datos agrupados (n≥60)


Medidas de dispersión
 Varianza (S2):
 Formulas de recurrencia.


Medidas de dispersión
Desviación estándar (S) 50
Es la raíz cuadrada de la varianza
40

30

S S 2
20

10
Desv. típ. = 568,43
Media = 2023
0 50 N = 407,00

90

1.

1.

2.

2.

2.

3.
30

70

10

30
50

90
0

0
0

0
Peso recién nacidos en partos gemelares
Medidas de dispersión
La desviación estándar de los siguientes datos 2,4,5,6,8 es:

x
 x i i

n = = =5

= =5

= 2.2361
Medidas de dispersión
La desviación estándar de la siguiente distribución es:

x
 Yn
i i i

n
M. Clase Frecuencia
Peso
Yi ni Yini 𝑛 (𝑌 − 𝑋 )
40 – 50 45 5 225 2955
50 – 60 55 10 550 2048
60 – 70 65 21 1365 390
70 - 80 75 11 825 356
80 - 90 85 5 425 1231
90 - 100 95 3 285 1980
= 267.06 100 – 130 115 3 345 6263
58 4020 15222

= 16.34
Medidas de dispersión
Dispersión en distribuciones ‘normales’
0.05

0.05
0.04

0.04
0.03

0.03
0.02

0.02
0.01

0.01
xs x  2s
68.5 % 95 %
0.00

0.00
150 160 170 180 190 150 160 170 180 190

 Centrado en la media y a una desviación estándar de distancia hay


aproximadamente el 68% de las observaciones.
 A dos desviaciones estándar tenemos el 95% (aprox.)
 A tres desviaciones estándar tenemos el 99.7% (aprox.)
Medidas de dispersión
Coeficiente de variación (CV)
S
Es la razón entre la desviación estándar y la media.
CV 
x
 Mide la desviación estándar en forma de
“qué tamaño tiene con respecto a la media”
 También se la denomina variabilidad relativa.
 Es frecuente mostrarla en porcentajes
Si la media es 80 y la desviación estándar 20 entonces
CV=20/80=0,25=25% (variabilidad relativa)

 Es una cantidad interesante para comparar la variabilidad de


diferentes variables.
 Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos
presentan más dispersión en peso que en altura.
Asimetría o Sesgo
 Una distribución es simétrica
si la mitad izquierda de su
distribución es la imagen
especular de su mitad
derecha.

 En las distribuciones
simétricas media, mediana y
moda coinciden.

 La asimetría es positiva o
negativa en función de a qué
lado se encuentra la cola de
la distribución.

 La media tiende a
desplazarse hacia los valores
extremos (colas).
Asimetría o Sesgo
 Hay diferentes estadísticos que sirven para detectar asimetría.
 Basado en diferencia entre estadísticos de tendencia central.
 Basado en la diferencia entre el 1º y 2º cuartiles y 2º y 3º.
 Basados en desviaciones con signo al cubo con respecto a la media.
 Los calculados con ordenador. Es pesado de hacer a mano.

 En función del signo del estadístico diremos que la asimetría es


positiva o negativa.

0.20
0.5
0.20

0.4

0.15
0.15

0.3

0.10
0.10

0.2

0.05
0.05

0.1

x s x s
x s
66 % 78 %
78 %
0.00

0.00
0.0

8 10 12 14 16 18 20 -2 -1 0 1 2 3 0 2 4 6 8 10 12 14

x x x
Apuntamiento o curtosis
La curtosis nos indica el grado de apuntamiento (aplastamiento) de
una distribución con respecto a la distribución normal o gaussiana.

Platicúrtica (aplanada): curtosis < 0

Mesocúrtica (como la normal): curtosis = 0 En el curso serán de especial


interés las mesocúrticas y
simétricas (parecidas a la
Leptocúrtica (apuntada): curtosis > 0 normal).

Aplanada Apuntada como la normal Apuntada


2.0

0.8
0.3
1.5

0.6
0.2
1.0

0.4
0.1
0.5

0.2
x s
xs x s
68 %
57 % 82 %
0.0

0.0
0.0

0.0 0.2 0.4 0.6 0.8 1.0 -3 -2 -1 0 1 2 3 -2 -1 0 1 2


Ejercicio: descriptiva con SPSS
28%
Descriptivos para Número de hijos n=419
25%

Estadístico Error típ. n=375


Media 1,90 ,045 25%
Intervalo de Límite
1,81 17%
confianza para la inferior
20%
media al 95% Límite n=255 14%

Porcentaje
superior 1,99 n=215
15%

Media recortada al 5% 8%

1,75 10%
n=127

4%
Mediana 2,00 n=54 2% 2% 1%
5%
Varianza 3,114 n=24 n=23 n=17
Desv. típ. 1,765
Mínimo 0
0 1 2 3 4 5 6 7 Ocho o más
Máximo 8
Número de hijos
Rango 8
Amplitud intercuartil
3,00

Asimetría 1,034 ,063


Curtosis 1,060 ,126
SPSS - Inicio
Hoja principal de ingreso de datos

3.-
4.- Variables
Casos

1.- Etiqueta
Vista de 2.- Etiqueta: Vista
datos de variables

Seguir
35
SPSS - variables
El ingreso de variables debe hacerse de acuerdo al tipo de datos que se
tienen; estos pueden ser:

Nombre de la variable
Dígitos en el
nombre

Valores de la
variable 36
SPSS – variables cualitativas
Esta variable se puede programar

Hacer
CLICK
Dar el valor 1
Ingresar
nombre de la
variable
Añadir

Nombres
largos
Nombres
cortos 37
SPSS – variables cualitativas

38
SPSS – Ingreso de datos

Retornar
39
SPSS – Estadísticas descriptivas

Solamente
para datos
numéricos

40
SPSS – Estadísticas descriptivas

Ingresar las
variables que se
desean estudiar

41
SPSS – Estadísticas descriptivas
 Hoja de salida de resultados

42
SPSS – Frecuencias

Variables
cualitativas

43
SPSS – Frecuencias

Frecuencias
porcentajes
44
SPSS – Frecuencias

Gráfica
45
SPSS – Frecuencias

Frecuencias con datos


continuos (numéricos)
46
SPSS – Frecuencias

47
SPSS – Borrado de resultados

Seleccionar de la ventana
CONTENIDO, todo aquello
que se desea borrar

48
SPSS – Importar datos

Copiar con
comando
y Pegar

49
¿Qué hemos visto?
 Parámetros
 Estadísticos y estimadores
 Clasificación
 Posición (cuartiles, percentiles,...)
 Diagramas de cajas
 Medidas de tendencia central: Media, mediana y moda
 Diferenciar sus propiedades.
 Medidas de dispersión
 con unidades: rango, rango intercuartíl, varianza, desv.
estándar
 sin unidades: coeficiente de variación
 ¿Qué usamos para comparar dispersión de dos
poblaciones?
 Asimetría
 positiva
 negativa
 Medidas de apuntamiento (curtosis)

Universidad Nacional de San Antonio Abad del Cusco


Métodos Cuantitativos en Negocios
ESTADISTICA DESCRIPTIVA
Medidas de forma:

Las medidas de forma permiten conocer que forma tiene la curva que
representa la serie de datos de la muestra

a) Concentración: mide si los valores de la variable están más o menos


uniformemente repartidos a lo largo de la muestra.

b) Asimetría: mide si la curva tiene una forma simétrica, es decir, si


respecto al centro de la misma (centro de simetría) los segmentos de
curva que quedan a derecha e izquierda son similares.

c) Curtosis: mide si los valores de la distribución están más o menos


concentrados alrededor de los valores medios de la muestra.

51
ESTADISTICA DESCRIPTIVA
Medidas de forma: Grado de concentración
a) Concentración
Para medir el nivel de concentración de una distribución de frecuencia
se pueden utilizar distintos indicadores, entre ellos el Indice de Gini.

S ( pi  qi )
IG 
Spi
n1  n2  ...  ni ( x1n1 )  ( x2 n2 )  ...  ( xi ni )
pi  *100 qi  *100
n ( x1n1 )  ( x2 n2 )  ...  ( xn nn )
En donde pi mide el porcentaje de individuos de la muestra que
presentan un valor igual o inferior al de xi.
El Indice Gini (IG) puede tomar valores entre 0 y 1:
IG = 0 : concentración mínima. La muestra está unifomemente repartida
a lo largo de todo su rango.
IG = 1 : concentración máxima. Un sólo valor de la muestra acumula el
100% de los resultados.
52
ESTADISTICA DESCRIPTIVA
Medidas de forma: Coeficiente de Asimetría

b) Asimetría
Se refiere a si la curva que forman los valores de la serie presenta la
misma forma a izquierda y derecha de un valor central (media
aritmética). Para medir el nivel de asimetría se utiliza el llamado
Coeficiente
1 de Asimetría de Fisher:
 x  x  n
i
3
i
g1  n
3
1 
   xi  x  ni 
2
2 g1 = 0 (distribución simétrica; existe la misma
n  concentración de valores a la derecha y a la
izquierda de la media)
g1 > 0 (distribución asimétrica positiva; existe
mayor concentración de valores a la derecha
de la media que a su izquierda)
g1 < 0 (distribución asimétrica negativa;
existe mayor concentración de valores a la
izquierda de la media que a su derecha) 53
ESTADISTICA DESCRIPTIVA
Medidas de forma: Coeficiente de Curtosis
c) Curtosis
El Coeficiente de Curtosis analiza el grado de concentración que
presentan los valores alrededor de la zona central de la distribución.
Distribución mesocúrtica: presenta un grado de concentración medio
alrededor de los valores centrales de la variable (el mismo que presenta
una distribución normal).
Distribución leptocúrtica: presenta un elevado grado de concentración
alrededor de los valores centrales de la variable.
Distribución platicúrtica: presenta un reducido grado de concentración
alrededor de los valores centrales de la variable.
g2 = 0 (distribución
1
mesocúrtica).   xi  x 4
ni
g2 > 0 (distribución g 2  n 2
3
leptocúrtica). 1 
   xi  x  ni 
2

g2 < 0 (distribución n 
platicúrtica).

54

También podría gustarte