Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 1. Parte II
Análisis de datos transversales
Medidas de posición
Media aritmética
Mediana
Moda
Otras medidas: Media ponderada, Media geométrica,
Media armónica, Rango medio, Eje medio
Análisis unidimensional
1
Medidas de posición
x
Valores observados
i
x +x +...+x N
x= i=1
= 1 2
N N Número total de observaciones
x n
distintos valores
i i
i=1 x1n1 +x 2 n 2 +...+x I n I
x= =
N N
Análisis unidimensional
Medidas de posición
x i
3+0+5+6+1+0+11+6+0+4 36
x= i=1
= 3, 6
N 10 10
I=7
x n i i
36
x= i=1
= 3, 6 días por empleado
N 10
Análisis unidimensional
2
Medidas de posición
Propiedades:
I
1. (x i -x) n i =0
i=1
N
N1 +N 2 +...+N k xM=2,5 xT=5,25
i
i=1 NM=6 NT=4
(2,5×6)+(5,25×4) 15+21 36
x= = = =3,6
6+4 10 10
Análisis unidimensional
Medidas de posición
Cambio de origen
Cambio de unidad Cambio de origen
y de unidad T=X+2
ti zi yi Z=3X
3xi 3xi+2 ti ni zi n i yi ni
Y=3X+2
xi ni xi+2
0 3 2 0 2 6 0 6
t=
t i ni
56
= =5,6
1 1 3 3 5 3 3 5 N 10
3 1 5 9 11 5 9 11
z=
zi n i = 108 =10,8
4 1 6 12 14 6 12 14 N 10
5 1 7 15 17 7 15 17
y=
yi n i = 128 =12,8
6 2 8 18 20 16 36 40
N 10
11 1 13 33 35 13 33 35
3
Medidas de posición
Ventajas
Inconveniente
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 15 1 2 3 4 10 20
3 4
5 5 5 5
La media no es la mejor medida para describir o resumir
un conjunto de datos que tiene valores extremos
Análisis unidimensional
Medidas de posición
Análisis unidimensional
4
Medidas de posición
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Me=3 Me=3
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Me=3,5 Me=3,5
Análisis unidimensional
Medidas de posición
MEDIANA (Me)
Me x i
x i x i 1
Me
2
N
N N i Me x i
i 1 2
si
N N x x i 1
i 2 Me i
2
Distribución de frecuencias El problema se resuelve obteniendo en primer lugar el llamado
de valores agrupados intervalo mediano, el primero cuya frecuencia absoluta
acumulada Ni alcanza o sobrepasa N/2. Es decir, Ni-1 N / 2 Ni
(S/K) * N N i-1
¡Ojo! Me L i 1 .ci
ni
Análisis unidimensional
5
INDIV. xi datos
frecuencia frec. VE X = {CV potencia de los coches}
ab. Ac. Ab.
i xi ni Ni
1 x1 35 1 1
2 x2 46 2 3
Calculo de la Mediana
3 x3 48 4 7 cuando la frecuencia no
4 x4 49 1 8 es única
5 x5 52 4 12
6 . 53 2 14
7 . 54 1 15
. . . . . N
37
38 .
89
90
1
20
170
190
N i 1 2 N i Me x i
39 . 91 1 191
si
N N x x i 1
40 . 92 6 197
i 2 Me i
41 x41 93 2 199 2
42 x42 94 1 200 N/2 Mediana 94,5
43 x43 95 14 214
44 . 96 3 217
45 . 97 9 226
46 . 98 2 228 N/2 = 200
47 100 17 245
48 102 1 246
. . . . .
90 215 3 396
91 220 1 397
92 225 2 399
93 x93 230 1 400
400
Análisis unidimensional
Cuantiles
S N N
Cuantil _ o _ Valor _ de _ x L i 1 K
i -1
.ci
ni
Análisis unidimensional
6
Medidas de posición
MODA (Mo):
Distribución de frecuencias
de valores sin agrupar Valor de la variable de mayor frecuencia
Misma amplitud:
Distribución de frecuencias intervalo modal en el intervalo de mayor frecuencia o
de valores agrupados altura
Distinta amplitud:
intervalo modal en el intervalo de mayor altura
CUANTILES: sN
Ni1 Ni Q s x i
–CUARTILES (k=4), Cs (s=1,2,3,4) k k
–DECILES (k=10), Ds (s=1,2,3,..,10) si
N s N x x i1
Qs i
–PERCENTILES (k=100), Ps (s=1,2,3,..,100) i
k k
2
Análisis unidimensional
Medidas de posición
Análisis unidimensional
7
Medidas dispersión o variación
Análisis unidimensional
Proveedor A Proveedor B
9 10 11 7 8 9 10 11 12 13 14 15
Análisis unidimensional
8
Análisis de datos unidimensional I
Medidas dispersión o variación
Medidas de posición y dispersión
Rango o recorrido
Recorrido Intercuartílico
Varianza
Desviación típica
Análisis unidimensional
Rango
Análisis de datos unidimensional I Recorrido Intercuartílico
Dispersión absoluta Varianza
Desviación típica
x -x
Evalúa la manera en
ni
2
i que fluctúan los valores
S2X i=1
de la variable respecto
N
a la media
Análisis unidimensional
9
Momentos de orden R:
Análisis unidimensional
Rango
Análisis de datos unidimensional I Recorrido Intercuartílico
Dispersión absoluta Varianza
Desviación típica
x 2
i ni
S 2
X
i 1
x2
N
Utiliza sólo los valores de la variable
Análisis unidimensional
10
Rango
Análisis de datos unidimensional I Recorrido Intercuartílico
Dispersión absoluta Varianza
Desviación típica
Ejemplo:
xi ni xini xi-x (xi-x)2 (xi-x)2ni xi2ni
1 2 2 -2 4 8 2 I=5
2 5 10 -1 1 5 20 x i ni
72
3 10 30 0 0 0 90 x= i=1
= 3
N 24
4 5 20 1 1 5 80
5 2 10 2 4 8 50
I=5 I=5
x -x ni x ni
2 2
i
26 i
242 2
S
2
X
i=1
1, 083 S 2
X
i 1
x2 3 1, 083
N 24 N 24
Análisis unidimensional
Rango
Análisis de datos unidimensional I Recorrido Intercuartílico
Dispersión absoluta Varianza
Desviación típica
Propiedades de la varianza:
Análisis unidimensional
11
Medidas de dispersión
• RANGO (RECORRIDO)
Re x max x min
• VARIANZA I
I
x i x n i
2 x 2
i ni
S
2
X S 2
x
i 1
x2
i 1 N N
• DESVIACIÓN TÍPICA
Sx S2x 0
COEFICIENTE DE VARIACIÓN
• CUASIVARIANZA (DE PEARSON)
N 2 S
S2X* SX g 0 (X) X (COMPARAR)
N 1 x
Análisis unidimensional
al “doblar”
por el eje de
simetría
i 1
g1 X N
S3X
Análisis unidimensional
12
Medidas de forma: simetría
Distribución asimétrica negativa
cola más larga a la izquierda de la moda
g1 (X) 0
Distribución simétrica
g1 (X) 0
g1 (X) 0
Análisis unidimensional
g 2 X N 3
S4X
Leptocúrtica
g 2 (X) 0
Mesocúrtica
g2 (X) 0
Platicúrtica
g 2 (X) 0
Análisis unidimensional
13
Transformaciones lineales
Análisis unidimensional
Tipificación de variables
• Tipificación estándar.
Xx
Z con z 0 y SZ 1
SX
• Tipificación a media “m” y desviación típica “k”.
X x
Z k m con z m y Sz k
X
S
UTILIDAD:
1.- Las variables pasan a ser adimensionales.
2.- Permiten comparar utilizando como distancia el número
de desviaciones típicas respecto a la media
Análisis unidimensional
14
Problema 1/33
Análisis unidimensional
Medidas de concentración
Análisis unidimensional
15
Medidas de concentración
CURVA DE LORENZ
Análisis unidimensional
Medidas de concentración
INDICE DE GINI
( p q ) i i
IG i 1
I 1
0 IG 1
p
i 1
i
Análisis unidimensional
16
Medidas de concentración
IG 0 0 IG 1 IG 1
qi qi qi
pi pi pi
Análisis unidimensional
Medidas de concentración
Análisis unidimensional
17
Problema 3/45
( p q ) i i
46.56
a) IG i 1
I 1
0.2909
p
160
i
i 1
Análisis unidimensional
b)
S. 50 25
20000 15000 K .10000
20
s / k 35 / 50 0.7
Análisis unidimensional
18