Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Material 101
Material 101
INTRODUCCIN A LA ESTADSTICA
DESCRIPTIVA PARA ECONOMISTAS
Palma, 2002
NDICE
INTRODUCCIN: Qu es...?
1
2
2
4
4
6
Qu es una variable?
Qu es la estadstica descriptiva? Cul es el mbito de la estadstica
descriptiva en el anlisis econmico?
Qu son la poblacin y la muestra?
Qu es un parmetro? Qu es un estadstico?
Qu es una muestra aleatoria?
Estructura del libro.
7
8
11
12
14
15
16
19
19
19
19
23
26
35
35
35
36
38
38
40
43
43
45
48
79
81
89
89
91
91
Media aritmtica.
Propiedades de la media.
Media ponderada.
Media ponderada y muestreos complejos.
Representatividad de la media.
Media cortada (trimmed mean).
Media geomtrica.
Utilizacin de la media, moda y mediana para detectar la
asimetra de una distribucin.
Cuartiles, deciles y percentiles.
Medidas de dispersin: rango, rango intercuartlico, varianza,
desviacin estndar, coeficiente de variacin.
Discusin y propiedades de la varianza, desviacin estndar y
coeficiente de variacin.
Relacin entre la media y la desviacin estndar: Desigualdad de
Chebychev.
El Diagrama de caja.
Diagrama de caja. Ayudas para su interpretacin.
Medidas de asimetra y curtosis.
Medida de asimetra de Fisher.
Medida de asimetra de Pearson.
Medida de apuntamiento o curtosis.
101
101
108
113
119
133
133
134
137
144
145
148
148
149
153
51
57
58
76
177
179
182
186
189
195
196
198
198
201
204
205
205
231
BIBLIOGRAFA.
INTRODUCCIN: Qu es...?
Qu es una variable?
Qu es un parmetro? Qu es un estadstico?
la muestra. Puede imaginar que este diseo ideal, para ser operativo necesita en
ocasiones de otros criterios que lo complementen (qu ocurre cuando la
poblacin no puede numerarse, por ejemplo), pero queremos destacar ahora la
idea de que mediante diseos muestrales aleatorios se pretende conseguir
muestras lo ms representativas posibles de la poblacin.
Su profesin es:
Profesional liberal.
Directivo o empresario.
Administrativo.
Trabajador manual.
Trabajador Autnomo.
Funcionario.
Jubilado.
Estudiante
Otras.
fi =
ni
,
n
i = 1 ,K , I
Ni = n j
i = 1,K I .
j =1
Fi =
n
j =1
Ni
, i = 1,K,I
n
Cuadro 1
Categoras
A1
A2
AI
Distribucin de frecuencias
Frecuencias
Frecuencias
Frecuencias
Absolutas
Relativas
Relativas acumuladas
n1
n1 /n
n1 /n
n2
n2 /n
(n1+n2) /n
nI
nI /n
(n1++nI) /n
Cuadro 2
VIVIENDA
Value Label
Value
Alquiler
Hipoteca vigente
Propiedad
0
1
2
Total
Valid cases
4791
Frequency
1764
960
2067
------4791
Missing cases
Percent
36,8
20,0
43,1
------100,0
Cum
Percent
36,8
56,9
100,0
Los valores que toma la variable (Value). Para esta variable los valores 0, 1 y
2 reflejan las categoras de alquiler, vivienda con hipoteca vigente y vivienda
de propiedad (en la columna Value Label se muestran las etiquetas de la
variable).
fi =
ni
n
Fi =
n
j =1
Ni
n
Grfica 1
Grfica de barras
2200
2000
1800
1600
1400
Frecuencia
1200
1000
800
0
100
80
60
Frecuencias
40
20
0
A1
A2
A3
A4
A5
A6
A7
A8
A3
A4
A5
A6
A7
A8
Variable Cualitativa
Grfica 3
120
100
80
60
Frecuencias
40
20
0
A1
Variable Cualitativa
A2
Value
Frequency
Nada satisfactorio
Poco satisfactorio
Bastante satisfactorio
Muy satisfactorio
No lo ha probado
1
2
3
4
5
------Total
6
31
96
90
13
------236
Percent
Valid
Percent
2,5
2,7
13,1
13,9
40,7
43,0
38,1
40,4
5,5
Missing
------100,0
100,0
Cum
Percent
2,7
16,6
59,6
100,0
Grfica de barras
50
40
30
Porcentaje
20
10
0
Muy satisf actorio
Bastante satisfact.
Grfica 5
Frecuencias relativas
Nada satisf echo
2,7%
Poco satisf echo
13,9%
Cuadro 4
Causa
1
2
3
4
5
6
50
40
100
Nmero de paradas
30
20
10
50
11
10
10
4
0
6,00
Causa de la parada
1,00
2,00
3,00
0
4,00
5,00
Grfica 7
Tiempo de parada
Porcentaje
300
200
100
100
50
70
53
41
20
0
1,00
Causa de la parada
6,00
3,00
4,00
0
2,00
5,00
Nios
0
1
2
3
4
5
Grfica 1
44.8
24.5
24.0
4.7
1.8
0.2
562
869
1170
1229
1252
1254
Cumulative
Percent
44.8
69.3
93.3
98.0
99.8
100.0
600
562
500
400
Frecuencias absolutas
300
307
301
200
100
59
0
0
Frequency Percent
1
,1
4
,3
13
,9
,9
1,2
Valid
Percent
,1
,3
Cum
Percent
,1
,3
19,00
20,00
21,00
22,00
23,00
24,00
25,00
26,00
27,00
28,00
29,00
30,00
31,00
32,00
33,00
34,00
35,00
36,00
37,00
38,00
39,00
40,00
9
20
18
33
34
37
36
42
33
31
33
32
27
34
45
31
32
31
26
31
31
25
,6
1,4
1,2
2,3
2,3
2,5
2,5
2,9
2,3
2,1
2,3
2,2
1,8
2,3
3,1
2,1
2,2
2,1
1,8
2,1
2,1
1,7
,6
1,4
1,2
2,3
2,3
2,5
2,5
2,9
2,3
2,1
2,3
2,2
1,8
2,3
3,1
2,1
2,2
2,1
1,8
2,1
2,1
1,7
1,8
3,2
4,5
6,7
9,0
11,6
14,0
16,9
19,2
21,3
23,6
25,8
27,6
29,9
33,0
35,1
37,3
39,5
41,2
43,4
45,5
47,2
34
2,3
27
1,8
34
2,3
31
2,1
40
2,7
32
2,2
35
2,4
23
1,6
20
1,4
28
1,9
,8 68,8
34
2,3
32
2,2
28
1,9
21
1,4
25
1,7
30
2,1
38
2,6
25
1,7
15
1,0
15
1,0
12
,8
18
1,2
11
,8
17
1,2
14
1,0
12
,8
20
1,4
10
,7
9
,6
2,3
1,8
2,3
2,1
2,7
2,2
2,4
1,6
1,4
1,9
49,5
51,4
53,7
55,8
58,6
60,8
63,2
64,7
66,1
68,0
2,3
2,2
1,9
1,4
1,7
2,1
2,6
1,7
1,0
1,0
,8
1,2
,8
1,2
1,0
,8
1,4
,7
,6
71,1
73,3
75,2
76,6
78,4
80,4
83,0
84,7
85,8
86,8
87,6
88,8
89,6
90,8
91,7
92,5
93,9
94,6
95,2
(Continuacin Cuadro 2)
41,00
42,00
43,00
44,00
45,00
46,00
47,00
48,00
49,00
50,00
51,00
11
52,00
53,00
54,00
55,00
56,00
57,00
58,00
59,00
60,00
61,00
62,00
63,00
64,00
65,00
66,00
67,00
68,00
69,00
70,00
,8
71,00
72,00
73,00
74,00
75,00
76,00
77,00
78,00
79,00
80,00
81,00
82,00
83,00
84,00
85,00
86,00
87,00
88,00
6
8
5
7
8
4
1
5
5
5
5
5
1
1
1
1
1
1
------1460
Total
,4
,5
,3
,5
,5
,3
,1
,3
,3
,3
,3
,3
,1
,1
,1
,1
,1
,1
------100,0
,4
,5
,3
,5
,5
,3
,1
,3
,3
,3
,3
,3
,1
,1
,1
,1
,1
,1
-----100,0
95,6
96,2
96,5
97,0
97,5
97,8
97,9
98,2
98,6
98,9
99,2
99,6
99,7
99,7
99,8
99,9
99,9
100,0
Grfica 2
50
40
Frecuencias absolutas
30
20
10
0
16
20
18
24
22
28
26
32
30
36
34
40
38
44
42
48
46
52
50
56
54
60
58
64
62
68
66
72
70
76
74
80
78
84
82
88
86
Cuadro 3
Valid
Cum
a
a
a
a
a
a
a
a
a
24
32
40
48
56
64
72
80
88
Total
169
268
252
256
199
164
96
40
16
------1460
11,6
18,4
17,3
17,5
13,6
11,2
6,6
2,7
1,1
------100,0
11,6
18,4
17,3
17,5
13,6
11,2
6,6
2,7
1,1
------100,0
11,6
29,9
47,2
64,7
78,4
89,6
96,2
98,9
100,0
Grfica
300
200
100
0
16 - 24
24 - 32
32 - 40
40 - 48
48 - 56
56 - 64
64 - 72
72 - 80
80 - 88
ni
n
donde la base es la amplitud del intervalo y, por tanto, la altura del rectngulo es
igual a:
alturai =
ni 1
n basei
marca de clase =
Grfica 4
Grfica 5
400000
600000
500000
300000
400000
200000
300000
200000
100000
100000
0
200000
0
1000000
600000
1800000
1400000
2600000
2200000
3400000
3000000
4200000
3800000
5000000
4600000
370000
5400000
1450000
910000
2530000
1990000
3610000
3070000
4690000
4150000
5230000
Grfica 6
Grfica 7
300000
200000
200000
100000
100000
0
208000
1504000
856000
2800000
2152000
4096000
3448000
5392000
4744000
0
154000
1234000
694000
2314000
1774000
3394000
2854000
4474000
3934000
5014000
Grfica 8
P r o p o r c i n d e g a s t o e n a l i me n t a c i n
FREQ.
CUM.
FREQ.
PCT.
CUM.
PCT.
12
12
4. 4 3
4. 4 3
12
31
43
11. 44
15. 87
20
56
99
20. 66
36. 53
28
65
164
23. 99
60. 52
36
51
215
18. 82
79. 34
44
29
244
10. 70
90. 04
52
13
257
4. 8 0
94. 83
60
265
2. 9 5
97. 79
68
266
0. 3 7
98. 15
76
268
0. 7 4
98. 89
84
271
1. 1 1
100. 00
10
Fr e c u e n c i a s r e l a t i v a s
ECP F .
20
30
I V t r i me s t r e 1 9 9 1
Grfica 9
Pr o p o r c i n g a s t o e n v e s t i d o y c a l z a d o
FREQ.
CUM.
FREQ.
PCT.
CUM.
PCT.
62
62
22. 88
22. 88
74
136
27. 31
50. 18
10
52
188
19. 19
69. 37
15
37
225
13. 65
83. 03
20
14
239
5. 17
88. 19
25
12
251
4. 43
92. 62
30
14
265
5. 17
97. 79
35
266
0. 37
98. 15
40
270
1. 48
99. 63
45
271
0. 37
100. 00
10
Fr e c u e n c i a s r e l a t i v a s
ECP F .
20
30
I V t r i me s t r e 1 9 9 1
.078947
Fraction
0
3000
39990
salarios base 1983
Grfica 19
.102424
Fraction
0
4000
A M
68992
salarios base 1986
Grfica 20
.101049
Fraction
0
117000
176900
A=M
salarios base 1992
x=
X
i =1
n1
n2
n3
Xp
np
x=
n
i =1
Xi
1
48
48
2
30
78
3
15
93
4
4
97
5
0
97
6
3
100
x=
48 1 + 30 2 + 15 3 + 4 4 + 0 5 + 3 6
=1,87
48 + 30 + 15 + 4 + 0 + 3
x=
Mediana = Linferior
n
N inferior
2
+
amplitud
nintervalo
donde:
observaciones.
N inferior = frecuencia acumulada hasta el intervalo anterior al que contiene
la mediana.
4609
1991
Mediana = 8 + 2
6 = 8,8
2422
Propiedades de la media
(1) Como estadstico de posicin central la media tiene como principal
caracterstica la siguiente:
n
( X
i =1
x )=0
xc+ X =
(c+ Xi )
i =1
i =1
i =1
c + Xi
n
nc + Xi
i =1
=c+
X
i =1
=c+ x
x cX =
c X
i =1
c Xi
i =1
= cx .
xw =
w X
i
i =1
i =1
Si, por ejemplo, las observaciones de una variable se ponderan por sus
frecuencias relativas: wi = ni n , es decir, por la importancia relativa de cada
valor en la distribucin, se tendra (suponiendo p valores distintos):
p
xw =
i =1
ni
i =1 n
ni
nX
n X
i
i =1
n
i =1
n X
i =1
x=
x=
0,60
(x1,rural + x2,rural + K + xn,rural ) + 0,40 (x1,urbana + x2,urbana + K + xn,urbana )
n
nurbana
x w = rural
=
0,60
0,40
n rural
+ nurbana
n rural
nurbana
=
0,60
(x1,rural + x2,rural + K + xn,rural )+ 0,40 (x1,urbana + x2,urbana + K + xn,urbana ) =
n rural
nurbana
+ x 2,urbana + K + x n ,urbana
x
+ 0,40 1, urbana
nurbana
xw =
w X
i
i =1
w
i =1
5 X 1 + 5 X 2 + 5 X 3 +... +5 X 20 X 1 + X 2 + X 3 +... + X 20
=
20 5
20
Clase 1
Variable:
Clase 2
70
80
90
95
x=
X
i =1
xw =
w X
i
i =1
w
i =1
__X1____X2__X3_____X4_________X5_ x X6_______________________X7____
_
ice =
Grfica 1
EEINMIDPOINT
-3.75
-1.25
1.25
3.75
6.25
8.75
11.25
13.75
16.25
18.75
21.25
23.75
26.25
28.75
31.25
33.75
36.25
38.75
41.25
43.75
46.25
0
2000
4000
6000
8000
10000
12000
FREQ.
CUM.
FREQ.
PCT.
CUM.
PCT.
0
0
13357
5562
1323
449
180
90
42
18
14
8
9
7
0
2
2
0
2
1
0
0
0
13357
18919
20242
20691
20871
20961
21003
21021
21035
21043
21052
21059
21059
21061
21063
21063
21065
21066
21066
0.00
0.00
63.41
26.40
6.28
2.13
0.85
0.43
0.20
0.09
0.07
0.04
0.04
0.03
0.00
0.01
0.01
0.00
0.01
0.00
0.00
0.00
0.00
63.41
89.81
96.09
98.22
99.07
99.50
99.70
99.79
99.85
99.89
99.93
99.97
99.97
99.98
99.99
99.99
100.00
100.00
100.00
14000
FREQUENCY
Cuadro 2
Media
Medias cortadas
2.6010
Observaciones suprimidas
(en cada cola):
1
2
3
10
105
2.5992
2.5974
2.5957
2.5867
2.5219
g = n X 1 X 2 ... X n
Si se emplea la notacin para valores agrupados segn su frecuencia, la
media geomtrica se define como:
x[ t , t 1] =
X t X t 1
X t 1
X t = ( 1 + x[ t , t 1] ) X t 1
denominndose a 1 + x[ t , t 1] factor de variacin unitaria.
La relacin entre el ltimo valor, XT, y el primero, X0 , se puede obtener si
sustituimos de manera recurrente:
X T = ( 1 + x[ T , T 1] ) X T 1 = ( 1 + x[ T , T 1] ) (1 + x[ T 1, T 2 ] ) X T 2 =... =
= ( 1 + x[ T , T 1] ) ( 1 + x[ T 1, T 2 ] )...(1 + x[ 2 , 1] ) ( 1 + x[1, 0] ) X 0
Si quisiramos definir una tasa media de variacin, x[ TMV ] , sta debera
satisfacer tambin la anterior relacin:
x[ TMV ] = T
XT
1
XO
Horas
Trabajada
s
43088
43387
42222
Tasa de
variacin
0,0069
-0,0268
Factor de
variacin
unitaria
1,0069
0,9731
1990
40453
-0,0419
0,9581
1991
33936
-0,1611
0,8389
1992
32126
-0,0533
0,9467
Media Geomtrica (factores de variacin unitaria): 0,057
Media Aritmtica (tasas de variacin): -0,055
x[ TMV ] = T
XT
1
XO
En nuestro caso:
x[TMV ] =5
32126
1 = 0,057
43088
r[ t , t 1] =
p t p t 1
,
p t 1
t = 1,...,12.
Cuadro 4
Mes
1
2
3
4
5
6
7
8
9
10 11 12
Rentabilida
-0,13 0,00 0,29 0,06 0,19 -0,03 0,05 0,04 0,00 0,04 0,00 0,04
d
Grfica 2
FREQUENCY
200
190
180
170
160
150
140
130
120
110
100
90
80
70
60
50
40
30
20
10
0
Grfica 3
FREQUENCY
3000
2000
1000
Grfica 4
FREQUENCY
300
200
100
Media
-4
101
-212
Mediana
-4,3
71
-62
Con los siguientes siete datos (ya ordenados de menor a mayor): 9, 23,
25, 28, 32, 47 y 50, obtendremos los tres cuartiles. El primer cuartil es igual a 23
(el valor en el lugar 8 4 = 2 ); el segundo cuartil es 28 (ocupa la posicin
99 n 10 0 .
Dadas las definiciones anteriores, en el cuadro 6 se ofrecen las obvias
equivalencias de definicin entre cuartiles y percentiles.
Cuadro 6
Mediana = Segundo Cuartil = 50 Percentil
Primer Cuartil = 25 Percentil
Tercer Cuartil = 75 Percentil
Renta p.c.
disponible
Renta mnima
0
5
270903
10
345497
15
403034
20
454221
25
501457
30
542498
35
585791
40
631359
45
681373
50
732524
55
781361
60
839756
65
904918
70
974001
75
1061552
80
1173166
85
1322099
90
1544322
95
1992821
Renta mxima
168572662
Fuente: Pena et al. (1996)
Grfica 5
percentiles
90
80
70
60
50
40
30
20
10
0
0
200000
400000
600000
800000
1000000
1200000
1400000
1600000
1800000
2000000
Renta p.c.
0<
C
<1 ,
Y
Cuadro 8
Grupos
Ingresos
segn
medios
cuartiles
(millones de
ptas)
1,3
Primero
Segundo
2,0
Tercero
2,8
Cuarto
4,6
Total
2,7
consumo
/
ingresos
%
75,2
67,1
64,4
55,3
62,2
Puede comprobar que a medida que los ingresos crecen el cociente entre gasto e
ingresos, mantenindose siempre inferior a la unidad, disminuye. El consumo representa
un 75,2% de los ingresos de las familias con menos ingresos, mientras que nicamente
supone el 55,3% de los ingresos de las familias situadas en la escala ms alta de riqueza.
empleo, entre 1969 y 1989, para los varones casados. Puede comprobar que
cuanto menores son los ingresos mayores han sido el crecimiento del paro y la
disminucin de los salarios. Por el contrario, en los percentiles superiores, tanto
el empleo como los ingresos salariales han aumentado. Cmo responde la oferta
de trabajo de la familia a esta situacin?
Grfica 6
,2
,1
,0
-,1
-,2
-,3
10
20
30
40
50
60
70
80
90
100
80
90
100
Grfica 7
,0
0,0
,0
,0
-,1
-,1
-,1
-,1
-,1
-,2
10
20
30
40
50
60
70
4
3
2
1
1969
0
1989
10
20
30
40
50
60
70
Grfica 9
80
90
100
1200
1000
800
600
400
1969
200
1989
10
20
30
40
50
60
70
80
90
100
Rango IQ = Q3 Q1
La varianza es el promedio de las desviaciones de la variable con respecto
a la media:
s x2 =
(X
i =1
x)2
sx =
(X
i =1
x)2
CV =
sx
x
.36
.36
0
-10.3137
10
-10.3137
10
(2)
sc2+ x =
(c + X i (c + x )) 2
i =1
(X
i =1
x)2
= s x2
sc2x =
(c X i c x ) 2
i =1
c2 ( X i x)2
i =1
sc x = c s x
c2 ( X i x ) 2
i =1
= c 2 s x2
(5) La
varianza
puede
escribirse
de
manera
equivalente
como:
s x2 =
X
i =1
2
i
i =1
i =1
n
i =1
n
i =1
( X i x ) 2 = ( X i2 + x 2 2 X i x ) = X i2 +n x 2 2 x X i =
= X i2 + n x 2 2 n x 2 = X i2 n x 2
i =1
i =1
( X i x)2
s x2 = i =1
X i2 n x 2
= i =1
X
i =1
2
i
x 2
( X
i =1
x)
<
( X
i =1
k )2
Ejemplo 11. Con los siguientes datos: {9, 23, 25, 28, 32, 47, 50}
calcularemos las diversas medidas de dispersin:
s x2 =
X
i =1
i
1
2
3
4
5
6
7
x 2
Xi2
81
529
625
784
1024
2209
2500
Xi
9
23
25
28
32
47
50
X i = 214
i =1
i =1
x=
2
i
X
i =1
2
i
= 7752
= 30,571
X
i =1
2
i
= 1107,43
s x2 =
X
i =1
2
i
x 2 = 172,84
sx =
(X
i =1
x)2
= 172,84 = 13,147
Y el coeficiente de variacin:
CV =
s x 13,147
=
= 0,43
x 30,571
Percentil 75
Mediana
Percentil
25
Regin
1
235
100
62
Regin
2
290
100
72
Cuadro 9
i
1
2
3
4
5
6
7
Xi
2,7
1,2
3,45
4,03
4,32
5,4
3,5
Xi2
7,29
1,44
11,9025
16,2409
18,6624
29,16
12,25
X
i =1
= 24,6
i =1
x=
Xi
i =1
2
i
= 96,9458
= 3,514
i =1
2
i
= 13,85
s x2 =
X
i =1
2
i
x 2 = 1,50
Cuadro 10
X1
X2
2,7
270
1,2
120
3,45
345
4,03
403
4,32
432
5,4
540
3,5
350
Media
3,514286
351,4286
Desviacin Estndar
1,322521
132,2521
Grfica 11
1
1
Grfica 12
500
400
300
200
100
1
Desviaci Coeficiente
n
de
Alemana
Britnica
Espaola
Nrdicos
estndar
22
30
31
36
60
75
60
75
variacin %
36,67
40
51,67
48
Y=
La
Y =
nueva
variable
X 5
10
tambin
puede
expresarse
como:
5 1
+ X , presentndose como la variable original multiplicada por
10 10
y=
Y 10 + 10 X
i
i =1
i =1
n
5
1
n +
Xi
X
5 1 i =1 i
10 i =1 10
=
= +
=
n
10 10 n
5 1
5 1
= + x = + 10 = 0,5
10 10
10 10
n
s =
2
Y
(Y y )
i =1
5 1
5 1
+ X i + x
10 10
10 10
i =1
=
=
n
n
1
1
(X i x )
10
= 10
= i =1
n
1 2
=
9 = 0,81
100
n
(X
i =1
x )
10 5 X
Y=
4
y=
10 5
10 5
x = 10 = 10
4 4
4 4
Y la desviacin estndar:
5
5
sY = s X = 9 = 11,25
4
4
Ejemplo 17. Distribucin de los ingresos en las Comunidades
Autnomas. En el cuadro 11 aparecen la media, desviacin estndar, y
coeficiente de variacin (en porcentaje) de la renta per capita de las
Comunidades Autnomas en 1990/1991 (se excluyen Ceuta y Melilla.
Fuente: Pena, 1996, pgs. 502-503). Las comunidades han sido
ordenadas en funcin del valor de su desviacin estndar. La dispersin
de la renta sera utilizada como una medida de desigualdad: cuanto
mayor es la dispersin, mayores diferencias se darn en los ingresos. En
el cuadro 12 se muestran las posiciones (de mayor a menor: 1 indica la
cifra ms alta, 17 la cifra ms baja) que toman las Comunidades segn
se ordenen por su renta, su desviacin estndar o su coeficiente de
variacin.
Como medida de dispersin podemos utilizar la desviacin estndar, pero
tambin el coeficiente de variacin. La desviacin estndar se relativiza al
ponerla en relacin con la media. Los coeficientes de variacin que se recogen en
el cuadro 11 indican que la desviacin estndar de la Comunidad extremea es
0,76 veces su media (o en porcentaje, el 75,90%), la de Catalunya 0,72 veces su
media, la de Madrid 1,85 y la de Castilla-La Mancha 3,96.
Cuadro 11
x
Extremadura
Asturias
Cantabria
Canarias
Navarra
Com. Valenciana
Baleares
Castilla-Len
Aragn
Rioja
Galicia
Catalunya
Pas Vasco
Murcia
Andaluca
Madrid
Castilla- La Mancha
659507
892325
829755
767552
1051310
833886
975140
866326
843630
870680
797931
1091739
990671
787525
744389
1130089
724065
sx
500588
535773
548971
556265
610642
612423
630351
654448
659440
674107
732694
795740
827134
961635
1082408
2099119
2868372
Cuadro 12
Navarra
Asturias
Baleares
Cantabria
Canarias
Catalunya
Com. Valenciana
Castilla-Len
Extremadura
Rioja
Aragn
Pas Vasco
Galicia
Murcia
Andaluca
Madrid
Castilla- La Mancha
CV 100
75,90
60,04
66,16
72,47
58,08
73,44
64,64
75,54
78,17
77,42
91,82
72,89
83,49
122,11
145,41
185,75
396,15
sx
CV 100
3
6
5
11
14
2
10
8
17
7
9
4
12
13
15
1
16
13
16
11
15
14
6
12
10
17
8
9
5
7
4
3
2
1
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Cuadro 13
x
sx
s x2
CV 100
Pensionistas Asalariados
1375919,81 1872897,97
393701,38 900167,565
1,550E+11
8,103E+11
28,6137
48,0628
Profesionales Empresarios
2221962,38 2067427,89
1471118,41 1279698,30
2,164E+12
1,638E+12
66,2081
61,8981
Cuadro 14
Perodo
Grfica 13
60,00
40,00
20,00
0,00
1
10 11 12
10 11 12
-20,00
-40,00
-60,00
Grfica 14
60,00
40,00
20,00
0,00
-20,00
-40,00
-60,00
Indicede Sharpe =
ER
donde:
Cuadro 15
Fondo de Inversin
Mobiliario
AB Fondo
Fondonorte
BSN Acciones
ndice de
Sharpe
0,07142
0,03420
0.02936
Clasificaci
n
1
2
3
2,79
2,71
2,93
1,93
1,91
9,50
Mutuafondo
Baskinver
BSN Renta Fija
Fondpostal
Segurfondo Divisas
AB Ahorro
BK Fondo
0.02379
0.00604
-0.00947
-0.00975
-0.01193
-0.01309
-0.02220
4
5
6
7
8
9
10
2,69
2,66
2,63
2,62
2,54
2,63
2,61
1,76
1,80
2,61
3,57
2,53
1,87
1,89
coeficiente de variacin
Q90/Q50
Q50/Q10
2.7
2.56
2.5
2.43
2.35
1.6
1.56
1.58
1.5
1.5
.9819
.9027
.8281
.7818
.5
1983
1986
1989
1992
periodo
que en los ltimos aos del perodo analizado la convergencia del PIB
per capita prcticamente se haba detenido.
Cuadro 16
Ao
sx x
1950
1951
1952
1953
1954
1955
1956
1957
1958
1959
1960
1961
1962
1,0000
0,9598
0,9491
0,9331
0,9004
0,8942
0,8879
0,8600
0,8257
0,8326
0,8204
0,7896
0,7828
Ao
sx x
Ao
sx x
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
0,7616
0,7545
0,7458
0,7349
0,7194
0,7071
0,6896
0,6634
0,6511
0,6273
0,6116
0,5966
0,5799
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
0,5753
0,5807
0,5840
0,5841
0,5806
0,5874
0,5700
0,5870
0,6037
0,6037
0,6146
0,6116
0,6091
Grfica 16
1,1
1,0
,9
Sigma-convergencia
,8
,7
,6
,5
88
19
86
19
84
19
82
19
80
19
78
19
76
19
74
19
72
19
70
19
68
19
66
19
64
19
62
19
60
19
58
19
56
19
54
19
52
19
50
19
CierreApertura
-0,1933
-0,0457
-0,1670
-0,0522
-0,0424
AperturaCierre
0,0015
0,1578
0,0863
0,2733
0,2617
Cierre-Cierre
-0,1908
0,1127
-0,0803
0,2235
0,2192
Grfica 17
,3
,2
,1
Rendimiento medio
,0
-,1
-,2
cierre-apertura
apertura-cierre
-,3
cierre-cierre
lunes
martes
mircoles
jueves
viernes
Grfica 18
,7
,6
,5
,4
Desviacin Estndar
,3
Lunes
,2
Martes
Mircoles
,1
Jueves
0,0
11,00
Viernes
11.30
HORA
12.00
12.30
13.00
13.30
14.00
14.30
15.00
15.30
16.00
16.30
17.00
1
k2
x=
Y su desviacin estndar:
i =1
182
= 26
7
sx =
X
i =1
2
i
x2 =
4744
26 2 = 1,31
7
28,62
26 2 1,31 =
23,38
Por lo que puede considerarse que no hay observaciones
extremas.
Ejemplo 24. Dispersin de los ingresos. En el cuadro 19 se
recogen los ingresos anuales (en euros) de tres colectivos (pensionistas,
asalariados y empresarios). Empleando la desigualdad de Chebychev
calcularemos para cada colectivo el intervalo que comprendera, como
mnimo, el 75% de las observaciones.
Cuadro 19
sx
Pensionista
Empresario
Asalariados
s
s
9735
12236
13150
2300
5400
5537
23036
12236 2 5400 =
1436
Cadena A
160
159
158
160
159
158
160
Cadena B
158
157
150
150
157
156
158
Cadena C
170
150
159
180
150
140
170
Cadena D
160
158
157
156
158
149
160
Cadena E
149
150
152
157
158
159
160
x=
X
i =1
5502
= 157,2
35
Y la desviacin estndar:
n
sx =
X
i =1
2
i
x2 =
866546
157,2 2 = 6,828
35
171
157,2 2 6,828 =
143
Grfica 19
Grf ica de control: DEFECTOS
190
180
170
160
150
Lmit e Sup.
Promedio
140
Lmit e I nf .
130
DEFECTOS
A A A A A A A B B B B B B B C C C C C C C D D D D D D D E E E E E E E
Lmit es basados en la regla de Cheby chev
Grfica 20
20
19
10
18
-10
N=
25
DIAGRAMA DE CAJA
Grfica 21
4
999
-2
465
998
792
-4
N=
Grfica 22
1000
10
2427
2756
4930
8
947
178
4620
4888
6907
1136
4446
9634
8577
5871
3061
5475
9861
5755
699
7988
4678
6685
5646
8710
932
4499
218
7088
9292
7989
3980
5219
7792
6445
7619
7643
6870
5673
8334
2899
5562
1023
1891
259
3773
7343
8682
5413
927
6608
3314
236
5185
2441
688
313
4431
2977
275
2974
8979
2258
8443
7742
7698
4688
262
7650
7030
1160
5536
3350
1145
5803
1337
9308
466
4617
8655
5557
845
1728
6814
1077
6048
6059
2887
3844
929
1473
8725
9835
91
2
5
7330
3130
4246
411
8718
6259
6722
4105
6020
238
8813
1361
4408
6317
35
8185
1805
1040
2995
3950
3003
5806
7520
7182
9996
2011
2576
4916
5801
5087
8907
6236
4358
67
5279
3049
6030
6396
926
3473
7536
6963
6765
6990
5583
8048
8890
3527
3798
3999
2395
3486
8540
4081
6107
8832
3682
9622
5410
1960
9198
7736
7539
9004
4487
1611
9340
9521
9984
5954
9925
8490
4812
5770
6934
6700
9018
9714
9615
1552
7489
3547
5624
6734
1738
3894
6897
3638
9489
8435
999
8151
2163
4360
3240
5834
2333
7978
2935
5942
7100
5376
7042
5104
1420
9285
3294
6592
1448
4239
8800
2185
3302
8498
8881
5085
1398
1970
5049
9770
5592
5617
4041
5448
4595
1058
3371
7440
4118
5092
4521
5074
2948
4185
1445
1334
9680
243
18
5186
3675
1291
7931
8075
6196
9095
9927
5875
9483
8946
2106
7712
7380
7117
6953
1435
6485
9689
7355
9700
3136
420
2077
1749
6754
7661
1924
9300
5716
7141
3483
7071
6433
8336
414
471
6489
3976
7865
9554
7862
4285
7773
855
21
2002
8918
8960
9829
2070
9404
4107
8066
8326
804
6366
2472
6834
8627
6151
6820
6551
4661
6735
8683
763
8594
4870
7079
4749
6239
1839
9822
8686
1653
4582
6093
3984
945
4816
6621
707
1641
4722
7458
5788
9906
5900
5865
2693
4997
482
1109
7438
5275
1229
9226
5843
872
9609
7820
7522
1393
5155
89
2424
6397
4946
9805
3911
6017
5619
5899
1462
6193
8542
8300
4296
9209
7699
4078
5732
2602
8822
5502
4865
3282
8654
5861
4123
7455
3884
8643
4111
2101
7172
2318
1676
1428
7572
4949
2929
4438
83
1864
5645
7854
541
1698
2867
3100
578
9563
7715
7246
136
5128
7305
4300
9215
5982
6561
5195
9491
944
1356
7168
7540
5077
167
7447
76
8615
8706
9085
3769
1055
4440
8790
2153
2450
6757
5796
2835
4412
968
571
9237
108
6125
4019
9902
170
1261
6618
7492
5582
4312
8082
7868
3310
8503
1670
5210
4724
6859
7972
3043
2715
-2
N=
10000
X3
Grfica 23
10
-10
239
136
21
707
730
763
555
571
108
482
243
266
471
167
83
466
76
91
414
238
262
5
926
845
927
67
35
259
929
313
236
218
275
688
178
932
699
947
-20
N=
1000
X5
8 1,5 (36 8) = 34
36 + 1,5 (36 8) = 78
Ejemplo 27. En la grfica 24 se reproduce el diagrama de caja
correspondiente a los siguientes datos {9, 23, 25, 28, 32, 47, 50}.
En un ejemplo anterior ya se haban obtenido los valores de los
tres cuartiles: 23, 28 y 47. Estos valores definiran la altura del rectngulo
(el rango intercuartlico es 24) y la posicin de la mediana. Se declararan
observaciones atpicas las que superaran 1,5 veces el rango
intercuartlico. Al restar esa cantidad (36) al primer cuartil y sumrsela al
tercer cuartil se obtienen valores (13 y 83) que superan el mnimo y
mximo de la variable. No existen, por tanto, observaciones extremas y
las prolongaciones de la caja llegan al mnimo y mximo de la variable.
Grfica 24
60
50
40
30
20
10
0
N=
Empresario
s
12404
12633
6681
Grfica 25
ingresos
45000
343
Pension.
Asalaria.
Profes.
Empres.
Cuadro 22
pas
Alemania
Australia
Austria
Blgica
Canad
Dinamarca
Espaa
Finlandia
Francia
Grecia
Holanda
Irlanda
Islandia
Italia
Japn
Luxemburgo
N. Zelanda
Noruega
Portugal
Reino Unido
Suecia
Suiza
Turqua
EEUU
Grfica 26
67,25
52,03
53,27
66,59
63,17
31,76
48,57
58,81
18,97
63,50
31,22
50,05
47,23
29,91
75,18
75,13
50,10
20,77
67,85
67,26
97,20
17,43
100
73,07
75,63
74,59
86,86
75,73
53,66
75,53
79,13
33,83
72,77
49,14
76,22
73,20
80,63
91,16
61,86
73,27
38,24
72,56
77,16
95,85
23,36
100
120
100
EEUU
80
60
40
Portugal
Grecia
Turqua
20
0
N=
24
24
Grfica 27
precio ptas
198967
98281.8
airtours cosmos
firtst ch
thomas co
thomson
virgin
Grfica 28
total def pc/da
42110.8
800.974
una vez
dos veces
tres vece
4 o ms v
( X
i =1
x)
n
en tanto que define un promedio de las desviaciones de la variable con respecto
al valor medio. En el caso de que se dieran muchas observaciones por encima de
la media se esperara un valor positivo, mientras que una mayor proporcin de
valores por debajo de la media proporcionara un valor negativo. Es posible que
ya se haya dado cuenta de que esta propuesta, si no se modifica, es inservible,
( X
n
i =1
x)= 0 .
m3 =
( X
i =1
x)3
m3 =
n (X
i =1
x)3
g1 =
m3
s x3
g1 = 0 : Simetra.
g1 > 0 : Asimetra positiva o por la derecha.
g1 < 0 : Asimetra negativa o por la izquierda.
AS =
x Moda
sx
AS = 0 , la distribucin es simtrica.
AS > 0 , la distribucin es asimtrica por la derecha.
AS < 0 , la distribucin es asimtrica por la izquierda.
Curtosis =
(X
i =1
x)4 / n
s
4
x
m4
s x4
m4 = 3 s x4
Grfica 29
.089626
.089626
Histogramas Normal
Grfica 30
.057
0
-.1
2.6
Grfica 31
.08
0
-2.38555
5.84201
Grfica 32
.1403
0
-16.758
16.5001
Grfica 33
.1142
0
-7.59041
8.28189
g2 =
m4
3
s x4
Xi
ni
X i ni
X i x
( X i x ) 2
( X i x )2 n i
( X i x )3 ni
0
1
2
3
4
4
5
2
2
1
0
5
4
6
4
-1,36
-0,36
0,64
1,64
2,64
1,84
0,13
0,41
2,70
6,98
7,37
0,64
0,83
5,40
6,98
-10
-0,23
0,53
8,87
18,46
n=14
X n =19
i =1
( X x) n =21,21 ( X x ) n =17,63
i =1
x =1,357
sx =
(X
i =1
x ) ni
2
21,21
=1,231
14
i =1
g1 =
m3 17,63 14
=
= 0,67
s x3 (1,231)3
Xi
ni
X i ni
X i x
( X i x )2 n i
( X i x )4 n i
0
1
2
3
4
4
5
2
2
1
0
5
4
6
4
-1,36
-0,36
0,64
1,64
2,64
7,37
0,64
0,83
5,40
6,98
13,57
0,08
0,34
14,57
48,79
n=14
X n =19
i =1
x =1,357
p
sx =
(X
g2 =
i =1
i =1
i =1
x ) ni
2
21,21
=1,231
14
m4
77,35 14
3=
3 = 0,59
4
sx
(1,231)4
Cuadro 25
Variacin
ndice de
sx
Mnimo
Mximo
Asimetra
Curtosis
ndice de
ocupaci
n
219
0,009
0,136
-0,381
0,452
0,351
0,60
Grfica 34
40
30
Frequency
20
10
-40
-20
0
20
Variacin ndice de ocupacin
40
ocupacin es elevado.
El coeficiente de asimetra est cercano a cero, coincidiendo
Grfica 35
nacionalidad espaola
70
60
50
40
30
Frecuencia
20
10
0
10,0
50,0
30,0
90,0
70,0
130,0
110,0
170,0
150,0
210,0
190,0
Grfica 36
.174051
Fraction
0
-70
-50
-30
-10
10
30
50
70
90
ARGENTINA, rendimientos mensuales
110
130
150
170
Grfica 37
.223881
Fraction
0
-30
-10
10
EEUU, rendimientos mensuales
30
50
Cuadro 26
Pas
Argentina
Brasil
Chile
Colombia
Grecia
India
Jordania
Malasia
Mjico
Nigeria
Paquistn
Filipinas
Portugal
Corea del Sur
Taiwan
Tailandia
Turqua
Venezuela
Zimbaue
Media
aritmtica
(%)
56.8
42.6
32.2
32.7
21.6
11.7
5.9
17.3
29.2
32.6
14.7
23.4
15.7
6.6
30.4
20.5
41.9
23.9
25.4
Media
Desviacin Asimetr
geomtric
Curtosis
estndar
a
a (%)
27.2
87.9
3.32
20.22
22.1
63.9
0.25
1.09
28.2
27.6
0.28
-0.07
28.0
31.5
1.63
4.14
14.0
41.2
1.76
6.33
6.3
33.8
0.72
1.11
4.6
15.9
0.17
1.53
13.9
25.2
-0.86
2.79
17.2
45.4
-1.01
5.41
18.1
52.3
1.49
19.64
11.1
27.4
1.23
4.27
17.7
34.1
0.67
3.69
9.0
39.2
2.35
12.91
2.8
28.0
0.59
0.42
17.2
52.4
0.59
1.45
15.0
32.7
-0.19
1.81
19.7
70.5
0.97
1.04
12.9
46.9
0.25
2.23
21.0
29.3
0.02
1.25
Cuadro 1
B1 B2
A1 n11 n12
A2 n21 n22
AI nI1 nI2
BJ
n1J
n2J
nIJ
ni . = nij ,
j =1
n. j = nij
i =1
Cuadro 2
n11 n12
n21 n22
nI1 nI2
n1J
n2J
nIJ
Distribucin
marginal de
A
n1.
n2.
nI.
n.1
n.J
B1
A1
A2
AI
Distribucin
marginal de
B
B2 BJ
n.2
B2 BJ
Distribucin
marginal de
A
A1
n1J
n11 n12
K
n n
n
n1.
n
A2
n2 J
n21 n 22
K
n n
n
n2.
n
M
M K M
n IJ
n I1 n I 2
K
n n
n
M
nI .
n
n.1 n.2
n. J
K
n n
n
AI
Distribucin
marginal de
B
B2
BJ
A1
n
n11 n12
K 1J
n1. n1.
n1.
A2
n 21 n 22
n 2. n 2.
AI
nI1
nI .
Distribucin
marginal de
B
n 21
n 2.
M K M
nI 2
n IJ
nI . K
nI .
n.1 n.2
n
K .J
n n
n
M
1
(iv) Perfiles columna. Muestra las frecuencias relativas de cada una de las celdas
con respecto al total de las columnas (cuadro 5).
Cuadro 5
B1 B2
A1
A2
AI
Distribucin
BJ marginal de
A
n
n11 n12
K 1J
n.1 n.2
n. J
n1.
n
n
n21 n22
K 2J
n.1 n.2
n. J
M
M K M
n
nI1 nI 2
K IJ
n.1 n.2
n. J
n2.
n
M
nI .
n
Totales
230
220
160
610
Totales
34,92
9,67
6,23
14,59
3,93
3,77
4,10
22,79
100,00
Grfica 1
15,00
10,00
5,00
ms 500
100 a 499
20 a 99
0,00
1
20/99
21,74
5,65
Alimentacin
Confeccin
Madera
Papel
Minerales
Construccin
Totales
6,09
14,35
8,70
3,91
4,78
34,78
100,00
6,82
21,82
1,36
4,55
4,09
14,09
100,00
5,63
5,00
0,63
2,50
3,13
17,50
100,00
6,23
14,59
3,93
3,77
4,10
22,79
100,00
88
25
16
34
163
524
143
148
211
1026
36
8
8
19
71
97
37
48
39
221
395
100
167
212
874
593
182
233
249
1257
358
120
102
118
698
200
94
90
115
498
520
148
157
181
1006
2812
856
968
1178
5814
Cuadro 11
zona 1 zona 2 zona 3 zona 4 zona 5 zona 6 zona 7 zona 8 zona 9 Totales
No
S, prx.aos
S, jubilacin
NS/NC
Totales
3,13
2,92
1,65
2,89
2,80
18,63
16,71
15,29
17,91
17,65
1,28
0,93
0,83
1,61
1,22
3,45
4,32
4,96
3,31
3,80
14,05
11,68
17,25
18,00
15,03
21,09
21,26
24,07
21,14
21,62
100
100
100
100
100
Cuadro 12
zona 1 zona 2 zona 3 zona 4 zona 5 zona 6 zona 7 zona 8 zona 9 Totales
53,99
S, prx.aos 15,34
S, jubilacin 9,82
NS/NC
20,86
Totales
100
No
51,07
13,94
14,42
20,57
100
50,70
11,27
11,27
26,76
100
43,89
16,74
21,72
17,65
100
45,19
11,44
19,11
24,26
100
47,18
14,48
18,54
19,81
100
51,29
17,19
14,61
16,91
100
40,16
18,88
18,07
23,09
100
51,69
14,71
15,61
17,99
100
48,37
14,72
16,65
20,26
100
Chi-Cuadrado y C de contingencia
48,37
S, prx.aos 14,72
S, jubilacin 16,65
NS/NC
20,26
Totales
100
No
48,37
14,72
16,65
20,26
100
48,37
14,72
16,65
20,26
100
48,37
14,72
16,65
20,26
100
48,37
14,72
16,65
20,26
100
48,37
14,72
16,65
20,26
100
48,37
14,72
16,65
20,26
100
48,37
14,72
16,65
20,26
100
48,37
14,72
16,65
20,26
100
48,37
14,72
16,65
20,26
100
79
24
27
496
151
171
34
10
12
107
33
37
423
129
145
608
185
209
338
103
116
241
73
83
487
148
167
2812
856
968
NS/NC
Totales
33
163
208
1026
14
71
45
221
177
874
255
1257
141
698
101
498
204
1006
1178
5814
e11 =
2812
163 = 79
5814
e12 =
2812
1026 = 496
5814
; ...
e21 =
856
163 = 24
5814
e22 =
856
1026 = 151
5814
; ...
2 =
(n
ij
i =1 j =1
eij
eij
i =1 j =1
(n
ij
eij
eij
(n
ij
eij
eij
1,1
0,0
4,6
0,0
1,6
0,4
3,1
0,0
0,1
0,6
1,2
1,5
0,9
0,6
3,4
0,7
1,8
6,4
3,1
6,9
0,4
0,1
2,6
0,1
1,3
2,9
1,8
3,9
7
5,7
0,6
1,9
2,3
0,0
0,7
2,5
C=
2
n+2
(I 1)
1
,
mn(I , J )
mn (I , J ) 2
Cuadro 16
Unipersonal:
No
S
Totales
Zona:
Rural Urbana
9070
9840
1065
1091
10135
10931
Totales
18910
2156
21066
Cuadro 17
Unipersonal:
No
Zona:
Rural
Urbana
48%
52%
89,5%
90%
43,1%
46,7%
Totales
89,8%
49,4%
10,5%
5,1%
48,1%
S
Totales
50,6%
10%
5,2%
51,9%
10,2%
Cuadro 18
Zona:
Unipersonal:
No
S
Rural
Urbana
18910
10135 = 9097,73
21066
2156
10135 =1037,27
21066
18910
10931= 9812,27
21066
2156
10931=1118,7
21066
10135
10931
Totales
Totales
18910
2156
21066
9812,27
1037,27
1118,7
= 1,59
C=
2
1,59
=
= 0,0087
2
21066 + 1,59
n+
Lambda
Cuadro 19
mayores de 60 aos:
No
S
Totales
Zona:
Rural
Urbana
5318
6726
4817
4205
10135
10931
Totales
12044
9022
21066
Zona:
Rural
Urbana
44,2%
55,8%
53,4%
46,6%
48,1%
51,9%
Totales
100%
100%
100%
Cuadro 20
mayores de 60 aos:
No
S
Totales
10135 9523
= 0,06038
10135
=
donde:
Cuadro 21
Categora socioeconmica del sustentador principal (SP):
Nivel de
estudios
del SP:
1
2
1
259
4,8
33,2
1,2
489
383 247
7,0
4,5
50,6 11,7
1,8
1,2
345 1434
4
3
0,1
0,2
0,0
228
44 3500
0,8 64,2
26,3 44,8
0,2 16,6
98 3693
Totales
5450
25,9
11602
Totales
4,2
62,7
2,3
22
1,1
2,8
0,1
6
0,6
0,8
0,0
4
0,4
0,5
0,0
780
3,7
3,0 12,4
45,6 67,9
1,6
6,8
22
253
1,1 12,3
2,9 12,0
0,1
1,2
6
78
0,6
7,4
0,8
3,7
0,0
0,4
1
99
0,1 10,9
0,1
4,7
0,0
0,5
757 2111
3,6 10,0
2,0
14,4
1,1
276
13,5
17,4
1,3
506
48,1
31,9
2,4
573
62,9
36,1
2,7
1586
7,5
15,8
58,5
8,7
751
36,6
24,0
3,6
191
18,2
6,1
0,9
99
10,9
3,2
0,5
3125
14,8
28,0 2,0
74,6 64,2
15,4 1,1
402
13
19,6 0,6
9,2
3,6
1,9
0,1
51
3
4,9
0,3
1,2
0,8
0,2
0,0
12
2
1,3
0,2
0,3
0,5
0,1
0,0
4362 366
20,7 1,7
0,8 31,8
58,7 47,3
0,5 17,5
16
297
0,8 14,5
9,6
3,8
0,1
1,4
7
203
0,7 19,3
4,2
2,6
0,0
1,0
2
119
0,2 13,1
1,2
1,5
0,0
0,6
167 7812
0,8 37,1
55,1
2052
9,7
1051
5,0
911
4,3
21066
variable dependiente:
1
2
3
19
20
1
10
20
10
1
20
19
30
60
30
Totales
40
40
40
120
ingresos
4
3
2
5
2
10
9
4
1
Cuadro 24
individuo edad
5
1
2
2
3
3
1
4
4
5
6
6
9
7
8
8
7
9
ingresos
2
3
2
4
5
10
1
4
9
relacin se invierte en la segunda variable. As, el par formado por los casos 5 y 9
sera discordante, al tomar el individuo 9 un valor mayor en la variable edad,
pero un valor menor en los ingresos. Los individuos 2 y 3, por ejemplo, seran
tambin un par discordante al invertirse el orden de los valores en las dos
variables.
En el caso de que los valores de una o ambas variables coincidieran el
par no se considerara ni concordante ni discordante. El par 5, 3, por ejemplo,
sera un par igualado, ni concordante ni discordante, al tomar el mismo valor en
la variable ingresos.
Un par de observaciones se considera como un par concordante si los
valores que toma una de las observaciones en las dos variables son mayores que
los que toma la otra observacin. Un par de observaciones se considera como un
par discordante si los valores que toma una de las observaciones en una de las
variables son mayores que los de la otra observacin, pero esa relacin se invierte
en la segunda variable. En el caso de que los valores de una o ambas variables
coincidieran, el par se considerara como un par igualado.
1
A
D
G
Y
2
B
E
H
3
C
F
I
Y
2
A E + AF + A H + A I
Y
2
BF + BI
Cuadro 28
X
1
2
3
Y
2
Cuadro 29
X
1
2
3
Y
2
C D
C+ D
b =
C D
(C + D + T X ) (C + D + TY )
c=
2m(C D)
n 2 (m1)
Riesgo inferior
66
Riesgo superior
68
Total
134
68
65
133
134
133
267
134
= 67,2509
267
133
134
= 66,749
267
134
= 66,749
267
133
133
= 66,2509
267
134
133
Tota
l
Riesgo inferior
133
134
133
267
=
2
(n
ij
eij
i =1 j =1
eij
66,2509
66,749
= 0,09378
2
0,09378
=
= 0,01874
2
267 + 0,09378
n+
C D 66656868
=
= 0,03747
C + D 6665+6868
Cuadro 32
Chi-cuadrado
0,09378
C de contingencia
0,01874
gamma
-0,03747
Cuadro 33
Nivel de Beneficios
Nivel de
concentracin
Bajo
Medio
Alto
Total
Bajo
Medio
Alto
Total
120
64
68
252
114
74
44
232
46
88
137
271
280
226
249
755
Dado que las dos variables son de tipo ordinal puede calcularse el
estadstico gamma, para ello deben obtenerse el nmero de pares
concordantes y de pares discordantes:
C = 120 (74 + 88 + 44 + 137 ) + 114 (88 + 137 ) + 64 (44 + 137 ) + 74 137 = 88532
D = 46 (64 + 74 + 68 + 44) + 114 (64 + 68) + 88 (68 + 44) + 74 68 = 41436
Y, por tanto:
C D 88532 41436
=
= 0,3624
C + D 88532 + 41436
simtrico =
Nivel de
Satisfaccin
Bajo
Medio
Alto
Totales
**
***
****
Totales
43
12
8
63
36
25
23
84
48
57
22
127
63
67
40
170
190
161
93
444
Cuadro 35
Categora Hotel
Nivel de
Satisfaccin
**
***
****
Totale
s
190
190
63 = 26,96
84 = 35,95
444
444
190
190
127 = 54,35
170 = 72,75
444
444
190
Medio
161
63 = 22,84
444
161
84 = 30,46
444
161
161
127 = 46,05
170 = 61,64
444
444
161
Alto
93
63 =13,20
444
93
84 =17,59
444
93
93
127 = 26,60
170 = 35,61
444
444
93
Totales
63
84
Bajo
127
170
444
2
2
2
2
(
(
43 26,96) (36 35,95)
22 26,60) (40 35,61)
=
+
+K+
+
= 25,83
26,96
35,95
26,60
35,61
Y el estadstico C de contingencia:
C=
25,83
2
=
= 0,234
2
444 + 25,83
n+
1
1
= 1 = 0,816
mn(I , J )
3
C D 26744 18763
=
= 0,1754
C + D 26744 + 18763
satisfaccin =
Miembro de la
pareja:
Hombre
Mujer
Total
Hombre
Ambos
Mujer
Total
179
356
535
356
178
534
22
23
45
557
557
1114
Miembro de la
pareja:
Hombre
Ambos
Mujer
Total
Hombre
557
535 = 267,5
1114
557
534 = 267
1114
557
45 = 22,5
1114
557
Mujer
557
535 = 267,5
1114
557
534 = 267
1114
557
45 = 22,5
1114
557
Total
535
534
45
1114
2 =
267
267
22,5
Y el estadstico C de contingencia:
2
117,91
C=
=
= 0,31
2
1114 + 117,91
n+
El mximo de C podra ser:
1
1
= 1 = 0,707
mn(I , J )
2
**
***
****
Total
21
37
137
49
244
(17,84) (28,96) (126,29) (70,91)
32
52
179
113
376
(27,49) (44,63) (194,61) (109,26)
24
36
229
144
433
(31,66) (51,40) (224,11) (125,83)
77
125
545
306 1053
2
2
2
2
(
(
21 17,84) (37 28,96)
229 224,11) (144 125,83)
=
+
+K+
+
= 22,997
17,84
28,96
224,11
125,83
C=
2
22,997
=
= 0,146
2
1053 + 22,997
n+
1
1
= 1 = 0,816
mn(I , J )
3
Yi = a + b X i
i =1, ..., n
donde a y b son constantes que pueden tomar cualquier valor, excluyendo para b
el valor de 0.
No debe confundirse la existencia de una relacin lineal con la
existencia de una relacin causal. La relacin lineal entre dos variables es
compatible tanto con una relacin causal en la que se enuncie que X es
causa de Y, como con la relacin contraria, en la que Y es causa de X o
incluso con la inexistencia de una relacin causa-efecto. El coeficiente de
correlacin slo detecta la existencia (y grado) de la asociacin entre dos
variables, sin implicar la presencia de algn tipo de relacin causal.
Podemos, por tanto, detectar una relacin lineal entre dos variables sin que
exista una relacin causal entre ellas: X no es causa de Y y tampoco Y es
causa de X. Simplemente existira una relacin lineal entre ellas, no estando
definida la direccin causal.
-1
-2
Y -3
-3
-2
-1
Grfica 2
3
-1
-2
Y -3
-3
-2
-1
Las dos grficas anteriores muestran relaciones lineales exactas entre dos
variables, X e Y. Cuando se da una relacin positiva la pendiente de la recta es
positiva, mientras que una relacin negativa entre las dos variables se refleja en
una pendiente de la recta negativa. El signo del valor del parmetro b de la recta
reflejara, por tanto, el sentido de la asociacin (positiva o negativa) entre las dos
variables.
Tambin pueden existir relaciones exactas entre dos variables que sean
de tipo no lineal, como por ejemplo las representadas en las grficas 3 y 4. En
estas grficas se muestran relaciones exactas de tipo cuadrtico y cbico,
respectivamente. La asociacin entre las dos variables es exacta en ambas
grficas. El coeficiente de correlacin no tiene por qu detectar este tipo de
relacin, puesto que est diseado con la intencin de medir asociaciones
lineales.
Grfica 3
10
-10
-20
Y -30
-3
-2
-1
Grfica 4
40
20
0
-20
-40
-60
-80
Y -100
-3
-2
-1
4000
3000
2000
1000
0
-1000
-2000
-1000
1000
2000
3000
4000
5000
6000
Estadstico de covarianza
El coeficiente de correlacin se puede definir a partir de otro estadstico,
el coeficiente de covarianza. En general, se habla de la covarianza entre dos
variables, X e Y, y se define formalmente como:
n
s XY =
( X
i =1
x )(Yi y )
n
2
1
0
0
10
11
12
13
Grfico 7.
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
0
10
11
12
13
(X
Grfico 8.
4
Y en desviaciones
-1
-2
-3
-4
-3
-2
-1
X en desviaciones
Grfico 9.
4
3
II
III
IV
2
1
0
-1
-2
-3
-4
-3
-2
-1
Y en desviaciones
-1
-2
-3
-4
-3
-2
-1
X en desviaciones
Grfica 11
1,5
1,0
,5
0,0
-,5
-1,0
-4
-3
-2
-1
Cuadro 1
(X
x )(Yi y )
Xi
Yi
Xi x
Yi y
1
2
3
4
5
6
7
8
9
10
12
10
11
13
15
14
12
11
19
20
14,55
12,85
13,3
13,53
18,18
18,94
16,11
13,82
23,53
23,02
-1,7
-3,7
-2,7
-0,7
1,3
0,3
-1,7
-2,7
5,3
6,3
-2,233
-3,933
-3,483
-3,253
1,397
2,157
-0,673
-2,963
6,747
6,237
s XY
13,7
16,783
11,67
3,7961
14,5521
9,4041
2,2771
1,8161
0,6471
1,1441
8,0001
35,7591
39,2931
Grfica 12
24
22
20
18
16
14
12
10
8
6
4
2
0
0
10
12
14
16
18
20
22
Si multiplicamos las variables del cuadro 1 por una constante (dos, por
ejemplo) y calculamos la nueva covarianza, tal como aparece en el cuadro 2, la
cifra de la nueva covarianza se ha multiplicado por cuatro, siendo ahora igual a
46,68. Implica esta cifra un mayor grado de asociacin? La respuesta es
negativa. Observe la representacin de las dos nuevas variables que se ofrece en
la grfica 13. La forma de la nube de puntos es la misma que en la grfica 12, no
presentando una asociacin ms fuerte entre las nuevas variables.
Cuadro 2
X i*
Yi *
1
2
3
4
5
6
7
8
9
10
24
20
22
26
30
28
24
22
38
40
29,1
25,7
26,6
27,06
36,36
37,88
32,22
27,64
47,06
46,04
x*
y*
X i* x * Yi * y *
-3,4
-7,4
-5,4
-1,4
2,6
0,6
-3,4
-5,4
10,6
12,6
(X
-4,466
-7,866
-6,966
-6,506
2,794
4,314
-1,346
-5,926
13,494
12,474
*
i
x * )(Yi * y * )
15,1844
58,2084
37,6164
9,1084
7,2644
2,5884
4,5764
32,0004
143,0364
157,1724
s X *Y *
27,4 33,566
46,68
Grfica 13
50
40
30
20
Y*
10
0
0
X*
10
20
30
40
50
Propiedades de la covarianza
(1) La covarianza puede calcularse a partir de la siguiente equivalencia
de su numerador:
( X
x )(Yi y ) = X i Yi n x y .
i =1
i =1
( (X
n
s X +b , Y + c =
i =1
+ b) ( x + b )
) ( (Y + c) ( y + c) ) ( X
n
i =1
x )( Yi y )
n
= s XY
( bX
n
sbX , cY =
i =1
bx )( cYi cy ) bc ( X i x )( Yi y )
= i =1
= b c s XY
n
n
n
sX a =
( X
i =1
x )( a a )
n
=0
( X
n
rXY
s
= XY =
s X sY
i =1
(X
n
i =1
x )( Yi y )
x)
(Y y )
n
i =1
El coeficiente de correlacin lineal entre dos variables es, por tanto, igual
a su covarianza dividida por el producto de desviaciones estndar de las dos
variables.
El signo del coeficiente de correlacin ser igual al signo de la
covarianza. Si entre dos variables existe una asociacin lineal positiva el
coeficiente de correlacin ser positivo. En el caso de una asociacin negativa, el
coeficiente de correlacin ser negativo. En el caso de ausencia de asociacin, el
coeficiente de correlacin ser cero:
Asociacin lineal positiva entre las dos variables s XY > 0 rXY > 0 .
Asociacin lineal negativa entre las dos variables s XY < 0 rXY < 0 .
Ausencia de asociacin lineal entre las dos variables s XY = 0 rXY = 0 .
Al estandarizar la covarianza mediante las desviaciones estndar se
suprime el problema de las unidades de medida. En el caso de multiplicar las
variables por cualquier constante, el numerador de rXY se multiplicar por esas
constantes, pero tambin en el denominador se producirn transformaciones:
( bX
n
rbX , cY =
i =1
( bX
n
i =1
bx )( cYi cy )
bx )
( cY cy )
n
i =1
=
2
b( X
x ) c ( Yi y )
i =1
b ( X
x )
i =1
c (Y y )
n
=
2
i =1
bc ( X i x )( Yi y )
n
i =1
( X
n
i =1
x )
( Y y )
n
=
2
bc s XY
=r
b s X c sY XY
i =1
Yi = a + b X i
i =1, ..., n .
rXY
( X
s
= XY =
s X sY
i =1
( X
i =1
( X
n
i =1
(X
n
i =1
x )( Yi y )
x)
(Y y )
i =1
x ) a + b X i (a + b x )
x)
=
2
(a + b X (a + b x ))
n
i =1
=
2
( X
x )b ( X i x )
i =1
(X
x)
i =1
b ( X
n
i =1
b ( Xi x )
x)
=
2
i =1
( X
i =1
x)
( X
i =1
x)
=1
2
( X
s
= XY =
s X sY
rXY
i =1
( X
i =1
( X
n
i =1
(X
i =1
(X
i =1
(Y y )
x )( b)( X i x )
x)
( b) ( X
n
i =1
x)
( X
i =1
x)
( X
i =1
=
2
i =1
=
2
( b) ( X i x )
(a b X (a b x ))
i =1
=
2
i =1
( X
n
x)
x )( Yi y )
x ) a b X i (a b x )
x)
i =1
x)
=1
2
rXY = + 1
rXY = 1
rXY = 0
1 rXY + 1
Asociacin lineal exacta de tipo positivo.
Asociacin lineal exacta de tipo negativo.
Ausencia de asociacin lineal.
rXY =
X
i =1
X
i =1
2
i
Yi n x y
n x2
Y
i =1
n y2
Matriz de correlaciones
Es frecuente analizar la relacin existente entre un conjunto de variables,
de manera que estemos interesados en las correlaciones entre todos los pares
1 r12
R=
r13 K r1k
r23 K r2 k
1 K r3k
O M
1
20000
10000
-10000
0
10
20
30
120
100
80
60
40
20
10
20
30
40
50
60
70
Piense que situaciones como la descrita pueden ser muy comunes. Por
ejemplo, suponga que estudia la relacin entre superficie de la vivienda y su
precio. Para ello toma informacin de diversas viviendas, sin distinguir si stas se
encuentran en una zona rural o urbana. Es posible que la posicin de las
observaciones sea similar a la representada en la grfica 15, siendo X la
superficie de la vivienda e Y el precio de la misma. El grupo del primer
cuadrante respondera a las viviendas de tipo urbano (con una baja superficie
media y alto precio), mientras que en el cuarto cuadrante apareceran las
viviendas de tipo rural, con una mayor superficie y un menor precio medio. Sin
distincin de su ubicacin, la asociacin entre las dos variables sera negativa: a
mayor superficie, menor precio; sin embargo, con ello se ocultara la relacin
fundamental entre las dos variables: cuanto mayor es la superficie, mayor es el
precio de la vivienda, aunque deba tenerse en cuenta la situacin geogrfica para
entender que los niveles en los que se establece esa relacin difieren segn se
trate de zonas urbanas o rurales.
Situaciones similares pueden darse combinando diversas posiciones de
los grupos. Puede existir una relacin esencial negativa entre las variables y que
por la existencia de grupos de individuos se detecte una correlacin positiva, o no
existir asociacin y detectarse con cualquier signo, etc. Como un segundo
ejemplo, observe la grfica 16. En la misma aparecen dos grupos de
observaciones. Si se calcula el coeficiente de correlacin, sin distincin de
50
40
30
20
10
10
20
30
40
50
60
Cuadro 4
i
1
2
3
4
5
X
4
5
7
3
8
Y
10
11
9
15
13
Rango de X
2
3
4
1
5
Rango de Y
2
3
1
5
4
Xi
Yi
X i Yi
4
5
7
3
8
10
11
9
15
13
40
55
63
45
104
16
25
49
9
64
5,4 11,6
X
i =1
2
i
Xi
Yi
X i Yi
X i2
Yi 2
2
3
4
1
5
2
3
1
5
4
4
9
4
5
20
4
9
16
1
25
4
9
1
25
16
696
42
Yi
100
121
81
225
169
X Y
i Yi
i =1
307
2
i
163
i =1
i =1
i Yi
X
i =1
55
2
i
Y
i =1
55
rPearson =
X Y nx y
i =1
n
i i
X
i =1
2
i
n x
Y el coeficiente de Spearman:
696 511,6 2
= 0,3104
rSpearmn =
X Y n x y
i i
i =1
n
X
i =1
2
i
nx
42 5 3 3
55 5 32
55 5 32
= 0,3
i
1
2
3
4
5
X
Y Rango de X
19 73
2
55 110
3
110 9
4
3 230
1
220 150
5
Rango de Y
2
3
1
5
4
rSpearman = 1
( )
( )
6 d i2
i =1
n (n 2 1)
Cuadro 7
Pas
Alemania
Austria
Blgica
Canad
Dinamarca
EEUU
Espaa
Francia
Grecia
Holanda
Irlanda
Italia
Japn
Noruega
Nueva Zelanda
Portugal
Suecia
Suiza
UK
Grfica 17
Tasa de
desempleo
2,6
5,6
7,3
7,9
6,4
6,6
10,6
6,4
5,5
5,2
10,4
8,4
2,4
2,7
3,3
5,8
2,4
0,8
6
Cua
impositiva
0,8
0,35
0,87
0,53
1
0,4
0,47
0,85
0,63
0,89
0,61
0,62
0,31
1,03
0,46
0,45
1,1
0,39
0,52
12
Espaa
Irlanda
tasa de desempleo
10
Italia
Canad
Blgica
EEUU
Austria
Francia
Portugal
Dinamarc
UK
Grecia
Holanda
4
Nueva Ze
Noruega
Suecia
Alemania
Japn
2
Suiza
0
.2
.4
.6
.8
cua impositiva
1.2
Cuadro 8
Xi
Yi
X i2
Yi 2
X i Yi
2,6
5,6
7,3
7,9
6,4
6,6
10,6
6,4
5,5
5,2
10,4
8,4
2,4
2,7
3,3
5,8
2,4
0,8
6
0,8
0,35
0,87
0,53
1
0,4
0,47
0,85
0,63
0,89
0,61
0,62
0,31
1,03
0,46
0,45
1,1
0,39
0,52
6,76
31,36
53,29
62,41
40,96
43,56
112,36
40,96
30,25
27,04
108,16
70,56
5,76
7,29
10,89
33,64
5,76
0,64
36
0,64
0,1225
0,7569
0,2809
1
0,16
0,2209
0,7225
0,3969
0,7921
0,3721
0,3844
0,0961
1,0609
0,2116
0,2025
1,21
0,1521
0,2704
2,08
1,96
6,351
4,187
6,4
2,64
4,982
5,44
3,465
4,628
6,344
5,208
0,744
2,781
1,518
2,61
2,64
0,312
3,12
Xi
i =1
Yi
i =1
X i2
i =1
Yi 2
i =1
X
i =1
Yi
106,3
12,28
727,65 9,0528
5,5947
0,64632
67,41
rXY =
X
i =1
X
i =1
2
i
n x
Yi n x y
=
Y
i =1
n y
9,0528 19 0,64632 2
= 0,1062
Entre las dos variables, por tanto, no parece existir ningn tipo de
asociacin, pudindose incluso hablar de una pequea asociacin negativa,
cuando se utiliza la informacin promedio del perodo 1965-1992.
Austria
Belgica
Dinamarca
Finlandia
Francia
Alemania
Irlanda
Costes de despido
Despidos
Despidos
procedentes improcedentes
14
20
9
12,5
5,2
9
5,2
6
4,2
15
3,4
18
5,4
24
Italia
19,6
Holanda
4
Portugal
16,1
Espaa
8,3
Suecia
5
UK
6,7
UE
8,1
Fuente: Layard et al. (1996)
32,5
5,3
20
30
16
11
16,8
Grfica 18
Italia
19.6
Portugal
despidos procedentes
Austria
Belgica
Espaa
UE
UK
Finlandi
Dinamarc
Irlanda
Suecia
Francia
Holanda
Alemania
3.4
5.3
32.5
despidos improcedentes
Cuadro 10
Xi
Yi
X i2
Yi 2
X i Yi
14
9
5,2
5,2
4,2
3,4
5,4
19,6
4
16,1
8,3
5
6,7
20
12,5
9
6
15
18
24
32,5
5,3
20
30
16
11
X
i =1
196
81
27,04
27,04
17,64
11,56
29,16
384,16
16
259,21
68,89
25
44,89
i =1
106,1
219,3
8,1615
16,8692
3
400
156,25
81
36
225
324
576
1056,25
28,09
400
900
256
121
i =1
2
i
1187,59
i =1
280
112,5
46,8
31,2
63
61,2
129,6
637
21,2
322
249
80
73,7
X
i =1
4559,59
Yi
2107,2
rXY =
X
i =1
X
i =1
2
i
Yi n x y
n x2
i =1
n y2
rXY =
X
i =1
X
i =1
2
i
Yi n x y
n x2
Y
i =1
n y2
4559,59 1316,869232
= 0,6034
rXY =
sX*Y*
s X * sY *
3 4 s XY
s
= XY = rXY = 0,9
3 s X 4 sY s X sY
Cuadro 11
Xi
Yi
Ventas
Beneficios
1239
13212
6867
9023
6286
10258
9854
4200
10199
7736
31,3
18,1
9
379,4
503
14,8
55,4
71
115,1
42,3
X i Yi
X i2
38781
1535121
239137 174556944
61803
47155689
3423326 81414529
3161858 39513796
151818 105226564
545912 97101316
298200 17640000
1173905 104019601
327233 59845696
Yi 2
980
328
81
143944
253009
219
3069
5041
13248
1789
5272
5485
1799
4603
3826
12242
6442
96,1
912,1
103,8
567,5
212,8
128,9
171,5
506639 27793984
5002869 30085225
186736
3236401
2612203 21187609
814173 14638276
1577994 149866564
1104803 41499364
n
6973
X i Yi
9235
831926
10774
322056
45284
16615
29412
n
X i2
i =1
i =1
i =1
2122738 101631667
9
9
1687012
202
rXY =
X Y n x y
i =1
X
i =1
2
i
n x 2
Y
i =1
n y 2
= 0,197
Xi
Yi
Consumo
per capita
(euros)
% poblacin
que hace
vacaciones
X i Yi
X i2
Yi 2
Espaa
UK
Holanda
Italia
Blgica
Francia
Alemani
a
6172
8440
8646
9199
9872
9977
53,4
61
69,9
57,2
56
59,1
329585
514840
604355
526183
552832
589641
38093584
71233600
74753316
84621601
97456384
99540529
2852
3721
4886
3272
3136
3493
10141
68,2
691616
102839881
4651
x
8921
X i Yi
X i2
i =1
i =1
Y
i =1
3809051,9
26010,4
568538895
0
6
60,69
rXY =
X Y n x y
i =1
X
i =1
2
i
n x
Y
i =1
n y
26010 7 60,69 2
= 0,38
Aliment.
Vestido
No durad.
Durad.
Gasto
Ingresos
Alimentacin
Vestido
1
0,22
0,25
0,09
0,50
0,26
0,22
1
0,43
0,13
0,60
0,34
No duraderos Duraderos
0,25
0,43
1
0,14
0,86
0,61
0,09
0,13
0,14
1
0,51
0,16
Gasto
Ingresos
0,50
0,60
0,86
0,51
1
0,59
0,26
0,34
0,61
0,16
0,59
1
Grfica 19
Gasto familiar total
3000000
2000000
1000000
0
0
1000000
Ingresos familiares
2000000
3000000
2000000
3000000
Grfica 20
Gasto en bienes duraderos
1300000
1200000
1100000
1000000
900000
800000
700000
600000
500000
400000
300000
200000
100000
0
0
1000000
Ingresos familiares
67
184
78
144
68
172
79
143
69
166
80
138
70
177
81
139
71
72
172,5 164
82
83
130 130,5
73 74 75
150 152 156
84 85
125 124
rXY =
X
i =1
X
i =1
2
i
n x
Yi n x y
=
Y
i =1
n y
241825 21 75155,1905
118895 21 752
Grfica 21
515066,5 21155,19052
= 0,9716
200
180
renta media
160
140
120
65
70
75
80
85
Cuadro 15
Mercado
Australia
Correlaciones
con el mercado de
EEUU
197619591995
1973
0,40
0,23
Austria
Blgica
Canad
Dinamarca
Francia
Alemania
Italia
Japn
Holanda
Noruega
Espaa
Suecia
Suiza
UK
Del anlisis de los
conclusiones:
0,12
0,40
0,68
0,32
0,42
0,33
0,20
0,23
0,58
0,47
0,29
0,39
0,46
0,50
coeficientes
Orden de la
correlacin
(de mayor a menor)
19591976-1995
1973
7
9
0,12
15
0,46
8
0,80
1
0,04
11
0,25
6
0,38
10
0,21
14
0,13
13
0,61
2
0,17
4
0,04
12
0,33
9
0,49
5
0,29
3
de correlacin se extraen
13
4
1
14
8
5
10
12
2
11
14
6
3
7
las siguientes
Los mercados con las correlaciones ms altas en el perodo 19591973 (Canad, Holanda y Suiza) tienen correlaciones numricamente
inferiores en el segundo perodo. Por el contrario, mercados como el
de Espaa y Dinamarca, apenas correlacionados con el de EEUU en
la primera etapa, presentan correlaciones algo ms altas en las
ltimas dos dcadas.
Si se calcula el coeficiente de correlacin entre los rangos de las
correlaciones de los dos perodos se obtiene un valor igual a 0,71.
Esto es indicativo de que efectivamente parece haberse dado una
continuidad importante en las relaciones a largo plazo entre estos
mercados de acciones.
No parece existir evidencia, por lo tanto, de cambios importantes en
la correlacin del mercado de EEUU con los principales mercados
mundiales. Este resultado entrara en contradiccin con la creencia de
que los mercados de acciones han incrementado su sincronizacin,
siendo ms sensibles a la influencia de factores comunes.
DAX 30 (Alemania).
CAC 40 (Francia).
FT SE 100 (Inglaterra).
S&P 500 (EEUU).
NIKKEI 225 (Japn).
p
log t
p t 1
donde pt indica el valor del ndice en el da t.
Los coeficientes de correlacin se calculan separadamente en
cuatro perodos:
Primer perodo: Enero de 1985 a octubre de 1987. En octubre de
1987 se produce una importante crisis burstil.
Segundo perodo: Octubre de 1987 a agosto de 1990. En agosto
de 1990 tiene lugar la guerra de Kuwait, que provoc una crisis en
las bolsas.
DAX 30
85-87
-0,1
87-90
0,3
90-92
0,4
92-96
0,5
CAC 40
-0,1
0,3
0,4
0,6
FT SE 100
S&P 500
NIKKEI 225
0,0
0,0
0,0
0,1
0,0
0,2
0,3
0,3
0,2
0,5
0,2
0,2
rit =
Precioit Precioit 1
Precioit 1
w r
=
=w r
w
i
Rct
it
it
(R
T
var( Rct ) =
ct
t =1
Rc )
Rct
t =1
Rc =
wi rit
t =1
wi rit
t =1
= wi
it
i =1
= wi ri
i
(R
ct
t =1
Rc ) = w1 r1t + w2 r2 t ( w1 r1 + w2 r2 ) =
2
t =1
= w1 (r1t r1 ) + w2 ( r2 t r2 ) =
t =1
))
t =1
T
2
1
t =1
T
2
2
t =1
t =1
t =1
t =1
(( r
1t
r1 )( r2 t r2 )
(R
T
var( Rct ) =
T
(r1t r1 )
2 t =1
1
=w
t =1
(r2 t r2 )
2 t =1
2
ct
Rc )
T
2
((r
T
t =1
1t
r1 )( r2 t r2 )
+w
+ 2 w1 w2
T
T
T
2
2
= w1 var (r1 ) + w2 var (r2 ) + 2 w1 w2 covar(r1 r2 )
( )
i =1
i =1 j = 2
i< j
( )
k 1 k
( )
i =1 j = 2
i< j
Fjese que el riesgo de la cartera depende de k varianzas y de k(k1)/2 covarianzas. De manera que cuanto mayor es el valor de k, mayor
ser la importancia relativa de las covarianzas para determinar el riesgo
de la cartera. Si k=6, el nmero de covarianzas distintas ser de 15; si
k=12, el nmero de covarianzas es de 66.
Al aumentar el nmero de activos de la cartera, el riesgo global se
aproxima a una media ponderada de las covarianzas.
De nuevo para nicamente dos activos:
var ( Rc ) = w12 var (r1 ) + w22 var (r2 ) + 2 w1 w2 var (r1 ) var (r2 ) correl (r1 r2 )
Este resultado permite observar que el riesgo global de una
cartera depende del riesgo de cada uno de los activos que la forman
(ponderados segn la importancia de su participacin) y de un riesgo
comn. Esta ltima componente del riesgo de la cartera juega un papel
importante para lograr disminuir el riesgo global. La situacin ideal ser
aquella en la que la correlacin sea negativa, pues con ello disminuir la
varianza del rendimiento de la cartera definida por la ponderacin simple
de las varianzas:
rXY =
s XY
s X sY
var( Rc ) = w12 var (r1 ) + w22 var (r2 ) 2 w1 w2 var (r1 ) var (r2 ) correl (r1 r2 )
Sin embargo, la correlacin de tipo positivo entre los activos ser
el valor ms frecuente, al incidir el riesgo de mercado sobre todas ellas.
Respecto a una correlacin positiva exacta, una correlacin positiva e
inferior a la unidad, disminuir comparativamente el riesgo global de la
cartera.
Ejemplo 11. Valoracin de una cartera con dos acciones. En este
ejemplo vamos a aplicar directamente lo explicado en el ejemplo anterior
a una cartera con dos acciones. En el cuadro 17 se muestran las
cotizaciones de las dos series durante 12 perodos. A partir de las
mismas se han calculado los rendimientos de cada perodo, los valores
medios y desviaciones estndar, la covarianza y el coeficiente de
correlacin de las dos series de rendimientos.
Cuadro 17
t
p At
p Bt
0
1
2
3
4
5
6
7
8
9
10
11
11
12
13
12,5
13
13,5
14
14,7
15
16
16,3
16,4
12
10
9,5
10
9
10
12
13
15
16
17
16,5
rA
rB
0,0375
0,0349
-0,001395
-0,38
covar(rA rB ) correl(rA rB )
rAt =
p At p A t 1
p A t 1
rBt =
p Bt p B t 1
p B t 1
0,091
0,083
-0,038
0,04
0,038
0,037
0,05
0,021
0,067
0,019
0,006
-0,167
-0,05
0,053
-0,1
0,111
0,2
0,083
0,154
0,067
0,063
-0,029
0,0348
0,1052
var(rA )
var (rB )
Rc = w A rA + w B rB
var( Rc ) = w 2A var(rA ) + wB2 var(rB ) + 2 w A wB var(rA ) var(rB ) correl(rA rB )
Cuadro 18
Orden
Orden
Rendimiento Rendimiento
w1 1 w1 medio de la
(ms a
cartera
menos)
0,75 0,25
0,0369
4
1
0
0,0376
1
0
1
0,0349
12
0,9
0,1
0,0373
2
0,8
0,2
0,0370
3
0,7
0,3
0,0368
5
0,6
0,4
0,0365
6
0,5
0,5
0,0362
7
0,4
0,6
0,0359
8
0,3
0,7
0,0357
9
0,2
0,8
0,0354
10
0,1
0,9
0,0352
11
Riesgo
global
0,00084
0,00121
0,01107
0,00084
0,00077
0,00100
0,00153
0,00237
0,00351
0,00495
0,00669
0,00873
Riesgo
(menos a
ms)
3
5
12
2
1
4
6
7
8
9
10
11
Cuadro 19
%
%
rango
rango
activida participacin primeros participaci
repetidore
visitante n visitantes
d
primeros
s
s
repetidores
visitantes
A
58,8
1
34,7
1
B
58,6
2
27,3
3
C
51,7
3
31,7
2
D
47
4
18,9
7
E
42,1
5
17
8
F
39,6
6
21,4
6
G
37,3
7
13,8
10
H
34,1
8
25,2
4
I
31,2
9
16,4
9
J
28,1
10
12,5
11,5
K
26,1
11
11,4
13
L
24,9
12
12,5
11,5
M
24,1
13
22,6
5
N
13,2
14
10,3
14
12,9
15
6,9
15
rSpearman =1
6 d i2
i =1
2
n(n 1)
=1
6 115,5
= 0,794
15 15 2 1
Cuadro 20
Blg.
BEN.
Italia
1,00
0,04
0,65
0,53
0,58
0,11
Japn
0,17
Holanda
0,61
0,40
0,45
Blgica
BENETTON
Europa
Francia
Alemania
Espaa
Suecia
Suiza
UK
EEUU
Mundo
1,00
0,06
0,10
0,03
0,03
0,19
0,02
0,00
0,03
0,09
0,12
Euro.
Fran.
Alem.
Italia
Japn Holanda
1,00
0,82 1,00
0,80 0,60 1,00
0,07 0,06 0,03 1,00
0,28 0,14 0,33 0,02 1,00
0,32
0,15
0,15
0,06
0,02
0,40
0,15
0,07 0,15 0,15 0,00 0,03
0,03
0,06
0,35
0,66 0,49 0,54 0,05 0,73
0,05
Cuadro 20 (continuacin)
Suecia
Suiza
UK
EEUU
Mundo
Blgica
BENETTON
Europa
Francia
Alemania
Italia
Japn
Holanda
Espaa
Suiza
1,00
0,03
UK
0,48
EEUU
0,11
Mundo
0,42
Suecia
Espaa
1,00
1,00
0,03
0,29 1,00
0,07
0,55 0,49
0,07
1,00
1,00
0,56
0,56
1,00
0,54
0,00
0,01
0,63
0,56
0,11
0,29
0,62
0,52
Yi = a + b X i
i =1,..., n
Yi = a + b X i
X
Y
ei = Yi a b X i
Yi = a + bX i + ei
donde el ltimo trmino define la discrepancia entre el valor observado y la recta
ajustada.
En este marco de causalidad resulta necesario disponer no slo de una
medida del grado de asociacin (el coeficiente de correlacin lineal), sino adems
de los valores numricos de a y b. Estos parmetros tienen un inters especial en
las relaciones econmicas, especialmente el segundo. La pendiente de la recta, b,
mide el impacto que una variacin en una unidad de la variable X tiene sobre la
variable Y. Matemticamente podemos escribir:
Yi
=b .
Xi
En trminos discretos, se entiende que b, la pendiente de la recta, mide la
variacin que sufre Y, como consecuencia de la variacin en una unidad de X.
El valor de a no es ms que el valor que toma la variable Y cuando el
valor de X es cero. Se conoce como trmino independiente de la regresin.
En la grfica 1 se muestra, para una recta con pendiente positiva, cules
son las interpretaciones grficas de a y b. El trmino independiente es la distancia
desde el centro de coordenadas al punto de corte del eje de ordenadas. La
pendiente de la recta mide la importancia de los cambios de Y consecuencia de las
variaciones de X. En el caso de una asociacin negativa entre las dos variables, el
valor de b sera inferior a cero, para proporcionar una pendiente negativa. En este
caso, al aumentar en una unidad el valor de X, Y disminuira en una cantidad igual
a b. Si la pendiente de la regresin tomara un valor igual a cero, la relacin causal
no existira, puesto que variaciones de la variable exgena no afectaran a la
variable endgena y la recta adoptara una posicin horizontal.
Grfica 1
100
90
80
70
60
50
40
30
20
10
0
0
10
12
14
16
18
20
22
24
26
28
30
32
Consumoi = f ( Renta i ) ,
Consumoi = a + b Rentai
El coeficiente b es, en este caso, la propensin marginal al consumo
(pmgc), que tendr el mismo valor para todas las observaciones:
pmgc =
consumoi
=b
renta i
pibt pibt 1
ventast ventast 1
=f
ventast 1
pibt
ventast ventast 1
pibt pibt 1
=a +b
ventast 1
pibt
q dA = f ( p A )
Grfica 2
q dA = a + b p A
El parmetro b medir ahora el impacto que una variacin unitaria en el
precio tiene sobre la cantidad demandada. La medida de este efecto es importante
como informacin del comportamiento del propio mercado de una empresa, a la
vez que el ajuste puede permitir hacer predicciones de cul es la cantidad
demandada que uno puede esperar para un nivel determinado del precio.
Una empresa puede estar interesada en analizar la relacin existente
entre los costes en uno de sus inputs productivos y el volumen de produccin. En
general, los costes en un input pueden descomponerse en una parte fija, que no
depende del nivel de produccin, y de una parte variable, que dependera del
volumen de actividad:
costes = CF + CV
donde CF indicara los costes fijos y CV los costes variables. Esta ltima cantidad
podra, por tanto, expresarse como:
CV = f ( produccin )
Si la relacin entre costes variables y el volumen de produccin es
proporcional, es decir, si al aumentar la produccin los costes variables aumentan
proporcionalmente, se tendr:
CV =CVMe produccin ,
siendo CVMe un parmetro constante, que definira los costes variables medios
(los costes variables por unidad de producto, que seran constantes fuese cul
fuese la cantidad producida). Bajo esta hiptesis, podra calcularse la siguiente
regresin:
costes = a + b produccin
en donde a seran los costes fijos y b estimara los costes variables medios. Esta
informacin le facilitar (siempre que realmente los costes variables medios sean
constantes) el impacto que futuros aumentos en la produccin ocasionarn en los
costes variables asociados a cada uno de los inputs.
Grfica 3
23
72
24
79
24
77
25
81
25
79
26
89
28
95
30
93
100
90
80
70
60
50
16
18
20
22
24
26
28
30
32
Yi = a + b X i
i =1 ,...,10
Esta impresin visual puede formalizarse algo ms. Lo que hace que una
de las rectas resulte mejor que las otras es la impresin que uno recibe de que
pasa ms cerca de la mayora de los puntos. Si los puntos no estn alineados de
manera exacta sobre una recta, ningn ajuste conseguir pasar por todos ellos,
pero puede ajustarse una recta que pase lo ms cerca posible de todos los puntos.
Grfica 4
100
90
3
80
70
2
60
50
16
18
20
22
24
26
28
30
32
(X
, Yi ) , la recta de
Grfica 5
100
ei
90
80
ei
70
60
50
16
18
20
22
24
26
28
30
32
ei2 = (Yi a b X i )
n
i =1
i =1
i =1
i =1
a, b
Derivando la funcin con respecto a los parmetros a y b, igualando a
cero y resolviendo el sistema obtendremos los valores que minimizan la suma de
los errores elevados al cuadrado. Este principio se denomina de mnimos
cuadrados ordinarios (mco) y las frmulas para a y b se conocen, en un contexto
estadstico ms amplio que el que contemplamos ahora, como estimadores por
mnimos cuadrados ordinarios.
e = (Y a bX )
2
i
i =1
i =1
= Yi + na + b
2
i =1
X
i =1
2
i
i =1
i =1
i =1
2a Yi 2b X i Yi + 2ab X i
ei2
i =1
ei2
=0
i =1
=0
ei2
n
n
i =1
= 2 n a 2 Yi + 2 b X i = 0
a
i =1
i =1
n
ei2
n
n
n
i =1
2
b = 2 b X i 2 X i Yi + 2a X i = 0
i =1
i =1
i =1
2na 2 Yi + 2b X i = 0
i =1
n
i =1
na Yi + b X i = 0
i =1
n
Y
i =1
i =1
n
X
i =1
+b
=0
n
n
a y +b x =0
a = y b x
i =1
i =1
2 b X 2 X i Yi + 2 a X i = 0
i =1
2
i
i =1
i =1
i =1
b X i2 X i Yi + a X i = 0
Sustituyendo el valor de a = y b x :
n
i =1
i =1
b X X i Yi + ( y bx ) X i = 0
i =1
2
i
i =1
i =1
b X i2 X i Yi + y X i b x X i = 0
i =1
i =1
b X i2 x X i X i Yi + y X i = 0
i =1
i =1
i =1
i =1
n
n
n
n
n
b X i2 x X i = X i Yi y X i
i =1
i =1
i =1
i =1
n
X
i =1
=n x :
n
n 2
2
b X i n x = X i Yi n y x
i =1
i =1
Se obtiene:
n
b=
X Y n y x
i =1
n
i i
X
i =1
2
i
n x2
a = y b x ;
b=
X Y n y x
i =1
n
i i
X
=
2
i
n x2
( X
n
i =1
b=
x )(Yi y )
(X
x)
i =1
( X i x )(Yi y ) = X i Yi n x y
n
i =1
i =1
( X
n
i =1
x ) = X i2 nx 2
2
i =1
( X
n
b=
i =1
x )(Yi y ) n
(X
n
i =1
x)
covar ( X , Y )
var ( X )
s xy
s x2
previamente: x , y ,
X i Yi ,
i =1
Cuadro 2
X
i =1
2
i
Xi
Yi
X i Yi
X i2
17
20
23
24
24
25
25
26
28
30
59
71
72
79
77
81
79
89
95
93
1003
1420
1656
1896
1848
2025
1975
2314
2660
2790
289
400
529
576
576
625
625
676
784
900
X Y X Y X
i
i =1
i =1
242
795
24,2
79,5
i =1
i i
19587
i =1
2
i
5980
b=
s xy
s
2
x
X Y n x y
i =1
n
i i
X
i =1
2
i
nx2
Y
100
90
80
70
60
50
40
30
20
10
0
0
10
20
30
40
50
60
70
80
90
100
-32
16
18
20
22
24
26
28
30
32
Cuadro 4
Xi
Yi
X i Yi
X i2
17
20
23
24
24
25
25
26
28
30
-21
-20
-23
-24
-30
-31
-25
-18
-27
-29
-357
-400
-529
-576
-720
-775
-625
-468
-756
-870
289
400
529
576
576
625
625
676
784
900
Xi
Yi
X i Yi
242
-248
-6076
24,2
-24,8
i =1
i =1
i =1
X
i =1
2
i
5980
b=
s xy
s
2
x
X Y nx y
i =1
n
i i
X
i =1
2
i
n x2
Grfica 8
- 10
Y - 20
- 30
- 40
0
10
20
30
40
23
6
24
2
24
7
25
5
25
3
26
4
28
6
30
6
Grfica 9
8
1
16
18
20
22
24
26
28
30
32
b=
s xy
s
2
x
X Y n x y
i i
i =1
n
X
i =1
2
i
n x2
Cuadro 6
Xi
Yi
X i Yi
X i2
17
20
23
24
24
25
25
26
28
30
2
6
6
2
7
5
3
4
6
6
34
120
138
48
168
125
75
104
168
180
289
400
529
576
576
625
625
676
784
900
X Y X Y X
i =1
i =1
242
47
24,2
4,7
i =1
i i
1160
i =1
2
i
5980
Grfica 10
35
30
25
20
Y
15
10
5
0
0
10
15
20
25
30
35
X=
1
Z
Yi = a + b X i
1
Yi = a + b .
Zi
Una relacin de econmica de este tipo es la denominada curva de
Phillips, que relaciona las tasas de variacin de los salarios con las tasas de
poblacin en paro:
1
Tasa de variacin salarios t = a + b
Tasa de parot
, b < 0
Yi = a X ib
Yi = e a + b X i
log ( Yi ) = a + b X i
log ( Yi ) = a + b
Yi = e
a + b
1
Xi
1
Xi
Yi = a 0 + a1 X 1i + a 2 X 2i + ... + a k X ki
Y
X1 X2
Xk
Y
X1 X2
Xk
Algunas propiedades del error del ajuste. El error del ajuste se ha definido
como:
ei = Yi a bX i .
Si los valores de a y b se obtienen por mco, el error tiene dos
caractersticas especiales. La primera es que la media del error, para todas las
observaciones muestrales, es cero. La segunda, que la covarianza entre la variable
exgena y el error es tambin igual a cero. Las dos propiedades se deducen del
sistema de ecuaciones normales, a partir del cul se han obtenido las expresiones
de mco.
Las caractersticas del error del ajuste cuando a y b se calculan
basndonos en mco son:
(1) La media del error del ajuste es cero:
n
e=
i =1
=0.
(2) El error del ajuste tiene covarianza nula con la variable exgena:
(X
n
s xe =
i =1
x )(ei e )
n
=0.
(Y y )
n
i =1
, y es la variacin
VT = VE + VE
La interpretacin de esta descomposicin es la siguiente. La variable
endgena presenta una variacin total (una dispersin respecto a su valor medio),
que se desea explicar mediante una relacin causal. El modelo supone que las
variaciones de la variable exgena explican las variaciones de la endgena. De
hecho, el modelo se puede escribir:
Yi = a + bX i + ei
y = a + bx
Yi y = b ( X i x ) + ei
Grfica 11
100
Yi y
90
80
Xi x
70
60
x
50
16
18
20
22
24
26
28
30
32
ei
90
b( X i x )
80
70
60
50
16
18
20
22
24
26
28
30
32
VE
VT
R2 =
(Y y )
i =1
= b 2 ( X i x ) + ei2
2
i =1
i =1
VE = b
( X
i =1
x)
VE = ei2
i =1
b2 ( Xi x)
n
R2 =
VE
=
VT
i =1
n
(Y y )
i =1
R2 =
VE VT V E
VE
=
=1
VT
VT
VT
0 R 2 1
R 2 = 0 El modelo NO es EXPLICATIVO
R 2 =1 El modelo EXPLICA toda la variacin de Y
La interpretacin de estos lmites resulta clara si tenemos en cuenta la
definicin del coeficiente. Si la variable X no explica las variaciones de Y ser
porque el parmetro b es igual a cero:
Yi y = b ( X i x ) + ei
Yi y = 0 ( X i x ) + ei
Yi y = ei
Yi y = b ( X i x )
(Y y )
n
i =1
=b
(X
n
i =1
x)
{ VE = 0 VT = V E }
{ V E = 0 VT =VE }
R2 =0
R 2 =1
Grfica 13
Grfica 14
26
26
24
24
22
22
20
20
18
18
16
16
14
16
18
20
22
24
26
28
30
32
14
16
18
20
22
24
26
28
30
32
Yi = a + b X i ,
b0
siendo los errores de ajuste igual a cero, para todas las observaciones. Ya hemos
indicado que esta circunstancia de correlacin exacta es difcil encontrarla con
variables econmicas reales, aunque no es extrao encontrarse con variables que
mantienen una relacin casi perfecta.
De hecho es en los valores intermedios del intervalo 0 R 2 1 en donde
nos encontraremos normalmente el coeficiente de determinacin de nuestros
modelos. Cuanto ms cerca de cero se encuentre el valor del coeficiente, peor
consideraremos el ajuste realizado. Cuanto ms cerca se encuentre el R 2 de la
unidad, mejor ser el ajuste. Existe una cierta ambigedad con relacin al valor
del R 2 a partir del cul considerar que el modelo tiene un buen ajuste. Es
suficiente con que el modelo explique un 40% de la variacin total de Y, o es
necesario que como mnimo explique un 70%? Un porcentaje de variacin
explicada igual al 10%, debe interpretarse como que el modelo es inservible?
En principio, como para otros estadsticos, no se debe pretender que stos
puedan dar ms informacin que la que contienen. El porcentaje de variacin que
el analista puede considerar como suficiente (tanto para declarar que tiene un
buen ajuste, como para decidir que se trata de un mal ajuste) depende del
problema y de la muestra que se est analizando.
Grfica 15
Grfica 16
8
6
4
2
2
0
0
-2
-4
-6
16
18
20
22
24
26
28
30
-2
-4
-6
32
16
18
20
22
24
26
28
30
32
28
30
32
Grfica 17
Grfica 18
60
40
20
-20
-40
16
18
20
22
24
26
28
30
32
-2
-4
-6
-8
16
18
20
22
24
26
R 2 = rxy2
R 2 = rxy
En el cuadro 7 aparecen los datos sobre los que queremos ajustar la recta de
regresin.
Cuadro 7
X 17 20 23 24 24 25 25 26 28 30
Y 48 60 68 71 66 70 74 83 83 89
Grfica 19
90
80
70
60
50
40
16
18
20
22
24
26
28
30
Cuadro 8
Xi
Yi
X i2
Yi 2
X i Yi
17
20
23
24
24
25
25
26
28
30
48
60
68
71
66
70
74
83
83
89
289
400
529
576
576
625
625
676
784
900
2304
3600
4624
5041
4356
4900
5476
6889
6889
7921
816
1200
1564
1704
1584
1750
1850
2158
2324
2670
X Y X
i =1
i =1
242
712
24,2
71,2
i =1
2
i
5980
Y
i =1
52000
X Y
i =1
i i
17620
32
( X
n
b=
i =1
x )(Yi y )
( X
n
i =1
x)
X Y n x y
i i
i =1
n
X
i =1
2
i
n x2
2
VE =b 2 ( X i x ) =b 2 X i2 n x 2 =3,15212 59801024,2 2 =1228,06
i =1
i =1
i =1
i =1
R2 =
1228,06
= 0,9406
1305,6
-2
-4
-6
16
18
20
22
24
26
28
30
32
Xi
Yi
X i2
Yi 2
X i Yi
17
20
23
24
24
25
25
26
28
30
35
34
32
30
31
33
35
33
31
28
289
400
529
576
576
625
625
676
784
900
1225
1156
1024
900
961
1089
1225
1089
961
784
595
680
736
720
744
825
875
858
868
840
X Y X
i =1
i =1
242
322
24,2
32,2
i =1
2
i
i =1
5980
10414
X Y
i =1
i i
7741
Grfica 21
36
34
32
30
28
26
16
18
20
22
24
26
28
30
32
( X i x )(Yi y )
n
b=
i =1
( X
n
i =1
x)
X Y nx y
i i
i =1
n
X
i =1
2
i
n x2
2
2
VE =b 2 ( X i x ) =b 2 X i2 nx 2 =( 0,41586) 59801024,2 2 =21,3753
i =1
i =1
i =1
i =1
-1
-2
-3
16
18
20
22
24
26
28
30
32
5000
4000
3000
2000
1000
1
10
11
ao
Cuadro 10
Xi
Yi
X i Yi
X i2
Yi 2
1
2
3
4
5
6
7
8
9
10
11
1897,6
2054,3
2063,2
2231,2
2682,2
2868,3
3130,7
3339,4
3635,5
4008
3934,2
1897,6
4108,6
6189,6
8924,8
13411
17209,8
21914,9
26715,2
32719,5
40080
43276,2
1
4
9
16
25
36
49
64
81
100
121
3600885,76
4220148,49
4256794,24
4978253,44
7194196,84
8227144,89
9801282,49
11151592,4
13216860,3
16064064
15477929,6
X
i =1
i Yi
X
i =1
2
i
Y
i =1
2894,96
216447,2
506
98189152,4
( X i x )(Yi y ) X iYi n x y
b= i =1
(X
i =1
x )
= i =1n
X
i =1
2
i
n x 2
216447,2 11 6 2894,96
=
506 11 6 2
25379,84
= 230,726
110
2
VE =b 2 ( X i x ) =b 2 X i2 n x 2 =
i =1
i =1
2
2
=(230,726) 506 11 6 = 5855793,6
i =1
R2 =
VE
5855793,6
=
= 0,976
VT 6000424,983
1100000
Nmero Turistas
1000000
900000
800000
90
100
110
120
130
Cuadro 11
Xi
Yi
X i Yi
X i2
Yi 2
100
95,12
92,68
97,56
109,76
124,39
129,27
126,83
114,63
109,76
1176
1117
1137
1058
1019
1039
901
862
862
823
117600,00
106249,04
105377,16
103218,48
111845,44
129241,21
116472,27
109327,46
98811,06
90332,48
10000,00
9047,81
8589,58
9517,95
12047,26
15472,87
16710,73
16085,85
13140,04
12047,26
1382976
1247689
1292769
1119364
1038361
1079521
811801
743044
743044
677329
X Y
X Y
1100 9994
1088474,60
i =1
i =1
i i
i =1
i =1
2
i
i =1
122659,356
10135898
110 999,4
Si se quiere cuantificar cul es el efecto de las variaciones del tipo
de cambio, podemos aproximar la relacin mediante un ajuste lineal y
discutir el valor de su pendiente. En el cuadro 11 se ofrecen los datos
necesarios y sus transformaciones (el nmero de turistas se presenta en
miles).
n
b=
(X
i =1
x )(Yi y )
(X
i =1
x )
X Y n x y
i =1
n
i i
X
i =1
2
i
n x
( X i x )2 =b 2 X i2 n x 2 =
i =1
i =1
i =1
R2 =
VE 71146,183
=
= 0,48
VT 147894,4
Cuadro 12
Xi
Yi
X i Yi
X i2
Yi 2
3
2
3
3
1
1
1
1
2
9
7
8
7
7
5
5
7
5
27
14
24
21
7
5
5
7
10
9
4
9
9
1
1
1
1
4
81
49
64
49
49
25
25
49
25
X Y X Y X
i
i =1
i =1
17
60
1,889
6,667
i =1
i i
120
i =1
2
i
39
Y
i =1
416
( X i x )(Yi y ) X iYi n x y
b= i =1
(X
i =1
x )
= i =1n
X
i =1
2
i
n x 2
a = y b x =6,667 0,9671,889=4,84
positiva, puesto que el aumento en una unidad del nmero de visitas incrementa
en casi un punto el nivel de satisfaccin de la estancia.
La variacin explicada, variacin no explicada y el coeficiente de
determinacin sern:
n
n
2
2
VE =b 2 ( X i x ) =b 2 X i2 n x 2 =(0,967 ) 399 1,889 2 =6,438
i =1
i =1
i =1
i =1
6,438
=0,403
15,96
Cuadro 13
Pas
Argentina
Brasil
Chile
Colombia
Grecia
India
Jordania
Malaisia
Tasa de
Coeficiente de
Crecimiento
Asimetra
PIB
3,30
0,30
0,20
3,70
0,30
3,40
1,60
4,10
1,80
1,90
0,70
4,50
0,20
6,90
-0,90
5,50
Mercado
Capitales
1,214
6,555
2,219
0,677
0,824
5,373
1,240
11,969
-1,00
3,70
5,611
Mxico
1,50
-0,60
0,576
Nigeria
1,20
6,50
0,643
Paquistn
0,70
1,80
1,495
Filipinas
2,40
2,80
1,591
Portugal
0,60
7,70
6,490
Corea sur
0,60
8,60
7,267
Taiwan
-0,20
6,40
2,004
Tailandia
1,00
4,10
0,487
Turqua
0,20
0,70
1,298
Venezuela
0,00
3,00
0,200
Zimbabwe
Para describir las relaciones se utiliza el modelo de regresin
simple. En las grficas 25 y 26 se muestran las nubes de puntos y la lnea
ajustada por mco.
Grfica 25
4
argentina
3
portugal
2
grecia
colombia
nigeria
1
filipinas
chile
brasil
zimbabwe
venezuela
0
asimetra
paquistn
turquia
india
jordania
tailandia
mxico
-1
malaysia
-2
-2
crecimiento pib
Grfica 26
10
4
argentina
3
portugal
2
grecia
colombia
nigeria
paquistn
turquia
1
f ilipinas
india
corea surtaiwan
asimetra
venezuela
jordania chile
babwe
0
tailandia
brasil
malasia
mxico
-1
-2
0
10
12
14
mercado de capitales
Cuadro 14
Coeficiente
Mercado
PIB
asimetra
Capitales
Yi
3,3
0,2
0,3
1,6
1,8
0,7
0,2
-0,9
-1
1,5
1,2
0,7
2,4
0,6
0,6
-0,2
Xi
0,3
3,7
3,4
4,1
1,9
4,5
6,9
5,5
3,7
-0,6
6,5
1,8
2,8
7,7
8,6
6,4
Zi
1,214
6,555
2,219
0,677
0,824
5,373
1,240
11,969
5,611
0,576
0,643
1,495
1,591
6,490
7,267
2,004
X i Yi
X i2
0,99
0,74
1,02
6,56
3,42
3,15
1,38
-4,95
-3,7
-0,9
7,8
1,26
6,72
4,62
5,16
-1,28
0,09
13,69
11,56
16,81
3,61
20,25
47,61
30,25
13,69
0,36
42,25
3,24
7,84
59,29
73,96
40,96
Z i Yi
Zi2
Yi 2
4,006
1,474 10,89
1,311
42,968 0,04
0,666
4,924
0,09
1,083
0,458
2,56
1,483
0,679
3,24
3,761
28,869 0,49
0,248
1,538
0,04
-10,772 143,257 0,81
-5,611 31,483
1
0,864
0,332
2,25
0,772
0,413
1,44
1,046
2,235
0,49
3,818
2,531
5,76
3,894
42,120 0,36
4,360
52,809 0,36
-0,401
4,016
0,04
1
0,2
0
4,1
0,7
3
0,487
1,298
0,2
4,1
0,14
0
i =1
0,74737
3,94737
3,0386
16,81
0,49
9
Yi
36,23
X
i =1
0,487
0,260
0
0,237
1,685
0,04
n
2
i
411,76
Z Y Z
i =1
11,275
i =1
1
0,04
0
n
2
i
362,068
Y
i =1
30,9
bx =
X Y nx y
i i
i =1
n
X
i =1
2
i
n x2
bz =
Z Y nz y
i i
i =1
n
Z
i =1
2
i
nz2
b 2 X i2 n x 2
2
2
VE
= ( 0,1713) (411,76193,94737 )= 3,396 =0,16739
R x2 = = ni =1
20,287
VT
30,9190,74737 2
Yi 2 n y 2
i =1
VE
=
R =
VT
2
z
n
b 2 Z i2 n z 2
i =1
n
Y
i =1
n y2
5,4428
= 0,2683
20,287
Grfica 27
30
Espaa
20
Italia
Irlanda
Francia
Blgica
Grecia
Holanda
10
Dinamarca
Alemania
Reino Unido
Portugal
0
0
10
20
30
40
50
60
70
(Tasa Paro Femenino) = 16,66 0,1513 (Tasa empleo femenino a tiempo parcial )
El valor del coeficiente de determinacin es igual a 0,20, es decir, que las
variaciones de las tasas de paro femenino vendran explicadas en un 20% por
las variaciones en la tasa de empleo con dedicacin parcial. Una conclusin que
parece desprenderse del anterior anlisis es la de que un aumento de la
flexibilidad del mercado laboral, favoreciendo el empleo a tiempo parcial, tendra
un impacto positivo, al reducir la tasa de paro femenina.
Cuadro 15
Pendiente
0,92
0,96
0,83
1,24
0,98
0,70
0,99
0,81
1,21
Correlacin
0,92
0,89
0,91
0,74
0,66
0,79
0,90
0,79
0,98
Pendiente
1.36
1,43
1,18
2,34
2,11
1,13
1,45
1,03
1,72
Correlacin
0,79
0,77
0,75
0,82
0,84
0,75
0,77
0,58
0,81
C. Valenciana
Extremadura
Galicia
Madrid
Murcia
Navarra
Pas Vasco
La Rioja
0,82
0,55
0,74
1,23
0,95
1,04
1,18
0,67
0,81
0,49
0,92
0,92
0,86
0,90
0,88
0,73
1,41
0,91
1,13
1,66
1,56
1,46
1,44
1,16
0,83
0,48
0,82
0,73
0,82
0,74
0,62
0,74
Cuadro 16
pas
Alemania
Australia
Austria
Blgica
Canad
Dinamarca
Espaa
Finlandia
Francia
Grecia
Holanda
Irlanda
Islandia
Italia
Japn
Luxemburgo
Tasa
crecimiento
PIB per capita
1960-1990
2,65
2,22
3,21
3,08
2,84
2,56
3,75
3,45
2,94
3,96
2,40
3,49
3,44
3,44
5,39
2,62
75,13
50,10
20,77
67,85
67,26
97,20
17,43
100
N. Zelanda
Noruega
Portugal
Reino Unido
Suecia
Suiza
Turqua
EEUU
1,31
3,23
4,08
2,16
2,40
1,89
2,96
1,94
Cuadro 17
n
X i2
i =1
55,041
2,975
Yi 2
i =1
84019,975 229,493
X
i =1
Yi
3581,841
(X
b = i =1
x ) (Yi y )
(X
i =1
x)
X Y n x y
i
= i =1n
X
i =1
2
i
n x 2
n
n
2
2
VE =b 2 ( X i x ) =b 2 X i2 n x 2 =( 0,0307 ) (84019,97524 55,0412 )=10,661
i =1
i =1
i =1
10,661
R2 =
=0,624
17,078
En la grfica 28 se representa el ajuste de la tasa de crecimiento del PIB
per capita respecto al ndice de 1960. La posicin de partida describe, por tanto,
bastante bien cul es la tasa de crecimiento que los pases han alcanzado en el
perodo. Cuanto mejor situado estaba el pas en 1960, menor ha sido su tasa de
crecimiento en los siguientes aos. Resulta llamativo observar que de los seis
pases en peor posicin en 1960 (Espaa, Irlanda, Japn, Portugal, Grecia y
Turqua) cinco de ellos se encuentran entre los primeros en su tasa de
1
0
20
40
60
80
100
120
= + ( Nivel de renta )i
1 n
s = log( yit ) log( y t )
n i =1
2
t
st2 =
1 n
log( yit ) log( y t )
n i =1
)=
2
(
)=
1
= (a + ( b + 1) log( y ) a ( b + 1) log( y ) ) =
n
1
= ((b + 1) (log( y ) log( y ) )) =
n
=
1 n
a + (b + 1) log( yit 1 ) a (b + 1) log( yt 1 )
n i =1
it 1
i =1
t 1
i =1
it 1
t 1
1 n
= (b + 1) log( yit 1 ) log( y t 1 )
n i =1
2
= (b + 1) st21
2
= a + b Salarioi
CCAA
Asturias
Pas Vasco
Salario
industrial
medio 1978
(media
nacional
igual a 100)
127,97
123,31
Tasa de
variacin
1978-1990
2,827
2,966
Madrid
Cantabria
Catalunya
Navarra
Aragn
Castilla-Len
Andaluca
Canarias
Galicia
Valencia
La Rioja
Murcia
Baleares
Castilla La Mancha
Extremadura
Fuente: Prez Domnguez
Encuesta Industrial del INE.
111,74
3,119
106,11
2,869
103,86
2,979
103,22
2,858
96,46
3,104
94,05
3,136
89,87
2,870
88,91
2,732
88,59
2,824
85,37
2,693
82,32
2,688
76,05
2,590
74,28
2,962
73,15
2,740
62,70
2,873
(1995), empleando la
Cuadro 19
n
X
i =1
i Yi
i =1
4578,949
2
i
153395,785
Y
i =1
140,657
93,409
2,872
b=
X
i =1
n
X
i =1
Yi n x y
2
i
nx2
VE
=
R =
VT
2
b 2 X i2 n x 2
i =1
Y
i =1
n y
= 0,15
Grfica 29
3,2
Cast.-Len
Aragn
Madrid
3,1
3,0
Catalunya
Baleares
2,9
Extremadura
Andaluca
Pas Vasco
Cantabria
Navarra
Asturias
Galicia
2,8
Cast.-Mancha
Canarias
Valencia
La Rioja
2,7
Murcia
2,6
2,5
50
60
70
80
90
100
110
120
130
140
74,90
77,10
75,90
76,20
77,20
74,40
76,00
78,70
74,60
77,10
74,50
76,20
74,10
76,40
77,20
77,60
75,40
75,90
75,00
Finlandia
Francia
Alemania
Grecia
Islandia
Irlanda
Italia
Japn
Luxemburgo
Holanda
Nueva Zelanda
Noruega
Portugal
Espaa
Suecia
Suiza
Turqua
UK
EEUU
13,50
10,20
10,90
5,20
14,80
6,40
7,50
15,60
12,50
11,70
9,00
15,30
4,70
4,40
13,30
9,90
2,10
6,50
5,10
Cuadro 21
n
X
i =1
9,1875
75,975
2
i
i =1
2355,21
138564,7
X
i =1
Yi
16799,23
X Y n x y
b= i =1n
X
i =1
2
i
n x 2
Y el coeficiente de determinacin:
b 2 X i2 n x 2
0,142 2 2355,21 24 9,1875 2
i =1
2 VE
=
= 0,21
R = =
n
VT
138564,7 24 75,975 2
2
2
Yi n y
i =1
Grfica 30
79
Japn
78
Suiza
Holanda
Francia
77
Canad
Suecia
Australia
Espaa
Grecia
Esperanza de vida
Noruega
Italia
UK
76
Islandia
Alemania
Austria
Turqua
EEUUDinamarca
75
Finlandia
Blgica
Luxemburgo
N. Zelanda
Irlanda
Portugal
74
1
11
13
15
17
BIBLIOGRAFA
Akdogan, H., 1997, International security selection under segmentation: Theory
and application, The Journal of Portfolio Management, vol. 24, n. 1, pgs. 8292.
Barro, R.J., 1991, Economic growth in a cross section of countries, Quaterly
Journal of Economics, n. vol. 106, n. 2, pgs. 407-443.
Bekaert, G., C.B. Erb, C.R. Harvey y T.E. Viskanta, 1998, Distributional
Characteristics of Emerging Market Returns and Asset Allocation, The Journal
of Portfolio Management, vol. 24 n. 2, Winter, pgs. 102-116.
Boyle, G.E. y T.G. McCarthy, 1997, A simple measure of -convergence,
Oxford Bulletin of Economics and Statistics, vol. 59, n. 2, pgs.257-264.
Camino, D., 1997, Efectos intrada y da de la semana en la Bolsa de Madrid.
Informacin y Volumen de contratacin, Revista Espaola de Financiacin y
Contabilidad, vol. XXVI, n 90, pgs. 51-75.
Domnech, R., M. Fernndez y D. Taguas, 1997, La fiscalidad sobre el trabajo y
el desempleo en la OCDE, Papeles de Economa Espaola, n. 72, pgs. 178191.
Ferruz, L. y J.L. Sarto, 1997, Revisin crtica de las medidas clsicas de
performance de carteras y propuesta de ndices alternativos. Aplicacin a fondos
de inversin espaoles (1990-1995), Boletn de Estudios Econmicos, vol. LII,
n. 162, Diciembre, pgs. 549-573.
Friedman, M., 1992, Do old fallacies ever die?, Journal of Economic
Literature, vol. 30, pgs. 2129-2132.
Govern Balear, 1991, El gasto turstico 1990, Direcci General dEconomia,
Palma de Mallorca.
Johnson, P. y G. Stears, 1998, Why are older pensioners poorer?, Oxford
Bulletin of Economics and Statistics, vol. 60, n 3, pgs. 271-290.
Juhn, C. y K.M. Murphy, 1996, Wage inequality and family labor supply,
Working Paper 5450, NBER Working Paper Series, Cambridge, MA.