Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Generalidades de La Regresión
Generalidades de La Regresión
Regresin lineal
Este tema, prcticamente ntegro, est calacado de los excelentes
apuntes y transparencias de Bioestadstica del profesor F.J. Barn Lpez
de la Universidad de Mlaga.
Te recomiendo visitar su pgina de apuntes y vdeos:
http://www.bioestadistica.uma.es/baron/apuntes/
Conclusin: los padres muy altos tienen tendencia a tener hijos que
heredan parte de esta altura, aunque tienen tendencia a acercarse
(regresar) a la media. Lo mismo puede decirse de los padres muy
bajos.
Francis Galton
Altura
en cm.
Peso
en Kg.
162
61
154
60
180
78
158
62
171
66
169
60
166
54
176
84
163
68
...
...
100
90
Pesa 76 kg.
80
70
60
Pesa 50 kg.
50
Mide 161 cm.
40
30
140
150
160
170
180
190
200
100
90
80
70
60
50
40
30
140
150
160
170
180
190
200
100
90
80
70
10 kg.
60
50
10 cm.
40
30
140
150
160
170
180
190
200
100
Descorrelacin
90
80
230
Fuerte relacin
directa.
70
180
60
130
50
80
40
30
140
30
150
160
170
180
190
200
140
150
160
170
180
190
200
80
Cierta relacin
inversa
70
60
50
40
30
20
10
0
140
150
160
170
180
190
200
330
Poca relacin
280
90
80
230
Fuerte relacin
directa.
70
180
60
130
50
80
40
30
30
140
150
160
170
180
190
200
Cierta relacin
inversa
60
50
40
30
20
10
0
140
150
160
170
180
190
150
160
170
180
190
200
80
70
140
200
1
S xy = ( xi x )( yi y )
n i
r=
S xy
SxS y
Propiedades de r
Es adimensional.
Slo toma valores en [-1,1].
Las variables son descorreladas r = 0.
Relacin lineal perfecta entre dos variables r = +1 o r = -1.
Excluimos los casos de puntos alineados horiz. o verticalmente.
-1
Variables
incorreladas
Relacin
directa
casi
perfecta
+1
r=0,1
150
160
170
180
190
200
130
120
110
100
90
80
70
60
50
40
30
140
110
100
100
90
90
80
80
150
160
170
180
190
200
70
70
60
60
50
50
r=0,6
40
30
140
r=0,4
150
160
170
180
190
r=0,8
40
200
30
140
150
160
170
180
190
200
100
90
90
80
80
70
70
60
60
50
50
r=0,9
40
30
140
150
160
170
180
190
200
100
90
80
70
60
50
r=1
40
30
140
150
160
170
180
190
r=0,99
40
200
30
140
150
160
170
180
190
200
80
20
10
0
20
70
60
50
40
30
r=-0,5
140
150
160
170
180
190
200
0
140
80
80
70
70
60
60
50
50
40
40
30
30
20
20
10
0
140
r=-0,95
150
r=-0,7
10
10
160
170
180
190
200
150
160
170
180
190
200
160
170
180
190
200
r=-0,999
0
140
150
X = Variable independiente
predictora, controlada, no es una variable aleatoria.
explicativa
= b 0 + b1X
b0 = 85 cm (No interpretar como altura de un hijo cuyo padre mide
0 cm Extrapolacin salvaje!)
b1= 0,5 (En media el hijo gana 0,5 cm por cada cm del padre.)
180
b1=0,5
150
120
90
60
b0=85 cm
30
0
220
210
200
190
180
170
160
150
140
130
120
110
100
90
80
70
60
50
40
30
20
10
180
b1=0,5
150
120
90
60
b0=85 cm
30
0
220
210
200
190
180
170
160
150
140
130
120
110
100
90
80
70
60
50
40
30
20
10
i ei2 = i (Yi - )2
b1 = r
Sy
Sx
r=
b0 = y b1 x
S xy
SxS y
y = y + b1 ( x x )
Cometi un
error de - 30 en
su ltima
prediccin
Interpretacin de la variabilidad en Y
En primer lugar olvidemos que
existe la variable X. Veamos cul
es la variabilidad en el eje Y.
La franja sombreada indica la zona
donde varan los valores de Y.
Proyeccin sobre el
eje Y = olvidar X.
Bondad de un ajuste
Resumiendo:
La dispersin del error residual ser una
fraccin de la dispersin original de Y.
S
R = 1
S
2
2
e
2
y
S < S
2
e
2
Y