Documentos de Académico
Documentos de Profesional
Documentos de Cultura
lineal simple
100
90
80 Pesa 76 kg.
70
30
140 150 160 170 180 190 200
Relación entre variables.
Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de
dispersión.
100 u r a
alt
n la
90 co
en ta
80
aum
es o
70
el p
que
60
re ce
P a
50
40
30
140 150 160 170 180 190 200
Predicción de una variable en función de la otra.
Aparentemente el peso aumenta 10Kg por cada 10 cm de altura... o sea,
el peso aumenta en una unidad por cada unidad de altura.
100
90
80
70
10 kg.
60
50
40 10 cm.
30
140 150 160 170 180 190 200
Cómo reconocer relación directa e inversa.
330 100
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
230
o80 directa.
180
70 o
60
130
o 50 o
80 40
30 o30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Dado un valor de X no podemos decir gran •Conocido X sabemos que Y se mueve por
cosa sobre Y. Mala relación. Independencia. una banda estrecha. Buena relación.
-1 0 +1
Entrenando el ojo: correlaciones positivas
330 130
120
280 110
230 100
90
180 80
70
130 60
80 50
r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
110 100
100 90
90 80
80
70
70
60
60
50 50
40 r=0,6 40 r=0,8
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Entrenando el ojo: casi perfectas y positivas
100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,9 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
100
90
80
70
60
50
40 r=1
30
140 150 160 170 180 190 200
Entrenando el ojo: correlaciones negativas
90 80
80 70
70 60
60 50
50
40
40
30
30
20 20
10 r=-0,5 10 r=-0,7
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Preguntas frecuentes
¿Si r=0 eso quiere decir que no las variables son
independientes?
En la práctica, casi siempre sí, pero no tiene
por qué ser cierto en todos los casos.
Lo contrario si es cierto: Independencia
implica incorrelación.
180
150 b1=0,5
120
90
60
b0=85 cm
30
0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
La relación entre las variables no es exacta. Es natural
preguntarse entonces:
Cuál es la mejor recta que sirve para predecir los valores de Y
en función de los de X
Qué error cometemos con dicha aproximación (residual).
180
150 b1=0,5
120
90
60
b0=85 cm
30
0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
El modelo lineal de regresión se construye utilizando la técnica de
estimación mínimo cuadrática:
Buscar b0, b1 de tal manera que se minimice la cantidad
Σi ei2
SY
b1 r b0 y b1 x
SX
Se obtiene además unas ventajas “de regalo”
El error residual medio es nulo
La varianza del error residual es mínima para dicha estimación.
2
S
R 12 e
2
S Y
S 2
e S 2
Y
Resumen sobre bondad de un ajuste
La bondad de ajuste de un modelo de regresión se mide usando el
coeficiente de determinación R2
Incluso se puede considerar el 140 150 160 170 180 190 200
que una variable dependa de
varias (regresión múltiple). ¿recta o cúbica?
Simple Múltiple
1 164 57
2 168 57
3 140 59
4 170 59
5 185 60
6 154 61
7 169 61
8 172 62
9 144 63
10 162 64
11 158 65
12 162 65
13 176 65
14 176 66
15 158 67
16 170 67
17 172 68
18 184 68
19 175 69
20 180 70