Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Regresin y Correlacin
1
Introduccin
Muchas veces las decisiones se basan en la relacin entre
dos o ms variables. Ejemplos:
2
Relacin estadstica entre dos
variables
Las observaciones no caen exactamente sobre la
curva de relacin entre las variables
Ejemplo 1:
3
Figura 1
Relacin estadstica entre tamao del lote y
horas hombre
180
160
Horas hombre
140
120
100
80
60
Horas hombre
40
20
0
0 10 20 30 40 50 60 70 80 90
6000
5000
4000
3000
2000
1000
0
0 2 4 6 8 10 12 14 16
7
Coeficiente de correlacin
lineal
El Coeficiente de Correlacin (r)
requiere variables medidas en escala de
intervalos o de proporciones
Vara entre -1 y 1.
Valores de -1 1 indican correlacin perfecta.
Valor igual a 0 indica ausencia de correlacin.
Valores negativos indican una relacin lineal
inversa y valores positivos indican una relacin
lineal directa
8
Correlacin Negativa Perfecta
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
9
Correlacin Positiva Perfecta
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
10
Ausencia de Correlacin
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
11
Correlacin Fuerte y Positiva
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
12
Frmula para el coeficente de
correlacin (r) . Pearson
n(XY) (X)(Y)
r=
[ n(X ) (X) ] [ n( Y ) ( Y)
2 2 2 2
]
13
Modelos de Regresin
14
Modelos de Regresin
15
Anlisis de Regresin
Objetivo: determinar la ecuacin de regresin para
predecir los valores de la variable dependiente (Y)
en base a la o las variables independientes (X).
Procedimiento: seleccionar una muestra a partir de
la poblacin, listar pares de datos para cada
observacin; dibujar un diagrama de puntos para
dar una imagen visual de la relacin; determinar la
ecuacin de regresin.
X: X1 X2 X3 X4 .. Xn Y: Y1 Y2 Y3 Y4 . Yn
(X,Y): (X1,Y1), (X2,Y2), (X3;Y3), , (Xn,Yn)
16
Proceso de estimacin de la regresin lineal simple
Modelo de regresin Datos de la muestra
y=0+1x+ x y
x1 y1
Ecuacin de regresin x2 y2
E(y)=0+1x . .
Parmetros desconocidos . .
0, 1 . .
xn yn
Ecuacin estimada de
b0 y b1 regresin
y=b0+b1x
proporcionan estimados Estadsticos de la muestra
de 0 y 1 b0 y b1
17
Lneas posibles de regresin en la
regresin lineal simple
Seccin A Seccin B Seccin C
Relacin lineal positiva Relacin lineal negativa No hay relacin
Ey Ey Ey
La pendiente 1
Lnea de regresin * es negativa La pendiente 1
es 0
* La pendiente 1 *
es positiva Lnea de regresin Lnea de regresin
x x x
* Ordenada al origen 0
18
Estimacin del Modelo de Regresin
Lineal Simple
Y= a + bX, donde:
Y es el valor estimado de Y para distintos X.
a es la interseccin o el valor estimado de Y cuando X=0
b es la pendiente de la lnea, o el cambio promedio de Y
para cada cambio en una unidad de X
el principio de mnimos cuadrados es usado para obtener a
y b: n( XY ) ( X )( Y )
b
n( X 2 ) ( X ) 2
Y X
a b
n n
19
Coeficiente de Determinacin
20
MODELO DE REGRESIN NO
LINEAL (Polinomial)
= b0 +b1X + b2X2 + .+bnXn
21
Ejemplo
Se desean comparar las mediciones del ndice de fertilidad de
lotes de terreno realizadas por tres sensores y su relacin con los
rendimientos reales por parcelas de lotes de maz. Los
rendimientos (Y) y los ndices dados por cada uno de los 3
sensores se presentan a continuacin :
45,95
Rendimiento 38,41
30,87
23,33
15,79
0,078 0,092 0,107 0,121 0,135
Lecturas del S3
Rendimiento
PRED_Rendimiento
Lecturas del S3
Y = 338.71*X - 4.87
23
R2 = 0.32
Ttulo
45,95
Rendimiento
38,41
30,87
23,33
15,79
0,22 0,26 0,30 0,34 0,37
Lecturas del S2
Rendimiento
PRED_Rendimiento
Lecturas del S2
Y = 155.37*X 13.25
R2 = 0.57
24
Ttulo
45,95
_Rendimiento
38,41
30,87
23,33
15,79
0,071 0,076 0,081 0,087 0,092
Lecturas del S1
Rendimiento
PRED_Rendimiento
Lecturas del S1
Y = -1004.34*X +112.24
R2 = 0.44 25
MODELO DE REGRESIN NO
LINEAL (CUADRTICO)
PARA S1:
= 118,095 - 1151,92X + 924,834X 2 R2=0,44
PARA S2:
= -42,97 + 357,271X - 340,869X 2 R2=0,576
PARA S3:
= -27,926 + 763,856X 1949,609X 2 R2=0,321
26
OTROS EJEMPLOS
A CONTINUACIN SE PRESENTAN LOS PESOS DE
Y LOS NIVELES DE COLESTEROL DE 10 PACIENTES
OBESOS:
X : 89 98 110 115 99 115 94 110 112 102
Y: 135 138 275 315 190 295 180 254 320
223
X= 1044 Y= 2325 XY= 248195
X2=10404 Y2=584289
Reemplazando tenemos: a=-511,949 b=7,131
27
CONCLUSIN:
EL SENSOR QUE D LAS
MEJORES MEDICIONES ES EL
3, POR TENER EL MAYOR
COEFICIENTE DE
DETERMINACIN
28
Los datos de la siguiente tabla representan las
estaturas (X, cm) y los pesos (Y, kg) de una
muestra de 12 hombres adultos. Para cada estatura
fijada previamente se observ el peso de una
persona seleccionada de entre el grupo con dicha
estatura, resultando:
X152 155 152 155 157 152 157 165 162 178 183 178
Y 50 61.5 54.5 57.5 63.5 59 61 72 66 72 84 82
Con estos datos vamos a plantear una ecuacin de
regresin lineal simple que nos permita
pronosticar los pesos conociendo las tallas.
29
Luego,
b = 1223 / 1409.667 = 0.8676
a = 65.25 (0.8676) (162.167) = -75.446
La ecuacin de regresin estimada es:
Coeficiente de correlacin: R= 0.9379
Coeficiente de determinacin: R=0.8796
=-75,446 + 0,8676X
30
El valor de b = 0.8676 indica el incremento del peso en kilogramos,
en promedio, por cada centmetro de aumento en la estatura de los
hombres adultos.
Cunto se espera que pese (en promedio) una persona que mide
1.60 m?
Sustituyendo el valor de inters en la ecuacin:
=-75,446 + 0,8676X
Se obtiene: =-75,446 + 0,8676(160)=63,37 kgs.
31