Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ME MINAS GEOLOGÍA Y
METALURGÍA
“SANTIAGO ANTÚNEZ DE
MAYOLO” ESCUELA ACADÉMICO
PROFESIONAL ING MINAS.
REGRESIÓN
LINEAL
1
Lic. Martha Vanessa Poma Blas.
Independencia - Dependencia
Cuando se estudian dos características simultáneamente sobre
una muestra, se puede considerar que una de ellas influye sobre
la otra de alguna manera. Por ejemplo la altura y el peso o las
horas de estudio y la calificación en un examen.
El objetivo principal de la regresión es descubrir el modo en que
se relacionan.
Dos variables pueden considerarse:
Variables independientes No tienen relación (una de ellas no
sirve para explicar los movimientos de la otra)
Dependencia funcional Y=f(x)
Dependencia estadística
Dependencia
Independencia estadística Dependencia funcional
estadística
- +
2
3
GRÁFICOS DE DISPERSIÓN: Permite ver si hay asociación
Asociación
positiva. Si
aumenta X
aumenta Y
4
GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN
La relación entre dos variables métricas puede ser representada mediante la línea
de mejor ajuste a los datos. Esta recta se le denomina recta de regresión, que puede
ser negativa o positiva, la primera con tendencia decreciente y la segunda creciente
y la otra ninguna relación.
y = a + bx
7
ANALISIS DE REGRESIÓN LINEAL
yn
yn 1 yˆ i
y3
u3 ui
yi
y1 yi
y2
Intercepto
x1 x2 x3 xi xn 1 xn
yi a bxi i ui yi yˆi
Error
ANALISIS DE REGRESIÓN LINEAL
y i a bxi
IDEA: hacer MÍNIMA la suma de los CUADRADOS de los residuos.
n n
u ( yi yˆi )
2
i
2
u
i 1
2
i (y
i 1
i y
ˆi ) 2
n n n
2
min
a ,b
i1
ui
2
i 1
( yi ˆ
y i ) 2
i 1
yi a bxi
EQUIVALE a buscar los coeficientes de la recta hace MÍNIMA la suma de los
CUADRADOS de los residuos.
1 n 1 n
Covarianza S xy ( xk x )( yk y ) xk yk x y
n k 1 n k 1
¿Es la recta de regresión una buena aproximación de la nube de puntos?
Coeficiente de determinación:
n
Diferencia entre el valor estimado y la
yˆ y
2
k media observada
R 2
k 1
n
Diferencia entre lo observado y la media
y y
2
k 1
k
observada
S 2
yˆi
2
y SY 1 XY
S 2
u i
S X SY
N
Coeficiente de correlación lineal de Pearson r:
S XY S XY S XY
yˆi y 2 x 2 xi y r
SY
xi x r
SX SX SX S X SY
Covarianza de dos variables X e Y
1 n 1 n
S xy ( xk x )( yk y ) xk yk x y
n k 1 n k 1
-1 0 +1
ANALISIS DE REGRESIÓN LINEAL
a Y bX A Y BX
b
cov( x, y ) B
XY nXY
v( x) X nX 2 2
17
y obtenemos que la recta de regresión de Y sobre X: y = a + bx
con los valores a y b anteriormente calculados, o bien la siguiente expresión:
S xy
y y
2
x x
Sx
Aplicando el mismo razonamiento llegaríamos a la expresión de la recta de
R r
2 2 2
S xy S xy S xy
2
R bb' r 2
S x2 S y2 S x S y xy
xy
Valor Significado
-1 Correlación negativa grande y perfecta
-0,9 a -0,99 Correlación negativa muy alta
-0,7 a -0,89 Correlación negativa Alta
-0,4 a -0,69 Correlación negativa moderada
-0,2 a -0,39 Correlación negativa baja
-0,01 a -0,19 Correlación negativa muy baja
0 Correlación nula
0,01 a 0,19 Correlación positiva muy baja
0,2 a 0,39 Correlación positiva baja
0,4 a 0,69 Correlación positiva moderada
0,7 a 0,89 Correlación positiva alta
0,9 a 0,99 Correlación positiva muy alta
S XY
yˆ 0 aq bpx0 y 2 x0 x
SX
Las estaturas y pesos de 10 jugadores de baloncesto de
un equipo son:
Estatura
186 189 190 192 193 193 198 201 203 205
(X)
Pesos
85 85 86 90 87 91 93 103 100 101
(Y)
Calcular:
La recta de regresión de Y sobre X.
El coeficiente de correlación.
El peso estimado de un jugador que mide 208 cm.
25