Está en la página 1de 22

SESIÓN 4.

REGRESIÓN LINEAL
REGRESION LINEAL
• Surge cuando se eligen “n” valores como: , x1, x2,…,xn pertenecientes
a la variable X, llamada variable independiente y posteriormente
también se mide los valores de ,y1, y2,…yn correspondientes a la
variable Y a la cual se le denominará variable dependiente

De tal manera se obtiene

• Si los representamos en un plano cartesiano se tiene:


• Como se observa no existe una tendencia lineal definida porque
si recurrimos al criterio personal cada uno elige su tendencia
por lo cual habría mucha diferencia, para dar solución
matemática se determina en este sentido la ecuación de la recta
=a +bx. Que es la que mejor se ajusta a los valores de la
muestra con el fin de poder predecir o estimar “y” (variable
dependiente) a partir de “X” (variable independiente).
Estimación de la Ecuación de Regresión
• La línea de regresión muestral proporciona un estimado de la línea de
regresión poblacional
Valor Estimado del Estimado de la
predecido de intercepto de pendiente de
y regresión regresión

Variable
y * independiente

ŷ  b 0  b1x

• Los términos de errores individuales (ei) tienen una media de cero


• Hallar la función lineal = a+bx consiste en determinar los valores de
a y b a partir de los datos de la muestra para lo cual daremos un trato
matemático adecuado por tanto, usaremos la notación yi para
representar el valor calculado de (Y) de la ecuación = a+bx.
• A partir de Xi. Al valor de y se denomina valor estimado o ajustado
de “y” cuando Xi=xi
• Xi es el valor de la muestra, a partir del cual será calculado el valor
de Y, para demostrar que los errores sean mínimos acudimos al
siguiente gráfico:
El modelo de regresión permite describir como influye una variable X
sobre otra variable Y .
• X: Variable independiente o explicativa o exógena

• Y: Variable dependiente o respuesta o endógena

El objetivo es obtener estimaciones razonables de Y para distintos valores


de X a partir de una muestra de n pares de valores (x1, y1), . . . ,(xn, yn).
a es el origen y di = b es la pendiente de la recta y permite obtener su grado de
inclinación (en relación a la horizontal o abscisa),  y n (a) es el coeficiente
de posición, el número que señala el punto donde la recta interceptará al eje
Yi-Ŷ= error de las ordenadas (y).

Forma simplificada de la ecuación de la recta


Si se conoce la pendiente b , y el punto donde la
recta corta al eje de ordenadas es ( 0, a )
n
(corresponde a (a), (n) ), podemos deducir,
partiendo de la ecuación de la recta de la forma
y − y 1 = b(x − x 1 )
y – a  = b(x – 0)
y – a = bx
𝐝 𝐢=𝐲 𝐢 − ^𝐲 y = bx + a
• El método adecuado para determinar la recta que mejor
se ajusta a los “n” datos de la muestra (Xi, Yi) es el
método de los mínimos cuadrados el cual minimiza la
suma de los cuadrados de errores.
• Para dar solución a este problema se aplica la derivación
y así obtener un sistema de ecuaciones así:
• Sistema de ecuaciones
n n
an+b  xi   yi ……….1
i 1 i 1
n n n
a  xi  b  xi ²=  x. y …….2
i 1 i 1 i 1
• Son datos conocidos mientras que a y b son datos
desconocidos.
n n n
Aquí: n,  xi ,  yi ,  xi.yi
i 1 i 1 i 1
• Existen varios métodos para resolver esta ves aplicaremos las
determinantes así:

b=
Estimación de la ecuación de Regresión Simple

Y’= a + bx, donde:


• Y = Variable independiente, Y’ es el valor estimado de Y para distintos X.
• X = Variable dependiente
• a es la intersección o el valor estimado de Y cuando X=0
• b es la pendiente de la línea, o el cambio promedio de Y’ para cada cambio en una unidad de X
• el principio de mínimos cuadrados es usado para obtener a y b:

y*

𝒏∑ 𝒙 . 𝒚 −∑ 𝒙 ∑ 𝒚
𝐛= a
𝒏∑ 𝒙 𝟐 −(∑ 𝒙)𝟐

Ó ---- c*
INTERPRETACION DEL COEFCIENTE DE
REGRESION (b)
• El coeficiente b es la pendiente, de acuerdo a esto se tiene:  
• Si b>0: la tendencia lineal es creciente.
• Si b<0: la tendencia es decreciente.
• Si b=0: No hay regresión entonces, entonces Y permanece
estacionario para cualquier valor de X.
Ejemplo1: Se tiene los resultados de los análisis X contra los
análisis (Y) de 5 muestras de mineral las cuales son:

(2,3), (3,4), (4,5), (6,8), (7,10)


Se pide: Determinar y graficar la recta de regresión mínimo
cuadrática y estimar el valor de Y cuando X = 4.5
Solución.
• Primeramente construimos una tabla así
Tabla

Xi Yi X*Y X2
2 3 6 2
3 4 12 9
4 5 20 16
6 8 48 36
7 10 70 49
22 30 156 114
Hallamos b

𝑛 𝑛 𝑛
𝑛 ∑ 𝑥𝑖 . 𝑦𝑖 − ∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑖 =1 𝑖 =1 𝑖= 1
𝑏= 𝑛 𝑛
𝑛 ∑ 𝑥𝑖 2 − ( ∑ 𝑥𝑖 ) 2
𝑖= 1 𝑖= 1
Luego remplazamos valores.

𝟓 ( 𝟏𝟓𝟔 ) −(𝟐𝟐)(𝟑𝟎)
𝒃=
𝟓 ( 𝟏𝟏𝟒 ) − ( 𝟐𝟐 ) 𝟐

𝟕𝟖𝟎 − 𝟔𝟔𝟎
𝒃=
𝟓𝟕𝟎 − 𝟒𝟖𝟒

𝟏𝟐𝟎
𝒃= =𝟏 . 𝟑𝟗𝟓
𝟖𝟔
• Para lo cual hallamos las medias tanto de x como de y los datos
extraemos de la tabla.
𝒏

∑ 𝒚𝒊
𝟑𝟎
𝒊=𝟏
𝒀= = =𝟔
𝒏 𝟓

=
• Hallamos el valor de a en la ecuación
donde a= - 0.138
adjunta

a
a
a
• Entonces la recta será:

=a

=
• Luego remplazamos en la Ec. (1), calculamos el valor de Y
cuando

X es 4.5
=

• Entonces para graficar se sabe que a es el origen y la


pendiente es el par ordenado de ambas medias de x y de y
2. Ejemplo. En un estudio sobre la producción de plata y oro en
onzas durante 10 semanas se han obtenido los siguientes reportes.
Calcular la recta de regresión y el índice de correlación.

Semana 1 2 3 4 5 6 7 8 9 10
Plata 10 20 30 40 30 25 30 28 29 35
Oro 15 25 20 45 25 30 28 29 36 38

También podría gustarte