Está en la página 1de 12

06/04/2022

MODELO DE REGRESIÓN Y
CORRELACIÓN LINEAL

Capítulo IV

CAPITULO IV
4.1 REGRESIÓN LINEAL
4.1.1 Definición y Modelos de regresión
Hasta ahora vimos el análisis de una variable, en este capítulo trataremos
el estudio conjunto de dos variables numéricas, es decir, el análisis y la
representación bidimensional de un par de variables cuantitativas más sus
gráficos, y la eventual relación estadística existente entre variables.

Existen modelos Lineales y No Lineales y la diferencia fundamental, y la


base para los nombres de los análisis, son las formas funcionales del
modelo. Específicamente, la regresión lineal requiere parámetros lineales
mientras que la no lineal presenta una forma curvilínea.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 2

1
06/04/2022

CAPITULO IV
Los Modelos de Regresión estudian la relación estocástica cuantitativa
entre una variable de interés y una o varias variables explicativas.
Es decir: Y = m (X1 ,X2 ,….., Xk ) + B + ε
Es así que, debemos determinar primero cual de las dos variables es la
variable dependiente (Y), y cual será la independiente (X). De esta manera:
- La variación presente en una de las variables ocasiona un cambio del
valor presente en la otra variable.
- Será posible predecir la variable dependiente numérica, a partir de los
valores de X (variable independiente).
- El modelo lineal o ajuste lineal de los datos es valido entre las ambas
variables.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 3

CAPITULO IV
Para realizar el análisis estadístico de dos variables, de tipo cuantitativo,
se proponen los siguientes pasos o etapas de análisis.

Primera Etapa del Análisis de Regresión Lineal:


Realizar un grafico para juzgar visualmente si la relación es lineal.

El Diagrama de Dispersión, es una grafica en la que cada punto trazado,


representa un par de valores observados de las variables independiente y
dependiente. El valor de la variable independiente “X” se identifica
respecto del eje horizontal, y el valor de la variable dependiente “Y” se
identifica respecto del eje vertical.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 4

2
06/04/2022

CAPITULO IV

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 5

CAPITULO IV
Una vez realizado el Diagrama de Dispersión, si la nube de puntos es
ascendente podemos decir que la relación entre las dos variables es
Directa, es decir si aumenta de valor X también aumentará de valor Y.

En cambio si la relación es descendente, las variables tienen una


asociación Inversa o negativa, mientras aumente el valor de X menor será
el valor de Y.

Si no es ascendente o descendente, es decir paralelo a los ejes o sin


orientación, se concluye que no existe relación estadística entre las dos
variables. Y en la situación más adversa no existirá ninguna forma o
relación entre las dos variables.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 6

3
06/04/2022

CAPITULO IV
Ejemplo de Aplicación: Las empresas de energía eléctrica, que deben
planear la operación y expansión de generación de electricidad, están muy
interesadas en pronosticar la demanda de energía.

Se realizó un estudio a corto plazo para investigar el efecto de la


temperatura media diaria de cada mes y el consumo medio diario (en
kWh) por familia. Se obtuvieron datos durante 2 años.

Los datos son los siguientes:

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 7

CAPITULO IV
Temperatura media Consumo medio Realice el grafico correspondiente al análisis de
diaria en ºF (X) diario (kWh) (Y)
31 40 Regresión en su primera etapa.
34 41
39 43
42 44
¿Cuál es la variable dependiente?
47 46 ¿De que tipo es?
56 48 ¿Existe una relación estadística entre ambas
62 50
66 52
variables, realice el grafico correspondiente?
68 55
71 59
75 62
78 65

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 8

4
06/04/2022

CAPITULO IV
Solución.- El Diagrama de Dispersión será:

(X) (Y)
31 40
34 41
39 43
42 44
47 46
56 48
62 50
66 52
68 55
71 59
75 62
78 65

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 9

CAPITULO IV
Interpretación:
De acuerdo con el grafico, podemos observar que existe la aproximación
lineal de la nube de puntos conformada entre las dos variables, por lo que
existe una relación estadística de tipo ascendente o directa.

Lo que significa, que a mayor es la temperatura media diaria observada,


mayor es el consumo de energía eléctrica diaria.

No se observa una relación perfecta entre las dos variables, pero si se


observa la aproximación lineal.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 10

5
06/04/2022

CAPITULO IV
Segunda Etapa del Análisis de Regresión Lineal:
Determinación de la función algebraica que explica la relación entre las
dos variables, de acuerdo con un modelo lineal.

El objetivo es la modelización de la variación entre las dos variables y


determinación de la Ecuación de Regresión. En un análisis de regresión, es
necesario expresar las variaciones de una variable “Y” en función de las
variaciones de la otra variable “X” por una relación lineal (el modelo):


Yi = b0 + b1 Xi + 𝜀𝑖

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 11

CAPITULO IV
Valor Observado
Y
(x=31, y=40)
Ɛ = (Y - Y)
(x, y= bo + b1(x))
b1 Valor Estimado

bo
X
Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 12

6
06/04/2022

CAPITULO IV
4.1.2 Método de Mínimos Cuadrados
Para determinar los valores de los parámetros bo y b1, el criterio
matemático utilizado son las ecuaciones normales lineales. De acuerdo
con este criterio la línea de regresión, con el mejor ajuste (la mejor
ecuación) es aquella para la cual se reduce el mínimo la suma de las
desviaciones cuadradas entre los valores estimados y reales de la variable
dependiente para los datos muéstrales. Con la aplicación de derivadas
parciales respecto de la siguiente expresión, alcanzamos las formulas de
calculo de los parámetros:
 (Y )
n n
− Yˆi =  ˆi2
2
i
i =1 i =1

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 13

CAPITULO IV
entonces derivando respecto a bo y b1, evaluando e igualando a cero,
obtenemos el siguiente sistema de ecuaciones:

Para la Pendiente de la Ecuación, o la constante b1:


σni=1 X i σni=1 Yi
σni=1 X i Yi − σni=1 X i Yi − 𝑛𝑋ത 𝑌ത
b1 = n =
σn X 2 σn X 2
σni=1 X 2i − i=1 i σni=1 X 2i − i=1 i
n n
Intercepto, o la constante bo: b0 = Yሜ − b1 Xሜ

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 14

7
06/04/2022

CAPITULO IV
Interpretación de los coeficientes del Modelo:
1. Respecto a la primera constante bo, representa el valor de la variable
dependiente (Y), cuando X es igual a cero. Lo que indica (en la mayoría de los
casos) que valor mínimo se puede observar en la variable dependiente.
2. En el caso de la segunda constante b1, representa el grado de crecimiento
(+b1, función ascendente), o de disminución (-b1, función descendente) que
tiene la variable Y, por cada unidad de la variable X.

Ejemplo de Aplicación:
Una vez comprobado gráficamente que el consumo de energía eléctrica
depende de la temperatura media diaria por familia. Determinar cual es
modelo de regresión lineal que se ajusta a los datos, interpretar sus
coeficientes.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 15

CAPITULO IV
Solución.- La tabla de cálculos será:
Temperatura Consumo
N X.Y X^2 669 605
en ºF (X) (kWh) (Y) 35190 −
1 31 40 1240 961 b1 = 12 = 0,483
2 34 41 1394 1156 669 2
3 39 43 1677 1521
40321 − 12
4 42 44 1848 1764
5 47 46 2162 2209
6 56 48 2688 3136
b0 = Yሜ − b1 Xሜ
7 62 50 3100 3844 b0 = 50,42 − 0.483 55,75 = 23,48
8 66 52 3432 4356
9 68 55 3740 4624 ෡(Consumo) = 23,48 + 0,48(Temp.)
10 71 59 4189 5041
Modelo : Y
11 75 62 4650 5625
12 78 65 5070 6084
TOTAL: 669 605 35190 40321

MODE -> STAT -> Y=a+bX -> \x,y\ -> SHIFT 1 -> REG ó OPTN (4)

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 16

8
06/04/2022

CAPITULO IV

Interpretación:
1. Respecto a bo, el consumo energético se estima en 23,48 kWh cuando la
temperatura es igual a cero ºF.
2. En el caso de b1, por cada grado ºF que aumenta la temperatura, el
consumo de energía aumenta en 0,48 kWh.
Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 17

CAPITULO IV
4.2 COEFICIENTE DE CORRELACIÓN LINEAL
4.2.1 Definición y forma de calculo
Comprende el calculo de la Correlación estadística entre las dos variables
de análisis, el cual varia de -1 a +1, de acuerdo con la siguiente expresión:
𝐶𝑜𝑣(𝑋, 𝑌) σ𝑛𝑖=1 𝑋𝑖 − 𝑋ሜ 𝑌𝑖 − 𝑌ሜ
𝑟= =
(𝑆𝑥 . 𝑆𝑦 )
σ𝑛𝑖=1 𝑋𝑖 − 𝑋ሜ 2 ⋅ σ𝑛𝑖=1 𝑌𝑖 − 𝑌ሜ 2

Puede adoptar un valor positivo (si la relación es directa) o un valor


negativo (si es inversa), que por efectos de establecer o determinar una
buena correlación su valor deberá ser mayor a 0,8 o menor a -0,8.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 18

9
06/04/2022

CAPITULO IV

-1,0 -,5 0 +,5 +1,0


Correlación Negativa No hay correlación Lineal Correlación Positiva
Perfecta Perfecta

Ejemplo de Aplicación:
Ya que se ha comprobado gráficamente que el consumo de energía
eléctrica depende de la temperatura media diaria por familia. Así también
se ha establecido el modelo de regresión lineal que se ajusta a los datos.
Finalizando ahora con el calculo de la correlación estadística, para la
comprobación del ajuste lineal.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 19

CAPITULO IV
Solución.- De acuerdo con la tabla de datos:
Temperatura en ºF Consumo (kWh)
N 𝐶𝑜𝑣(𝑋, 𝑌)
(X) (Y)
1 31 40 𝑟= = 0,962
2 34 41 (𝑆𝑥 . 𝑆𝑦 )
3 39 43
4 42 44
5 47 46 Como el valor de la correlación
6 56 48
7 62 50 es próximo a uno (positivo), se
8 66 52
9 68 55 comprueba la asociación entre
10 71 59
11 75 62 las dos variables, y el correcto
12 78 65
TOTAL: 669 605 ajuste lineal en los datos.
MODE -> STAT -> Y= A+BX -> \x,y\ -> SHIFT 1 -> REG – OPTN (4)

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 20

10
06/04/2022

CAPITULO IV
4.2.2 Coeficiente de determinación, definición e interpretación
El coeficiente de determinación es la proporción de la varianza total de la
variable explicada por la regresión. El coeficiente de determinación,
también llamado R cuadrado, refleja la bondad del ajuste de un modelo.
Es importante saber que el resultado del coeficiente de determinación
oscila entre 0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el
ajuste del modelo a la variable que estamos intentando explicar. De forma
inversa, cuanto más cerca de cero, menos ajustado estará el modelo y, por
tanto, menos fiable será.
෡i − ഥ
σni=1(Y Y)2
r2 =
σni=1(Yi − ഥ
Y)2

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 21

CAPITULO IV
Con la ayuda del Software Minitab:

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 22

11
06/04/2022

CAPITULO IV
Con la ayuda del Software Minitab:

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 23 23

12

También podría gustarte