Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capitulo 4 - Regresión - Corr Lineal - I - 2022
Capitulo 4 - Regresión - Corr Lineal - I - 2022
MODELO DE REGRESIÓN Y
CORRELACIÓN LINEAL
Capítulo IV
CAPITULO IV
4.1 REGRESIÓN LINEAL
4.1.1 Definición y Modelos de regresión
Hasta ahora vimos el análisis de una variable, en este capítulo trataremos
el estudio conjunto de dos variables numéricas, es decir, el análisis y la
representación bidimensional de un par de variables cuantitativas más sus
gráficos, y la eventual relación estadística existente entre variables.
1
06/04/2022
CAPITULO IV
Los Modelos de Regresión estudian la relación estocástica cuantitativa
entre una variable de interés y una o varias variables explicativas.
Es decir: Y = m (X1 ,X2 ,….., Xk ) + B + ε
Es así que, debemos determinar primero cual de las dos variables es la
variable dependiente (Y), y cual será la independiente (X). De esta manera:
- La variación presente en una de las variables ocasiona un cambio del
valor presente en la otra variable.
- Será posible predecir la variable dependiente numérica, a partir de los
valores de X (variable independiente).
- El modelo lineal o ajuste lineal de los datos es valido entre las ambas
variables.
CAPITULO IV
Para realizar el análisis estadístico de dos variables, de tipo cuantitativo,
se proponen los siguientes pasos o etapas de análisis.
2
06/04/2022
CAPITULO IV
CAPITULO IV
Una vez realizado el Diagrama de Dispersión, si la nube de puntos es
ascendente podemos decir que la relación entre las dos variables es
Directa, es decir si aumenta de valor X también aumentará de valor Y.
3
06/04/2022
CAPITULO IV
Ejemplo de Aplicación: Las empresas de energía eléctrica, que deben
planear la operación y expansión de generación de electricidad, están muy
interesadas en pronosticar la demanda de energía.
CAPITULO IV
Temperatura media Consumo medio Realice el grafico correspondiente al análisis de
diaria en ºF (X) diario (kWh) (Y)
31 40 Regresión en su primera etapa.
34 41
39 43
42 44
¿Cuál es la variable dependiente?
47 46 ¿De que tipo es?
56 48 ¿Existe una relación estadística entre ambas
62 50
66 52
variables, realice el grafico correspondiente?
68 55
71 59
75 62
78 65
4
06/04/2022
CAPITULO IV
Solución.- El Diagrama de Dispersión será:
(X) (Y)
31 40
34 41
39 43
42 44
47 46
56 48
62 50
66 52
68 55
71 59
75 62
78 65
CAPITULO IV
Interpretación:
De acuerdo con el grafico, podemos observar que existe la aproximación
lineal de la nube de puntos conformada entre las dos variables, por lo que
existe una relación estadística de tipo ascendente o directa.
5
06/04/2022
CAPITULO IV
Segunda Etapa del Análisis de Regresión Lineal:
Determinación de la función algebraica que explica la relación entre las
dos variables, de acuerdo con un modelo lineal.
Yi = b0 + b1 Xi + 𝜀𝑖
CAPITULO IV
Valor Observado
Y
(x=31, y=40)
Ɛ = (Y - Y)
(x, y= bo + b1(x))
b1 Valor Estimado
bo
X
Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 12
6
06/04/2022
CAPITULO IV
4.1.2 Método de Mínimos Cuadrados
Para determinar los valores de los parámetros bo y b1, el criterio
matemático utilizado son las ecuaciones normales lineales. De acuerdo
con este criterio la línea de regresión, con el mejor ajuste (la mejor
ecuación) es aquella para la cual se reduce el mínimo la suma de las
desviaciones cuadradas entre los valores estimados y reales de la variable
dependiente para los datos muéstrales. Con la aplicación de derivadas
parciales respecto de la siguiente expresión, alcanzamos las formulas de
calculo de los parámetros:
(Y )
n n
− Yˆi = ˆi2
2
i
i =1 i =1
CAPITULO IV
entonces derivando respecto a bo y b1, evaluando e igualando a cero,
obtenemos el siguiente sistema de ecuaciones:
7
06/04/2022
CAPITULO IV
Interpretación de los coeficientes del Modelo:
1. Respecto a la primera constante bo, representa el valor de la variable
dependiente (Y), cuando X es igual a cero. Lo que indica (en la mayoría de los
casos) que valor mínimo se puede observar en la variable dependiente.
2. En el caso de la segunda constante b1, representa el grado de crecimiento
(+b1, función ascendente), o de disminución (-b1, función descendente) que
tiene la variable Y, por cada unidad de la variable X.
Ejemplo de Aplicación:
Una vez comprobado gráficamente que el consumo de energía eléctrica
depende de la temperatura media diaria por familia. Determinar cual es
modelo de regresión lineal que se ajusta a los datos, interpretar sus
coeficientes.
CAPITULO IV
Solución.- La tabla de cálculos será:
Temperatura Consumo
N X.Y X^2 669 605
en ºF (X) (kWh) (Y) 35190 −
1 31 40 1240 961 b1 = 12 = 0,483
2 34 41 1394 1156 669 2
3 39 43 1677 1521
40321 − 12
4 42 44 1848 1764
5 47 46 2162 2209
6 56 48 2688 3136
b0 = Yሜ − b1 Xሜ
7 62 50 3100 3844 b0 = 50,42 − 0.483 55,75 = 23,48
8 66 52 3432 4356
9 68 55 3740 4624 (Consumo) = 23,48 + 0,48(Temp.)
10 71 59 4189 5041
Modelo : Y
11 75 62 4650 5625
12 78 65 5070 6084
TOTAL: 669 605 35190 40321
MODE -> STAT -> Y=a+bX -> \x,y\ -> SHIFT 1 -> REG ó OPTN (4)
8
06/04/2022
CAPITULO IV
Interpretación:
1. Respecto a bo, el consumo energético se estima en 23,48 kWh cuando la
temperatura es igual a cero ºF.
2. En el caso de b1, por cada grado ºF que aumenta la temperatura, el
consumo de energía aumenta en 0,48 kWh.
Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 17
CAPITULO IV
4.2 COEFICIENTE DE CORRELACIÓN LINEAL
4.2.1 Definición y forma de calculo
Comprende el calculo de la Correlación estadística entre las dos variables
de análisis, el cual varia de -1 a +1, de acuerdo con la siguiente expresión:
𝐶𝑜𝑣(𝑋, 𝑌) σ𝑛𝑖=1 𝑋𝑖 − 𝑋ሜ 𝑌𝑖 − 𝑌ሜ
𝑟= =
(𝑆𝑥 . 𝑆𝑦 )
σ𝑛𝑖=1 𝑋𝑖 − 𝑋ሜ 2 ⋅ σ𝑛𝑖=1 𝑌𝑖 − 𝑌ሜ 2
9
06/04/2022
CAPITULO IV
Ejemplo de Aplicación:
Ya que se ha comprobado gráficamente que el consumo de energía
eléctrica depende de la temperatura media diaria por familia. Así también
se ha establecido el modelo de regresión lineal que se ajusta a los datos.
Finalizando ahora con el calculo de la correlación estadística, para la
comprobación del ajuste lineal.
CAPITULO IV
Solución.- De acuerdo con la tabla de datos:
Temperatura en ºF Consumo (kWh)
N 𝐶𝑜𝑣(𝑋, 𝑌)
(X) (Y)
1 31 40 𝑟= = 0,962
2 34 41 (𝑆𝑥 . 𝑆𝑦 )
3 39 43
4 42 44
5 47 46 Como el valor de la correlación
6 56 48
7 62 50 es próximo a uno (positivo), se
8 66 52
9 68 55 comprueba la asociación entre
10 71 59
11 75 62 las dos variables, y el correcto
12 78 65
TOTAL: 669 605 ajuste lineal en los datos.
MODE -> STAT -> Y= A+BX -> \x,y\ -> SHIFT 1 -> REG – OPTN (4)
10
06/04/2022
CAPITULO IV
4.2.2 Coeficiente de determinación, definición e interpretación
El coeficiente de determinación es la proporción de la varianza total de la
variable explicada por la regresión. El coeficiente de determinación,
también llamado R cuadrado, refleja la bondad del ajuste de un modelo.
Es importante saber que el resultado del coeficiente de determinación
oscila entre 0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el
ajuste del modelo a la variable que estamos intentando explicar. De forma
inversa, cuanto más cerca de cero, menos ajustado estará el modelo y, por
tanto, menos fiable será.
i − ഥ
σni=1(Y Y)2
r2 =
σni=1(Yi − ഥ
Y)2
CAPITULO IV
Con la ayuda del Software Minitab:
11
06/04/2022
CAPITULO IV
Con la ayuda del Software Minitab:
12