Está en la página 1de 10

TarrySergio123

www.wuolah.com/student/TarrySergio123

787624

Tema-3-Analisis-de-regresion.pdf
Resúmenes de la Asignatura

1º Estadística Descriptiva

Grado en Economía

Facultad de Ciencias Económicas y Empresariales


Universidad Autónoma de Madrid

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su
totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2093181

Tema 3: Análisis de regresión


El análisis de la regresión consiste en la obtención de funciones que permitan predecir una
variable desconocida en función de otra u otras de las que se disponen datos.
Una función de regresión es una función que permite la predicción del valor de una variable
conociendo el valor de otra u otras.

1. Tipos de funciones de regresión:


➢ Función de regresión de Y sobre X: Función que permite la predicción de los valores de la
variable Y conociendo los valores de la variable X.
𝑓(𝑥; 𝑎, 𝑏, 𝑐, … )
➢ Función de regresión de X sobre Y: Función que permite la predicción de los valores de la
variable X conociendo los valores de la variable Y.
𝑓(𝑦; 𝑎, 𝑏, 𝑐, … )

- Caso lineal:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
➢ Recta de regresión de Y sobre X (𝑦 ∗ ): Recta que permite la predicción de los valores de la
variable Y conociendo los valores de la variable X.
𝑓(𝑥; 𝑎, 𝑏) = 𝑎 + 𝑏𝑥 = 𝑦 ∗
➢ Recta de regresión de X sobre Y (𝑥 ∗ ): Recta que permite la predicción de los valores de la
variable X conociendo los valores de la variable Y.
𝑓(𝑦; 𝑎′, 𝑏′) = 𝑎′ + 𝑏′𝑦 = 𝑥 ∗

Pack permiso AM + 2 clases: 58,65€ - Autoescuela Gala


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2093181

2. Cálculo de una función de regresión:


Para obtener una función de regresión, suele emplearse el método de regresión mínimo-
cuadrática. Este método busca obtener la función que haga mínima la suma de los cuadrados
de los errores.
𝐼 𝐽 𝐼 𝐽
𝑛𝑖𝑗 2 2 𝑛𝑖𝑗
∑ ∑[𝐸𝑟𝑟𝑜𝑟] · = ∑ ∑[𝑦𝑗 − 𝑓(𝑥𝑖 ; 𝑎, 𝑏, 𝑐, … )] ·
𝑁 𝑁
𝑖=1 𝑗=1 𝑖=1 𝑗=1
𝐼 𝐽 𝐼 𝐽
𝑛𝑖𝑗 2 𝑛𝑖𝑗
∑ ∑[𝐸𝑟𝑟𝑜𝑟]2 · = ∑ ∑[𝑥𝑖 − 𝑓(𝑦𝑗 ; 𝑎, 𝑏, 𝑐, … )] ·
𝑁 𝑁
𝑖=1 𝑗=1 𝑖=1 𝑗=1

- Caso lineal:
A. Recta de regresión de Y/X:
𝐼 𝐽 𝐼 𝐽 𝐼 𝐽

𝑛𝑖𝑗 2 2 𝑛𝑖𝑗 2 𝑛𝑖𝑗
𝑦 = ∑ ∑[𝐸𝑟𝑟𝑜𝑟] · = ∑ ∑[𝑦𝑗 − 𝑓(𝑥𝑖 ; 𝑎, 𝑏)] · = ∑ ∑[𝑦𝑗 − (𝑎 + 𝑏𝑥𝑖 )] ·
𝑁 𝑁 𝑁
𝑖=1 𝑗=1 𝑖=1 𝑗=1 𝑖=1 𝑗=1

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
𝑆𝑋𝑌 𝑆𝑌
𝑎 = 𝑦̅ − 𝑏𝑥̅ 𝑏= 2 =𝑟·
𝑆𝑋 𝑆𝑋
𝑆𝑋𝑌 𝑆𝑋𝑌 𝑆𝑋𝑌 𝑆𝑋𝑌 𝑆𝑋𝑌 𝑆𝑌
𝑦 ∗ = 𝑎 + 𝑏𝑥 = (𝑦̅ − · 𝑥̅ ) + ( 2 ) · 𝑥 = 𝑦̅ − 2 · 𝑥̅ + 2 · 𝑥 = 𝑦̅ + 2 · (𝑥 − 𝑥̅ ) = 𝑦̅ + 𝑟 · · (𝑥 −
𝑆𝑋2 𝑆𝑋 𝑆𝑋 𝑆𝑋 𝑆𝑋 𝑆𝑋

B. Recta de regresión de X/Y:


𝐼 𝐽 𝐼 𝐽 𝐼 𝐽
𝑛𝑖𝑗 2 𝑛𝑖𝑗 2 𝑛𝑖𝑗
𝑥 ∗ = ∑ ∑[𝐸𝑟𝑟𝑜𝑟]2 · = ∑ ∑[𝑥𝑖 − 𝑓(𝑦𝑗 ; 𝑎′, 𝑏′)] · = ∑ ∑[𝑥𝑖 − (𝑎′ + 𝑏′𝑦𝑗 )] ·
𝑁 𝑁 𝑁
𝑖=1 𝑗=1 𝑖=1 𝑗=1 𝑖=1 𝑗=1

𝑆𝑋𝑌 𝑆
𝑎′ = 𝑥̅ − 𝑏′𝑦̅ 𝑏′ = = 𝑟 · 𝑆𝑋
𝑆𝑌2 𝑌
𝑆𝑋𝑌 𝑆𝑋𝑌 𝑆𝑋𝑌 𝑆𝑋𝑌 𝑆𝑋𝑌 𝑆𝑋
𝑥 ∗ = 𝑎′ + 𝑏′𝑦 = (𝑥̅ − 2 · 𝑦̅) + ( 2 ) · 𝑦 = 𝑥̅ − 2 · 𝑦̅ + 2 · 𝑦 = 𝑥̅ + 2 · (𝑦 − 𝑦̅) = 𝑥̅ + 𝑟 · · (𝑦 − 𝑦̅)
𝑆𝑌 𝑆𝑌 𝑆𝑌 𝑆𝑌 𝑆𝑌 𝑆𝑌

Descuento para estudiantes madrileños con código: UNIBENGALA - bengalaspain.com


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2093181

3. Características de una función de regresión:


• La recta de regresión de X/Y corta con la recta de regresión de Y/X en el punto (𝑥̅ , 𝑦̅).
𝑆𝑋𝑌 𝑆𝑋𝑌 𝑆𝑋𝑌
𝑦 ∗ (𝑥) = 𝑦̅ + 2
𝑆𝑋
· (𝑥 − 𝑥̅ ) → 𝑦 ∗ (𝑥̅ ) = 𝑦̅ + 2
𝑆𝑋
· (𝑥̅ − 𝑥̅ ) = 𝑦̅ + 2
𝑆𝑋
· 0 = 𝑦̅
𝑆𝑋𝑌 𝑆𝑋𝑌 𝑆𝑋𝑌
𝑥 ∗ (𝑦) = 𝑥̅ + 𝑆2 · (𝑦 − 𝑦̅) → 𝑥 ∗ (𝑦̅) = 𝑥̅ + 𝑆2 · (𝑦̅ − 𝑦̅) = 𝑥̅ + 𝑆2 · 0 = 𝑥̅
𝑌 𝑌 𝑌
• El coeficiente de correlación lineal es igual a la media geométrica de los coeficientes de
regresión de las rectas de regresión de Y/X y de X/Y.
2
𝑆𝑋𝑌 𝑆𝑋𝑌 2 (𝑆𝑋𝑌 )2 𝑆𝑋𝑌 𝑆𝑋𝑌
𝑟= = √( ) =√ = √ 2 · 2 = √𝑏 · 𝑏′ = √∏ 𝑏𝑖

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
𝑆𝑋 𝑆𝑌 𝑆𝑋 𝑆𝑌 (𝑆𝑋 𝑆𝑌 )2 𝑆𝑋 𝑆𝑌
𝑖=1

• La recta de regresión de X/Y y la recta de regresión de Y/X tienen pendiente positiva si


r>0.
𝑆 𝑆
𝑦 ∗ = 𝑎 + 𝑏𝑦 ∗ → 𝑏 = 𝑟 · 𝑌 → si 𝑟 > 0 → 𝑟 · 𝑌 > 0 → 𝑏 > 0 → 𝑦 ∗ = 𝑎 + 𝑏𝑦 ∗
𝑆𝑋 𝑆𝑋
∗ ∗ 𝑆𝑋 𝑆𝑋
𝑥 = 𝑎 + 𝑏′𝑥 → 𝑏′ = 𝑟 · 𝑆𝑌
→ si 𝑟 > 0 → 𝑟 ·𝑆 > 0 → 𝑏 ′ > 0 → 𝑥 ∗ = 𝑎 + 𝑏′𝑥 ∗
𝑌

• La recta de regresión de X/Y y la recta de regresión de Y/X tienen pendiente negativa si


r<0.
𝑆 𝑆
𝑦 ∗ = 𝑎 + 𝑏𝑦 ∗ → 𝑏 = 𝑟 · 𝑌 → si 𝑟 < 0 → 𝑟 · 𝑌 < 0 → 𝑏 < 0 → 𝑦 ∗ = 𝑎 − 𝑏𝑦 ∗
𝑆𝑋 𝑆𝑋
𝑆𝑋 𝑆𝑋
𝑥 ∗ = 𝑎 + 𝑏′𝑥 ∗ → 𝑏′ = 𝑟 · → si 𝑟 < 0 → 𝑟 · < 0 → 𝑏′ < 0 → 𝑥 ∗ = 𝑎 − 𝑏′𝑥 ∗
𝑆𝑌 𝑆𝑌

• La recta de regresión de X/Y y la recta de regresión de Y/X son perpendiculares si r=0.


𝑆 𝑆
𝑦 ∗ = 𝑦̅ + 𝑟 · 𝑆𝑌 · (𝑥 − 𝑥̅ ) → 𝑦 ∗ = 𝑦̅ + 0 · 𝑆𝑌 · (𝑥 − 𝑥̅ ) = 𝑦̅
𝑋 𝑋
𝑆𝑋 𝑆
𝑥 ∗ = 𝑥̅ + 𝑟 · 𝑆 · (𝑦 − 𝑦̅) → 𝑥 ∗ = 𝑥̅ + 0 · 𝑆𝑋 · (𝑦 − 𝑦̅) = 𝑥̅
𝑌 𝑌
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2093181

• La recta de regresión de X/Y coincide con la recta de regresión de Y/X si r=1.


𝑆𝑌 𝑆𝑌 𝑆𝑌 𝑆𝑌
𝑦 ∗ = 𝑦̅ + 𝑟 · · (𝑥 − 𝑥̅ ) → 𝑦 ∗ = 𝑦̅ + 1 · · (𝑥 − 𝑥̅ ) → 𝑦 ∗ = 𝑦̅ + · (𝑥 − 𝑥̅ ) → 𝑦 ∗ − 𝑦̅ = · (𝑥 − 𝑥̅ ) →
𝑆𝑋 𝑆𝑋 𝑆𝑋 𝑆𝑋
𝑆 𝑆𝑋
→ (𝑦 ∗ − 𝑦̅) · 𝑆𝑋 = (𝑥 − 𝑥̅ ) → 𝑥 ∗ = 𝑥̅ + 𝑆 · (𝑦 ∗ − 𝑦̅)
𝑌 𝑌

• La recta de regresión de X/Y coincide con la recta de regresión de Y/X si r=-1.


𝑆𝑌 𝑆𝑌 𝑆𝑌 𝑆𝑌
𝑦 ∗ = 𝑦̅ + 𝑟 · · (𝑥 − 𝑥̅ ) → 𝑦 ∗ = 𝑦̅ + (−1) · · (𝑥 − 𝑥̅ ) → 𝑦 ∗ = 𝑦̅ + (− ) · (𝑥 − 𝑥̅ ) → 𝑦 ∗ − 𝑦̅ = (− ) · (𝑥 − 𝑥̅ ) →
𝑆𝑋 𝑆𝑋 𝑆𝑋 𝑆𝑋
𝑆 𝑆𝑋
→ (𝑦 ∗ − 𝑦̅) · (− 𝑋 ) = (𝑥 − 𝑥̅ ) → 𝑥 ∗ = 𝑥̅ − · (𝑦 ∗ − 𝑦̅)
𝑆𝑌 𝑆𝑌

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.

Descuento para estudiantes madrileños con código: UNIBENGALA - bengalaspain.com


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2093181

4. Predicción obtenida por una función de regresión o valor teórico de una variable
(y*):
- Media del valor teórico de una variable (𝐲̅ ∗):
∑𝐽𝑗=1 𝑦𝑗∗ · 𝑛𝑗

𝑦̅ =
𝑁

∑𝐼𝑖=1 𝑥𝑖∗ · 𝑛𝑖
𝑥̅ =
𝑁
A. Relación entre la media aritmética del valor teórico de una variable y la media aritmética
de la variable:
𝑆𝑋𝑌 𝑆𝑋𝑌 𝑆𝑋𝑌
𝑦 ∗ = 𝑦̅ + 2 · (𝑥 − 𝑥̅ ) → 𝑦̅ ∗ = 𝑦̅ + 2 · (𝑥̅ − 𝑥̅ ) → 𝑦̅ ∗ = 𝑦̅ + 2 · 0 → 𝑦̅ ∗ = 𝑦̅
𝑆𝑋 𝑆𝑋 𝑆𝑋
𝑆𝑋𝑌 𝑆𝑋𝑌 𝑆𝑋𝑌
𝑥 ∗ = 𝑥̅ + 𝑆2 · (𝑦 − 𝑦̅) → 𝑥̅ ∗ = 𝑥̅ + · (𝑦̅ − 𝑦̅) → 𝑥̅ ∗ = 𝑥̅ + · 0 → 𝑥̅ ∗ = 𝑥̅
𝑌 𝑆𝑌2 𝑆𝑌2

- Varianza debida a la regresión (𝐒𝐘𝟐∗ ):


La varianza debida a la regresión es una medida del error cometido al emplear la media de los

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
valores teóricos de la variable en lugar de los valores teóricos de la variable.
𝐽 2 𝐽 2
(𝑦𝑗∗ − 𝑦̅ ∗ ) · 𝑛𝑗 𝑦𝑗∗ · 𝑛𝑗
𝑆𝑌2∗ =∑ = (∑ ) − (𝑦̅ ∗ )2
𝑁 𝑁
𝑗=1 𝑗=1
𝐼 2 𝐼
(𝑥𝑖∗ − 𝑥̅ ∗ )2 · 𝑛𝑖 𝑥𝑖∗ · 𝑛𝑖
𝑆𝑋2∗ =∑ = (∑ ) − (𝑥̅ ∗ )2
𝑁 𝑁
𝑖=1 𝑖=1

A. Relación entre la varianza debida a la regresión y la varianza de la variable y la varianza


residual:
La varianza debida a la regresión mide la mejora producida al emplear una función de
regresión para estimar el valor de una variable, en lugar de su media aritmética.
𝑆𝑌2∗ = 𝑆𝑌2 − 𝑆𝐸2 = 𝑆𝑌2 − (𝑆𝑌2 − 𝑆𝑌2 𝑟 2 ) = 𝑆𝑌2 𝑟 2
𝑆𝑋2∗ = 𝑆𝑋2 − 𝑆𝐸2 = 𝑆𝑋2 − (𝑆𝑋2 − 𝑆𝑋2 𝑟 2 ) = 𝑆𝑋2 𝑟 2

Interpretación:
➢ Ajuste excelente (𝑆𝑌2∗ = 𝑆𝑌2 ó 𝑆𝑋2∗ = 𝑆𝑋2 ): Al emplear los valores teóricos de la variable en
lugar de la media aritmética de la variable para realizar predicciones, la mejora producida
es exactamente igual a la varianza de la variable, eliminándose. Características:
o La varianza residual (SE2 ) es 0.
➢ Ajuste pésimo (𝑆𝑌2∗ = 0 ó 𝑆𝑋2∗ = 0): Al emplear los valores teóricos de la variable en lugar
de la media aritmética de la variable para realizar predicciones, la predicción no mejora.
Características:
o La varianza residual (SE2 ) es igual a la varianza de la variable (SY2 ó SX2 ).

Descuento para estudiantes madrileños con código: UNIBENGALA - bengalaspain.com


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2093181

5. Análisis de la bondad de una predicción realizada por una función de regresión:


- Error o residuo (E):
El error o residuo de un ajuste es la diferencia entre el valor real que adopta la variable y el
valor predicho por la función de regresión.
𝐸 = 𝑦 − 𝑦∗
𝐸 = 𝑥 − 𝑥∗
̅):
A. Media aritmética del error (E
∑𝐼𝑖=1 𝐸𝑖 · 𝑛𝑖
𝐸̅ =
𝑁

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La media aritmética del error siempre es igual a 0.
𝐸 = 𝑦 − 𝑦 ∗ → 𝐸̅ = 𝑦̅ − 𝑦̅ ∗ = 𝑦̅ − 𝑦̅ = 0
𝐸 = 𝑥 − 𝑥 ∗ → 𝐸̅ = 𝑥̅ − 𝑥̅ ∗ = 𝑥̅ − 𝑥̅ = 0

B. Varianza residual (SE2 ):


La varianza residual mide el error cometido al emplear la media de los errores en lugar del
valor de cada error.
2
𝑆𝑌
∑𝐽𝑗=1 ∑𝐼𝑖=1 [𝑦𝑗 − (𝑦̅ + 𝑟 · (𝑥 )
𝑆𝑋 · 𝑖 − 𝑥̅ )] · 𝑛𝑖𝑗
𝐽 2 2
(𝐸𝑗 − 𝐸̅ ) · 𝑛𝑖 ∑𝐽𝑗=1[(𝑦𝑗 − 𝑦𝑗∗ ) − 0] · 𝑛𝑗
𝑆𝐸2 = ∑ = =
𝑁 𝑁 𝑁
𝑗=1
2
𝑆𝑋
∑𝐼𝑖=1 ∑𝐽𝑗=1 [𝑥𝑖 − (𝑥̅ + 𝑟 ·
𝑆𝑌 · (𝑦𝑗 − 𝑦̅))] · 𝑛𝑖𝑗
𝐼
(𝐸𝑖 − 𝐸̅ )2 · 𝑛𝑖 ∑𝑖𝑖=1[(𝑥𝑖 − 𝑥𝑖∗ ) − 0]2 · 𝑛𝑖
𝑆𝐸2 = ∑ = =
𝑁 𝑁 𝑁
𝑖=1

B.A. Relación entre la varianza residual y la varianza debida a la regresión y la varianza de la


variable:
La varianza residual es una medida del error producido por realizar una predicción con una
determinada función de regresión.
𝑆𝐸2 = 𝑆𝑌2 · (1 − 𝑟 2 ) = 𝑆𝑌2 − 𝑆𝑌2 𝑟 2 = 𝑆𝑌2 − 𝑆𝑌2∗
𝑆𝐸2 = 𝑆𝑋2 · (1 − 𝑟 2 ) = 𝑆𝑋2 − 𝑆𝑋2 𝑟 2 = 𝑆𝑋2 − 𝑆𝑋2

Interpretación:
➢ Ajuste excelente (𝑆𝐸2 = 0): Las predicciones realizadas por la función de regresión
coinciden con los valores reales de la variable. Características:
o El coeficiente de correlación lineal (r) es 1.
o La varianza debida a la regresión (SY2∗ ó SX2∗ ) es igual a la varianza de la variable
(SY2 ó SX2∗ ).
➢ Ajuste pésimo (𝑆𝐸2 = 𝑆𝑌2 ó 𝑆𝐸2 = 𝑆𝑋2): La recta de regresión no supone ninguna mejora de la
predicción con respecto a la que ya nos permitía hacer la media aritmética de la variable.
Características:
o El coeficiente de correlación lineal (r) es 0.
o La varianza debida a la regresión (SY2∗ ó SX2∗ ) es igual a 0.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2093181

- Coeficiente de determinación lineal (R2):


El coeficiente de determinación lineal mide el tanto por uno de error producido por realizar
una predicción con una determinada función de regresión.
𝑆𝑌2∗ 𝑆𝑌2 − 𝑆𝐸2 𝑆𝐸2
𝑅2 = = = 1 −
𝑆𝑌2 𝑆𝑌2 𝑆𝑌2
2 2 2
2
𝑆𝑋 ∗ 𝑆𝑋 − 𝑆𝐸 𝑆𝐸2
𝑅 = 2 = =1− 2
𝑆𝑋 𝑆𝑋2 𝑆𝑋
Características:
• Es adimensional.
• Está acotado entre 0 y 1.

A. Caso lineal:
En el caso lineal, el coeficiente de determinación lineal puede expresarse como:

𝑆𝑌2∗ 𝑆𝑌2 · 𝑟 2
𝑅2 = = = 𝑟2
𝑆𝑌2 𝑆𝑌2

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
𝑆𝑋2∗ 𝑆𝑋2 · 𝑟 2
𝑅2 = 2 = = 𝑟2
𝑆𝑋 𝑆𝑋2
Interpretación:
➢ Ajuste excelente (𝑅 2 = 1): Las predicciones realizadas por la función de regresión
coinciden con los valores reales de la variable. Características:
o La varianza residual (SE2 ) es 0.
o La varianza debida a la regresión (SY2∗ ó SX2∗ ) es igual a la varianza de la variable
(SY2 ó S𝑋2 ).
➢ Ajuste pésimo (𝑅 2 = 0): La recta de regresión no supone ninguna mejora de la predicción
con respecto a la que ya nos permitía realizar la media aritmética de la variable.
Características:
o La varianza residual (SE2 ) es igual a la varianza de la variable (SY2 ó SX2).
o La varianza debida a la regresión (SY2∗ ó SX2∗ ) es igual a 0.

Después de los finales, ¡RELÁJATE CON GUATAFAC!


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-2093181

6. Linealización:
- Función potencial:
En caso de que un conjunto de valores se ajusten a una función potencial (función de regresión
potencial), puede linealizarse para la función para favorecer su estudio.

𝑌 = 𝑎 · 𝑋 𝑏 → log(𝑌) = log(𝑎 · 𝑋 𝑏 ) → log(𝑌) = log(𝑎) + log(𝑋 𝑏 ) → log(𝑌) = log(𝑎) + 𝑏 · log(𝑋) → 𝑉 = 𝐴 + 𝑏𝑈

- Función exponencial:
En caso de que un conjunto de valores se ajusten a una función exponencial (función de
regresión exponencial), puede linealizarse la función para favorecer su estudio.

𝑌 = 𝑎 · 𝑏 𝑋 → log(𝑌) = log(𝑎 · 𝑏 𝑋 ) → log(𝑌) = log(𝑎) + log(𝑏 𝑋 ) → log(𝑌) = log(𝑎) + 𝑋 · log(𝑏) → 𝑉 = 𝐴 + 𝐵𝑋

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.

Pack permiso B + 3 clases: 33,15€ - Autoescuela Gala

También podría gustarte