Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EXPLORATORIO
DE DATOS
BIVARIADOS
ANÁLISIS DE
REGRESION LINEAL
SIMPLE
Introducción
Condición previa para un ARLS
Objetivos de un ARLS
Características de un ARLS
Características de un ARLS
Características de un ARLS
𝑌𝑖 = 𝑎 ∗ 𝑋𝑖 + 𝑏
donde:
𝒀𝒊 : son los “valores predichos para Y por el
MRLS.
Geométricamente:
Estadísticamente:
donde:
a=0,3384 significa que por cada mil pesos
adicionales de Ingresos Mensuales, el Gasto en
Turismo aumenta en 0,3384 ($ 338,4)
Concepto de “Residuo”
La RRLS buscada es la que mejor representa a la
nube de puntos del Diagrama de Dispersión.
𝑒𝑖 = 𝑦𝑖 − 𝑦𝑖
𝑆𝐶𝐸 = 𝑒𝑖 2 = 𝑦𝑖 − 𝑦𝑖 2
Construcción del Modelo de
Regresión Lineal Simple
𝑛 𝑛
𝑆𝐶𝐸 = 𝑒𝑖 2 = 𝑦𝑖 − 𝑦𝑖 2
𝑖=1 𝑖=1
𝑛
= 𝑦𝑖 − 𝑎 ∗ 𝑥𝑖 − 𝑏 2
𝑖=1
𝑏 =𝑌−𝑎∗𝑋
Construcción del Modelo de Regresión
Lineal Simple
1.556,67
𝑎= =0,3384
67,822
𝑌𝑖 − 𝑌 = 𝑌𝑖 − 𝑌𝑖 + 𝑌𝑖 − 𝑌
2 2
𝑛
𝑖=1 𝑌𝑖 − 𝑌 2
= 𝑛
𝑖=1 𝑌𝑖 − 𝑌𝑖 + 𝑛
𝑖=1 𝑌𝑖 − 𝑌
𝑛 𝑛
2 2
𝑆𝐶𝐸 = 𝑒𝑖 = 𝑌𝑖 − 𝑌𝑖
𝑖=1 𝑖=1
𝒏
𝟐
𝑺𝑪𝑹 = 𝒀𝑰 − 𝒀
𝑰=𝟏
La Capacidad Explicativa del
Modelo.
De manera entonces que la Partición de la Suma de
Cuadrados puede expresarse como:
O equivalentemente,
𝑆𝐶𝐸
1= + 𝑟2
𝑆𝐶𝑇
r²=[r]²
La Capacidad Explicativa del
Modelo.
Esta última expresión es realmente informativa, dado
que indica que aún antes de construir el ARLS, ya es
posible conocer cuál será su Capacidad Explicativa o
Bondad del Ajuste, elevando al cuadrado el
Coeficiente de Correlación Lineal de Pearson.
En el Ejemplo anterior:
r²=0,97²=0,9409=94,1%
Rango de Variación de r²
𝑆𝐶𝐸
A partir de la expresión: 𝑟 2 =1-
𝑆𝐶𝑇
𝑆𝐶𝐸 0
De manera que 𝑟 2 =1- =1- = 1.
𝑆𝐶𝑇 𝑆𝐶𝑇
𝑆𝐶𝐸 𝑆𝐶𝑇
𝑟 2 =1- = 1- =1 −1=0
𝑆𝐶𝑇 𝑆𝐶𝑇
𝑺𝑪𝑻 = 𝒀𝒊 − 𝒀 𝟐
𝒊=𝟏
𝑺𝑪𝑻 = 𝒏 ∗ 𝑽 𝒀
𝑺𝑪𝑻 = 𝑺𝑪𝑬 + 𝑺𝑪𝑹
𝑺𝑪𝑬 = 𝑺𝑪𝑻 ∗ 𝟏 − 𝒓𝟐
𝑺𝑪𝑬 = 𝑺𝑪𝑻 − 𝑺𝑪𝑹
La Capacidad Explicativa del
Modelo.
Fórmulas para obtener la Partición
de la Suma de Cuadrados y r²
Coeficiente de Determinación:
𝟐 𝑺𝑪𝑹
𝒓 = 𝑺𝑪𝑻
𝟐
𝑺𝑪𝑬
𝒓 =𝟏−
𝑺𝑪𝑻
𝒓𝟐 = 𝒓 𝟐
La Capacidad Explicativa del
Modelo.
Ejemplo:
r =-40,50/43,43 = -0,93
por lo que se justifica construir un ARLS
La Capacidad Explicativa del
Modelo.
Identificación del MRLS:
20
N° de Errores cometidos
15
10
y = -0,7849x + 22,973
0
0 5 10 15 20 25 30 35
-5
Tiempo de Capacitación (Horas)
La Capacidad Explicativa del
Modelo.
Capacidad Explicativa del Modelo:
100,00%
80,00%
Parte Explicada por el MRLS
60,00% 86,49% Parte Inexplicada por el MRLS
40,00%
20,00%
13,51%
0,00%
Pronósticos a partir del Modelo
Una vez identificado o construido el Modelo de
Regresión Lineal Simple, también es posible
emplearlo para predecir o pronosticar un Valor
Medio (el valor más probable) para Y, dado un valor
específico asignado a X.
Ejemplo:
¿Cuál será el Número de Errores que cometa un
empleado que reciba 16 horas de capacitación?
𝒀 = −𝟎, 𝟕𝟖𝟒𝟗 ∗ 𝟏𝟔 + 𝟐𝟐,973 = 10,415
Es decir entre 10 y 11 errores.
𝑥𝑚í𝑛 ≤ 𝑥𝑖 ≤ 𝑥𝑚á𝑥