Está en la página 1de 23

Docente: Dra.

Claudia Santander
SESIÓN 4
CONTENIDO:
CONCEPTO. LA REGRESIÓN LINEAL, GRÁFICA, EL
COEFICIENTE DE DETERMINACIÓN Y APLICACIONES
PRÁCTICAS.

CAPACIDADES:

ANALIZA LOS COEFICIENTES CORRELACIÓN Y DETERMINACIÓN


 TENIENDO
ANALIZA LOSEN CUENTA LOS DIAGRAMAS DE DISPERSIÓN,
COEFICIENTES
REGRESIÓN LINEAL, PARA APLICARLO EN CASOS
RELACIONADOS A SU ÁMBITO.
ANÁLISIS DE REGRESIÓN
LINEAL
SIMPLE
Introducción:  Cuando se tienen datos históricos de las
variables analizadas puede emplearse un
procedimiento estadístico llamado análisis de
regresión con la finalidad de obtener una
ecuación de forma matemática que indique la
relación existente entre mis variables,
aproximadamente mediante una línea recta.
 En regresión, la variable dependiente o de
predicción Y que es la que se busca predecir, y la
variable independiente o explicativa X que se
usa para predecir el valor de la variable
dependiente.
 La regresión y los análisis de correlación nos
muestran como determinar tanto la naturaleza
como la fuerza de una relación entre dos
variables
 El análisis de correlación, entonces, nos dice que
tan bien la ecuación de estimación realmente
describe la relación.
DEFINICIONES
Correlación
Establece si existe una relación entre las variables y
responde a la pregunta, ”¿Qué tan evidente es esta
relación?"
Regresión
Describe con más detalle la relación entre las variables.

Construye modelos matemáticos de predicción a partir de


información experimental u otra fuente disponible.

Regresión lineal simple


Regresión lineal múltiple
Regresión no lineal cuadrática o cúbica

6
Regresión:
• Ecuación que describe la relación entre el valor esperado de
Y, se denota como E(Y), y X se le llama ecuación de
regresión:

Análisis simple)
Ŷ = β0+ β1X + e
E(Y)= β0+ β1X (Ecuación de regresión lineal

Estadístico • Donde:
◦ β0: constante o parámetro de posición. Es el valor
promedio de la variable de respuesta Y cuando X es cero
(intersección de la recta de regresión con el eje Y).
◦ β1: coeficiente de regresión. Es el cambio (incremento o
disminución según el signo de β1) promedio en la
variable de respuesta Y cuando X se incrementa en una
unidad. Pendiente.
◦ e: es el error aleatorio, el cual se supone tiene media 0 y
varianza constante. Da cuenta de la variabilidad de y que
no puede ser explicada por la relación lineal entre X y Y.
◦ E(Y): media o valor esperado de y para un valor dado
de X.
Las unidades de β1 son las mismas unidades de la variable
dependiente Y.
NOTA: Los coeficientes de regresión “β1” y el coeficiente de
correlación lineal simple “r” deben de tener el mismo
signo.
• En la práctica no se conocen de los
parámetros poblacionales β0 y β1, y es
necesario estimarlos usando datos
muestrales. Estos estadísticos muestrales
calculados se denotan como b0 y b1 ,
como estimaciones de β0 y β1 .
Sustituyendo en la Ecuación de
Ecuación de regresión lineal simple, se obtiene
la ecuación de regresión
regresión simple estimada.
• Ŷ = b0 + b 1 X
estimada Donde:
Ŷ: Valor estimado de Y.

• A la gráfica de esta ecuación, se le


llama recta de regresión
estimada.
Regresión : Estimación de
parámetros
• Consiste en determinar los valores de " b0" y " b1" a partir de la muestra, es decir,
buscar o fijar los datos de la muestra o población a una línea recta de modo que las
diferencias de cada observación a la línea de regresión sea lo menos posible. Este
método de estimación es el de Mínimos Cuadrados, mediante el cual se obtiene:

e = (Yi - Ŷ i)2
Yi: valor observado de la variable dependiente en la observación i
Ŷ i: valor estimado de la variable independiente en la observación i
Regresión: Estimación de
parámetros
•• Luego de minimizar cada valor de ei, se obtienen las
• fórmulas de “b0” y “b1”.

ത 𝑖 −𝑌)
σ(𝑋𝑖 −𝑋)(𝑌 ത
• b1 = ത 2
σ(𝑋𝑖 −𝑋)
• ത b1 𝑋ത
b0 = 𝑌-
• Donde:
𝑋𝑖 = valor de la variable independiente en la observación i.
• 𝑌𝑖 = valor de la variable dependiente en la observación i.
• ത media de la variable independiente.
𝑋=
• 𝑌ത = media de la variable dependiente.
n = número total de observaciones (tamaño de la muestra).
Coeficiente de determinación

• La diferencia entre la observación i, y el valor observado de la


variable dependiente yi, y el valor estimado de la variable
dependiente , se le llama residual i. El residual i representa el error
que existe al usar para estimar yi. Por lo tanto, para la observación i,
el residual es yi . La suma de los cuadrados de estos residuales o
errores es la cantidad que se minimiza empleando el método de los
mínimos cuadrados. Esta cantidad, también conocida como suma de
cuadrados debida al error, se denota por SCE.
SCE = σ(𝑌𝑖 − 𝑌 ෡𝑖 )2
Coeficiente de determinación

• Para el i-ésimo restaurante de la muestra, la diferencia yi proporciona una medida del


error que hay al usar para estimar las ventas. La correspondiente suma de cuadrados,
llamada Suma total de cuadrados, se denota STC. ത 2
STC = σ(𝑌𝑖 − 𝑌)
• Se puede entender STC como una medida de qué tanto se agrupan las observaciones en
torno a la recta y SCE como una medida de qué tanto se agrupan las observaciones en
torno de la recta .
• Para medir qué tanto se desvían de los
valores , de la recta de regresión, se calcula
otra suma de cuadrados. A esta suma se le
llama suma de cuadrados debida a la
Coeficiente de regresión y se denota SCR.
determinación
෡𝑖 − 𝑌)
SCR = σ( 𝑌 ത 2
STC = SCR + SCE

Donde:
Relación
entre STC = suma total de cuadrados.
STC, SCR SCR = suma de cuadrados debida a la
Y SCE
regresión.
SCE = suma de cuadrados debida al error.
Coeficiente de determinación R2

• Después de realizar un análisis de regresión y se ha calculado el


coeficiente de determinación r2, el coeficiente de correlación
muestral se puede calcular de la siguiente manera:

𝑆𝐶𝑅
𝑟2 =
𝑆𝑇𝐶
Coeficiente de
correlación
𝑟𝑥𝑦 = (𝑠𝑖𝑔𝑛𝑜 𝑑𝑒 𝑏1 ) 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑐𝑖ó𝑛

𝑟𝑥𝑦 = (𝑠𝑖𝑔𝑛𝑜 𝑑𝑒 𝑏1 ) 𝑟 2

Donde:

𝑏1
= 𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 𝑒𝑐𝑢𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑎
𝑦ො = 𝑏0 + 𝑏1 𝑥
El coeficiente de determinación R2
Es una medida de la bondad de ajuste del modelo de
regresión hallada. Indica qué porcentaje de la variabilidad de
“Y” (variable de respuesta ) es explicada por su relación
lineal con “X”. El valor estadístico de R2 varía de 0 a 1.

Ejemplo: Con los datos del ejemplo anterior. Hallar la


ecuación de regresión entre las dos variables.

Salario de trabajadores = f (N° de horas/semana)

Solución:
ƩXi = 677 ƩYi = 1,032.4 ƩXi2 = 47,277
ƩXiYi = 71,752.2 Ȳ = 103.24 X= 67.7
Ejemplo
Con los datos del ejemplo anterior. Hallar la ecuación de regresión
entre las dos variables.
Salario de trabajadores = f (N° de horas/semana)
N° horas Salario
semanales trabajadores
(horas) obreros (S/.) XY X2 y2
X Y
84 134.4 84(134.4) 84x84 134.4 x 134.4
76 77.6 76(77.6) 76 x 76 77.6 x 77.6
72 112.6 72(112.6) 72 x 72 112.6 x 112.6
49 80.2 49(80.2) 49 x 49 80.2 x 80.2
71 110.6 71 (110.6) 71 x 71 110.6 x 110.6
63 98.8 63 (98.8) 63 x 63 98.8 x 98.8
64 100.4 64 (100.4) 64 x 64 100.4 x 100.4
84 134.4 84 (134.4) 84 x 84 134.4 x 134.4
47 77.6 47 (77.6) 47 x 47 77.6 x 77.6
67 105.8 67 (105.8) 67 x 67 105.8 x 105.8
Ʃ Xi=677 Ʃ Yi=1,032.4 Ʃ XY=71,752.2 Ʃ X2=47,277 Ʃ Y2=11,0548.64
El coeficiente de determinación R2

Ecuación de regresión:

Salario de trabajadores = b0 + b1 N° de horas/semana


(S/.) (hora)

b1 = 10(71,752.2 ) – (677)(1,032.4) = 18,587.2 = 1.2871


10(47,277) – (677)2 14,441
b0 = 103.24 – 1.2871 (67.7) = 16.1033

Entonces, la ecuación de regresión es:


Salario de trabajadores = 16.1033 + 1.2871 N° de horas/semana
(S/.) (hora)
El coeficiente de determinación R2
Interpretación:
o La ecuación de regresión estimada es: Ŷ = 16.1033 + 1.2871 X

• Coeficiente de correlación: R= 0.78

• Coeficiente de determinación: R²=0.61 (61%). El 61% de las


variaciones que ocurren en el salario de trabajadores obrero se
explicarían por las variaciones en la variable horas semanales
o El valor de β1 = 1.2871 indica el incremento del salario en soles, en
promedio, por cada hora de aumento en la semana de los trabajadores
obreros.
o El valor de 16.1033, no tiene interpretación práctica en el ejemplo, se
interpretaría como el valor obtenido, en promedio, para el salario Y,
cuando el número de horas X es 0.
o Utilizando la ecuación de regresión para estimar o predecir valores de la
variable Y: Para un número de horas de 48 a la semana se obtiene un
salario de 77.8841 soles.
ACTIVIDAD

✓ EN GRUPOS DESARROLLAR LOS


EJERCICIOS PROPUESTOS DEL MATERIAL
DE LECTURA.

También podría gustarte