Está en la página 1de 21

Análisis de Regresión

Lineal
Módulo12
Probabilidad y Estadística
2019 - 2

Videoconferencia 13
Tema: Análisis de Regresión Lineal

ÍNDICE

Temario

Introducción al tema

Desarrollo del contenido (Sub temas)

Conclusiones

Consultas
OBJETIVO

Estimar e interpretar la relación que existe entre una variable

dependiente y una o mas variables independientes o explicativas

utilizando el software MegaStat


Tema: Análisis de Regresión Lineal

TEMARIO

1. Introducción

2. Análisis de Regresión Lineal Simple

3. Medidas de Bondad de Ajuste

4. Predicciones

5. Ejemplos

6. Conclusiones
Tema: Análisis de Regresión Lineal

1. Introducción
Un modelo de regresión es un modelo que permite describir como influye una variable X
sobre otra variable Y

❑ X: Variable independiente o explicativa

❑ Y: Variable dependiente o respuesta

El objetivo es obtener estimaciones razonables de Y para distintos valores de X a partir


de una muestra de n pares de valores (x1, y1), . . . ,(xn, yn)

Ejemplos:

❑ Estudiar como influye la estatura del padre sobre la estatura del hijo.

❑ Estimar el precio de una vivienda en función de su superficie.

❑ Aproximar la calificación obtenida en un curso según el número de horas de estudio


semanal.
Tema: Análisis de Regresión Lineal
Regresión

Predice o explica el comportamiento de una variable dependiente (Y) en función de otra


variable independiente (X).

Regresión Lineal Simple

Este tipo de regresión se utiliza cuando existe solo una variable independiente X para una
variable dependiente Y. Está definida por la siguiente ecuación lineal en su forma general:

Donde:
𝑌 = 𝑏0 + 𝑏1 𝑋𝑖 + ℯ
Y: Es la variable respuesta o la predicción de la variable Y dado un valor X

𝒃𝟎 : Es el valor de Y cuando X = 0, es decir, es el valor de Y cuando la línea de regresión cruza el eje


de las Y.

𝒃𝟏 : Es la pendiente de la línea, o la variación promedio en Y por cada variación de una unidad en X.

𝑿𝒊 :Es cualquier valor seleccionado de la variable independiente X.

𝓮 : Es el error de predicción
Tema: Análisis de Regresión Lineal

2. Diagrama de dispersión

Es una gráfica en la que cada punto representa un par de valores observados (xi,yi)
de las variables dependientes e independientes.

Tipos de Diagrama de dispersión

Relación directa entre X e Y Relación inversa entre X e Y Relación no lineal entre X e Y


Tema: Análisis de Regresión Lineal

3. Supuestos del modelo

1. NORMALIDAD DE LOS ERRORES (KOLMOGOROV- SMIRNOV)

Ho: Los errores se distribuyen normalmente

H1: Los errores no distribuyen normalmente

2. AUTOCORRELACION DE ERRORES (DURBIN-WATSON; DW)


0 1 3 4
Autocorrelación + No hay Autocorrelación Autocorrelación -

1 ≤ 𝐷𝑊 ≤ 3
Tema: Análisis de Regresión Lineal

4. Ecuación de regresión estimada

෢0 + 𝛽
𝑌෠ = 𝛽 ෢1 + 𝑒

෢0
𝛽 Intercepto con el eje. Es el valor de Y que se obtiene cuando x = 0
:
෢1 : Pendiente de la recta. Mide el cambio que se producirá en la variable.
𝛽

෢0 >0 (Pendiente positiva)


Directa: 𝛽
෢1 <0 (Pendiente negativa)
Inversa: 𝛽
Tema: Análisis de Regresión Lineal

5. Prueba de independencia
Validar el coeficiente de regresión
Hipótesis

𝐻0 :෣
𝛽0 = 0 (No existe relación lineal entre X e Y)

𝐻1 :෣
𝛽1 ≠ 0 (Existe relación lineal entre X e Y)

Estadístico de prueba:

Fuentes de Grados de Suma de Cuadrado F calculado


variación libertad cuadrados medio
Regresión 1 SCR CMR(1) Fc=(1)/(2)
Error n-2 SCE=SCT-SCR CME(2)
Total n-1 SCT
Supuestos: Normalidad en los residuos y No autocorrelación de los residuos

Decisión: Si P- valor ≤= 𝛼, se rechaza 𝐻0


Tema: Análisis de Regresión Lineal

Medidas de Bondad de ajuste


A. Coeficiente de correlación

El Coeficiente de correlación (r) consiste en determinar el grado


de relación entre dos variables. El coeficiente de correlación es
un número comprendido entre −1 ≤ 𝑟 ≤ 1.
Se define:
n xy −  x  y
r=
n x − ( x ) n y − ( y )
2 2 2 2

Si r> 0, se dice que hay una correlación directa positiva.


Si r= 1, se dice que hay una correlación perfecta positiva.
Si r< 0, se dice que hay una correlación inversa negativa.
Si r= −1, se dice que hay una correlación perfecta negativa.
Si r= 0, se dice que no hay una correlación lineal entre las 2 variables.
Gráficos de dispersión
Tema: Análisis de Regresión Lineal

B. Coeficiente de correlación de Pearson

ALTA MEDIA BAJA BAJA MEDIA ALTA

-1 -0.7 -0.4 0 +0.7 +1


+0.4
PERFECTA PERFECTA

(-) INVERSA
(+) DIRECTA
Tema: Análisis de Regresión Lineal

C. Coeficiente de Determinación
El coeficiente de determinación, también llamado R cuadrado, refleja la bondad del
ajuste de un modelo a la variable que pretende explicar.

Es importante saber que el resultado del resultado del coeficiente de determinación


oscila entre 0 y 1.

Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable
que estamos intentando explicar.

De forma inversa, cuanto más cerca de cero, menos ajuste estará el modelo y, por lo
tanto, menos fiable será.
σ 𝑖 ( ෡
𝑌𝑖 − ത
𝑌) 2
𝑅2 =
σ𝑖(𝑌𝑖 − 𝑌) ത 2
0 ≤ 𝑅2 ≤ 1
Para probar la autocorrelación positiva con nivel de significancia α, la estadística de prueba d se
compara con los valores críticos inferiores y superiores (dL,α and dU,α):
• Si d < dL,α, existe evidencia estadística de que los términos de error estén autocorrelacionados
positivamente.
• Si d > dU,α, no hay evidencia estadística de que los términos de error estén autocorrelacionados
positivamente.
• Si dL,α < d < dU,α, la prueba no es concluyente.
Correlación serial positiva es la correlación en serie en la que un error positivo para una
observación aumenta las posibilidades de un error positivo para otra observación.
Para probar la autocorrelación negativa con nivel de significancia α, la estadística de prueba (4 - d)
se compara con los valores críticos inferior y superior (dL,α and dU,α):
• Si (4 − d) < dL,α, existe evidencia estadística de que los términos de error se autocorrelacionados
negativamente.
• Si (4 − d) > dU,α, no hay evidencia estadística de que los términos de error se
autocorrelacionados negativamente.
• Si dL,α < (4 − d) < dU,α, la prueba no es concluyente.
Correlación serial negativa implica que un error positivo para una observación aumenta la
probabilidad de un error negativo para otra observación y un error negativo para uno aumenta las
posibilidades de un error positivo para otra observación.
Tema: Análisis de Regresión Lineal

. Ejemplo de aplicación

La empresa Blamy llevó a cabo un estudio para determinar la relación entre el número de
años de experiencia (X) y el salario mensual, en cientos de soles (Y) entre los accionistas de
cierta ciudad. Para ello, se tomó una muestra aleatoria de 16 accionistas y se obtuvieron los
siguientes datos:
Experiencia 13 16 30 2 8 6 20 1 4 10 27 31 19 7 15 25
Salario 41.76 53.12 57.76 26.40 42.24 30.56 58.40 27.04 31.68 39.36 57.60 58.24 54.08 34.24 49.60 58.40

a) Obtenga un diagrama de dispersión con la información anterior.


b) Hallar la ecuación de regresión determinando los coeficientes de regresión.
c) El salario de un accionista que tiene 18 años de experiencia.
d) El coeficiente de correlación. Interprete este valor
e) El coeficiente de determinación. Interprete este valor.
f) Compruebe la validez del modelo obtenido. Use α = 0,05.
Tema: Análisis de Regresión Lineal

CONCLUSIONES

1. El análisis de regresión y correlación lineal constituyen métodos que se


emplean para conocer las relaciones y significación entre series de datos.
2. Diagrama de dispersión nos orientan a decidir el uso de los métodos de regresión y
correlación lineal.
3. El análisis de correlación produce un número que resume el grado de la fuerza de
relación entre dos variables.
4. El análisis de regresión da lugar a una ecuación matemática que describe dicha
relación.
Tema: Análisis de Regresión Lineal

CONSULTAS

Realice consultas a través del


chat o solicita al docente activar
el micrófono para participar.

También podrás enviar tus consultas a través


de Pregúntale al profesor o Mensajería interna
y te responderé en 24 horas.
Análisis de Regresión
Lineal.

Material producido por:


Universidad Privada del Norte

@ 2019 | Universidad Privada del Norte

También podría gustarte