Está en la página 1de 25

+

Regresión Lineal Simple

Tatiana Pamela Jimenez


+
Regresión lineal simple

 Objetivo  caracterizar el comportamiento de una variable


Y (dependiente) como una función lineal de una variable X
(independiente).

Tatiana Pamela Jimenez


+
Regresión lineal simple

 El procedimiento básico de Regresión lineal simple consta


de tres pasos:

 Análisis de Correlación: Establecer la fuerza de relación entre las


dos variables.
 Construcción de la ecuación de ajuste: Determinar las
estimaciones de los valores de b 0 y b 1.
 Validación de supuestos del modelo: Normalidad, Independencia,
Linealidad.

Tatiana Pamela Jimenez


+
Análisis de correlación
Diagrama de dispersión
 Exploratoria  Diagrama de dispersión

ión facilita
e la relación
ntificar el tipo de

Tatiana Pamela Jimenez


+
Análisis de correlación

Tatiana Pamela Jimenez


+
Análisis de correlación

 Analítica  Coeficiente de correlación y Coeficiente de


determinación.

 Coeficiente de correlación: Medida para indicar el grado de


relación entre dos variables.

Tatiana Pamela Jimenez


+
Análisis de correlación

Estimación del coeficiente de correlación:

Prueba de hipótesis sobre el coeficiente de correlación poblacional

Valores críticos: ±ta/2,n-2

Tatiana Pamela Jimenez


+
Análisis de correlación

 Coeficiente de determinación: Medida relativa, indica la


proporción de varianza de Y que es explicada por la
variabilidad de la variable X.

 R2 = r2

Tatiana Pamela Jimenez


+
Ejemplo
Gráfico de dispersión

Tatiana Pamela Jimenez


+
Ejemplo
Análisis de correlación

Como el p_valor es menor a 0.05 de


significancia, hay evidencia para rechazar Ho.
Hay relación entre la cantidad de lluvia diaria
y la cantidad de partículas eliminadas

Estimación puntual del coeficiente de


correlación y la estimación del intervalo de
confianza
Tatiana Pamela Jimenez
+ Construcción de la ecuación
de ajuste

Tatiana Pamela Jimenez


+
Construcción de la ecuación de
ajuste
Estimación de b 1:

Estimación de b 0:

Ecuación de predicción:

Residuales:

Error estándar de la ecuación:

Tatiana Pamela Jimenez


+
Intervalos de confianza para b 0 y b 1

Tatiana Pamela Jimenez


+
Ejemplo
Construcción de la ecuación de ajuste

Estimaciones de b o y b 1 para el Ejemplo

Se = 2,20261

Tatiana Pamela Jimenez


+
Ejemplo
Análisis de regresión

Estimación y significancia de los


parámetros

Tatiana Pamela Jimenez


+
Ejemplo
Análisis de varianza (significancia del modelo)

Ho: y = bo+b 1x
Ha: y ≠ bo+b 1x

Tatiana Pamela Jimenez


+
Construcción de la ecuación de
ajuste

Conclusión: Las partículas eliminadas pueden explicarse a través de la


cantidad de lluvia, mediante la ecuación,

la cual tiene un error estándar de Se = 2,20261, y cuya representatividad de


variabilidad es del 96%

Tatiana Pamela Jimenez


+
Validación de supuestos

Tatiana Pamela Jimenez


+
Supuestos

 Linealidad

 Independencia

 Normalidad

 Homocedasticidad

Tatiana Pamela Jimenez


+
Validación de supuestos
(Para los procedimientos se utilizan los residuales)

Supuesto de linealidad si el modelo lineal es apropiado para los


datos no se debe observar ningún patrón de comportamiento entre los
residuales y la variable X.

Tatiana Pamela Jimenez


+
Validación de supuestos
(Para los procedimientos se utilizan los residuales)
Independencia  Se verifica que los datos son independientes entre ellos

Se puede mostrar mediante un gráfico de residuales contra su orden de


recolección

Estadístico de Durbin-Watson

0 ≤ DW ≤ 4

Entre 1.5 y 2.5 se considera que hay independencia


Menor a 1.5 hay autocorrelación positiva
Mayor a 2.5 hay autocorrelación negativa
Tatiana Pamela Jimenez
+
Validación de supuestos
(Independencia)

Tatiana Pamela Jimenez


+
Validación de supuestos
(Para los procedimientos se utilizan los residuales)

Homocedasticidad  Igualdad de varianzas de los residuos.

Prueba de Breusch-Pagan
para homocedasticidad

Tatiana Pamela Jimenez


+
Validación de supuestos
(Para los procedimientos se utilizan los residuales)

Normalidad  Las observaciones provienen de una población con


distribución normal.

De manera gráfica  se construye el gráfico de probabilidad normal


(Q-Q)

1. Ordenar de menor a mayor los residuales


2. Calcular su probabilidad acumulada, mediante la fórmula:
(posición – 0.5)/n
3. Determinar a cuál valor de Z le corresponde la probabilidad
acumulada.
4. Graficar residuales vs. valores Z

Tatiana Pamela Jimenez


+ Validación de supuestos
(Normalidad)

Tatiana Pamela Jimenez

También podría gustarte