Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Por ejemplo, es posible que se tenga interés en analizar la relación entre presión
sanguínea y edad, estatura y peso, la concentracion de un medicamento
inyectable y la frecuencia cardiaca, el nivel de consumo de algunos nutrientes y la
ganancia de peso, la intensidad de un estímulo y el tiempo de reacción, el ingreso
familiar y los gastos médicos.
Es útil para averiguar la forma probable de las relaciones entre las variables. El objetivo
final, cuando se emplea este metodo de análisis, es predecir o estimar el valor de una
variable Y que corresponde al valor dado de otra variable X.
Para el modelo de regresión lineal simple son importantes solo dos variables, X y Y.
X se Ie conoce como variable independiente y a la variable Y se Ie conoce como variable
dependiente, y se habla de regresión de Y sobre X, o Y en función de X.
Regresión Lineal Simple
Modelo de Y= 𝜷𝟎 + 𝜷𝟏 𝒙 + 𝒆
regresión lineal
A 𝜷𝟎 y 𝜷𝟏 se los conoce como los parámetros del modelo, 𝒆 es una variable aleatoria que se conoce como
término del error. El término del error da cuenta de la variabilidad de Y que no puede ser explicada por la
relación lineal entre X y Y.
1. El término del error es una variable aleatoria cuya media, o valor esperado es cero; es decir E(e)= 0.
2. Para cada valor de X existe una subpoblación de valores de Y. Para que los procedimientos de inferencia
estadística de estimación y prueba de hipótesis sean validos estas subpoblaciones deben seguir una
distribución normal.
3. La varianza de e que se denota 𝜎𝑒2 , es la misma para todos los valores de X. La varianza de Y respecto a la recta
de regresión es igual a σ2 y es la misma para todos los valores de X.
5. El término del error e es una variable aleatoria distribuida normalmente. Como Y es función lineal de e,
también Y es una variable aleatoria distribuida normalmente.
Y y1
e1
𝑦ො 1
X
Regresión Lineal Simple
Prueba de significancia
En una ecuación de regresión lineal simple, la media o valor esperado de Y es una función lineal de X.
E(Y)= 𝜷𝟎 + 𝜷𝟏 𝒙
Contraste de Hipótesis
H0: 𝜷𝒊 = 0
Ha: 𝜷𝒊 ≠ 0
ෝ = 𝒃𝟎 + 𝟎 𝒙 y tendríamos que Y no depende de X es decir X y Y no están
Si 𝒃𝟏 = 0 entonces 𝒚
relacionadas linealmente. Si pasa lo contrario que 𝒃𝟏 ≠ 0 , se cumple que Y si está relacionada
linealmente con X. Por lo tanto, para probar si existe una relación de regresión significante, se
debe realizar una prueba de hipótesis para determinar si el valor de 𝒃𝟏 es distinto de cero.
H0: 𝜷𝟏 = 0
Ha: 𝜷𝟏 ≠ 0
2
En Regresión lineal simple 𝑅2 = 𝑟𝑥𝑦 ;
siendo 𝑟𝑥𝑦 el coeficiente de correlación
lineal entre X y Y
Regresión Lineal Simple - Ejemplo
Test de correlación
Pearson's product-moment correlation
data: XCirc.Cintura and YTejido.Adiposo
t = 14.74, df = 107, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal
to 0
Matriz de correlación
95 percent confidence interval:
Rcmdr> cor(regresion[,c("XCirc.Cintura","YTejido.Adiposo")], 0.7451954 0.8723430
use="complete") sample estimates:
XCirc.Cintura YTejido.Adiposo cor
XCirc.Cintura 1.0000000 0.8185578 0.8185578
YTejido.Adiposo 0.8185578 1.0000000
Rcmdr> RegModel.1 <- lm(YTejido.Adiposo~XCirc.Cintura,
data=regresion) Prueba de Significancia
Rcmdr> summary(RegModel.1)
H0: 𝜷𝟏 = 0
Ha: 𝜷𝟏 ≠ 0 Como el p-value es <2e-16 y es
Call: significativo, entonces hay
lm(formula = YTejido.Adiposo ~ XCirc.Cintura, data = regresion)
evidencia estadística para
Residuals: rechazar la hipótesis H0, es decir
Min 1Q Median 3Q Max 𝜷𝟏 no es igual a cero, igual
-107.288 -19.143 -2.939 16.376 90.342 sucede para 𝜷𝟎
Coeficiente de Determinación
Coefficients:
Estimate Std. Error t value Pr(>|t|) R2 ajustado es 0.667 es decir el modelo encontrado
(Intercept) -215.9815 21.7963 -9.909 <2e-16 *** se ajusta (explica) en un 66.7%
XCirc.Cintura 3.4589 0.2347 14.740 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
ෝ = 𝒃𝟎 + 𝒃𝟏 𝒙
𝒚
Residual standard error: 33.06 on 107 degrees of freedom
Multiple R-squared: 0.67, Adjusted R-squared: 0.667 ෝ = −215.9815 + (3.4589) 𝒙
𝒚
F-statistic: 217.3 on 1 and 107 DF, p-value: < 2.2e-16 𝑻𝒆𝒋𝒊𝒅𝒐
𝑨𝒅𝒊𝒑𝒐𝒔𝒐 = −215.9815 +3.4589 Circ Cintura
0.4
Nitrite
2. Test de correlación para verificar si es significativa la correlación lineal
0.2
Rcmdr> with(Dataset, cor.test(Nitrite, Temperature, alternative="two.sided",
Rcmdr+ method="pearson"))
0.0
Pearson's product-moment correlation
20 22 24 26
data: Nitrite and Temperature
t = -4.5524, df = 22, p-value = 0.0001565 Temperature
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.8586308 -0.4075850
sample estimates:
cor
-0.6964693
Regresión Lineal Simple
Prueba de Significancia
Rcmdr> RegModel.3 <- lm(Nitrite~Temperature, data=Dataset) Como el p-value es 0.000157 y
H0: 𝜷𝟏 = 0 es significativo, entonces hay
Rcmdr> summary(RegModel.3) evidencia estadística para
Ha: 𝜷𝟏 ≠ 0
Call:
rechazar la hipótesis H0, es decir
lm(formula = Nitrite ~ Temperature, data = Dataset) 𝜷𝟏 no es igual a cero
Residuals:
Min 1Q Median 3Q Max Coeficiente de Determinación
-0.162043 -0.047086 -0.007109 0.028934 0.272539
R2 ajustado es 0.4617 es decir el modelo encontrado
Coefficients: se ajusta (explica) en un 46.17%
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.938155 0.186117 5.041 0.0000477 ***
Temperature -0.034957 0.007679 -4.552 0.000157 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ෝ = 𝒃𝟎 + 𝒃𝟏 𝒙
𝒚
Modelo final
Regresión Lineal Simple
2000000
Tothers 0.3979985 0.1077741 0.29369 0.4561534 1
1000000
Tbiom
Rcmdr> with(Dataset, cor.test(Tbiom, Tdiatcent, alternative="two.sided",
Rcmdr+ method="spearman"))
0
data: Tbiom and Tdiatcent 0 400000 800000 1400000
S = 367.16, p-value = 0.000000277
alternative hypothesis: true rho is not equal to 0 Tdiatcent
sample estimates:
rho
0.8403655
Regresión Lineal Simple
Prueba de Significancia
Rcmdr> RegModel.2 <- lm(Tbiom~Tdiatcent, data=Dataset) Como el p-value es 9.6e-12 y es
H0: 𝜷𝟏 = 0 significativo, entonces hay
Rcmdr> summary(RegModel.2) evidencia estadística para
Ha: 𝜷𝟏 ≠ 0
Call:
rechazar la hipótesis H0, es decir
lm(formula = Tbiom ~ Tdiatcent, data = Dataset) 𝜷𝟏 no es igual a cero
Residuals:
Min 1Q Median 3Q Max Coeficiente de Determinación
-220235 -134715 -66466 92693 449958
R2 ajustado es 0.8781 es decir el modelo encontrado
Coefficients: se ajusta (explica) en un 87.81%
Estimate Std. Error t value Pr(>|t|)
(Intercept) 167655.35905 53927.24737 3.109 0.00512 **
Tdiatcent 1.20946 0.09366 12.913 9.6e-12 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ෝ = 𝒃𝟎 + 𝒃𝟏 𝒙
𝒚
Modelo final
Regresión Lineal Simple