Está en la página 1de 5

FORMULE Y ESTIME UN MODELO DE REGRESIÓN LINEAL CON

VARIABLES DICOTÓMICAS
Las medidas de 12 personas muestran la circunferencia de la cintura (cm), el peso, la altura
y la edad.
PESO ALTURA CINTURA EDAD

74 168 62 25

92 196 75 31

63 170 60 29

72 175 71 64

58 162 66 44

78 169 62 41

85 190 79 37

85 186 74 35

73 176 70 34

62 170 66 29

80 176 71 19

72 179 79 50

Almacenamos datos para dos variables en dos vectores.


Peso
74 92 63 72 58 78 85 85 73 62 80 72

Altura
168 196 170 175 162 169 190 186 176 170 176 179
 
Supongamos que nuestro objetivo es determinar el peso de una persona a partir de la altura,
o la variable dependiente es el peso y la variable independiente es la altura. Dado que
queremos graficar las varianzas de dos variables para determinar si la relación entre ellas se
puede considerar lineal, tiene sentido desarrollar un modelo de regresión lineal simple.

100

90

80

70

60

50
Valores Y
40

30

20

10

0
160 165 170 175 180 185 190 195 200

Como podemos suponer que existe una relación lineal entre las dos variables en términos
de un diagrama de dispersión, procedemos a ajustar un modelo lineal.

> reg_lin <- lm(peso ~ altura)


> reg_lin
Call:
lm(formula = peso ~ altura)

Coefficients:
(Intercept) altura
-80.222 0.877

> summary(reg_lin)
Call:
lm(formula = peso ~ altura)

Residuals:
Min 1Q Median 3Q Max
-6.872 -4.084 -1.196 3.038 10.005

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -80.2220 29.8888 -2.684 0.022934 *
altura 0.8770 0.1692 5.184 0.000411 ***

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 5.572 on 10 degrees of freedom


Multiple R-squared: 0.7288, Adjusted R-squared: 0.7017
F-statistic: 26.87 on 1 and 10 DF, p-value: 0.0004106

De forma predeterminada, la salida de vuelta por la función lm contiene solo estimaciones


de los parámetros (en este caso, β^0 y β^1). Entonces el modelo lineal se puede escribir
como

PESOi = -80.222+0.877ALTURAi
Ajustaremos un nuevo modelo de regresión lineal que incorpore información de estas
nuevas variables. Primero, crearemos dos vectores numéricos, uno para cada nueva
variable.

> Cintura <- c(62, 75, 60, 71, 66, 62, 79, 74, 70, 66, 71, 69)
> Edad <- c(25, 31, 29, 64, 44, 41, 37, 35, 34, 29, 19, 50)

Y ajustaremos un modelo de regresión lineal (cintura con la edad).

> reg_lin <- lm(cintura ~ edad )


> reg_lin

Call:
lm(formula = cintura ~ edad)
Coefficients:
(Intercept) edad
66.50997 0.06137

> summary(reg_lin)
Call:
lm(formula = cintura ~ edad)
Residuals:
Min 1Q Median 3Q Max
-8.2897 -3.9188 -0.0081 3.8285 10.2193
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 66.50997 5.73594 11.60 4.03e-07 ***
edad 0.06137 0.14981 0.41 0.691

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 6.002 on 10 degrees of freedom


Multiple R-squared: 0.01651, Adjusted R-squared: -0.08184
F-statistic: 0.1678 on 1 and 10 DF, p-value: 0.6907

El modelo se puede escribir como


CINTURAi = 66.50997+0.06137 EDADi

También podría gustarte