Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Regresión
Lineal Simple
En situaciones en las que se observan dos o mas
variables cuantitativas sobre cada unidad
experimental y el interés se centra en la forma
en que se relacionan éstas variables surgen
Interrogantes:
1. Existe relación entre las variables?
2. Si se conoce el comportamiento de una de
ellas, es posible predecir el comportamiento
de la otra?
Objetivos:
Y X
Y X X 2
Modelo de Regresión Lineal
Simple
E y \ xi y \ xi xi
y la varianza es s2.
+ 1xi
E(y|x2)
+ 1x2 E(y|x1)
+ 1x1
x1 x2 xi X
1020
𝑦𝑖𝑗 = 𝛼 + 𝛽𝑥𝑖 +ij
890
760
630
500
2 3 4 5 6 7
pH
•Para estudiar la validez del modelo
es necesario confirmar estas
hipótesis mediante el estudio de
los residuos
•r = valores observados - valores
predichos por el modelo
• normalidad, tendencias, etc.
Consideremos el ejemplo siguiente:
Temperatura
0 15 30 45 60 75
(°C)
Gramos 8-6-8 12-10-14 25-21-24 31-33-28 44-39-42 48-51-44
Diagrama de Dispersión
60
50
Cantidad Compuesto
40
30
20
10
0
0 15 30 45 60 75
Temperatura
• En primer lugar debemos encontrar los
parámetros de la recta y .
60
𝑦 = 𝑎 + 𝑏 𝑥𝑖
50
Cantidad Compuesto
𝑒𝑖
40
30
20
10
0
0 15 30 45 60 75
Temperatura
Estimación de los parámetros de
la recta
x x y y S
• Pendiente: b ̂ i i
XY
x x
2
i
S XX
• Ordenada al origen: a ˆ y ˆ x
Análisis con Infostat
•Activando
Menú→Estadisticas→Regresion Lineal, se
habilita la ventana que permite declarar
las variables: Y (peso) se debe colocar
como dependiente y X (temperatura)
como regresora.
•Se obtienen en la salida los coeficientes
de regresión y estadísticos asociados.
Con Infostat
La ecuación buscada es:
yˆ 5.83 0.57 x
50
Cantidad Compuesto
ei
40
30
20
10
0
0 15 30 45 60 75
Temperatura
•El parámetro s2 (varianza del error en el
modelo de regresión), refleja la variación
aleatoria alrededor de la verdadera recta
de regresión.
yi yi
ˆ 2
sˆ 2 i 1
e 2
𝑥2 𝜎𝑒
𝜎𝑎 = 𝜎𝑒 𝑛𝑆𝑥𝑥 y 𝜎𝑏 =
𝑆𝑥𝑥
•El estadístico de prueba es:
ˆ 0 b 0
t
sˆ b sb
•Siendo sˆ b el error estándar estimado de la pendiente.
•La hipótesis nula se rechaza sit t ó para un valor
n 2
p adecuado. 2
Pruebas de Hipótesis sobre la
pendiente
y y
-4 -3 -2 -1 0 1 2 3 4
x -4 -3 -2 -1 0 1 2 3 4
x
Si se rechaza H0
Yi X i i
• x tiene importancia para • Existe un efecto lineal
explicar la variabilidad de de x, pero pueden
y y el modelo es adecuado obtenerse mejores
resultados con la adición
de términos polinomiales
de mayor grado en x
Y
y
x
x
• También es posible determinar un intervalo de
confianza de 100(1-)% para la pendiente,
según la expresión siguiente:
sˆ b
Pruebas de Hipótesis sobre la ordenada al
origen.
•Si se desea probar si la ordenada al origen es igual a cero ( o a algún
otro valor):
•H0 : = 0
•H1 : ≠ 0
•El estadístico de prueba es:
a0
t
sˆ a
•Siendo el denominador el error estándar estimado de ordenada al
origen.
𝜎ŝ𝑎
El método del Análisis de la Varianza
CuadradoMedioRe gresión
F
CuadradoMedioError
3805,89
F 575.06
6.62
para probar la H0 que la variabilidad explicada
por el modelo lineal no es mayor que la
explicada por el error.