Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase 6: Solemne
Curso Unidad 2: Análisis de Varianza Clase 7: Validación de supuestos del análisis de varianza
Nivel de Nivel de
hidrocarburos Pureza hidrocarburos Pureza
0,99 90,01 1,19 93,54
1,02 89,05 1,15 92,52
1,15 91,43 0,98 90,56
1,29 93,74 1,01 89,54
1,46 96,73 1,11 89,85
1,36 94,45 1,2 90,39
0,87 87,59 1,26 93,25
1,23 91,77 1,32 93,41
1,55 99,42 1,43 94,98
1,4 93,65 0,95 87,33
Regresión lineal simple
• Los datos se pueden representar en un diagrama de dispersión
Modelo de Regresión
• En un análisis de regresión de dos variables que llamaremos variable
independiente 𝑋 y la variable dependiente 𝑌.
• Supongamos que cierto experimento aleatorio lo trataremos de manera
simultanea dos variables.
• Seleccionamos 𝑛 valores 𝑥1 , 𝑥2 , … , 𝑥𝑛 y para cada valor 𝑥𝑗 obtenemos una
observación 𝑦𝑗 .
• Al inspeccionar el diagrama de dispersión, se observa que ninguna curva
simple pasa por los puntos, pero se puede suponer que la media de 𝑌 se
relaciona con 𝑋 por una relación lineal.
𝐸 𝑌 𝑥 = 𝜇𝑌ȁ𝑥 = 𝛽0 + 𝛽1 𝑥
𝑌ȁ𝑥 = 𝛽0 + 𝛽1 𝑥 + 𝜀
• Dónde 𝜀 es el término que representa al valor aleatorio
• Este modelo se le llama modelo de regresión lineal simple porque sólo
tiene una variable regresora.
• El modelo 𝜇𝑌ȁ𝑥 corresponde a una recta de valores medios.
• Además se toma el supuesto de que la media y varianza de 𝜀 son 0 y 𝜎 2
Así
𝐸 𝑌 𝑥 = 𝐸 𝛽0 + 𝛽1 𝑥 + 𝜀 = 𝛽0 + 𝛽1 𝑥 + 𝐸 𝜀 = 𝛽0 + 𝛽1 𝑥
𝑉 𝑌 𝑥 = 𝑉 𝛽0 + 𝛽1 𝑥 + 𝜀 = 𝑉 𝛽0 + 𝛽1 𝑥 + 𝑉 𝜀 = 𝜎 2
Regresión Lineal Simple
Regresión lineal simple: Estimación
Para estimar los coeficientes se usa el método conocido como método de los
mínimos cuadrados
• Supongamos que tenemos 𝑛 pares de observaciones, 𝑥1 , 𝑦1 , 𝑥2 , 𝑦2 ,
… , 𝑥𝑛 , 𝑦𝑛
• Las observaciones se pueden expresar como
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀𝑖
𝑛 𝑛
2 2
𝐿 = 𝜀𝑖 = 𝑦𝑖 − 𝛽0 − 𝛽1 𝑥𝑖
𝑖=1 𝑖=1
Regresión lineal simple: Estimación
Lo que se busca es encontrar una recta que minimice 𝐿, así los estimadores de
𝛽0 𝑦 𝛽1 , como por ejemplo 𝛽መ0 𝑦 𝛽መ1 deben satisfacer:
𝑛
𝜕𝐿
ቤ = −2 𝑦𝑖 − 𝛽መ0 − 𝛽መ1 𝑥𝑖 = 0
𝜕𝛽0 𝛽 1
,𝛽
0 𝑖=1
𝑛
𝜕𝐿
ቤ = −2 𝑦𝑖 − 𝛽መ0 − 𝛽መ1 𝑥𝑖 𝑥𝑖 = 0
𝜕𝛽1 𝛽 1
,𝛽
0 𝑖=1
Así
𝑛 𝑛
𝑛𝛽መ0 + 𝛽መ1 𝑥𝑖 = 𝑦𝑖
𝑖=1 𝑖=1
𝑛 𝑛 𝑛
𝛽መ0 = 𝑦𝑖 − 𝛽መ1 𝑥𝑖
𝑖=1 𝑖=1
𝑛 𝑛
𝛽መ0 = 𝑦ത − 𝛽መ1 𝑥ҧ
𝑛 𝑛
𝑛
𝑦𝑖 𝑥𝑖 − 𝑥𝑖 𝑦𝑖
𝑖=1 𝑖=1
𝑖=1
𝑛
𝛽መ1 = 𝑛 2
𝑛
𝑥𝑖2 − 𝑥𝑖
𝑖=1
𝑖=1
𝑛
Regresión lineal simple: Ejemplo
Considerando el problema de la pureza del oxígeno, ajustar el modelo de
regresión
Nivel de Nivel de
hidrocarburos Pureza hidrocarburos Pureza
0,99 90,01 1,19 93,54
1,02 89,05 1,15 92,52
1,15 91,43 0,98 90,56
1,29 93,74 1,01 89,54
1,46 96,73 1,11 89,85
1,36 94,45 1,2 90,39
0,87 87,59 1,26 93,25
1,23 91,77 1,32 93,41
1,55 99,42 1,43 94,98
1,4 93,65 0,95 87,33
Regresión lineal simple: ejemplo
Salida R
Modelo
𝑥𝑖 2
𝑖=1
𝐸 𝛽መ0 = 𝛽0 𝑉 𝛽መ0 = 𝑛 𝜎2
𝑛 𝑥𝑖 − 𝑥ҧ 2
𝑖=1
𝜎2
𝑛
𝐸 𝛽መ1 = 𝛽1 𝑉 𝛽መ1 = 2
𝑥𝑖 − 𝑥ҧ
𝑖=1
2
Estimación de 𝜎
• 𝜎 2 se describe como la desviación cuadrada entre la observación y la media
estimada 𝑦ො𝑖 , un estimador insesgado sería
𝑛
2
2 𝑦𝑖 − 𝑦ො
𝑠 =
𝑖=1
𝑛−2
𝑆𝐶𝐸
𝑠2 =
𝑛−2
Dónde 𝑆𝐶𝐸 representa la suma cuadrado del error
𝑛
2
𝑆𝐶𝐸 = 𝑦𝑖 − 𝑦ො
𝑖=1
Inferencias sobre los coeficientes
• Para la construcción de los intervalos de confianza para los estimadores,
debemos suponer que los errores se distribuyen normales, 𝜀𝑖 son 𝑁𝐼𝐷 0, 𝜎 2 .
Así 𝑦𝑖 son 𝑁𝐼𝐷 𝛽0 + 𝛽1 𝑥𝑖 , 𝜎 2 .
• Para probar 𝐻0 que 𝛽1 = 𝛽10 , es decir que es igual a una constante, en
comparación a una hipótesis alternativa, utilizamos la distribución 𝑡 con 𝑛 −
2 g.l , el estadístico queda:
𝛽መ1 −𝛽10
𝑇=
𝑠/ 𝑆𝑥𝑥
Dónde
𝑛
2
𝑆𝑥𝑥 = 𝑥𝑖 − 𝑥ҧ
𝑖=1
Intervalo de confianza para los estimadores
• Considernado el estadístico de 𝑡, podríamos fijar un intervalo de confianza
100 1 − 𝛼 % para el parámetro 𝛽1 .
𝑠 𝑠
𝛽መ1 −𝑡𝛼,𝑛−2 < 𝛽1 < 𝛽መ1 + 𝑡𝛼,𝑛−2
2 𝑆𝑥𝑥 2 𝑆𝑥𝑥
𝑛 𝑛
𝑠 𝑠
𝛽መ0 −𝑡𝛼,𝑛−2 𝑥𝑖2 < 𝛽0 < 𝛽መ0 −𝑡𝛼,𝑛−2 𝑥𝑖2
2 𝑛𝑆𝑥𝑥 𝑖=1
2 𝑛𝑆𝑥𝑥 𝑖=1
14,947
𝑡= = 11,35
1,18/0,68
Intervalos de confianza de la media y
observación
Para la media
1 𝑥0 − 𝑥ҧ 2 1 𝑥0 − 𝑥ҧ 2
𝑦ො0 −𝑡𝛼,𝑛−2 𝑠 2 + ≤ 𝜇𝑌ȁ𝑥 ≤ 𝑦ො0 +𝑡𝛼,𝑛−2 𝑠 2 +
2 𝑛 𝑆𝑥𝑥 2 𝑛 𝑆𝑥𝑥
1 𝑥0 − 𝑥ҧ 2
𝑦ො0 −𝑡𝛼,𝑛−2 𝑠 2 1+ + ≤ 𝑦0
2 𝑛 𝑆𝑥𝑥
1 𝑥0 − 𝑥ҧ 2
≤ 𝑦ො0 +𝑡𝛼,𝑛−2 𝑠 2 1+ +
2 𝑛 𝑆𝑥𝑥
Resumen de la clase
• Se revisaron los conceptos de :