Documentos de Académico
Documentos de Profesional
Documentos de Cultura
0.937 √ 20 −2
𝑇 =¿ =11.38
√1 −0.937 2
𝑝 ¿=5.898482813293526 𝑒 −10 ¿
Por lo tanto, decimos que la correlación entre las variables es estadísticamente significativa al nivel del 5%.
En la Regresión:
• Observamos una variable dependiente o de respuesta (Y).
• Y = f(X1, …, Xn)
4
Diferentes tipos de regresión
• Regresión lineal simple
.
Y = 0 + 1X + μ . . .. .
Y = 0 + 1X1 + 2X2+ μ
• Regresión Polinomial
. .
Y = 0 + 1X + 2X + μ
.
.
2
..
5
Reconocer en la Regresión
La variable RESPUESTA y el PREDICTOR
10
Y = 0 + 1X + 7
Parámetros: 4
4 1 5 2 6 3 7 8
Ideas Básicas
a. Graficar las observaciones (X,Y)
b. Hallar la mejor línea que ajusta los puntos graficados.
7
Actividad de Clase
1. En el ejemplo anterior, la variable respuesta es:
A. Hidrocarbon level B. Purity.
8
Simple linear regression: model
Con los datos {(X1,Y1),….,(Xn,Yn)}, nosotros modelamos la
relación lineal:
E(i) = 0
Var (
{1,…, n} are independent random variables
(Asumiremos también que i ~ Normal)
9
Resumen: Regresión Lineal Simple
Basados en el diagrama de dispersión, es razonable asumir que la media de la variable
aleatoria Y está relacionada a X por el siguiente modelo de regresión lineal simple:
Yi 0 1 X i i i 1,2,!,
i n
i
Error aleatorio
Intercepto Pendiente
•El caso de regresión lineal simple, considera un único regresor or predictor x y una única
variable dependiente (o respuesta) Y.
10
Método de Mínimos Cuadrados Ordinarios
𝒏 𝒏
Pendiente
Intercepto
𝑛 𝑛 𝑛
^
β 1=
𝑛∑ 𝑋 𝑖 𝑌 𝑖 − ∑ 𝑋𝑖 ∑ 𝑌 𝑖
𝑖 =1 𝑖 =1 𝑖 =1 ^β =𝑌 − ^β 𝑋
0 1
(∑ )
𝑛 𝑛 2
𝑛∑ 𝑋𝑖 −
2
𝑋𝑖
𝑖=1 𝑖 =1
^ =β
𝑌 ^ +β
^ 𝑋 Recta de Regresión Ajustada.
𝑖 0 1 𝑖
14
Ejemplo: Purity y hydrocarbon level
Table 11-1 Oxygen and Hydrocarbon Levels
Observació Hydrocarbon Level Purity
n x (%) y (%)
1 0.99 90.01
Ajustar un modelo de regresión lineal simple
2 1.02 89.05
3 1.15 91.43 relacionando purity (y) con hydrocarbon level
4 1.29 93.74 (x)
5 1.46 96.73
6 1.36 94.45
7 0.87 87.59
8 1.23 91.77
9 1.55 99.42 100
10 1.40 93.65
98
11 1.19 93.54
96
12 1.15 92.52
13 0.98 90.56
Purity ( y)
94
14 1.01 89.54 92
15 1.11 89.85
90
16 1.20 90.39
88
17 1.26 93.25
18 1.32 93.41 86
0
19 1.43 94.98 .
8
20 0.95 87.33 5
0
.
9 15
5
1
El Modelo de Regresión Estimado, es:
2,214.6566
𝑛 𝑛 𝑛
𝑛∑ 𝑋 𝑖 𝑌 𝑖 − ∑ 𝑋𝑖 ∑ 𝑌 𝑖
^
β 1=
𝑖 =1 𝑖 =1 𝑖 =1 29.2892
(∑ )
𝑛 𝑛 2
𝑛∑ 𝑋𝑖 −
2
𝑋𝑖
𝑖=1 𝑖 =1
3.92 1,843.21
(∑ )
𝑛 𝑛 2 𝑛 𝑛
𝑛∑ 𝑋 2
𝑖 − 𝑋𝑖 ∑ ( 𝑋𝑖 − 𝑋 )
2
∑ 2
𝑥𝑖
𝑖= 1 𝑖 =1 𝑖 =1 𝑖 =1
𝐷𝑜𝑛𝑑𝑒 : 𝑥𝑖 = 𝑋 𝑖 − 𝑋 𝑦 𝑦 𝑖 =𝑌 𝑖 − 𝑌
= Donde:
𝐷𝑒𝑒𝑠𝑡𝑜 , 𝑠𝑖𝑔𝑢𝑒𝑞𝑢𝑒 :
𝑛 𝑛 𝑛
1
∑ 𝑤 𝑖= 0 ∑ 𝑤 𝑖 𝑋 𝑖= 1 ∑ 𝑤 𝑖 =¿
2
𝑛
¿
𝑖=1 𝑖=1 𝑖 =1
∑ 𝑥
2
𝑖
𝑖=1
Continúa…
= 1
V({
𝑛
σ 2ε
𝑉 (β
^ )= σ
1
2
ε ∑𝑤 2
𝑖 = 𝑛
∑ 𝑥 2𝑖
𝑖 =1
𝑖=1
Entonces
También conocemos que:
= ++
Puesto que: y E 𝐸 (^
β 0 )= β 0
Entonces
Como
Estimación de la varianza
=
+ 3
(∑ )
𝑛
2 2 σ 2ε
𝐸 ε 𝑖 =1 =𝑛 σ ε 𝐸 ( ε )=𝑉 ( ε ) =
2
𝑖 =1 𝑛
20
Continúa …
2 σ2
𝐸 (^
β 1 − β 1 ) =𝑉 (^
β 1 )=
ε
𝑛
∑ 𝑥 2𝑖
𝑖 =1
{ ( )} {( )( )}
𝑛 𝑛 𝑛 𝑛
𝐸 ( ^β 1 − β1 ) ∑ ε 𝑖 𝑥 𝑖 =𝐸 ∑ 𝑤 𝑖 ε𝑖 ∑ ε𝑖 𝑥 𝑖 =σ
2
ε ∑ 𝑤 𝑖 𝑥 𝑖 =σ 2ε
𝑖=1 𝑖=1 𝑖=1 𝑖 =1
Por lo tanto:
Como: =
21
Ejemplo 2: Profundidad (X) y costos de
perforación (Y) de pozos petroleros (En Miles de
dólares)
Estimar los costos de Depth Cost Depth Cost
perforación de pozos 5000 2596.8 8210 4813.1
de petróleo es una 8600 5618.7
5200 3328.0
cuestión importante
9026 7736.0
para la industria del 6000 3181.1
petróleo. 6538 3198.4 9197 6788.3
23
Actividad de Clase
1. En este ejemplo, la variable respuesta es:
A. El costo perforación B. La profundidad
24
• Paso 2: Hallar los coeficientes de la recta de regresión
entre profundidad de pozo y costo
25
Resultados y Usos del Modelo de Regresión Lineal
1. Al ajustar una regresión lineal, los coeficientes estimados, son:
Valores Estimados (0,1) son (-2,277.1, 1.0033)