Está en la página 1de 12

UNIDAD 1

REGRESIÓN LINEAL SIMPLE


Peso (x) Rendimiento (y) 𝑦 ̂
Estimado 𝑦 ̂ (y- )^2
23.00 28.80 28.80 0.000000000 Error
21.00 29.30 31.46 4.665600000 2.07
22.00 34.10 30.13 15.760900000
24.50 27.70 26.81 0.801025000
20.30 33.50 32.39 1.229881000
27.00 26.40 23.48 8.526400000
26.50 23.80 24.15 0.119025000
21.10 30.70 31.33 0.393129000
32.30 18.30 16.43 3.493161000
32.10 19.70 16.70 9.018009000
36.00 14.20 11.51 7.236100000
29.00 20.80 20.82 0.000400000
Medias 26.23 25.61 SUMA 51.24
Coeficiente de correlación c
C=[n(cuadrante1)+n(cuadrante2)-n(cuadrante3)-n(cuadrante4)]/n
C= (1+0-6-5)/12 = -10/12 = -0.833
C= -0.833
40.00
Cuadrante 1 Cuadrante 2
35.00

30.00 1; 28.80

25.00
12; 20.80
20.00

15.00

10.00

5.00 Cuadrante 3 Cuadrante 4

0.00
18.00 20.00 22.00 24.00 26.00 28.00 30.00 32.00 34.00 36.00 38.00

x1 y1 x2 y2
23 28.8 29 20.8
y-y1= m(x-x1)
m=(y2-y1)/(x2-x1) m= -1.33
y-28.8= -1.33(x-23)
Ecuación de y= -1.33x+ 30.59 + 28.8 30.59
regresión y= -1.33x + 59.39 59.39

x=25 automóvil con p=2500 kg


y=-1.33*(25)+59.39
y= 26.14 mi/gal
Cuadrante 2

Cuadrante 4

.00 36.00 38.00


UNIDAD 1
REGRESIÓN LINEAL SIMPLE
Coeficiente correlación lineal de pearson 𝑏=(∑▒ 〖 (𝑥_𝑖−𝑥 ̅)(𝑦_𝑖−𝑦 ̅) 〗 )/(∑▒
▒𝑦_𝑖 〗〗 )/(√(𝑛∑▒ 〖𝑥 _𝑖^2− 〖 (∑▒ 〖𝑥 _𝑖) 〗〗 ^2 〗 ) √(𝑛∑▒ 〖𝑦 _𝑖^2− 〖 (∑▒ 〖𝑦 _𝑖) 〗〗 ^2 〗 ))

𝑥_𝑖−𝑥 ̅ 𝑦_𝑖−𝑦 ̅
Peso (x) Rendimiento (y) x^2 y^2 xy
23.00 28.80 529.00 829.44 662.4 -3.23 3.19
21.00 29.30 441.00 858.49 615.3 -5.23 3.69
22.00 34.10 484.00 1162.81 750.2 -4.23 8.49
24.50 27.70 600.25 767.29 678.65 -1.73 2.09
20.30 33.50 412.09 1122.25 680.05 -5.93 7.89
27.00 26.40 729.00 696.96 712.8 0.77 0.79
26.50 23.80 702.25 566.44 630.7 0.27 -1.81
21.10 30.70 445.21 942.49 647.77 -5.13 5.09
32.30 18.30 1043.29 334.89 591.09 6.07 -7.31
32.10 19.70 1030.41 388.09 632.37 5.87 -5.91
36.00 14.20 1296.00 201.64 511.2 9.77 -11.41
29.00 20.80 841.00 432.64 603.2 2.77 -4.81
SUMA 314.80 307.30 8553.50 8303.43 7715.73
MEDIA 26.23 25.61 712.79 691.95 642.98

r= -0.96596091
Diagrama de dispersión
Este valor es negativo y cercano a -1. Po
40.00 inferir que el rendimiento depende fuer
y que a medida que el peso aumenta
35.00
disminuye.
30.00 f(x) = − 1.17113374127848 x + 56.3310751462055
R² = 0.933080474361297
y: rendimiento

25.00
b= -1.17113374
20.00
a= 56.3310751
15.00
Ecuación de regresión
10.00 𝑦 ̂=56.331−1.1711𝑥
5.00
0.00 𝑦 ̂= 27.0535751
18.00 20.00 22.00 24.00 26.00 28.00 30.00 32.00 34.00 36.00 38.00
x: peso
_𝑖−𝑥 ̅)(𝑦_𝑖−𝑦 ̅) 〗 )/(∑▒ 〖〖 (𝑥 〗 _𝑖−𝑥 ̅) 〗 ^2 )

𝑦 ̂=𝑎+𝑏𝑥
valores
〖 (𝑥 〗 _𝑖−𝑥 〖〖 (𝑥 〗 _𝑖−𝑥 ̅) 〗𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜
^2 𝑦 ̂ residuales (y- 𝑦 ̂)^2 Error
̅-10.319722222222
)*(𝑦_𝑖−𝑦 ̅) 10.4544 29.394999097 -0.595 0.35402393 1.5557
-19.319722222222 27.3878 31.737266579 -2.437 5.94026838
-35.948055555556 17.9211 30.566132838 3.534 12.4882171
-3.6255555555556 3.0044 27.638298485 0.062 0.00380708
-46.823888888889 35.2044 32.557060198 0.943 0.88913547
0.60694444444445 0.5878 24.710464132 1.690 2.85453145
-0.4822222222222 0.0711 25.296031002 -1.496 2.23810876
-26.137222222222 26.3511 31.620153205 -0.920 0.84668192
-44.337222222222 36.8044 18.503455303 -0.203 0.04139406
-34.662222222222 34.4178 18.737682051 0.962 0.92605583
-111.42138888889 95.3878 14.17026046 0.030 0.00088444
-13.303055555556 7.6544 22.368196649 -1.568 2.45924073
SUMA 0.00000000 29.0423492

egativo y cercano a -1. Por tanto podemos


endimiento depende fuertemente del peso
ida que el peso aumenta, el rendimiento
disminuye.

1.1711𝑥

mi/gal
UNIDAD 1
REGRESIÓN LINEAL SIMPLE Sean las variables
x: representa el gasto en publicidad (en miles de dólares)
Formulario y: representa el número de pasajeros (en miles de personas)
Suma de cruzados de x
𝐶〗 _𝑥=∑▒ 〖𝑒 _𝑖^2− 〖 (∑▒ 〖𝑥𝑖 ) 〗〗 ^2/𝑛 〗 x y x^2 xy
10 15 100 150
12 17 144 204
Suma de cuadrados cruzados 8 13 64 104
17 23 289 391
〖𝑆𝐶〗 _𝑥𝑦=∑▒ 〖𝑥𝑖𝑦𝑖− (∑▒𝑥𝑖 ∑▒𝑦𝑖)/𝑛 〗
10 16 100 160
15 21 225 315
Para la ecuación de 10 14 100 140
regresión se tiene 14 20 196 280
19 24 361 456
𝑏= 〖𝑆𝐶〗 _𝑥𝑦/ 〖𝑆𝐶〗 _𝑥
y= a+bx 10 17 100 170
11 16 121 176
𝑎=𝑦 ̅−𝑏𝑥 ̅
13 18 169 234
16 23 256 368
Intervalo de confianza para una media
de y condicionada a un valor de x 10 15 100 150
12 16 144 192
Error estándar de estimación SUMAS 187 268 2469 3490
MEDIA 12.47 17.87
𝑆_𝑒=√((∑▒ 〖 (𝑦𝑖−𝑦 ̂) 〗 ^2 )/(𝑛−2))

Error estándar de la media condicionada

𝑆_𝑦=𝑆_𝑒 √(1/𝑛+ 〖 (𝑥𝑖−𝑥 ̅) 〗 ^2/ 〖𝑆𝐶〗 _𝑥 )

Donde: xi es un valor fijo para la


variable independiente

El intervalo de confianza para la


media condicionada está dado po:
𝜇_𝑦𝑙𝑥=(𝑦𝑖) ̂±𝑡(𝑆_𝑦)

Intervalo de confianza para la pendiente (b)


𝑏 ̂=𝑏±𝑡(𝑆_𝑏)

𝑆_𝑏=𝑆_𝑒/√( 〖𝑆𝐶〗 _𝑥 )
𝑦 ̂ (yi- 𝑦 ̂)^2
15.19941917 0.039768 SC_x= 137.73 S_e= 0.907 gl=
17.36205227 0.13108185 SC_xy= 148.93 S_y= 0.627 significancia
13.03678606 0.00135321 b= 1.081 t=
22.76863504 0.05352974 a= 4.386 µylx=
15.19941917 0.64092967 Por lo tanto, el modelo de regresión lineal para
20.60600194 0.15523447 estos datos está dado por: Si se invierten 20,000 dólares en pu
el número de pasajeros esté ent
15.19941917 1.43860634 personas con una probabi
𝑦 ̂=4.386+1.081𝑥
19.52468538 0.22592399
24.93126815 0.86726037 Si se realiza un gasto de 20,000 en publicidad, 𝒃 ̂=
15.19941917 3.24209133 entonces:
16.28073572 0.07881255 𝑦 ̂= 26.01 S_b=
18.44336883 0.19657592 Se esperaría que el número de pasajeros sea de
21.68731849 1.72313275 26010
15.19941917 0.039768
17.36205227 1.8551864
10.6892546
13
95%
1.7709
24.90 ≤ µylx ≤ 27.12

se invierten 20,000 dólares en publicidad, se espera que


el número de pasajeros esté entre: 24,900 y 27,120
personas con una probabilidad del 95%.

0.94448806 ≤𝒃 ̂ ≤ 1.21814505

0.07726495
UNIDAD 1
INTERVALO DE CONFIANZA DE REGRESIÓN

Formulario Consumidor Ingreso (x) Consumo (y) x^2


1 24.3 16.2 590.49
Suma de cruzados de x 2 12.5 8.5 156.25
3 31.2 15 973.44
𝐶〗 _𝑥=∑▒ 〖𝑒 _𝑖^2− 〖 (∑▒ 〖𝑥𝑖 ) 〗〗 ^2/𝑛 〗
4 28 17 784
5 35.1 24.2 1232.01
Suma de cuadrados cruzados 6 10.5 11.2 110.25
7 23.2 15 538.24
〖𝑆𝐶〗 _𝑥𝑦=∑▒ 〖𝑥𝑖𝑦𝑖− (∑▒𝑥𝑖 ∑▒𝑦𝑖)/𝑛 〗
8 10 7.1 100
9 8.5 3.5 72.25
10 15.9 11.5 252.81
Para la ecuación de
regresión se tiene 11 14.7 10.7 216.09
12 15 9.2 225
𝑏= 〖𝑆𝐶〗 _𝑥𝑦/ 〖𝑆𝐶〗 _𝑥
Sumas 228.9 149.1 5250.83
Medias 19.075 12.425
𝑎=𝑦 ̅−𝑏𝑥 ̅

a) Construir un intervalo de confianza para la media condicionada


Intervalo de confianza para una media ingreso de 32.5, usar un nivel de 95%.
de y condicionada a un valor de x
µylx= 17.232 ≤µylx≤
Error estándar de estimación El promedio de gasto para una persona que tiene un ingreso de $32,500 estaría en
$17,232 y $22,605 con un nivel de confianza del 95%.
𝑆_𝑒=√((∑▒ 〖 (𝑦𝑖−𝑦 ̂) 〗 ^2 )/(𝑛−2))

b) Construir un intervalo de confianza para la estimación del consu


el ingreso es de 32.5, usar un nivel de 95%.
Error estándar de la media condicionada y_x= 14.229 ≤y_x≤
𝑆_𝑦=𝑆_𝑒 √(1/𝑛+ 〖 (𝑥𝑖−𝑥 ̅) 〗 ^2/ 〖𝑆𝐶〗 _𝑥 ) Esto significa que una persona que tiene un ingreso de $32,500 tend
gasto de entre $14,229 y $25,607 con una confianza de 95%.

c) Estimar un intervalo de confianza para la coeficiente de regres


Donde: xi es un valor fijo para la poblacional, usar un nivel de 90%.
variable independiente 𝒃 ̂= 0.421 ≤𝒃 ̂ ≤
Esto implica que por cada mil que aumente el ingreso de una persona, sus gasto
incrementarían entre $421 y $695 mensuales con una confianza de 90%.
El intervalo de confianza para la
media condicionada está dado po:
𝜇_𝑦𝑙𝑥=(𝑦𝑖) ̂±𝑡(𝑆_𝑦)

Error estándar del pronóstico


30
𝑆_𝑦𝑖=𝑆_𝑒 √(1+1/𝑛+ 〖 (𝑥𝑖−𝑥 ̅) 〗 ^2/ 〖𝑆𝐶〗 _𝑥 )
25

El intervalo de confianza está dado po: 20 f(x) = 0.55817141242139


𝑦_𝑥=(𝑦𝑖) ̂±𝑡(𝑆_𝑦𝑖)
15

10
25

20 f(x) = 0.55817141242139
𝑦_𝑥=(𝑦𝑖) ̂±𝑡(𝑆_𝑦𝑖)
15
Intervalo de confianza para la pendiente (b) o coeficiente de regresión poblacional
𝑏 ̂=𝑏±𝑡(𝑆_𝑏) 10

5
𝑆_𝑏=𝑆_𝑒/√( 〖𝑆𝐶〗 _𝑥 )
0
5 10 15
xy 𝒚 ̂ (y- 𝒚 ̂)^2
393.66 15.3414456 0.73711561 SC_x= 884.5625
106.25 8.75502296 0.06503671 SC_xy= 493.7375
468 19.1928284 17.5798098 b= 0.5582 Gasto en miles por cada mil de ingreso
476 17.4066799 0.16538851 a= 1.7779
849.42 21.3696969 8.01061573 𝒚 ̂ = 1.7779+0.5582x 19.9185
117.6 7.63868014 12.6829992 S_e= 2.2506075237498
348 14.7274571 0.07427965 S_y= 1.2058815
71 7.35959443 0.06738927 gl= (n-2) 10
29.75 6.52233731 9.13452284 t= 2.2281
182.85 10.6528058 0.71773807 Significancia 95% 0.025
157.29 9.98300007 0.5140889 µylx= 17.232 ≤µylx≤ 22.605
138 10.1504515 0.90335804 S_yi= 2.5533
3337.82 50.6523423 y_x= 14.229 ≤y_x≤ 25.607
gl= (n-2) 10
t= 1.8125
nza para la media condicionada a un Significancia 90% 0.05
sar un nivel de 95%. S_b= 0.076
22.605 𝒃 ̂= 0.421 ≤𝒃 ̂ ≤ 0.695
tiene un ingreso de $32,500 estaría entre de
nivel de confianza del 95%.

za para la estimación del consumo si


usar un nivel de 95%.
25.607
ene un ingreso de $32,500 tendría un
607 con una confianza de 95%.

nza para la coeficiente de regresión


r un nivel de 90%.
0.695
te el ingreso de una persona, sus gastos se
mensuales con una confianza de 90%.

Chart Title
0

0 f(x) = 0.558171412421395 x + 1.77788030806189

0
5

0 f(x) = 0.558171412421395 x + 1.77788030806189

0
5 10 15 20 25 30 35 40

También podría gustarte