Está en la página 1de 16

INSTITUTO TECNOLGICO DE CANCN

Tema:
Regresin Lineal

Alumno:
.

Carrera:
Ingeniera en sistemas computacionales

Materia:
Probabilidad y Estadstica

Maestro:
.

Cancn, Quintana Roo a 15 de junio del 2015

REGRESIN LINEAL
Ejemplo 1. Determine el modelo de regresin lineal para un conjunto de 20
mediciones de temperaturas (considere valores negativos).
Los ejercicios debe contener:
1. Grafica de dispersin
2. Ecuacin de regresin lineal
3. Covarianza SXY
4. Coeficiente de correlacin lineal r
5. Coeficiente de determinacin r2
6. Los residuales (grafica)
7. Error estndar del estimador
8. Estimar dos aproximaciones de temperatura y usar el error estndar para
definir margen de confiabilidad
Datos:
Temperatura
muestreada
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Temperatura
Fahrenheit
(Y)
3
37.4
-7
19.4
36
96.8
22
71.6
-21
-5.8
5
41
36
96.8
21
69.8
12
53.6
18
64.4
-52
-61.6
43
109.4
26
78.8
-35
-31
32
89.6
11
51.8
39
102.2
-5
23
15
59
33
91.4
232
1057.6

Temperatur
a Celsius(X)

1. CONSTRUCCIN DEL DIAGRAMA DE DISPERSIN.

Diagrama de dispersin
120
100
80
60
40
20

Temperatura fahrenheit Y

0
-60

-40

-20

-20 0

20

40

-40
-60
-80
Temperatura celsius X

2. ECUACIN DE REGRESIN LINEAL.

Temperatura
muestreada

Temperatura
Celsius(X)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

3
-7
36
22
-21
5
36
21
12
18
-52
43
26
-35
32
11
39

Temperatura
Fahrenheit
(Y)
37.4
19.4
96.8
71.6
-5.8
41
96.8
69.8
53.6
64.4
-61.6
109.4
78.8
-31
89.6
51.8
102.2

XY

X2

Y2

112.2
-135.8
3484.8
1575.2
121.8
205
3484.8
1465.8
643.2
1159.2
3203.2
4704.2
2048.8
1085
2867.2
569.8
3985.8

9
49
1296
484
441
25
1296
441
144
324
2704
1849
676
1225
1024
121
1521

1398.76
376.36
9370.24
5126.56
33.64
1681
9370.24
4872.04
2872.96
4147.36
3794.56
11968.36
6209.44
961
8028.16
2683.24
10444.84

60

18
19
20

-5
15
33

23
59
91.4
232

-115
885
3016.2

1057.6

25
225
1089

34366.4

14968

529
3481
8353.96
95702.7
2

Media:

X 232 11.6

n
Y

20

1057.6
52.88
n
20
Por lo tanto:
XY nXY 34366.4 20 11.6 52.88 22098.24 1.8
b
2
12276.8
14968 20 11.6
X2 nX2
Y

a Y bX 52.88 1.8 11.6 32


La ecuacin de regresin es:

Y a bX 32 1.8X

Diagrama de dispersin
120
100
80
60
40
Temperatura fahrenheit Y

20
0
-60

-40

-20

-20 0

20

-40
-60
-80
Temperatura celsius X

3. COVARIANZA SXY

40

60

Temperatura
muestreada

Temperatura Temperatura
Celsius(X) Fahrenheit (Y)

X- X

Y- Y

(X- X )(Y- Y )

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

3
-7
36
22
-21
5
36
21
12
18
-52
43
26
-35
32
11
39
-5
15
33
232

37.4
19.4
96.8
71.6
-5.8
41
96.8
69.8
53.6
64.4
-61.6
109.4
78.8
-31
89.6
51.8
102.2
23
59
91.4
1057.6

-8.6
-18.6
24.4
10.4
-32.6
-6.6
24.4
9.4
0.4
6.4
-63.6
31.4
14.4
-46.6
20.4
-0.6
27.4
-16.6
3.4
21.4
0

SXY

S XY

X i X Yi Y

i1

22098.24
20

1104.912

4. COEFICIENTE DE CORRELACIN R.
Se sacan las desviaciones estndar de cada variable:

xi2
Sx
X2
n
14968
Sx2
(11.6)2
20
2

Sx2 748.4 134.56 613.84


Sx 613.84 24.77
yi2
2
Sy
Y 2
n

-15.48
-33.48
43.92
18.72
-58.68
-11.88
43.92
16.92
0.72
11.52
-114.48
56.52
25.92
-83.88
36.72
-1.08
49.32
-29.88
6.12
38.52
0

133.128
622.728
1071.648
194.688
1912.968
78.408
1071.648
159.048
0.288
73.728
7280.928
1774.728
373.248
3908.808
749.088
0.648
1351.368
496.008
20.808
824.328
22098.24

95702.72
(52.88)2
20
2
Sy 4785.136 2796.2944 1988.8416
Sy2

Sy 1988.8416 44.59
Aplicando la frmula de coeficiente de correlacin r:

SXY
SX SY
1104.912
r
1.0
(24.77)(44.59)
r

Comparando el resultado con la tabla de coeficiente de correlacin


Correlacin

Relacin lineal entre X y Y

Pendiente de la
recta

r=0

Las variables no estn relacionadas.

No tiene
pendiente

0<r<1

Las variables estn directamente

positiva

relacionadas.
-1 < r < 0

Las variables estn inversamente

negativa

relacionadas.
r=1

Las variables tienen una correlacin


directa perfecta

positiva

r = -1

Las variables tienen una correlacin

negativa

inversa perfecta

Podemos decir que nuestro resultado encaja en r=1 Las variables tienen
una correlacin directa perfecta.

5. COEFICIENTE DE DETERMINACIN R2.

S2XY
r 2 2
SX SY
(1104.912)2
1220830.528
2
r

1.0
(24.77)2 (44.59)2 1219907.659
2

6. CLCULO DE RESIDUALES Y GRFICA DE RESIDUALES


Residual
Temperatura
muestreada

Temperatura
Celsius(X)

1
2
3
4
5
6
7
8
9
10
11
12
13
14

3
-7
36
22
-21
5
36
21
12
18
-52
43
26
-35

Valor
Temperatura
Fahrenheit ajustado( )
(Y)
Y
37.4
19.4
96.8
71.6
-5.8
41
96.8
69.8
53.6
64.4
-61.6
109.4
78.8
-31

37.4
19.4
96.8
71.6
-5.8
41
96.8
69.8
53.6
64.4
-61.6
109.4
78.8
-31

e Y Y

0
0
0
0
0
0
0
0
0
0
0
0
0
0

15
16
17
18
19
20

32
11
39
-5
15
33
232

89.6
51.8
102.2
23
59
91.4
1057.6

89.6
51.8
102.2
23
59
91.4
1057.6

0
0
0
0
0
0
0

Diagrama residual
1
0.9
0.8
0.7
0.6
0.5

Residual e

0.4
0.3
0.2
0.1
0
-60

-40

-20

20

40

60

Valor ajustado

7. ERROR ESTNDAR DEL ESTIMADOR.

se

Yi Yi

(0)2
se
0
20

n 2

8. ESTIMAR

DOS

APROXIMACIONES

USAR

EL

ERROR

ESTNDAR PARA DEFINIR MARGEN DE CONFIABILIDAD.

Y a bX 32 1.8X
1) 32+1.8(4)=39.2+0=39.2
32+1.8(4)=39.2-0=39.2

2) 32+1.8(42)=107.6+0=107.6
32+1.8(42)=107.6-0=107.6

Ejemplo 2:
Datos:
Trabajador

10

11

12

muestreado
Semanas de

14

12

10

11

26

20

28

16

23

18

24

26

38

22

32

25

experiencia
(X)

Nmero de
rechazos
(Y)

1. CONSTRUCCIN DEL DIAGRAMA DE DISPERSIN.

Diagrama de dispersin
40
35
30
25
Semanas de experiencia

20
15
10
5
0
0

10

Nmero de rechazos

12

14

16

2. ECUACIN DE REGRESIN LINEAL.


Trabajador
muestreado
1
2
3
4
5
6
7
8
9
10
11
12

Semanas de

Nmero de

experiencia(X)
7
9
6
14
8
12
10
4
2
11
1
8
92

rechazos(Y)
26
20
28
16
23
18
24
26
38
22
32
25
298

XY

X2

Y2

182
180
168
224
184
216
240
104
76
242
32
200
2048

49
81
36
196
64
144
100
16
4
121
1
64
876

676
400
784
256
529
324
576
676
1444
484
1024
625
7798

Media:

X 92 7.66

n
Y

12

298
24.83
n
12
Por lo tanto:
XY nXY 2048 12 7.66 24.83 234.3736 1.363487011 1.4
b
2
171.8928
876 12 7.66
X2 nX2
Y

a Y bX 24.83 1.4 7.66 35.554 35.5


La ecuacin de regresin es:

Y a bX 35.5 1.4X

Diagrama de dispersin
40
35
30
25
Semanas de experiencia

20
15
10
5
0
0

10

12

14

16

Nmero de rechazos

3. COVARIANZA SXY
Trabajador
muestreado

Semanas

Nmero de

de

rechazos(Y)

X- X

Y- Y

(X- X )(Y- Y )

experiencia
1

(X)
7

26

-0.66

1.17

-0.7722

20

1.34

-4.83

-6.4722

28

-1.66

3.17

-5.2622

14

16

6.34

-8.83

-55.9822

23

0.34

-1.83

-0.6222

12

18

4.34

-6.83

-29.6422

10

24

2.34

-0.83

-1.9244

26

-3.66

1.17

-4.2822

38

-5.66

13.17

-74.5422

10

11

22

3.34

-2.83

-9.4522

11

32

-6.66

7.17

-47.7522

12

25

0.34

0.17

0.0578
-236.6486

SXY

SXY

X i X Yi Y

i1

236.6486
12

19.72

4. COEFICIENTE DE CORRELACIN R.
Se sacan las desviaciones estndar de cada variable:

xi2
Sx
X2
n
876
Sx2
(7.66)2
12
2

Sx2 73 58.6756 14.3244


Sx 14.3244 3.7847
yi2
2
Sy
Y 2
n
7798
Sy2
(24.83)2
12
2
Sy 649.83 616.5289 33.3011

Sy 33.3011 5.77
Aplicando la frmula de coeficiente de correlacin r:

SXY
SX SY
19.72
r
0.90
(3.7847)(5.77)
r

Comparando el resultado con la tabla de coeficiente de correlacin


Correlacin

Relacin lineal entre X y Y

Pendiente de la
recta

r=0

Las variables no estn relacionadas.

No tiene
pendiente

0<r<1

Las variables estn directamente

positiva

relacionadas.
-1 < r < 0

Las variables estn inversamente

negativa

relacionadas.
r=1

Las variables tienen una correlacin

positiva

directa perfecta
r = -1

Las variables tienen una correlacin

negativa

inversa perfecta

Podemos decir que nuestro resultado encaja en -1<r<0 Las variables estn
inversamente relacionadas con una pendiente negativa.

5. COEFICIENTE DE DETERMINACIN R2.

S2XY
r 2 2
SX SY
(19.72)2
388.8784
2
r

0.81
(3.7847)2 (5.77)2 476.8859
2

6. CLCULO DE RESIDUALES Y GRFICA DE RESIDUALES.


Trabajador
muestreado

Semanas de

Nmero de

experiencia(X

rechazos(Y)

Valor
ajustado(

Residual

e Y Y

26

25.7

0.3

20

22.9

-2.9

28

27.1

0.9

14

16

15.9

0.1

23

24.3

-1.3

12

18

18.7

-0.7

10

24

21.5

2.5

26

29.9

-3.9

38

32.7

5.3

10

11

22

20.1

1.9

11

32

34.1

-2.1

12

25

24.3

0.7
0.8

Diagrama residual
6
4
2
Residual e

0
10

15

20

25

-2
-4
-6
Valor ajustado

7. ERROR ESTNDAR DEL ESTIMADOR.

se

se

Yi Yi

n 2

0.64
0.25
10

30

35

40

8. ESTIMAR

DOS

APROXIMACIONES

USAR

EL

ERROR

ESTNDAR PARA DEFINIR MARGEN DE CONFIABILIDAD.

Y a bX 35.5 1.4X
3) 35.5+(-1.4)(3)=31.3+0.25=31.55
35.5+(-1.4)(3)=31.3-0.25=31.05
4) 35.5+(-1.4)(13)=17.3+0.25=17.55
35.5+(-1.4)(13)=17.3-0.25=17.05

También podría gustarte