Está en la página 1de 49

U4: Trabajo de la unidad.

Intervalos de confianza, pruebas de


hipótesis y regresión lineal
Tamara Santos Garrido.
1. Los corredores de propiedades en muchas ocasiones necesitan saber como cambia el avaluó de un

x 1.1 1.6 1.5 1.6 1.4 1.3 1.1


y 4 4.9 5.4 5.1 4.8 4.6 4.1
a) Por el método de mínimos cuadrados. Determine la recta de regresión lineal.

b) Es posible afirmar que la relación entre el avalúo y su superficie es significativa. Use α = 5%

Según los datos entregados en planilla Excel descargable:

a) Realice un gráfico de dispersión e indique la relación entre la variable edad del trabajador y tiempo d

b) Mediante un modelo de regresión lineal. Estime el número de horas que un trabajador está conecta

c) Determine un modelo de regresión lineal que relacione el sueldo con la antigüedad laboral del traba

d) Determine e interprete el coeficiente de correlación lineal del modelo anterior.


ambia el avaluó de una propiedad (en miles de UF) en relación con su superficie (cientos de mt2). La tabla a continu

1.7 1.9 1.5


5.6 6.2 5

a. Use α = 5%

el trabajador y tiempo de conexión en internet.

abajador está conectado a Internet, si tiene 52 años.

edad laboral del trabajador.


de mt2). La tabla a continuación es una muestra de 10 propiedades en Santiago.
x y 1. a)
1.1 4 -96
1.6 4.9 -95.1
1.5 5.4 -94.6 Resumen
1.6 5.1 -94.9
1.4 4.8 -95.2 Estadísticas de la regresión
1.3 4.6 -95.4 Coeficiente de correlación múl
1.1 4.1 -95.9 Coeficiente de determinación
1.7 5.6 -94.4 R^2 ajustado
1.9 6.2 -93.8 Error típico
1.5 5 -95 Observaciones
-950.3
-95.03 ANÁLISIS DE VARIANZA
Grados de libertad
Regresión
Residuos
Total

Intercepción
Variable X 1

y= 2,4974x + 1,2988

6
f(x) = 2.4974182444062 x + 1.29879518072289
R² = 0.910262213673296

3
4

0
1 1.1 1.2 1

b) El avalúo de la propiedad está estrechamente vinculad


as de la regresión
0.95407662883
0.91026221367
0.89904499038
0.21131910922
10

Grados de libertadSuma de cuadrados


Promedio de los cuadrados F Valor crítico de F
1 3.62375387263339 3.62375387263339 81.148622 1.8406723E-05
8 0.35724612736661 0.044655765920826
9 3.981

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%


1.29879518072 0.41298031979864 3.14493238165963 0.0137028 0.34646085551
2.49741824441 0.27723669004623 9.00825299851087 1.841E-05 1.85810929073

Incremento UF

f(x) = 2.4974182444062 x + 1.29879518072289


R² = 0.910262213673296
1.1 1.2 1.3 1.4 1.5 1.6 1.7

piedad está estrechamente vinculada a su tamaño, con un coeficiente del 95%. Esto implica que hay una conexión d
rítico de F

Superior 95% Inferior 95,0% Superior 95,0%


2.2511295059 0.34646085551 2.251129506
3.1367271981 1.85810929073 3.136727198
1.7 1.8 1.9 2

plica que hay una conexión directa entre la superficie de la propiedad y su valuación, de modo que un aumento en la
que un aumento en la superficie conlleva un cambio proporcional en el avalúo.
Horas
Sueldo
Antigüedad conectado a
Edad (años) Mensual
Laboral (años) Internet
(miles de $)
(semanal)
22 1 22 254.1
43 8 13 749.2
45 9 11 713.8
47 10 14 874.5
53 11 8 709.6
50 11 10 933.9
56 13 9 1050.3
59 12 6 874.9
47 10 8 797.4
53 13 12 1021.7
47 10 11 782.5
55 15 6 1091.2
48 10 9 1054.0
49 10 11 748.4
48 12 12 847.0
50 11 9 978.2
39 7 13 601.9
47 9 11 860.1
48 10 12 769.8
49 10 10 740.3
44 8 12 683.8
49 11 10 786.6
48 11 10 858.0
47 8 12 559.5
48 9 10 908.5
58 11 6 797.0
43 8 13 719.4
40 6 13 497.3
48 9 12 683.7
42 9 12 778.6
53 12 10 1159.8
49 11 10 1007.0
37 5 15 479.1
48 10 10 728.0
53 11 11 974.5
58 13 7 1204.3
43 10 12 870.1
39 10 13 753.2
38 6 15 476.6
49 9 10 649.4
47 10 12 742.3
46 7 11 552.9
44 9 11 695.4
46 9 11 678.0
57 11 8 867.5
25 1 20 284.1
47 8 13 719.3
48 10 12 974.0
49 9 10 569.9
45 9 13 733.9
44 8 13 621.1
39 10 14 853.0
49 12 8 962.8
47 10 9 780.9
43 10 11 930.3
45 7 13 492.5
48 10 12 765.8
45 9 12 700.3
43 6 10 499.5
39 8 14 580.8
39 8 14 730.7
49 11 11 890.1
49 9 10 756.3
58 13 7 1281.3
39 7 15 715.6
49 11 10 983.5
45 9 13 789.3
59 14 6 1071.7
48 11 14 981.2
48 11 10 878.3
49 11 10 967.6
49 9 10 784.5
49 12 11 1094.9
56 11 9 891.3
53 12 9 953.9
46 9 11 798.9
46 10 13 701.1
49 11 13 1015.1
48 11 10 938.0
49 10 12 891.4
57 14 8 1221.7
48 10 9 1015.7
43 8 13 696.3
35 5 17 466.4
48 10 9 701.8
34 6 17 473.2
34 4 14 321.7
49 10 11 735.3
48 11 10 1030.1
53 13 10 928.2
49 10 12 1038.0
47 10 12 900.7
38 7 14 576.0
55 12 7 898.4
48 9 11 693.9
54 12 8 942.7
38 8 13 579.1
48 8 10 635.2
49 12 9 1032.1
44 10 15 879.8
39 8 14 666.6
38 8 13 714.6
44 10 11 791.2
46 9 11 731.0
46 10 12 711.3
47 12 9 1190.8
35 5 16 576.0
48 11 13 874.7
49 12 11 1042.6
46 9 12 859.0
59 13 7 1115.2
48 9 12 637.3
49 11 10 892.1
44 8 11 726.4
48 10 9 672.2
39 7 13 619.0
48 11 9 890.5
43 8 13 680.5
45 9 12 915.7
38 8 16 784.0
44 9 13 704.7
44 8 11 738.3
55 13 8 1011.1
48 11 10 775.7
45 10 11 934.9
48 10 10 717.0
46 9 10 611.1
49 10 9 881.4
49 11 12 885.5
38 6 15 467.1
39 6 14 576.1
48 11 11 966.0
39 7 13 602.3
48 10 8 880.8
57 13 8 1014.1
38 8 14 619.9
39 7 12 583.2
37 8 14 589.5
54 12 9 1140.8
38 7 11 646.1
49 10 11 773.1
39 8 14 618.6
38 7 14 619.2
43 6 13 472.6
48 12 9 875.1
44 9 12 720.0
39 8 14 554.3
45 10 12 833.6
46 11 14 747.7
49 12 8 1034.8
46 8 12 601.5
49 13 8 895.0
38 8 13 652.7
55 12 8 1158.3
48 10 13 871.3
49 13 11 1010.9
53 11 11 934.7
43 8 12 668.5
38 11 14 784.6
39 7 13 558.8
53 10 7 737.8
48 9 11 750.7
43 9 12 857.2
55 11 9 1034.4
37 7 14 563.8
39 8 14 633.5
47 10 11 829.9
48 9 12 940.9
35 5 16 468.7
48 9 11 685.6
43 11 11 991.0
39 7 12 563.8
48 13 9 914.7
49 11 11 1067.2
48 10 11 761.2
45 9 13 659.8
48 11 10 934.9
45 9 11 635.1
48 9 12 785.1
49 11 9 946.8
44 9 12 593.6
53 13 8 875.1
48 10 11 860.3
35 6 15 578.4
38 7 14 615.7
45 7 12 567.8
56 13 8 1045.2
47 9 11 678.3
54 12 10 901.2
53 12 10 938.0
38 5 15 557.8
53 13 10 1179.1
49 9 9 742.5
29 4 17 451.5
48 12 10 940.4
48 9 11 712.2
54 12 8 854.9
46 7 12 597.7
49 9 9 635.4
45 10 14 702.5
38 8 13 637.8
49 11 10 972.4
46 9 12 639.7
48 11 9 854.3
44 10 12 703.0
46 10 15 765.7
39 7 14 619.1
48 11 9 884.6
45 9 12 873.4
38 7 14 677.1
46 10 11 879.7
48 10 11 942.6
44 10 11 867.1
48 13 10 1072.0
44 8 11 604.3
54 12 9 907.6
49 10 10 857.4
48 11 10 683.3
38 9 14 551.9
46 10 12 868.2
49 11 10 941.7
43 9 14 700.4
44 10 13 882.0
38 8 13 641.1
46 10 12 790.0
38 6 15 480.2
53 12 10 996.0
49 9 11 665.7
38 8 12 598.4
39 9 13 748.2
49 9 10 743.5
45 9 11 649.0
44 8 13 670.4
45 9 12 760.6
39 7 13 566.1
49 10 11 690.6
45 10 10 703.2
58 13 6 1035.5
45 9 12 861.6
47 10 11 853.2
44 8 10 556.9
49 11 9 1161.3
39 8 16 686.9
54 12 7 1206.6
49 11 9 988.7
54 10 8 956.6
47 8 11 616.3
46 11 13 887.5
49 10 11 794.7
48 10 11 852.8
48 10 9 856.0
38 7 15 480.2
47 9 11 770.3
49 12 8 868.6
48 10 11 702.4
39 8 16 580.9
43 8 13 663.4
48 10 11 779.0
39 9 13 857.3
38 7 12 578.6
49 10 12 854.4
34 5 16 493.4
48 10 10 908.6
44 8 15 674.3
48 10 12 650.1
43 7 13 555.1
44 8 11 660.3
48 12 10 964.2
45 9 13 660.3
46 7 11 578.5
38 7 13 486.0
48 9 11 748.3
45 10 13 765.9
48 11 11 717.9
38 6 13 566.3
47 12 12 1009.5
58 14 8 1338.3
48 11 11 965.0
53 11 9 1013.0
49 11 11 887.2
53 13 9 1172.1
48 12 9 1196.8
45 10 11 913.6
45 9 13 798.9
39 6 13 427.6
53 12 9 961.6
38 7 13 475.8
55 13 7 967.8
48 10 13 959.9
39 7 15 601.3
48 10 9 875.8
39 8 13 601.4
47 10 10 933.9
49 12 9 1043.0
48 10 9 775.9
53 11 11 851.2
36 5 16 421.0
49 11 11 879.7
55 12 8 720.3
49 11 8 969.8
Horas
Edad (años) conectado a
"x" Internet
(semanal) "y"
22 22
43 13
45 11 25
47 14
53 8
50 10 20

Horas conectado a internet (semanal)


56 9 f(x) = − 0.351125756916799 x + 27.51
R² = 0.73723238444016
59 6
47 8 15
53 12
47 11
55 6 10
48 9
49 11
48 12 5
50 9
39 13
47 11 0
48 12 15 20 25 30

49 10
44 12
49 10
48 10 Podemos ver que hay una correlación negativa solo con
47 12
48 10
58 6 Resumen
43 13
40 13 Estadísticas de la regresión
48 12 Coeficiente de correlación múlt
42 12 Coeficiente de determinación
53 10 R^2 ajustado
49 10 Error típico
37 15 Observaciones
48 10
53 11 ANÁLISIS DE VARIANZA
58 7 Grados de libertad
43 12 Regresión
39 13 Residuos
38 15 Total
49 10
47 12
46 11 Intercepción
44 11 Variable X 1
46 11
57 8
25 20
47 13
48 12 Igualmente, nos aseguraremos y calcularemos el coeficie
49 10
45 13 Columna 1
44 13 Columna 2
39 14
49 8
47 9
43 11 -0.858622375925625
45 13 Esto nos indica que hay una correlación negativa (inversa
48 12
45 12
43 10 b)
39 14
39 14 52 años
49 11
49 10
58 7 El número de horas que un trabajador esté cconectado a
39 15
49 10
45 13
59 6
48 14
48 10
49 10
49 10
49 11
56 9
53 9
46 11
46 13
49 13
48 10
49 12
57 8
48 9
43 13
35 17
48 9
34 17
34 14
49 11
48 10
53 10
49 12
47 12
38 14
55 7
48 11
54 8
38 13
48 10
49 9
44 15
39 14
38 13
44 11
46 11
46 12
47 9
35 16
48 13
49 11
46 12
59 7
48 12
49 10
44 11
48 9
39 13
48 9
43 13
45 12
38 16
44 13
44 11
55 8
48 10
45 11
48 10
46 10
49 9
49 12
38 15
39 14
48 11
39 13
48 8
57 8
38 14
39 12
37 14
54 9
38 11
49 11
39 14
38 14
43 13
48 9
44 12
39 14
45 12
46 14
49 8
46 12
49 8
38 13
55 8
48 13
49 11
53 11
43 12
38 14
39 13
53 7
48 11
43 12
55 9
37 14
39 14
47 11
48 12
35 16
48 11
43 11
39 12
48 9
49 11
48 11
45 13
48 10
45 11
48 12
49 9
44 12
53 8
48 11
35 15
38 14
45 12
56 8
47 11
54 10
53 10 25
38 15
53 10
49 9 20
Horas conectado a internet (semanal)

f(x) = − 0.351125756916799 x + 27.51348901007


29 17 R² = 0.73723238444016
48 10
15
48 11
54 8
46 12 10
49 9
45 14
38 13 5
49 10
46 12
48 9 0
20 25 30 35
44 12
46 15
39 14
48 9
45 12
38 14
46 11
48 11
44 11
48 10
44 11
54 9
49 10
48 10
38 14
46 12
49 10
43 14
44 13
38 13
46 12
38 15
53 10
49 11
38 12
39 13
49 10
45 11
44 13
45 12
39 13
49 11
45 10
58 6
45 12
47 11
44 10
49 9
39 16
54 7
49 9
54 8
47 11
46 13
49 11
48 11
48 9
38 15
47 11
49 8
48 11
39 16
43 13
48 11
39 13
38 12
49 12
34 16
48 10
44 15
48 12
43 13
44 11
48 10
45 13
46 11
38 13
48 11
45 13
48 11
38 13
47 12
58 8
48 11
53 9
49 11
53 9
48 9
45 11
45 13
39 13
53 9
38 13
55 7
48 13
39 15
48 9
39 13
47 10
49 9
48 9
53 11
36 16
49 11
55 8
49 8
Gráfico de dispersión

f(x) = − 0.351125756916799 x + 27.51348901007


R² = 0.73723238444016

20 25 30 35 40 45 50 55 60

Edad (años)

ay una correlación negativa solo con visualizar nuestro gráfico

s de la regresión
0.85862237593
0.73723238444
0.73635061392
1.21212628563
300

Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
1 1228.41346057 1228.41346057341 836.081913 1.7634173E-88
298 437.836539427 1.46925013230397
299 1666.25

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%


27.5134890101 0.56336214246 48.8380154368748 3.019E-144 26.4048168163
-0.35112575692 0.01214334334 -28.9150810566178 1.7634E-88 -0.37502332845

guraremos y calcularemos el coeficientte de correlación


Columna 1 Columna 2
1
-0.85862237593 1

hay una correlación negativa (inversa) entre las variables "Edad" y "Horas conectado a internet", por lo que a menor

y = -0,3511* 52 + 27,513 =

que un trabajador esté cconectado a internet, si tiene 52 años, serían 9,2558 horas.
Gráfico de dispersión

= − 0.351125756916799 x + 27.51348901007
0.73723238444016

25 30 35 40 45 50 55 60

Edad (años)
55 60 65 70

rítico de F
Superior 95%Inferior 95,0%Superior 95,0%
28.6221612 26.4048168 28.622161204
-0.32722819 -0.3750233 -0.3272281854

nternet", por lo que a menor edad, mayor cantidad de horas conectado a internet y a mayor edad, menor cantidad d

9.2558
55 60 65
ad, menor cantidad de horas conectado a internet.
Sueldo
Antigüedad
Mensual
Laboral (años)
(miles de $) "
"x"
y"
1 254.1 2. c)
8 749.2
9 713.8
10 874.5
11 709.6
11 933.9
13 1050.3
12 874.9
10 797.4 f(x) = 76.9005600
R² = 0.764260702
13 1021.7
10 782.5

Sueldo mensual (miles de $)


15 1091.2
10 1054.0
10 748.4
12 847.0
11 978.2
7 601.9
9 860.1
10 769.8
10 740.3
8 683.8
11 786.6
11 858.0
8 559.5
0 2
9 908.5
11 797.0
8 719.4
6 497.3
9 683.7
9 778.6
12 1159.8
11 1007.0
5 479.1
10 728.0
11 974.5
13 1204.3
10 870.1
10 753.2
6 476.6
9 649.4
10 742.3
7 552.9
9 695.4
9 678.0
11 867.5
1 284.1
8 719.3
10 974.0
9 569.9
9 733.9
8 621.1
10 853.0
12 962.8
10 780.9
10 930.3
7 492.5
10 765.8
9 700.3
6 499.5
8 580.8
8 730.7 d)
11 890.1
9 756.3
13 1281.3
7 715.6
11 983.5
9 789.3
14 1071.7
11 981.2
11 878.3
11 967.6
9 784.5
12 1094.9
11 891.3
12 953.9
9 798.9
10 701.1
11 1015.1
11 938.0
10 891.4
14 1221.7
10 1015.7
8 696.3
5 466.4
10 701.8
6 473.2
4 321.7
10 735.3
11 1030.1
13 928.2
10 1038.0
10 900.7
7 576.0
12 898.4
9 693.9
12 942.7
8 579.1
8 635.2
12 1032.1
10 879.8
8 666.6
8 714.6
10 791.2
9 731.0
10 711.3
12 1190.8
5 576.0
11 874.7
12 1042.6
9 859.0
13 1115.2
9 637.3
11 892.1
8 726.4
10 672.2
7 619.0
11 890.5
8 680.5
9 915.7
8 784.0
9 704.7
8 738.3
13 1011.1
11 775.7
10 934.9
10 717.0
9 611.1
10 881.4
11 885.5
6 467.1
6 576.1
11 966.0
7 602.3
10 880.8
13 1014.1
8 619.9
7 583.2
8 589.5
12 1140.8
7 646.1
10 773.1
8 618.6
7 619.2
6 472.6
12 875.1
9 720.0
8 554.3
10 833.6
11 747.7
12 1034.8
8 601.5
13 895.0
8 652.7
12 1158.3
10 871.3
13 1010.9
11 934.7
8 668.5
11 784.6
7 558.8
10 737.8
9 750.7
9 857.2 Sueldo Mensual (miles de $) " y"
11 1034.4
1600.0
7 563.8
8 633.5
1400.0

1200.0
1600.0

1400.0
10 829.9
9 940.9
5 1200.0
468.7
9 685.6
11 991.0
1000.0
7 563.8
13 914.7
800.0
11 1067.2
10 761.2
9 600.0
659.8
11 934.9
9 635.1
400.0
9 785.1
11 946.8
200.0
9 593.6
13 875.1
10 0.0
860.3 0 2 4 6 8 10
6 578.4
7 615.7
7 567.8
13 1045.2
9 678.3
12 901.2
12 938.0
5 557.8
13 1179.1
9 742.5
4 451.5
12 940.4
9 712.2
12 854.9
7 597.7
9 635.4
10 702.5
8 637.8
11 972.4
9 639.7
11 854.3
10 703.0
10 765.7
7 619.1
11 884.6
9 873.4
7 677.1
10 879.7
10 942.6
10 867.1
13 1072.0
8 604.3
12 907.6
10 857.4
11 683.3
9 551.9
10 868.2
11 941.7
9 700.4
10 882.0
8 641.1
10 790.0
6 480.2
12 996.0
9 665.7
8 598.4
9 748.2
9 743.5
9 649.0
8 670.4
9 760.6
7 566.1
10 690.6
10 703.2
13 1035.5
9 861.6
10 853.2
8 556.9
11 1161.3
8 686.9
12 1206.6
11 988.7
10 956.6
8 616.3
11 887.5
10 794.7
10 852.8
10 856.0
7 480.2
9 770.3
12 868.6
10 702.4
8 580.9
8 663.4
10 779.0
9 857.3
7 578.6
10 854.4
5 493.4
10 908.6
8 674.3
10 650.1
7 555.1
8 660.3
12 964.2
9 660.3
7 578.5
7 486.0
9 748.3
10 765.9
11 717.9
6 566.3
12 1009.5
14 1338.3
11 965.0
11 1013.0
11 887.2
13 1172.1
12 1196.8
10 913.6
9 798.9
6 427.6
12 961.6
7 475.8
13 967.8
10 959.9
7 601.3
10 875.8
8 601.4
10 933.9
12 1043.0
10 775.9
11 851.2
5 421.0
11 879.7
12 720.3
11 969.8
Relación entre sueldo y antiguedad laboral de un trabajado

f(x) = 76.9005600458063 x + 53.6169886295215


R² = 0.764260702713312
Sueldo mensual (miles de $)

0 2 4 6 8 10

Antiguedad en años

Resumen

Estadísticas de la regresión
Coeficiente de correlación mú0.8742200539
Coeficiente de determinació 0.7642607027
R^2 ajustado 0.7634696312
Error típico 91.120555515
Observaciones 300

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
Regresión 1 8021554.2735255 8021554.27352545
Residuos 298 2474280.7799412 8302.95563738663
Total 299 10495835.053467

Coeficientes Error típico Estadístico t


Intercepción 53.61698863 24.190117222136 2.21648320829373
Variable X 1 76.900560046 2.4740962913375 31.0822825752808

y= 76,901x + 53,617

Coeficiente de correlación múltiple: 0.8742200539414

Esto significa que hay una correlación positiva, por lo tanto, una gran relación entre las variables sueldo y
Sueldo Mensual (miles de $) " y"
6 8 10 12 14 16
edad laboral de un trabajador

8 10 12 14 16

uedad en años
F Valor crítico de F
966.10829 1.63971E-95

Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%


0.02741341 6.011890049 101.222087 6.01189005 101.2220872
1.6397E-95 72.03164615 81.7694739 72.0316462 81.76947394

ón entre las variables sueldo y antigüedad. De esta manera a mayor antigüedad, mayor es el sueldo.
BIBLIOGRAFÍA
https://www.youtube.com/watch?v=iQ4V9pJC_Bk
https://www.youtube.com/watch?v=SsFBnvkoZa4
https://www.youtube.com/watch?v=MQPN25q1uho
https://www.youtube.com/watch?v=S-ucpdHED3M
https://www.youtube.com/watch?v=zK87rAUI0f0
https://www.youtube.com/watch?v=acbEICRBRgY
https://www.youtube.com/watch?v=4DIcRlmDWU0
https://www.youtube.com/watch?v=rmjDsbyrhto

También podría gustarte