Está en la página 1de 26

REGRESION Y CORRELACION MULTIPLE

PROBLEMA 01:
Se pretende estimar los gastos en alimentacion de una familia con base en la informacion que proporcionan las variables independientes o regresoras "Ingresos mensu
familia". Para ello se recoge una muestra aleatoria simple de 15 familias, cuyos resultados se facilitan en la siguiente tabla.
Los gastos e ingresos se encuentran expresados en cien mil euros.

Relacion: Gastos vs N° m
N° MIEMBROS DE LA
N° GASTOS DE ALIMENTACION (Y) INGRESOS (X1) 1.4
FAMILIA (X2)
1.2
1 0.43 2.1 3
1
2 0.31 1.1 4
0.8
3 0.32 0.9 5
0.46 1.6 4 0.6
4 f(x) = - 0.0363461538x + 0.6712692308
5 1.25 6.2 4 0.4 R² = 0.0159942981
6 0.44 2.3 3 0.2
7 0.52 1.8 6 0
0.29 1 5 1.5 2 2.5 3 3.5 4
8
9 1.29 8.9 3
10 0.35 2.4 2
11 0.35 1.2 4
12 0.78 4.7 3 Relacion: Ga
13 0.43 3.5 2 1.4
14 0.47 2.9 3 f(x) = 0.1343217934x + 0.1618
1.2 R² = 0.8882291765
15 0.38 1.4 4
1
Regresion y Correlacion Lineal Multiple: 0.8
- Realizar el diagrama de dispersion de dichas variables.
0.6
- Calcular el modelo de regresion y el coeficiente de correlacion para probar estadisticamente su relacion.
- Relacionar la informacion obtenida con el problema. 0.4
SOLUCION 0.2

0
0 1 2 3 4
0.6

0.4

0.2
- Realizar el diagrama de dispersion de dichas variables.
0
0 1 2 3 4
- Calcular el modelo de regresion y el coeficiente de correlacion para probar estadisticamente su relacion.

Y=b0+b1X1+b2X2

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.9744945769
Coeficiente de determinación R^2 0.9496396804
R^2 ajustado 0.9412462938
Error típico 0.0775122828
Observaciones 15

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F
Regresión 2 1.3595421521 0.679771076 113.14142
Residuos 12 0.0720978479 0.006008154
Total 14 1.43164

Coeficientes Error típico Estadístico t Probabilidad


Intercepción -0.1604580427 0.0903891033 -1.7751923275 0.10121136
Variable X 1 0.1487270228 0.009971317 14.9154843642 4.1458E-09
Variable X 2 0.0769151943 0.020106868 3.8253195049 0.00241602

Y=-0.1605+0.1487X1+0.0769X2

R^2=0.9496, por ser cercano a 1, el modelo matematico es muy confiable.


R^2=94.96%, el modelo matematico se aplica al 94,96% de confiabilidad
r=0.9745=97.45%, la correlacion entre las variables es excelente , dado que su valor de coeficiente es 0.9745

- Relacionar la informacion obtenida con el problema.


Y=-0.1605+0.1487X1+0.0769X2

este modelo explica al 94.96% de confiabilidad ,esto se deb a que los variables se encuentran en una correlacion de 0.9745.
egresoras "Ingresos mensuales" y "Numero de miembros de la

Relacion: Gastos vs Ingresos

f(x) = 0.1343217934x + 0.1618989784


R² = 0.8882291765

1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
Valor crítico de F
1.6313E-08

Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
-0.357399 0.0364829 -0.357399 0.0364829
0.12700139 0.17045266 0.12700139 0.17045266
0.03310609 0.1207243 0.03310609 0.1207243
PROBLEMA 02:
Variable X 1 Gráfico de los residuales
Se pretende estimar los ingresos de una familia con base en la informacion que proporcionan las variables independientes 100
o regresoras "Habitantes" y "superficie". Para ello se recoge una muestra aleatoria simple de 13 datos, cuyos resultados se
facilitan en la siguiente tabla. 50

Residuos
0
0 f(x)
10= - 1.77283119649584E-15x
20 30 40 + 5.769859503633E-14
50 60 70 80
-50 R² = 2.22044604925031E-16
-100

N° INGRESOS (Y) HABITANTES (X1) SUPERFICIE (X2) Variable X 1

1 198 70 21
2 209 35 26
3 197 55 14
4 156 25 10
5 85 28 12 Resumen Variable X 1 Curva de regresión ajustada
6 187 43 20 300
7 43 15 5 Estadísticas de la regresión
200
8 211 33 28 Coeficiente d 0.79167649 Y
100 Pronóstico para Y

Y
9 120 23 9 Coeficiente d 0.62675167
10 62 4 6 R^2 ajustado 0.59282 0
11 176 45 10 Error típico 42.7218706 0 10 20 30 40 50 60 70 80
12 117 20 8 Observacione 13 Variable X 1
13 273 56 36
ANÁLISIS DE VARIANZA
Regresion y Correlacion Lineal Multiple: Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
- Realizar el diagrama de dispersion de dichas variables. Regresión 1 33712.4903 33712.4903 18.470996 0.00126061
- Calcular el modelo de regresion y el coeficiente de correlacion para probar estadisticamente su relacion. Residuos 11 20076.7405 1825.15823
- Relacionar la informacion obtenida con el problema. Total 12 53789.2308

SOLUCION Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%
Superior 95.0%
Intercepción 56.9100636 26.0180796 2.1873276 0.05120647 -0.3553435 114.175471 -0.3553435 114.175471
Variable X 1 2.86320614 0.66620434 4.29778966 0.00126061 1.39690026 4.32951201 1.39690026 4.32951201
Análisis de los residuales
Relacion: Ingresos vs habiltantes
300
Observación
Pronóstico para YResiduos
Residuos estándares
250 f(x) = 6.0293058057x + 61.3840238326
R² = 0.750382399 1 257.334493 -59.3344931 -1.45061197
200 2 157.122278 51.8777217 1.26830853
150 3 214.386401 -17.386401 -0.4250634
100 4 128.490217 27.509783 0.67256023
50 5 137.079835 -52.0798354 -1.27324982
0 6 180.027927 6.97207258 0.1704535
0 5 10 15 20 25 30 35 40 7 99.8581556 -56.8581556 -1.39007038
8 151.395866 59.6041339 1.45720416
Relacion: Ingresos vs superficie 9 122.763805 -2.76380471 -0.0675696
10 68.3628881 -6.36288814 -0.15556013
300
11 185.75434 -9.75433969 -0.23847447
250
f(x) = 2.8632061354x + 56.910063599 12 114.174186 2.82581369 0.0690856
200 R² = 0.6267516711
13 217.249607 55.7503928 1.36298775
150
100
50
0
0 10 20 30 40 50 60 70 80

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.9250965282
Coeficiente de determinación R^2 0.8558035865
R^2 ajustado 0.8269643038
Error típico 27.8499805424
Observaciones 13

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 2 46033.0166070861 23016.5083 29.6749262 6.23408E-05
Residuos 10 7756.2141621447 775.621416
Total 12 53789.2307692308

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%


Intercepción 37.5023003593 17.6461216318 2.12524322 0.05949604 -1.81570884
Variable X 1 1.4962877931 0.553386309 2.7038757 0.02216541 0.26326626
Variable X 2 4.244624453 1.0649998266 3.98556352 0.0025777 1.87165696

Y=-37.5023+1.4962X1+4.2446X2
PROBLEMA 03: Variable X
un constructor inmobiliario desea estudiar la relacion entre el tamaño de la casa que compraria un cliente
(en pies cuadrados) y otras variables, las posibles variables independiente son: el ingreso familiar, el 10

Residuos
numero de miembros en la familia, si hay un adulto mayor viviendo con la familia (1 para si, 0 para no), y 5
los años totales de educacion adicionales al bachillerato del esposo y la esposa . La informacion muestral
se reporta en la siguiente tabla. 0
-52000 2

Pies Ingresos (mil Miembros Adulto


Familia Educacion
Cuadrados dolares) de Familia Mayor
1 2240 60.8 2 0 4 Resumen
2 2380 68.4 2 1 6
3 3640 104.5 3 0 7 Estadísticas de la regresión
4 3360 89.3 4 1 0 Coeficiente d 0.37381248
5 3080 72.2 4 0 2 Coeficiente 0.13973577
6 2940 114 3 1 10 R^2 ajustado 0.03220274
7 4480 125.4 6 0 6 Error típico 2.97850211
8 2520 83.6 3 0 8 Observacione 10
9 4200 133 5 0 2
10 2800 95 3 0 6 ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Formule una ecuacion de regresion multiple apropiada . Regresión 1 11.5282012
¿Qué variable independiente incluira en la ecuacion de regresion final?, Residuos 8 70.9717988
Total 9 82.5

regresion lineal Chart Title Coeficientes Error típico


140 5000 Intercepción 0.76295732 4.26091765
f(x) = 0.0272669861x + 8.3472560976
4500 Variable X 1 0.00149717 0.00131337
120 f(x) = 540.6896551724x + 1271.5862068966
R² = 0.711078109 4000 R² = 0.8242220353
100 3500
3000
80 2500
Análisis de los residuales
60 2000
1500
40 1000
20 500
0
1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5
R² = 0.711078109 4000 R² = 0.8242220353
100 3500
3000
80 2500
60 2000
1500
40 1000 Observación
Pronóstico para YResiduos
20 500 1 4.11661585 -3.1166159
0 2 4.32621951 -2.3262195
0 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5
2000 2500 3000 3500 4000 4500 5000 3 6.21265244 -3.2126524
4 5.79344512 -1.7934451
5 5.3742378 -0.3742378
6 5.16463415 0.83536585
7 7.47027439 -0.4702744
8 4.53582317 3.46417683
9 7.05106707 1.94893293
10 4.95503049 5.04496951
Variable X 1 Gráfico de los residuales
10
Residuos

5
0
-52000 2500 3000 3500 4000 4500 5000
Variable X 1

Variable X 1 Curva de regresión ajustada


20
10 Y
Pronóstico para Y
Y

0
2000 2500 3000 3500 4000 4500 5000
Variable X 1

Promedio de los cuadradosF Valor crítico de F


11.5282012 1.2994684 0.28728787
8.87147485

Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
0.17905939 0.86234287 -9.0627364 10.588651 -9.0627364 10.588651
1.13994228 0.28728787 -0.0015315 0.00452581 -0.0015315 0.00452581
Residuos estándares
-1.1098432
-0.8283789
-1.1440423
-0.6386552
-0.133268
0.29747815
-0.1674672
1.23361148
0.6940252
1.79654001
PROBLEMA 04:
se desea construir un modelo de regresion para obtener el volumen de
madera de un "cerezo negro" en funcion de la altura del tronco y del diametro
del mismo a un metro sobre el suelo. Se ha tomado una muestra de 31
arboles. Las unidades de longitudes son pies y de volumen pies cubicos).

Arbol Diametro Altura Volumen


1 8.3 70 10.3
2 8.6 65 10.3
3 8.8 63 10.2
4 10.5 72 16.4
5 10.7 81 18.8
6 10.8 83 19.7
7 11 66 15.6
8 11 75 18.2
9 11.1 80 22.6
10 11.2 75 19.9
11 11.3 79 24.2
12 11.4 76 21
13 11.4 76 21.4
14 11.7 69 21.3
15 12 75 19.1
16 12.9 74 22.2
17 12.9 85 33.8
18 13.3 86 27.4
19 13.7 71 25.7
20 13.8 64 24.9
21 14 78 34.5
22 14.2 80 31.7
23 14.5 74 36.3
24 16 72 38.3
25 16.3 77 42.6
26 17.3 81 55.4
27 17.5 82 55.7
28 17.9 80 58.3
29 18 80 51.5
30 18 80 51
31 20.6 87 77

Regresion y Correlacion Lineal Multiple:


- Realizar el diagrama de dispersion de dichas variables.
- Calcular el modelo de regresion y el coeficiente de correlacion para probar estadisticamente su relacion.
- Relacionar la informacion obtenida con el problema.
e su relacion.
Chart Title
25

20
Estadísticas de la regresión
15 f(x) = 0.2557471264x - 6.1883945124
Coeficiente d 0.96720669 R² = 0.2696517931
Coeficiente 0.93548878 10
R^2 ajustado 0.93326426 5
Error típico 2.34879151
0
Observacione 31 60 65 70 75 80 85 90

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 2320.01218 2320.01218 420.534208 8.322E-19
Residuos 29 159.987825 5.51682153
Total 30 2480

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción -21.125763 1.858901 -11.364652 3.357E-12 -24.927643 -17.323884
Variable X 1 2.80228551 0.13665065 20.5069307 8.322E-19 2.52280354 3.08176748

Variable X 1 Gráfico de
Análisis de los residuales
5

Observación
Pronóstico para YResiduos
Residuos estándares 0
Residuos

1 2.13320653 -1.1332065 -0.4907115 6 8 10 12 14


2 2.97389218 -0.9738922 -0.4217237 -5
3 3.53434929 -0.5343493 -0.2313888
-10
4 8.29823466 -4.2982347 -1.861261
Variable X
5 8.85869176 -3.8586918 -1.6709261
6 9.13892031 -3.1389203 -1.3592441
7 9.69937741 -2.6993774 -1.1689092
8 9.69937741 -1.6993774 -0.73588 Variable X 1 Curva de re
9 9.97960596 -0.979606 -0.424198
40
10 10.2598345 -0.2598345 -0.1125159
30
11 10.5400631 0.45993693 0.19916611
20
12 10.8202916 1.17970838 0.51084815
Y

10
13 10.8202916 2.17970838 0.94387733
0
14 11.6609773 2.33902273 1.01286509 6 8 10 12 14 16 18
15 12.5016629 2.49833707 1.08185285
Variable X 1
16 15.0237199 0.97628011 0.42275778
17 15.0237199 1.97628011 0.85578695
18 16.1446341 1.85536591 0.80342758
19 17.2655483 1.7344517 0.7510682
20 17.5457768 2.45422315 1.06275024
21 18.1062339 2.89376605 1.25308514
22 18.6666911 3.33330895 1.44342003
23 19.5073767 3.49262329 1.5124078
24 23.710805 0.28919503 0.12522988
25 24.5514906 0.44850937 0.19421765
26 27.3537761 -1.3537761 -0.5862246
27 27.9142332 -0.9142332 -0.3958897
28 29.0351474 -1.0351474 -0.448249
29 29.315376 -0.315376 -0.136567
30 29.315376 0.684624 0.29646217
31 36.6013183 -5.6013183 -2.4255343
Chart Title
25

20 f(x) = 0.1846321321x + 7.6778569939


R² = 0.9353198725
15

10
85 90

0
0 10 20 30 40 50 60 70 80 90

Inferior 95.0%
Superior 95.0%
-24.927643 -17.323884
2.52280354 3.08176748

able X 1 Gráfico de los residuales

8 10 12 14 16 18 20 22

Variable X 1

ble X 1 Curva de regresión ajustada

Y
Pronóstico para Y

8 10 12 14 16 18 20 22
Variable X 1
PROBLEMA 05:
Hemos recogido datos sobre usuarios de mediana edad de una biblioteca en la que además se realizan actividades tanto p
adolescentes y adultos, y estamos interesados en analizar cuáles son las variables que determinan el nivel de satisfacción
recogidas son: afición a la lectura, al cine, a la música, número de hijos, renta… y, por supuesto, nivel de satisfacción.

affcion_lectunum_hijos affi_cine affic_musica renta_mens


4 0 3 5 1200
3 0 3 4 1500
5 1 4 1 1800
2 2 1 3 1000
4 1 5 3 1300
3 1 3 4 1900
5 3 4 5 1300
3 0 2 3 1200
3 1 4 1 1600
1 3 2 1 1400
4 0 5 4 1700
5 0 5 5 2500
5 2 4 4 1100
5 2 5 3 1400
2 1 1 4 1800
4 2 5 4 2000
3 3 2 4 1500
1 1 2 3 1000
2 1 2 2 1300
1 0 2 5 1600
5 1 4 4 1800
2 2 3 3 1200
4 1 5 5 1700
4 1 4 3 1500
5 2 4 5 1100

Regresion y Correlacion Lineal Multiple:


- Realizar el diagrama de dispersion de dichas variables.
- Calcular el modelo de regresion y el coeficiente de correlacion para probar estadisticamente su relacion.
- Relacionar la informacion obtenida con el problema.

Variable X 1 Gráfico de los residuales Variable X 1 Curva de reg


5 10
Residuos

0 5
-5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
Y

0
Variable X 1 0.5 1 1.5 2 2.5 3 3.5 4 4.5
Variable X 1
5 10

Residuo
0 5
-5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5

Y
0
Variable X 1 0.5 1 1.5 2 2.5 3 3.5 4 4.5
Variable X 1
se realizan actividades tanto para niños como para
minan el nivel de satisfacción de sus usuarios; las variables
to, nivel de satisfacción.

nivel_estudioaficcion_Tv satisfaccion
4 4 4
5 4 3
3 5 5
2 2 3
3 4 4
1 4 3
4 5 5
4 4 3
2 5 4
2 1 2
3 4 4
4 5 5
5 3 5
3 4 5
4 3 3
4 5 5
4 3 3
2 2 2
3 3 3
4 4 2
3 4 4
4 4 4
2 5 4
5 4 4
5 5 5

e su relacion.

e X 1 Curva de regresión ajustada


Y
Pronóstico para Y

1 1.5 2 2.5 3 3.5 4 4.5 5 5.5


Variable X 1
Y
Pronóstico para Y

1 1.5 2 2.5 3 3.5 4 4.5 5 5.5


Variable X 1
6

4
Resumen f(x) = 0.160041841x + 3.1966527197
R² = 0.039880133
3
Estadísticas de la regresión
Coeficiente d 0.69592799 2
Coeficiente 0.48431577
R^2 ajustado 0.46189472 1
Error típico 0.74206541
Observacione 25 0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 11.8947953 11.8947953 21.6009373 0.00011201
Residuos 23 12.6652047 0.55066107
Total 24 24.56

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción 1.22807018 0.56462712 2.17501098 0.04016257 0.06005 2.39609035
Variable X 1 0.65935673 0.1418679 4.64768085 0.00011201 0.36588061 0.95283284

Análisis de los residuales 5

Observación
Pronóstico para YResiduos
Residuos estándares 4 f(x) = 0.3133333333x + 2.6946666667
R² = 0.1199239957
1 3.86549708 0.13450292 0.18515321
2 3.86549708 -0.8654971 -1.1914206 3
3 4.5248538 0.4751462 0.65407383
4 2.54678363 0.45321637 0.62388581 2

5 3.86549708 0.13450292 0.18515321


1
6 3.86549708 -0.8654971 -1.1914206
7 4.5248538 0.4751462 0.65407383
0
8 3.86549708 -0.8654971 -1.1914206 0.5 1 1.5 2 2.5 3 3.5 4
9 4.5248538 -0.5248538 -0.7225
10 1.8874269 0.1125731 0.15496518 6
11 3.86549708 0.13450292 0.18515321
12 4.5248538 0.4751462 0.65407383 5
13 3.20614035 1.79385965 2.46938028 f(x) = 0.6593567251x + 1.2280701754
4 R² = 0.4843157704
14 3.86549708 1.13450292 1.56172706
3

2
5

f(x) = 0.6593567251x + 1.2280701754


4 R² = 0.4843157704
15 3.20614035 -0.2061404 -0.2837674 3
16 4.5248538 0.4751462 0.65407383
17 3.20614035 -0.2061404 -0.2837674 2
18 2.54678363 -0.5467836 -0.752688
1
19 3.20614035 -0.2061404 -0.2837674
20 3.86549708 -1.8654971 -2.5679945 0
21 3.86549708 0.13450292 0.18515321 0.5 1 1.5 2 2.5 3 3.5 4 4.

22 3.86549708 0.13450292 0.18515321


23 4.5248538 -0.5248538 -0.7225
24 3.86549708 0.13450292 0.18515321
25 4.5248538 0.4751462 0.65407383
.1966527197

3 3.5 4 4.5 5 5.5

Inferior 95.0%
Superior 95.0%
0.06005 2.39609035
0.36588061 0.95283284

3333333x + 2.6946666667
239957

2 2.5 3 3.5 4 4.5 5 5.5

7251x + 1.2280701754
704
7251x + 1.2280701754
704

2.5 3 3.5 4 4.5 5 5.5

También podría gustarte