Está en la página 1de 10

EJERCICIOS: ANÁLISIS DE CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE

1. Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:


Estatura (X) 186 189 190 192 193 193 198 201 203 205
Pesos (Y) 85 85 86 90 87 91 93 103 100 101
Calcular:
a. La recta de regresión de Y sobre X.

N X Y XY X2 Y2
1 186 85 15810 34596 7225
2 189 85 16065 35721 7225
3 190 86 16340 36100 7396
4 192 90 17280 36864 8100
5 193 87 16791 37249 7569
6 193 91 17563 37249 8281
7 198 93 18414 39204 8649
8 201 103 20703 40401 10609
9 203 100 20300 41209 10000
10 205 101 20705 42025 10201
TOTAL 1950 921 179971 380618 85255

10 ∑ 𝑋𝑖𝑌𝑖− (∑ 𝑋𝑖 )(∑ 𝑌𝑖 )
b= [10 ∑ 𝑋𝑖 2−(∑ 𝑋𝑖) 2]
= 1.0217

a= -107.139

RECTA DE REGRESION:
Y = 1.0217x-107.139

b. El coeficiente de correlación. Interpretar

𝑛 ∑ 𝑋𝑖𝑌𝑖− (∑ 𝑋𝑖 )(∑ 𝑌𝑖 )
r=
[𝑛∑ 𝑋𝑖 2−(∑ 𝑋𝑖) 2][𝑛 ∑ 𝑌𝑖 2−(∑ 𝑌𝑖) 2]

r = 0.944

interpretación:
Si 0.7 < r < 1.0 existe alto grado de correlación
Debido a que nuestro “r” es 0.944, entonces, existe alto grado de correlación entre la altura del
jugador y su peso estimado

c. El peso estimado de un jugador que mide 208 cm.


Si:
1
Y = 1.0217x-107.139
Entonces:
Y= 1.0217 (208) – 107.139
Y= 105.375

d. Elaborar el diagrama de dispersión

e. Calcular el error de estimación

N x y Y (Y-y)2
1 186 85 82.8972 4.42176784
2 189 85 85.9623 0.92602129
3 190 86 86.984 0.968256
4 192 90 89.0274 0.94595076
5 193 87 90.0491 9.29701081
6 193 91 90.0491 0.90421081
7 198 93 95.1576 4.65523776
8 201 103 98.2227 22.8225953
9 203 100 100.2661 0.07080921
10 205 101 102.3095 1.71479025
TOTAL 1950 921 920.925 46.72665

46.72665
S= 10−2
= 2.416 kg

2
2. A partir de los siguientes datos referentes a horas trabajadas por mes en un taller (X), y a unidades producidas
(Y).
Horas (X) 80 79 83 84 78 60 82 85 79 84 80 62
Producción (Y) 300 302 315 330 300 250 300 340 315 330 310 240

Determinar:
a. La recta de regresión de Y sobre X,
N x y x.y x2 y2
1 80 300 24000 6400 90000
2 79 302 23858 6241 91204
3 83 315 26145 6889 99225
4 84 330 27720 7056 108900
5 78 300 23400 6084 90000
6 60 250 15000 3600 62500
7 82 300 24600 6724 90000
8 85 340 28900 7225 115600
9 79 315 24885 6241 99225
10 84 330 27720 7056 108900
11 80 310 24800 6400 96100
12 62 240 14880 3844 57600
TOTAL 936 3632 285908 73760 1109254

12 ∑ 𝑋𝑖𝑌𝑖− (∑ 𝑋𝑖 )(∑ 𝑌𝑖 )
b= [12 ∑ 𝑋𝑖 2−(∑ 𝑋𝑖) 2]
= 3.4734

a= 31.7411

RECTA DE REGRESION:
Y = 3.4734x + 31.7411

b. El coeficiente de correlación lineal e interpretarlo.


𝑛 ∑ 𝑋𝑖𝑌𝑖− (∑ 𝑋𝑖 )(∑ 𝑌𝑖 )
r=
[𝑛∑ 𝑋𝑖 2−(∑ 𝑋𝑖) 2][𝑛 ∑ 𝑌𝑖 2−(∑ 𝑌𝑖) 2]

r = 0.954

Si 0.7 < r < 1.0 existe alto grado de correlación


Debido a que nuestro “r” es 0.954, entonces, existe alto grado de correlación entre las horas de trabajo
y las unidades producidas.

3
c. Elaborar el diagrama de dispersión

d. Calcular el error de estimación

N x y Y (Y-y)2
1 80 300 309.6131 92.4116916
2 79 302 306.1397 17.1371161
3 83 315 320.0333 25.3341089
4 84 330 323.5067 42.1629449
5 78 300 302.6663 7.10915569
6 60 250 240.1451 97.119054
7 82 300 316.5599 274.230288
8 85 340 326.9801 169.517796
9 79 315 306.1397 78.5049161
10 84 330 323.5067 42.1629449
11 80 310 309.6131 0.14969161
12 62 240 247.0919 50.2950456
TOTAL 936 3632 3631.9956 896.134753

896.1347
S= 12−2
= 9.4664 kg

e. Para cierto mes estimar las unidades producidas en el taller si se trabaja 70 horas
Si:
Y = 3.4734x + 31.7411
Entonces:

4
Y=3.4734 (70) + 31.7411 Y= 274.7181

3. La siguiente tabla muestra el número de automóviles vendidos en los últimos 10 años en cierta ciudad :

Año (X) 2009 2010 2011 20120 2013 2014 2015 2016 2017 2018
Unidades
150 200 180 300 302 315 330 300 450 400
Vendidas (Y)
Determinar:
a. La recta de regresión de Y sobre X

n x y xy x2 y2
1 2009 150 301350 4036081 22500
2 2010 200 402000 4040100 40000
3 2011 180 361980 4044121 32400
4 2012 300 6036000 404814400 90000
5 2013 302 607926 4052169 91204
6 2014 315 634410 4056196 99225
7 2015 330 664950 4060225 108900
8 2016 300 604800 4064256 90000
9 2017 450 907650 4068289 202500
10 2018 400 807200 4072324 160000
TOTAL 38243 2927 11328266 441308161 936729

10 ∑ 𝑋𝑖𝑌𝑖− (∑ 𝑋𝑖 )(∑ 𝑌𝑖 )
b= [10 ∑ 𝑋𝑖 2−(∑ 𝑋𝑖) 2]
= 28.503

a= -57098.151

RECTA DE REGRESION:
y= 28.503x-57098.151

b. El coeficiente de correlación lineal e interpretarlo.


𝑛 ∑ 𝑋𝑖𝑌𝑖− (∑ 𝑋𝑖 )(∑ 𝑌𝑖 )
r=
[𝑛∑ 𝑋𝑖 2−(∑ 𝑋𝑖) 2][𝑛 ∑ 𝑌𝑖 2−(∑ 𝑌𝑖) 2]

r = 0.915

Interpretación:

Si 0.7 < r < 1.0 existe alto grado de correlación


Debido a que nuestro “r” es 0.915, entonces, existe alto grado de correlación entre el año y los
automóviles vendidos

5
c. Dibujar la nube de puntos

d. Calcular el error de estimación

n x y Y (Y-y)2
1 2009 150 164.376 206.669376
2 2010 200 192.879 50.708641
3 2011 180 221.382 1712.46992
4 2012 300 249.885 2511.51322
5 2013 302 278.388 557.526544
6 2014 315 306.891 65.755881
7 2015 330 335.394 29.095236
8 2016 300 363.897 4082.82661
9 2017 450 392.4 3317.76
10 2018 400 420.903 436.935409
TOTAL 20135 2927 2926.395 12971.2608

12971.2608
S= 10−2
= 35.7648 unidades

6
e. Estimar el número de accidentes para el año 2021
Si:
y= 28.503x-57098.151

Entonces:
y= 28.503(2021)-57098.151
y= 506.412

f. Estimar el número de accidentes en el año 2007

y= 28.503x-57098.151

Entonces:
y= 28.503(2007)-57098.151
y= 107.37

7
4. La siguiente tabla muestra el número de accidentes de tráfico en los últimos 7 años en cierta ciudad:

Año(X) 2013 2014 2015 2016 2017 2018 2019


N°accid(Y) 510 515 518 522 528 532 536

a. Determinar el número promedio de accidentes en los 7 años.

n x y
1 2013 510
2 2014 515
3 2015 518
4 2016 522
5 2017 528
6 2018 532
7 2019 536
TOTAL 3661

3661
Promedio: = 7
= 523 accidentes de tráfico.

b.  Dibujar la nube de puntos

8
c. Calcular la recta de regresión de Y (n°accidentes) sobre X(años).

n x y xy x2 y2
1 2013 510 1026630 4052169.000 260100
2 2014 515 1037210 4056196.000 265225
3 2015 518 1043770 4060225.000 268324
4 2016 522 1052352 4064256.000 272484
5 2017 528 1064976 4068289.000 278784
6 2018 532 1073576 4072324.000 283024
7 2019 536 1082184 4076361.000 287296
TOTAL 14112 3661 7380698 28449820 1915237

7 ∑ 𝑋𝑖𝑌𝑖− (∑ 𝑋𝑖 )(∑ 𝑌𝑖 )
b= [7∑ 𝑋𝑖 2−(∑ 𝑋𝑖) 2]
= 4.357

a= -8261

RECTA DE REGRESION:
y= 4.357x - 8261

d. Obtener el coeficiente de correlación lineal

𝑛 ∑ 𝑋𝑖𝑌𝑖− (∑ 𝑋𝑖 )(∑ 𝑌𝑖 )
r=
[𝑛∑ 𝑋𝑖 2−(∑ 𝑋𝑖) 2][𝑛 ∑ 𝑌𝑖 2−(∑ 𝑌𝑖) 2]

r = 0.998

Interpretación:

Si 0.7 < r < 1.0 existe alto grado de correlación


Debido a que nuestro “r” es 0.998, entonces, existe alto grado de correlación entre el año y los
accidentes de tráfico producidos.

e. ¿Cuántos accidentes se estimaría para el año 2010?

Si:
Y = 4.357x - 8261

Entonces:

Y = 4.357 (2010) - 8261

9
Y = 496.57 accidentes de tráfico.

10

También podría gustarte