Está en la página 1de 11

UNIVERSIDAD NACIONAL DE CAJAMARCA

EJERCICIOS
CORRELACIN Y REGRESIN
1.- Suponga que el gerente de comercializacin de Bella Holandesa observa el precio y
volumen de venta de galones de leche de 10 semanas en forma aleatoria. Los datos obtenidos
se presentan en la tabla. Generar el diagrama de dispersin, verificar la tendencia con el
coeficiente de correlacin, los parmetros de la lnea de regresin, el coeficiente de
determinacin, y la desviacin estndar.
Semana

Venta Semanal
de galones
10,000
6,000
5,000
12,000
10,000
15,000
5,000
12,000
17,000
20,000

1
2
3
4
5
6
7
8
9
10

Precio de Venta
por galn (en US$)
1.30
2.00
1.70
1.50
1.60
1.20
1.60
1.40
1.00
1.10

diagrama de dispersin

precio de venta por galon

Diagrama de dispersion
18
16
14
12
10
8
6
4
2
0
0

10

20

30

venta semanal de galones (en miles)

40

50

UNIVERSIDAD NACIONAL DE CAJAMARCA

Verificar la tendencia con el coeficiente de correlacin

XY

X2

Y2

10

1.3

13

100

1.69

12

36

1.7

8.5

25

2.89

12

1.5

18

144

2.25

10

1.6

16

100

2.56

15

1.2

18

225

1.44

1.6

25

2.56

12

1.4

16.8

144

1.96

17

17

289

20

1.1

22

400

1.21

112

14.4

149.3

1488

21.56

][

][

Parmetros de la lnea de regresin

UNIVERSIDAD NACIONAL DE CAJAMARCA

18
y = 0.3953x + 0.907
R = 0.8065

precio de venta por galon

16
14
12
10
8
6
4
2
0
0

10

20

30

40

50

venta semanal de galones (en miles)

Desviacin estndar.

Se utiliza la covarianza cuando se trata de datos agrupados como lo es este caso.

UNIVERSIDAD NACIONAL DE CAJAMARCA

2.-El gerente general de una planta de produccin de materiales de construccin considera


que la demanda de embarques de aglomerado puede estar relacionado con el nmero de
permisos de construccin emitidos en el municipio durante el trimestre anterior. El gerente
ha recolectado los siguientes datos:
Permisos de Construccin Embarque de Conglomerados
15
6
9
4
40
16
20
6
25
13
25
9
15
10
35
16
a)
b)
c)
d)
e)

Revsese el diagrama de dispersin para ver si los datos pueden ser descritos
satisfactoriamente por una ecuacin lineal.
Calclese la razn de la variacin de los embarques ante una variacin de los permisos.
Determnese una estimacin de los embarques cuando el nmero de permisos de
construccin es de 30.
Calcular la desviacin estndar.
Calcular el coeficiente de correlacin.
SOLUCIN

XY

X^2

Y^2

15
9
40
20
25
25
15
35
184

6
4
16
6
13
9
10
16
80

90
36
640
120
325
225
150
560
2146

225
81
1600
400
625
625
225
1225
5006

36
16
256
36
169
81
100
256
950

UNIVERSIDAD NACIONAL DE CAJAMARCA

Diagrama De Dispersin

Embarque de Conglomerados

18
R = 0.8065

16

R=0.8905

14
12
10
8
6
4
2
0
0

10

15

20

25

30

35

Permisos de Construccin

Y = a + bx.
a =
b =
R =
S=

0.907
0.3953
0.8981
4.6291

Y = 0.907 + 0.3953x.
Y (30) = 0.907 + 0.3953*30. =

13

3.- La poblacin de cierta ciudad tiene el siguiente comportamiento histrico:


Ao
1
2
3
4
5
6
7
8
9

Habitantes
1000,000
1020,000
1050,000
1080,000
1120,000
1170,000
1230,000
1300,000
1380,000

40

45

UNIVERSIDAD NACIONAL DE CAJAMARCA

a) Realizar el diagrama de dispersin.

diagrama de dispersion
1600
habitantes en miles

1400
1200
1000
800
600
400
200
0
0

10

aos

b) Hallar los parmetros de la tendencia.

Calculo de los parmetros:

Coeficiente de correlacin:

][

][

Como el coeficiente de correlacin de acerca a 1 podemos decir que existe una


buena o aceptable nivel descriptivo entre las variables x e y.
c) Pronosticar la poblacin en el ao 15.

UNIVERSIDAD NACIONAL DE CAJAMARCA

1600

habitantes en miles

1400
1200
1000
800
600
y = 46.833x + 915.83
R = 0.9578

400
200
0
0

10

aos

Como se quiere determinar la poblacin en 15 aos reemplazaremos en la ecuacin


determinada en la tabla anterior:

4. Cul de las siguientes situaciones es inconsistente?


a)
b)
c)
d)

Y = 499 + 0.21X y r = 0.75


Y = 100 + 0.9X y r = -0.7
Y = -20 + X y r = 0.4
Y = -7-4X y r = -0.9
Solucin
CORRELACIN

VALOR O RANGO

Perfecta

|R| = 1

Excelente

0.9 <= |R| < 1

Buena

0.8 <= |R| < 0.9

Regular

0.5 <= |R| <0.8

Mala

|R|< 0.5

Como se puede apreciar en las ecuaciones anteriores, la alternativa que es inconsistente es la C


por presentar coeficiente de correlacin menor de 0.5, lo cual indica que la correlacin es mala.

UNIVERSIDAD NACIONAL DE CAJAMARCA

5. Los ingresos de Telefnica se estiman mediante el Producto Nacional Bruto. La


ecuacin de regresin es Y = 0.078 + 0.06X en donde el PNB se mide en miles de millones
de dlares.
a) Interprete la pendiente.
b) Interprete la interseccin con Y.
Como la pendiente es positiva (ascendente b=0.06) los ingresos de telefnica van en aumento.

6. Considere los datos de la tabla siguiente:


Ventas semanales (en US$) Gastos de publicidad (en US$)
1,250.00
41,000.00
1,380.00
54,000.00
1,425.00
63,000.00
1,425.00
54,000.00
1,450.00
48,000.00
1,300.00
46,000.00
1,400.00
62,000.00
1,510.00
61,000.00
1,575.00
64,000.00
1,650.00
71,000.00
a)
b)
c)
d)

Existe una relacin significativa entre los gastos de publicidad y las ventas?
Establezca la ecuacin de prediccin.
Pronostique las ventas para un gasto de publicidad de US$50.00.
Qu porcentaje de los gastos en publicidad explican las variaciones en las ventas?
SOLUCIN

XY

X^2

Y^2

41000
54000
63000
54000
48000
46000
62000
61000
64000
71000
564000

1250
1380
1425
1425
1450
1300
1400
1510
1575
1650
14365

51250000
74520000
89775000
76950000
69600000
59800000
86800000
92110000
100800000
117150000
818755000

1681000000
2916000000
3969000000
2916000000
2304000000
2116000000
3844000000
3721000000
4096000000
5041000000
3.2604E+10

1562500
1904400
2030625
2030625
2102500
1690000
1960000
2280100
2480625
2722500
20763875

UNIVERSIDAD NACIONAL DE CAJAMARCA

Diagrama De Dispersin
1700
1650

VENTAS SEMANAL

1600
1550

R = 0.719

R=0.847
9

1500
1450
1400
1350
1300
1250
1200
40000 45000 50000 55000 60000 65000 70000 75000
gastos de publicidad

Y = a + bx.
a =
b =
R =

828.127
0.0108
0.8480

S=

106.0104

Y(50) = 828.127+ 0.0108*50 =

828.666

UNIVERSIDAD NACIONAL DE CAJAMARCA

7. En la siguiente tabla se presenta la informacin de una empresa de rdenes por correo


para 12 ciudades:
Ciudades
A
B
C
D
E
F
G
H
I
J
K
L

Nmero de Ordenes
Recibidas por Correo
24,000
16,000
23,000
15,000
32,000
25,000
18,000
18,000
35,000
34,000
15,000
32,000

Nmero de Catlogos
Distribuidos
6,000
2,000
5,000
1,000
10,000
7,000
15,000
3,000
11,000
13,000
2,000
12,000

a)
b)
c)
d)

Determine si existe una relacin lineal significativa entre estas dos variables.
Determine la lnea de regresin.
Determine el error estndar de la estimacin.
Qu porcentaje de la variacin de los datos independientes explica la variacin de los
datos dependientes?
e) Pronostique las rdenes por correo recibidas cuando se distribuyeron 10,000 catlogos.
f) Calcule la varianza explicada para la variable Y.
SOLUCIN

X
6000
2000
5000
1000
10000
7000
15000
3000
11000
13000
2000
12000
87000

Y
24000
16000
23000
15000
32000
25000
18000
18000
35000
34000
15000
32000
287000

XY
144000000
32000000
115000000
15000000
320000000
175000000
270000000
54000000
385000000
442000000
30000000
384000000
2366000000

X2
36000000
4000000
25000000
1000000
100000000
49000000
225000000
9000000
121000000
169000000
4000000
144000000
887000000

Y2
576000000
256000000
529000000
225000000
1024000000
625000000
324000000
324000000
1225000000
1156000000
225000000
1024000000
7513000000

UNIVERSIDAD NACIONAL DE CAJAMARCA

Diagrama De Dispersin

Nmero de Ordenes Recibidas por Correo

40000
R = 0.4893

R=0.6995

35000

30000

25000

20000

15000

10000
0

2000

4000

6000

8000

10000 12000 14000 16000

catalogos distribuidos

Y = a + bx.
a =
b =
R =
S=

15846.179
1.1132
0.6995
8491.8261

Y(10000) =15846.179+ 1.1132*10000

Y(10000) =

26977.886 ordenes recibidas

También podría gustarte