Está en la página 1de 11

Departamento de Economía Aplicada I

ESCUELA DE EMPRESARIALES

DIPLOMATURA DE EMPRESARIALES

ESTADÍSTICA

Ejercicios Resueltos
REGRESIÓN NO LINEAL Y REGRESIÓN LINEAL
MÚLTIPLE
Curso 2006-2007
Escuela de Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Curso 2006 - 2007

1) Se dispone de la información que aparece recogida en la siguiente tabla, relativa a la


Renta disponible bruta (X) y al Gasto total en alimentos y bebidas no alcohólicas (Y) de los
hogares en las distintas Comunidades Autónomas, para el año 2002:

X Y
(109 €) (109 €)
Andalucía 65,0 8,7
Aragón 14,3 1,6
Asturias 10,8 1,4
Baleares 11,1 1,1
Canarias 18,2 2,1
Cantabria 6,0 0,8
Castilla y León 26,9 3,3
Castilla-La Mancha 16,4 2
Cataluña 77,3 8,9
Comunidad Valenciana 44,4 5,2
Extremadura 8,9 1,2
Galicia 26,0 3,8
La Rioja 3,4 0,4
Madrid 69,4 7,1
Murcia 11,2 1,6
Navarra 7,3 0,7
País Vasco 28,3 2,9
Fuente: INE. Contabilidad Regional de España
Encuesta Continua de Presupuestos Familiares

a) Determinar una función potencial que explique el gasto en alimentación a partir de la


renta.
b) Si la renta disponible bruta de los hogares en Ceuta y Melilla, en el año 2002, fue de
1.500.000.000 de euros, ¿Cuál será la estimación del gasto en alimentación de los hoga-
res de Ceuta y Melilla?

SOLUCIÓN:

a) Tenemos que determinar la función:


y* = Axb

Para ello, la transformamos en una función lineal tomando logaritmos:

ln y* = ln A + b ln x

y, llamando:
v* = ln y * a = ln A u = ln x

nos queda: v* = a + bu , que no es más que la recta de regresión de V sobre U, por lo que:

2
Escuela de Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Curso 2006 - 2007

Suv
b= a = v − b ⋅u
Su2

Los cálculos necesarios para la determinación de estos coeficientes aparecen en la si-


guiente tabla:

xi yi ui = ln xi vi = ln yi ui2 ui vi
65,0 8,7 4,1744 2,1633 17,4256 9,0305
14,3 1,6 2,6603 0,4700 7,0772 1,2503
10,8 1,4 2,3795 0,3365 5,6620 0,8007
11,1 1,1 2,4069 0,0953 5,7932 0,2294
18,2 2,1 2,9014 0,7419 8,4181 2,1525
6,0 0,8 1,7918 -0,2231 3,2105 -0,3998
26,9 3,3 3,2921 1,1939 10,8379 3,9304
16,4 2 2,7973 0,6931 7,8249 1,9388
77,3 8,9 4,3477 2,1861 18,9025 9,5045
44,4 5,2 3,7932 1,6487 14,3884 6,2538
8,9 1,2 2,1861 0,1823 4,7790 0,3985
26,0 3,8 3,2581 1,3350 10,6152 4,3496
3,4 0,4 1,2238 -0,9163 1,4977 -1,1214
69,4 7,1 4,2399 1,9601 17,9768 8,3106
11,2 1,6 2,4159 0,4700 5,8366 1,1355
7,3 0,7 1,9879 -0,3567 3,9517 -0,7091
28,3 2,9 3,3429 1,0647 11,1750 3,5592
444,9 52,8 49,1992 13,0448 155,3723 50,6140

1 N 49,1992 1 N
155,3723
u= ∑
N i =1
ui =
17
= 2,8941 Su2 =
N
∑u
i =1
2
i −u2 =
17
− 2,89412 = 0,7637

N N
1 13, 0448 1 50, 6140
v=
N
∑ vi =
i =1 17
= 0, 7673 Suv =
N
∑u v − u ⋅v =
i =1
i i
17
− 2,8941 ⋅ 0, 7673 = 0, 7567

Por tanto,

0, 7567
b= = 0,9908 a = 0, 7673 − 0, 9908 ⋅ 2,8941 = −2,1001
0, 7637

Así, la recta de regresión de V sobre U es:

v* = −2,1001 + 0,9908 ⋅ u

Teniendo en cuenta que a = ln A , se tiene que:

A = e a = e −2,1001 = 0,1224

3
Escuela de Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Curso 2006 - 2007

y la función potencial que explica el gasto en alimentación a partir de la renta es:

y* = 0,1224 ⋅ x 0,9908

b) Para determinar la estimación del gasto en alimentación de los hogares de Ceuta y Melilla,
sustituimos en la ecuación anterior el valor x = 1,5 :

y* = 0,1224 ⋅1,50,9908 = 0,1829

Por tanto, la estimación del gasto en alimentación de los hogares de Ceuta y Melilla es
de 182.900.000 euros.

2) El gerente de una determinada empresa está estudiando las posibles relaciones entre las
variables X 1 : Beneficios anuales, X 2 : Gastos en publicidad anuales y X 3 : horas
extraordinarias anuales de los empleados, utilizando para ello datos de estas tres
variables proporcionadas por algunas empresas de su sector:

Gastos en Horas extras


Beneficios
publicidad anuales
(106 €)
(106 €) (102 horas)
1,3 0,3 4
3,5 1,5 9
2,8 0,7 6
3 1,1 7,5
3,3 1,2 8
4 2 7
3,7 2 8

a) Determinar la matriz de varianzas – covarianzas.


b) Determinar la matriz de correlación.
c) ¿Qué porcentaje de la varianza de los beneficios explicaría una función lineal de los
gastos en publicidad?
d) ¿Qué porcentaje de la varianza de los beneficios explicaría una función lineal de las
horas extraordinarias anuales de los empleados?
e) Establecer una relación lineal que explique X 1 mediante X 2 y X 3 .
f) Hallar el coeficiente de correlación múltiple entre X 1 y X 2 , X 3 . ¿Qué porcentaje de la
varianza de X 1 queda explicado por el modelo lineal obtenido en el apartado anterior?
g) Si una empresa destina 900.000 euros a publicidad y sus empleados realizan 500 horas
extraordinarias al año, ¿cuál sería la estimación de los beneficios de dicha empresa?
h) Hallar los coeficientes de correlación parcial de X 1 con X 2 y de X 1 con X 3 .

4
Escuela de Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Curso 2006 - 2007

SOLUCIÓN:

a) La matriz de varianzas – covarianzas viene dada por:

 S12 S12 S13 


 
C =  S12 S 22 S 23 
 S13 S23 S32 

donde Si2 es la varianza de la variable X i y Sij es la covarianza entre las variables X i y


Xj.

x1i x2i x3i x1i2 x2i2 x3i2 x1i ⋅ x2i x1i ⋅ x3i x2i ⋅ x3i
1,3 0,3 4 1,69 0,09 16 0,39 5,2 1,2
3,5 1,5 9 12,25 2,25 81 5,25 31,5 13,5
2,8 0,7 6 7,84 0,49 36 1,96 16,8 4,2
3 1,1 7,5 9 1,21 56,25 3,3 22,5 8,25
3,3 1,2 8 10,89 1,44 64 3,96 26,4 9,6
4 2 7 16 4 49 8 28 14
3,7 2 8 13,69 4 64 7,4 29,6 16
21,6 8,8 49,5 71,36 13,48 366,25 30,26 160 66,75

Las medias y varianzas de cada una de las variables son:

1 N 21, 6 1 N 2 71,36
x1 = ∑
N i =1
x1i =
7
= 3, 0857 S12 = ∑
N i =1
x1i − x12 =
7
− 3, 0857 2 = 0, 6727

1 N 8,8 1 N
13, 48
x2 = ∑ x2 i = = 1, 2571 S 22 = ∑ x22i − x22 = − 1, 25712 = 0, 3454
N i =1 7 N i =1 7
1 N 49,5 1 N 366, 25
x3 = ∑ x3i = = 7, 0714 S32 = ∑ x32i − x32 = − 7, 07142 = 2, 3167
N i =1 7 N i =1 7

y las covarianzas son:

1 N 30, 26
S12 = ∑
N i =1
x1i x2i − x1 ⋅ x2 =
7
− 3, 0857 ⋅1, 2571 = 0, 4438

1 N 160
S13 = ∑ x1i x3i − x1 ⋅ x3 = − 3, 0857 ⋅ 7,0714 = 1, 0369
N i =1 7
1 N 66, 75
S 23 = ∑ x2i x3i − x2 ⋅ x3 = − 1, 2571⋅ 7, 0714 = 0, 6462
N i =1 7

Por tanto, la matriz de varianzas – covarianzas es:

5
Escuela de Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Curso 2006 - 2007

 0, 6727 0, 4438 1, 0369 


 
C =  0, 4438 0,3454 0,6462 
 1, 0369 0, 6462 2,3167 
 

b) La matriz de correlación viene dada por:

1 r12 r13 
 
R =  r12 1 r23 
r 1 
 13 r23
Sij
donde rij = es el coeficiente de correlación entre las variables X i y X j .
Si S j

S12 0, 4438
r12 = = = 0,9207
S1S 2 0,6727 0,3454
S 1, 0369
r13 = 13 = = 0,8306
S1S3 0,6727 2,3167
S 0, 6462
r23 = 23 = = 0, 7224
S2 S3 0,3454 2,3167

Por tanto, la matriz de correlación es:

 1 0,9207 0,8306 
 
R =  0,9207 1 0,7224 
 0,8306 0, 7224 1 

c) Tenemos que calcular el coeficiente de determinación entre X 1 y X 2 :

R122 = r122 = 0,9207 2 = 0,8477

Por tanto, el 84,77% de la varianza de X 1 está explicado por una función lineal de
X2 .

d) Tenemos que calcular el coeficiente de determinación entre X 1 y X 3 :

R132 = r132 = 0,8306 2 = 0,6899

Por tanto, el 68,99% de la varianza de X 1 está explicado por una función lineal de
X3 .

6
Escuela de Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Curso 2006 - 2007

e) Hay que determinar el plano de regresión de X 1 sobre X 2 , X 3 : x1* = a1 + b12 x2 + b13 x3 . Los
coeficientes de este plano de regresión vienen dados por:

C12 C13
b12 = − b13 = − a1 = x1 − b12 x2 − b13 x3
C11 C11

donde Cij es el adjunto del elemento (i, j ) en la matriz de varianzas – covarianzas.

0,3454 0,6462
C11 = = 0,3826
0, 6462 2,3167

0, 4438 0,6462 C12 −0,3581


C12 = − = −0, 3581 ⇒ b12 = − =− = 0, 9360
1, 0369 2, 3167 C11 0,3826

0, 4438 0,3454 C13 −0, 0714


C13 = = −0, 0714 ⇒ b13 = − =− = 0,1866
1, 0369 0, 6462 C11 0,3826

a1 = x1 − b12 x2 − b13 x3 = 3, 0857 − 0, 9360 ⋅1, 2571 − 0,1866 ⋅ 7, 0714 = 0,5895

Así, la ecuación del plano de regresión es: x1* = 0,5895 + 0,936 x2 + 0,1866 x3

f) El coeficiente de correlación múltiple entre X 1 y X 2 , X 3 es:

|C |
r1⋅23 = 1 −
S12C11

Para calcular el determinante de la matriz de varianzas – covarianzas, utilizamos los


adjuntos que hemos calculado anteriormente:

C = S12C11 + S12C12 + S13C13 =


= 0, 6727 ⋅ 0,3826 + 0, 4438 ⋅ (−0,3581) + 1, 0369 ⋅ (−0, 0714) =
= 0, 0244 ⇒ C = 0, 0244

Por tanto,
|C | 0, 0244
r1⋅23 = 1 − = 1− = 0,9514
2
S1 C11 0, 6727 ⋅ 0, 3826

El porcentaje de variación de X 1 explicado por el plano de regresión obtenido ante-


riormente lo obtenemos a partir del coeficiente de determinación múltiple R12⋅23 :

R12⋅23 = r1⋅223 = 0,9514 2 = 0,9052


7
Escuela de Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Curso 2006 - 2007

Por tanto, el 90,52% de la variación de X 1 está explicado por el plano de regresión de


de X 1 sobre X 2 , X 3 .

Obsérvese que si consideramos la recta de regresión de X 1 sobre X 2 , el coeficiente


de determinación de esta recta sería: R122 = 0,8477 , que es menor que R12⋅23 . Y, también,
que si consideramos la recta de regresión de X 1 sobre X 3 , el coeficiente de determina-
ción de esta recta sería: R132 = 0, 6899 , que también es menor que R12⋅23 .

g) Para estimar los beneficios de una empresa que destina 900.000 euros a publicidad y en
la que sus empleados realizan 500 horas extraordinarias al año, utilizamos el plano de re-
gresión obtenido anteriormente, haciendo x2 = 0,9 y x3 = 5 :

x1* = 0,5895 + 0,936 ⋅ 0,9 + 0,1866 ⋅ 5 = 2,3649

La estimación de los beneficios sería 2.364.900 euros.

h) El coeficiente de correlación parcial entre X 1 y X 2 lo podemos obtener mediante:

C12
r12⋅3 = −
C11C22
o bien, mediante
r12 − r13 ⋅ r23
r12⋅3 =
(1 − r132 )(1 − r232 )

Calculémoslo mediante la primera expresión. Tenemos que calcular C22 :

0, 6727 1, 0369 −0,3581


C22 = = 0, 4833 ⇒ r12⋅3 = − = 0,8328
1, 0369 2,3167 0,3826 ⋅ 0, 4833

Utilizando la segunda expresión, obtenemos el mismo resultado:

0, 9207 − 0,8306 ⋅ 0, 7224


r12⋅3 = = 0,8328
(1 − 0,83062 )(1 − 0,7224 2 )

El coeficiente de correlación parcial entre X 1 y X 3 viene dado por:

r13 − r12 ⋅ r23 0,8306 − 0,9207 ⋅ 0, 7224


r13⋅2 = = = 0, 6132
(1 − r )(1 − r )
2
12
2
23 (1 − 0,9207 2 )(1 − 0, 72242 )

8
Escuela de Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Curso 2006 - 2007

3) Se tienen datos de una determinada empresa, en los que se reflejan los precios (variable
X 1 ) de los cinco productos que se comercializan, así como el coste de los factores que
intervienen en la elaboración de estos productos. Dichos datos se reflejan en la siguiente
tabla:

Precio productos (103 ptas.) 14 24 25 45 47


Precio factores (103 ptas.) 15 16 15 12 10

Los datos reflejan que la política de precios de esta empresa está condicionada por
causas externas a la misma (precios de la competencia, impuestos, precios de promoción,
etc.).

a) A partir de estos datos, ¿se puede establecer una relación de tipo lineal que explique el
precio del producto en función del precio de los factores? Cuantifíquela.
b) Si la empresa piensa comercializar un producto en el que el coste de los factores es de
13000 ptas., ¿qué pronóstico haría usted para el precio de dicho producto?
c) Si aumentase el precio de los factores del producto de mayor precio un 1%, ¿qué va-
riación relativa experimentaría dicho precio?

Se tienen además datos sobre el beneficio (variable X 3 , en miles de pesetas) que han
proporcionado a la empresa las ventas de los cinco productos anteriores, a lo largo del úl-
timo año. Dichos datos son:

§ Beneficio medio: 73,2


§ x3* = 65,14 + 0, 26 x1
§ R132 = 0,9796
§ Covarianza entre X 2 y X 3 : −6,52
§ Determinante de la matriz de varianzas – covarianzas: 32,98

d) Construir el modelo lineal que explique los precios de los productos a partir de las
otras dos variables ( X 2 y X 3 ).

SOLUCIÓN:

a) Calculemos el coeficiente de correlación entre las variables X 1 y X 2 .

x1i x2i x1i2 x2i2 x1i x2 i 155 5631


x1 = = 31 S12 = − 312 = 165, 2
14 15 196 225 210 5 5
24 16 576 256 384
25 15 625 225 375 68 950
x2 = = 13, 6 S12 = − 13, 62 = 5, 04
45 12 2025 144 540 5 5
47 10 2209 100 470
155 68 5631 950 1979

9
Escuela de Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Curso 2006 - 2007

1979
S12 = − 31 ⋅13, 6 = −25,8
5
Por tanto, le coeficiente de correlación es:

S12 −25,8
r12 = = = −0,8941
S1S 2 165, 2 5, 04

Luego, se puede establecer una relación de tipo lineal que explique el precio del producto en
función del precio de los factores.

Calculemos la recta de regresión de X 1 sobre X 2 : x1* = a + bx2 .

S12 −25,8
b= = = −5,119 a = x1 − bx2 = 31 − (−5,119) ⋅13, 6 = 100, 619
S 22 5, 04

Luego la recta de regresión es: x1* = 100, 619 − 5,119 x2 , con un coeficiente de determina-
ción
R122 = r122 = 0, 7995

b) Hay que calcular la predicción de X 1 para x2 = 13 : x1* = 100, 619 − 5,119 ⋅ 13 = 34, 072 . Por
tanto, si el precio de los factores es de 13000 pesetas, el precio del producto es 34072 pese-
tas.

c) El producto de mayor precio es el que tiene un precio igual a 47, cuyo precio de los factores
es igual a 10. Tenemos que calcular la elasticidad en el punto x2 = 10 .

−5,119 ⋅10
Ex1|x2 =10 = = −1, 0356
100, 619 − 5,119 ⋅ 10

Bajaría el precio del producto un 1,0356%.


d) Ahora tenemos una tercera variable X 3 : beneficio en miles de pesetas. De esta variable sa-
bemos que x3 = 73, 2 y que S 23 = −6,52 . Además, como x3* = 65,14 + 0, 26 x1 , se tiene que:

S13 S13
0, 26 = ⇒ 0, 26 = ⇒ S13 = 42,952
S12 165, 2

Por otra parte, como R132 = 0,9796 , se tiene que:

S132 42,9522
0,9796 = 2 2 ⇒ 0,9796 = ⇒ S32 = 11, 4
S1 S3 165, 2 ⋅ S32

Por tanto, el vector de medias y la matriz de varianzas – covarianzas son:

10
Escuela de Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Curso 2006 - 2007

 31   165, 2 −25,8 42,952


M = 13, 6  C =  −25,8 5, 04 −6,52 
   
 73, 2   42,952 −6,52 11, 4 

Tenemos que construir el modelo lineal x1* = a1 + b12 x2 + b13 x3 :

Calculemos los coeficientes del plano de regresión.

5, 04 −6, 52 −25,8 −6,52


C11 = = 14, 9456 C12 = − = 14, 073
−6,52 11, 4 42,952 11, 4

−25,8 5,04
C13 = = −48, 2621
42, 952 −6,52

Por tanto, los coeficientes del plano de regresión son:

14, 073 −48, 2621


b12 = − = −0,9416 b13 = − = 3, 2292
14,9456 14,9456

a1 = 31 − 8 − (−0,9416) ⋅13, 6 − 3, 2292 ⋅ 73, 2 = −192,5703

y el plano de regresión es: x1* = −192,5703 − 0,9416 x2 + 3, 2292 x3 .

El coeficiente de determinación múltiple viene dado por:

C 
r12⋅23 = 1 −  32,98
S C11  ⇒ r12⋅23 = 1 −
2
= 0,9866

1
165, 2 14,9456
C = 32,98 

11

También podría gustarte