Está en la página 1de 11

Problemas Propuestos

1) Dado el modelo
= + + +
y los siguientes datos:

10 1 0
25 3 -1
32 4 0
43 5 1
58 7 -1
62 8 0
67 10 -1
71 10 2

a) Estime , y .

b) Calcule la suma de los cuadrados de los residuos.

c) Obtenga la varianza residual.

91,6500858

d) Obtenga la varianza explicada por la regresión. (gretl)

1658,17496
= suma de cuadrados / k
e) Obtenga la varianza de la variable endógena.

f) Calcule el coeficiente de determinación.

g) Obtenga una estimación insesgada de .

h) Estime la varianza de β 2 .

Variable X 1 6,62006078
2) Una empresa multinacional recopiló las utilidades, ingresos y los gastos en millones de
pesos anuales de una de sus sucursales en un determinado país. Los datos se presentan en
la siguiente tabla:

Año Gastos Ingresos Utilidades


2000 36 411 447
2001 32,4 420,6 453
2002 42 438 480
2003 44,4 451,2 495,6
2004 51,6 477,6 529,2
2005 48 526,8 574,8
2006 50,4 565,2 615,6
2007 52,8 579,6 632,4
2008 55,2 614,76 669,96
2009 57,6 672 729,6
2010 61,2 715,8 777

a) ¿Qué supuestos del modelo de regresión lineal se cumplen en este caso?


b) ¿Qué supuestos del modelo de regresión lineal múltiple se cumplen en este caso?
c) ¿Se podrá realizar alguna corrección y obtener algún modelo de regresión lineal de las
utilidades de esto?

3) La siguiente tabla presenta datos que obtuvieron en una compañía de cables telefónicos
entre los años 1970 y 1985 en un determinado país.

Construcción
Desempleo ( Ventas
Año PIB ( ) de viviendas
) anuales ( )
nuevas ( )

1970 1409,9 1600,7 2,7 6005


1971 1172,9 1899,7 2,5 7489
1972 1316,4 1327,9 6 8828
1973 958,6 1966,7 5,1 6870
1974 1331,2 2434,9 8,7 8392
1975 1649,1 2154 5 9373
1976 1567,9 1776 4,7 6780
1977 1344,4 1647,1 9,6 4109
1978 1673 1958 7,7 6871
1979 1198,8 1854,8 9,1 7061
1980 1699,3 2079,4 7,1 8925
1981 1816,7 1873,9 6 8680
1982 1448,8 1722 10,3 6575
1983 1593,4 1495 8,6 8291
1984 1706,2 1244,1 12,3 7620
1985 1622,4 1345 11,8 7370

El objetivo de esta empresa es determinar las ventas anuales de cables (en millones de
metros) a partir del siguiente modelo de regresión lineal múltiple:
= + + + +
a) Determine e interprete los coeficientes de este modelo.
b) Determinar qué supuestos se cumplen en este caso.
c) ¿Este modelo es significativo, considerando un nivel de confianza de 5%?
d) ¿Se puede eliminar alguna variable en este caso?

4) Se tiene el siguiente modelo de regresión lineal múltiple:


= 1,132 + 4,989 − 0,221 + 0,032 + 0,018
Donde:
= Sueldos promedio en un determinado país.
= Porcentaje de empleos vacantes respecto al total de personas no cesantes de dicho
país.
= PIB
=Precio de importaciones
=Precio de importaciones del año anterior.

Las desviaciones estándar de cada coeficiente son respectivamente: 0,812, 0,947, 0,141,
0,018 y 0,021. El valor de es 0,91 y ! es 14.

Con esta información:


a) Determine si los coeficientes estimados son estadísticamente significativos
individualmente.
b) ¿Se puede explicar por qué se incluye la variable y que además su coeficiente sea
negativo?
c) ¿Se puede desechar alguna de las variables de este modelo?

5) Se tiene la siguiente información respecto a pozos de exploración exportados en un


determinado país de medio oriente.
Pozos de
Precio por Producción PNB (miles
exploración
barril en nacional de millones
en miles
dólares ( ) ( ) de $) ( ")
()
4,99 22,84 4,58 587,6

14,05 25,92 7,99 590,52

13,35 26,61 4,36 633,52

16,78 22,47 3,11 676,55


16,41 24,36 6,25 698,64

16,23 24,45 4,32 721,86

10,13 24,6 4,9 713,7

19,92 22,53 4,11 754,74

17,11 24,54 5,1 768,85

13,68 24,69 5,62 781,1

17,26 26,6 4,03 779,53

15,2 27,23 8,08 820,46

13,8 27,15 9,11 836,87

6,09 21,11 8,33 855,41

15,88 21,04 8,45 899,12

8,67 27,01 7,7 930,76

10,84 21,06 9,87 974,35

8,52 21,8 5,31 1025,83

11,23 22,76 6,91 1081,04

12,95 20,67 9,74 1107,74

7,78 22,61 9,85 1151,84

14,76 24,54 12,19 1178,85

8,73 21,56 10,06 1175,3

12,02 23,48 6,93 1207,42

2,64 25,31 8,85 1271,1

6,56 23,77 7,35 1334,94

8,66 22,91 9,96 1317,91

10,3 26,04 7,83 1302,42

6,22 23,04 10,97 1370,94

10,99 27,13 4,98 1432,62

5,74 25,89 7,77 1485,19


Obs: La producción interna está en miles de millones de barriles.

Con esta información:


a) Determine el modelo de regresión lineal múltiple del respecto a las demás variables
b) Interprete cada coeficiente del modelo de regresión lineal múltiple
c) Determine el modelo de regresión lineal de respecto a cada variable por separado
d) De todos los modelos encontrados ¿cuál es el mejor? Justifique.

6) Utilizando los datos del ejercicio anterior


a) ¿Los coeficientes son estadísticamente significativos individualmente a un nivel de
confianza de 5%?
b) ¿Rechazaría o aceptaría la hipótesis de que = 0?

7) La siguiente tabla presenta el promedio de los sueldos semanales ( , en dólares), PIB (


) e IPC () de un país ficticio desde los años 1991 hasta el 2006
Año
1991 208,85 3131,68 69,75
1992 513,85 3868,80 81,57
1993 245,94 4354,77 72,88
1994 235,59 3322,27 123,03
1995 500,41 2750,87 110,47
1996 349,62 2894,90 162,31
1997 301,69 4398,19 59,97
1998 343,03 4714,77 113,43
1999 62,24 4555,31 7229,24
2000 145,63 4116,65 2780,67
2001 94,32 3528,71 7639,69
2002 260,76 2838,56 133,30
2003 97,19 3199,20 62,68
2004 125,88 2624,19 33,44
2005 201,76 4322,76 8,40
2006 352,74 4410,04 18,26

a) Determine el modelo de regresión lineal múltiple


= + + +
Donde es 0 si los valores son desde 1991 hasta 1998 y es 1 si los valores desde
1999 hasta 2006 e interprete los parámetros.
b) Determine la significancia estadística de cada parámetro con un nivel de confianza de
95% e interprete resultados.
c) Determine los modelos de regresión lineal del sueldo respecto a cada variable de la
tabla.
d) ¿Cuál es el mejor modelo para este caso? Argumente su respuesta
8) Se realiza una pequeña encuesta a personas que viven en localidades urbanas o rurales en
la zona centro del país. Los datos se aprecian en la siguiente tabla:
Años Sueldo (miles
Localidad
escolaridad de pesos)
10 995 Urbana
12 1397 Urbana
8 815 Urbana
12 1247 Urbana
9 1826 Urbana
6 1378 Urbana
5 900 Rural
4 298 Rural
6 625 Rural
4 494 Rural
5 674 Rural
5 119 Rural

a) Determine el modelo de regresión lineal que determina los años de escolaridad


respecto a las variables sueldos y localidad, para esto considere localidad urbana=0 y
localidad rural =1.
b) Determine el modelo de regresión lineal que determina los años de escolaridad
respecto al sueldo. ¿Cuál de los dos modelos es mejor?
c) Contraste las siguientes hipótesis:
- El sueldo no es una variable significativa
- La variable localidad no es una variable significativa.
d) Realice nuevamente los modelos solicitados en la parte a) y b) pero invirtiendo las
variables, es decir, determinar el modelo de regresión del sueldo respecto a las demás
variables (con localidad y sin localidad) y determine cuál de los dos modelos es mejor.

9) A continuación se presentan la tasa de pobreza y de desempleo de un determinado país.


Pobreza Desempleo Pobreza Desempleo
16 8,2 10,8 5,6
14 6,6 13,7 4,4
13 9,7 10,3 5,9
18,2 9,6 9,7 6,5
14,4 7,5 9,9 4,2
11 7,2 11,3 4
16,6 7 10,7 2,7
11,5 6,2 15,1 5,8
12 3,5 14,5 7
15,8 4,3 12,7 3,5
11,5 3,6 11,6 4,1
13,2 6,9 15,3 5,6
16,8 5,5 9,5 3,6
13,1 8,9 16,2 6,8
15,5 4,1 12,3 8,3

a) Si se considera el modelo de regresión lineal $ = + %+ , ¿existe correlación


serial?
b) Si se considera el modelo de regresión lineal $ =+ %+ $ + ¿existe
correlación serial?

10) De la información obtenida por una empresa se desea estimar un modelo de regresión
lineal que explique las utilidades respecto al número de trabajadores. Al analizar esta
información se obtuvieron los siguientes datos:
= 0,87

’(⋅( = 0,23
*

’+ − ,) = 5,12
*

¿Existe en este caso correlación serial?

11) Luego de analizar 25 datos se obtuvo el siguiente modelo de regresión:


. = 2,4 + 0,94 + 2,5

Además, / = 1,18 y el error estándar de cada coeficiente de la regresión es: 0,25, 0,21 y
0,39 respectivamente. En este caso, ¿existe correlación serial en la perturbación aleatoria?

12) Con los siguientes datos se crea un modelo de regresión lineal:


X Y
3 26
0 11
2 16
1 1
-3 8
-3 2
-2 2
Con dicho modelo se obtienen los siguientes residuos:
Residuos
( 7,68
( 0,80
( 0,39
(" -11,91
(0 5,92
(1 -0,08
(2 -2,79

Determine si existe o no correlación serial.

13) En un estudio de 20 datos se obtiene el siguiente modelo de regresión:


3 = 3,9 + 2,02 + 3,1
Por otro lado, usando los residuos de este modelo, se realizó el siguiente modelo de
regresión:
(4 = 0,65(
Analice la presencia de correlación serial.

14) De un análisis 25 datos en donde se analiza la demanda (%) respecto al precio ($) y la
renta ( ), se obtiene el siguiente modelo de regresión:
%3 = 450,5 + 0,615 − 20,8$ + 0,4%
Con / = 2,1 y las desviaciones estándar de cada coeficiente es 310,84, 0,024, 18,9 y 0,02
respectivamente.
¿Existe correlación serial en este caso?

15) Se realiza una regresión lineal del sueldo promedio () respecto al número de trabajadores
() de una muestra aleatoria de 40 empresas. El modelo de regresión es:
= 6,8 + 0,012
Con error estándar del coeficiente de 17.02 y = 0,93.
Luego la oficina de investigación realiza con los mismos datos un nuevo modelo de
regresión:
1
= 0,006 + 8.2 7 8
Con error estándar del coeficiente igual a 57,32 = 0,98 y 9 =
13,27. a) Interprete ambas regresiones
b) ¿Por qué la oficina de investigación realizó el nuevo modelo de regresión? Hint: Revise
la heteroscedasticidad.
c) ¿Se puede comparar los valores de de ambos modelos? ¿Por qué?

16) Se analizan 25 datos obteniendo el siguiente modelo de regresión de la demanda anual:


%= + + $ +
Si se utilizan los primeros 10 datos se obtiene el siguiente modelo de regresión:
% = 75,46 + 0.81 − 0,93$
Con la suma de los cuadrados de los residuos igual a 123,2. Si se utilizan los
últimos 10 datos se obtiene el siguiente modelo de regresión:
% = 22,72 + 0,45 − 0,2$
Con la suma de los cuadrados de los residuos igual a 501,22. También
se tiene la siguiente información:
1
( = 6,02 − 631,44
Con la suma de los cuadrados de los residuos igual a 302,7.
1
( =
12,4

722,9
8
:
Con la suma de los cuadrados de los residuos igual a 305,6.
Con esta información, determine la existencia de heteroscedasticidad, en caso de que
exista, ¿Cuál es la forma más adecuada para solucionar esto?

17) Una empresa crea un modelo de regresión de las ventas respecto al precio. Ordenando los
datos se tienen dos modelos de regresión lineal:
4 = 1,6 + 0,9;
Con < = 1,2, … , 10 y ∑* ( = 241.

4 = 1,6 + 0,9;
Con < = 16,17, … , 25 y ∑0* 1 ( = 44581.
Con esta información, determine la existencia de heteroscedasticidad, en caso de que
exista, ¿Cuál es la forma más adecuada para solucionar esto?

18) Considerando el modelo:


=? +? +
= + + +
y además los productos cruzados:
.

2,8 5 2 1 1
3 5 2 5 1
3 0 2 0 0
2 5 0 2 1
3 3 1 0 0

a) Identifique cada uno de las ecuaciones del modelo.


b) Estime la forma reducida.
c) Estime los parámetros utilizando método de mínimos cuadrados ordinarios, mínimos
cuadrados indirectos o mínimos cuadrados en dos etapas y explique el por qué se
eligió ese método.

19) Considerando el modelo:


@=AB+A +
B = A @ + A" + A0C + D
Se sabe:
3 5 70 2 7
+@B) +@B) = E F, +GC) +GC) = E F, +GC) +@B) = E F
5 3 0 3 5 3
a) Determinar los coeficientes de los modelos usando distintos métodos y explique el
por qué usar cada uno.
b) Si B = 3 determine una predicción para @ .
c) Si @ = 4 y C = 7 determine una predicción para B .

20) Se desea realizar un estudio del gasto en educación respecto al PIB de 20 países, para eso
se desea realizar un modelo de regresión lineal de la forma:
=? +? +
considerando los siguientes datos:
EDUC PIB EDUC PIB
210,8 15310 729,35 39196,8
450,92 16943,9 2021,84 44340,8
233,22 16140,2 2565,16 44546,3
543,25 18294,3 2058,76 44898,3
787,84 15880,5 1401,63 47591,5
883,09 17239,7 1752,41 52498
443,06 19793,3 1393,21 53263,7
571,39 18978,6 3189,89 54735,1
1300,74 23482,4 2882,16 54958,2
1472,46 34493 2892,96 61785,7

a) Determine los coeficientes del modelo de regresión lineal y los residuos


b) ¿Los residuos están normalmente distribuidos? (utilice H = 0,05)
c) ¿Cuáles son las consecuencias en la estimación del modelo si no se cumple la
normalidad de los errores?

También podría gustarte