Está en la página 1de 23

PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

PRÁCTICA 9

INTRODUCCIÓN A LA ESTADÍSTICA

Facultad de Ciencias Económicas y de Administración


Universidad de la República

1. Ross - 3.7 Ej.3 pág 130


Los datos siguientes representan las puntuaciones obtenidas en un test de inteligencia (IQ) por
10 madres y sus respectivas hijas mayores.

Puntuaciones de las madres Puntuaciones de las hijas


135 121
127 131
124 112
120 115
115 99
112 118
104 106
96 89
94 92
85 90

(a) Dibuje un diagrama de dispersión.

(b) Haga una conjetura sobre el valor del coeficiente de correlación muestral r.

(c) Calcule en valor de r.

(d) ¿Qué conclusiones se pueden extraer acerca de la relación entre las puntuaciones de las
madres y las de las hijas?

2. Ross - 12.2 Ej. 1 pág. 529 modificado.


Los siguientes 12 pares de datos relacionan y, el porcentaje de producto resultante en un expe-
rimento de laboratorio, con x, la temperatura a la cual se llevó a cabo el experimento.

i xi yi i xi yi
1 100 45 7 150 69
2 110 51 8 160 74
3 120 54 9 170 78
4 125 53 10 180 86
5 130 59 11 190 89
6 140 63 12 200 94

Se pide:

1
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

(a) Represente estos datos en un diagrama de dispersión.

(b) ¿Cree que el modelo de regresión simple es apropiado para describir la relación existente
entre el porcentaje del producto y la temperatura?

(c) Dibuje a mano una recta que se ajuste a los datos.

(d) Determine la recta de regresión estimada y compárela con la recta dibujada en el apartado
anterior.

3. Ross - 12.3 Ej. 5 pág. 537


A continuación se muestra el consumo anual de productos derivados del pollo (en millones de
libras) en Estados Unidos, entre los años 1995 y 2002:

25,9 26,8 27,3 27,8 29,6 30,5 30,8 32,6

Se pide:

(a) Con el año como variable de entrada y el consumo como variable de respuesta, dibuje un
diagrama de dispersión.

(b) Calcule la recta de regresión estimada.

(c) Dibuje la recta de regresión estimada sobre el diagrama de dispersión.

(d) Haga una predicción del consumo correspondiente al año 1994.

(e) Haga una predicción del consumo del año 2004.

4. Ross - 12.3 Ej. 7 pág. 538


Los datos siguientes relacionan las producciones mundiales de pulpa de madera y de prensa
escrita en siete años diferentes. Los datos provienen de la Oficina de Estadı́stica de las Nacio-
nes Unidas, Nueva York, Boletı́n Mensual de Estadı́stica, y aparecen en millones de toneladas
métricas.

Pulpa de madera Prensa escrita


124,4 25,4
131,3 27,8
133,1 28,3
136,6 29,3
142,0 30,6
150,1 32,3
150,3 33,1

Se pide:

(a) Si la producción de pulpa de madera es la variable de entrada, encuentre la recta de regresión


estimada.

(b) Haga una predicción de la producción de prensa escrita en un año en que se produjeron
146,0 millones de toneladas métricas de pulpa de madera.

2
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

(c) Si la producción de prensa escrita es la variable de entrada, encuentre la recta de regresión


estimada.

(d) Pronostique la producción mundial de pulpa de madera en un año en el que la producción


de prensa escrita fue de 32,0 millones de toneladas métricas.

5. Ross - 12.4 Ej. 3 pág. 544


Los datos siguientes relacionan la velocidad de las pulsaciones sobre un teclado de una secre-
taria particular con la temperatura de su oficina. Las unidades de velocidad de pulsaciones y
temperatura se dan, respectivamente, en palabras por minuto y en grados Fahrenheit.

Temperatura Velocidad de pulsaciones


50 63
60 74
70 79

(a) Calcule a mano el valor de SSR .

(b) Estime σ 2 .

(c) Si la temperatura se ha fijado en 65 grados, ¿qué velocidad de pulsaciones se puede predecir?

6. Ross - 12.4 Ej. 8 pág. 545


Con los datos que relacionaban las edades a la que 25 padres (x ) y sus respectivos hijos (Y )
empezaron a afeitarse, se obtuvieron los siguientes estadı́sticos de resumen:

x̄ = 13, 9 ȳ = 14, 6
Sxx = 46, 8 Syy = 53, 3 Sxy = 12, 2


Sugerencia: Recordar que en el modelo simple |r| = R2 .

(a) Determine la recta de regresión estimada.

(b) Si el padre de un muchacho se afeitó por primera vez a la edad de 15,1 años, pronostique la
edad a la que comenzó a afeitarse su hijo.

(c) Estime σ 2 .

3
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

7.
(a) Contraste la hipótesis H0 )β = 0 versus H1 )β 6= 0 para los siguientes datos:

xi yi
64 111
65 114
66 108
67 123
69 97
70 116
72 125
72 108
74 142
74 122
75 110
76 134

Utilice un nivel de significación del 5 %.

(b) Obtenga un intervalo de confianza al 95 % para el coeficiente de la variable de entrada.

8. Ross - 12.8 Ej. 1 pág. 569 - modificado


Una empresa inmobiliaria recogió la siguiente información relativa a los precios de venta de casas
con tres dormitorios en un determinado barrio y a los tamaños de dichas casas. Las superficies
habitables vienen dadas en unidades de 1000 pies cuadrados, mientras que los precios de venta
están en unidades de 1000 dólares.

Superficie habitable Precio de venta


2,3 240
1,8 212
2,6 253
3,0 280
2,4 248
2,3 232
2,7 260

Se pide:

(a) Dibuje los datos en un diagrama de dispersión.

(b) Determine la recta de regresión estimada.

(c) Interprete el valor estimado para β, B.

(d) ¿Qué porcentaje del precio de venta viene explicado por la superficie habitable?

4
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

9. Ross - 12.8 Ej. 6 pág. 570


A un comerciante de coches nuevos le interesa encontrar la relación existente entre el número
de vendedores que trabajan durante el fin de semana y el número de coches vendidos. Los datos
siguientes se recogieron durante seis domingos consecutivos.

Número de vendedores Número de coches vendidos


5 22
7 20
4 15
2 9
4 17
8 25

Se pide:

(a) Determine la recta de regresión estimada.

(b) ¿Cuál es el coeficiente de determinación?

(c) ¿Qué parte de la variación en el número de coches vendidos se explica por el número de
vendedores?

(d) Contraste la hipótesis nula de que el número medio de ventas no depende del número de
vendedores.

(e) Obtenga un intervalo de confianza al 99 % para la variable de entrada.

10. Ross - 12.9 Ej. 3 pág. 572


Encuentre el coeficiente de correlación muestral si el coeficiente de determinación y la recta de
regresión estimada son:

(a) R2 = 0, 64 , ŷ = 2x + 4

(b) R2 = 0, 64 , ŷ = 2x − 4

(c) R2 = 0, 64 , ŷ = −2x + 4

(d) R2 = 0, 64 , ŷ = −2x − 4

5
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

11.
Se desea estimar una relación lineal que vincule el consumo privado (CP) como una función del
Producto Interno Bruto (PIB) a lo largo del perı́odo 1970-1985. A esos efectos se ha sacado la
siguiente información del Banco Central del Uruguay:

AÑOS CP PIB
1970 21.972 25.857
1971 22.118 25.888
1972 22.281 25.486
1973 22.382 25.579
1974 21.986 26.383
1975 22.758 27.930
1976 22.239 29.043
1977 22.158 29.384
1978 22.919 30.930
1979 24.163 32.838
1980 26.232 34.808
1981 26.854 35.469
1982 24.257 32.138
1983 21.926 30.257
1984 20.556 29.532
1985 20.764 29.738

Se pide:

(a) Estimar el modelo lineal simple: CPt = α + βP IBt + et por mı́nimos cuadrados.

(b) Estimar la varianza de los errores aleatorios (σ 2 ).

(c) Calcular e interpretar el coeficiente de determinación (R2 ).

(d) Observar la siguiente salida de la opción de regresión de planillas electrónicas aplicada a


este problema en particular. Identificar los elementos que se han estudiado en el curso.

6
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

Resumen
Estadı́sticas de la regresión
Coeficiente de correlación múltiple 0,7413
Coeficiente de determinación R2 0,5495
R2 ajustado 0,5174
Error tı́pico 1204,6721
Observaciones 16

ANÁLISIS DE VARIANZA

Grados de Suma de cua- Promedio de F Valor crı́tico


libertad drados cuadrados de F
Regresión 1 24785200,0608 24785200,0608 17,0787 0,0010
Residuos 14 20317288,3767 1451234,8840
Total 15 45102488,4375

Coeficientes Error tı́pi- Estadı́stico Probabilidad Inferior Superior


co t 95 % 95 %
Intercepción 11060,5 2868,1136 3,8564 0,0017 4908,97 17211,96
PIB 0,4002 0,0968 4,1326 0,0010 0,1925 0,6079

12.
Se considera el siguiente modelo que relaciona el gasto en educación (G) con la renta disponible
(r ): Gi = α + βri + ei .
De la información obtenida para 10 familias, se ha obtenido la siguiente información:

ḡ = 7 r̄ = 50
P10 2
P10 2
P10
i=1 ri = 30650 i=1 gi = 622 i=1 ri gi = 4345

Se pide:

(a) Calcular los coeficientes del modelo estimado.

(b) Interpretar la estimación del coeficiente β.

(c) Calcular el coeficiente de determinación del modelo. Interpretar el resultado.

(d) Estimar la varianza de los errores.

7
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

13.
Se considera el siguiente conjunto de datos a los efectos de estimar los parámetros del modelo
de regresión lineal simple Yi = α + βxi + ei para i=1,...,6.

x y
1 10,2
1 7,8
3 8,2
3 5,8
5 6,2
5 3,8

La representación gráfica de dichos datos y la recta de regresión lineal aparece en la gráfica


siguiente (diagrama de dispersión).

Resumen
Estadı́sticas de la regresión
Coeficiente de determinación R2 0,649

Error tı́pico 1,470


Observaciones 6

ANÁLISIS DE VARIANZA

Grados de li- Suma de cua- Promedio de cua- F


bertad drados drados
Regresión 1 16 16 7,4074
Residuos 4 8,64 2,16
Total 5 24,64

Coeficientes Error tı́pico Estadı́stico t Valor-p


Intercepción 10 1,2550 7.9682 0,0013
Variable X1 -1 0,3674 -2.7217 0,0529

8
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

Se pide:
(a) Calcular el coeficiente de correlación lineal muestral (r), entre x e y.
(b) ¿Qué porcentaje de la variación total de la variable Y es explicada por el modelo?.
(c) ¿Es la variable x significativa para explicar y al 5 % de significación? ¿Y al 10 % de signifi-
cación?
(d) Construya un intervalo de confianza al 95 % para β.

14.
Usando el archivo: Tabla Ej 14 Practico Regresion.xls disponible en EVA, en el que se tienen los
valores de renta per cápita en dólares en 2002, y las tasas de natalidad por cada 1000 habitantes
para estados de Estados Unidos. Se quiere explicar la tasa de natalidad por cada 1000 habitantes
en función de la renta per cápita. Responda a las siguientes preguntas en base a los resultados
que produce una salida de la función regresión de una planilla electrónica.

Se pide:
(a) ¿Cuál es la recta de regresión estimada?
(b) ¿Qué interpretación tiene B en este problema?
(c) Determine el coeficiente de determinación para este problema e interprete su significado.
(d) La renta per cápita, es significativa a un nivel del 1 % para explicar la tasa de natalidad?
(e) Obtenga el intervalo de confianza al 95 % para el coeficiente de la renta per cápita e interprete
el resultado.

15.
Una empresa de ómnibus utiliza el siguiente modelo lineal para explicar los costos de reparación
y mantenimiento de sus unidades:

COST OSi = α + β1 KM V IAJi + β2 EDADi + ei .

COST OSi = Total de costos anuales de reparación y mantenimiento del i-ésimo vehı́culo.
KM V IAJi = miles de kilómetros viajados por el i-ésimo vehı́culo.
EDADi = Antigüedad en años del i-ésimo vehı́culo.

Procesados los datos en una planilla electrónica se obtiene la siguiente salida:

Resumen
Estadı́sticas de la regresión
Coeficiente de correlación múltiple 0,901241
Coeficiente de determinación R2 0,812237
R2 ajustado 0,780943
Error tı́pico XXX
Observaciones XXX

9
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

ANÁLISIS DE VARIANZA

Grados de Suma de cua- Promedio de F Valor crı́tico


libertad drados cuadrados de F
Regresión XXX XXX XXX 25,95512 0,000
Residuos XXX 32785,31 XXX
Total 14 XXX

Coeficientes Error tı́pico Estadı́stico t Probabilidad


Intercepción 108,91501 73,27075 XXX 0,030
Variable X1 26,678791 3,7041353 XXX 0,00
Variable X2 71,130916 XXX 3,7363434 0,003

Se pide:

(a) Completar la salida calculando los datos faltantes.

(b) ¿Cómo interpreta el valor de los Bi obtenidos?.

(c) Analizar la significación del modelo.

(d) El gerente de la empresa afirma que los kilómetros viajados no influyen significativamente
en los costos. ¿Qué comentario le merece esta afirmación, ¿Serı́a pertinente excluir alguna
de las variables incluidas?.

10
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

16. EJERCICIOS PLANTEADOS EN PRUEBAS DE EVA-


LUACIÓN
16.1. SEGUNDO PARCIAL 2014 - VERSIÓN 1 - ENUNCIADO 5
Para estudiar si la polı́tica de descuentos sobre la compra en efectivo de un producto afecta
las cantidades vendidas, una empresa decide estimar un modelo de regresión lineal con los
descuentos (medidos como porcentaje sobre el precio de lista) y las cantidades vendidas del
producto. El modelo planteado es el siguiente: V tai = α + βDtoi + ei . Para ajustar el modelo
toma los datos de 30 dias que sortea del año 2014. Se sabe que:
30 30
V ta2i = 757883
P P
V tai = 4611
i=1 i=1

30 30
Dto2i = 8037
P P
Dtoi = 429
i=1 i=1

30
P
V tai ∗ Dtoi = 75234
i=1

PREGUNTAS:

1. Realizando los cálculos necesarios con 3 cifras decimales, la estimación de α es:

(A) 4,887. (B) 83,816. (C) 19,838.

2. Con un 95 % de confianza, se estima que, por cada punto porcentual adicional de descuento
realizado, las ventas promedio del producto aumentarán, aproximadamente, entre:

(A) 4,3 y 5,4 unidades.


(B) 83,3 y 84,4 unidades.
(C) 8,8 y 9,9 unidades.

3. La proporción de la variabilidad de las ventas del producto explicada por la polı́tica de


descuentos es:

(A) 0,924. (B) 0,076. (C) 0,961.

4. De acuerdo a la notación utilizada en el curso, la variabilidad de las ventas explicada por


el modelo es:

(A) Syy . (B) SSR . (C) Syy − SSR .

11
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

16.2. EXAMEN FEBRERO DE 2015 - VERSIÓN 1 - ENUNCIADO 6


Se analiza un conjunto de datos al que se ajustó un modelo de regresión lineal simple,
resultando la siguiente salida:

ESTADÍSTICAS DE LA REGRESIÓN
Coeficiente de correlación múltiple
Coeficiente de determinación R2
R2 ajustado
Error tı́pico 0,5110855017
Observaciones

ANÁLISIS DE VARIANZA

Gr. de lib. Suma de cuadrados Prom. de los cuadrados F Valor crı́tico de F


Regresión 1 28,35821542 28,35821542 108,5654857 2,53911E-06
Residuos
Total 10

Coeficiente Error tı́pico Estadı́stico t Probabilidad


Intercepción 2,385382064 0,424711145 5,616480965 0,0003273
Variable X1 0,041779869 10,41947627 2,53911E-06

PREGUNTAS:

1. El coeficiente de determinación es:

(A) 0,96096146.
(B) 0,92344692.
(C) 0,5110855.

2. El valor estimado del coeficiente que multiplica a x es:

(A) 0,4353243505.
(B) 0,340811721.
(C) 2,385382064.

12
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

16.3. EXAMEN 26 DE FEBRERO DE 2015 - VERSIÓN 1 - ENUNCIADO 5


Un investigador sostiene que existe una relación lineal entre la unidad indexada (U I) y el
tipo de cambio del dólar (Dolar). El modelo planteado es el siguiente: U Ii = α + β ∗ Dolari + ei .
Para ajustar el modelo toma los datos de los dı́as hábiles del primer semestre de 2014 (118 dı́as).
Se brinda la salida de excel de la función regresión lineal con los datos referidos. Se sabe además
que el valor promedio del primer semestre de 2014 para la Unidad indexada es 2,80525508 y
para el tipo de cambio es 22,7877119.

ANÁLISIS DE VARIANZA
Gr. de lib. Suma de cuadrados Prom. de los cuadrados F Valor crı́tico de F
Regresión 339,0645841 3,17503E-36
Residuos 0,074822573
Total 0,293526752

Coeficiente Error tı́pico Estadı́stico t Probabilidad


Intercepción 0,106062205 8,48935E-13
Variable X1 0,085683186 18,41370642 3,17503E-36

PREGUNTAS:

1. La estimación insesgada del desvı́o de los errores es igual a (aproxime su resultado a 4


cifras decimales):

(A) 0, 0254. (B) 0, 0253. (C) 0, 0252.

2. La suma de cuadrados de la regresión es igual a (no realice aproximaciones en sus cálculos):

(A) 0, 218704179.
(B) 0, 216834911.
(C) 0, 214997327.

3. La estimación del parámetro α es igual a (no realice aproximaciones en sus cálculos):

(A) 0, 8527313228.
(B) 22, 54734871.
(C) 4, 757778837.

4. La proporción de variabilidad de la variable de respuesta explicada por el modelo es igual


a (aproxime su resultado a 3 cifras decimales):

(A) 0, 745. (B) 0, 655. (C) 0, 652.

5. Si el dólar está a $26, la predicción del valor de la UI según el modelo es (no realice
aproximaciones en sus cálculos):

(A) 3, 080494159.
(B) 2, 80525508.
(C) 2, 912354114.

13
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

16.4. EXAMEN 1 DE AGOSTO DE 2015 - VERSIÓN 1 - ENUNCIADO 3


Una empresa inmobiliaria considera que el precio de los alquileres de las casas en cierta zona
(variable Y ) depende del precio de venta de dichas viviendas (variable x). En base a un conjunto
de datos se ajusta un modelo de regresión lineal para el que se obtienen los siguientes resultados:

ŷ = 86, 97 + 0, 0054x R2 = 0, 8774.

PREGUNTAS:

1. El coeficiente de correlación lineal muestral es:



(A) 0, 8774.
(B) 1.

(C) − 0, 8774.

2. Se cumple una de las siguientes relaciones:

(A) ȳ = 86, 97 + 0, 0054x̄.


(B) Syy < SSR .
(C) Sxy = 86, 97Sxx .

3. La primera observación de la muestra mostró un precio de alquiler de 500 y un precio de


venta de 80000. Entonces su residuo es:

(A) mayor a 0. (B) igual a 0. (C) menor a 0.

14
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

16.5. EXAMEN 1 DE AGOSTO DE 2015 - VERSIÓN 1 - ENUNCIADO 4


Una empresa desea poder relacionar mediante un modelo lineal el dinero invertido en cada
cliente para analizar sus preferencias con el monto de las ventas que hace a cada uno de ellos en
el año posterior al análisis de preferencias. Para ello cuenta con los siguientes datos:

Ventas (y) Dinero invertido (x)


1000 53
1200 60
1100 70
1250 73
800 40
850 42

PREGUNTAS:

1. El modelo estimado es ŷ = A + Bx donde:

(A) 300 ≤ A ≤ 400 y 10 ≤ B ≤ 15.


(B) 10 ≤ A ≤ 15 y 300 ≤ B ≤ 400.
(C) A y B no pueden ser determinados porque la cantidad de observaciones es insuficiente.

2. El valor estimado de la varianza de la variable aleatoria de error es:

(A) mayor que 6000.


(B) mayor que 4000 y menor que 5000.
(C) menor que 3000.

3. La variabilidad de las ventas es explicada por el dinero invertido en cada cliente en un


porcentaje:

(A) mayor a 80 % y menor que 90 %.


(B) menor a 20 %.
(C) mayor que 90 %.

15
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

16.6. SEGUNDO PARCIAL 2015 - VERSIÓN 1 - ENUNCIADO 3


Se obtuvo una muestra de 12 establecimientos agropecuarios y, en referencia al mismo
perı́odo, se registró la inversión realizada y el rendimiento neto obtenido (ambas en miles de
U$S). Se ajustó un modelo de regresión lineal para explicar el rendimiento neto obtenido en
función de la inversión realizada, obteniéndose los siguientes resultados:

ŷ = 0, 1696 + 0, 3218x rxy = 0, 6891


P12 P12 2
Además se sabe que: i=1 xi = 205 y i=1 xi = 3817.
PREGUNTAS:

1. Sólo uno de los siguientes conjuntos de desigualdades es correcto, ¿cuál es?

(A) Sxx > Syy y x̄ > ȳ.


(B) Sxx > Syy y x̄ < ȳ.
(C) Sxx < Syy y x̄ > ȳ.

2. El porcentaje (aproximando a 2 decimales) de la variación total del rendimiento neto


obtenido explicado por la variación de la inversión es:

(A) 47,49. (B) 68,91. (C) 32,18.

3. Para la sexta observación de la muestra, que es el par x6 = 18


e y6 = 3, el modelo:

(A) sobreestima el valor del rendimiento en 2962 dólares.


(B) subestima el valor del rendimiento en 2962 dólares.
(C) no presenta error al estimar el rendimiento neto obtenido.

16
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

16.7. SEGUNDO PARCIAL 2014 - VERSIÓN 1 - ENUNCIADO 5


Se presenta la salida obtenida en Excel al postular un modelo de regresión lineal simple para
explicar el puntaje final que obtuvieron los estudiantes del curso de Introducción a la Estadı́stica
del año 2014 (variable Y ), en función del puntaje que obtuvieron los estudiantes en el primer
parcial (variable x). Se consideraron todos los estudiantes que llegaron a obtener el mı́nimo en
el primer parcial (sacaron 15 o más puntos).

Gr. de lib. Suma de cuadrados Prom. de los cuadrados F Valor crı́tico de F


Regresión 1 296246 296246 2736 0
Residuos 1562 169108 108
Total 1563 465355

Coef. Error tı́pico Estadı́stico t Probabilidad Inferior 95 Superior 95


Intercepción 8,494 0,947 8,968 8,44164E-19 6,64 10,35
Variable x 1,724 0,033 52,31 0 1,66 1,79

PREGUNTAS:

1. Bajo los supuestos establecidos en el curso resulta:

(A) V (Yi ) = α + βxi + σ 2 .


(B) V (Yi ) = α + βxi .
(C) V (Yi ) = σ 2 .

2. El modelo resultó:

(A) no significativo porque el p − V alor del contraste es 8,44164.


(B) significativo para cualquier nivel de significación razonable.
(C) significativo al 10 % pero no al 5 %.

3. La estimación puntual de la desviación tı́pica de los errores del modelo es igual a:

(A) 108. (B) 0,033. (C) 10,3923.

4. Basándose en la estimación de la pendiente de la recta de regresión se puede afirmar que:

(A) Se estima que, por cada punto adicional que logre obtener un estudiante en el primer
parcial, logrará un incremento promedio de 1,724 puntos en el puntaje final del curso.
(B) Se estima que, por cada punto adicional que logre obtener un estudiante en el primer
parcial, logrará un incremento de 1,724 puntos en el puntaje final del curso.
(C) Como el puntaje es una variable que solo puede tomar números naturales, se estima
que el impacto esperado de un punto adicional en el primer parcial serı́a de 2 puntos
sobre el puntaje final del curso.

5. Para la misma muestra, si se calcula el intervalo de confianza al 99 % para el coeficiente


angular de la recta de regresión que denotamos (k1 ; k2 ), entonces:

(A) k1 < 1, 66 y k2 > 1, 79.


(B) k1 > 1, 66 y k2 < 1, 79.
(C) k1 < 6, 64 y k2 > 10, 35.

17
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

16.8. EXAMEN 2 DE FEBRERO 2016 - VERSIÓN 1 - ENUNCIADO 1


Una PYME comenzó a invertir en publicidad de su producto y ha registrado los siguientes
resultados:

Mes Gasto (u.m.) Ingreso (u.m.)


Octubre 2015 10 245
Noviembre 2015 7,5 205
Diciembre 2015 12 250
Enero 2016 15 285

Para analizar la relación de ambas variables se plantea un modelo de regresión lineal Ingresoi =
α+βGastoi +ei para cada mes i. Todos los supuestos teóricos habituales del modelo son válidos.

PREGUNTAS: (no realice aproximaciones en los cálculos)

1. El coeficiente de correlación lineal muestral es:

(A) 0,95346238.
(B) 0,97645398.
(C) 1.

2. En febrero 2016 se hace un gasto de 20 u.m. en publicidad. El modelo estima que el ingreso
promedio para dicho mes será:

(A) mayor a 330 u.m.


(B) menor a 330 u.m. pero mayor a 285 u.m.
(C) menor a 285 u.m.

3. El intervalo de confianza para β al 95 % es (aproximando los resultados finales a 2 deci-


males):

(A) (3,31 ; 16,86).


(B) (5,07 ; 15,09).
(C) (5,48 ; 14,68).

18
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

16.9. EXAMEN 23 DE FEBRERO 2016 - VERSIÓN 1 - ENUNCIADO 5


Considere un modelo de regresión lineal simple, yi = α + βxi + ei .
PREGUNTAS:

1. En los datos adjuntos se dispone de una salida que resulta de ajustar el modelo del enun-
ciado a cierto conjunto de datos. Teniendo en cuenta esa información se concluye que el
modelo es significativo al 5 % porque en el contraste de hipótesis que permite concluirlo:

(A) el valor del estadı́stico de contraste es menor que 0, 05.


(B) el p − valor es mayor que 0, 05.
(C) el valor del estadı́stico de contraste está contenido en la región crı́tica.

2. En los datos adjuntos se dispone de una salida que resulta de ajustar el modelo del enun-
ciado a cierto conjunto de datos. Teniendo en cuenta esa información se concluye que la
correlación lineal muestral entre x e y es aproximadamente:

(A) 0,8852. (B) 0,7835. (C) -0,8852.

3. En el contexto del enunciado, sólo una de las siguientes afirmaciones es correcta. ¿Cuál es?

(A) El valor del coeficiente de correlación lineal muestral entre x e y será tanto más
próximo a 1 cuanto más lejana de 0 sea la estimación puntual de β.
(B) Si las variables x e y tienen correlación lineal muestral igual a 0 la estimación puntual
de β es 0.
(C) Para que una nube de puntos sugiera una relación estadı́stica linealmente positiva
entre x e y ella debe tener todos sus puntos sobre una recta creciente.

4. En el contexto del enunciado, sólo una de las siguientes afirmaciones es correcta. ¿Cuál es?

(A) El método de mı́nimos cuadrados consiste en identificar los estimadores de α y β que


minimizan el R2 del modelo.
(B) El porcentaje de variación de la variable dependiente que no es explicado por el modelo
de regresión lineal es igual al cuadrado del coeficiente de correlación lineal muestral
entre x e y.
(C) Si el coeficiente de correlación lineal muestral entre x e y no es nulo, el coeficiente de
determinación del modelo será siempre positivo cualquiera sea el signo de la pendiente
de la recta estimada.

19
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

DATOS ADJUNTOS

Estadı́sticas de la regresión
Coeficiente de correlación múltiple 0,8852
Coeficiente de determinación 0,7835
R2 ajustado 0,7474
Error tı́pico 5,4006
Observaciones 8
Análisis de Varianza
Gr. de lib. Suma de cuadrados Prom. de los cuadrados F Valor crı́tico de F
Regresión 1 633,242 633,242 21,711 0,00347
Residuos 6 175,000 29,167
Total 7 808,242

Coef. Error tı́pico Estadı́stico t Probabilidad


Intercepción 5,93118 4,17721 1,41989 0,20545
Variable x -2,71551 0,58279 -4,65952 0,00347

20
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

16.10. SEGUNDO PARCIAL 2014 - VERSIÓN 1 - ENUNCIADO 4


Una empresa de Uruguay exporta plástico a Argentina. Se dispone de datos sobre el ingreso
por habitante en dólares del paı́s vecino (X1 ), la exportación de plástico medida en toneladas
(X2 ) y la utilidad neta anual de la empresa medida en miles de dólares (y). Con ello se estimó
un modelo de regresión para explicar la variable (y) en función de las variables X1 y X2 . Los
resultados obtenidos se presentan en las siguientes tablas (algunos se han perdido):

Gr. de lib. Suma de cuadrados Prom. de los cuadrados F Valor crı́tico de F


Regresión 2 113.758,44 56.879,22 62,28 1,32617E-05
Residuos 8 7.305,76 913,22
Total 10 121.064,21

Coef. Error tı́pico Estadı́stico t Prob. Inferior 95 Superior 95


Intercepción 110,59 53,30 2,07 0,072 -12,32 233,50
Vble. X1 -22,47 19,71 -1,14 0,287 -67,92 22,98
Vble. X2 8,93 4,17

PARTE I
PREGUNTAS:

1. El tamaño de la muestra es:

(A) n = 8. (B) n = 10. (C) n = 11.

2. Si se realiza el contraste de significación del modelo al 10 % de significación se concluye


que:

(A) el modelo es significativo porque el p − V alor del contraste es 0,072.


(B) el modelo no es significativo porque el p − V alor del contraste es 0,287.
(C) el modelo es significativo porque el p − V alor del contraste es aproximadamente 0.

3. Para un nivel dado de ingreso per cápita en el paı́s vecino, se estima que en promedio por
cada tonelada adicional de plástico que exporte la empresa, su utilidad neta promedio

(A) se incrementará 37.238 dólares con 1 centavo anuales.


(B) disminuirá 22.470 dólares anuales.
(C) se incrementará 37 dólares con 238 centavos anuales.

4. La estimación del desvı́o de los errores es aproximadamente:

(A) 28,49. (B) 30,22. (C) 27,03.

21
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

PARTE II
Se decide excluir la variable X1 por no ser significativa y se plantea un modelo de regresión
simple para estimar y como función de X2 y se obtienen los siguientes resultados:

Coef. Error tı́pico Estadı́stico t Prob. Inferior 95 Superior 95


Intercepción 56,99 25,53 2,23 0,052 -0,75 114,74
Vble. X2 27,43 2,51 10,92 1,709E-06 21,75 31,11

PREGUNTAS:

1. Si se exportan 10 toneladas de plástico, el modelo predice que la utilidad neta de la empresa,

(A) superará los 330 mil dólares.


(B) será negativa (la empresa tendrá pérdidas).
(C) será positiva (la empresa tendrá ganancias) pero inferior a los 330 mil dólares.

2. La variable ((cantidad toneladas de plástico exportadas)):

(A) Es significativa al 10 %.
(B) Para cualquier nivel de significación igual o menor al 10 % no es significativa.
(C) Es significativa al 5 % pero no lo es al 1 %.

16.11. EXAMEN FEBRERO DE 2015 - VERSIÓN 1 - ENUNCIADO 7


Se plantea un modelo de regresión lineal para la variable de respuesta y con tres variables
de entrada. Se dispone de 20 observaciones.
PREGUNTAS:

1. De acuerdo a la notación utilizada en el curso, si no se rechaza la hipótesis de que β1 sea


0 contra que sea diferente de 0:

(A) el modelo no es significativo.


(B) el término independiente no es significativo.
(C) la variable x1 no es significativa.

2. Sabiendo que la variabilidad total de la variable de respuesta es 22380 y que la proporción


de dicha variabilidad que el modelo explica es 0,9316353887, se deduce que el valor estimado
de la varianza de la variable aleatoria de error del modelo es:

(A) 85. (B) 95,625. (C) 76,5

22
PRÁCTICA 9: MODELO DE REGRESIÓN LINEAL

16.12. EXAMEN FEBRERO DE 2018 - VERSIÓN 1 - ENUNCIADO 6

Se dispone de 25 pares de observaciones de las variables x e y. De ellos se desprende que:


25
P
xi = 2024, 8 ; sx = 24, 22.
i=1

25
P
yi = 41552 ; sy = 1848.
i=1

cov(x, y) = −16113.

Se propone el modelo de regresión lineal simple Yi = α + βxi + ei con i = 1, 2, . . . , 25.


PREGUNTAS:

1. El coeficiente de determinación del modelo vale:

(A) 0,1296. (B) 0,36. (C) 0,64.

2. La estimación minı́mo cuadrática del coeficiente α vale (utilice 3 cifras decimales):

(A) −27, 468. (B) −562, 608. (C) 3886, 768

3. El valor del estadı́stico de contraste para H0 )β = 0 versus H1 )β 6= 0 es:

(A) menor que B y se rechaza la hipótesis nula al 5 % de significación.


(B) igual a B y no se rechaza la hipótesis nula al 5 % de significación.
(C) mayor que B y no se rechaza la hipótesis nula al 5 % de significación.

23

También podría gustarte