Está en la página 1de 6

Universidad Nacional de Asunción

Facultad de Ciencias Exactas y Naturales


Departamento de Educación a Distancia

Ejercicios de Regresión Lineal Múltiple resueltos

1- La supervisora de taquígrafas desea utilizar los datos muéstrales que se dan a


continuación para determinar la relación entre las variables, el Número de palabras del
dictado (P), el Número total de horas requeridas para mecanografiar el dictado (H) y un
índice que indica la Dificultad del Dictado(D). Los datos de su registro se muestran en forma
resumida:

155000 −17500 −25000


𝑎𝑑𝑗(𝑋 𝑡 𝑋) = [−17500 2500 2500 ]; ∑ 𝑃 = 100; ∑ 𝐻 = 200; ∑ 𝐷 = 200;
−25000 2500 5000
100
∑ 𝐻𝐷 = 800 ∑ 𝑃𝐻 = 1000 𝐶𝑀𝐸 = det(𝑋 𝑡 𝑋) = 250000.
11
a. Hallar la ecuación de regresión múltiple explicando el significado de los coeficientes de
regresión parcial, explicar el significado de las variables.

 Variable dependiente (y): Número total de horas requeridas para mecanografiar el


dictado (H)
 Variable independiente 𝑥1 : Número de palabras del dictado (P):
 Variable independiente 𝑥2 =Índice que indica la Dificultad del Dictado (D).

∑ 𝑦𝑖 200 155000 −17500 −25000


Tenemos que: 𝑋 𝑡 𝑦 = [∑ 𝑥𝑖1 𝑦𝑖 ] = [1000] ; 𝑎𝑑𝑗(𝑋 𝑡 𝑋)𝑡 = [−17500 2500 2500 ]
∑ 𝑥𝑖2 𝑦𝑖 800 −25000 2500 5000

155000 −17500 −25000 200


1
Entonces podemos calcular b como: 𝑏 = 250.000 (−17500 2500 2500 ) (1000),
−25000 2500 5000 800

1 −6.500.000 −26
𝑏= ( 1.000.000 ) = ( 4 )
250.000
1.500.000 6

Por tanto la ecuación de regresión lineal es 𝑦 = −26 + 4𝑥1 + 6𝑥2

a. 𝛽0 =26: Es la disminución promedio del número total de horas requeridas para


mecanografiar el dictado (H), cuando el número de palabras del dictado y el Índice que
indica la Dificultad es cero. En realidad, este valor negativo indica que cuando no hay
número de dictado y no hay índice de dificultad no se puede calcular el número total de
horas.
b. 𝛽1 =4: Representa el aumento promedio del número total de horas requeridas para
mecanografiar el dictado, cuando el número de palabras del dictado aumenta en una
unidad y el Índice de dificultad se mantiene constante.

Lic. Viviana D González

1 www.virtual.facen.una.py
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

c. 𝛽2 =6: Indica el aumento promedio del número total de horas requeridas para
mecanografiar el dictado, cuando el Índice de dificultad aumenta en una unidad y el
número de palabras del dictado se mantiene constante.

b. Ensayar la hipótesis conjunta sobre la naturaleza de la relación lineal existente entre


variables involucradas.
 Análisis conjunto
 Planteamiento de la hipótesis:
𝐻0 : 𝛽1 = 𝛽2 = 0. No existe relación lineal entre el Número total de horas requeridas para
mecanografiar el dictado (y), Número de palabras del dictado x1 y el índice que indica la
Dificultad del Dictado x2.
𝐻1 : Algún 𝛽𝑗 ≠ 0 𝑗 = 1, 2. Existe relación lineal entre el Número total de horas requeridas
para mecanografiar el dictado (y), Número de palabras del dictado x1 y el índice que indica
la Dificultad del Dictado x2

Como no tenemos el valor de n, calculamos a partir de los valores de la matriz cofactor

𝐷𝑒𝑡𝑒𝑟(𝑋 𝑡 𝑋) = 𝑛 . 𝑎11 + ∑ 𝑥1 𝑎12 + ∑ 𝑥2 𝑎13


𝐷𝑒𝑡𝑒𝑟(𝑋 𝑡 𝑋)−∑ 𝑥1 . 𝑎12 −∑ 𝑥2 . 𝑎13 250000−100.(−17500)+200. (−25.000)
Tenemos 𝑛 = ≈ 45
𝑎11 155000

200
2002 40000
𝑆𝐶𝑅 = [−26 4 6]. [1000] − 45 =(3600 − 45 ) = 2711,1111
800
𝑆𝐶𝐸 100 𝑆𝐶𝐸
𝐶𝑀𝐸 = → =
𝑛−𝑘−1 11 42
100 ∗ 42
𝑆𝐶𝐸 = = 381,8181
11
𝑆𝐶𝑇 = 𝑆𝐶𝑅 + 𝑆𝐶𝐸 = 2711,1111 + 381,8181 = 3092,9292
𝐶𝑀𝑅 𝑆𝐶𝑅⁄
𝑘
Calculo del estadístico 𝐹 ≈ (𝑘, 𝑛 − 𝑘 − 1, 𝛼), 𝐹𝑐𝑎𝑙 = 𝐶𝑀𝐸 = 𝑆𝐶𝐸
⁄𝑛−𝑘−1
Tabla Anova
Fuente de 𝒈𝒍 𝑺𝑪 𝑪𝑴 𝑭𝒄𝒂𝒍
Variación
Regresión 2 𝟐𝟕𝟏𝟏, 𝟏𝟏𝟏𝟏 1355,55 149,11
Error 42 𝟑𝟖𝟏, 𝟖𝟏𝟖𝟏 100/11
Total 44 𝟑𝟎𝟗𝟐, 𝟗𝟐𝟗𝟐

 Establecimiento del Criterio de decisión:


- 𝑠𝑖 𝐹𝑐𝑎𝑙 ≤ 𝐹𝑡 No Se Rechaza 𝐻0
- Si 𝐹𝑐𝑎𝑙 > 𝐹𝑡 Se Rechaza 𝐻0
 Conclusión: Entonces tenemos que Ft para 0.05 con 42 y 2 gl es 3,22 y como

www.virtual.facen.una.py
2
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

𝐹𝑐𝑎𝑙 > 𝐹𝑡 Se Rechaza 𝐻0 es decir existe relación entre la variable dependiente e


independientes
c. Determinar el coeficiente de determinación múltiple
𝑆𝐶𝐸 381,8181
𝑅2 = 1 − =1− = 0,87655 ∗ 100 ≈ 88%
𝑆𝐶𝑇 3092,9292

Aproximadamente el 88 % de la variación total del número total de horas queda explicada por
la ecuación de regresión que contienen al número de palabras del dictado x1 y el índice de la
Dificultad del Dictado x2 como variables de predicción
2- Un estudio sobre el efecto que tienen las variables: Inteligencia (𝑋1), Estudio (en hrs)
(𝑋2), Nivel social (𝑋3) y género (𝑋4), sobre la calificación que un estudiante obtiene en una
asignatura se tienen los siguientes datos:

n=20,

Matriz de correlaciones simples

Matriz de correlaciones
Inteligencia Nivel social Calificación
Inteligencia 1 0,703 0,760
Nivel social 0,703 1 0,557
Calificación 0,760 0,557 1

La correlación parcial de la Inteligencia con la Calificación eliminando el efecto del Nivel


social es:

𝑟𝑖𝑦 − 𝑟𝑦𝑘 𝑟𝑖𝑘 𝑟1𝑦 − 𝑟𝑦3 𝑟13


𝑟1𝑦.3 = =
√(1 − 𝑟 2 𝑦3 )(1 − 𝑟 213 ) √(1 − 𝑟 2 𝑦3 )(1 − 𝑟 213 )
0,760 − 0,557 ∗ 0,703 0,368
= = = 0,623
√(1 − (0,557)2 )(1 − (0,703)2 ) 0,831 ∗ 0,711

3- A continuación, se tiene la regresión de la mortalidad infantil (MI) sobre el PIB per cápita (PIBPC)
y la tasa de alfabetización de las mujeres (TAM) para una muestra de 64 países.

Los resultados de la regresión se reproducen a continuación,


Variables Coeficientes 𝑆𝑏j,con j 1,2,3

Constante 263,6416 11,5932

𝑃𝐼𝐵𝑃𝐶 − 0,0056 0,0019

𝑇𝐴𝑀 − 2,2316 0,2099

𝑅2 = 0,7077; 𝑅 2 𝑎𝑗𝑢𝑠𝑡 = 0,6981 𝑆𝐶𝑅 =257.362,4

a. Determina el MRLM para el estudio en términos de las variables

www.virtual.facen.una.py
3
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

𝑀𝐼̂ = 263,6416 − 0,0056𝑃𝐼𝐵𝑃𝐶 − 2,2316𝑇𝐴𝑀

b. Arma la tabla Anova detallada


n=64
𝑆𝐶𝑅 =257.362,4
𝑆𝐶 𝑅
𝑅2 = 𝑥100
𝑆𝐶𝑇

257.362,4 257.362,4
0,7077 = 𝑆𝐶𝑇
, 𝑆𝐶𝑇 =
0,7077
= 363.660,31

Fuente de gl SC CM 𝐹𝑐𝑎𝑙
variación
Regresión 2 𝑆𝐶𝑅= 257.362,4 𝐶𝑀𝑅 =128.681,2 73,845
Error 61 𝑆𝐶𝐸 = 106.297,91 𝐶𝑀𝐸= 1.742,59

Total 63 𝑆𝐶𝑇 = 363.660,31

c. Realiza un contraste global del modelo, de manera a determinar si el modelo explica una parte
significativa de la variabilidad de la variable respuesta. Realiza la conclusión.
Planteamiento de la hipótesis

𝐻0: 𝛽1 = 𝛽2 = 0. No existe relación lineal entre la variable de respuesta, mortalidad infantil (𝑦) y las
variables de predicción, PIB per cápita (x1) y tasas de alfabetización de las mujeres (x2)
𝐻1 : Algún 𝛽𝑗 ≠ 0 𝑗 = 1, 2. Existe asociación lineal entre la variable de respuesta, mortalidad
infantil (y) PIB per cápita (x1) y tasas de alfabetización de las mujeres (x2)
Utilizamos = 𝛼 =5%.

El estadístico de prueba es, el estadístico 𝐹(2;61;0,05) = 3,148


Criterio de decisión

• Si 𝐹𝑐𝑎𝑙 ≤ 𝐹𝑡, no se rechaza 𝐻0

• Si 𝐹𝑐𝑎𝑙 > 𝐹𝑡, se rechaza 𝐻0


Conclusión: Como 𝐹𝑐𝑎𝑙 > 𝐹𝑡, entonces rechazamos la hipótesis nula, y concluimos que la MI se
relaciona linealmente ya sea con el PIB per cápita, con la TAM o, con ambas. Podemos decir que
ambas variables explican una parte de la variabilidad de Y

d. Realiza el contraste parcial del coeficiente B1 de manera a determinar si la variable 𝑃𝐼𝐵𝑃𝐶


contribuye a la capacidad predictiva del modelo. Concluye.

Para este punto, planteamos una prueba de hipótesis sobre el coeficiente 𝑏1.

www.virtual.facen.una.py
4
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

 Planteamiento de la hipótesis 𝜷𝟏
𝐻0: 𝛽1 = 0. La variable PIB per cápita (𝑥1) no es una variable explicativa de la variable de respuesta,
Mortalidad Infantil (𝑦).

𝐻1: 𝛽1 ≠ 0. La variable PIB per cápita (𝑥1) es una variable explicativa de la variable de respuesta,
Mortalidad Infantil (𝑦).
Adoptamos 𝛼 = 5%, para el nivel de significancia

El estadístico de prueba apropiado a utilizar es t-student, donde:

𝑏𝑗 −𝛽
𝑡𝑐𝑎𝑙 = 𝑆𝑏𝑗

−0.0056−0
𝑡𝑐𝑎𝑙 = =-2,947
0.0019

 Criterio de decisión
Si −𝑡𝑡𝑎𝑏 ≤ 𝑡𝑐𝑎𝑙 ≤ 𝑡𝑡𝑎𝑏, se acepta 𝐻0

Si −𝑡𝑡𝑎𝑏 ≥ 𝑡𝑐𝑎𝑙 ≥ 𝑡𝑡𝑎𝑏, se rechaza 𝐻0

Tenemos que 𝑡 (61;0,975) = 2,000

 Conclusión
Como 𝑡𝑐𝑎𝑙 < 𝑡𝑡𝑎𝑏, entonces aceptamos la hipótesis nula, esto nos indica que, la variable PIB per cápita
(𝑥1) no es una variable explicativa significativa de la variable de respuesta, Mortalidad Infantil (𝑦).

4- En una investigación que desea estudiar la influencia que sobre la demanda de carne vacuna
ha tenido el precio de la carne porcina (X1) y de la caprina (X2), han tomado datos anuales desde
1979 a 2001 (ambos inclusive)

A continuación, se muestran los resúmenes de los datos:

𝑦̂ = 2,1 + 0,7𝑥1 − 1,5𝑥2; 𝑅2 = 0,9; 𝑆𝐶𝑅 = 126

a. Se podría afirmar, para un nivel de confianza del 95%, que los precios no influyen sobre la
demanda de la carne vacuna?
Para responder acerca de, si los precios no influyen sobre la demanda de la carne vacuna,
realizaremos una prueba de hipótesis para lo cual construimos nuestra tabla ANOVA
𝑆𝐶𝑅
De R2 = 𝑆𝐶𝑇 , tenemos que:
𝑆𝐶𝑅 126
SCT== = =140
R2 0,90

SCE=SCT-SCR= 14

www.virtual.facen.una.py
5
Universidad Nacional de Asunción
Facultad de Ciencias Exactas y Naturales
Departamento de Educación a Distancia

Fuente de gl SC CM 𝐹𝑐𝑎𝑙
variación
Regresión 2 SCR = 126 63 90
Error 20 SCE=14 0,7

Total 22 SCT=140

 Planteamiento de la hipótesis
𝐻0 : 𝛽1 = 𝛽2 = 0. No existe relación lineal entre la variable de respuesta, demanda de carne vacuna
(y) y las variables de predicción, precio de la carne porcina (𝑥1) y precio de la carne caprina (X2)
𝐻1 : Algún 𝛽𝑗 ≠ 0 𝑗 = 1, 2. Existe asociación lineal entre la variable de respuesta, demanda de
carne vacuna (y) y las variables de predicción, precio de la carne porcina (𝑥1) y precio de la carne
caprina (X2)
El nivel de significancia a utilizar es de 𝛼 = 5%.
El estadístico de prueba es F.
Obtenemos de la tabla de distribución F de Fisher el valor: 𝐹(2;20;0,05) = 3,493
 Criterio de decisión
Si 𝐹𝑐𝑎𝑙 ≤ 𝐹𝑡, no se rechaza 𝐻0

Si 𝐹𝑐𝑎𝑙 > 𝐹𝑡, se rechaza 𝐻0


 Conclusión
Como 𝐹𝑐𝑎𝑙 > 𝐹𝑡𝑎𝑏, rechazamos la hipótesis nula, y concluimos que la Demanda de carne vacuna se
relaciona linealmente ya sea con el Precio de la carne porcina, con el Precio de la carne caprina o,
con ambos.

www.virtual.facen.una.py
6

También podría gustarte