Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ADMINISTRACIÓN FINANCIERA
MÉTODOS ESTADÍSTICOS
UNIDAD 3: ANÁLISIS DE
REGRESIÓN MÚLTIPLE
2
ANÁLISIS DE REGRESIÓN MÚLTIPLE
5
EJEMPLO
6
EJEMPLO
7
EJEMPLO DE REGRESIÓN LINEAL MÚLTIPLE
8
EJEMPLO DEL MODELO DE REGRESIÓN LINEAL
9
ECUACIÓN DEL MODELO DE REGRESIÓN
13
ERROR ESTÁNDAR
MÚLTIPLE
14
ESTIMACIÓN DEL ERROR ESTÁNDAR MÚLTIPLE
15
ANÁLISIS DE VARIANZA
16
ANOVA
Prueba Global
17
PRUEBA GLOBAL: PRUEBA DE REGRESIÓN
MÚLTIPLE
La hipótesis nula indica que todos los coeficientes de regresión son cero y la
hipótesis alternativa indica que al menos una variable independiente tiene la
habilidad de explicar la variabilidad en la variable dependiente.
18
PRUEBA GLOBAL: PRUEBA DE REGRESIÓN
MÚLTIPLE
• El estadístico de prueba
𝐶𝑀𝑅
𝐹=
𝐶𝑀𝐸
Fuente de
variación SS g.l. CM F
Regresión SSR k
20
TABLA ANOVA
21
EVALUACIÓN INDIVIDUAL
DE LOS COEFICIENTES DE
REGRESIÓN
22
EVALUACIÓN INDIVIDUAL DE LOS
COEFICIENTES DE REGRESIÓN
24
R E S U LTA D O S D E T PA R A L A S P E N D I E N T E
25
NUEVO MODELO DE REGRESIÓN SIN LA
VARIABLE EDAD DEL CALEFACTOR
26
NUEVO MODELO DE REGRESIÓN SIN LA
VARIABLE EDAD DEL CALEFACTOR
27
COEFICIENTE DE
DETERMINACIÓN
28
COEFICIENTE DE DETERMINACIÓN
MÚLTIPLE (R 2 )
29
COEFICIENTE DE DETERMINACIÓN
MÚLTIPLE (R 2 )
30
AJUSTE DEL COEFICIENTE DE DETERMINACIÓN
32
COEFICIENTE DE DETERMINACIÓN AJUSTADO
33
MULTICOLINEALIDAD
34
MULTICOLINEALIDAD
37
¿CÓMO IDENTIFICAR SI
EXISTE MULTICOLINEALIDAD?
38
MATRIZ DE CORRELACIÓN
41
FACTOR DE INFLACIÓN DE VARIANZA
1
𝑉𝐼𝐹 = 2
1− 𝑅 𝑗
• El término R2J se refiere al coeficiente de determinación, donde la
variable independiente es usada como una variable dependiente y las
demás variables independientes como variables independientes
43
VIF
coeff std err t stat p-value lower upper vif
Intercept 427.193803 59.60142931 7.16750937 2.2376E-06 300.844417 553.543189
Mean
Outside
Temperatu
re (°F) -4.58266263 0.772319353 -5.93363692 2.1004E-05 -6.21990652 -2.94541874 1.3182237
Attic
Insulation
(inches) -14.8308627 4.754412281 -3.11938928 0.00660596 -24.9097665 -4.7519589 1.01097187
Age of
Furnace
(years) 6.10103206 4.012120166 1.52065038 0.14786248 -2.40428274 14.6063469 1.30953419
El VIF es 1.32 es menor que 5. Por lo que se indica que la variable independiente
temperatura no está correlacionada con las otras variables independientes.
45
SELECCIÓN DE LA “MEJOR
ECUACIÓN DE REGRESIÓN”
46
PROBLEMA DE SELECCIÓN DE VARIABLES
Lo que habíamos hecho anteriormente era como considerar todas las variables a la
vez. Por ejemplo, en el caso del costo de calefacción observábamos de forma global
(F) si al menos una de las tres variables independientes aportaba a la explicación de Y
pero contemplando que estaban las tres variables “a la vez” contempladas en la
modelación.
48
STEPWISE (REGRESIÓN POR PASOS)
50
SUPUESTOS DEL MODELO
Análisis de residuos
51
EVALUACIÓN DE LOS SUPUESTOS DE REGRESIÓN
• Existe una relación lineal. Esto es, hay una línea recta en la
relación entre la variable dependiente y el conjunto de variables
independientes. (Linealidad).
• La variación en los residuales es el mismo valor para las
estimaciones de y (o de las X’s) (Homocedasticidad).
• Los residuales siguen una distribución de probabilidad
Normal. (Normalidad).
• Los residuales son independientes. Significa que las
observaciones sucesivas de la variable dependiente no están
correlacionadas. Este supuesto es a menudo violado cuando el
tiempo está involucrado con la muestra de las observaciones. 52
(Independencia).
ANÁLISIS DE RESIDUALES
100
Mean Outside Temperature
80 (°F) Gráfico de los residuales
Residuales
60
40 100
20 80
0 60
-20 0 50 100 150 200 250 300 350 400 40
Residuos
-40
20
0
-60
-20 0 10 20 30 40 50 60 70
-80
-40
-100
-60
-80
Valores predichos -100
Mean Outside Temperature (°F)
60 60
Residuos
Residuos
20 20
-20 0 2 4 6 8 10 12 14 -20 0 2 4 6 8 10 12 14 16
-60 -60
-100 -100
Attic Insulation (inches) Age of Furnace (years)
54
SUPUESTO DE
HOMOCEDASTICIDAD
100
80
60
40
Residuales
20
0
0 50 100 150 200 250 300 350 400
-20
-40
-60
-80
-100
Valores predichos
400
350
300
Heating Cost ($)
250
200
150
100
50
0
0 20 40 60 80 100 120
Muestra percentil
56
ANÁLISIS DE INFLUENCIA
57
GRÁFICAMENTE CÓMO
IDENTIFICAR PUNTOS
ATÍPICOS
• DFFITS mide el efecto que tiene cada observación sobre los valores
ajustados en un modelo lineal.
• DFFITS representa aproximadamente el número de desviaciones
estándar que el valor ajustado cambia cuando cada observación se
elimina del conjunto de datos y el modelo se reajusta.
• Las observaciones que tienen un valor DFFITS grande pueden podrían
ser influyentes.
Un criterio comúnmente utilizado para un valor DFFITS
grande es si el valor absoluto de DFFITS es mayor que
lo siguiente: