Documentos de Académico
Documentos de Profesional
Documentos de Cultura
𝕐 = 𝕏𝛽 + 𝜀
En el cual:
𝑦1 𝛽0 𝜀1
𝑦2 𝛽1 𝜀2
. 𝛽2 .
Y= . 𝛽= ε= .
.
. . .
𝑦𝑛 𝜀𝑛
𝛽𝑝−1
1 𝑥11 . . 𝑥1𝑝−1
1 𝑥21 . . 𝑥2𝑝−1
𝑋= . . . . . La matriz X es llamada matriz de diseño
. . . . .
1 𝑥𝑛1 . . 𝑥𝑛𝑝−1
Ejemplo 1:
Considere los siguientes tabla de Escriba los datos en la forma matricial
datos:
x1 x2 Y 𝒀 = 𝑋𝛽 + 𝜀
4 1.5 160
3 2,2 112
160 1 4 1,5 𝜀1
1,6 1,0 69
112 1 3 2,2 𝛽𝑜 𝜀2
1,2 2 90 69 1 1,6 1,0 𝜀3
= 𝛽1 + 𝜀
90 1 1,2 2 4
3,4 0,8 123 𝛽2 𝜀5
123 1 3,4 0,8
4,8 1,6 186 186 1 4,8 1,6 𝜀6
Supuestos del modelo
Para el modelo , 𝕐 = 𝕏𝛽 + 𝜀 nosotros asumimos que,
𝜀 ∼ 𝑁(0, 𝜎 2 𝐼𝑛 ) 𝑐𝑜𝑣 𝜀𝑖 , 𝜀𝑗 = 0 i≠𝑗
Es decir que:
𝐸(𝜀1 ) 0
𝐸(𝜀2 ) 0.
.
𝐸 𝜀 = . = . = 0, 0𝜖ℜ𝑛
. .
𝐸(𝜀𝑛 ) 0
𝜎2 … 0
0 0
𝑣𝑎𝑟 𝜀 = Σ𝑒 = ⋱ = 𝜎 2 𝐼𝑛
⋮ ⋮
0 … 𝜎2
Estimador de mínimos cuadrados
ordinarios
𝛽 = (𝕏𝑡 𝕏)−1 𝕏𝑡 𝕐
• 𝕏𝑡 𝕏𝜖 𝑀𝑝𝑥𝑝
𝑌 = 𝕏𝛽
Estimaciones 𝑦𝑖
Los valores estimados 𝑦𝑖
𝛽0
.
𝑦𝑖 =(1, 𝑥𝑖1 … 𝑥𝑖𝑝−1 ) . = 𝑥𝑖𝑡 𝛽
.
𝛽𝑝−1
En el cual se define como 𝑥𝑖𝑡 es la i-ésima fila de la matriz de diseño 𝕏. Por lo que
los valores estimados o pronosticados para todos los n casos es :
𝑌 = 𝕏𝛽
Ejemplo 3:
Dado el siguiente modelo encuentre los valores estimados 𝑦𝑖
x1 x2 Y 𝑦𝑖 =15 +3 0 𝑥1 + 13𝑥2
4 1.5 160
1 4 1,5
3 2,2 112 1 3 2,2
15
1,6 1,0 69 1 1,6 1,0
𝑦𝑖 = 30 =
1 1,2 2
1,2 2 90 1 3,4 0,8 13
1 4,8 1,6
3,4 0,8 123
4,8 1,6 186
Tabla de Análisis de Varianza (ANOVA)
El teorema de Cochran estableces que si cada una de las n observaciones 𝑦𝑖 son
tomadas de una misma Población Normal con parámetros 𝜇 y 𝜎 2 , la Suma
Cuadrática Total (SCT) se descompone en k sumas cuadráticas que denotaremos
como SCq, q=1,21…k. Cada una de ellas con 𝑔𝑙𝑞 grados de libertad, por lo que el
𝑆𝐶𝑞
cociente 𝜎2 tiene una distribución ji-cuadrado con 𝑔𝑙𝑞 grados de libertad.
x1 x2 Y 𝑦𝑖 =15 +3 0 𝑥1 + 13𝑥2
4 1.5 160
3 2,2 112
1,6 1,0 69
1,2 2 90
3,4 0,8 123
4,8 1,6 186
Estimador de la varianza 𝜎 2 del error
𝑆𝐶𝐸
La Media Cuadratica del Error 𝑀𝐶𝐸 = 𝑛−𝑝, es un estimador insesgado de la
varianza 𝜎 2 del error
x1 x2 Y 𝑀𝐶𝐸 =
4 1.5 160
3 2,2 112
1,6 1,0 69
1,2 2 90
3,4 0,8 123
4,8 1,6 186
Prueba Global del modelo de regresion
𝐻0 ; 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑝−1 = 0
Vs
𝐻1 ; 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑏𝑒𝑡𝑎𝑠 𝑛𝑜 𝑒𝑠 𝑐𝑒𝑟𝑜
𝑀𝐶𝑅
El estadistico de prueba es : 𝐹𝑜 = 𝑀𝐶𝐸 ∼ 𝐹(𝑝 − 1, 𝑛 − 𝑝)
x1 x2 Y
4 1.5 160
3 2,2 112
1,6 1,0 69
1,2 2 90
3,4 0,8 123
4,8 1,6 186
Propiedades de los 𝛽
𝐸 𝛽 =𝛽
𝑣 𝛽 = 𝜎 2 (𝕏𝑡 𝕏)−1
Un estimador de la matriz de varianzas y covarianzas de 𝛽 es:
x1 x2 Y
4 1.5 160
3 2,2 112
1,6 1,0 69
1,2 2 90
3,4 0,8 123
4,8 1,6 186
Contrastes de hipótesis para cada 𝛽𝑖
Bajo los supuestos de Normalidad e Independencia de los residuos 𝑒𝑖 , la
variable muestral
𝛽𝑖 − 𝛽𝑖
~ 𝑇(𝑛 − 𝑝)
𝑆𝛽𝑖
𝛽𝑖 −𝛽𝑖
En otras palabras el estadístico tiene una distribución T de Student con
𝑆𝛽
𝑖
n-p grados de Libertad.
𝛽
El estadistico de prueba es : T = 𝑆 𝑖 ∼ 𝑡(𝛼 2 𝑛 − 𝑝)
𝛽𝑖
Siendo 𝑡 𝛼
2 𝑛 − 𝑝 el percentil (1- 𝛼 2)100 de la distribución T de student con n-p
grados de libertad
Ejemplo 7:
Realice las pruebas de hipótesis individual para los 𝛽𝑖 del modelo
x1 x2 Y
4 1.5 160
3 2,2 112
1,6 1,0 69
1,2 2 90
3,4 0,8 123
4,8 1,6 186
Coeficiente de Determinación
𝑆𝐶𝑅
𝑅2 =
𝑆𝐶𝑇
0 ≤ 𝑅2 ≤ 1
𝑅2 indica la proporción de variabilidad de Y, explicada a través del modelo por las
variables de explicación; o si trabajamos con la potencia de explicación del modelo
𝑅2 x(100%), se cambia el valor de proporción a porcentaje
• Un valor cercano a cero indica que no se capto casi nada de la variación total de Y,
• Un valor cercano a uno señala que casi 100% de la variabilidad fue captada
• Lo que interesa de un modelo es que capte la mayor variación, entonces es
preferible que sea cercano a 1
Ejemplo 8:
Calcule el 𝑅2 del modelo e interprete su valor.
x1 x2 Y
4 1.5 160
3 2,2 112
1,6 1,0 69
1,2 2 90
3,4 0,8 123
4,8 1,6 186