Documentos de Académico
Documentos de Profesional
Documentos de Cultura
González
Introducción a Modelos Lineales
Para representar un modelo lineal, suponga que una variable Y se puede expre-
sar en términos de las variables X1 , X2 , . . . , Xp . Se llamará variable dependiente
a Y y variables independientes a las X ′ s.
Organizando la Y y las X ′ s en matrices, se tiene que
y1 x11 x12 . . . x1p
y2 x21 x22 . . . x2p
=. = . . .
.
.. .. .. . . ..
y n×1 y X n×p = x1 x2 . . . xp .
con xj = (x1j x2j x3j . . . xnj )⊤ y n el número de unidades en las cuales se realizan
las observaciones. A X se le va a llamar matriz diseño.
Un modelo lineal en los parámetros es dado por:
E(Y ) = Xβ (1)
en que β = β1 β2 . . . βp ⊤ vector de parámetros a estimar. Cabe resaltar la
Considere ahora
Y = Xβ + ε, (2)
con ε un vector aleatorio tal que E(ε) = 0. Xβ corresponde a la parte sistemática
del modelo, y ε corresponde a la parte aleatoria del modelo. Si se conoce β y X , y
si se obtiene una realización de ε, entonces se tiene un vector de escalares y,
y = Xβ + una realización de ε.
Ejemplo 1. Considere el modelo de efectos fijos, como el dado en (2). Algunos casos
particulares son
1. yij = µ + τi + εij , i = 1, 2, . . . , a
y j = 1, 2, . . . , ri .
Esta expresión corresponde a un modelo lineal con una vía de clasificación. En
la tabla 1 se presentan datos ilustrativos sobre el número de vehículos de la
marca A en la empresa B clasificados por kilómetros rodados. En este caso las
ciudades corresponden a “unidades” o réplicas. a = 3, r1 = 4, r2 = 3 y r3 = 4.
2. yijk = µ + τi + γj + εijk , i = 1, 2, . . . , a, j = 1, 2, . . . , b y k = 1, 2, . . . , r.
2
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
Tabla 3: Número de vehículos importados por la empresa B en los últimos dos años
clasificados por puerto de importación y marca. Datos ilustrativos.
Puerto importación Renault Volkswagen Chevrolet
Buenaventura 15 11 12
13 10 10
Santa Martha 9 11 18
8 14 23
3
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
Tabla 4: Número de vehículos importados por la empresa B en los últimos dos años
según marca y origen del vehículo. Datos ilustrativos.
Ford Volkswagen
Brasil Venezuela EEUU Brasil México Alemania
30 7 5 32 10 12
8 14 20 10 9 15
Las respectivas matrices y, X , β y ε son dadas por
30 1 1 0 1 0 0 0 0 0 ε(11)1
8 1 1 0 1 0 0 0 0 0 ε(11)2
7 1
µ
1 0 0 1 0 0 0 0
ε(12)1
τ1
14 1 1 0 0 1 0 0 0 0 ε(12)2
τ2
5 1 1 0 0 0 1 0 0 0 ε(13)1
δ1(1)
20 1 1 0 0 0 1 0 0 0
ε(13)2
= δ2(1)
+
32 1 0 1 0 0 0 1 0 0
ε(24)1
10 1 δ
3(1)
0 1 0 0 0 1 0 0 δ4(2)
ε(24)2
10 1 0 1 0 0 0 0 1 0 ε(25)1
δ5(2)
9 1 0 1 0 0 0 0 1 0 ε(25)2
δ
12 1 0 1 0 0 0 0 0 1 | 6(2)
{z } ε(26)1
15 1 0 1 0 0 0 0 0 1 β ε(26)2
| {z } | {z } | {z }
y X Una realización de ε
4
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
5. yi = a + bxi + εi , i = 1, 2, . . . , n.
Esta expresión corresponde a un modelo lineal con variable independiente re-
gresora ( regresión lineal simple). En la tabla 5 se presentan datos ilustrativos
sobre número de reclamaciones y valor pago para diferentes zonas. n = 7.
Tabla 5: Número de reclamaciones y valor pago para diferentes zonas. Datos ilustra-
tivos.
Reclamaciones Valor pago
65 350.000
35 250.000
20 130.000
10 75.000
15 60.000
5 20.000
30 120.000
Las respectivas matrices y, X , β y ε son dadas por
350.000 1 65 ε1
250.000 1 35 ε2
130.000 1 20 ε3
75.000 = 1 10 a +
ε4
b
60.000 1 15 | {z } ε5
20.000 1 5 β ε6
120.000 1 30 ε7
| {z } | {z } | {z }
y X Una realización de ε
5
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
Tabla 6: Número de reclamaciones y valor pago para diferentes zonas por kilómetros
rodados (por año). Datos ilustrativos.
Kilómetros Reclamaciones Valor pago
Entre 15.000 y 25.000 10 60.000
Entre 15.000 y 25.000 140 700.000
Entre 15.000 y 25.000 30 140.000
Entre 15.000 y 25.000 9 25.000
Más de 25.000 65 350.000
Más de 25.000 35 250.000
Más de 25.000 20 130.000
Más de 25.000 10 75.000
Más de 25.000 15 60.000
Más de 25.000 5 20.000
Más de 25.000 30 120.000
6
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
β1 − β5
β2 − β5
β1 + β2 + 2β3 − β4
β2 + β4 − 2β3
7
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
en que 1a corresponde a un vector de orden a cuyas entradas son unos. Los pa-
rámetros µi , i = 1, 2, . . . , p, corresponden a las medias de celda, y los tamaños ni
corresponden a las frecuencias de celda.
Ejemplo 2. Retomando el ejemplo 1, los respectivos modelos de medias de celda
para los items 1 a 4 son:
8
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
1. p = 3, n1 = 4, n2 = 3 y n3 = 4.
8 1 0 0 ε11
10 1 0 0 ε12
12 1 0 0 ε13
13 1 0 0 ε14
10 0 1 0
µ1
ε21
15 = 0 1 0
µ2 +
ε22
12 0 1 0
| µ 3
ε24
{z }
13 0 0 1 ε31
β
16 0 0 1 ε32
13 0 0 1 ε33
15 0 0 1 ε34
| {z } | {z } | {z }
y W Una realización de ε
9
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
Modelos de regresión
El modelo de regresión es un caso especial del modelo lineal simple enmarcado
en los modelos funcionales. La relación funcional depende de una o más variables
conocidas como regresores, predictores o variables independientes. En general las
variables son cuantitativas, pero puede incluir variables cualitativas, en este caso el
modelo tendrá componentes funcionales y de clasificación. Ver Hocking (1996)[p.14].
Definición 4 .Hocking (1996)[p.17] Se dice que la variable aleatoria Y satisface
un modelo de regresión lineal simple sobre x, si los pares observados (xi , yi ) están
relacionados por la ecuación
Yi = β0 + β1 xi + εi
en que los εi son variables aleatorias independientes que tienen distribución normal
con media cero y varianza σ2 .
Ejemplo 3. La expresión asociada a los datos ilustrativos presentados en la tabla 5,
si adicional al supuesto de E(εi ) = 0, para todo i, se agregan los supuestos de inde-
pendencia entre los ε′ s y distribución normal con varianza constante, , corresponde
a un ejemplo de regresión lineal simple.
Definición 5 Bickel & Doksum (1977)[p.251] Y1 , Y2 , . . . , Yn se dice que satisfacen
.
un modelo lineal general, si se pueden expresar como
p
(4)
X
Yi = βj xij + εi , i = 1, 2, . . . , n
j=0
10
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
en que las xij son constantes conocidas, los βj son parámetros de valor real descono-
cidos, y los εi son variables aleatorias independientes que tienen distribución normal
con media cero y varianza σ2 .
Ejemplo 4. La expresión asociada a los datos ilustrativos presentados en la tabla 6,
si adicional al supuesto de E(εij ) = 0, para todo i y para todo j , se agregan los su-
puestos de independencia entre los ε′ s y distribución normal con varianza constante,
corresponde a un ejemplo de la expresión (4).
Ejemplo 5. Considere los datos ilustrativos presentados en la tabla 7, sobre el nú-
mero de reclamaciones, valor pago para diferentes zonas y número de asegurados año
póliza . Un modelo propuesto, en este caso, puede ser dado por
a
yi = β0 + β1 x1i + β2 x2i + εi , i = 1, 2, . . . , n,
en que las variables aleatorias εi son independentes con distribución normal de media
cero y varianza σ2 . Note que p = 2, sin embargo el número de parámetros a estimar
en β es p + 1 = 3.
Tabla 7: Datos ilustrativos sobre número de reclamaciones, valor pago para diferentes
zonas y número de asegurados año póliza.
Número de asegurados año póliza Reclamaciones Valor pago
1200,35 65 350.000
800,70 35 250.000
300,65 20 130.000
170,10 10 75.000
300,40 15 60.000
120,15 5 20.000
600,24 30 120.000
Las respectivas matrices y, X , β y ε son dadas por
350.000 1 1200, 35 65 ε1
250.000 1 800, 70 35 ε2
130.000 1 300, 65 20
β0
ε3
75.000 = 1 170, 10 10
β1 +
ε4
60.000 1 300, 40 15
β2 }
ε5
20.000 1 120, 15 5 | {z ε6
β
120.000 1 600, 24 30 ε7
| {z } | {z } | {z }
y X Una realización de ε
a
Esta variable cuenta el tiempo que una persona estuvo asegurada en un año. Una persona que
este medio año se contabiliza como 0.5, una persona que estuvo asegurada 3 meses cuenta como
0.25 y una persona que estuvo todo el año cuenta como 1.
11
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
Métodos de estimación
Método de Mínimos Cuadrados
Suponga que las variables aleatorias Y1 , Y2 , Y3 , . . . , Yn , se pueden escribir de la
forma
Yi = gi (θ1 , θ2 , . . . , θr ) + εi , 1≤i≤n
con gi funciones conocidas y θ1, θ2 , . . . , θr , parámetros de interés, de valor descono-
cido. Suponga que el vector de parámetros θ = (θ1 , θ2, . . . , θr )⊤ puede variar libre-
mente sobre un conjunto A ⊂ Rr . También, suponga que los εi satisfacen, al menos
en forma aproximada, las siguientes restricciones:
E(εi ) = 0, 1 ≤ i ≤ n
V(εi) = σ2 > 0, 1 ≤ i ≤ n
Cov(εi , εj ) = 0, 1 ≤ i < j ≤ n
Cabe notar que σ2 es, también, un parámetro. Sea g(θ) = (g1 (θ), g2 (θ), . . . , gn (θ))⊤
y Y = (Y1 , Y2, Y3 , . . . , Yn )⊤ , el valor esperado de Y es
g (θ)
Y1 1
g2 (θ)
E
Y2
=
. . . ..
.
Yn gn (θ)
E(Y ) = g(θ)
Una vez se observa Y = y, con y = (y1 , y2, y3, . . . , yn )⊤ , el estimador obtenido vía
mínimos cuadrados resulta de minimizar
n
X
[yi − gi (θ1 , . . . , θr )]2 = [y − g(θ)]⊤ [y − g(θ)]
i=1
Si las gi , i = 1, 2, . . . , n, son diferenciables, θ̂ está bien definido, ver Bickel & Doksum
(1977)[p.95].
Ejemplo 6 (Regresión lineal simple). Un caso especial es
Yi = gi (θ) + εi = β0 + β1 xi +εi , 1≤i≤n
| {z }
gi (θ)
Para minimizar
n
X n
X
Q= [yi − gi (θ1 , . . . , θr )]2 = [yi − β0 − β1 xi ]2
i=1 i=1
denota .
⊤
b d
∂
dθ
d
dθ
= , ∂ , . . . , ∂θ∂r
∂θ1 ∂θ2
13
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
n n
P P
ȳ x2i − x̄ xi y i
β̂0 1 i=1n i=1
= n
.
β̂1 X P
xi yi − nx̄ȳ
x2i − nx̄2 i=1
i=1
| {z }
SSxx
luego
n
P n
P
ȳ x2i − x̄ xi y i
i=1 i=1 (143571, 4286) (7100) − 25, 71428571(39450000)
β̂0 = n =
P 7100 − (7) (25, 71422 )
x2i − nx̄2
i=1
= 1994, 22
Pn
xi yi − nx̄ȳ
39450000 − (7)(25, 7142)(143571, 4286)
β̂1 = i=1n =
P 2 7100 − (7) (25, 71422 )
xi − nx̄2
i=1
= 5505, 78
14
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
350000
250000
Valor_Pago
150000
50000
10 20 30 40 50 60 70
Reclamaciones
Figura 1: Gráfico de dispersión para los datos del ejemplo 7 y línea ajustada.
15
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
β0
Y1 x10 x11 . . . x1p β1 ε1
Y2 x20 x21 . . . x2p ε2
Y = . , X= . . . . β = β2 , ε = . .
.. . . . . ..
,
. . . . ..
.
Yn xn0 xn1 . . . xnp εn
βp
Para minimizar
Q = [y − g(θ)]⊤ [y − g(θ)] = (y − Xβ)⊤ (y − Xβ)
16
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
igualando a 0,
dQ
=0
dβ
−2X ⊤ y + 2X ⊤ X β̂ = 0
X ⊤ X β̂ = X ⊤ y (10)
Si X ⊤ X es no singular,
β̂ = (X ⊤ X)−1 X ⊤ y. (11)
Si X no es de rango columna completo, X ⊤ X es singular, ver anexo A.
Ejemplo 9. Las ecuaciones dadas en (11) se pueden usar en el caso de regresión
lineal simple, ejemplo 6, se tiene
1 x1 y1
1 x2 y2
β̂0
, X = 1 x3 , y = y 3
β̂ =
β̂1 .. .. ..
. . .
1 xn yn
n nx̄ nȳ
X ⊤X = Pn y X ⊤y = P n
nx̄ x2i xi y i
i=1 i=1
n n
h i−1 P 2 −nx̄
P 2
1 x
i=1 i 1 x −nx̄
X ⊤X = P n
=
n
i=1 i
2 2 2
P
n xi − n x̄ −nx̄ n n 2
xi − nx̄ 2 −nx̄ n
i=1 i=1
n
P 2
1 n1 xi −x̄
= i=1
SSxx −x̄ 1
n n
P 2 P
ȳ x i − x̄ x y
i i
β̂0 1 i=1n i=1
β̂ = = .
β̂1 SSxx P x y − nx̄ȳ
i i
i=1
17
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
Ejemplo 11. Considere los datos ilustrativos presentados en la tabla 7 sobre el nú-
mero de reclamaciones, valor pago y número de asegurados año póliza, para diferentes
zonas. Si el modelo (7) fuera adecuado, en modelo propuesto sería
yi = β0 + β1 x1i + β2 x2i + εi , i = 1, 2, . . . , n,
en que las variables aleatorias εi son independentes con distribución normal de media
cero y varianza σ2 .
Las respectivas matrices y, X , β y ε son dadas por
350.000 1 1200, 35 65 ε1
250.000 1 800, 70 35 ε2
130.000 1 300, 65 20 β0 ε3
75.000 = 1 170, 10 10 β1 + ε4 .
60.000 1 300, 40 15 β2 ε5
20.000 1 120, 15 5 | {z } ε6
β
120.000 1 600, 24 30 ε7
| {z } | {z } | {z }
y X Una realización de ε
Luego, el estimador de β vía minimos cuadrados, teniendo en cuenta que
7 3492, 59 180 1005000
X ⊤ X = 3492, 59 2666249, 285 136875, 2 X ⊤ y = 764595300
180 136875, 2 7100 39450000
−1 0, 41335 −0, 00034 −0, 004
X ⊤X = −0, 00034 0, 000036 −0, 0007
−0, 004 −0, 0007 0, 0137
es
633, 43
β̂ = 147, 27 .
2701, 164
En la figura 2 se presenta una matriz de scatterplot para las variables Número de
asegurados año póliza (Insured), Reclamaciones y Valor_Pago. En la figura 3 se
presenta un gráfico de dispersión, y en la figura 4 se presenta un gráfico de dispersión
agregando un plano estimado por mínimos cuadrados.
Las instrucciones en R para la estimación y el gráfico se presentan a continuación.
library(scatterplot3d)
library(car)
library(ggplot2)
library(GGally)
library(Cairo)
remove(list=ls())
Insured=c(1200.35,800.70,300.65,170.10,300.40,120.15,600.24)
18
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
9e−04
Insured
6e−04 Corr: Corr:
0.985*** 0.958***
3e−04
0e+00
60
Reclamaciones
40 Corr:
0.958***
20
3e+05
Valor_Pago
2e+05
1e+05
Reclamaciones=c(65,35,20,10,15,5,30)
Valor_Pago=c(350000,250000,130000,75000,60000,20000,120000)
ajuste2=lm(Valor_Pago~Insured+Reclamaciones)
ejemplo.regm=data.frame(Insured,Reclamaciones,Valor_Pago)
ggpairs(ejemplo.regm,columns=1:3,
upper = list(continuous = wrap("cor", size = 5)),
lower = list(continuous = "points"))
figura3d <-scatterplot3d(Insured,Reclamaciones,Valor_Pago,
xlim=c(100,1250),ylim=c(4,70),zlim=c(15000,370000),
angle=30,pch=16, highlight.3d=TRUE, type="h")
library(rgl)
figura3d$plane3d(ajuste2, lty.box = "solid")
scatter3d(Valor_Pago~Insured+Reclamaciones, data=ejemplo.regm,
fit="linear")
19
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
4e+05
3e+05
Reclamaciones
Valor_Pago
70
2e+05
60
50
40
1e+05
30
20
10
0e+00
0
0 200 400 600 800 1000 1200 1400
Insured
Tabla 9: Datos para el ejemplo sobre valor unitario, tasa de producción y costos.
Valor unitario tasa de costos Valor unitario tasa de costos
producción producción
14.39 85 80 16.70 80 95
16 80 105 21.20 65 115
24.60 50 125 22. 25 60 130
19.90 70 116 14.9 90 90
15.10 95 94 16.50 100 110
15.90 100 115 17.40 80 115
4e+05
3e+05
Reclamaciones
Valor_Pago
70
2e+05
60
50
40
1e+05
30
20
10
0e+00
0
0 200 400 600 800 1000 1200 1400
Insured
Figura 4: Gráfico de dispersión para los datos del ejemplo 11 en 3D y plano ajustado.
entonces
✟i σ 2
V √
εi
wi
=
w
✟
w✟i
= σ2 .
✟
21
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
Igual que en el método de mínimos cuadrados, sea g(θ) = (g1 (θ), g2 (θ), . . . , gn (θ))⊤
y Y = (Y1 , Y2, Y3 , . . . , Yn )⊤ , el valor esperado de Y es
g (θ)
Y1 1
g2 (θ)
E
Y2
. . . ...
=
Yn gn (θ)
E(Y ) = g(θ).
Una vez se observa Y = y, con y = (y1, y2 , y3, . . . , yn )⊤ , se tiene Z = z, con z =
(z1 , z2 , z3 , . . . , zn )⊤ . El estimador obtenido vía mínimos cuadrados ponderados
resulta de minimizar
n n
X X 1
[zi − gi∗ (θ)]2 = [yi − gi (θ)]2 = [y − g(θ)]⊤ W −1 [y − g(θ)]
wi
i=1 i=1
0 0 0 ... ca
22
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
Para minimizar
1 1 1 1
Q = [z − g ∗ (θ)]⊤ [z − g ∗ (θ)] = [W − 2 y − W − 2 Xβ]⊤ [W − 2 y − W − 2 Xβ]
= (y − Xβ)⊤ W −1 (y − Xβ)
23
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
igualando a 0,
dQ
=0
dβ
−2X ⊤ W −1 y + 2X ⊤ W −1 X β̂ = 0
X ⊤ W −1 X β̂ = X ⊤ W −1 y. (14)
Si X ⊤ W −1 X es no singular,
β̂ = (X ⊤ W −1 X)−1 X ⊤ W −1 y.
entonces
β̂ = (X ⊤ W −1 X)−1 X ⊤ W −1 y
1 −1
w1 0 0 ... 0
1 1 x 1
0 0 ... 0
w2 1 x2
1 1 1 . . . 1 1
.. .. ×
0 0 ... 0
=
x1 x2 x3 . . . xn . .. .. ..
w3
... . .
.. . . .
1 1 xn
0 0 0 ... wn
1
w1 0 0 ... 0
1 y1
0
w2 0 ... 0 y2
1 1 1 ... 1 0 1
0 ... 0 ..
. . . xn . .. .. ..
w3
... .
x1 x2 x3
.. . . .
1 yn
0 0 0 ... wn
24
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
n n
−1 n
P 1 P xi P yi
i=1 wi wi wi
= i=1 i=1
Pn Pn 2 n
P
xi xi x i yi
wi wi wi
i=1 i=1 i=1
n n
n
P x2i P xi P yi
wi − wi wi
1 i=1 i=1 i=1
= 2 n
P n
P n
P x i yi
n n n xi 1
P 1 P x2i P xi −
wi wi − wi i=1
wi
i=1
wi
i=1
wi
i=1 i=1 i=1
n
n
n
n
P x2i P yi P xi P x i yi
wi −
wi wi wi
1 i=1
i=1 i=1 i=1
= 2 n n
n
n
,
n n n P 1 P x i yi P xi P yi
P 1 P x2i P xi −
wi wi − wi wi wi wi wi
i=1 i=1 i=1 i=1 i=1 i=1 i=1
n
2 1
dividiendo tanto numerador como denominador por y tomando ui =
P 1 wi
wi P
n
1
i=1 wj
j=1
se tiene que
n
n
n n
2
P P P P
u x
i i u y
i i − u x
i i u x y
i i i
1
i=1 n i=1 n i=1 n i=1
β̂ = 2
.
n
P n
P P P P
ui x2i − ui x i ui xi yi − ui x i ui yi
i=1 i=1 i=1 i=1 i=1
de β1 y β2 ?
Ejercicio 6. Considere el siguiente conjunto de datos:
i 1 2 3
xi 2 -6 7
yi 3 4 6
1. para el modelo yi = β0 + β1 xi + ǫi , i = 1, 2, 3, con E(ǫi ) = 0 y V(ǫi ) = σ2 ,
i = 1, 2, 3, presente la estimación de β0 y de β1 , vía mínimos cuadrados.
25
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
• µ es la media general, y
• τi es el efecto de estar en la categoría i de kilometraje, con respecto a la
media general, µ.
Las respectivas matrices y, X , β y ε son dadas por
8 1 1 0 ε11
10 1 1 0 ε12
12 1 1 0 ε13
13 1 1 0 ε14
10 1 0 1
µ
ε21
15 = 1 0 1
τ1 +
ε22
12 1 0 1 τ2 ε24
| {z }
13 1 −1 −3/4 ε31
β
16 1 −1 −3/4 ε32
13 1 −1 −3/4 ε33
15 1 −1 −3/4 ε34
| {z } | {z } | {z }
y X Una realización de ε
26
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
2. Obtener A−1
11 .
27
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
28
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
h − i⊤
Entonces X ⊤X = G⊤ es una inversa generalizada de X ⊤ X .
2. Teniendo en cuenta que, ver Harville (1997)[p.52],
para cualquier matriz Am×n , se puede probar que A = 0 si y solo si
A⊤ A = 0, y que
para cualquier matrices Am×n , B n×p y C n×p , se puede probar que AB =
AC si y solo si A⊤ AB = A⊤ AC ,
entonces
−
⊤ ⊤
X X
|{z} |{z} X X X ⊤ |{z}
X ⊤ X = |{z} I
X |{z}
A⊤ A | {z } A⊤ A C
B
−
X X ⊤X X ⊤ X = X
| {z }
G
con xi escalar y a⊤i la i-ésima fila de A. Similarmente, el espacio columna de Am×n , denotado por
C(A), es el conjunto de todos los vectores columna m-dimensionales tales que se pueden expresar
como combinaciones lineales de las n columnas de A.
x1 a1 + x2 a2 + · · · + xn an = Ax
con xi escalar y ai la i-ésima columna de A. Ver Harville (1997)[p.27]
29
Notas de Clase elaboradas por L. M. González
Introducción a Modelos Lineales
es decir,
X = LX ⊤ X
X ⊤ = X ⊤ XR
Así X es invariante a .
− −
X ⊤X X⊤ X ⊤X
4. Usando que, Harville (1997)[p.117], para cualquier matriz A, (A− )⊤ es una
inversa generalizada de A⊤ . En este caso, se tiene que si A− = X ⊤ X − es
h i⊤
la inversa generalizada de A = X ⊤ X , (A− )⊤ = X ⊤ X − es una inversa
generalizada de X ⊤ X ⊤ = X ⊤ X , y
− ⊤ − ⊤
⊤ ⊤ ⊤
X X X X =X X X X⊤
h − i⊤
la cual por 3. es invariante a G, entonces X X ⊤.
−
X ⊤X X ⊤ = X X ⊤X
(1997)[p.120].
ii) Cualquier solución es de la forma
x = A− d + I − A− A z
30
Notas de Clase elaboradas por L. M. González
REFERENCIAS Introducción a Modelos Lineales
i) −
X ⊤ X X ⊤X X ⊤Y = X ⊤Y = d
| {z }
inversa gener. de X⊤
para algún z.
Ejercicio 10. Para X ⊤X β̂ = X ⊤y, encontrar una solución de β̂, en que
10 1 1 0 0
5 1 1 0 0
12 1 1 0 0
3
1
µ̂
0 1 0
τˆ1
4 ,
Y = 1
X= 0 1 0
, β̂ =
τˆ2
3 1 0 1 0
8
1
τˆ3
0 0 1
7 1 0 0 1
6 1 0 0 1
Referencias
Bickel, P. & Doksum, K. (1977), Mathematical Statistics: Basic ideas and selected
topics, San Francisco: Holden-Day Inc.
Canavos, G. (1988), Probabilidad y estadística. Aplicaciones y Métodos, México: Mc
Graw-Hill.
Everitt, B. (2006), The Cambridge Dictionary of Statistics, Cambridge University
Press.
Harville, D. A. (1997), Matrix Algebra from a Statistician’s Perspective, New York:
Springer.
31
Notas de Clase elaboradas por L. M. González
REFERENCIAS Introducción a Modelos Lineales
32