Documentos de Académico
Documentos de Profesional
Documentos de Cultura
03 Modelos Lineales PDF
03 Modelos Lineales PDF
Seminario ITAM-CONAC
Mtodos Estadsticos en Actuara I
1. Conceptos Preliminares
Tipos de Variables
Modelo de Regresin Lineal
Modelo Poisson-Gamma
Modelo Tweedie
3. Aplicacin en Tarificacin
JUAN JOS FERNNDEZ DURN
1. Conceptos Preliminares
Tipos de Variables:
1
Ejemplos:
Modelo 1: Y = 0 + 1 X + e
Modelo 2: ln(Y ) = 0 + 1 eX + 2 X 2 + e
Modelo 3: eY = 0 + 1 cos(X ) + 3 eX + e
Modelo 4: Y = e0 +cos(2 X ) + e
e: trmino de error
0 , 1 , 2 y 3 : parmetros.
Yi = 0 + 1 Xi + ei
h(Yi ) = 0 + 1 g(Xi ) + ei
i = 1, . . . , n
i = 1, . . . , n
VE1)
Es tal que cuando n , su varianza muestral
1 n
2
i=1 (Xi X ) Q donde Q es una constante fija finita.
n
VE2) El cuarto momento de X es finito.
E1) Tienen media cero (condicional en X ),
E (ei Xi ) = 0 Cov(ei , Xi ) = 0. La variable explicativa X
y el error e no estn correlacionados.
E2) Son homoscedsticos (Tienen varianza constante),
Var (ei Xi ) = 2 . Por lo tanto, el error tiene varianza
constante que no es funcin de la variable explicativa.
E3) No estn correlacionados, Cov(ei , ej Xi , Xj ) = 0 para
toda i = j.
E4) Tienen una distribucin normal, por tanto,
ei N(0, 2 )
Equivalentemente,
e N(0, 2 Inn )
JUAN JOS FERNNDEZ DURN
Var (Yi Xi ) = 2
Yi Xi N(0 + 1 Xi , 2 ) independientes.
Minimizar:
n
SC(0 , 1 ) =
(Yi 0 1 Xi )2
i=1
8
6
hcuartos
4
2
0
2
10
12
hocupantes
)2
SCT =
(Yi Y
i=1
i Y
)2
SCM =
(Y
i=1
i )2
SCE =
(Yi Y
i=1
1 t(n2),1 2 s
1
SCXX
(
)
donde t(n2),1 2 es el percentil 1 2 100% de una
distribucin t-Student con n 2 grados de libertad (g.l.).
Prueba de Hiptesis:
H0 : 1 = 0 vs. Ha : 1 = 1
1
t(n2) es una cantidad pivotal bajo H0 .
1
s
SCXX
x
E[Y
X = x] = Y
x 0 1 x
Y
t(n2)
)2
X
s n1 + (x
SCXX
2
x t(n2),1 s 1 + (x X )
Y
2
n
SCXX
8
6
hcuartos
4
2
0
2
10
12
hocupantes
)2
1 (x X
0 + 1 x t(n2),1 2 s 1 + +
n
SCXX
Anlisis de Residuales
i , definido como
e
i = observadoi esperadoi
i = Yi Y
e
Determinar la existencia de violaciones a los supuestos del
modelo.
Por ejemplo,
1
Para la variable Sexo con posibles valores Hombre (H) y
Mujer (M) es necesario construir una variable indicadora:
{
1 si el i-simo individuo es hombre
IH (i) =
0 en otro caso
2
Y : Salario.
SCEreducido
+ 2p n
2
scompleto
i(i))2
(Yi Y
i=1
EJEMPLO 1.
REGRESIN LINEAL SIMPLE:
ESPERANZA DE VIDA VS. NMERO DE HABITANTES POR
CADA DOCTOR
Funciones de densidad:
f (y; , ) = c(y, )e
y a()
E [Y ] = = a()
() = V ()
Var (Y ) = a
Ejemplos:
1
Y Po()
2
Y Bi(n, p)
3
Y Normal(, 2 ) = N(, 2 )
JUAN JOS FERNNDEZ DURN
Liga Cannica
ln
i
1i
= x i
Funcin de
Varianza V ()
Parmetro de
Dispersin
i (1 i )
i
1
2i
3i
ln(i ) = x i
i = x i
1
= x i
i
2
i = x i
Table: Ligas Cannicas.
para i = 1, . . . , n
wi
i = X i = g(i ) i = g 1 (X i )
..
..
..
..
.
.
.
...
.
Yn X1n X2n . . . Xp1,n
Binomial
Yi nmero de reprobados en el saln i
Xi1 duracin del examen
Poisson
Yi nmero de accidentes de autos en el ao para el sujeto i
Xi1 ao lluvioso o no
Xi2 millas recorridas
Xi3 sexo
Xi4 edad
JUAN JOS FERNNDEZ DURN
H0 : q+1 = q+2 = . . . = p1 = 0
Ejemplo: Y , X1 , X2 , . . . , X10
Modelo completo: i = 0 + 10
i=1 i Xi
Modelo reducido: i = 0 + 1 X1 + 2 X10
Modelos anidados: Se dice que los modelos
M1 , M2 , . . . , Mk estn anidados si M1 M2 . . . Mk
Ejemplo:
M1
M2
M3
M4
: utiliza X1 , X2 , . . . , X10
: utiliza X1 , X3 , X5
: utiliza X1 , X3
: utiliza X1
RC =
LR
LC
LR y
LC deben ser muy cercanos en valor.
Si H0 es verdadera (bajo H0 ) entonces
2 ln(RC ) 2pk
( (
2 ln(RC ) = 2 ln
LR
LS
ln
LR
LS
LC
LS
LC
LS
))
= 2 ln(RS )2 ln(CS )
Devianza
( )
LM
2 ln k
( LS )
LMk 1
2 ln
gl
DMk 1 DMk
LS
2 ln
..
.
(
2 ln
LM1
LS
LC
LS
..
.
( )
Decremento en devianza
DM1 DM2
DC DM1
0
DS DC
AIC
Anlisis de Residuales
Distintos tipos de residuales se pueden definir para un modelo
lineal generalizado
1
Pearson
rp =
)
Var(
D=
i=1
n
di
di2
i=1
rD = signo(Y
) di
rD = signo(Y
)di
E (Z ) = y Var (Z ) = (1 ).
JUAN JOS FERNNDEZ DURN
i =
ex i
1 + ex i
e0 +xi1 1 +...+xi,p1 p1
1 + e0 +xi1 1 +...+xi,p1 p1
Momio:
i
1i
entonces =
m
1+m .
Funcin de verosimilitud:
L( z) =
izi (1 i )1zi .
i=1
i
= ex i = e0 +xi1 1 +...+xi,p1 p1
1 i
De xk a xk + 1
m(xi1 , . . . , xik + 1, . . . , xi,p1 ) =
i
=
1 i
EJEMPLO 2.
REGRESIN LOGSTICA.
HUNDIMIENTO DEL TITANIC.
y
e para y = 0, 1, 2, . . .
y!
De xk a xk + 1
i (xi1 , . . . , xik + 1, . . . , xi,p1 ) = e0 +xi1 1 +...+(xik +1)k +...+xi,p1 p1
y entonces
i (xi1 , . . . , xik + 1, . . . , xi,p1 ) =
e0 +xi1 1 +...+xik k +...+xi,p1 p1 ek = i (xi1 , . . . , xik , . . . , xi,p1 )ek .
Funcin de verosimilitud:
L( y) =
yi !
ei (xi1 ,...,xi,p1 ) .
Modelo Poisson:
Varianza = Media
Sobredispersin (Cuasipoisson):
Varianza > Media
Y E Poisson(E ) y E Gamma()
E (Y ) =
Var (Y ) = +
fY (y , ) =
(+y ) y
()y ! (+)+y
EJEMPLO 3.
REGRESIN POISSON.
ACCIDENTES DE BARCOS.
Gamma,
Normal Inversa y
Modelo Tweedie (para frecuencia y severidad).
Modelo Gamma
T Gamma(, r )
fT (t) =
rt
rr
r 1
t
e
para t, r , > 0
(r )r
Y IG(, )
f (y) =
2y 3
)1
2
La media es y la varianza es
(y )2
22 y
3
.
3 .
para y, , > 0
La liga cannica es
1
2
y la
funcin de varianza es V () =
Nuevamente, en la prctica
se prefiere utilizar la liga logaritmo.
Modelo Tweedie
Sea Y una variable aleatoria tal que
Y =
Zk
k =1
donde
N sigue una distribucin Poisson (Po())
las Z s son independientes e idnticamente distribuidas
como Gamma entonces,
Y sigue una distribucin Tweedie la cual asigna una
probabilidad positiva al caso Y = 0 siendo una mezcla de
una distribucin discreta y una distribucin continua.
3. Aplicacin en Tarificacin
Ideas Fundamentales:
1
EJEMPLO 4. TARIFICACIN.
MODELO DE FRECUENCIA: POISSON-BINOMIAL
NEGATIVO
MODELO DE SEVERIDAD: GAMMA-LOGNORMAL