Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ker
Ker
Estimacin no-paramtrica
Mximo Camacho Alonso
Universidad de Murcia
www.um.es/econometria/tecpre
mcamacho@um.es
Maximo Camacho Estimacin no-paramtrica 2
Contenido del tema
Introduccin: ventajas e inconvenientes
Estimacin funcin de densidad
Algunos tipos de estimacin
Propiedades asintticas
El papel del kernel
El papel de la ventana
Estimacin de funciones
Nadaraya-Watson
Prediccin
Maximo Camacho Estimacin no-paramtrica 3
1. Introduccin
Estimacin paramtrica
Estimacin no-paramtrica
Ventajas
Inconvenientes
Maximo Camacho Estimacin no-paramtrica 4
Supongamos que
Disponemos de n observaciones de y, x.
Pensamos
y
t
= m(x
t
) + e
t
Deseamos estimar
Funcin de densidad de y
La funcin m
1. Introduccin
Maximo Camacho Estimacin no-paramtrica 5
1. Introduccin
Supuesto 1: m es lineal
Supuesto 2:
Implica
Estimamos a, b,
t t t
e bx a y + +
) , 0 ( N e
2
1.1. Estimacin paramtrica
) , ( /
2
t t t
bx a N x y +
)
( /
t t t
x b a N x y +
Maximo Camacho Estimacin no-paramtrica 6
No exigimos a priori que
la densidad de y
la funcin m
pertenezcan a una familia paramtrica
Trataremos de estimarlas dejando que los
datos hablen por s mismos
1. Introduccin
1.2. Estimacin no-paramtrica
Maximo Camacho Estimacin no-paramtrica 7
Principio de parquedad
Mtodo flexible
Qu mtodo paramtrico?
Fcil de implementar
Evitamos el error al elegir
funciones de densidad errneas
m errnea
1. Introduccin
1.3. Ventajas
Maximo Camacho Estimacin no-paramtrica 8
Muestras grandes
Existen varios no-paramtricos
Qu mtodo usar?
Resultados menos intuitivos
Inferencia
1. Introduccin
1.4. Inconvenientes
Maximo Camacho Estimacin no-paramtrica 9
2. Funciones de densidad
Introduccin
Tipos de estimacin no-paramtrica
Histograma
Kernel
Kernel adaptativa
Vecino ms cercano
Estimacin kernel
Propiedades
Datos multivariantes
Maximo Camacho Estimacin no-paramtrica 10
Densidad univariante
Ejemplo
Copas y Fryer (1980)
y
t
duracin 86 pacientes tras suicidio
Ntese:
y > 0
y suele ser pequea
2. Estimacin funciones densidad
2.1. Introduccin
Maximo Camacho Estimacin no-paramtrica 11
Histograma
Kernel: Rosenblatt (1956)
Vecino ms cercano: Loftsgaarcen y Quesenberry
(1965)
Kernel variable: Breiman, Meisel y Purcell (1977)
2. Estimacin funciones densidad
2.2. Tipos de estimacin no-paramtrica
Maximo Camacho Estimacin no-paramtrica 12
2. Estimacin funciones densidad
2.2. Tipos de estimacin no-paramtrica
Sean:
Un punto de partida y
0
Un radio h
Para cada natural m se define
La bola [ y
0
+mh, y
0
+(m+1)h ), m = 0,1,2,...
1. Histograma
nh
B #
) y ( f
i
i
Maximo Camacho Estimacin no-paramtrica 13
0
0,001
0,002
0,003
0,004
0,005
0,006
0,007
0,008
0,009
-
5
0
1
0
7
0
1
3
0
1
9
0
2
5
0
3
1
0
3
7
0
4
3
0
4
9
0
5
5
0
6
1
0
6
7
0
7
3
0
7
9
0
2. Estimacin funciones densidad
2.2. Tipos de estimacin no-paramtrica
1. Histograma
y
0
= -50
h = 30
Maximo Camacho Estimacin no-paramtrica 14
2. Estimacin funciones densidad
2.2. Tipos de estimacin no-paramtrica
1. Histograma
Ventajas
Fcil aplicacin
Inconvenientes
Depende de y
0
Discontinuidades:
no derivadas
Mltiples
explicativas
Maximo Camacho Estimacin no-paramtrica 15
2. Estimacin funciones densidad
2.2. Tipos de estimacin no-paramtrica
2. Estimacin kernel: definiciones
Una funcin de densidad f(y) satisface:
1.
2. f (y) 0
Una funcin kernel K(y) slo satisface 1
1 dy ) y ( f
Maximo Camacho Estimacin no-paramtrica 16
2. Estimacin funciones densidad
2.2. Tipos de estimacin no-paramtrica
2. Estimacin kernel: estimador
Definimos estimador kernel:
Simplificamos: K es la normal
estandarizada
(
,
\
,
(
j
n
i
i
h
y y
K
nh
y f
1
1
) (
n
1 i
i
)
h
y y
( K
nh
1
) y ( f
y
F(y )
x
x x x x x x
Maximo Camacho Estimacin no-paramtrica 18
2. Estimacin funciones densidad
2.2. Tipos de estimacin no-paramtrica
2. Estimacin kernel: el papel de h
y
F(y )
x x x x x
n
1 i
i
)
h
y y
( K
nh
1
) y ( f
) y ( f
) y ( f
Inconvenientes
Eleccin de K, h
h fija: problemas en
distribiciones
asimtricas
Maximo Camacho Estimacin no-paramtrica 20
2. Estimacin funciones densidad
2.2. Tipos de estimacin no-paramtrica
2. Estimacin kernel: kernel a examen
h=15
-200 -50 100 250 400 550 700 850
Maximo Camacho Estimacin no-paramtrica 21
2. Estimacin funciones densidad
2.2. Tipos de estimacin no-paramtrica
2. Estimacin kernel: kernel a examen
h=60
-200 -50 100 250 400 550 700 850
Maximo Camacho Estimacin no-paramtrica 22
2. Estimacin funciones densidad
2.2. Tipos de estimacin no-paramtrica
3. Estimacin kernel adaptativa
Definimos
i
adapta la ventana a cada observacin: resta peso
a observaciones aisladas
n
1 i
i
i
i
)
h
y y
( K
h
1
n
1
) y ( f
Maximo Camacho Estimacin no-paramtrica 23
2. Estimacin funciones densidad
2.2. Tipos de estimacin no-paramtrica
3. Estimacin kernel adaptativa
-200 -50 100 250 400 550 700 850
Maximo Camacho Estimacin no-paramtrica 24
2. Estimacin funciones densidad
2.2. Tipos de estimacin no-paramtrica
4. Estimacin vecino ms cercano
Consideremos: d (x,y) = | x - y |
Ordenamos: d
1
(y) d
2
(y) ... d
n
(y)
d
n
( y ) = distancia entre ( observacin ms lejana a y, y )
Definimos
Ventana grande (curva suave) en obs. atpicas
(
(
,
\
,
,
(
j
n
1 i
k
i
k
) y ( d
y y
K
) y ( nd
1
) y ( f
k ~ n ^ (1/2)
Maximo Camacho Estimacin no-paramtrica 25
2. Estimacin funciones densidad
2.2. Tipos de estimacin no-paramtrica
4. Estimacin vecino ms cercano
-200 -50 100 250 400 550 700 850
Maximo Camacho Estimacin no-paramtrica 26
2. Estimacin funciones densidad
2.3. Estimacin Kernel
1. Supuestos adicionales
K simtrica
1 dt ) t ( K
0 dt ) t ( tK
0 k dt ) t ( K t
2
2
f derivadas
continuas de
cualquier orden
Maximo Camacho Estimacin no-paramtrica 27
2. Estimacin funciones densidad
2.3. Estimacin Kernel
2. Error Cuadrtico Medio: definicin
( ) dy ) y ( f
) y ( f E ECM
2
dy ) y ( f
E ) y ( f
2
+ dy ) y ( f
E ) y ( f
E
2
! !! ! (varianza) dy
! !! !(sesgo)
2
dy
Maximo Camacho Estimacin no-paramtrica 28
2. Estimacin funciones densidad
2.3. Estimacin Kernel
2. Error Cuadrtico Medio: sesgo
! !! !(sesgo)
2
dy
Aplicar propiedades de K
Expansin de Taylor
( )
dy ) y ( ' ' f k h
4
1
2
2
2
4
(Aumenta con h)
Maximo Camacho Estimacin no-paramtrica 29
2. Estimacin funciones densidad
2.3. Estimacin Kernel
2. Error Cuadrtico Medio: varianza
! !! !varianza
dy
Aplicar propiedades de K
Expansin de Taylor
dy ) y ( K
nh
1
2
(Disminuye con h)
Maximo Camacho Estimacin no-paramtrica 30
2. Estimacin funciones densidad
2.3. Estimacin Kernel
3. El papel de la ventana
h: aumenta sesgo y diminuye varianza
.
minimiza el ECM
pequea para
n grande
densidades fluctuacin rpida
h
Nopt
= 1.06 n
-1/5
( ) ( ) ( )
5 / 1
5 / 1
2
5 / 1
2
5 / 2
2 opt
n dy ) y ( ' ' f dt ) y ( K k h
dy ) y ( K , ' ' f , n g
2
Maximo Camacho Estimacin no-paramtrica 32
2. Estimacin funciones densidad
2.3. Estimacin Kernel
4. El papel del Kernel
Epanechnikov
Gausiana
Rectangular
<
(
,
\
,
(
j
resto 0
5 | y | 5 / y
5
1
1
4
3
2
) y ) 2 / 1 exp(( 2 / 1
2
n
i
i i
y f
n
h VCMV
1
) (
log
1
) (
Maximo Camacho Estimacin no-paramtrica 34
2. Estimacin funciones densidad
2.3. Estimacin Kernel
5. Propiedades asintticas
Consistencia puntual. Bajo f continua y:
! |K(y)| dy < , !K(y)dy = 1
| y K(y) | 0 si | y |
h
n
0 y nh
n
si n
entonces
) y ( f ) y ( f
p
Maximo Camacho Estimacin no-paramtrica 35
2. Estimacin funciones densidad
2.3. Estimacin Kernel
5. Propiedades asintticas
Consistencia funcional.
Bajo los supuestos anteriores
K no negativa
entonces, con probabilidad 1:
0 | ) ( ) (
dy y f y f
Maximo Camacho Estimacin no-paramtrica 36
2. Estimacin funciones densidad
2.3. Estimacin Kernel
6. Datos multivariantes
Suponemos Y
i
vector d-dimensional
Definicin
Ejemplo: si el Kernel es gausiano
( )
(
,
\
,
(
j
n
1 i
i
d
Y Y
h
1
K
nh
1
) Y ( f
( ) ) Y ' Y 2 / 1 exp( 2 ) Y ( K
2 / d
(
,
\
,
(
j
(
,
\
,
(
j
p
n
nh
0 h
si
Maximo Camacho Estimacin no-paramtrica 43
3. Estimacin de funciones
3. 2. Nadaraya-Watson: ECM
( ) dy ) x ( m
) x ( m E ECM
2
= ! !! !(sesgo)
2
dy + ! !! !varianza
dy
= h
4
B
2
(x) + n
-1
h
-1
V(x)
donde B
2
(x) y V(x) dependen de:
m, f y var(x)
Maximo Camacho Estimacin no-paramtrica 44
3. Estimacin de funciones
3. 2. Nadaraya-Watson: papel de h
Serie: tasa crecimiento US GDP 1947.2-2000.3
Serie real
Serie estimada
h = 0.01
Maximo Camacho Estimacin no-paramtrica 45
3. Estimacin de funciones
3. 2. Nadaraya-Watson: papel de h
Serie: tasa crecimiento US GDP 1947.2-2000.3
h = 2
Serie estimada
Serie real
Maximo Camacho Estimacin no-paramtrica 46
3. Estimacin de funciones
3. 2. Nadaraya-Watson: eleccin de h
Hrdle y Vieu (1990)
Para series temporales: validacin cruzada
h que minimiza
j i
j j i i
) x ( w y
1 n
1
) x ( m
con
( )
n
1 i
2
i i i
) x ( m
y
n
1
) h ( CV
Maximo Camacho Estimacin no-paramtrica 47
3. Estimacin de funciones
3. 3. Estimacin vecino ms cercano
donde w
ki
(x) = n / k si x
i
es una de las k
observaciones ms cercanas a x (0 en otro caso)
Efectos de k
k >= n serie estimada = media de y
k = 1 serie estimada = serie real
i ki
1
y ) x ( w n ) x ( m
( m
) y ( m
y
) y ( m
y
2 n 3 n
1 n 2 n
n 1 n
+ +
+ +
+
3. Estimacin funciones
3.5. Prediccin