Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Antonio Lenton
antoniolenton@gmail.com
Samanta Fernandez
samanta.fernandez@gmail.com
Walter Lamagna
...@gmail.com
Noviembre 2010
1.
Modelos no param
etricos
En los modelos tradicionales de regresi
on no lineal se ajusta el modelo general
yi = f (, x0i ) + i
yi = f (xi ) + i
= f (xi1 , xi2 , ..., xik ) + i
2.
Regresi
on Local Polin
omica
2.1.
2.2.
Par
ametros del modelo
Una de las cosas que se deben elegir es el orden de los polinomios a ajustar. Uno cuadratico permite
capturar picos y valles en la fuci
on, sin embargo, un termino lineal tambien tiene un buen desempe
no y
es el valor por defecto en la funcion loess
Otro par
ametro a setear es el ancho de la ventana, la opcion por defecto toma 3/4 de los datos y
puede no ser una buena eleccion, dependiendo del caso.
blablabla.... blablabla.... .....
3.
Aplicaciones
4.
Regresi
on Simple
5.
Regresi
on Multiple
6.
Resoluci
on de un caso en R
6.1.
LOWESS
f: el ancho de ventana tomado para realizar el suavizado. Esto determina la proporcion de puntos
en el plot que influencian el suavizado en cada valor. Valores mas altos dan mayor suavizado
iter: el numero de iteraciones para lograr mayor robustez que deben ejecutarse. Utilizando valores
mas peque
nos la funcion se ejecutar
a mas rapidamente.
delta: los valores de x que caen dentro de un deltade cada uno de los otros, se reemplazan por
un unico valor en el output de lowess
'
data.frame':
$ education:
$ income
:
$ women
:
$ prestige :
$ census
:
$ type
:
11023 ...
...
...
2 ...
> head(dataset)
GOV.ADMINISTRATORS
GENERAL.MANAGERS
ACCOUNTANTS
PURCHASING.OFFICERS
CHEMISTS
PHYSICISTS
De este dataset vamos a tomar la columna income para predecir los valores de prestige
> income = dataset$income
> prestige = dataset$prestige
List of 2
$ x: num [1:102] 14.8 17.3 20.1 20.2 20.8 21.5 23.2 23.3 25.1 25.2 ...
$ y: num [1:102] 1898 2266 2681 2696 2785 ...
lowess devuelve una lista de coordenadas x e y que corresponden a coordenadas de la linea de ajuste,
con esto podemos graficarla:
3
25000
20000
15000
10000
5000
income
20
40
60
80
prestige
Si variamos el par
ametro f de la funcion lowess podemos ver como varia la linea resultado:
25000
f=0.7
25000
f=1
40
5000
80
20
40
prestige
f=0.5
f=0.3
60
prestige
60
25000
20
15000
80
25000
income
15000
5000
income
20
40
60
80
20
prestige
40
60
prestige
5000
15000
5000
income
15000
income
80
25000
f=0.15
25000
f=0.2
40
5000
80
20
40
prestige
f=0.1
f=0.05
60
prestige
60
25000
20
15000
80
25000
income
15000
5000
income
20
40
60
5000
15000
income
15000
5000
income
80
20
prestige
40
60
80
prestige
6.2.
LOESS
parametric: indica si algun termino debe ser ajustado globalmente en vez de en forma local, los
tinos se pueden especificar por nombre, n
umero o como vector del mismo tama
no que el n
umero
de predictores.
drop.square: para ajustes con mas de un predictor y degree = 2, indica si el termino cuadratico
debe ser eliminado para algun predictor en particular. Los terminos se indican del mismo modo
que para parametric
dropped:
normalize: indica si los predictores deben ser normalizados a una escala com
un, en caso de haber
mas de uno. La normalizacion que se utiliza es seteada al 10Debe setearse a falso para predictores
en coordenadas espaciales y otros que tengan escala com
un.
family:
method:
Utilizamos la funcion loess para generar la prediccion para la variable income a partir de la variable
prestige
> to_sort = data.frame(x = prestige, y = income)
> str(to_sort)
data.frame':
102 obs. of 2 variables:
$ x: num 68.8 69.1 63.4 56.8 73.5 77.6 72.6 78.1 73.1 68.8 ...
$ y: int 12351 25879 9271 8865 8403 11030 8258 14163 11377 11023 ...
25000
20000
15000
10000
5000
>
>
>
>
>
>
>
'
20
40
60
x
80
7.
Ventajas
8.
Desventajas
9.
Bibliografa Consultada