Documentos de Académico
Documentos de Profesional
Documentos de Cultura
j=0
w
j
x
j
(1)
donde los coecientes w
0
, . . . , w
M
son denotados colectivamente como w.
14 Facundo Bromberg c - Inteligencia Articial II - 2011
Fitear la curva implica en la prctica estimar estos coecientes a partir de
los datos. Antes de explicar como se estiman estos coecientes notemos que
a pesar de que la funcin polinomial y(x, w) es no-lineal en x, es lineal en los
coecientes w. Las funciones que son lineales con respecto a los parametros
desconocidos tienen importantes propiedades y se les llama modelos lineales.
Para determinar los valores de los coecientes tearemos el polinomio a
los datos minimizando una funcin de error que mida, para cierto valor de
w, los errores entre y(x, w) y el valor de entrenamiento t:
E(w) =
1
2
N
n=1
[y(x
n
, w) t
n
]
2
Vemos as que este error valdr cero cuando la funcin y(x, w) pase exacta-
mente a travs de cada punto de entrenamiento, por ejemplo, el polinomio
de grado M = 9 de la Fig. 4 (Abajo a la Derecha).
Fitear la curva puede hacerse entonces eligiendo el valor de w que minim-
ice el error E(w). Dado que la funcin error es cuadrtica en w, su derivada
ser lineal, y por lo tanto existira una sola solucin que denotamos w
,
calculable analticamente.
4.1. Performance bias y el problema del sobre-teo
Hasta aqu hemos llegado con el bias absoluto, quedandonos la impor-
tante decisin de decidir el bias de performance de complejidad del modelo,
tambin conocido como el problema de seleccin de modelos, que en este ca-
so se traduce en decidir sobre el grado del polinomio M. La Fig. 4 muestra
las curvas y(x, w
2E(w
)/N
donde la division por N permite una comparacin igualitaria para distintos
tamaos de datasets, y la raz cuadrada asegura que E
RMS
es medido en la
misma escala que los valores de salida t.
Figura 6: E
RMS
(root-mean-squared error) evaluado en el conjunto de en-
trenamiento (circulos azules) y testeo (rojo o gris oscuro) para varios valores
del grado del polinomio M. Extrado de (Bishop, 2006)
.
La Fig. 6 presenta el root-mean-squared error del conjunto de entre-
namiento (circulos azules) y conjunto de testeo (rojo o gris oscuro) para
distintos valores de M. El error para el conjunto de testeo mide cuan bien
el polinomio y(x, w
n=1
[y(x
n
, w) t
n
]
2
+
2
||w||
2
donde ||w||
2
= w
T
w = w
2
o
+ w
2
1
+ . . . + w
2
M
, y el coeciente gobierna la
importancia relativa del trmino de la regularizacin y el error cuadrtico
medio.
Como encontramos el valor de entonces? Al igual que antes, mini-
mizamos el error con respecto a todos los coecientes: w y . La Fig. 9
muestra teos de polinomios de grado M = 9 regularizados con ln = 18
18 Facundo Bromberg c - Inteligencia Articial II - 2011
(izquierda) y ln = 0 (derecha). Vemos que para ln = 18 el sobre-teo
ha sido eliminado, aunque aumentando demasiado el valor de (i.e., penal-
izando demasiado el error) obtenemos nuevamente un mal teo.
Figura 10: Izquierda: Tabla de coecientes w