Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
1.2 Predicción y estimación
La asociación entre m variables aleatorias las trata de manera simétrica, por
ejemplo, estudiar la asociación entre X e Y lequivale a estudiar la asociación
entre Y y X. Esta simetrı́a se rompe cuando se desea predecir el valor de una
de ellas, Y , denominada variable respuesta en función de los valores de otras
variables.
Es importante distinguir dos casos:
(b) x no es aleatorio, sino que está fijo por diseño, por ejemplo cuando él
está bajo control de un experimentador.
2
descripción parcial es la varianza v(x) = σ 2 (x), pero nuevamente la función
v es desconocida y es aún más difı́cil de estimar que h.
2 El enfoque funcional
2.1 Enfoque no paramétrico
Denotemos por xi el valor asociado con yi y por X0 = {x1 , . . . , xn } al conjunto
de valores asociados con los yi . Por definición de la función de regresión, Yi
es un estimador insesgado de h(xi ). Cuando hay r observaciones y1 , . . . , yr
asociadas con un valor x ∈ X0 , el estimador natural es el promedio de ellas.
En esta sección consideraremos el caso univariado, siendo inmediatas las
extensiones al caso de multiples predictores. Supondremos que X será un
intervalo en IR (que contiene infinitos puntos), mientras que X0 contiene a
lo más n puntos, a los que suele llamar puntos experimentales si están bajo
nuestro control. Existe un sinnúmero de métodos estadı́sticos para estimar h
usand muy pocos supuestos. La idea principal es ”pedir prestada” (borrowing
strength) información para puntos cercanos al x de interés.
Suavidad:
En el análisis esploratorio de datos (AED) se suele buscar una tendencia,
la cual es una aproximación de la función de regresión. Esto se representa
geométricamente por la superposición de una curva a la nube de puntos
3
(xi , yi ), i = 1, . . . , n. Notar que hay infinitas funciones ĥ, cuyo gráfico pasa
por todos los puntos, pero ellas carecen de interés, particularmente para n
grande. Si hay dos o más observaciones yi para un mismo valor x, tal ĥ no
existe. La forma de la tendencia suele ser de interés, por ejemplo saber si es o
no creciente. Cuando se sabe que la función es creciente existen métodos de
regresión isotónica. Por otra parte, el contexto suele sugerir que la tendencia
es una función suave. Hay una multiplicidad de métodos no paramétricos
para estimar funciones suaves. La idea general es lograr un compromiso
adecuado entre ajuste (la curva pasa cerca de los puntos) y su suavidad. Una
familia muy importante de métodos es el de estimaciones por núcleo, el cual
es utilixado por la función loess del software computacional R.
4
Notación: En estricto rigor el parámetro debe definir por completo a la
función. Por esta razón, si θ = (θ1 , . . . , θk ) ∈ Θ, los números θi debieran lla-
marse componentes paramétricas. Sin embargo, por un abuso de notación
estas componentes se denominan parámetros y θ se denomina vector de
parámetros. La función h correspondiente a θ podrı́a escribirse como hθ ,
lo que es engorroso. Lo usual es denotar h por h(·, θ) o h(x, θ).
Definamos la función S(·, θ) con dominio Θ por
n
X
S (h(x, θ)) = (yi − h(xi , θ))2 . (2.1)
i=1
5
formulación equivalente, es
k
X
Yi = βj hj (xi ) + i , i = 1, . . . , I, (2.3)
j=1
donde los i se denominan errores, los cuales se supondrán i.i.d. Notar que
estos errores no son observables y contienen coeficientes desconocidos. Sin
embargo, si βj se reemplaza por βˆj se obtienen los residuos
k
X
ei = yi − βˆj hj (xi ). (2.4)
j=1