Está en la página 1de 7

Regresin lineal

Para otros usos de este trmino, vase Funcin lineal (desambiguacin).




Ejemplo de una regresin lineal con una variable dependiente y unavariable independiente.
En estadstica la regresin lineal o ajuste lineal es un mtodo matemtico que modela la relacin
entre una variable dependiente Y, lasvariables independientes X
i
y un trmino aleatorio . Este
modelo puede ser expresado como:

: variable dependiente, explicada o regresando.
: variables explicativas, independientes o regresores.
: parmetros, miden la influencia que las variables explicativas tienen sobre
el regresando.
donde es la interseccin o trmino "constante", las son los parmetros
respectivos a cada variable independiente, y es el nmero de parmetros independientes a tener
en cuenta en la regresin. La regresin lineal puede ser contrastada con la regresin no lineal.
ndice
[ocultar]
1 Historia
o 1.1 Etimologa
2 El modelo de regresin lineal
3 Hiptesis modelo de regresin lineal clsico
4 Supuestos del modelo de regresin lineal
5 Tipos de modelos de regresin lineal
o 5.1 Regresin lineal simple
5.1.1 Anlisis
o 5.2 Regresin lineal mltiple
6 Rectas de regresin
7 Aplicaciones de la regresin lineal
o 7.1 Lneas de tendencia
o 7.2 Medicina
8 Vase tambin
9 Referencias
10 Bibliografa
11 Enlaces externos
[editar]Historia
La primera forma de regresiones lineales documentada fue el mtodo de los mnimos cuadrados, el
cual fue publicado por Legendre en 1805,
1
y en dnde se inclua una versin del teorema de Gauss-
Mrkov.
[editar]Etimologa
El trmino regresin se utiliz por primera vez en el estudio de variables antropomtricas: al
comparar la estatura de padres e hijos, result que los hijos cuyos padres tenan una estatura muy
superior al valor medio tendan a igualarse a ste, mientras que aquellos cuyos padres eran muy
bajos tendan a reducir su diferencia respecto a la estatura media; es decir, "regresaban"
al promedio.
2
La constatacinemprica de esta propiedad se vio reforzada ms tarde con la
justificacin terica de ese fenmeno.
El trmino lineal se emplea para distinguirlo del resto de tcnicas de regresin, que emplean
modelos basados en cualquier clase de funcin matemtica. Los modelos lineales son una
explicacin simplificada de la realidad, mucho ms gil y con un soporte terico por parte de
la matemtica y la estadstica mucho ms extenso.
Pero bien, como se ha dicho, podemos usar el trmino lineal para distinguir modelos basados en
cualquier clase de aplicacin.
[editar]El modelo de regresin lineal
El modelo lineal relaciona la variable dependiente Y con K variables explicativas (k = 1,...K), o
cualquier transformacin de stas, que generan un hiperplano de parmetros desconocidos:
(2)
donde es la perturbacin aleatoria que recoge todos aquellos factores de la realidad no
controlables u observables y que por tanto se asocian con el azar, y es la que confiere al modelo su
carcterestocstico. En el caso ms sencillo, con una sola variable explicativa, el hiperplano es
una recta:
(3)
El problema de la regresin consiste en elegir unos valores determinados para los parmetros
desconocidos , de modo que la ecuacin quede completamente especificada. Para ello se
necesita un conjunto de observaciones. En una observacin cualquiera i-sima (i= 1,... I) se registra
el comportamiento simultneo de la variable dependiente y las variables explicativas (las
perturbaciones aleatorias se suponen no observables).
(4)
Los valores escogidos como estimadores de los parmetros, , son los coeficientes de regresin,
sin que se pueda garantizar que coinciden con parmetros reales del proceso generador. Por tanto,
en
(5)
Los valores son por su parte estimaciones de la perturbacin aleatoria o errores.
[editar]Hiptesis modelo de regresin lineal clsico
1. Esperanza matemtica nula.

Para cada valor de X la perturbacin tomar distintos valores de forma aleatoria, pero no tomar
sistemticamente valores positivos o negativos, sino que se supone que tomar algunos valores
mayores que cero y otros menores, de tal forma que su valor esperado sea cero.
2. Homocedasticidad
para todo t
Todos los trminos de la perturbacin tienen la misma varianza que es desconocida. La dispersin
de cada en torno a su valor esperado es siempre la misma.
3. Incorrelacin. para todo
t,s con t distinto de s
Las covarianzas entre las distintas pertubaciones son nulas, lo que quiere decir que no estn
correlacionadas o autocorrelacionadas. Esto implica que el valor de la perturbacin para cualquier
observacin muestral no viene influenciado por los valores de la perturbacin correspondientes a
otras observaciones muestrales.
4. Regresores no estocsticos.
5. No existen relaciones lineales exactas entre los regresores.
6. Suponemos que no existen errores de especificacin en el modelo ni errores de
medida en las variables explicativas
7. Normalidad de las perturbaciones
[editar]Supuestos del modelo de regresin lineal
Para poder crear un modelo de regresin lineal, es necesario que se cumpla con los siguientes
supuestos:
3

1. La relacin entre las variables es lineal.
2. Los errores en la medicin de las variables explicativas son independientes entre s.
3. Los errores tienen varianza constante. (Homocedasticidad)
4. Los errores tienen una esperanza matemtica igual a cero (los errores de una misma
magnitud y distinto signo son equiprobables).
5. El error total es la suma de todos los errores.
[editar]Tipos de modelos de regresin lineal
Existen diferentes tipos de regresin lineal que se clasifican de acuerdo a sus parmetros:
[editar]Regresin lineal simple
Slo se maneja una variable independiente, por lo que slo cuenta con dos parmetros. Son de la
forma:
4

(6)
donde es el error asociado a la medicin del valor y siguen los supuestos de modo
que (media cero, varianza constante e igual a un y con ).
[editar]Anlisis
Dado el modelo de regresin simple, si se calcula la esperanza (valor esperado) del valor Y, se
obtiene:
5

(7)

Derivando respecto a y e igualando a cero, se obtiene:
5

(9)
(10)
Obteniendo dos ecuaciones denominadas ecuaciones normales que generan la
siguiente solucin para ambos parmetros:
4

(11)
(12)
La interpretacin del parmetro es que un incremento en Xi de una unidad, Yi incrementar
en
[editar]Regresin lineal mltiple
La regresion lineal nos permite trabajar con una variable a nivel de intervalo o razn, as tambin se
puede comprender la relacin de dos o ms variables y nos permitir relacionar mediante
ecuaciones, una variable en relacin a otras variables llamndose Regresin mltiple.
Constantemente en la prctica de la investigacin estadstica, se encuentran variables que de
alguna manera estn relacionados entre si, por lo que es posible que una de las variables puedan
relacionarse matemticamente en funcin de otra u otras variables.
Maneja varias variables independientes. Cuenta con varios parmetros. Se expresan de la forma:
6

(13)
donde es el error asociado a la medicin del valor y siguen los supuestos de modo
que (media cero, varianza constante e igual a un y con ).
[editar]Rectas de regresin
Las rectas de regresin son las rectas que mejor se ajustan a la nube de puntos (o tambin
llamado diagrama de dispersin) generada por una distribucin binomial. Matemticamente, son
posibles dos rectas de mximo ajuste:
7

La recta de regresin de Y sobre X:
(14)
La recta de regresin de X sobre Y:
(15)
La correlacin ("r") de las rectas determinar la calidad del ajuste. Si r es cercano o igual a 1, el
ajuste ser bueno y las predicciones realizadas a partir del modelo obtenido sern muy fiables (el
modelo obtenido resulta verdaderamente representativo); si r es cercano o igual a 0, se tratar de un
ajuste malo en el que las predicciones que se realicen a partir del modelo obtenido no sern fiables
(el modelo obtenido no resulta representativo de la realidad). Ambas rectas de regresin se
intersecan en un punto llamado centro de gravedad de la distribucin.
[editar]Aplicaciones de la regresin lineal
[editar]Lneas de tendencia
Vase tambin: Tendencia.
Una lnea de tendencia representa una tendencia en una serie de datos obtenidos a travs de un
largo perodo. Este tipo de lneas puede decirnos si un conjunto de datos en particular (como por
ejemplo, elPBI, el precio del petrleo o el valor de las acciones) han aumentado o decrementado en
un determinado perodo.
8
Se puede dibujar una lnea de tendencia a simple vista fcilmente a partir
de un grupo de puntos, pero su posicin y pendiente se calcula de manera ms precisa utilizando
tcnicas estadsticas como las regresiones lineales. Las lneas de tendencia son generalmente
lneas rectas, aunque algunas variaciones utilizan polinomios de mayor grado dependiendo de la
curvatura deseada en la lnea.
[editar]Medicina
En medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco
9
vinieron de
estudios que utilizaban la regresin lineal. Los investigadores incluyen una gran cantidad de
variables en su anlisis de regresin en un esfuerzo por eliminar factores que pudieran
producir correlaciones espurias. En el caso del tabaquismo, los investigadores incluyeron el estado
socio-econmico para asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto
de su educacin o posicin econmica. No obstante, es imposible incluir todas las variables posibles
en un estudio de regresin.
10

11
En el ejemplo del tabaquismo, un hipottico gen podra aumentar la
mortalidad y aumentar la propensin a adquirir enfermedades relacionadas con el consumo
de tabaco. Por esta razn, en la actualidad laspruebas controladas aleatorias son consideradas
mucho ms confiables que los anlisis de regresin.
[editar]Vase tambin
Homoscedasticidad
Regresin logstica
Modelos de regresin mltiple postulados y no postulados
Regresin segmentada
Econometra
Mnimos cuadrados
Regularizacin de Tikhonov
Cuarteto de Anscombe
Capital Asset Pricing Model
[editar]Referencias