Está en la página 1de 5

Regresin lineal

de padres e hijos, donde result que los hijos cuyos padres tenan una estatura muy superior al valor medio, tendan a igualarse a ste, mientras que aquellos cuyos padres
eran muy bajos tendan a reducir su diferencia respecto a
la estatura media; es decir, regresaban al promedio.[2]
La constatacin emprica de esta propiedad se vio reforzada ms tarde con la justicacin terica de ese fenmeno.
El trmino lineal se emplea para distinguirlo del resto de
tcnicas de regresin, que emplean modelos basados en
cualquier clase de funcin matemtica. Los modelos lineales son una explicacin simplicada de la realidad,
mucho ms giles y con un soporte terico mucho ms
extenso por parte de la matemtica y la estadstica.

Ejemplo de una regresin lineal con una variable dependiente y


una variable independiente.

Pero bien, como se ha dicho, podemos usar el trmino


En estadstica la regresin lineal o ajuste lineal es un lineal para distinguir modelos basados en cualquier clase
mtodo matemtico que modela la relacin entre una de aplicacin.
variable dependiente Y, las variables independientes Xi y
un trmino aleatorio . Este modelo puede ser expresado
como:

2 El modelo de regresin lineal

Yt = 0 +1 X1 +2 X2 + +p Xp +

El modelo lineal relaciona la variable dependiente Y


con K variables explicitas Xk (k = 1,...K), o cualquier
Yt : variable dependiente, explicada o regresando.
transformacin de stas que generen un hiperplano de
X1 , X2 , , Xp : variables explicativas, independientes parmetros k desconocidos:
o regresores.

(2) Y = k Xk +
, , , , : parmetros, miden la inuencia que
0

las variables explicativas tienen sobre el regresando.


donde es la perturbacin aleatoria que recoge todos
aquellos factores de la realidad no controlables u observables y que por tanto se asocian con el azar, y es la que
conere al modelo su carcter estocstico. En el caso ms
sencillo, con una sola variable explicita, el hiperplano es
una recta:

donde 0 es la interseccin o trmino constante, las


i (i > 0) son los parmetros respectivos a cada variable
independiente, y p es el nmero de parmetros independientes a tener en cuenta en la regresin. La regresin
lineal puede ser contrastada con la regresin no lineal.

(3) Y = 1 + 2 X2 +

Historia

El problema de la regresin consiste en elegir unos valores


determinados para los parmetros desconocidos k , de
modo que la ecuacin quede completamente especicada.
Para ello se necesita un conjunto de observaciones. En
una observacin i-sima (i= 1,... I) cualquiera, se registra
el comportamiento simultneo de la variable dependiente
y las variables explicitas (las perturbaciones aleatorias se
suponen no observables).

La primera forma de regresin lineal documentada fue el


mtodo de los mnimos cuadrados que fue publicada por
Legendre en 1805,[1] y en dnde se inclua una versin
del teorema de Gauss-Mrkov.

1.1

Etimologa

El trmino regresin se utiliz por primera vez en el estudio de variables antropomtricas: al comparar la estatura

(4) Yi =
1

k Xki + i

5 TIPOS DE MODELOS DE REGRESIN LINEAL

Los valores escogidos como estimadores de los parmetros k , son los coecientes de regresin sin que se pueda
garantizar que coincida n con parmetros reales del proceso generador. Por tanto, en
(5) Yi =


k Xki + i

Los valores i son por su parte estimaciones o errores de


la perturbacin aleatoria.

2. Que los errores en la medicin de las variables explicativas sean independientes entre s.
3. Que los errores tengan varianza constante.
(Homocedasticidad)
4. Que los errores tengan una esperanza matemtica
igual a cero (los errores de una misma magnitud y
distinto signo son equiprobables).
5. Que el error total sea la suma de todos los errores.

Hiptesis del modelo de regresin 5 Tipos de modelos de regresin lilineal clsico


neal

1. Esperanza matemtica nula.


E(i ) = 0

Existen diferentes tipos de regresin lineal que se clasican de acuerdo a sus parmetros:

Para cada valor de X la perturbacin tomar distintos valores de forma aleatoria, pero no tomar sistemticamen- 5.1 Regresin lineal simple
te valores positivos o negativos, sino que se supone tomar algunos valores mayores que cero y otros menores que Slo se maneja una variable independiente, por lo que
cero, de tal forma que su valor esperado sea cero.
slo cuenta con dos parmetros. Son de la forma:[4]
2. Homocedasticidad
V ar(t ) = E(t Et )2 = E2t = 2 para todo t

(6) Yi = 0 + 1 Xi + i

Xi y
Todos los trminos de la perturbacin tienen la misma donde i es el error asociado a la medicin del valor
2
siguen
los
supuestos
de
modo
que

N
(0,

)
(media
i
varianza que es desconocida. La dispersin de cada t en
cero, varianza constante e igual a un y i j con
torno a su valor esperado es siempre la misma.
i = j ).
3. Incorrelacin.
Cov(t , s ) = (t Et )(s Es ) = Et s = 0 para
todo t,s con t distinto de s

5.1.1 Anlisis

Las covarianzas entre las distintas pertubaciones son nu- Dado el modelo de regresin simple, si se calcula la
las, lo que quiere decir que no estn correlacionadas. Esto esperanza (valor esperado) del valor Y, se obtiene:[5]
implica que el valor de la perturbacin para cualquier ob(7) E(yi ) = yi = E(0 ) + E(1 xi ) +
servacin muestral no viene inuenciado por los valores
E(
i)
de las perturbaciones correspondientes a otras observaciones muestrales.
Derivando respecto a 0 y 1 e igualando a cero, se
4. Regresores no estocsticos.
obtiene:[5]

5. No existen relaciones lineales exactas entre los regre2


i yi )
(9) (y
=0
sores.

0

6. T > k + 1 Suponemos que no existen errores de


especicacin en el modelo, ni errores de medida en las
variables explicativas
7. Normalidad de las perturbaciones N (0, 2 )

Supuestos del modelo de regresin lineal

Para poder crear un modelo de regresin lineal es necesario que se cumpla con los siguientes supuestos:[3]
1. Que la relacin entre las variables sea lineal.

(10)

(yi yi )2
1

=0

Obteniendo dos ecuaciones denominadas ecuaciones normales que generan la siguiente solucin para ambos
parmetros:[4]
(11) 1

(x
y)
x)(y
(x
x)2

(12) 0 =

y1
n

x
yn
xy
2
2
( x) n
x

= y 1 x

La interpretacin del parmetro medio 1 es que un incremento en Xi de una unidad, Yi incrementar en 1

7.1

5.2

Lneas de tendencia

Regresin lineal mltiple

La regresin lineal permite trabajar con una variable a


nivel de intervalo o razn. De la misma manera, es posible analizar la relacin entre dos o ms variables a travs
de ecuaciones, lo que se denomina regresin mltiple o
regresin lineal mltiple.
Constantemente en la prctica de la investigacin estadstica, se encuentran variables que de alguna manera estn
relacionadas entre s, por lo que es posible que una de las
variables puedan relacionarse matemticamente en funcin de otra u otras variables.
Maneja varias variables independientes. Cuenta con varios parmetros. Se expresan de la forma:[6]
(13) Yi = 0 +

i Xip + i

7.1 Lneas de tendencia


Una lnea de tendencia representa una tendencia en una
serie de datos obtenidos a travs de un largo perodo. Este
tipo de lneas puede decirnos si un conjunto de datos en
particular (como por ejemplo, el PBI, el precio del petrleo o el valor de las acciones) han aumentado o decrementado en un determinado perodo.[8] Se puede dibujar una
lnea de tendencia a simple vista fcilmente a partir de un
grupo de puntos, pero su posicin y pendiente se calcula de manera ms precisa utilizando tcnicas estadsticas
como las regresiones lineales. Las lneas de tendencia son
generalmente lneas rectas, aunque algunas variaciones
utilizan polinomios de mayor grado dependiendo de la
curvatura deseada en la lnea.

7.2 Medicina

donde i es el error asociado a la medicin i del valor


relacionando la
Xip y siguen los supuestos de modo que i N (0, 2 ) En medicina, las primeras evidencias
[9]
mortalidad
con
el
fumar
tabaco
vinieron
de estudios
(media cero, varianza constante e igual a un y i j
que
utilizaban
la
regresin
lineal.
Los
investigadores
incon i = j ).
cluyen una gran cantidad de variables en su anlisis de
regresin en un esfuerzo por eliminar factores que pudieran producir correlaciones espurias. En el caso del
6 Rectas de regresin
tabaquismo, los investigadores incluyeron el estado socioeconmico para asegurarse que los efectos de mortalidad
Las rectas de regresin son las rectas que mejor se ajus- por tabaquismo no sean un efecto de su educacin o positan a la nube de puntos (o tambin llamado diagrama cin econmica. No obstante, es imposible incluir todas
de dispersin) generada por una distribucin binomial. las variables posibles en un estudio de regresin.[10][11]
Matemticamente, son posibles dos rectas de mximo En el ejemplo del tabaquismo, un hipottico gen podra
ajuste:[7]
aumentar la mortalidad y aumentar la propensin a adquirir enfermedades relacionadas con el consumo de tabaco.
Por esta razn, en la actualidad las pruebas controladas
La recta de regresin de Y sobre X:
aleatorias son consideradas mucho ms conables que los
anlisis de regresin.
xy
)
(14) y = y + 2 (x x
x

La recta de regresin de X sobre Y:


(15) x = x
+

xy
y2 (y

y)

La correlacin (r) de las rectas determinar la calidad


del ajuste. Si r es cercano o igual a 1, el ajuste ser bueno
y las predicciones realizadas a partir del modelo obtenido sern muy ables (el modelo obtenido resulta verdaderamente representativo); si r es cercano o igual a 0, se
tratar de un ajuste malo en el que las predicciones que
se realicen a partir del modelo obtenido no sern ables
(el modelo obtenido no resulta representativo de la realidad). Ambas rectas de regresin se intersecan en un punto
llamado centro de gravedad de la distribucin.

Aplicaciones de la regresin lineal

7.3 Informtica
Ejemplo de una rutina que utiliza una recta de regresin
lineal para proyectar un valor futuro: Cdigo escrito en
PHP
<?php //Licencia: GNU/GPL $xarray=array(1,
2, 3, 4, 5 ); //Dias $yarray=array(5, 5, 5, 6.8,
9); //Porcentaje de ejecucion $pm=100; //Valor futuro $x2=0; $y=0; $x=0; $xy=0; $cantidad=count($xarray);
for($i=0;$i<$cantidad;$i++){
//Tabla de datos print ($xarray[$i]. ---- ".$yarray[$i]."<br>"); //Calculo de terminos $x2 +=
$xarray[$i]*$xarray[$i]; $y += $yarray[$i]; $x +=
$xarray[$i]; $xy += $xarray[$i]*$yarray[$i]; } //Coeciente parcial de regresion $b=($cantidad*$xy$x*$y)/($cantidad*$x2-$x*$x); //Calculo del intercepto $a=($y-$b*$x)/$cantidad; //Recta tendencial
//y=a+bx //Proyeccion en dias para un 100% de
la ejecucion: if ($b!=0) $dias_proyectados=($pm$a)/$b; else $dias_proyectados=999999; //Innitos

11 ENLACES EXTERNOS

$dp=round($dias_proyectados,0); if($dp<=$pm) print [11] Efecto del tabaquismo, los sntomas respiratorios y el asma sobre la espirometra de adultos de la Ciudad de Mxi$dp."---> Culmina antes de los $pm dias <br>"; if($dp
co, Justino Regalado-Pineda; Alejandro Gmez-Gmez;
>$pm) print $dp ."---> ALARMA: No culmina antes de
Javier Ramrez-Acosta; Juan Carlos Vzquez-Garca
los $pm dias <br>"; ?>

10 Bibliografa
8

Vase tambin
Homoscedasticidad
Regresin logstica
Modelos de regresin mltiple postulados y no postulados
Regresin segmentada
Econometra
Mnimos cuadrados

Devore, Jay L.; Probabilidad y Estadstica para Ingeniera y Ciencias. International Thomson Editores.
Mxico. ISBN-10: 9706864571.
Walpole, Ronald E.; Raymond H.; Myers, Sharon L.; Probabilidad y Estadstica para Ingenieros. Pretice-Hall Hispanoamericana, S.A. Mxico.
ISBN-10: 9701702646.
Canavos, George C.; Probabilidad y Estadstica.
Aplicaciones y Mtodos. McGraw-Hill. Mxico.
ISBN-10: 9684518560.

Regularizacin de Tikhonov
Cuarteto de Anscombe
Capital Asset Pricing Model

Referencias

11 Enlaces externos
Clculo de regresiones lineales en lnea. (en ingls)
ZunZun.com Ajuste de curvas y supercies en lnea.
(en ingls)

[1] C.F. Gauss. Theoria combinationis observationum erroribus minimis obnoxiae. (1821/1823)

xuru.org Herramientas de regresin lineal en lnea.


(en ingls)

[2] Introduction to linear regression Curvet.com (en ingls)

Simulacin de la recta de regresion de una variable


bidimensional continua con R (lenguaje de programacin)

[3] Anlisis de regresin lineal, Universidad Complutense


de Madrid
[4] Frmulas, Probabilidad y Estadstica. Cs. Bsicas.
U.D.B. Matemtica. Universidad Tecnolgica Nacional,
Facultad Regional Buenos Aires. Editorial CEIT-FRBA.
(Cdigo BM2BT2)
[5] Modelo de regresin lineal simple. EinsteinNet.
[6] Tcnicas de regresin: Regresin Lineal Mltiple. Prtega
Daz, S., Pita Fernndez, S. Unidad de Epidemiologa Clnica y Bioestadstica. Complejo Hospitalario de La Corua (Espaa)
[7] Apunte sobre Rectas de regresin. Ministerio de Educacin y Ciencia. Gobierno de Espaa.
[8] Utilizacin de las lneas de tendencia, Paritech (en ingls)
[9] Doll R, Peto r, Wheatley K, Gray R et al. Mortality in relation to smoking: 40 years observations on male British
doctors .BMJ 1994;309:901-911 (8 de octubre]
[10] Environmental Tobacco Smoke and Adult Asthma Division of Pulmonary and Critical Care Medicine, Division of Occupational and Environmental Medicine; Department of Medicine, Institute for Health Policy Studies; and Department of Epidemiology and Biostatistics,
Universidad de California, San Francisco, California. (en
ingls)

12
12.1

Text and image sources, contributors, and licenses


Text

Regresin lineal Fuente: http://es.wikipedia.org/wiki/Regresi%C3%B3n%20lineal?oldid=79725287 Colaboradores: Joseaperez, JorgeGG, Riviera, Elwikipedista, Tano4595, Felipealvarez, Magister Mathematicae, Alhen, BOT-Superzerocool, Vitamine, Gaeddal, GermanX, Baneld, BOTpolicia, CEM-bot, Daniel De Leon Martinez, Laura Fiorucci, Marianov, Roberpl, Davius, Antur, Gafotas, Ggenellina, Ingenioso Hidalgo, Thijs!bot, Alvaro qc, Xabier, Diego D E, Yeza, Gusgus, JAnDbot, Kved, Rjgalindo, TXiKiBoT, Juan renombrado,
Hlnodovic, Dhcp, Marvelshine, Alesico, Icchu, Snakeeater, VolkovBot, Technopat, Matdrodes, Muro Bot, PaintBot, Drinibot, Pacomegia,
Correogsk, Tirithel, Dnu72, HUB, Antn Francho, Carro e, Botito777, Alexbot, Juan Mayordomo, Raulshc, Hucknall, Chomolungma, AVBOT, MastiBot, HanPritcher, NjardarBot, Diegusjaimes, DrFO.Tn.Bot, Andreasmperu, Luckas-bot, Madmaxsrx, Jcoronelf, El Quinche,
FariBOT, Mcapdevila, SuperBraulio13, Jkbw, Botarel, BOTirithel, TiriBOT, Blinski, TorQue Astur, Rouxfederico, PatruBOT, AldanaN,
Ivanpares, EmausBot, Sergio Andres Segovia, ConPermiso, Gecime, Alfonso Aguilar, Fbport, MerlIwBot, Acratta, Johnbot, Elvisor, Maria
Antonia Aguilar C., Balles2601 y Annimos: 115

12.2

Images

Archivo:Artculo_bueno.svg Fuente: http://upload.wikimedia.org/wikipedia/commons/e/e5/Art%C3%ADculo_bueno.svg Licencia: Public domain Colaboradores: Circle taken from Image:Symbol support vote.svg Artista original: Paintman y Chabacano
Archivo:Linear_regression.svg Fuente: http://upload.wikimedia.org/wikipedia/commons/3/3a/Linear_regression.svg Licencia: Public
domain Colaboradores: Trabajo propio Artista original: Sewaqu

12.3

Content license

Creative Commons Attribution-Share Alike 3.0

También podría gustarte