Está en la página 1de 4

REGRESIÓN LINEAL

En muchos problemas existe una relación inherente entre dos o más variables, y resulta
necesario explorar la naturaleza de dicha relación. El análisis de regresión es una
técnica estadística para el modelado y la investigación de la relación entre dos o más
variables. En nuestro caso sólo analizaremos la dependencia entre dos variables. Por
ejemplo, en el Laboratorio de Física se puede realizar una práctica donde se investigue
la dependencia de la posición en función del tiempo para un movimiento rectilíneo
uniforme, o bien se puede investigar el comportamiento de un resorte, es decir medir el
estiramiento del resorte en función de distintos pesos. En todos estos ejemplos podemos
definir una variable independiente, que llamaremos por comodidad x, y otra variable
dependiente, que llamaremos y. La idea es encontrar la relación y = f (x) . Ahora bien,
dadas las limitaciones en tiempo del curso supondremos que la relación es del tipo
lineal, es decir, y = a.x + b , donde a es la pendiente de la recta y b la ordenada al
origen.

Supongamos que los n pares de observaciones sean: (x1,y1); (x2,y2);......... (xn,yn). En la


figura 1 se representan los puntos, una recta y el error e1; e2; .... en entre la coordenada y
del valor observado y la correspondiente coordenada en la recta. Luego, para encontrar

40

en
y = a.x+b
30
(xn,yn)
(x1,y1)

e1
eje y

20

(x2,y2)
10
e4
e2

(x4,y4)
e3
0
(x3,y3)
0 5 10 15 20
eje X

Fig.1. Diagrama de dispersión.


la ecuación de la recta se aplica el método de los cuadrados mínimos, donde se
n n
minimiza la siguiente suma: ∑ e 2 = ∑ ( yi − a.xi − b) 2 . Las ecuaciones matemáticas
i =1 i i =1

para obtener el valor de la pendiente y ordenada al origen escapan a los alcances de este
curso.
A continuación brindaremos las ecuaciones correspondientes para obtener a y b.

n
∑ ( xi − x ).( yi − y )
S xy
[1] a = , b = y − a.x , donde a S xy = i =1 se lo denomina
S x2 n

n
2
∑ ( xi − x )
covarianza y S x2 = i =1 es la varianza.
n

S xy
De esta manera podremos escribir la ecuación de la recta como: y − y = ( x − x ) [2]
S x2

Por lo general, muchas calculadoras científicas poseen un modo (Modo REG) que
permite el cálculo de la pendiente y la ordenada al origen con sólo ingresar los pares
ordenados de puntos.
Como aplicación tratemos de encontrar una relación entre la superficie de distintos
rectángulos de papel y su peso. Para ello supondremos que se puede plantear una
relación lineal de la superficie en función del peso. Por ello, la variable independiente
será el peso y la variable dependiente la superficie. En la tabla I se pueden apreciar los
valores obtenidos.
Superficie Peso
cm2 gramos
Y: cm2 X: gr.
121 0,340
100 0,203
81 0,150
64 0,101
144 0,454
169 0,609
196 0,761
225 0,871

Tabla I. Pesos para distintas superficies.


A continuación, realizaremos las cuentas a mano. x = 0,436125 gr y = 137,5 cm 2

S 2 = 0,07282861 gr 2 , y
x

(0,34 − 0, 436125).(121 − 137,5) + (0, 203 − 0,436125).(100 − 137,5) + ... + (0,871 − 0,436125).( 225 − 137,5)
S xy =
8

S xy = 14,21806261 . Ahora si reemplazamos en la expresión [1] resultará:

a = 195,226335 b = 52,3569146 con lo cual podremos escribir la ecuación de la


recta como:
Superficie = 195,226335. área + 52,3569146
En la figura 2 representamos el gráfico de dispersión y la recta hallada.

Datos observados
y=195,226335.x+52,3569146
200
área (cm )
2

150

100

50
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9
Peso (gr)

Figura 2. Datos experimentales y recta de regresión lineal.


Por último, en la figura 3 se muestran tres gráficas, en la primera se observa que todos
los puntos se disponen sobre una recta perfecta. En el segundo gráfico, se observa que
existe cierta relación lineal entre las variables. En cambio, en el tercer gráfico carece de
sentido trazar un recta, en este caso no tiene sentido plantear una relación lineal., esto
no significa que no exista otro tipo de relación entre las variables.
S xy
Se define el coeficiente de correlación, r, como: r = con 0 ≤ r ≤ 1 , el mismo
SxS y

permite medir la bondad del ajuste. Así si r = 1 , tendremos un ajuste perfecto; si r ≈ 1

o cercano a 1, entonces tiene sentido plantear una relación lineal, y para r = 0 se dice
que carece de sentido plantear una relación lineal.

Así como obtuvimos con la calculadora gráfica o científica el valor de a y b, también se


puede obtener el coeficiente de correlación r, y para el ejemplo planteado tenemos
r = 0,99297. Al coeficiente de correlación en algunos libros se lo denomina coeficiente
de Pearson.
También algunos libros definen el coeficiente de determinación como: CD = r2100 y el
mismo es interpretado como la proporción de variación y observada que puede ser
explicada por el modelo de regresión lineal.

También podría gustarte