Está en la página 1de 5

Regresión Lineal

A. Barajas

Supongamos que realizamos un experimento en el que medimos dos cantidades físicas, con el
objetivo de analizar la relación entre ellas. Por ejemplo, medimos la posición de un carro que
intenta viajar a velocidad constante y que todas las posiciones son medidas con respecto a un
único punto, en este caso, con respecto a un árbol al lado de la calle, como se muestra a
continuación

El objetivo del experimento es determinar la velocidad de dicho carro. Los datos recopilados
pueden ser como se presentan a continuación:

Posición (m) Tiempo (s)


8,0 1
15,8 2
24,1 3
31,6 4
40,1 5
Al graficar estos puntos en un sistema coordenado observamos que entre ellos existe una relación
lineal, es decir, que los datos están ubicados aproximadamente sobre una línea recta

45
40
35
Posición (m)

30
25
20
15
10
5
0
0 1 2 3 4 5 6
Tiempo (s)
Más aún, teóricamente la relación teórica entre la posición y el tiempo para un objeto que se
mueve a velocidad constante, 𝒙 = 𝑣. 𝒕 + 𝑥0 , es justamente la ecuación de una línea recta.

¿Cómo determinar la velocidad del carro? Es común que en este tipo de experimentos, se intente
hallar la velocidad (o la cantidad que se busca) para cada pareja de datos, y luego promediar
todos los resultados, de la siguiente manera

Posición (m/s) Tiempo (s) 𝒗 = 𝒙/𝒕


8,0 1 8,00
15,8 2 7,90
24,1 3 8,03
31,6 4 7,90
40,1 5 8,02
̅ = 7.97
𝒗
Aunque esto parece razonable, este procedimiento no es en realidad apropiado como se mostrara
a continuación: de los datos obtenidos es posible inferir que cuando el tiempo era t=0s, la posición
del carro era x=0m, es decir, que el carro estaba pasando justo al lado del árbol. Imaginemos
ahora que se repite el mismo experimento, con las mismas condiciones, pero que las posiciones
ahora no son medidas con respecto al árbol sino con respecto al hidrante que esta 20 metros más
atrás; esto implicaría que los datos de la posición aumentarían 20 metros cada uno. Al intentar
realizar el mismo análisis que realizamos anteriormente observaríamos un problema:

Posición (m/s) Tiempo (s) 𝒗 = 𝒙/𝒕


28 1 28,0
35,8 2 17,9
44,1 3 14,7
51,6 4 12,9
60,1 5 12,0
𝒗̅ = 17.1
Aunque la velocidad del carro sigue siendo la misma, la velocidad obtenida con nuestro análisis
dista mucho del valor correcto. Aunque este problema se podría arreglar restándole a cada
posición los 20 metros de la posición inicial, en muchos experimentos no sabemos cuánto es dicha
posición inicial, o más aún, nos piden que determinemos cuánto vale esta. Es por este motivo que
estadísticamente este tipo de problemas se solucionan con la regresión lineal.

La regresión lineal es un procedimiento que nos dice cuál es la línea recta que mejor representa el
comportamiento de los datos, o más específicamente, nos dice cuanto seria la pendiente y el
punto de corte con el eje ‘y’ de dicha recta. En general la regresión lineal se puede realizar con una
computadora o una calculadora; en internet se pueden encontrar videos sobre cómo hacerlo. Acá
nos enfocaremos en cómo se interpretan los resultados obtenidos.
En este caso en particular, al hacer la regresión lineal la posición hace las veces de la variable
dependiente (o visto de otra manera la variable en el eje ‘y’) y el tiempo la independiente (la
variable en el eje ‘x’). Esto nos da como resultado un valor de la pendiente de 𝐵 = 8 y un punto de
corte de 𝐴 = 19,9. Al trazar en la gráfica de posición contra tiempo la línea recta que representa
esta ecuación, se obtiene lo siguiente:

70

60
Posición (m)

50

40
x = 8t + 19,92
30

20

10
0 1 2 3 4 5 6
Tiempo (s)

Si la regresión lineal se realizó sin errores, la línea recta pasara necesariamente entre los datos
experimentales. Las dimensiones del punto de corte y de la pendiente pueden ser halladas por
análisis dimensional.

Para interpretar los resultados obtenidos, basta con comparar la ecuación teórica con la ecuación
experimental obtenida mediante la regresión lineal

𝒙 = 𝑣 𝒕 + 𝑥0
𝒙 = 8 m/s 𝒕 + 19,9 m
Como asumimos que la ecuación teórica describe adecuadamente el sistema, es razonable afirmar
que las pendientes de la ecuación teórica y experimental son iguales, al igual que sus puntos de
corte. Es decir, que se tiene que cumplir que (pendientes)

𝑣 = 8 𝑚/𝑠

y que (puntos de corte)

𝑥0 = 19,9 𝑚

Como se puede observar, esta comparación nos lleva de forma automática determinar el valor de
la velocidad del carro, y su posición inicial; aunque esta última es bastante cercana al valor que
debería dar (20m) no coincide exactamente por pequeñas fluctuaciones en los datos
experimentales, lo cual es perfectamente normal. Por otro lado, es claro que la velocidad es
menor que la que se había hallado realizando un promedio entre velocidades, debido a que la
posición inicial del carro es de 20m. Esto se puede ver claramente en la gráfica: cuando el tiempo
es 0 s, el carro no se encuentra en la posición 0 m.

Miremos un segundo ejemplo. En un experimento se mide la presión de determinado gas a


medida que se cambia su temperatura. Los resultados se registran a continuación

P (Pa) T (K)
349000 300
357800 310
365800 320
374000 330
382700 340

La ecuación teórica que relaciona estas dos cantidades, para un gas (ideal), es 𝑃𝑉 = 𝑛𝑅𝑇, en
𝐽
donde 𝑅 = 8.31 es una constante llamada la constante de los gases, 𝑛 es el número de
𝑚𝑜𝑙∗𝐾
moles que tiene el gas (el cual es constante), y 𝑉 el volumen que ocupa. Supongamos que el
volumen medido del gas es de 1 𝑚3 . El objetivo del experimento es hallar el número de moles
contenidas en el gas. La presión es la variable dependiente, por tanto es la que despejamos de la
ecuación teórica

𝑛𝑅𝑇
𝑃=
𝑉

Se puede observar que la relación entre las variables es lineal. Por tanto procedemos a realizar la
regresión lineal

385000
380000
375000
Presión (Pa)

370000
365000
360000
355000
350000
P = 836 Pa/K T+ 98340 Pa
345000
290 300 310 320 330 340 350
Temperatura (k)

Comparamos las dos ecuaciones


𝑷 = 𝑛𝑅 𝑻
𝑉
𝑷 = 836 Pa/K 𝑻 + 98340 Pa

De la comparación de las pendientes, concluimos que

𝑛𝑅
= 836 Pa/K
𝑉

Y por tanto el número de moles será

𝑃𝑎
𝑉 ∗ (836 𝐾 )
𝑛= = 100,6 𝑚𝑜𝑙𝑒𝑠
𝑅

¿Cómo interpretamos la comparación entre los puntos de corte? En la ecuación teórica, el punto
de corte es 0 mientras que en la regresión lineal es de 98340 Pa. Esto indica que en el experimento
se presentó un error sistemático: todas las presiones medidas estuvieron aproximadamente
100000 pascales por encima del valor esperado. Generalmente esto es debido a errores de
medición (por ejemplo, instrumentos mal calibrados) pero debe ser analizado para cada caso en
particular. En todo caso, sin importar cuál es el origen de dicho error, la regresión lineal nos
permite aislarlo e identificarlo.

En general la regresión lineal nos permite analizar estadísticamente el comportamiento entre dos
variables y realizar deducciones de constantes o cantidades físicas. Si la relación entre las dos
variables no es lineal, se pueden realizar otro tipo de regresiones que no son lineales pero que se
basan en los mismos principios.

También podría gustarte