Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Regresion Lineal
Regresion Lineal
A. Barajas
Supongamos que realizamos un experimento en el que medimos dos cantidades físicas, con el
objetivo de analizar la relación entre ellas. Por ejemplo, medimos la posición de un carro que
intenta viajar a velocidad constante y que todas las posiciones son medidas con respecto a un
único punto, en este caso, con respecto a un árbol al lado de la calle, como se muestra a
continuación
El objetivo del experimento es determinar la velocidad de dicho carro. Los datos recopilados
pueden ser como se presentan a continuación:
45
40
35
Posición (m)
30
25
20
15
10
5
0
0 1 2 3 4 5 6
Tiempo (s)
Más aún, teóricamente la relación teórica entre la posición y el tiempo para un objeto que se
mueve a velocidad constante, 𝒙 = 𝑣. 𝒕 + 𝑥0 , es justamente la ecuación de una línea recta.
¿Cómo determinar la velocidad del carro? Es común que en este tipo de experimentos, se intente
hallar la velocidad (o la cantidad que se busca) para cada pareja de datos, y luego promediar
todos los resultados, de la siguiente manera
La regresión lineal es un procedimiento que nos dice cuál es la línea recta que mejor representa el
comportamiento de los datos, o más específicamente, nos dice cuanto seria la pendiente y el
punto de corte con el eje ‘y’ de dicha recta. En general la regresión lineal se puede realizar con una
computadora o una calculadora; en internet se pueden encontrar videos sobre cómo hacerlo. Acá
nos enfocaremos en cómo se interpretan los resultados obtenidos.
En este caso en particular, al hacer la regresión lineal la posición hace las veces de la variable
dependiente (o visto de otra manera la variable en el eje ‘y’) y el tiempo la independiente (la
variable en el eje ‘x’). Esto nos da como resultado un valor de la pendiente de 𝐵 = 8 y un punto de
corte de 𝐴 = 19,9. Al trazar en la gráfica de posición contra tiempo la línea recta que representa
esta ecuación, se obtiene lo siguiente:
70
60
Posición (m)
50
40
x = 8t + 19,92
30
20
10
0 1 2 3 4 5 6
Tiempo (s)
Si la regresión lineal se realizó sin errores, la línea recta pasara necesariamente entre los datos
experimentales. Las dimensiones del punto de corte y de la pendiente pueden ser halladas por
análisis dimensional.
Para interpretar los resultados obtenidos, basta con comparar la ecuación teórica con la ecuación
experimental obtenida mediante la regresión lineal
𝒙 = 𝑣 𝒕 + 𝑥0
𝒙 = 8 m/s 𝒕 + 19,9 m
Como asumimos que la ecuación teórica describe adecuadamente el sistema, es razonable afirmar
que las pendientes de la ecuación teórica y experimental son iguales, al igual que sus puntos de
corte. Es decir, que se tiene que cumplir que (pendientes)
𝑣 = 8 𝑚/𝑠
𝑥0 = 19,9 𝑚
Como se puede observar, esta comparación nos lleva de forma automática determinar el valor de
la velocidad del carro, y su posición inicial; aunque esta última es bastante cercana al valor que
debería dar (20m) no coincide exactamente por pequeñas fluctuaciones en los datos
experimentales, lo cual es perfectamente normal. Por otro lado, es claro que la velocidad es
menor que la que se había hallado realizando un promedio entre velocidades, debido a que la
posición inicial del carro es de 20m. Esto se puede ver claramente en la gráfica: cuando el tiempo
es 0 s, el carro no se encuentra en la posición 0 m.
P (Pa) T (K)
349000 300
357800 310
365800 320
374000 330
382700 340
La ecuación teórica que relaciona estas dos cantidades, para un gas (ideal), es 𝑃𝑉 = 𝑛𝑅𝑇, en
𝐽
donde 𝑅 = 8.31 es una constante llamada la constante de los gases, 𝑛 es el número de
𝑚𝑜𝑙∗𝐾
moles que tiene el gas (el cual es constante), y 𝑉 el volumen que ocupa. Supongamos que el
volumen medido del gas es de 1 𝑚3 . El objetivo del experimento es hallar el número de moles
contenidas en el gas. La presión es la variable dependiente, por tanto es la que despejamos de la
ecuación teórica
𝑛𝑅𝑇
𝑃=
𝑉
Se puede observar que la relación entre las variables es lineal. Por tanto procedemos a realizar la
regresión lineal
385000
380000
375000
Presión (Pa)
370000
365000
360000
355000
350000
P = 836 Pa/K T+ 98340 Pa
345000
290 300 310 320 330 340 350
Temperatura (k)
𝑛𝑅
= 836 Pa/K
𝑉
𝑃𝑎
𝑉 ∗ (836 𝐾 )
𝑛= = 100,6 𝑚𝑜𝑙𝑒𝑠
𝑅
¿Cómo interpretamos la comparación entre los puntos de corte? En la ecuación teórica, el punto
de corte es 0 mientras que en la regresión lineal es de 98340 Pa. Esto indica que en el experimento
se presentó un error sistemático: todas las presiones medidas estuvieron aproximadamente
100000 pascales por encima del valor esperado. Generalmente esto es debido a errores de
medición (por ejemplo, instrumentos mal calibrados) pero debe ser analizado para cada caso en
particular. En todo caso, sin importar cuál es el origen de dicho error, la regresión lineal nos
permite aislarlo e identificarlo.
En general la regresión lineal nos permite analizar estadísticamente el comportamiento entre dos
variables y realizar deducciones de constantes o cantidades físicas. Si la relación entre las dos
variables no es lineal, se pueden realizar otro tipo de regresiones que no son lineales pero que se
basan en los mismos principios.