IntroducciénBloque 1Bloque 2Bloque 3Bloque 4Referencias
Regresion lineal simple
Introducci6n
Muchas veces nos enfrentamos a experimentos que involucran dos variables. Su informacién
se puede expresar mediante el par (x,y), cuyos componentes no necesariamente caen en una
recta en el plano cartesiano, pero muestran una tendencia que podria describirse como lineal.
Esto abre la puerta a encontrar una cierta recta que se ajuste a tales puntos. En esta lectura,
por lo tanto, abordaremos la técnica llamada regresién lineal que permite hallar una recta que
se ajusta a los puntos y permite realizar predicciones sobre el comportamiento de las variables
que han generado esos puntos.
1. Presentacién del caso
Se seleccionaron al azar 12 adultos de un grupo de estudiantes de la Ues21 y se registraron
tanto sus temperaturas corporales como frecuencias cardiacas. Puedes observar los
resultados en la tabla 1.
Tabla 1: Valores de la temperatura corporal (variable independiente) y las frecuencias
cardiacas
1 35,3 70
2 364 68
3 379 80
4 37.5 75
5 37.8 79
6 35 75
7 36,8 74
8 36,5 4
9 37.2 84
10 37.8 73
" 37.2 66
12 37.6 88
Fo
labora propia,
A continuacién, se presentan algunas preguntas para que respondas+ eCual es la recta de minimos cuadrados apropiada para este caso?
+ Encuentra el coeficiente de correlacién r que relacione la temperatura corporal con las
frecuencias cardiacas.
* {Hay una relacion entre la variable x y la variable de respuesta y?
+ eCual es el valor esperado de la frecuencia de la primera persona, si sabemos que su
temperatura es de 35,3 grados?
En la regresi6n lineal simple tenemos solo una variable independiente o variable de pronéstico
y una variable de respuesta o variable de interés. Supongamos entonces que obtenemos un
conjunto de puntos:
(a, Y1), Gear V2)s 1 Or In do*
En ellos, las variables de su primer componente provienen de alguna variable estadistica X y
las variables de su segundo componente provienen de alguna variable estadistica Y, ambas
variables numéricas. Una pregunta natural que surge es si existe alguna ecuacién que ajuste
los puntos enunciados anteriormente a partir de la siguiente formula
y=bot byx
El concepto de ajuste que usaremos estar basado en el principio de
mostramos a continuacién.
Figura 1: Principio de minimos cuadrados
Prin emis cutodes
laa del po ~ lara in ines =~ (b+)
[La sumade las desvacones vets lead de os puts (6.9. 3)
Alby) = Sy,~ t+ bd
Lasestacionespuntuaes de ly 8, dented por By By lads estimaco-
te de niin cdrads, son sels valores ce eaten lio by)
Esesin By ones gc J(By ,) = Ny com cage yy, a eta
de rere etna recta inion cuadrados cs enone I ota iy
289 = By + Bes
Fone: Devore, 2016
La respuesta a la pregunta anterior es positiva y los parémetros b_O y b_1 vienen dados por
las formulas de la figura 1El término
es también denominado ordenada al origen:
By =y — Ax
Asimismo, cuando se agrega un componente aleatorio de error ¢ al modelo determinista, se
llega a un modelo probabilistico que explica las desviaciones de los puntos alrededor de ta
recta:
y=Bxt+ate
De esta manera, el componente de error € permite que cada respuesta individual y se desvie
de la recta de medias en una pequefia cantidad.
Existen algunas suposiciones en relacién con el error aleatorio <, donde los valores de «
satisfacen. Esto quiere decir que son independientes en el sentido probabilistico, tienen una
varianza comin igual a
ae
yuna media de 0, Ademas, poseen una distribucién normal de probabilidad.
2. Analisis de correlacion
El coeficiente de correlacién de Pearson es una medida de dependencia lineal entre las dos
variables X e Y. Este coeficiente viene dado por la siguiente ecuacién.
Th @i-NOi-yY)
(u-2) fun. (%-y)
El valor de r esta en el intervalo [-1,1]. Si r=1, entonces hay una correlacién positiva perfecta,
Es decir, se ajusta perfectamente a los datos y es creciente. En otras palabras, cuando una de
ellas aumenta, la otra también lo hace en proporcién constante. Por su parte, si 0