Está en la página 1de 7
IntroducciénBloque 1Bloque 2Bloque 3Bloque 4Referencias Regresion lineal simple Introducci6n Muchas veces nos enfrentamos a experimentos que involucran dos variables. Su informacién se puede expresar mediante el par (x,y), cuyos componentes no necesariamente caen en una recta en el plano cartesiano, pero muestran una tendencia que podria describirse como lineal. Esto abre la puerta a encontrar una cierta recta que se ajuste a tales puntos. En esta lectura, por lo tanto, abordaremos la técnica llamada regresién lineal que permite hallar una recta que se ajusta a los puntos y permite realizar predicciones sobre el comportamiento de las variables que han generado esos puntos. 1. Presentacién del caso Se seleccionaron al azar 12 adultos de un grupo de estudiantes de la Ues21 y se registraron tanto sus temperaturas corporales como frecuencias cardiacas. Puedes observar los resultados en la tabla 1. Tabla 1: Valores de la temperatura corporal (variable independiente) y las frecuencias cardiacas 1 35,3 70 2 364 68 3 379 80 4 37.5 75 5 37.8 79 6 35 75 7 36,8 74 8 36,5 4 9 37.2 84 10 37.8 73 " 37.2 66 12 37.6 88 Fo labora propia, A continuacién, se presentan algunas preguntas para que respondas + eCual es la recta de minimos cuadrados apropiada para este caso? + Encuentra el coeficiente de correlacién r que relacione la temperatura corporal con las frecuencias cardiacas. * {Hay una relacion entre la variable x y la variable de respuesta y? + eCual es el valor esperado de la frecuencia de la primera persona, si sabemos que su temperatura es de 35,3 grados? En la regresi6n lineal simple tenemos solo una variable independiente o variable de pronéstico y una variable de respuesta o variable de interés. Supongamos entonces que obtenemos un conjunto de puntos: (a, Y1), Gear V2)s 1 Or In do* En ellos, las variables de su primer componente provienen de alguna variable estadistica X y las variables de su segundo componente provienen de alguna variable estadistica Y, ambas variables numéricas. Una pregunta natural que surge es si existe alguna ecuacién que ajuste los puntos enunciados anteriormente a partir de la siguiente formula y=bot byx El concepto de ajuste que usaremos estar basado en el principio de mostramos a continuacién. Figura 1: Principio de minimos cuadrados Prin emis cutodes laa del po ~ lara in ines =~ (b+) [La sumade las desvacones vets lead de os puts (6.9. 3) Alby) = Sy,~ t+ bd Lasestacionespuntuaes de ly 8, dented por By By lads estimaco- te de niin cdrads, son sels valores ce eaten lio by) Esesin By ones gc J(By ,) = Ny com cage yy, a eta de rere etna recta inion cuadrados cs enone I ota iy 289 = By + Bes Fone: Devore, 2016 La respuesta a la pregunta anterior es positiva y los parémetros b_O y b_1 vienen dados por las formulas de la figura 1 El término es también denominado ordenada al origen: By =y — Ax Asimismo, cuando se agrega un componente aleatorio de error ¢ al modelo determinista, se llega a un modelo probabilistico que explica las desviaciones de los puntos alrededor de ta recta: y=Bxt+ate De esta manera, el componente de error € permite que cada respuesta individual y se desvie de la recta de medias en una pequefia cantidad. Existen algunas suposiciones en relacién con el error aleatorio <, donde los valores de « satisfacen. Esto quiere decir que son independientes en el sentido probabilistico, tienen una varianza comin igual a ae yuna media de 0, Ademas, poseen una distribucién normal de probabilidad. 2. Analisis de correlacion El coeficiente de correlacién de Pearson es una medida de dependencia lineal entre las dos variables X e Y. Este coeficiente viene dado por la siguiente ecuacién. Th @i-NOi-yY) (u-2) fun. (%-y) El valor de r esta en el intervalo [-1,1]. Si r=1, entonces hay una correlacién positiva perfecta, Es decir, se ajusta perfectamente a los datos y es creciente. En otras palabras, cuando una de ellas aumenta, la otra también lo hace en proporcién constante. Por su parte, si 0

También podría gustarte