Está en la página 1de 4

Regresión lineal

La regresión lineal modela, en la forma de una ecuación


matemática, la relación entre dos variables X e Y.

La regresión lineal es un campo de estudio que enfatiza la relación


estadística entre dos variables continuas conocidas como variables
de predicción y respuesta . (Nota: cuando hay más de una variable predictora,
se convierte en regresión lineal múltiple).

 La variable predictora se denota con mayor frecuencia como x y


también se conoce como variable independiente.

 La variable de respuesta se denota con mayor frecuencia como y y


también se conoce como variable dependiente.
 La gráfica de puntos dispersos muestra la relación entre edad y presión arterial sistólica de
37 mujeres.
 EJEMPLO: La presión arterial cambia con la edad.
Tensión arterial sistólica (mm Hg)

Relación entre edad y presión arterial


sistólica

200

100

0
0 10 20 30 40 50 60 70 80 90 100
Edad (años)

TRAZANDO UNA LÍNEA DE REGRESIÓN

 Nuestro objetivo es trazar una línea, que mejor describa la relación entre X y Y.
 Se puede trazar una línea con una regla, que una los puntos, pero es improbable que
obtengamos una misma línea y cada una de ellas, da diferente descripción de la relación
entre X y Y.
Relación entre edad y hemoglobina

Hemoglobina (gr/dl)
20
15
10
5
0
15 20 25 30 35 40 45 50 55 60 65
Edad (años)

 Cada distancia vertical es la diferencia entre el valor observado para la variable


dependiente (en el eje y) y el valor de la línea trazada para el correspondiente valor del
eje x.

 La distancia vertical entre los valores observados y los trazados es conocida como residual.
Llamamos a cada uno de los residuales e1.

Relación entre edad y hemoglobina

20
Heoblobina (gr/dl)

15
10
5
0
15 20 25 30 35 40 45 50 55 60 65
Edad (años)

 La línea que mejor traza los datos se le conoce como línea de regresión.

 Da una estimación del valor promedio de y por algún valor de x. En general decimos que
es una regresión de y sobre x.

 Se puede pensar en la línea de regresión como una línea que une los valores medios de y
por cada valor de x.
18
16
14
12
10
8
6
4
2
0
1 2 3 4 5 6 7 8 9 10 11

 La expresión matemática para la línea de regresión es la ecuación:

y= α + βx

donde α es la intersección de la línea con el eje y,

β es la pendiente de la línea.

 Regresión de los cuadrados mínimos da una línea de mejor trazo con una intersección y
una pendiente determinada.

 La línea que mejor traza los datos se le conoce como línea de regresión.

 Da una estimación del valor promedio de y por algún valor de x. En general decimos que
es una regresión de y sobre x.

 Se puede pensar en la línea de regresión como una línea que une los valores medios de y
por cada valor de x.

 podemos usarla para dar un resumen de la relación entre la variable explicativa y


respuesta (independiente, dependiente).

 Podemos decir: Por una unidad de incremento en x, y se


incrementa por un cierto valor (el valor de b). y = a + bx

También podría gustarte