Está en la página 1de 32

Regresión lineal

Simple
Regresión lineal simple

Es la relación entre dos variables


cuantitativas, una denominada
independiente “x” y otra dependiente ”y”.

En todo estudio o investigación, se muestra


la relación entre estas variables con una
tabla de valores y un diagrama con
puntos ubicados en un plano cartesiano.
Ejemplo
SBP (mmHg)
Vitaminas (y)

220
200

180
A la relación de los
160 puntos en el plano
cartesiano se le
140 llama nube de
puntos o diagrama
120 de dispersión

100
80 wtPeso
(kg)(x)
60 70 80 90 100 110 120

Dispersión de puntos de peso y consumo de


vitaminas
Dispersión de puntos

El modelo de los datos es indicativo del tipo de


relación entre las dos variables y se puede
ver:
 Relación positiva: Si el comportamiento es
ascendente
 Relación negativa: Si el comportamiento es
descendente
 No hay relación: Cuando la relación se observa
con puntos que no muestran ascendencia o
descendencia
Relación positiva

Los puntos se
muestran en forma
ascendente
Calificación final del curso

Número de horas para estudio


Relación negativa

Los puntos se
muestran en forma
descendente o hacia
abajo

Confiabilidad

Edad del Auto


Sin relación
Peso (libras)

Tasa de pulso (latidos/minuto)


Regresión
 En el ejemplo mostrado, los puntos se observan en forma
ascendente y el método de regresión lineal, busca trazar
una recta que muestre este comportamiento hacia arriba.
La característica de la recta es que debe pasar entre los
puntos y se le llama a esta recta “De mejor ajuste”
Vitaminas
220

200

180

160

140

120

100
Peso
80 Kg
Wt (kg)
60 70 80 90 100 110 120
Para trazar la recta se usa el modelo lineal de una recta, descrito
con la formula:

ŷ  a  bX
Y usando un procedimiento denominado de minimos cuadrados, se
determina el valor de la letra “a” denominada Termino
independiente y el valor de la letra “b”, denominada la Pendiente
de la recta”, con el uso de los modelos:

 x y
 xy 
n
b1 
(  x) 2
x 2

n
Para determinar los valores de a y b, se usan los valores iniciales y se
.construye la siguiente tabla
Respuesta

x y xy x^2 y^2

67 120 8040 4489 14400

69 125 8625 4761 15625

85 140 11900 7225 19600

83 160 13280 6889 25600

74 130 9620 5476 16900

81 180 14580 6561 32400

97 150 14550 9409 22500

92 140 12880 8464 19600

114 220 25080 12996 48400

85 130 11050 7225 16900

sumas 847 1495 129605 73495 231925

La tercera columna es la multiplicación de los valores de las dos variables “


x , y” y las siguientes dos columnas son el cuadrado de los valores de las
dos variables, las sumas de la última fila se reemplazan en los modelos de
:a y b quedando
Los modelos quedan

La recta que se traza entre la nube de puntos indica lo


siguiente:
Ecuación
Ecuación lineal
lineal
Y b”, indica si el valor es positivo la“
recta es ascendente y si es
negativo es descendente

Yŷ = baX + bX
a
Change
Cambio
b= pendiente
b = S lo p e in Y
en Y
C h a n g e i en
Cambio n XX
a”, indica el punto en “y” por donde pasa la recta a“
atrazar
= Y -in te r c e p t
X
:La grafica con la recta de mejor ajuste es

Es importante que reemplacen en la ecuación que se obtuvo un valor de x


y al realizar la operación se obtiene el valor de y, esta pareja se ubica en
la nube de puntos y se traza la recta tocando el punto junto con el valor de
“a”
Ejercicio 2
Edad PA Edad PA
(x) (y) (x) (y)
20 120 46 128
Los siguientes son las
edades en años y la 43 128 53 136
presión arterial (PA) 63 141 60 146
de 20 adultos 26 126 20 124
aparentemente 53 134 63 143
sanos.
31 128 43 130
58 136 26 124
46 132 19 121
58 140 31 126
70 144 23 123
Serial x y xy x2
1 20 120 2400 400
2 43 128 5504 1849
3 63 141 8883 3969
4 26 126 3276 676
5 53 134 7102 2809
6 31 128 3968 961
7 58 136 7888 3364
8 46 132 6072 2116
9 58 140 8120 3364
10 70 144 10080 4900
Serial x y xy x2
11 46 128 5888 2116
12 53 136 7208 2809
13 60 146 8760 3600
14 20 124 2480 400
15 63 143 9009 3969
16 43 130 5590 1849
17 26 124 3224 676
18 19 121 2299 361
19 31 126 3906 961
20 23 123 2829 529
Total 852 2630 114486 41678
 x y
 xy 
n 114486 
852  2630
b1  = 20  0.4547
(  x) 2
852 2

x  n
2 41678 
20

Al reemplazar en el modelo el valor de a, esta da: 112,13, compruebelo

La ecuación que se obtiene se denomina de predicción, ya que sin hacer


experimentación se puede obtener el valor de la variable dependiente

ŷ =112.13 + 0.4547 x

para edad x = 25, al reemplazar la presión arterial


es: Presión arterial = 112.13 + 0.4547 * 25=123.49 = 123.5 mm hg
SBP
TAS(mm Hg)HG)
(mm
220

200

180

160

140

120

100

80 Peso (Kg)
Wt (kg)
60 70 80 90 100 110 120

Diagrama de puntos dispersos de peso y tensión arterial sistólica


Coeficiente de correlación

Estadístico que muestra el grado de


relación entre las dos variables. Se usa
para saber si los resultados de la variable
dependiente, son dados por los valores de
la variable independiente
Coeficiente de correlación simple (r)

 También llamado correlación de


Pearson
 Mide la naturaleza y fuerza entre dos
variables cuantitativas.
El signo de r denota la naturaleza de la
asociación, si es negativo la relación es
inversa, es decir a medida que
aumentan los valores de “x”, los
valores de “y” disminuyen y si es
positiva, es directa y los dos aumentan.
Mientras que el valor de r denota la
fuerza de asociación. A mayor valor la
relación es mas fuerte
 Si el signo es positivo, significa que la
relación es directa (un incremento en una
variable está asociado con el incremento
de la otra variable; una disminución de
una variable está asociado con la
disminución de la otra variable).

 Si el signo es negativo, significa una


relación inversa o indirecta (significando
que el incremento en una variable está
asociado con una disminución de la otra
variable).
 El valor de r está entre ( -1) y ( +1)
 El valor de r denota la fuerza de la
asociación como se ilustra en el siguiente
diagrama.

fuerte intermedio débil débil intermedio fuerte

1- -0.75 -0.25 0 0.25 0.75 1


indirecta Directa
Correlación correlación
perfecta perfecta
sin relación
Si r = cero significa que no hay asociación o
correlación entre las dos variables.

Si 0 < r < 0.25 = débil correlación.

Si 0.25 ≤ r < 0.75 = intermedia correlación.

Si 0.75 ≤ r < 1 = fuerte correlación.

Si r = l = perfecta correlación.
Cómo clacular el coeficiente de correlación¿
?simple (r)

 xy   x y
r n
 ( x) 2
  ( y) 
2
x 
2 .  y 
2 
 n  n 
  
:Ejemplo
Una muestra de 6 niños fue seleccionada y la tabla
muestra su edad en años y peso en kilogramos. Se
requiere encontrar la correlación entre edad y peso.

Muestra Edad Peso (Kg)


(años)
1 7 12
2 6 8
3 8 12
4 5 10
5 6 11
6 9 13
Las dos variables son de tipo cuantitativo,
una variable (edad) es llamada
independiente y la otra (peso) es llamada
dependiente y con notación de variable Y,
para encontrar la relación entre edad y
peso, calcule el coeficiente de correlación
simple, usando la siguiente fórmula:

 x y
 xy  n
r 
 ( x) 2  ( y)2 
x 
2 .  y 
2 
 n  n 
  
Edad Peso

(años) (Kg) xy X2 Y2
Serial
(x) (y)
1 7 12 84 49 144
2 6 8 48 36 64
3 8 12 96 64 144
4 5 10 50 25 100
5 6 11 66 36 121
6 9 13 117 81 169
Total =x∑ =y∑ =x2∑ =y2∑
xy= 461∑
41 66 291 742
41  66
461 
r 6
 (41)2   (66)2 
291  .742  
 6  6 

r = 0.759
Fuerte correlación directa
Ejemplo: Relación entre ansiedad y puntaje de
pruebas
Ansiedad Puntaje X2 Y2 XY
)X( de
prueba
(Y)
10 2 100 4 20
8 3 64 9 24
2 9 4 81 18
1 7 1 49 7
5 6 25 36 30
6 5 36 25 30
X = 32∑ Y = 32∑ X2 = 230∑ Y2 = 204∑ XY=129∑
Calculando el coeficiente de correlación

(6)(129)  (32)(32) 774  1024


r   .94
 6(230)  32  6(204)  32 
2 2
(356)(200)

r = - 0.94

Fuerte correlación inversa