Documentos de Académico
Documentos de Profesional
Documentos de Cultura
17.regresión y Correlación Simple
17.regresión y Correlación Simple
17 REGRESIÓN
Y CORRELACIÓN
SIMPLE
OBJETIVOS
Al finalizar el Tema 17, el participante será capaz de:
1. Utilizar diagramas de dispersión para visualizar la
relación entre dos variables.
2. Identificar relaciones simples entre variables
3. Utilizar la ecuación de regresión para predecir valores
futuros.
4. Aplicar el análisis de correlación para describir el
grado hasta el cuál dos variables están relacionadas
linealmente entre si.
Y • Y Y
• •• • • • ••
•• •
•• • •• • • •
• •• • • • • ••
• ••
•• •• •• • • •
••• •
• •
X X X
(d) Curvilinea inversa (e) Lineal inversa (d) Ninguna relación
con más dispersión
PACIENTE 1 2 3 4 5 6 7 8 9 10
COMPLEMENTO
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5
EN Kg: X
AUMENTO DE
8 10 9 12 14 13 15 17 14 14
PESO : Y
PACIENTE 1 2 3 4 5 6 7 8 9 10
COMPLEMENTO
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5
EN Kg: X
AUMENTO DE
8 10 9 12 14 13 15 17 14 14
PESO : Y
20
15
10
0
0.0 2.0 4.0 6.0
15
10
0
0.0 2.0 4.0 6.0
20
Aumento de peso
15
(Kg)
10
5
0
0.0 2.0 4.0 6.0
Complemento nutricional (Kg)
Ejemplo:
En Y = 10 + 2X
cuando X aumenta en 1, Y aumenta en 2
En Y = 5 - 0,8X
cuando X aumenta en 1, Y disminuye en 0,8
Y = b0 + b1 X
Variable Variable
Dependiente Independiente
X
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Cuando cambios en X, provoca variaciones en Y
en sentido inverso (X aumenta, Y disminuye o
viceversa), las variables están inversamente
relacionadas. Se observa en la ecuación el signo
-. Y
Ejemplo: o
Y = 20 - 3X
o o
o o
o
o
X
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
C) Grado de la ecuación:
La ecuación es de primer grado si la
variable independiente está elevada al
exponente 1. Su gráfica genera una línea
recta (por lo que también se le llama
ecuación lineal)
Ejemplo: Y = 30 + 4 X
12
11
10
. . (5,10.5)
9
8
7
6
. . (3,7.5)
(4,9)
5
4
3
2
.(1,4.5)
(2,6)
1 2 3 4 5 X
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
E) Forma general:
La ecuación simple de primer grado tiene la
siguiente forma general
Y = b0 + b1 X
Donde:
b1: pendiente, o sea, el cambio en Y cuando X = 1.
b0: el valor autónomo, es decir, Y = b0 cuando X = 0.
En la gráfica es la intersección con el eje Y
Ejemplo:
Y
Y = 3 + 1.5X
b0 = 3
.
X
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
17.3 Regresión lineal simple
Es una técnica estadística que permite
determinar la mejor ecuación que represente la
relación entre dos variables relacionadas.
= error
Yi - Y
10
8
. Línea de
estimación
6
Ŷ
Min Y - Y
2
4 Error= -6
•
i
•
2
• . Error= 2
X
2 4 6 8 10 12 14
Y nb 0 + b1 X
1.0 8.0 1.0 8.0
1.5 10.0 2.3 15.0
XY b 0 X b1 X 2 2.0
2.5
9.0
12.0
4.0
6.3
18.0
30.0
3.0 14.0 9.0 42.0
Ŷ 7,479 1,576X
Y
.
Yi
Y
1.5
2.0
10.0
9.0
9.843
10.630
.
2.5 12.0 11.418
3.0 14.0 12.206
Valor 3.5 13.0 12.994
observado Valor 4.0 15.0 13.782
estimado 4.5 17.0 14.570
5.0 14.0 15.358
2
(Y - Ŷ)
Syx =
n2
14
21,20 21,20
Sy x = 2,65
10 2 8
Syx =1,628
variacion explicada
r2
variacion total
r2 =
Ŷ - Y 2
Y - Y
2
i
9 5 7 14 10 45
Y=
5 5
Y = 9 unidades
Ŷ Y
Ŷ 2
Y Ŷ Y
9.055 12.6 -3.545 12.5699
9.843 12.6 -2.758 7.6038
10.630 12.6 -1.970 3.8793
11.418 12.6 -1.182 1.3964
12.206 12.6 -0.394 0.1551
12.994 12.6 0.394 0.1553
13.782 12.6 1.182 1.3971
14.570 12.6 1.970 3.8805
15.358 12.6 2.758 7.6055
16.146 12.6 3.546 12.5720
126.0 126.0 0.0 51.2
Ŷ Y Ŷ Y Ŷ Y 2
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
4to Paso: Se compara la variación explicada y
la variación total.
variacion explicada
Ŷ - Y
2
r2
variacion total
r2 = i
Y -Y
2
51,2
r2 = 0,707
72,4
r= r2
Sus valores oscilan entre -1 y 1
Cuando r es positivo, indica que X e Y
están directamente relacionados.
r = 0,707
r = 0,84
i = Yi - Ŷi
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Podemos evaluar lo adecuado del modelo de
regresión ajustado mediante el gráfico de los
residuos (eje vertical) con respecto a los
correspondientes valores de Xi de la variable
independiente (eje horizontal).
El gráfico muestra un
3
adecuado ajuste entre 2
el incremento de peso
Residuos
1
tendencia. Variable X 1
i1
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Los valores estandarizados nos permiten tomar en
cuenta la magnitud de los residuos en unidades
que reflejen la variación estandarizada alrededor
de la línea de regresión.
1.5
1
0.5
0
-0.5 0 5 10 15 20
-1
-1.5
-2
b. Normalidad
D i2
n
i
i1
2
Change Statistics
R Square
Model Change F Change df1 df2 Sig. F Change Durbin-Watson
1 .707a 19.336 1 8 .002 1.517
a. Predictors: (Constant), Complemento
b. Dependent Variable: AUMENTO
2
se estima mediante la siguiente formula:
n
Y 2
b 2SC
Y 2
n 1 x
S 2
i 1
n2
yx
Pr( t 0 t t 0 )
b1 1
Pr t 0 t0 1
Sy x
SCx
Sy x S y x
Pr b1 t 0 1 b1 t 0 1
SCx SCx
b0 0 b0 0
t n2
Sb0 1 x
2
Sy x
n SCx
donde:
Y Y
2
b 2 SC
2
n 0 x
S 2y x
n2
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
-t0 t0
Pr( t 0 t t 0 )
b
Pr t 0 0 0
t0 1
S
b 0
Pr b0 t 0Sb0 0 b0 t 0Sb0 1
1 X
Ŷ N y / X0 , 2 0
X
2
n SCx
Pr ŷ t 0S ŷ y / X0 ŷ t 0S ŷ 1
donde:
1 X x
2
S ŷ S 2y x 0
n SCx
1 X
Ŷ N y / X0 , 2 1 0
X
2
n SCx
Pr ŷ t 0S ŷ Y / X0 ŷ t 0S ŷ 1
donde:
2
1 X0 x
S ŷ S y x 1
2
n SC x
2
Error
Experimental
Y
2
n
b12SCx n 2 S2y x
Total SCtotal n 1
b0 Y b1 X
Xi Yi X Y
i i
442
32,5126
n 10 32,5
b1 1,57
X 2
126,25
32,5 20,62
i
X 2
n
i
10
Ŷ 7,49 1,57X
Interpretación:
b0= Se espera que el peso que un niño que no
consume este complemento nutricional sea
7,49 Kg.
b1= Por cada Kg. de complemento nutricional, el
peso del niño se incrementará en 1,57 Kg.
Sy x Sy x
Pr 1,57 t 0,10 8 1 1,57 t 0,10 8 1 0,10
SCx SCx
Sy x Sy x
Pr 1,57 1,86 1 1,57 1,86 0,90
4,54 4,54
1660
126
2
1,57 20,62
2
10 72,7 50,82
S 2
yx 2,69
8 8
S y x 1,642
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
1,642 1,642
Pr 1,57 1,86 1 1,57 1,86 0,90
4,54 4,54
1 3,80 3,25
2
SŶ 1,642 1
10 20,62
Interpretación
Ŷ 7,49 1,57(5,51)
Ŷ 16,14
E. Prueba de Hipótesis acerca de
1
1. Hp: 1= 0
Ha: 1 0
2. =
Fc
CMeregresión
0,10
3. CMeerror
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Supuestos
- La muestra seleccionada al azar
- La población se distribuye al azar
- Los valores de X fijas y de Y variables (o
aleatorias)
- Asunciones de la regresión lineal simple
4. Criterios de decisión
F1-/2 F/2
0,0041 5,32
Pr 16,91 1,86S Ŷ Y X0 16,91 1,86 S Ŷ 1
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.99582747
Coeficiente de determinación R^2 0.99167236
R^2 ajustado 0.98959045
Error típico 1.5310881
Observaciones 6
ANÁLISIS DE VARIANZA
GL SC CMe F cal P-valor
Regresión 1 1116.62308 1116.62308 476.328138 2.60786E-05
Residuos 4 9.37692308 2.34423077
Total 5 1126
Paciente 1 2 3 4 5 6 7 8 9 10 11
Prueba nueva 50 55 60 65 70 75 80 85 90 95 100
Prueba estandar 61 61 59 71 80 76 90 106 98 100 114
2
5. El coeficiente de correlación de muestra, r, no es nada más que r
y no podemos interpretar su significado directamente como un
porcentaje del mismo tipo
21. Una valor pequeño de r2 implica que no existe una relación de causa-
efecto significativa entre X y Y