Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Análisis de Regresión y Correlación (Diseño)
Análisis de Regresión y Correlación (Diseño)
Análisis de Regresión
E (Y / X ) Y 0
+ 1
. X
Siendo:
E (Y/X) el valor teórico (esperado) de Y para un valor dado de X.
0 y 1 Parámetros desconocidos los cuales se deben estimar.
0 el intercepto u ordenada al origen (valor que asume Y cuando la recta
corta a la ordenada)
1 el coeficiente de regresión o pendiente de la recta.
Ŷ i = a + b X i + e i
Donde:
Ŷ i valor estimado de Yi.
a el estimador de 0
b el estimador de 1
ei residuo o error aleatorio con distribución N ( 0, 2 ) y Cov (ei, ej) = 0.
n n
Y i Yˆ i
2
S.C.RES. = ei : [mín]
i 1 i 1
CALCULO ESTADISTICO Y BIOMETRIA
o la expresión equivalente
n
S.C.RES. = (Y i a b X i )
2
: [mín]
i 1
a n b X i Y i
a X i b X
2
X iY i
i
n n
Yi b X i
i 1 i 1
a Y b X
n
y:
n n
X Y
X . Y
n n n
i 1 i 1
X Y X Y
i 1
x y
i 1 n i 1
Cov X ,Y
by / x
X
n 2 n 2
n
2 S
2
x X X x
n
i 1 i 1
i 1
2
X
i 1 n
Y
2
SCT i
Y SCExp . SC Re s .
Yˆ
2
SCExp . i
Y
Y
2
SC Re s . i
Yˆ i
( Yˆi Y )
2
SCExp .
R 2
(Y i Y )
2 SCT
Este coeficiente puede tomar valores entre cero y uno, su valor se acerca a
0 cuando no existe relación entre las variables o bien la misma es muy debil y tiende a 1 a
medida que aumenta la intensidad de la asociación.
2
H 0
: R 0
2
H1 : R 0
CALCULO ESTADISTICO Y BIOMETRIA
Yi
( Y i Yˆ )
Yˆ i (Y i Y )
Yi
X X i
Donde:
SCExp CM
Explicada por la glExp.= k CM F
Exp
SCExp. Exp .
gl CM
regresión Exp Re s
SC Re s .
glRes. = n – k – 1 CM
Error SCRes. Re s .
gl Re s .
Planteo de hipótesis
H 0
: 0 0
H1 : 0 0
a
ta
Sa
Siendo: Sa el error estandár de la ordenada al origen, el cual se puede calcular a partir de
la siguiente expresión:
2
2 1 X
Sa Sa CM
X
n 2
Re s
X
i
Planteo de hipótesis
H 0
: 1 0
H1 : 1 0
CALCULO ESTADISTICO Y BIOMETRIA
b
tb
Sb
Siendo: Sb el error estandár de la pendiente, el cual se puede calcular a partir de la
siguiente expresión:
2 CM
Sb Sb
Re s .
X 2
i
X
4.- "+ b" es el promedio de los incrementos de "y" debido a aumentos unitarios en "x"
y "- b"
es el promedio de disminuciones de "y" debido a aumentos unitarios en "x".
1.- Los valores estimados por la recta son más confiables dentro de los valores
observados de x.
4.- El sentido de la recta de regresión está determinado por el signo del coeficiente de
regresión.
CALCULO ESTADISTICO Y BIOMETRIA
Ejemplo de aplicación
Diagrama de dispersión
0,23
N itr o g e n o e n p l a n ta ( p p m )
0,21
0,19
0,17
0,15
0,13
0,41 0,51 0,61 0,71 0,81 0,91 1,01 1,11 1,21
X Y 1,5588
X 8 ,28 X 0 , 69
Y 2 ,22 Y 0 ,185
2
X 6 ,0728
n n
n n X Y
8 , 28 2 , 22
i 1 i 1
x
y
X Y 1,5588
i 1 i 1 n 12
b y / x n
2
2
0 ,159
n
8 , 28
2
i 1
x
n
X 6 ,0728
12
i 1
2
X
i 1 n
Y = 0,076 + 0,159 X
(Yˆ Y )
2
R2
i
SCExp .
0 . 009
0 ,9473
(Y
2
i
Y ) SCT 0 . 0095
CALCULO ESTADISTICO Y BIOMETRIA
2
H 0
: R 0
2
H1 : R 0
Explicada por la
0.009 1 0.009 180
regresión
Total 0.0095 11
Planteo de hipótesis
H 0
: 0 0
H1 : 0 0
Cálculo del t a
CALCULO ESTADISTICO Y BIOMETRIA
2 1
2
2 1 X
0 , 69
Sa Sa CM 0 ,00005 0 ,00839
X
n 2
Re s
i
X
12 0 ,3596
a 0 ,076
ta 9 ,06
Sa 0 . 00839
Planteo de hipótesis
H 0
: 1 0
H1 : 1 0
Cálculo del t b
2 CM 0 ,00005
Sb Sb 0 ,0118
Re s .
X 2
i
X 0 ,3596
b 0 ,159
tb 13 , 48
Sb 0 ,0118
Las hipótesis nula, tanto para la ordenada al origen como para la pendiente
son rechazadas ya que los valores de ta y tb son mayores que el valor de t tabulado, por
lo tanto podemos concluir que la recta no pasa por el origen y que las variables X e Y
(nitrogeno en suelo y nitrogeno en planta) presentan una relación lineal positiva y
significativamente diferente de cero.
2) Relaciones no lineales
y = a . xb
2800
2200
1600
Peso(kg)
1000
400
-200
-10 0 10 20 30 40 50 60 70
DAP(cm)
y=0,38+1,78*x
5
LOG(Peso)
-1
-0.5 0.5 1.5 2.5 3.5 4.5
LOG(DAP)
log (y) y log (x) son la nueva variable dependiente e independiente respectivamente, log
(a) es la ordenada al origen y b es la pendiente de la recta.
y = a . e b. x
90
70
50
y=1,2*exp(0,3*x)
Númerodeindividuos
30
10
-10
0 2 4 6 8 10 12 14 16
T
iempo(días)
5.5
4.5
3.5 y=0,18+0,30*x
2.5
LogNúmerodeIndividuos
1.5
0.5
-0.5
0 2 4 6 8 10 12 14 16
T
iempo(días)
1.2
1.0
0.8
0.6
PesoRemanente
0.4
0.2
0.0
-20 20 60 100 140 180 220 260 300
T
iempo(días)
y = a + b log(x)
430
y=42.4+107.2*
log(x)
380
Productividad(Mg/ha.año)
330
280
100 300 500 700 900 1100
Precipitación(mm/año)
CALCULO ESTADISTICO Y BIOMETRIA
380
360
y=42.4+46.5*
x
340
Productividad(Mg/ha.año)
320
300
280
5.0 5.4 5.8 6.2 6.6 7.0 7.4
LogPrecipitación
Y = a + b1. X1 + b2. X2
CALCULO ESTADISTICO Y BIOMETRIA
-1 ≤ r ≤ 1
r = - 1 : Perfecta relación lineal inversa entre las variables. Todos los puntos
pertenecen a una recta de pendiente negativa.
CALCULO ESTADISTICO Y BIOMETRIA
r = 1 : Perfecta relación lineal directa entre las variables. Todos los puntos
pertenecen a una recta de pendiente positiva
x y Cov ( x , y ) Cov ( X , Y )
x
. y
V(x) . V(y ) Sx .Sy
n n
n n xi yi
i=1 i=1
x y xi y i -
i=1 i =1 n
r = =
2
2 2 2
x y
n
n
xi yi
n n
i=1 i=1
x i
. yi
2 2
- -
n n
i=1 i=1
r by /x
. bx / y
Siendo:
n
n
x y
x y
i =1
b y/x = i =1
n b x/y =
n
2
x
2
y
i =1 i =1
CALCULO ESTADISTICO Y BIOMETRIA
Planteo de hipótesis
H 0
: 0
H1 : 0
Expresión de cálculo de t r
r
tr
Sr
Siendo: Sr el error estandár del coeficiente de correlación, el cual se puede calcular a
partir de la siguiente expresión:
2
1 r
Sr
n 2