Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Analisis de Regresion
Y = f(x1,...,xn; θ1,...,θm)
donde:
Para elegir una relación funcional particular como la representativa de la población bajo
investigación, usualmente se procede:
Una vez decidido el tipo de función matemática que mejor se ajusta (o representa nuestro
concepto de la relación exacta que existe entre las variables) se presenta el problema de
elegir una expresión particular de esta familia de funciones; es decir, se ha postulado una
cierta función como término del verdadero estado en la población y ahora es necesario
estimar los parámetros de esta función (ajuste de curvas).
Como los valores de los parámetros no se pueden determinar sin errores por que los
valores observados de la variable dependiente no concuerdan con los valores esperados,
entonces la ecuación general replanteada, estadísticamente, sería:
Y = f(x1,...xn;θ1,...,θm) + ε
Cuando la relación funcional entre las variables dependiente (Y) e independiente (X) es
una línea recta, se tiene una regresión lineal simple, dada por la ecuación
Y = ßo + ß1X + ε
F. de Mendiburu
2
donde:
Terminologia:
Promedios
∑ yi ∑ xi
y= ; x=
n n
(
SCY = ∑ y − y ;
i )
2
(
SCX = ∑ xi − x )
2
( )(
; SPXY = ∑ x i − x y i − y )
SCY tambien corresponde a la suma de cuadrados total = SC total
Estimación de parámetros
Y = ßo + ß1X + ε
F. de Mendiburu
3
(
Q = ∑ ei2 = ∑ y i − β 0 − β 1 x )2
bo = y − b1 x
spxy
b1 =
scx
CMresidual.∑ X i2 CMresidual
Sb0 = Sb1 =
n.SCX SCX
Si b1=0, se dice que no existe relación lineal entre las dos variables.
F. de Mendiburu
4
Los cálculos de regresión pueden ser vistos como un proceso de partición de la suma total
de cuadrados; así, gráficamente se tiene:
(y − y ) = (y) − y )+ (y − y) )
i i i i
F. de Mendiburu
5
Luego:
( ) ( )
∑ yi − y = ∑ yi − y + ∑ ( yi − yi )
2 ) 2 ) 2
Suma de Cuadrados del Total (SCT), mide la dispersión (variación total) en los valores
observados de Y. Este término se utiliza para el cálculo de la variancia de la muestra.
Cuando cada partición se asocia a una porción correspondiente del total de grados de
libertad, la técnica es conocida cono analisis de variancia (ANVA), que generalmente se
presenta en un cuadro de la siguiente forma:
F. de Mendiburu
6
Años (X) 0 1 2 3 4 5 6 7 8 9
Madera Aserrada (Y) 489.25 475.24 495.72 585.2 565.78 630.22 624.92 482.27 590.27 834.67
Gl SC CM F F0.05 Pr>F
Regression 1 49223 49223 6,9941 5,31 0,0295
Residual 8 56303 7037.8
Total 9 105526
X = El periodo.
Intercepto = 467,42
Tasa = 24,42
Intervalos de Confianza
b1 - t0 Sb1 ≤ ß1 ≤ b1 + to Sb1
Con estos resultados se puede afirmar al 95% de confianza que la tasa de crecimiento en
madera aserrada es positiva y por lo menos se tendra un crecimiento de 3 mil metros
cubicos por año.
F. de Mendiburu
7
En función del modelo se puede hacer estimaciones para los siguientes años:
2000 711.7
2001 736.12
2002 760.55
Estas proyecciones son puntuales, en base al modelo; para año 2000, X=10, resulta una
producción de 711 mil m3 de madera aserrada.
Para obtener limites de confianza para estos valores predecidos, se debe determinar sus
desviaciones estandar correspondiente; utilice la siguiente formula:
1 x −x
S _ Pr edicho = CMresidual 1 + + 0
( )
2
n SCX
Prueba de Hipotesis
F. de Mendiburu
8
Para el ejemplo planteado, se rechaza la hipotesis planteada, esto significa que existe una
relación lineal significativa del tiempo y la producción de madera aserrada total.
Analisis de Correlacion
-1 ≤ r ≤ 1.
Si r = -1, la asociación es perfecta pero inversa; es decir, a valores altos de una variable le
corresponde valores bajos a la otra variable, y viceversa.
SPXY
r=
SCX .SCY
Para los datos de la producción de madera aserrada total entre los años 1990 a 1999,
existe una asociación de 0.68.
2015,17
r= = 0.68
(105525,86)(82,5)
Coeficiente de Determinacion (R²)
F. de Mendiburu
9
1 = SCR/SCT + SCE/SCT
R² = 1 - SCE/SCT = SCR/SCT
R² = SC regresion / SC total
Interpretación de R²:
Tambien, se puede obtener el R² ajustado que es la relacion entre cuadrados medios, asi:
Lo que se espera que ambos R², resulten similares, para dar una confianza al coeficiente
de determinación.
F. de Mendiburu