Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TEORA DE LA REGRESION
Dr. Salvador Martn Medina Torres Profesor - Investigador Postgrado en Desarrollo Sustentable de Recursos naturales REA DE GESTIN DE VIDA SILVESTRE
Universidad Autnoma Indgena de Mxico -Unidad Mochicahui Jurez 39, Mochicahui, El Fuerte, Sinaloa. C.P. 81890. Tel. y Fax: (698) 892-06-54 y 892-00-42
Prediccin Crear una funcin lineal que permita describir el comportamiento de una variable dependiente Y en funcin de una o mas variables independientes X
mnima
(1777-1855) La idea es producir estimadores de los parmetros ( o, 1) que hagan mnima la suma de cuadrados de las distancias entre los valores observados Yi, y los valores estimados i
5
(Xi
i 1 1 n
X i )(Yi Y i ) (Xi X i )2
1
i 1
Error = Y observada o real estimada El mtodo minimiza la suma de estos errores elevada al cuadrado, para evitar el valor cero que ocurre cuando se suman los errores.
7
(Xi
i 1 1 n
X i )(Yi Y i ) (Xi X i )2
(Xi
i 1 n
X i )(Yi Y i ) SPXY
Covarianza XY
i 1
i 1
(Xi
X i )2
SPXX
Varianza X
SPXY SPXX
(Yi Y i ) 2
i 1
SPYY
Ejemplo prctico:
Suponer que se toma una muestra aleatoria de 10
1,613.00
614.00
260,697
38,596
99,568
Xi
161.30
Yi
61.40
X i2
Yi 2
X iYi
Datos de Infante, S. y G. Zrate. 1991. Mtodos estadsticos, un enfoque interdisciplinario. Ejemplo 12.1. 465 p.
10
(Xi
i 1
X i )(Yi Y i ) SPXY
SPXY
X iYi
Xi n
Yi
Covarianza XY
(Xi
i 1
X i )2
SPXX
Varianza X
(Yi Y i ) 2
i 1
SPYY Varianza Y
SPXY SPXX
Estimando parmetros
SPXY X iYi Xi n Yi 99,568 (1,613)(614 ) 529 .8 10
SPXY SPXX
Y
1
12
Yi
Xi
102.91 1.0187 X i
13
valores estimados para Yi (denotados por i), mediante la ecuacin de regresin obtenida, sustituyendo los valores de Xi :
Y1 Y2 Y10
0 10 0 0 1
X1 X2 X 10
102 .91 1.0187 162 102 .91 1.0187 158 102 .91 1.0187 173
En la memoria de clculo
Se calcula con la ecuacin de regresin obtenida para cada valor de X
observaciones
1 2
estatura (cm) Xi
162.00 158.00
peso (kg) Yi
63.00 52.00
X2i
26,244 24,964
Y2i
3,969 2,704
XiYi
10,206 8,216
Yi estimada
62.11 58.04
3
4 5 6 7 8 9 10
167.00
151.00 162.00 168.00 167.00 153.00 152.00 173.00 1,613.00
78.00
49.00 71.00 62.00 68.00 48.00 56.00 67.00 614.00
27,889
22,801 26,244 28,224 27,889 23,409 23,104 29,929 260,697
6,084
2,401 5,041 3,844 4,624 2,304 3,136 4,489 38,596
13,026
7,399 11,502 10,416 11,356 7,344 8,512 11,591 99,568
67.21
50.91 62.11 68.22 67.21 52.95 51.93 73.32
Xi
161.30
Yi
61.40
X i2
Yi 2
X iYi
15
y = -102.91+1.0187x
que se pueden generar, hemos generado aquella cuya suma de cuadrados de las distancias entre los valores reales y estimados (Yi - i), sea la menor de todas
17
X2i
26,244 24,964 27,889 22,801 26,244 28,224 27,889 23,409 23,104 29,929 260,697
Y2i
3,969 2,704 6,084 2,401 5,041 3,844 4,624 2,304 3,136 4,489 38,596
XiYi
10,206 8,216 13,026 7,399 11,502 10,416 11,356 7,344 8,512 11,591 99,568
Yi estimada
62.11
20
se interpreta matemticamente como el valor que tomar una i cuando X = 0 muchos problemas.
En nuestro ejemplo: una persona de 0 cm, no puede pesar -102.91 kg de estatura.
Sin embargo, este valor es necesario para representar la tendencia que muestran los datos en el espacio de valores observados para la variable independiente.
21
0:
22
tambin llamado Coeficiente de Regresin, es de mayor importancia que 0 , ya que ya que nos indica la forma en que estn relacionadas X y Y. Mide cuanto y en que direccin (positiva o negativa) se modifican los valores de Y cuando cambia X.
Ejemplo: en el caso anterior, se dice que por cada 1.0187 kg de incremento en el peso, se incrementar 1.0 cm de estatura. Precaucin: una vez mas, esta afirmacin solo opera para un cierto intervalo de valores.
Suponer que el valor mnimo de estatura sea de 1 metro: le correspondera un peso estimado de -1.04 kg, situacin naturalmente imposible. Para una mejor interpretacin de 1, debemos estimar su varianza
23
1,
Conclusiones
Recordar: un supuesto bsico del modelo de
regresin, es que para cada valor posible de X, Y es una variable aleatoria con distribucin normal cuya media es Y/X
Lo correcto es decir que las medias poblacionales de
estimadores de parmetros desconocidos, y son por tanto, variables aleatorias sobre las que deben hacerse afirmaciones probabilsticas.
24
Y/X)
0,
la
~N
X 0; n( SPXX )
Y / X0
2 i
2 1
~N
SPXX
2 )
YX 0
X0
~ N(
Y / X0
X 0;
Donde
2
YX 0
1 n
( X 0 X )2 SPXX
26
Como estimador de
2,
expresa:
2 e
S .C.ERROR n 2
SPYY
SPXY n 2
1
modelo de lnea recta adoptado sea correcto; es decir, que en esas condiciones:
E (S )
2 e
27
Sustituyendo
2 por
y Xo:
~N
X i2 0; n( SPXX )
2 1;
2
0
S e2 X i2 n( SPXX )
S e2 SPXX
S
2 e
1 ~ N
SPXX
( X 0 X )2 SPXX
S 21
2
YX 0
1 n
S2
YX 0
1 n
( X 0 X )2 SPXX
28
~N
X i2 0; n( SPXX )
2
0
X i2 n( SPXX )
50.124 (
2 1
2 2
1
~N
SPXX
SPXX
520 .1
0.0019 (
29
= 1.0187
2 e
SPYY
SPXY n 2
1
44.587
30
Ya con el valor de
Se2
44.587
estimadas de
2
0
y 1:
2
S X n( SPXX )
S SPXX
2 e
2 e
2 i
50.124(
2
1
0.0019 (
= -102.91
YX 0
120
1.04 kg
es:
2
YX 0
120
1 n
( X 0 X )2 SPXX
1 10
7.325
32
2
YX 0
2 1 Se n
( X 0 X )2 SPXX
Donde:
Se2
44.587
33
Conclusin:
Para un valor hipottico X0 = 100 cm de estatura, el valor
estimado de xo deber ser de -1.04 kg, con una varianza estimada de 326.62 kg2, o una desviacin estndar de 18.07 kg (-19.12 a 17.03 kg).
Es decir, el peso estimado a 100 cm de estatura, deber estar entre ese intervalo de valores.
34