Está en la página 1de 6

APUNTES DE REGRESIN LINEAL POR EL MTODO DE LOS MNIMOS

CUADRADOS.
1. Si tenemos los siguientes datos obtenidos de la clase, en la cual se
desea determinar la relacin lineal del dimetro de la cabeza de 15
alumnos de ambos sexos, con rango de edades entre 16 y 41 aos.
Podemos obtener una regresin con la siguiente metodologa de los
mnimos cuadradosi.
n
observacin

EDAD
(AOS)

ESTATURA
(M)

DMETRO
CABEZA
(CM)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

20
16
22
23
22
20
20
22
41
22
22
20
24
20
20

155
172
165
153
168
154
158
164
168
173
160
170
183
167
180

51
55
53
51
54
55
54
56
56
58
55
57
59
55
55

La grfica de dispersin de los datos queda de la siguiente forma.

2. Empricamente puedo hacer un ajuste de una recta, que muestre la


tendencia de los puntos graficados. Esta recta tendr la propiedad de pasar
por en medio de la dispersin de puntos. La ecuacin Es la siguiente
Yi bo bi X i

La idea fundamental del anlisis de regresin es obtener aquellos valores que


sean buenos estimadores de los parmetros b o y bi y que tambin minimicen
los errores de Yi para cada una de las observaciones.

Donde:
b1

SSxy
SSx

bo Y b1 X
n

Promedio de x

x
i 1

Promedio de y

y
i 1

3. Este modelo implica preguntarnos Existe una relacin entre las dos
variables? Y Que tan fuerte es esta relacin?
Para contestar estas dos preguntas se recurri al Coeficiente de Correlacin (r)
y el Coeficiente de Determinacin (r 2) El valor de r siempre tendr valores
dentro del rango -1 y 1, donde el valor negativo implica una relacin lineal
negativa y viceversa. Es decir mientras ms cercano al uno absoluto se
encuentre el coeficiente de correlacin, el modelo que representa a la relacin
probabilstica tendr una mejor correspondencia con los datos generados en la
realidad1. Para determinar los valores crticos de r, se tendr un nivel de
significacin =0.10
En base a la tabla IX2 encontramos los valores crticos de r
r > valor absoluto 0.412
r

SS xy
SS xx SS yy

Op cit. (Rubio, 2003)

r2

SS xy2
SS x SS y

Donde:
SS xy

xy n x y
1

1
x2
n

SS y y 2

1
y 2
n

SS x

Yi= El valor estimado de la variable dependiente en la iesima observacin.


bo y i son parmetros obtenidos por el mtodo de mnimos cuadrados.
Xi= Es el valor de la variable independiente en la iesima observacin.
=Es el error aleatorio.
n= nmero de datos.
x= observacin de la variable independiente.
y= observacin de la variable dependiente.
X = Promedio de las observaciones de x.
Y =Promedio de las observaciones de y.
SSx = Suma de cuadrados de x
SSy = Suma de cuadrados de y

Tabla de las operaciones efectuadas

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
totales

Estatura=
xi
medicin
real
155
172
165
153
168
154
158
164
168
173
160
170
183
167
180
2490

SSx

1134

SSy

68.9333333

SSxy

201

n de
observacin

Dimetro = yi
medicin real

xi2

yi2

xi*yi

DIMETRO
estimado

err

51
55
53
51
54
55
54
56
56
58
55
57
59
55
55
824

24025
29584
27225
23409
28224
23716
24964
26896
28224
29929
25600
28900
33489
27889
32400
414474

2601
3025
2809
2601
2916
3025
2916
3136
3136
3364
3025
3249
3481
3025
3025
45334

7905
9460
8745
7803
9072
8470
8532
9184
9408
10034
8800
9690
10797
9185
9900
136985

53.0
56.0
54.8
52.6
55.3
52.8
53.5
54.6
55.3
56.2
53.9
55.6
57.9
55.1
57.4

-2.
-1.
-1.
-1.
-1.
2.
0.
1.
0.
1.
1.
1.
1.
-0.
-2.

bo= Y-b1*X

25.51

b1= SSxy/SSx

0.177

25.51

0.18

promedio y 54.9333333

25.51

0.18

promedio x

25.51

0.18

166

En base a las frmulas de r y r 2, tenemos los coeficientes de correlacin y de


determinacin.
r

0.71891061

r2

0.51683246

Donde si r= 0 no existe relacin entre variables.


r > valor absoluto 0.412
0.72>0.412
Nos indica que existe relacin entre variables.

Representacin grfica de los valores reales y los estimados. Se puede observar el error
en cada estimacin.

El intervalo de confianza es un rango en cualquiera de los lados de la media de


una muestra. Para obtenerlo se requiere tener los siguientes datos:
1. Alfa () es el nivel de significacin utilizado para calcular el nivel de
confianza. El nivel de confianza es igual a 100(1 - alfa)%, es decir, un
alfa de 0,05 indica un nivel de confianza de 95%.
2. Desviacin estndar (s) es la desviacin estndar de una muestra para
el rango de datos y se presupone que es conocida.
s

1 n
( xi X )2
n 1 i 1

3. Tamao de la muestra (n).


Si suponemos que el argumento alfa es igual a 0,05, se tendr que calcular
el rea debajo de la curva normal estndar que es igual a (1 - alfa) o 95%.
Este valor es 1,96. Por lo tanto, el intervalo de confianza en C es:

Y 1.96

Referencias bibliogrficas.

Rubio Arias, Hector. Estadstica Experimental. Instituto Nacional de Investigaciones Forestales, Agropecuarias y
Pecuarias (INIFAP) Mxico 2003.
2 Murray, Spiegel. Estadstica, 2da. Ed. Mc. Graw Hill. Mxico 1991

También podría gustarte