Está en la página 1de 7

MTODOS CUANTITATIVOS APLICADOS A LOS NEGOCIOS

INTERNACINALES. APUNTES Y EJERCICIO DE REGRESIN LINEAL POR


EL MTODO DE LOS MNIMOS CUADRADOS.
Cancn Q Roo a 22 de junio de 2009.

Profesor, Juan Francisco Brcenas Graniel.

1. Si tenemos los siguientes datos obtenidos de una muestra previa de la


poblacin cancunense, en la cual se desea determinar la relacin lineal
del dimetro de la cabeza de 15 personas de ambos sexos, con rango
de edades entre 16 y 41 aos. Obtener una regresin con la siguiente
metodologa de los mnimos cuadradosi. Los resultados servirn para
obtener un estimado de la cantidad de personas a muestrear para
obtener datos que sirvan para la obtencin la distribucin de tallas de
sombrero en Cancn.

DMETRO
n observacin EDAD (AOS) ESTATURA (M)
CABEZA (CM)

1 20 155 51

2 16 172 55

3 22 165 53

4 23 153 51

5 22 168 54

6 20 154 55

7 20 158 54

8
22 164 56
9 41 168 56

10 22 173 58

11 22 160 55

12 20 170 57

13 24 183 59

14 20 167 55

15 20 180 55

Grfica 1. Dispersin de los datos.

1
2. Empricamente puedo hacer un ajuste de una recta, que muestre la
tendencia de los puntos graficados. Esta recta tendr la propiedad de pasar
por en medio de la dispersin de puntos. La ecuacin Es la siguiente
Yi bo bi X i

La idea fundamental del anlisis de regresin es obtener aquellos valores que


sean buenos estimadores de los parmetros b o y bi y que tambin minimicen
los errores de Yi para cada una de las observaciones.

Donde:
SSxy
b1
SSx

bo Y b1 X

x i

Promedio de x X i 1
n

y i
Promedio de y Y i 1
3. Este modelo implica preguntarnos Existe n una relacin entre las dos
variables? Y Que tan fuerte es esta relacin?

Para contestar estas dos preguntas se recurri al Coeficiente de Correlacin (r)


y el Coeficiente de Determinacin (r 2) El valor de r siempre tendr valores

2
dentro del rango -1 y 1, donde el valor negativo implica una relacin lineal
negativa y viceversa. Es decir mientras ms cercano al uno absoluto se
encuentre el coeficiente de correlacin, el modelo que representa a la relacin
probabilstica tendr una mejor correspondencia con los datos generados en la
realidad1. Para determinar los valores crticos de r, se tendr un nivel de
significacin =0.10

En base a la tabla IX2 encontramos los valores crticos de r


r > valor absoluto 0.412
SS xy
r
SS xx SS yy

SS xy2
r
2

SS x SS y

Donde:

xy n x y
1
SS xy

SS x x 2

1
x2
n

SS y y 2
1
y 2
n

Yi= El valor estimado de la variable dependiente en la iesima observacin.


bo y i son parmetros obtenidos por el mtodo de mnimos cuadrados.
Xi= Es el valor de la variable independiente en la iesima observacin.
=Es el error aleatorio.
n= nmero de datos.
x= observacin de la variable independiente.
y= observacin de la variable dependiente.
X = Promedio de las observaciones de x.
Y =Promedio de las observaciones de y.
SSx = Suma de cuadrados de x
SSy = Suma de cuadrados de y
Tabla 1. De las operaciones efectuadas

1
Op cit. (Rubio, 2003)
2

3
Estatura=
n de xi Dimetro = yi DIMETRO
xi2 yi2 xi*yi err
observacin medicin medicin real estimado
real
1 155 51 24025 2601 7905 53.0 -2.
2 172 55 29584 3025 9460 56.0 -1.
3 165 53 27225 2809 8745 54.8 -1.
4 153 51 23409 2601 7803 52.6 -1.
5 168 54 28224 2916 9072 55.3 -1.
6 154 55 23716 3025 8470 52.8 2.
7 158 54 24964 2916 8532 53.5 0.
8 164 56 26896 3136 9184 54.6 1.
9 168 56 28224 3136 9408 55.3 0.
10 173 58 29929 3364 10034 56.2 1.
11 160 55 25600 3025 8800 53.9 1.
12 170 57 28900 3249 9690 55.6 1.
13 183 59 33489 3481 10797 57.9 1.
14 167 55 27889 3025 9185 55.1 -0.
15 180 55 32400 3025 9900 57.4 -2.
totales 2490 824 414474 45334 136985
SSx 1134

SSy 68.9333333 bo= Y-b1*X 25.51 b1= SSxy/SSx 0.177

SSxy 201 25.51 0.18

promedio y 54.9333333 25.51 0.18

promedio x 166 25.51 0.18

En base a las frmulas de r y r 2, tenemos los coeficientes de correlacin y de


determinacin.

r 0.71891061

r2 0.51683246

Donde si r= 0 no existe relacin entre variables.

r > valor absoluto 0.412


0.72>0.412

Nos indica que existe relacin entre variables.

Grfica 2. Representacin grfica de los valores reales y los estimados. Se puede


observar el error en cada estimacin.

4
El intervalo de confianza es un rango en cualquiera de los lados de la media de
una muestra. Para obtenerlo se requiere tener los siguientes datos:

1. Alfa () es el nivel de significacin utilizado para calcular el nivel de


confianza. El nivel de confianza es igual a 100(1 - alfa)%, es decir, un
alfa de 0,05 indica un nivel de confianza de 95%.
2. Desviacin estndar (s) es la desviacin estndar de una muestra para
el rango de datos y se presupone que es conocida.

1 n
s ( xi X )2
n 1 i 1

3. Tamao de la muestra (n).

Si suponemos que el argumento alfa es igual a 0,05, se tendr que calcular


el rea debajo de la curva normal estndar que es igual a (1 - alfa) o 95%.
Este valor es 1,96. Por lo tanto, el intervalo de confianza en C es:

s
Y 1.96
n

EJERCICIO 1.

5
1. Siga la secuencia de resolucin del ejercicio y obtenga los valores presentados
en la tabla 1, grafico 1 y 2, programando y graficando en Excel, emulando lo
presentado en este escrito.
2. Obtenga la desviacin estndar y el tamao de la muestra.

Referencias bibliogrficas.

6
i
Rubio Arias, Hector. Estadstica Experimental. Instituto Nacional de Investigaciones Forestales, Agropecuarias y
Pecuarias (INIFAP) Mxico 2003.

2 Murray, Spiegel. Estadstica, 2da. Ed. Mc. Graw Hill. Mxico 1991

También podría gustarte