Está en la página 1de 6

Prctica #10: Regre

sin

Multilineal.

April 6, 2011

Introduccin.

Cuando se quiere llevar un ajuste de regresin lineal mltiple, cuando el nmero de variables pasa de dos, la utilizacin de lgebra de matrices es de bastante utilidad. En esta clase de problemas, el experimentador tiene un nmero k de variables independientes (x1 , x2, ..., xk ) y un nmero n de observaciones (y1, y2,..., yn ), las cuales pueden ser explicadas por una ecuacin de la forma:Yi = 0 + 1 X1i + 2 X2i +...+k Xki + i . Esta ecuacin puede ser reexpresada de forma compacta como:
y = X +

Donde:
1 1 X= 1 . . . x11 x12 x13 x21 x22 x23

. . .

. . .

1 x1n

x2n

. . . . . . . . . . . . . . .

xk1 y1 1 y2 2 xk2 y3 3 xk3 , Y = . , = . . . . . . . . yn n xkn

El sistema de ecuaciones a resolver es de la forma X = y , y su resultado por mnimos cuadrados es:


[X X] = X y

Finalmente, para obtener el vector de coecientes, es necesario invertir el producto que se encuentra del lado izquierdo de la ecuacin, de manera que:
= inv[X X] (X y)

; de esta forma se han estimado los parmetros de regresin lineal.


Procedimientos.

La prctica consisti en ajustar un modelo de regresin lineal mltiple partiendo de una serie de datos que se encontraban en un documento de la hoja de clculo Microsoft Excel. Estos datos contienen informacin acerca del nivel de colesterol e ndice de masa corporal (variables independientes) y de la tensin arterial Diastlica ( variable dependiente) de 70 individuos. Como primer paso, se importaron los datos del archivo .xls al entorno de trabajo de Scilab. Para esto se utiliz la funcin readxls cuyo argumento de entrada es unicamente la ruta del documento de excel cuyos datos queremos importar. Las lneas de cdigo utilizadas para importar los datos del documento, fueron las siguientes:
sh=readxls('/home/sinpulmones/Descargas/aversi.xls') hoja1=sh(1);

Posteriormente, fueron denidos dos arreglos: Un vector de unos, cuya dimensin era de 70 1, y una matriz de 70 2. Adems, fueron extrados los datos correspondientes a las variables independientes y dependientes e igualados a una variable. El cdigo que se utiliz en la consola de Scilab fueron las siguientes:
zm=ones(70,3); z=zeros(70,1); vari1=hoja1((2:71),2); vari2=hoja1((2:71),3); vard=hoja1((2:71),4);

Las variables independientes fueron igualadas a vari1 y vari2 y se igual la variable dependiente a vard. El vector de unos fue generado para colocar los 2

datos de las variables independientes mientras que el vector de ceros se gener para colocar los datos de la variable dependiente. Como ltimo paso, se gener un ciclo para transferir los datos de la variable a los arreglos que fueron inicializados.
for i=1:70 z(i,1)=vard(i,1); zm(i,2)=vari1(i,1); zm(i,3)=vari2(i,1); end

Donde z es el vector de la variable dependiente y zm es la matriz de coecientes que contenan a la variables independientes. El modelo lineal que se busca resolver para obtener los coecientes de mnimos cuadrados de la regresin lineal mltiple es el siguiente: [X X] = X y . Para poder encontrar el vector de coecientes , se debe llevar a cabo la siguiente operacin: = (inv(X X)) (X y). En Scilab esto se llev mediante los siguientes comandos:
x=(inv(zm'*zm))*(zm'*z)

Donde x es el vector de coecientes de la regresin polinomial. Cmo ltimo paso, utilizando los coecientes obtenidos por la solucin del modelo de mnimos cuadrados en su forma matricial, se procedi a gracar el plano de regresin. Para esto, se utiliz la funcin fplot3d, de la siguiente manera:
deff('z=f(x,y)','z=19.837851+ 0.1772564*x+ 0.7689353*y') x=3:1: 100 ; y=x; clf();fplot3d(x,y,f,alpha=5,theta=31)

Resumen de Resultados.

En la tabla 1 se muestran los coecientes del modelo lineal de regresin mltiple. En la gura 1, se muestra la grca del plano de regresin. 3

Tabla 1. Coecientes del Modelo Lineal. Coeciente del Modelo


0 1 2

Valor 19.837851 0.1772564 0.7689353

Figura 1. Plano de regresin para el modelo de regresin lineal mltiple


y = 19.837851 + 0.1772564x1 + 0.7689353x2

En este modelo, x1 representa el nivel del colesterol y x2 representa elndice de masa corporal.

Conclusiones.
Grupal.

Al nalizar los procedimientos experimentales se comprendi la manera de llevar a cabo un modelo de regresin lineal mltiple con la utilizacin del programa de anlisis numrico Scilab. Adems, se comprendi la forma en que se pueden importar documentos de Microsoft Excel a la consola de este software. En lo que reere al modelo de regresin obtenido, se determin la relacin que existe entre la presin arterial diastlica y el ndice de masa corporal y la presin arterial Diastlica, aumentando en aproximadamente 0.17 unidades por 4

cada unidad de nivel de colesterol y 0.76 unidades por cada unidad de ndice de Masa Corporal.
Individual.
Josshimar Aldaco: Esta prctica fue mucho ms agradable que la vez que utilizamos R debido a que considero que estamos mucho ms familiariazados con Scilab. Sin embargo, creo en los problemas que plantea la ingeniera se necesitan soluciones rpidas y la utilizacin de programacin cuando existen paquetes que ya tienen soluciones precargadas no tiene sentido. De ninguna manera sustituira el uso de paquetes como Minitab por Scilab. Cristian Blanco: En esta prctica comprendi el modo de introducir una regresin multilineal en el software de Scilab, fue interesante la forma en que ya utilizamos mas la ayuda para la solucin de problemas, la forma de interactuar con otros formatos como es el de excell con scilab fue interesante, actualmente representa un modo mas agil de introducir datos, aunque se debe vericar las entradas y salidas al respecto, result un elemento ideal para facilitar y optimizar tiempos en la realizacin de esta regresin. Concluy con que esta prctica resulto interesante en la medida en que se comprendi la interaccin de scilab con otros programas se esperara ver si interactua por ejemplo con R, mathlab u otros programas de algun modo similar. Diego Granados: Con esta prctica entend como debe ser abordado un problema de regresin lineal mltiple y comprend la manera en que debe ser solucionado. Me pareci de mucha utilidad entender como funciona la funcin readxls en excel y la manera de utilizar Scilab para efectuar el anlisis de regresin. Sin embargo, las funcionalidades de estadstica de scilab no son las mejores y no constituye mi primera opcin para llevar a cabo anlisis de regresiones. Jordan Prez: Lo que ms me agrad de la prctica fue la idea de poder sincronizar a Scilab con Excel por que para m esa funcionalidad era desconocida. Obtener el modelo de regresin mediante la pura utilizacin de matrices me pareci muy interesante y me ayud a entender un poco ms como funciona una regresin ya que, muchas veces, el software que tiene funciones estadsticas poco dice acerca de la metodologa que utilizan para estimar parmetros.

References

[1] http://lc.e.umich.mx/~calderon/estadistica/anova02.html [2] Steven C. Chapra & Raymond P. Canale. Mtodos Numricos para Ingenieros. Quinta Edicin. McGrawHill. Mxico 2006. 5

También podría gustarte