P. 1
APLICACIÓN DE LA REGRESION LINEAL POR MINIMOS CUADRADOS

APLICACIÓN DE LA REGRESION LINEAL POR MINIMOS CUADRADOS

|Views: 15.262|Likes:
Publicado porcesar_acosta
Un problema de la vida real, desarrollado mediante la tecnica de regresión lineal por minimos cuadrados.
Un problema de la vida real, desarrollado mediante la tecnica de regresión lineal por minimos cuadrados.

More info:

Published by: cesar_acosta on May 18, 2009
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

06/06/2013

pdf

text

original

Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.

PROYECCION DE USO DE AUDIOVISUALES EN LA FUNDACIÓN UNIVERSITARIA KONRAD LORENZ
Acosta, César. cesara.acostaq@fukl.edu FUNDACIÓN UNIVERSITARIA KONRAD LORENZ Resumen- Este documento está encaminado a la resolución de un problema de la vida real, abordándolo por medio del uso de los métodos numéricos vistos, siendo la regresión lineal por mínimos cuadrados la herramienta que permitirá obtener los resultados deseados. Por otra parte es una forma de aplicar parte de los conocimientos adquiridos en pro del mejoramiento de la calidad en el servicio del departamento de audiovisuales de la Fundación Universitaria Konrad Lorenz, analizando en un mediano plazo el crecimiento de las solicitudes por parte de la comunidad académica. cca Índice de Términos: correlación, dispersión, función lineal, regresión lineal. {login1,login2, …}@xxx.yy.zz

Nombre Institución

I.

FORMULACIÓN DEL PROBLEMA

En los últimos años se ha visto una tendencia de crecimiento en el uso de ayudas audiovisuales, como el videobean, que complementa la labor pedagógica de los docentes de la Universidad Konrad Lorenz, por tal razón la institución ha venido adquiriendo equipos y nuevas tecnologías que permitan satisfacer esta necesidad lo que conlleva a grandes inversiones de dinero que no habían sido presupuestadas algunos años atrás. Por tal razón mi propuesta de problema es contribuir proporcionando un pronóstico de utilización de los próximos dos a tres años, de estas ayudas audiovisuales, procurando el desarrollo de nuevos procesos internos que mejoren aspectos logísticos en cuanto a los prestamos que se efectúan diariamente. Desde mi punto de vista y ya que laboro actualmente en el área de audiovisuales de la institución, se ha observando que la universidad está en continua expansión y seria de gran utilidad conocer y planificar cuales van a ser las exigencias, al menos de tipo tecnológico y de apoyo pedagógico que tendremos en un mediano plazo.

II.

JUSTIFICACION DEL METODO DE RESOLUCION

Después de un análisis grafico, que se puede observar en la figura 1, en el cual se tomaron datos estadísticos del uso de ayudas audiovisuales de 8 semestres correspondientes a los últimos cuatro años, se observa que los datos en la grafica de dispersión están contenidos en una región estrecha y por lo tanto sugiere una relación directamente proporcional.[1]

Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.

Grafico de dispersion de datos.
4000 NUMERO DE EQUIPOS 3500 3000 2500 2000 1500 1000 500 0 0 2 4 PERIODOS 6 8 10

Fig.1

Gran parte de las matemáticas se dedica a estudiar variables que están deterministicamente relacionadas. Decir que X y Y están relacionadas de esta manera, significa que una vez conocido el valor de X, el valor de Y queda completamente especificada. [2] Donde se asocian errores sustanciales con los datos, la interpolación polinomial es inapropiada y puede dar resultados insatisfactorios cuando se usa para predecir valores, por ejemplo en la figura 2a, se muestran siete datos derivados experimentales que exhiben variabilidad significativa, pero sugiere una posible relación entre Y y X. Es decir, la tendencia general indica que los valores más altos de Y son asociados a los valores más altos de X. ahora si una interpolación de sexto orden se ajusta a estos datos, como se aprecia en la figura 2b, pasara justo a través de todos los puntos. Sin embargo, a causa de la variabilidad de los datos la curva oscila en forma amplia en el intervalo entre los puntos. Una estrategia más apropiada para tales casos es derivar una función aproximada que ajuste la forma de la tendencia general de los datos sin ajustar necesariamente con los puntos individuales. La figura 2c ilustra cómo se puede usar por lo general una línea recta para caracterizar la tendencia de los datos sin pasar a través de un punto en particular. Para determinar esta línea recta hay que inspeccionar de forma visual los datos graficados y después trazar una “mejor” línea a través de los puntos. Pero para hacer esto es necesario concebir algunos criterios con el fin de establecer una base para el ajuste. Una forma de hacerlo es derivar una curva que minimice la discrepancia entre los puntos y la curva, para lograr esto se utiliza la técnica de regresión por mínimos cuadrados.

Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.

Fig. 2a

Fig. 2b

Fig.2c

III.

INSUMOS PARA LA SOLUCION DEL PROBLEMA

La relación matemática deterministica más simple entre dos variables X y Y es una relación lineal: (1) Donde es el estimado de la pendiente o razón de cambio de con , es el intercepto de y con la línea de regresión, y es el error, o residuo, entre el modelo y las observaciones. Así el error o residuo es la discrepancia entre el valor real de y el valor aproximado, , predicho por la ecuación lineal.

Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.

A. Criterio para un “mejor” ajuste Una estrategia para ajustara a la “mejor” línea a través de los datos podría ser minimizar la suma de los errores residuales para todos los datos disponibles, como en:

(2)

Donde n es el número total de puntos. Sin embargo, éste es un criterio inadecuado, como se puede ver en la figura (3a), la cual muestra el ajuste de una línea recta de dos puntos. Obviamente, el mejor ajuste es la línea que conecta los puntos. Sin embargo, cualquier línea recta que pasa a través del punto medio que conecta la línea (excepto una línea perfecta vertical) resulta en un valor mínimo de la ecuación (2) igual a cero debido a los errores que se cancelan.

Fig. 3a

Fig. 3b

Fig. 3c

Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.

Por tanto otro criterio lógico podría ser minimizar la suma de los valores absolutos de las discrepancias, como en (3)

La figura (3b) demuestra que por este criterio es también inadecuado. Para los cuatro puntos expuestos, cualquier línea recta que este dentro de las líneas punteadas minimizará el valor absoluto de la suma. Así, este criterio tampoco da un único mejor ajuste. Una tercera estrategia para ajustar a la mejor línea es el criterio minimax. En esta técnica la línea se elige de manera que minimice la máxima distancia que tenga un punto individual desde la línea. Como se ilustra en la figura (3c), tal estrategia no es adecuada para regresión, ya que tiene una excesiva influencia en puntos fuera del conjunto; es decir, un solo punto con un gran error. Una estrategia que supera los defectos de los procedimientos anteriores es minimizar la suma de los cuadrados de los residuos entre la y medida y la y calculada con el modelo lineal.

(4)

Este criterio tiene varias ventajas, entre ellas el hecho de que se obtiene una línea única para un cierto criterio conjunto de datos. A continuación se presenta una técnica para determinar los valores de y que minimizan la ecuación 4. B. Ajuste por mínimos cuadrados de una línea recta Para determinar los valores de coeficiente: y de la ecuación (17.3) es diferenciada con respecto a cada

(5)

Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.

Obsérvese que se han simplificado los símbolos de la sumatoria; todas las sumatorias son de i= 1 hasta n. Al fijar estas derivadas igual a cero, resultara un mínimo . Si se hace esto, las ecuaciones se pueden expresar como:

(6)

Ahora si hacemos que

= y

podemos expresar las ecuaciones como un conjunto de dos ecuaciones ):

lineales con dos incógnitas (

(7)

(8)

Estas son las llamadas ecuaciones normales, y pueden ser resueltas en forma simultánea.

(9)

Este resultado, entonces, se puede usar un conjunto con la ecuación 7 y resolver para

(10)
Donde

y

son las medias de y y x respectivamente.

Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.

IV.SOLUCION DEL PROBLEMA

Como se dijo anteriormente, el problema que queremos solucionar tiene que ver con el pronóstico de uso de ayudas audiovisuales en la Fundación Universitaria Konrad Lorenz. Para esto contamos con la tabla 1[3], donde vemos la distribución según el año y el semestre, de los prestamos efectuados de las ayudas audiovisuales. La figura 4 ilustra la grafica de dispersión de estos datos hasta el segundo semestre de 2008. Con esta grafica podemos determinar que la nube de datos tiene una tendencia ascendente y hay poca dispersión entre los mismos.

AÑO 2004 2005 2006 2007 2008

PERIODO 1 2 3 4 5 6 7 8 9 10 N(total de muestras)

USUARIOS ATENDIDOS 690 730 739 1077
2690 2442

1ER SEMESTRE 2DO SEMESTRE

2786
2856

2936 3469

10

Tabla 1

Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.

Uso de audiovisuales hasta 2008-II
3000 NUMERO DE USUARIOS 2500 2000 1500 1000 500 0 0 2 4 PERIODOS 6 8 10

FIG. 4

Habiendo verificado esto podemos comenzar a hacer los cálculos matemáticos necesarios que determinaran la recta de regresión. En la tabla 2 se ilustra cada una de las sumatorias que se incluirán en las ecuaciones 9 y 10.

ΣXi 1 2 3 4 5 6 7 8 9 10 55

ΣYi 690 730 739 1077
2690 2442

Σxi/n 1 2 3 4 5 6 7 8 9 10 5.5

ΣYi/n 690 730 739 1077
2690 2442

ΣXi 1 2 3 4 5 6 7 8 9 10

Σ(Xi*Yi) ΣYi 690 730 739 1077
2690 2442

Σxi^2 1 2 3 4 5 6 7 8 9 10 385

Σyi^2 690 730 739 1077
2690 2442

2786
2856

2786
2856

2786
2856

2786
2856

2936 3469 20415

2936 3469 2041.5

2936 3469 140241

2936 3469 52487103

Tabla 2

Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.

Con esta información ya tenemos la posibilidad de ir a las ecuaciones 9 y 10, reemplazar y obtener una recta de la forma y=mx+b, que es determinada por nuestros valores . Seguido de esto, y con base en esta función obtener la recta de regresión, creamos la tabla 3 en la que damos valores de x y los evaluamos en nuestra función que nos dará el punto y.
a1 a0 338,8909091 177,6

X 0 1 2 3 4 5 6 7 8 9 10 11 12

Y 177 516 855 1194 1533 1872 2210 2549 2888 3227 3566 3905 4244

Tabla 3. Lo siguiente, y como podemos ver en la figura 5, es graficar los valores de la tabla 3 e incluirlos sobre la figura 4 de dispersión para verificar el comportamiento sobre esta, también es necesario obtener el coeficiente de correlación r, este valor puede ir de +1.00 a -1.00 que multiplicado por 100 (para mostrarlo en porcentaje) nos indica la fuerza o grado de la relación; cuanto mayor sea, mayor será la correspondencia entre los dos conjuntos de datos. Así, cuando rXY= 1.00 o 100%, los resultados en y serán completamente predecibles, si se conoce x. [4] En nuestro caso el cálculo de r se hace mediante la ecuación:

Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.

Esto nos da como resultado un valor que indica que la correlación es explicada en un 95.46%

Estimación de uso de equipos audiovisuales para 1er semestre del año 2010
4500 4000 3500 3000 2500 2000 1500 1000 500 0 0 2 4 6 8 10 12 4244 NUMERO DE EQUIPOS

Linea de Regresion Puntos de dispersion estimado

14

PERIODOS

Fig. 5

Vemos que para el primer semestre del año 2010, el número de usuarios del departamento de audiovisuales puede ascender a los 4244 usuarios de las diferentes facultades.

Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.

REFERENCIAS

[1] http://www.slideshare.net/edwood.ocasio/regresion-presentation. Tomado el 8 de Mayo de 2009. [2] Probabilidad y estadística: para ingeniería y ciencias. Devore, Jay L. México: Cengage Learning,
c2008 Edición 7. ed. Pág.: 447 [3] Dirección de Biblioteca Fundación Universitaria Konrad Lorenz. Dra. Beatriz Flórez [4] Principios de la medición en psicología y educación. Brown, Frederick G. Pag. 112

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->