Está en la página 1de 8

REGRESIN LINEAL Y CORRELACIN En las unidades anteriores se ha centrado la atencion en el tratamiento de los valores que puede tomar una

variable definida en una investigacion, tanto en el nivel de muestra como en el de poblacion. Sin embargo, frecuentemente las investigaciones implican considerar dos o ms variables. Los procedimientos para el analisis de la relacion de dos variables seran contemplados en esta unidad.

REGRESIN LINEAL SIMPLE


La regresion es un metodo para determinar la relacion existente entre una variable independiente y otra dependiente, con fines de prediccion de esta ultima variable ante los cambios de la primera. La variable independiente o predictora suele representarse por X y la variable dependiente por Y. En algunos casos, la variable independiente se asocia con medidas de causa y la dependiente con medidas de efecto. En la produccion industrial pueden ser variables independientes: el numero de trabajadores, el tiempo de labor semanal, la cantidad de materia prima, entre otras. Y variables dependientes: el numero de articulos producidos, los ingresos semanales, el posicionamiento en el mercado, etc. Observese que las variables dependientes se muestran como efecto de las variables independientes o causa del proceso de produccion. Por ejemplo, una compania de bienes raices residenciales en una ciudad desea predecir los costos mensuales del alquiler de apartamentos, basado en el area en metros cuadrados. Se selecciono una muestra aleatoria con los siguientes datos: Tabla 30. rea y costo de alquiler de apartamentos

Fuente: Adaptacion del texto Estadistica para administracion. Berenson y otros, En este caso, se busca relacionar las variables area y costo mensual; donde la variable independiente (X) es el area, y la dependiente (Y), el costo mensual. Diagrama de dispersin Cuando se toma una muestra de dos variables o bivariada, se obtiene una serie de pares de datos. Estas parejas son de la forma (x,y) y se pueden representar como puntos en un plano bidimensional o plano cartesiano; la representacion grafica de las parejas se conoce como diagrama de dispersin.

La regresion lineal pretende encontrar una recta que represente todos los puntos que se encuentran en el plano cartesiano. En la grafica 15 se ilustran algunos diagramas de dispersion. Grfica 15. Representacin de algunos diagramas de dispersin

Para el ejemplo de la tabla 30, el diagrama de dispersion se presenta en la grafica 16. Grfica 16. Diagrama de dispersin para el rea y costo de alquiler de Apartamentos

El diagrama de dispersion muestra una relacion lineal positiva; es decir, a medida que crece el area aumenta el valor del alquiler del apartamento. Adicionalmente, no se observa ningun valor atipico.

Ajuste de una recta por el mtodo de mnimos cuadrados Sobre el diagrama de dispersion se puede trazar un sinnumero de lineas rectas que represente el conjunto de datos y facilite la prediccion para la variable dependiente. Sin embargo, este metodo intuitivo es demasiado subjetivo. El objeto de la regresion lineal consiste en determinar una recta de la forma i i y = b +b x 0 , que sea representativa del conjunto de datos muestrales; este proceso se conoce como ajuste de una recta y se utiliza como procedimiento el mtodo de mnimos cuadrados. En este sentido, el metodo de minimos cuadrados es objetivo y no depende de la apreciacion personal del investigador, sino de relaciones matematicas preestablecidas. La tarea esta en determinar los parametros 0 b y b en la ecuacion de regresion lineal simple i i y = b +b x 0 , donde x : es el i-esimo valor de la variable X. Y : es el i-esimo valor de la variable y 0 b : es el valor que toma la variable dependiente "y", cuando la variable independiente "x" vale 0, y es el punto donde la recta cruza el eje vertical. b : determina la pendiente de la recta, su grado de inclinacion. b : es el valor que toma la variable dependiente "y", cuando la variable independiente "x" vale 0, y es el punto donde la recta cruza el eje vertical. b : determina la pendiente de la recta, su grado de inclinacion. Una vez hallados los parametros 0 b y b , los valores calculados a partir de la ecuacion de regresion se denominan valores estimados, y se representan por yi . En el metodo de minimos cuadrados se emplean los datos de la muestra para determinar los parametros 0 b y b que minimizan la suma de los cuadrados de las desviaciones entre los valores observados de la variable dependiente i y y los valores estimados de la variable dependiente i y . La desviacion se obtiene entre la diferencia de los valores reales i y y los valores estimados i y ; por tanto, la suma de los cuadrados de las desviaciones debe ser minima. Esto es, min ( y)

Con el calculo diferencial se puede demostrar que los parametros b1 y b que minimizan el cuadrado de las desviaciones son:

Los parametros para el ejemplo de la tabla 30, se calculan a partir de los datos presentados en la tabla.

Valores para el clculo de parmetros de la compaa de bienes raz

en consecuencia, el modelo de regresion para estimar el costo de alquiler mensual de un apartamento a partir del area sera:

Este modelo representa la integracion de todos los puntos ubicados en el diagrama de dispersion, y garantiza que la suma del cuadrado de las desviaciones es minima, como se ilustra en la grafica 17. Modelo de regresin lineal para el rea y costo de alquiler de Apartamentos

Interpretacin de bo y b bo = 88,1412 indica que cuando el cambio en el area es cero, el cambio esperado en el costo de alquiler mensual es de 88,1412 miles de pesos; es decir, que el costo de alquiler mensual aumenta 88,1412 miles de pesos. La pendiente b = 5,73804 senala que por cada incremento de 1 m2 en el area, se pronostica que el cambio esperado en el costo mensual de alquiler es de 5,73804 miles de pesos, cuyo significado es que se pronostica que el costo de alquiler aumenta 5,73804 miles de pesos por cada 1 m2 de incremento en el area. Predicciones Con la ecuacion de regresion encontrada, es posible predecir algunos valores para la variable dependiente a partir de la variable independiente Observacin Cuando se utiliza un modelo de regresion con propositos de pronostico, es importante que se tenga en cuenta solo el intervalo de valores que toma la variable independiente y que fueron usados para construir el modelo. Entonces, si se predice un valor de Y para un valor dado de X, es posible interpolar dentro de este intervalo de valores de X, pero no se debe extrapolar hacia fuera de este intervalo. Por ejemplo, cuando se usa el area en m2 para predecir el alquiler mensual, se observa en la tabla 29 que los

metros cuadrados varian de 65 a 184. Por tanto, las predicciones de costos de alquiler mensual deben hacerse solo para apartamentos con un area entre estas medidas. Cualquier pronostico de costos de alquiler mensual con areas fuera de este intervalo es poco confiable.