Está en la página 1de 9

ANALISIS DE REGRESIN Y CORRELACIN LINEAL 4.1.

Introduccin La determinacin de la relacin entre variables es fundamental para los estudios y la toma de decisiones. Tanto en la administracin pblica como privada, las tomas de decisiones estn fundamentadas en el conocimiento de la informacin para que la evaluacin sea significativa, para conocer verazmente la relacin que existe entre dos variables en particular. Una que se conoce y que corresponde a una variable independiente, y la otra que es desconocida y que recibe el nombre de variable dependiente. Para el caso del presente anlisis, se identificar a la variable independiente como X y a la variable dependiente como Y. 4.2. Tipos de relaciones. Como se trata de interpretar las relaciones que existen entre variables, se definir el y describir que el anlisis de regresin y correlacin lineal corresponde a una relacin asociada que existe entre dos variables que como se ha sealado antes, la variable X que es conocida y la variable Y desconocida. Considrense los siguiente ejemplos: En una fbrica se sabe que hay una relacin entre la tecnologa y la productividad; la venta de latas de aerosoles y el nivel de contaminacin ambiental; el PIB (producto interno bruto) y el consumo total. Ntese que en estos ejemplos que hay un incremento en la variable independiente que provoca un incremento en la variable dependiente por lo tanto, se esta hablando de una relacin directa. Cuando se habla ple ejemplo de la competencia, existen dos establecimientos que producen y venden bienes, si uno de los dos mejora e incrementa su produccin puede ser que vende ms que el otro, en este sentido se habla de una relacin en donde la variable independiente crece mientras que la variable dependiente disminuye. Esta es una relacin inversa. 4.3. Diagrama de dispersin. Un diagrama de dispersin es un grfico por puntos que son pares de los cuales el primero se refiere a lo que se conoce como variable independiente y el segundo que es la variable dependiente. En este campo se puede figurar la tendencia de una recta o una tendencia diferente o sea curva. Como ejemplo de este subtema, se puede considerar la siguiente tabla que se refiere a la variable independiente (llamadas) y nmero de unidades de producto vendidas variable dependiente:

Vendedores A B C D E F G H I J

Llamadas 25 45 20 40 10 10 20 20 30 30

Unidades vendidas 35 65 40 60 35 60 50 40 40 60

DIAGRAMA DE DISPERSIN DATOS DE LA TABLA ANTERIOR

70 60 50 40 Series1 30 Series2 20 10 0 0 10 20 30 40 50

Los datos observados de la tabla y grfica, dan la idea de la relacin entre el nmero de llamadas y las ventas del producto, lo que indica que los vendedores que ms llamadas hicieron pudieron vender ms unidades, pero no se puede aventurar y decir que la relacin es la ideal, es decir perfecta, sin embargo como se observa el vendedor F que slo hizo 10 llamadas pudo vender ms que el vendedor C. La lnea de regresin se representa mediante una recta en la grfica siguiente

70 60 50 40 Series1 30 Series2 20 10 0 0 10 20 30 40 50

4.4. Representacin grfica de los tipos de relacin: lineal y curvilnea.

4.5. Determinacin de Y estimada mediante ajuste de mnimos cuadrados. La ecuacin de regresin expresa la relacin lineal entre dos variables y recibe el nombre de Y estimada, cuyo smbolo es Y. As se determina la ecuacin para la estimacin de la variable dependiente Y. Y = a + bX De la cual se explica lo siguiente: (frmula)

a=interseccin de la recta con el eje vertical (y) b=pendiente de la recta

X=variable independiente Estimacin mediante la lnea de regresin, en los diagramas visualmente se observa que la lnea se coloca al ajustar los puntos de datos. La lnea de regresin es una ecuacin y esta dada por y = a +bx. Con esta ecuacin, se puede tomar cierto valor de la variable x independiente--, para calcular el valor de y la letra a representa la interseccin y Por ejemplo, considere que a = 3 y b = 2, el valor de y cuando x = 7, por lo que sustituyendo los valores en la ecuacin se tiene: Y = 5 + 2(7) = 5 + 14 = 19 Ahora vase como se obtiene el valor de la pendiente b, a travs de una representacin en el grfico suponiendo los siguientes puntos: Primer punto: (x1,y1) = 4,5 y (x2,y2) = 5,7. Entonces se tiene que el valor de b esta dado por:

(x2,y2) segundo punto (x1,y1) primer punto

=3

Sustituyendo b = y2 y1 = 7 - 5 x2 x1 5-4

=2 1

= 2

Ahora aplicando la ecuacin mediante el uso del mtodo de mnimos cuadrados, para la y estimada que se simboliza: Y=variable dependiente ye estimada. Ahora se procede a estimar los valores de a (interseccin) y b (pendiente) Para ello es prctico suponer un ejercicio para el uso de la ecuacin de la estimacin mediante este mtodo.

Ejemplos hipotticos: (ejemplo 1) El Gerente de administracin de una empresa necesita estimar lo que le implicar gastar para la reparacin de su equipo de transporte. Suponiendo que cuenta con una camioneta de lujo con una antigedad de 3 aos. En otras palabras el gerente tiene inters en conocer la relacin que existe entre la antigedad y el gasto que se tiene que hacer en reparacin. Para ello, se ha concentrado informacin considerable sobre cuatro camionetas de las mismas caractersticas que posee la empresa La solucin se determina de la siguiente manera: Primeramente se tiene que organizar los datos requeridos para calcular la lnea de regresin. Ordenar a continuacin dichos datos: GASTOS ANUALES DE REPARACIN DE VEHCULOS. Cuadro 1 No.de unidad Edad de Cada unidad (X) 6 4 4 2 Gastos de reparacin durante el ltimo ao (Y) 7 8 6 5

1 2 3 4

Obtener los valores de XY, X2, Y2 Cuadro 2 unidad 1 2 3 4 4 Edad (x) 6 4 4 2 16 Gastos (y) 7 8 6 5 26 XY 42 32 24 10 108 X2 36 16 16 4 72 Y2 49 64 36 25 174

Con los datos de los cuadros 1 y 2 se puede determinar la ecuacin, para estimar los valores de y cuando X=7 y X=8 aos respectivamente. Estableciendo el criterio a aplicar se tienen que desarrollar:

X = 4,

Y = 6.5 (ecuacin 1)

b =XY- nXY X2 nX2 a= Y bX = a + bx

(ecuacin 2) (ecuacin 3)

Sustituyendo las ecuaciones propuestas, se tiene: b = 108 4(4)(6.5)/72-4(16) = .5

a= 6.5 0.5(4) = 6.5 2. = 4.5 Cuando X = 7, ye estimadada es: = 4.5 + .5(7) = 4.5 + 3.5 = 8 1 camioneta con antigedad de 7 aos, har un gasto
de 8 mil pesos.

Cuando X = 8 ye estimada es: = 4.5 + .5(8) = 4.5 + 4 = 9.5 camioneta con antigedad de 8 aos, se har un gasto de
9 mil pesos.

(Ejemplo 2) La siguiente muestra de observaciones se tom aleatoriamente. (Cuadro 3) variables X 4 5 3 6 Y 4 6 5 7 (Cuadro 4) X 4 5 3 6 10 x 28 Y 4 6 5 7 7 y 29 XY 16 30 15 42 70 xy 173 X2 16 25 9 36 100 x2 186

10 7 Y2 16 36 25 49 49 y2 175

Con los puntos tomados del cuadro 4, se puede determinar la ecuacin, para estimar los valores de y cuando X=7

(Ejemplo 3) El departamento de Recursos Humanos de una empresa importante desea conocer la relacin de calificaciones de pruebas y la destreza en la productividad, por lo que analiza comparativamente una muestra aleatoria de 5 empleados de una lnea de produccin con su rendimiento por hora (productividad), cuyos datos fueron registrados como se indica en el siguiente cuadro: (Cuadro 5) Empleado 1 2 3 4 5 Calif. Prueba de destreza (x) 11 13 15 16 11 Unidades producidas por hora (y) 57 65 69 70 52

Ahora, los clculos que se tienen que realizar para calcular la pendiente y el punto de interseccin de y de la ecuacin correspondiente, es decir, Y= a + bx estn registrados en el siguiente cuadro: (Cuadro 6) Empleado 1 2 3 4 5 x Calif. x 11 13 15 16 11 Productividad xy por hora 57 65 69 70 52 y xy X2 Y2

x2

y2

Aplicar las frmulas matemticas: 1, 2 y 3 4.6 Error estndar de la estimacin El propsito de esta medicin constituye el desarrollo de intervalos para mejor confianza de la variable predicta (dependiente). En razn de ello, se deber primeramente conocer o determinar atreves de ecuacin matemtica el error estndar de la estimacin el cual se identifica por: (Se), desviacin estndar que se refiere a la forma de dispersin de los pares de puntos que se localizan arriba y debajo de la de la lnea de regresin. Retomando el caso del cuadro 2, para calcular el error estndar atreves de:

Se = (Y - Y) 2 n2

(Ecuacin 4)

(Cuadro 7) X 6 4 4 2

y 7 8 6 5

7.82 6.5 6.5 5.18

( y ) ( - 0.82) ( 1.5 ) ( -0.5 ) ( -0.18 )

( y )2 0.25 2.25 0.25 0.25 2 (y - ) 3.00

Desarrollando la ecuacin 4: Se = 3.2 42 = 3. 2 = 1.6 Se = 1.26 ( error estndar )

Estimacin de intervalo para la ye estimada. Como se trata de muestras pequeas, se utilizar la tabla de valores de t. Desarrollando la siguiente expresin matemtica: = a + bx tSe (Ecuacin 5) Sustituyendo la ecuacin, se tiene la estimacin de los lmites superior e inferior. = 4.5 + 0.5(7) 1.26,
= 81.26;

= 4.5+3.5 (1)1.26 lmite superior lmite inferior

8+1.26 = 9.26 8 1.26= 6.7

Asi se tiene una confianza de ms de 68% que el monto de gasto de una camioneta con 7 aos de antigedad estar ente 6.7 y 9.26. Con un nivel de confianza de ms de 95% el intervalo se obtiene con un 2 Se. 4.6.1 Comentario sobre la interpretacin del error estndar de la estimacin. En un diagrama de dispersin, en donde existe una lnea recta de ye estimada y trazando lneas por encima y de debajo de la recta de ye estimada, se puede observar el grado de dispersin de los valores dados por cada par de datos (variable independiente y variable dependiente), cuando se aplica por ejemplo, 1,

2, y 3 errores estndares de niveles de confianza ms de 68%, 95% y 99% respectivamente.

También podría gustarte