Está en la página 1de 6

Regresin y correlacin

1. 2. 3. 4. 1. Introduccin Marco Terico Desarrollo de un Ejercicio Bibliografa Introduccin A continuacin, desarrollare el grado de relacin entre dos o mas variables en lo que llamaremos anlisis de correlacin, Para representar esta relacin utilizaremos una representacin grfica llamada diagrama de dispersin, estudiaremos un modelo matemtico para estimar elvalor de una variable basndonos en el valor de otra, en lo que llamaremos anlisis de regresin. y, finalmente Desarrollaremos un ejercicio aplicando lo aprendido, donde utilizaremos datos verdaderos de una empresa de servicios tursticos. Ecuacin de regresin Mltiple.- La forma general de la ecuacin de regresin mltiple con dos variables independientes es:
Y' = a + b1X1 + b2X2

X1,X2 : Variables Independientes a : es la ordenada del punto de interseccin con el eje Y. b1 : Coeficiente de Regresin (es la variacin neta en Y por cada unidad de variacin en X1.). b2 : Coeficiente de Regresin (es el cambio neto en Y para cada cambio unitario en X2). Prueba Global.- esta prueba investiga bsicamente si es posible que todas las variables independientes tengan coeficientes de regresin neta iguales a 0. 2. Marco Terico A fin de facilitar la comprensin del presente trabajo definiremos algunos conceptos basicos. Anlisis de Correlacin .- Es el conjunto de tcnicas estadsticas empleado para medir la intensidad de la asociacin entre dos variables. El principal objetivo del anlisis de correlacin consiste en determinar que tan intensa es la relacin entre dos variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersin. Diagrama de Dispersin.- es aquel grafico que representa la relacin entre dos variables. Variable Dependiente.- es la variable que se predice o calcula. Cuya representacin es "Y" Variable Independiente.- es la variable que proporciona las bases para el calculo. Cuya representacin es: X1,X2,X3....... Coeficiente de Correlacin.- Describe la intensidad de la relacin entre dos conjuntos de variables de nivel de intervalo. Es la medida de la intensidad de la relacin lineal entre dos variables. El valor del coeficiente de correlacin puede tomar valores desde menos uno hasta

uno, indicando que mientras ms cercano a uno sea el valor del coeficiente de correlacin, en cualquier direccin, ms fuerte ser la asociacin lineal entre las dos variables. Mientras ms cercano a cero sea el coeficiente de correlacin indicar que ms dbil es la asociacin entre ambas variables. Si es igual a cero se concluir que no existe relacin lineal alguna entre ambas variables. Anlisis de regresin.- Es la tcnica empleada para desarrollar la ecuacin y dar las estimaciones. Ecuacin de Regresin.- es una ecuacin que define la relacin lineal entre dos variables. Ecuacin de regresin Lineal: Y = a + Bx Ecuacin de regresin Lineal Mltiple: Y = a + b1X1 + b2X2 + b3X3... Principio de Mnimos Cuadrados.- Es la tcnica empleada para obtener la ecuacin de regresin, minimizando la suma de los cuadrados de las distancias verticales entre los valores verdaderos de "Y" y los valores pronosticados "Y". Anlisis de regresin y Correlacin Mltiple.- consiste en estimar una variable dependiente, utilizando dos o ms variables independientes.

Y AO 2000 2001 2002 2003 2004 VENTAS 264000 384000 400200 422400 543000

X1

X2

GASTOS DEPUBLICIDAD COMISIONES DE VENDEDORES 550 590 680 700 750 15840 19250 26013 16896 16290

3. ANLISIS DE DATOS: Se van a utilizar las siguientes variables: Variables Independientes: 1.- Gastos de Publicidad 4. 2.- Comisin de vendedores 5. Variable dependiente: - Ventas Utilizando el Excel obtenemos los siguientes datos.
Estadsticas de la Regresin Coeficiente de correlacin mltiple Coeficiente de determinacin R2 0.92092 0.84810

R2 ajustado Error tpico Observaciones

0.69619 54887.83156 5

6. De aqu se puede decir: - De acuerdo al valor del coeficiente de correlacin mltiple, podemos afirmar que la variable X1 (Gastos de Publicidad) y X2 (Comisin de vendedores) se encuentran asociadas en forma directa de una manera muy fuerte con la variable dependiente Ventas, en un 92%. - De acuerdo al Coeficiente de determinacin R2, podemos decir que el 85% de las ventas pueden ser explicadas por los gastos de publicidad y las comisiones de los vendedores.
ANLISISDEVARIANZA Grados de libertad Regresin Residuos Total 2 2 4 Suma de cuadrados 33640459893 6025348107 39665808000 Prom. de los cuadrados 16820229947 3012674053 F 5.5832 Valor crtico de F 0.15190282

7.
Coeficiente s Error tpico Estadstic Probab ot . Inferior 95.0% Sup. 95.0%

Inf. 95%

Sup. 95%

Intercepci 242459.3 n 9 -289315.16 GSTOS DE PUBLICID .

-1.193

0.3551 1332534.44 753904.11 1332534.44 753904.11 3 6 8 6 8 0.0790 323.127596 8 5 0.7624 30.4540025 5 7

1123.49

336.22

3.342

2570.108

-323.128

2570.108

COM. DE VENDED.

-2.27

6.55

-0.346

25.922

-30.454

25.922

8. De aqu se desprende la ecuacin de regresin mltiple:


Y = - 289315 + 1123 X1 - 2.27 X2

9. Prueba Global: Verificacin de la validez del modelo de regresin Mltiple. Formulacin de Hiptesis: Hp: B1 = B2 = 0 Ha: B1 B2 0 10. Si se acepta la hiptesis planteada, significa que ninguno de los factores (X1,X2) son relevantes para explicar los cambios en Y. De acuerdo a la tabla de anlisis de la varianza F calculado es 5.58 y el pvalor es 0.15, de lo cual podemos decir que La hiptesis planteada se rechaza y se acepta la hiptesis alternativa, por que el F calculado es mayor que el p-valor. Hasta ahora se ha demostrado que algunos, pero no necesariamente todos los coeficientes de regresin, no son iguales a cero y, por o tanto son tiles para las predicciones. El siguiente paso consiste en probar individualmente las variables para determinar cuales coeficientes de regresin pueden ser cero y cuales no. Del anlisis mediante Excell tenemos el siguiente cuadro. VENTAS VS GASTOS DE PUBLICIDAD
Estadsticas de la regresin Coeficiente de correlacin mltiple 0.915976333 Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones 0.839012642 0.785350189 46136.36902 5

11.
ANLISISDEVARIANZA GL Regresin Residuos Total 1 3 4 Suma de cuadrados 33280114360 6385693640 39665808000 Prom. de los cuadr. 33280114360 2128564547 F 15.6350 p-Valor 0.028865932

12.
Error tpico Estadst. Probab. Inf. 95% t

Coeficientes

Sup. 95%

Inf. 95%

Sup. 95%

Intercepcin GASTOS DE PUBLICIDAD

324444.428 185054.64 -1.7532 0.1778 913371.43 264482.58 913371.43 264482.58

1111.8722 281.19389

3.9541 0.0289

216.9869 2006.7575 216.9869 2006.7575

13. VENTAS VS COMISIN DE VENDEDORES


Estadsticas de la regresin Coeficiente de correlacin mltiple Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones 0.003317293 1.10044E-05 -0.333318661 114986.0448 5

14.
ANLISIS DE VARIANZA GL Regresin Residuos Total 1 3 4 Suma de cuadrados 436499.6307 39665371500 39665808000 Prom. de los cuadrados 436499.6307 13221790500 F 3.30137E-05 Valor crtico de F 0.9957763

15.
Coeficient es Error tpico Probabilid ad Inferior 95% Superior 95% Inferior 95.0% Superior 95.0%

Estadst. t

Intercepcin

404199.65 262605.15 1.5391916 0.2213843 431527.94 1239927.2 431527.94 1239927.2 21 63 05 4 14 46 14 46

COM. DE VENDEDOR 0.0784636 13.655945 0.0057457 43.537817 43.380889 43.537817 43.380889 ES 6 37 5 0.9957763 31 99 31 99

16. De acuerdo a los cuadros podemos decir: - La variable que mas relacin tiene con las Variable Dependiente es decir las ventas 17. es la variable Gastos de Publicidad ya que su R2 "Coeficiente de determinacin" es 18. 79%. - En cuanto a la variable Comisiones de vendedores podemos decir que no tiene 19. relacin relevante con las Ventas ya que su Coeficiente de determinacin es casi 20. nulo 0.001% . 21. Desarrollo de un Caso. Una agencia de Viajes desea saber la relacin que hay entre las ventas, el presupuesto destinado a publicidad, y las comisiones de los vendedores para esto presenta los siguientes datos. Realice los anlisis respectivos. 22. Bibliografa. a) LIND, Douglas y MARCHAL, William y MASON, Robert. Estadstica para administracin y economia. Alfaomega. Colombia 11avaedicin. 2004 Cap.13 y 14 b) CORDOVA, Jorge Herramientas Estadsticas para la Gestin en Salud. JC ediciones. Versin electrnica (formato CD) Mayo 2003. c) HILDEBRAND, David y OTT, Lyman. Estadstica Aplicada a la administracin y a la economia. Adidison wesley Iberoamericana sa. 1997. Cap. 13,14 y 15.

Ing. Sandra Ysolina Baca Garcia UNIVERSIDAD INCA GARCILASO DE LA VEGA ESCUELA DE POSTGRADO "MAESTRA EN CIENCIAS EN INGENIERA DE SISTEMAS Y COMPUTACIN" Lima, Noviembre del 2005 CURSO : Modelos Estadsticos