Está en la página 1de 21

ANLISIS DE REGRESIN Y CORRELACIN LINEAL SIMPLE

Introduccin
El vicepresidente de una gran compaa opina que las ganancias anuales de la empresa dependen de la cantidad gastada en investigacin y desarrollo. El presidente de la compaa no est de acuerdo y ha solicitado pruebas.

Introduccin
Qu herramienta puede presentar el vicepresidente que sustenten su teora? Qu variables tendr que medir? Qu ecuacin ayudar a predecir las ganancias anuales en funcin de la cantidad presupuestada en I y D? Ser esta ecuacin lineal o no lineal? Qu precisin se puede esperar al usar esta herramienta de toma de decisiones?

A continuacin se presentan datos de 11 aos

Ao

Gasto en I y D (ciento de miles )

Ganancia anual (millones)

50 40 30 20 10

1999 2000
2001 2002 2003 2004 2005 2006

2 4
5 4 6 5 5 7

20 25
34 30 33 34 36 35

0 0 2 4 6 8 10

Una lnea recta podra ser lo ms adecuado para relacionar estas variables?

2007
2008 2009

8
7 8

40
37 41

Diagrama de dispersin
Grfica que presenta la relacin entre dos variables de inters
Scatterplot of Y1 vs X1, Y vs X
6.0 Y1*X1 350 150 140 325 130 120 300 110 275 100 90 250 24.0 25.5 27.0 28.5 80 7.5 9.0 Y*X 10.5 12.0

Anlisis de Regresin Lineal Simple


Qu es el anlisis de regresin lineal ? Es modelar la dependencia de la variable Y en funcin de la variable X a travs de la ecuacin de una recta

Yi 0 1 X i ei
Parmetros Variable dependiente Variable predictora (independiente)

i=1, 2, , n
Error ~ NID(0,2)

Para Y=Ganancia (millones de soles) X= Gasto en I y D (ciento de miles de soles) La ecuacin de regresin estimada, podra responder las siguientes preguntas:

Cul ser el valor de la ganancia, por cada cien mil soles que se gaste anualmente en I y D? Cul ser la ganancia anual promedio, dado un gasto en I y D de S/. 450000 ? Cul ser la ganancia del prximo mes, si el gasto en I y D es de S/. 500000?

Coeficiente de regresin estimado

Intervalo de confianza para Y/X=4.5 Intervalo de prediccin para el valor de Y dado X=5

SUPUESTOS DEL MODELO


1) Los errores se distribuyen normalmente. (Se usa Kolmogorov) 2) Los errores tienen media 0 y varianza (No realizamos esta prueba) 3) Los errores no se encuentran autocorrelacionados (Durbin Watson D-W).

0DW4
0 1 3 4

Autocorre lacin +

No hay Autocorrelacin

Autocorrelacin -

Verificacin de supuestos
Prueba de Kolmogorov-Smirnov para una muestra Unstandardi zed Residual N 11 Media ,0000000 Parmetros a,b normales Desviacin tpica 2,50282563 Absoluta ,143 Diferencias ms extremas Positiva ,143 Negativa -,112 Z de Kolmogorov-Smirnov ,474 Sig. asintt. (bilateral) ,978
a. La distribucin de contraste es la Normal. b. Se han calculado a partir de los datos.

>0.05. Los errores se distribuye normalmente

No existe autocorrelacin

Ecuacin estimada Y b0 b1 X

Coeficientesa Modelo

Coeficientes no estandarizados
1

Coeficientes tipificados
Beta t 6,241 Sig. ,000

(Constante)

B 16,270

Error tp. 2,607

GASTO

3,050

,448

,915

6,812

,000

a. Variable dependiente: GANACIA

Y 16 .270 3.050 X

Anlisis de varianza

ANOVAb Modelo
1

Suma de cuadrados 322,995 62,641 385,636

gl
1 9 10

Media cuadrtica 322,995 6,960

F
46,406

Sig.
,000a

Regresin Residual Total

a. Variables predictoras: (Constante), GASTO b. Variable dependiente: GANACIA

Fcal=46.408 > F(0.05;1,9)=5.1174 Al nivel de significacioa del 5%, podemos concluir que existe relacin lineal entre el gasto en inversin y desarrollo y la ganancia de la empresa.

Qu tan bueno es el modelo?


Coeficiente de determinacin
Porcentaje de la variabilidad de Y que es explicada por la ecuacin de regresin ajustada.

Coeficiente de no determinacin
Porcentaje de la variabilidad de Y que es no es explicada por el modelo

Prueba de hiptesis para la pendiente

Intervalos de confianza para valores predichos

Intervalo de 95% de confianza para Y/X=4.5


Y^o= Sxx= SCR= 29.995 34.7213115 322.995

t=
Media de X=

2.26215716
5.54545

LI= LS=

28.9551246 31.0348754

ANLISIS DE CORRELACIN
Qu es el anlisis de correlacin lineal ? Es una herramienta estadstica que podemos usar para describir el grado de relacin lineal entre las variables.

r Coef .de det er min acin


Tiene el mismo signo que b1

r 0.838 0.915

Existe un una fuerte correlacin lineal directa entre gasto y ganancia.

a)Asociacin lineal inversa

b) Asociacin lineal directa


c) No hay asociacin lineal d) No hay asociacin lineal

Interpretacin: 1. El valor absoluto de r indica la fuerza de la relacin entre Y y X. 2. El signo da la direccin de la relacin (directa o inversamente proporcional)
r=1 r = -1 r=0 correlacin positiva perfecta. correlacin negativa perfecta. no hay relacin lineal entre Y y X.

tcal

0.915 11 2 6.82 1 0.838

Se Rechaza Ho

Con un nivel de significancia del 5% se puede afirmar que el gasto en I y D est correlacionado con la ganancia.

También podría gustarte