Está en la página 1de 9

Contenido:

Matriz de correlaciones.
Regresin lineal simple.
Regresin curvilineal.
Ejercicios


Unidad 7
Inferencia Estadstica
Anlisis de Regresin lineal simple
y Correlacin
Anlisis de Regresin lineal simple y correlacin
106
Introduccin
A continuacin se muestra la base de datos con la que se explicar los procedimientos
involucrados al realizar un anlisis de regresin lineal simple.
Los datos corresponden a las ventas totales por ao de cada una de 11 regiones en las
que una compaa opera. Dicha compaa se dedica a la venta de repuestos para
automviles. Se pretende estimar el valor de las ventas futuras conociendo el nmero de
distribuidoras establecidas en cada regin y el nmero de automviles registrados para
cada regin.




MATRIZ DE CORRELACIONES
El primer paso que daremos consiste en analizar la matriz de correlaciones. Analizando
dicha matriz se podr determinar cul de las variables independientes esta ms
correlacionada con la variable dependiente.
La secuencia de pasos es: Analizar, Correlaciones, Bivariadas:



Obtenemos el siguiente resultado:

Anlisis de Regresin lineal simple y correlacin
107


Correlaciones
1 .739** .548
.009 .081
11 11 11
.739** 1 .670*
.009 .024
11 11 11
.548 .670* 1
.081 .024
11 11 11
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Ventas (mills $)
Nro distribuidoras
Nro Autos (mills)
Ventas
(mills $)
Nro
distribuidoras
Nro Autos
(mills)
La correlacin es significativa al nivel 0,01 (bilateral).
**.
La correlacin es significante al nivel 0,05 (bilateral).
*.

Se observa que la variable ventas est ms correlacionada con la variable Nmero de
distribuidoras (correlacin 0.739) por lo que un primer paso ser realizar un anlisis de
regresin lineal simple con esta variable independiente.


REGRESION LINEAL SIMPLE ENTRE LA VARIABLE
INDEPENDIENTE MS CORRELACIONADA CON Y
La secuencia es:
Analizar, Regresin, Lineal, se mostrar el siguiente cuadro de dilogo:



Por el momento slo se proceder a obtener la ecuacin del modelo as como algunos
valores representativos para la validacin de dicho modelo.
Un anlisis ms riguroso del modelo y su validacin se har para el caso de regresin
lineal mltiple.


Anlisis de Regresin lineal simple y correlacin
108
Resultados obtenidos:
Resumen del modelo
.739
a
.546 .496 9.7718
Modelo
1
R R cuadrado
R cuadrado
corregida
Error tp. de la
estimacin
Variables predictoras: (Constante), Nro distribuidoras
a.

El coeficiente de determinacin, denotado por R
2
(0.546) implica que el 54.6% de
variacin en las ventas pueden ser explicadas por el modelo de regresin.

ANOVA
b
1033.836 1 1033.836 10.827 .009
a
859.393 9 95.488
1893.229 10
Regresin
Residual
Total
Modelo
1
Suma de
cuadrados gl
Media
cuadrtica F Sig.
Variables predictoras: (Constante), Nro distribuidoras
a.
Variable dependiente: Ventas (mills $)
b.

La tabla de Anlisis de Varianza permite realizar la prueba de significacin global del
modelo, se propone las siguientes hiptesis:

modelo el para iva significat es variable una menos l A H
modelo l a n contribuye no variables las conjunta forma En H
i
o
0 :
0 :
1
1


Analizando el P-Valor (0.009), el cual es inferior al 5% (nivel de significacin
propuesto usualmente para la prueba), se decide que se debe rechazar la hiptesis nula
con lo cual concluimos que la variable Nmero de distribuidoras s contribuye
significativamente al modelo.

Coeficientes
a
10.881 6.409 1.698 .124
.012 .004 .739 3.290 .009
(Constante)
Nro distribuidoras
Modelo
1
B Error tp.
Coeficientes no
estandarizados
Beta
Coeficientes
estandarizad
os
t Sig.
Variable dependiente: Ventas (mills $)
a.

El modelo estimado para el presente caso ser:

) ( 012 . 0 881 . 10

oras distribuid de Nro entas V + =


Adems de la prueba de verificacin global se puede realizar la prueba de verificacin
individual de la variable independiente.

modelo el para iva significat es variable La H
modelo el para iva significat es no variable La H
i
i o
0 :
0 :
1

=


Para el caso desarrollado (regresin lineal simple), esta prueba es anloga a la prueba de
verificacin global.

Anlisis de Regresin lineal simple y correlacin
109
Una forma grfica de verificar la relacin lineal entre Y con X es realizar un grfico de
dispersin, el cul muestra la posible tendencia y/o relacin posible entre variable
dependiente e independiente.
La secuencia para obtener dicho grfico es la siguiente:



En el cuadro de dilogo (Dispersin simple) se ingresar la informacin de la siguiente
manera:



El resultado que se obtiene es el siguiente:
125 480 650 1233 1694 1699 1840 2011 2214 2302 2850
Nro distribuidoras
3.5
16.0
20.2
25.2
26.0
30.0
33.1
35.0
38.2
46.2
52.3
V
e
n
t
a
s

(
m
i
l
l
s

$
)
A
A
A
A
A
A
A
A
A
A
A

Anlisis de Regresin lineal simple y correlacin
110

REGRESIN CURVILINEAL


Analizaremos los diferentes modelos curvilneos que puedan formarse para determinar
cul de ellos es el mejor. Los datos se muestran a continuacin:
La secuencia para realizar una regresin curvilnea es la siguiente:

Analizar, Regresin, Estimacin Curvilnea







Como se muestra, tenemos la posibilidad de elegir entre varios modelos. Para
desarrollar nuestro ejemplo hallaremos los coeficientes estimados y la tabla de anlisis
de varianza de los modelos: Lineal, Cuadrtico, Potencia y Exponencial.

Anlisis de Regresin lineal simple y correlacin
111
Los resultados que obtenemos son los siguientes:

LINEAL
Resumen del modelo

R R cuadrado
R cuadrado
corregida
Error tpico de la
estimacin
.966 .933 .920 9.017
La variable independiente esMillas.

ANOVA


Suma de
cuadrados gl
Media
cuadrtica F Sig.
Regresin
5675.152 1 5675.152 69.795 .000
Residual
406.557 5 81.311
Total
6081.709 6
La variable independiente esMillas.

Coeficientes

Coeficientes no
estandarizados
Coeficientes
estandarizados

B Error tpico Beta
t Sig.
Millas
-2.040 .244 -.966 -8.354 .000
(Constante)
91.660 5.080 18.042 .000


CUADRTICO
Resumen del modelo

R R cuadrado
R cuadrado
corregida
Error tpico de la
estimacin
.993 .986 .979 4.584
La variable independiente esMillas.

ANOVA


Suma de
cuadrados gl
Media
cuadrtica F Sig.
Regresin
5997.661 2 2998.830 142.721 .000
Residual
84.048 4 21.012
Total
6081.709 6
La variable independiente esMillas.
Coeficientes

Coeficientes no
estandarizados
Coeficientes
estandarizados

B Error tpico Beta
t Sig.
Millas
-3.924 .497 -1.858 -7.900 .001
Millas ** 2
.048 .012 .922 3.918 .017
(Constante)
99.897 3.330 29.998 .000


Anlisis de Regresin lineal simple y correlacin
112
POTENCIA




Coeficientes

Coeficientes no estandarizados
Coeficientes
estandarizados

B Error tpico Beta
t Sig.
ln(Millas) -,428 ,084 -,917 -5,125 ,004
(Constante) 126,278 25,995

4,858 ,005
La variable dependiente es ln(Porcentaje).


EXPONENCIAL
Resumen del modelo
R R cuadrado
R cuadrado
corregida
Error tpico de la
estimacin
.989 .979 .974 .104
La variable independiente esMillas.

ANOVA

Suma de
cuadrados gl
Media
cuadrtica F Sig.
Regresin
2.496 1 2.496 229.924 .000
Residual
.054 5 .011
Total
2.550 6
La variable independiente esMillas.

Coeficientes
Coeficientes no
estandarizados
Coeficientes
estandarizados

B Error tpico Beta
t Sig.
Millas
-.043 .003 -.989 -15.163 .000
(Constante)
99.496 5.840 17.036 .000
La variable dependiente es ln(Porcentaje).



Anlisis de Regresin lineal simple y correlacin
113




A la vista de los resultados, el modelo cbico presenta el mayor coeficiente de
determinacin pero la variable independiente que acompaa al trmino cbico no es
significativa para el modelo por lo que pasamos a elegir el modelo cuadrtico por tener
el segundo mejor R
2
y adems por que la variable que acompaa al trmino cuadrtico
es significativa.

También podría gustarte