Está en la página 1de 13

Modelo de Regresin y Correlacin Lineal.

Ejemplo. Considere la siguiente informacin:


PRODUCCION DE JUGUETES
AOS
VOLUMEN DE
(x)
PRODUCCION, MILES (y)
2003
56
2004

58

2005

55

2006

60

2007

64

2008

65

2009

68

2010

65

2011

78

2012

95

2013

97

Se pide determinar: (a) la ecuacin de tendencia, (b) el coeficiente de correlacin, (c) corregir
los datos histricos en base a la ecuacin de regresin estimada, (d) Cul seria el volumen de
produccin de juguetes para los aos 2014 y 2018? y (e) representar la tendencia histrica, la
tendencia corregida y la tendencia proyectada del volumen de produccin de juguetes.
Solucin:
Datos obtenidos del cuadro:

x 0 y 761

110 y 2

xy 436 y

54,813

(a) Ecuacin de tendencia lineal.


y = a + bx

Ecuacin general

Calculando las constantes a y b

Y
n

761
69.18
11

XY
X
2

436
3.964
110

Reemplazando a y b en la ecuacin general, obtenemos la ecuacin de regresin de


tendencia lineal estimada: y = 69.18 + 3.964(x)
(b)

Coeficiente de correlacin lineal

(c)

n xy x y

[n x ( x ) 2 ][n y 2 ( y ) 2 ]
2

0.89

Correccin de los datos histricos en base a la ecuacin de regresin estimada: Ejemplo:


y = 69.18 + 3.964(x) = 49; etc.

(d)

(e)

AOS
2003

X
-5

TENDENCIA
HISTORICA
56

TENDENCIA
CORREGIDA
49

2004

-4

58

53

2005

-3

55

57

2006

-2

60

61

2007

-1

64

65

2008

65

69

2009

68

73

2010

65

77

2011

78

81

2012

95

85

2013

97

89

Cul seria el volumen de produccin para los aos 2014 -2018?


AOS
2014

X
6

VOLUMEN DE PRODUCCION
PROYECTADO
92

2015

96

2016

100

2017

104

2018

10

108

Representar la tendencia histrica (2003 2013), la tendencia corregida (2003 2013) y


la tendencia proyectada (2014 2018) del volumen de produccin de juguetes.

Modelo de Regresin y Correlacin Parablica.


Una funcin cuadrtica o de segundo grado se puede representar de manera
genrica como:

y = a + bx + cx2

Donde los parmetros desconocidos son: a, b, c.

La grafica es:
Para determinar estos parmetros se requiere de tres
ecuaciones

normales

por

el

mtodo

de

mnimos

cuadrados:

= na

xy

=a

+ b

+ c

+ b

+ c

+ c

xy =a x
2

+b

Pero, existe otro mtodo abreviado, ms simple, que se resume en dos ecuaciones normales:

xy

= b

ty

= b

xt

+c

+ c

xt

(1)

(2)

Donde:

xy

xy

xt

x3

x y
n

x x

( x ) 2

x2

x2

ty

x2 y

x y
2

( x 2 ) 2
n

Determinados los valores se reemplazan en las ecuaciones normales (1) y (2) y se determina
b y c.
La constante a se resuelve as: a

y b x c x
n

Seguiremos para ello un razonamiento similar al que hicimos en el caso del modelo de
regresin lineal simple, utilizando el procedimiento de ajuste de los mnimos cuadrados, es
decir, haciendo que la suma de los cuadrados de las desviaciones con respecto a la curva de
regresin sea mnima:
D ( y y' ) 2

( y a bx cx

)2

Cuando se trata de SERIES DE TIEMPO, se simplifican las 3 ecuaciones normales haciendo


que

x = 0. Resolviendo obtenemos las constantes a, b y c


y c x

xy
x

n x 2 y x 2 y

n x 4 ( x 2 ) 2

Estndar de Estimacin de la Parbola: S yx

Coeficiente de correlacin parablica: r

a y b xy x x 2 y

n2

a y b xy c x 2 y n y

ny

Ejemplo. Se tiene la siguiente serie cronolgica que refleja la produccin de artculos para el
hogar (tres primeras columnas):
AOS

(x)

(x)

DEMANDA

DESARROLLO

(y)

x2

x3

x4

xy

x2 y

y2

3.5

49

-343

2,401

-24.5

171.5

12.25

2006

-7

2007

-5

7.0

25

-125

625

-35.0

175.0

49.00

2008

-3

11.2

-27

81

-33.6

100.8

125.44

2009

-1

13.3

-1

-13.3

13.3

176.89

2010

26.4

26.4

26.4

696.96

2011

27.4

27

81

82.2

246.6

750.76

2012

28.5

25

125

625

142.5

712.5

812.25

2013

7
0
x

44.9
162.2
y

49
168
x2

343
0
x3

2,401
6,216
x4

314.3
459.0
xy

2,200.1
3,646.2
x2y

2,016.01
4,639.56
y2

Se pide: (a) Construir el diagrama de dispersin., (b) determinar la curva de regresin


parablica, (c) calcular el error estndar de regresin, (d) calcular el coeficiente de correlacin y
(e) graficar la curva de regresin.
Solucin:
(a)

Diagrama de dispersin:

(b)

Curva de regresin parablica


Observando el grfico, a simple vista se aprecia que la lnea de ajuste sea una curva.
Ello indica que deber trabajarse con un polinomio aproximadamente de segundo grado,
de la forma:
y = a + bx + cx
Las ecuaciones normales son:
y = na + bx + cx2

162.2 = 8a + 0b + 168c

xy = ax + bx2 + cx3
2

x y = ax + bx + cx

459 = 0a +168b + 0c

3,646.2 = 168a + 0b + 6,216c

Simplificando y sustituyendo el valor de las sumatorias obtenidas


y = na + cx2

162.2 = 8a + 168c

xy = bx2
2

459 = 168b

x y = ax + cx

3,646.2 = 168a + 6,216c

Despejando y calculando b:

459
2.7321428
168

Calculando c:
162.2 =

8a +

Calculando a:
168c (-21)

162.2 = 8 + 168 (0.089)

3,646.2 = 168a + 6,216c

8a = 162.2 14.95

_____________________

a = 18.41

-3,646.2 = -168a -3,528c


3,646.2 = 168a + 6,216c
_____________________
240 = 2,688c c = 0.089
Luego la ecuacin de la tendencia parablica es:
y' = 18.41 + 2.73(x) + 0.089(x)

(c)

Error estndar de regresin

S yx
(d)

a y b xy c x 2 y
n2

75.8762
12.646 3.56
6

Coeficiente de correlacin parablica (r).

r
2

(e)

a y b xy c( x 2 y ) n( y ) 2

n( y )

0.9715 r (0.9715) 2 0.9438

Graficar la Curva de regresin: y' = 18.41 + 2.73(x) + 0.089(x)


Determinando algunos "puntos aislados" asignando valores a x:
x = -7

y = 3.7

x = -3

y = 11.0

x= 1

y = 21.2

x= 5

y = 34.3

Puntos que se llevan al diagrama del tems a).

Modelo de Regresin y Correlacin Potencial.


La curva de regresin potencial se construye a partir de la funcin potencial
cuya ecuacin es:
(1) y = axb

y = axb(1)
Que tiene dos parmetros desconocidos: a y b.
Para determinar los parmetros a y b del modelo potencial se debe efectuar las
transformaciones matemticas adecuadas a la expresin analtica del modelo de tal forma de
variarlo en una lnea recta. Para tal efecto se le obtiene logaritmo a la expresin potencial; asi:

(2) Log. y = Log. a + b Log. x


Por lo que ahora, Log. a y b son los parmetros desconocidos.
Si y = Log y
x = Log x la ecuacin queda: y = Log. a + b (x)
Ecuaciones normales.

(log.y) = Log.a(n)
(Log.x

Log.y) = Log.a (

+b(

Log.x)

Log.x)

+b(

Log.x)

Resolviendo las ecuaciones simultneamente obtenemos las constantes a y Log b

Log .a

Log. y b Log .x
n

y b x
n

y( x ) x( xy )
n( x ) ( x )
n Log .xLog . y Log .x Log . y
b
n Log .x ( Log .x )
2

Log .a

n .x. y .x y
n x 2 ( x) 2

Coeficiente de correlacin potencial.

b Log .xLog . y Log .a Log . y n( Log . y )

( Log . y )

n( Log . y ) 2

n xy x y

[n x ( x) 2 ][ n y 2 ( y ) 2 ]
2

Grafica de la ecuacin
y
Una de las formas para graficar la ecuacin
es determinar algunos puntos aislados
asignando valores a x, de donde se
deduce el valor de y, similar que para la
ecuacin parablica.
x
Ejemplo. Con los siguientes datos histricos (observar tres primeras columnas) proyectar la
demanda mediante regresin potencial.

DATOS

DESARROLLO
X

Log. (x)

Log.(y)

0
0.30103
0.47712
0.60206
0.69897
0.77815
2.85733

4.30103
4.54407
4.65321
4.60206
4.74036
4.74036
27.58110

AO
x
1
2
3
4
5
6

1
2
3
4
5
6

20,000
35,000
45,000
40,000
55,000
55,000
SUMA

( x. y )
(x ) 2
( y) 2
2
2 Log . xLog . y
( Log .x ) ( Log . y )
0
0.09062
0.22764
0.36248
0.48856
0.60552
1.77482

18.49886
20.64855
21.65239
21.17896
22.47104
22.47104
126.92083

0
1.36790
2.22015
2.77072
3.31337
3.68872
13.36085

( Log . y 4.59685)
Solucin:
(a)

Calculamos los valores de a y b:


Ecuaciones: y = axb

y = Log. a + b (x)

Utilizando las formulas de regresin lineal (mnimos cuadrados) encontramos los valores
de Log. a y b:

y ( x ) x( xy ) 10.77513 4.33679
2.484586
n( ( x ) ( ( x )
2

Log .a

Anti log .a 21,716.51

(b)

n xy x y
n x ( x)
2

6(13.36085) 2.85733( 27.58110 )


0.54608
6(1.77482) (2.85733) 2

Por ejemplo, podemos cuantificar la demanda del ao 7.


Reemplazando los valores de a y b en la ecuacin general obtenemos:

y ax b 21,716.51(7) 0.54608 62,846


y = Log. a + b (x) = 4.33679 + 0.54608 (Log.7) = 4.798281138
Para cuantificar la demanda del ao 7, se encuentra el antilogaritmo de 4.798281138,
cuyo resultado final es:
y = Antilog (4.79828) = 62,846
Por ambas formas determinamos la demanda del ao 7, que es: 62,846
(c)

A continuacin se calcula el coeficiente de correlacin (r) y el coeficiente de


determinacin (r2).

n x

n xy x y

( x ) 2 n y 2 ( y ) 2

Luego: r 2 (0.96) 2 0.9216

0.957 0.96

Como se puede observar ambos coeficientes se aproximan a la unidad, lo que implica


que la ecuacin de regresin potencial empleada es la que mejor se ajusta a las
variables.
(d)

Graficar la Curva de regresin: y' = 4.33679 + 0.54608 (Log.n))


Determinando algunos "puntos aislados" asignando valores a x:
x = 1 y = 4.33

x = 3 y = 4.72

x = 2 y = 4.50

x = 4 y = 4.76

Puntos que permiten la construccin del diagrama de dispersin correspondiente.

Con la informacin del ejemplo que acabamos de terminar, proyectar la demanda del ao 7
mediante regresin potencial; en este caso utilizar logaritmos neperianos).
DATOS

DESARROLLO
x

AO

1
2
3
4
5
6

1
2
3
4
5
6

y
20,000
35,000
45,000
40,000
55,000
55,000
SUMA

Ln( x )

Ln( y )

0
0.69315
1.09861
1.38629
1.60944
1.79176
6.57925

9.90349
10.46310
10.71442
10.59663
10.91509
10.91509
63.50782

x2

.y 2

Ln ( x 2 )

Ln( y 2 )

0
0.48045
1.20695
1.92181
2.59029
3.21040
9.40991

98.0790657
109.476532
114.798748
112.288668
119.139156
119.139156
672.921325

Encontrando los valores de a y b:


b = 0.54608 (calculo anterior)

y b x 63.50782 0.54608(6.57925) 9.9858373


n

Reemplazando los valores de a y b en la ecuacin general:


y = Log. a + b(x) y= 9.9858373 + 0.54608 (Log. x).

xy
Ln ( x ) Ln ( y )
0
7.25247
11.77099
14.69005
17.56716
19.55721
70.83789

y= 4.33679 + 0.54608 (Log. 7) = 4.798281138.


Finalmente, para cuantificar la demanda del ao 7, se encuentra el antilogaritmo de
4.798281138, cuyo resultado es:
y = Antilog. 4.798281138 = 62,846 unidades.

Modelo de Regresin y Correlacin Exponencial.


La curva de regresin exponencial se determina a partir de la funcin exponencial de la forma:

(1) y = abx
Que tiene dos parmetros desconocidos: a y b
La regresin exponencial puede tambin ser linealizada aplicando logaritmos a ambos
miembros, resultado de ello la relacin siguiente:
(2) Log.y = Log.a + x Log.b (puede ser + / -).
Siendo ahora los parmetros desconocidos Log. a y Log. b
La grafica es:

Las 2 ecuaciones normales son:

(log.y) = Log.a (n) + Log.b( x)


x (Log.y) = Log.a ( x) + Log.b (
x)
2

Despejando

simultneamente,

se

obtiene

las

constantes a y b

Log .b

n xLog. y x Log . y

Log .a

Log. y Log.b x

n x 2 ( x ) 2

Obviamente la solucin final ser: a = antilog a y b = antilog b.

Cuando se trata de SERIES DE TIEMPO se hace que

x = 0 y se obtiene:

Log .a

Log. y

Log .b

xLog. y
x
2

Coeficiente de correlacin exponencial:

Log .b xLog. y Log .a Log . y n( Log . y ) 2

( Log. y )

n( Log . y ) 2

Grfica: similar procedimiento que para parbola y/o potencial


Ejemplo. La demanda de equipos mecnicos en un pas, respecto a los gastos de publicidad,
es de acuerdo a lo mostrado en el cuadro siguiente:
DEMANDA DE EQUIPOS MECANICOS Y PUBLICIDAD
PUBLICIDAD
CIENTOS DE $
(x)

DEMANDA EQUIPOS MECANICOS: MILES


UNIDADES
(y)

1.2

50

2.0

60

3.0

68

3.8

88

5.0

125

5.5

135

6.5

184

Utilizando el modelo de curva exponencial, se pide:


(a) Graficar el diagrama de dispersin
(b) Determinar la ecuacin de regresin exponencial
(c) Ajustar los valores a la tendencia
(d) Proyectar la demanda de equipos mecnicos cuando los gastos en publicidad son: 7, 8, 9
y 11 (cientos de $).
Solucin:
(a)

Diagrama de dispersin

(b)

Ecuacin de regresin exponencial


(1) y = abx

(2) Log. y = Log.a + x Log.b

(Cuadro de clculos):

Log. y

xLog. y

( Log . y ) 2

x2

1.2

50

1.69897

2.038764

1.44

2.886499

2.0

60

1.77815

3.556300

4.00

3.161822

3.0

68

1.83251

5.497530

9.00

3.358089

3.8

88

1.94448

7.389024

14.44

3.781013

5.0

125

2.09691

10.484550

25.00

4.397032

5.5

135

2.13033

11.716815

30.25

4.538322

6.5

184

2.26482

14.721330

42.25

5.129399

x y Log. y
27.0

710

xLog. y

13.74617

x2

55.404313

126.38

( Log . y ) 2
27.252176

( Log . y ) 13.74617 7 1.96374

El calculo de los parmetros Log.y y Log.a se puede realizar mediante las ecuaciones
normales:

(log.y) = Log.a (n) + Log.b( x)


x (Log.y) = Log.a ( x) + Log.b ( x )
2

Reemplazando valores de las sumatorias obtenidas:


(1)
(2)

13.74617 = Log.a (7) + Log.b (27)


55.404313 = Log.a (27) + Log.b (126.38)

Resolviendo este sistema se obtiene: a= 34.63

b= 1.2799

De igual forma, utilizando formulas:

Log .b

n xLog . y x Log . y

Log .a

Log. y Log.b x 13.74617 0.11( 27 ) 1.53945

n x 2 ( x ) 2

Antilogaritmo a = 34.63

0.10718 Anti log .1.27799

Luego, las ecuaciones de regresin son:


(1) y = 34.63 (1.2799)X
(c)

(d)

(2) Log. y = 1.53945 + 0.10718 (x)

Ajustar los valores de la demanda de equipos mecnicos a la tendencia

1.53945 + 0.10718 (x)

y'

Antig. y

50
60
68
88
125
135
184

1.53945 + 0.10718 (1.2)


1.53945 + 0.10718 (2.0)
1.53945 + 0.10718 (3.0)
1.53945 + 0.10718 (3.8)
1.53945 + 0.10718 (5.0)
1.53945 + 0.10718 (5.5)
1.53945 + 0.10718 (6.5)

1.67
1.75
1.86
1.95
2.08
2.13
2.24

46.77
56.23
72.44
89.12
120.23
134.90
173.78

Proyeccin de la demanda de los equipos mecnicos

7
8
9
10

1.53945 + 0.10718 (x)

y'

Antig. y

1.53945 + 0.10718 (7.0)


1.53945 + 0.10718 (8.0)
1.53945 + 0.10718 (9.0)
1.53945 + 0.10718 (11.0)

2.28
2.40
2.50
2.72

190.55
251.19
316.23
524.81

Esto significa que, aproximadamente, si se diera una publicidad de 7(cientos de $) la


demanda de equipos mecnicos seria de 190, 550 unidades.
(e) Coeficiente de correlacin exponencial

Log .b( xLog . y ) Log .a Log . y n( Log . y ) 2

( Log. y )

n( Log . y ) 2

0.10718(55.404313) 1.53945(13.74617) 7(1.96374) 2


0.6402
27.252176 7(1.96374) 2