Está en la página 1de 6

Estadística y Análisis de Datos

ANÁLISIS DE REGRESIÓN NO LINEAL

REGRESIÓN PARABÓLICA SIMPLE


La regresión parabólica simple es aplicada cuando aquellos fenómenos que se observan en un
diagrama de dispersión, presentan una concentración de puntos inicialmente ascendentes y en
seguida descendentes (o viceversa). Esta regresión es utilizada, en gran parte, por los economistas en
el análisis de funciones de utilidad, ingresos, etc.
La ecuación general de la parabólica es:
𝑦 = 𝑎 + 𝑏𝑥 + 𝑐𝑥 2
El método de mínimos cuadrados propone cuantificar el error total mediante la suma de los cuadrados
de los errores particulares, es decir,
𝑛 𝑛 𝑛
2
𝐷= ∑ 𝑒𝑖2 = ∑(𝑦𝑖 − 𝑦̂𝑖 )2 = ∑(𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 − 𝑐𝑥𝑖2 )
𝑖=1 𝑖=1 𝑖=1

Igualando a cero las tres derivadas parciales:


𝜕𝐷
=0
𝜕𝑎
𝜕𝐷
=0
𝜕𝑏
𝜕𝐷
=0
𝜕𝑐
Se obtendrán las ecuaciones normales que manipuladas convenientemente acaban siendo:
𝑛 𝑛 𝑛

𝑛𝑎 + 𝑏 ∑ 𝑥𝑖 + 𝑐 ∑ 𝑥𝑖2 = ∑ 𝑦𝑖
𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛 𝑛 𝑛

𝑎 ∑ 𝑥𝑖 + 𝑏 ∑ 𝑥𝑖2 + 𝑐 ∑ 𝑥𝑖3 = ∑ 𝑥𝑖 𝑦𝑖
𝑖=1 𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛 𝑛 𝑛

𝑎 ∑ 𝑥𝑖2 + 𝑏 ∑ 𝑥𝑖 3 + 𝑐 ∑ 𝑥𝑖4 = ∑ 𝑥𝑖2 𝑦𝑖


{ 𝑖=1 𝑖=1 𝑖=1 𝑖=1

Sistema de ecuaciones del que se pueden despejar los valores de los coeficientes de regresión
parabólica.
Ejemplo
Se realiza una prueba de frenado de un automóvil nuevo, midiendo la distancia de parada de acuerdo a
la rapidez del vehículo al momento de aplicar los frenos, obteniéndose los siguientes resultados:

Rapidez (km/h) Distancia (metros)


35 16
50 26
65 41
80 62
95 88
110 119

1
Estadística y Análisis de Datos

Diagrama de dispersión

140

120

100
Distancia (m)
80

60

40

20

0
0 20 40 60 80 100 120
Rapidez (km/h)

𝑥𝑖 𝑦𝑖 𝑥𝑖2 𝑥𝑖3 𝑥𝑖4 𝑥𝑖 𝑦𝑖 𝑥𝑖2 𝑦𝑖

35 16 1225 42875 1500625 560 19600

50 26 2500 125000 6250000 1300 65000

65 41 4225 274625 17850625 2665 173225

80 62 6400 512000 40960000 4960 396800

95 88 9025 857375 81450625 8360 794200

110 119 12100 1331000 146410000 13090 1439900

Total 435 352 35475 3142875 294421875 30935 2888725

Reemplazando se obtiene el siguiente sistema de ecuaciones lineales:


6𝑎 + 435𝑏 + 35475 𝑐 = 352
{ 435𝑎 + 35475𝑏 + 3142875 𝑐 = 30935
35475𝑎 + 3142875𝑏 + 294421875 𝑐 = 2888725
De donde:
4208
𝑎= = 13,3587
315
611
𝑏=− = −0,3394
1800
149
𝑐= = 0,0118
12600
Ecuación final:
𝑦̂ = 13,3587 − 0,3394𝑥 + 0,0118𝑥 2

2
Estadística y Análisis de Datos

Coeficiente de determinación:

2
𝑆𝐸2 0,020238095
𝑅 =1− 2 =1− = 0,999984253
𝑆𝑌 1285,22222
Una expresión de la varianza residual que simplifique el cálculo es:
∑𝑛𝑖=1 𝑦𝑖2 − 𝑎 ∙ ∑𝑛𝑖=1 𝑦𝑖 − 𝑏 ∙ ∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑐 ∙ ∑𝑛𝑖=1 𝑥𝑖2 𝑦𝑖
𝑆𝐸2 =
𝑛
Entonces:
28362 − 13,35873016 ∙ 352 − (−0,339444444) ∙ 30935 − 0,011825396 ∙ 2888725
𝑆𝐸2 = = 0,020238095
6

REGRESIÓN EXPONENCIAL
Si el comportamiento de los valores de las variables puede ser explicado por medio de una función de
tipo exponencial.
𝑦 = 𝑎𝑒 𝑏𝑥
Si se aplica logaritmo natural, la función se linealiza y de esa manera se pueden obtener los valores de
a y b.
ln y = ln(𝑎𝑒 𝑏𝑥 )
ln y = ln 𝑎 + 𝑏x
Haciendo y´= ln y, A = ln a, se obtiene y´ = A + b x, con lo que se reduce a un ajuste lineal entre las
variables Y´ y X, y por medio de mínimos cuadrados podemos encontrar los valores de A y b.
𝑆𝑥𝑦´
𝑏=
𝑆𝑥2
̅ − 𝑏 ∙ 𝑥̅
𝐴 = 𝑦´
Lógicamente se puede aplicar un ajuste exponencial si la variable y sólo toma valores positivos.
Ejemplo
Ajuste los datos siguientes con el modelo exponencial y aplique una transformación logarítmica para
hallar los coeficientes de dicho modelo.
X 6 3 0 3 6 9 12 15 20 25
Y 2 2,8 3,9 4,2 5,8 6,2 7,5 8,2 9,3 10,9

Diagrama de dispersión

14
12
10
8
Y

6
4
2
0
-10 -5 0 5 10 15 20 25 30
X

3
Estadística y Análisis de Datos

𝒙𝒊 𝒚𝒊 𝒚′𝒊 = 𝒍𝒏 𝒚𝒊 𝑥𝑖2 𝒙𝒊 𝒚´𝒊


-6 2 0,69314718 36 -4,15888308
-3 2,8 1,02961942 9 -3,08885825
0 3,9 1,36097655 0 0
3 4,2 1,43508453 9 4,30525358
6 5,8 1,75785792 36 10,5471475
9 6,2 1,82454929 81 16,4209436
12 7,5 2,01490302 144 24,1788362
15 8,2 2,10413415 225 31,5620123
20 9,3 2,2300144 400 44,600288
25 10,9 2,38876279 625 59,7190697
Total 81 60,8 16,8390492 1565 184,08581

Por lo tanto:

𝑥̅ = 8,1
̅ = 1,68390492
𝑦´
184,08581
𝑆𝑥𝑦´ = − 8,1 ∙ 1,68390492 = 4,76895107
10
𝑠𝑥2 = 90,89
𝑆𝑥𝑦´
𝑏= = 0,05246948
𝑆𝑥2
̅ − 𝑏 ∙ 𝑥̅ = 1,25890213
𝐴 = 𝑦´

Entonces

A = ln a  a = 𝑒 𝐴 = 3,52155317

Ecuación final:

𝑦̂ = 3,52155317 ∙ 𝑒 0,05246948∙𝑥

Coeficiente de determinación:
𝑆𝐸2 0,01801033
𝑅2 = 1 − 2 = 1 − 0,268234715 = 0,93285608
𝑆𝑌´
Una expresión de la varianza residual que simplifique el cálculo es:
∑𝑛𝑖=1 𝑦´2𝑖 − ln 𝑎 ∙ ∑𝑛𝑖=1 𝑦´𝑖 − 𝑏 ∙ ∑𝑛𝑖=1 𝑥𝑖 𝑦´𝑖
𝑆𝐸2 =
𝑛
Entonces:
31,03770512 − ln 3,52155317 ∙ 16,83904925 − 0,05246948 ∙ 184,0858097
𝑆𝐸2 = = 0,01801033
10

4
Estadística y Análisis de Datos

O también, se puede obtener el coeficiente de correlación teniendo en cuenta que existe un ajuste
lineal entre las variables Y´ y X.
𝑆𝑥𝑦´ 4,76895107
𝑟= = = 0,965844749
𝑠𝑥 ∙ 𝑠𝑦´ 9,533624704 ∙ 0,51791381

De donde 𝑅 2 = 𝑟 2 = 0,93285608

REGRESIÓN POTENCIAL
Si el comportamiento de los valores de las variables viene explicado por una función de tipo Potencial
𝑦 = 𝑎𝑥 𝑏
Tomamos logaritmos neperianos:
ln 𝑦 = ln 𝑎 + 𝑏 ∙ ln 𝑥
Haciendo 𝑦´ = ln 𝑦, 𝐴 = ln 𝑎, 𝑥´ = ln 𝑥 queda
𝑦´ = 𝐴 + 𝑏𝑥´
con lo que se reduce a un ajuste lineal entre las variables Y´ y X´, y por medio de mínimos cuadrados
podemos encontrar los valores de A y b.
𝑆𝑥´𝑦´
𝑏= ̅ − 𝑏 ∙ 𝑥´
𝐴 = 𝑦´ ̅
2
𝑆𝑥´
Este ajuste se puede aplicar sólo si las variables 𝑥 e 𝑦 toman valores positivos.

Ejemplo
Ajuste los datos siguientes con el modelo de potencias y aplique una transformación logarítmica para
estimar los parámetros de dicho modelo.
X 2,5 3,5 5 6 7,5 10 12.5 15 17.5 20
Y 13 11 8.5 8.2 7 6.2 5.2 4.8 4.6 4.3

Diagrama de dispersión

14

12

10

8
Y

0
0 5 10 15 20 25
X

5
Estadística y Análisis de Datos

𝒙𝒊 𝒚𝒊 𝒙′𝒊 = 𝒍𝒏 𝒙𝒊 𝒚′𝒊 = 𝒍𝒏 𝒚𝒊 𝒙′𝒊 ∙ 𝒚′𝒊


2.5 13 0.91629073 2.564949357 2.35023932
3.5 11 1.25276297 2.397895273 3.0039944
5 8.5 1.60943791 2.140066163 3.44430362
6 8.2 1.79175947 2.104134154 3.7701023
7.5 7 2.01490302 1.945910149 3.92082024
10 6.2 2.30258509 1.824549292 4.20118
12.5 5.2 2.52572864 1.648658626 4.16406432
15 4.8 2.7080502 1.568615918 4.24789065
17.5 4.6 2.86220088 1.526056303 4.3678797
20 4.3 2.99573227 1.458615023 4.3696201
Total 20,9794512 19,17945026 37,84009464

Por lo tanto:
̅ = 2,09794512
𝑥´ ̅ = 1,917945026
𝑦´
184,08581
𝑆𝑥´𝑦´ = − 8,1 ∙ 1,68390492 = −0,239733942
10
2
𝑠𝑥´ = 0,443713801
𝑆𝑥´𝑦´
𝑏= = −0,540289579 ̅ − 𝑏 ∙ 𝑥´
𝐴 = 𝑦´ ̅ = 3,051442911
2
𝑆𝑥´

Entonces: A = ln a  a = 𝑒 𝐴 = 21,14583399

Ecuación final:

𝑦̂ = 21,14583399 ∙ 𝑥 −0,540289579

Coeficiente de determinación:
𝑆𝐸2 0,000632515037
𝑅2 = 1 − 2 = 1 − 0,130158266 = 0,995140415
𝑆𝑌´
Una expresión de la varianza residual que simplifique el cálculo es:
∑𝑛𝑖=1 𝑦´2𝑖 − ln 𝑎 ∙ ∑𝑛𝑖=1 𝑦´𝑖 − 𝑏 ∙ ∑𝑛𝑖=1 𝑥´𝑖 𝑦´𝑖
𝑆𝐸2 =
𝑛
Entonces:
38,08671388 − ln 21,14583399 ∙ 19,17945026 − (−0,540289579) ∙ 37,84009464
𝑆𝐸2 = = 0,000632515037
10
O también, se puede obtener el coeficiente de correlación teniendo en cuenta que existe un ajuste
lineal entre las variables Y´ y X´.
𝑆𝑥´𝑦´ −0,239733942
𝑟= = = −0,997567248
𝑠𝑥´ ∙ 𝑠𝑦´ 0,666118458 ∙ 0,360774536
De donde 𝑅 2 = 𝑟 2 = 0,995140415

También podría gustarte