Está en la página 1de 33

Facultad de Ciencias Económicas

Escuela de Contabilidad

 Tema:
ANÁLISIS DE REGRESIÓN Y
CORRELACIÓN NO LINEAL:
MODELO EXPONENCIAL Y
POTENCIAL

 Curso:
Estadística Aplicada.

 Docente:
Walter Castañeda Guzmán

 Ciclo:
V.

 Estudiante:

Domínguez Alemán, Angie.


García Lupú, Carmen.
León Godínez, Joselyn.
López Cortez, Renzo.
Neyra Jiménez, Leodan.
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

Índice
1. Introducción……………………………………………………………………………… 3
2. Capítulo 1: Análisis de Regresión y Correlación No Lineal………………………… 4
2. 1. Regresión No Lineal………………………………………………………………. 4
2. 2. Correlación……………………………………………………………………….… 4
3. Capítulo 2: Modelos de Análisis de Regresión y Correlación No Lineal………….. 5
3. 1. Modelo de Análisis de Regresión Simple Geométrica o Exponencial……... 5
3. 1. 1. Definición……………………………………………………………….. 5
3. 1. 2. Ecuación características……………………………………………… 5
3. 1. 3. Tabla de datos…………………………………………….…………… 6
3. 1. 4. Estimadores del Modelo Exponencial………………………………. 6
3. 1. 5. Análisis de varianza para la Regresión No Lineal…………………. 6
3. 1. 5. 1. ANVA para el Modelo Exponencial……………………… 6
3. 1. 5. 2. ANVA para los coeficientes “a” y “b”…………………….. 7
3. 1. 6. Intervalos de confianza……………………………………………….. 9
3. 1. 6. 1. Intervalos de confianza para el coeficiente “a”…………. 9
3. 1. 6. 2. Intervalos de confianza para el coeficiente “b”…………. 9
3. 1. 7. Caso práctico………………………………………………………...… 9
3. 2. Modelo de Análisis de Regresión Logarítmica o Potencial………………… 14
3. 2. 1. Definición……………………………………………………………… 14
3. 2. 2. Ecuación características…………………………………………….. 14
3. 2. 3. Tabla de datos………………………………………………………... 15
3. 2. 4. Estimadores del Modelo Potencial…………………………………. 15
3. 2. 5. Análisis de varianza para la Regresión No Lineal………………... 15
3. 2. 5. 1. ANVA para el Modelo Potencial………………………… 15
3. 2. 5. 2. ANVA para los coeficientes “a” y “b”…………………… 16
3. 2. 6. Intervalos de confianza…………………………………………….... 18
3. 2. 6. 1. Intervalos de confianza para el coeficiente “a”………...18
3. 2. 6. 2. Intervalos de confianza para el coeficiente “b”…......… 18
3. 2. 7. Caso práctico……………………………………………………….... 19
4. Ejercicios propuestos…………………………………………………………………. 23
5. Conclusiones…………………………………………………………………………... 31
6. Recomendaciones…………………………………………………………………….. 32
7. Referencias bibliográficas y linkografías……………………………………………. 33

2
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

1. Introducción

Habitualmente el tratamiento de la regresión se limita al caso lineal. En


muchos casos esto puede ser suficiente, pero en otros no. En la cual será
necesario probar la linealidad de la curva de regresión, dicha prueba se
puede obtener por el método de análisis de la varianza e interpretarse por
medio de la prueba de hipótesis.

A continuación, desarrollaremos el grado de relación entre dos variables, una


la cual es dependiente de otra variable, en lo que llamaremos análisis de
correlación no lineal, Para representar esta relación utilizaremos una
representación gráfica llamada diagrama de dispersión, estudiaremos un
modelo matemático para estimar el valor de una variable basándonos en el
valor de otra, en lo que llamaremos análisis de regresión no lineal, también
se realizara un análisis de varianza.

En el presente trabajo se describe la aplicación de modelos no lineales en


problemas muy comunes. Asimismo, se describe el intervalo de confianza
para la ecuación de la regresión y el coeficiente de correlación y el de
determinación en el modelo no lineal, aplicando las fórmulas
correspondientes. En el caso de los modelos no lineales se prueba el grado
de ajuste realizado a través de las pruebas específicas, las cuales en este
caso aplicaremos el modelo exponencial y el modelo potencial.

La correcta elección de un modelo adecuado, que describa los datos en


problemas de a tratar, proporciona elementos de juicio suficientes para la
toma de decisiones en condiciones de incertidumbre.

Y, finalmente desarrollaremos un ejercicio aplicando lo aprendido por medio


de logaritmos neperianos y también explicaremos el análisis de regresión y
correlación de los modelos antes mencionados, con logaritmos decimales;
es decir, con logaritmos con base 10.

3
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

2. Capítulo 1: Análisis de Regresión y Correlación No Lineal


En muchos casos, si la recta de regresión no ajusta correctamente al
conjunto de datos, se puede lograr hacer un ajuste de otras curvas
conocidas. En algunos casos el procedimiento consiste en aplicar, a los
datos, transformaciones previas que permitan la linealización de la relación
entre variables, para luego aplicar el método de los mínimos cuadrados.
Entre los modelos más comunes de regresión no lineal entre las variables X
e Y tenemos los siguientes:
 El polinomio de segundo grado.
 El modelo exponencial.
 El modelo potencial
2. 1. Regresión No Lineal
La regresión no lineal genera una ecuación para describir la relación no
lineal entre una variable de respuesta continua y una o más variables
predictoras y predice nuevas observaciones. Utilice la regresión no
lineal en lugar de la regresión de mínimos cuadrados ordinarios cuando
no pueda modelar adecuadamente la relación con parámetros lineales.
Los parámetros son lineales cuando cada término del modelo es aditivo
y contiene solo un parámetro que multiplica el término.

2. 2. Correlación
La correlación estadística constituye una técnica estadística que nos
indica si dos variables están relacionadas o no.
Por ejemplo, considera que las variables son el ingreso familiar y el
gasto familiar. Se sabe que los aumentos de ingresos y gastos
disminuyen juntos. Por lo tanto, están relacionados en el sentido de que
el cambio en cualquier variable estará acompañado por un cambio en
la otra variable. De la misma manera, los precios y la demanda de un
producto son variables relacionadas; cuando los precios aumentan la
demanda tenderá a disminuir y viceversa. Si el cambio en una variable
está acompañado de un cambio en la otra, entonces se dice que las
variables están correlacionadas. Por lo tanto, podemos decir que el
ingreso familiar y gastos familiares y el precio y la demanda están
correlacionados.

4
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

3. Capítulo 2: Modelos de Análisis de Regresión y Correlación No Lineal


3. 1. Modelo de Análisis de Regresión Simple Geométrica o
Exponencial
3. 1. 1. Definición
Este modelo de regresión es una alternativa cuando el modelo
lineal no logra un coeficiente de determinación apropiado, o
cuando el fenómeno en estudio tiene un comportamiento que
puede considerarse exponencial. La forma más simple de tratar
de establecer la tendencia es a través de un diagrama de
dispersión o nube de puntos, tal como la siguiente:

Este modelo también es conocido como exponencial.


3. 1. 2. Ecuación características

La función que define el modelo es la siguiente:


𝒀𝑰 = 𝑨 × 𝑩𝑿𝒊 × 𝑬
En la cual:
Yi: Variable dependiente
A, B: Parámetros de la ecuación, que generalmente son
desconocidos
E: Error asociado al modelo
Xi: Valor de la observación de la variable independiente

Al sustituir los parámetros por estimadores, el modelo adopta


la siguiente forma:
𝒀𝒊 = 𝒂 × 𝒃𝒙

5
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

La ecuación se transforma aplicando logaritmos de ambos


lados, con lo cual se convierte a una forma lineal:
𝑳𝒏 𝒀𝒊 = 𝒍𝒏 𝒂 + 𝒙𝒊 × 𝒍𝒏 𝒃
3. 1. 3. Tabla de datos

Para el ajuste de un conjunto de datos al modelo geométrico


de regresión, se construye la siguiente tabla de datos:
X Y Ln Y X2 (ln Y)2 X*ln Y

.. .. .. .. .. ..

ΣX ΣY Σln Y ΣX2 Σ(ln Y)2 ΣX*ln Y

Debido a las propiedades de los logaritmos, ningún valor de y


puede ser negativo. En tal caso, lo que se hace es definir un
valor de y muy pequeño (Ej.: 0.00000001)
Se puede trabajar con logaritmos naturales o logaritmos base
10.
3. 1. 4. Estimadores del Modelo Exponencial

Los estimadores para el ajuste del modelo se calculan de la


siguiente manera:
∑ 𝑥 × ∑ ln 𝑦
∑ 𝑥 × ln 𝑌 −
𝐿𝑛 𝑏 = 𝑛
(∑ 𝑥) 2
∑ 𝑥2 −
𝑛
∑ ln 𝑦 − ln 𝑏 × ∑ 𝑥
Ln 𝑎 =
𝑛
Será necesario utilizar antilogaritmos para obtener los valores
finales de “a” y “b”.
3. 1. 5. Análisis de varianza para la Regresión No Lineal
3. 1. 5. 1. ANVA para el Modelo Exponencial

Con el objeto de determinar si el modelo explica o


no el fenómeno en estudio, se realiza el análisis de
varianza, que se calcula de la siguiente manera:
Fórmulas:
(∑ 𝑥)(∑ 𝑙𝑛 𝑌)
𝑆𝐶𝑅 = 𝐿𝑛 𝑏 × (∑ 𝑥 𝑙𝑛 𝑌 − )
𝑛

6
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

(∑𝐿𝑛 𝑌)2
𝑆𝐶𝑇 = ∑(𝐿𝑛 𝑌)2 −
n

Fuente Grados Suma de Cuadrado F calculada F


de de cuadrados medio tabulada
Variación libertad
Regresión 1 SCR S.C.R/1 C.M.R/C.M.E
Error n-2 S.C.T.- S.C.E/(n-
S.C.R. 2)
Total n-1 SCT n-1

LAS HIPÓTESIS DE PRUEBA PARA EL ANVA SON:


Ho: El modelo no explica el fenómeno en estudio
Ha: El modelo sí explica el fenómeno en estudio
o Para buscar en la tabla la F tabulada, se usan el
numerador los grados de libertad de regresión y en el
denominador, de acuerdo con el nivel de significancia
escogido (los más usuales son al 5% y al 1%).
o Si el valor de F calculada es mayor que el de F tabulada,
se rechaza Ho, en caso contrario se acepta

Grado de ajuste del modelo


Para determinar el grado de ajuste del modelo, se calcula el
coeficiente de determinación, de la siguiente manera:
∑ 𝑋 × ∑ ln 𝑌
ln 𝑏 × (∑ 𝑋 𝑙𝑛 𝑌 − )
𝑛
𝑟2 =
(∑𝑙𝑛 𝑌)2
∑(ln 𝑌)2 −
𝑛
3. 1. 5. 2. ANVA para los coeficientes “a” y “b”

Para el coeficiente “a”


Se puede probar la hipótesis de que el coeficiente a
es igual a un valor a´, para lo cual se sigue el siguiente
procedimiento:
1) Se define la hipótesis:
Ho: a=a´
Ha: a≠a´.
2) Se calcula el error standard para a con la
siguiente fórmula:

7
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟 × ∑ 𝑥 2


𝑆𝑎 =
√ (∑ 𝑥)2
𝑛 × (∑ 𝑥 2− 𝑛 )

El cuadrado medio del error se obtiene del


análisis de varianza.
3) Se calcula el estadístico de prueba:

ln 𝑎 − 𝑙𝑛 𝑎̂
𝑡=
𝑆𝑎

4) Se obtiene en la tabla de t de student el


estadístico comparador, con los siguientes
datos: n-2 grados de libertad y nivel α/2
5) Si el valor de t calculado es mayor que el
tabulado, se rechaza la Ho, en caso contrario,
la hipótesis se acepta.

Para el coeficiente “b”

Para probar la hipótesis de que el logaritmo del


coeficiente b es igual a un valor b´, se procede así:
I. Se plantea la hipótesis:
Ho: Ln b=Ln b´
Ha: Ln b≠ Ln b´
II. Se calcula el estadístico:
ln 𝑏 − ln 𝑏̂
𝑡=
𝑆𝑏
Sb es conocido como el error standard de b y
se calcula de la siguiente manera:

√𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟


𝑆𝑏 =
(∑ 𝑥)2
√∑ 𝑥 2 −
𝑛
El cuadrado medio del error se obtiene del
análisis de varianza.
III. Se busca en la tabla de t de student el valor
tabulado para los siguientes datos:
n-2 grados de libertad y un nivel α/2

IV. Si el valor de t calculado es mayor que el


tabulado, se rechaza la Ho, en caso contrario,
se acepta.

8
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

3. 1. 6. Intervalos de confianza
3. 1. 6. 1. Intervalos de confianza para el coeficiente “a”

El intervalo de confianza para el coeficiente a se


calcula así:

𝑡 × √𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟 × ∑ 𝑥 2


𝐿𝑛 𝑎 ±
(∑ 𝑥)2
√𝑛 × (∑ 𝑥 2 −
𝑛 )
El cuadrado medio del error se obtiene del análisis de
varianza
El valor de t se obtiene de la tabla de t de student con:
n-2 grados de libertad y un nivel α/2
3. 1. 6. 2. Intervalos de confianza para el coeficiente “b”

El intervalo de confianza para el coeficiente b se


calcula así:

√𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟


𝐼𝐶 = 𝐿𝑛 𝑏 ± 𝑡 ×
2
√∑ 𝑥 2 − (∑ 𝑥)
𝑛
El cuadrado medio del error se obtiene del análisis de
varianza
El valor de t se obtiene de la tabla de t de student con:
n-2 grados de libertad y un nivel α/2
3. 1. 7. Caso práctico

Se desea estudiar el aumento de población de una comunidad


a través de los años para lo cual se obtuvieron los siguientes
datos:

AÑO (X) HABITANTES (Y)


1900 375
1920 735
1940 1220
1960 1845
1980 2333
2000 3800

9
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

Se pide:
a. Construya un diagrama de dispersión.
b. Efectúe la estimación del modelo geométrico.
c. Determine el grado de ajuste e interprételo.
d. Elabore el análisis de varianza y discútalo.
e. Qué población habrá en el año 2010.
f. Pruebe la hipótesis que b=1 con un 99% de confianza.
g. Calcule intervalo de confianza al 95% para a y b

a. Diagrama de dispersión:

b. Estimación del modelo geométrico:


 Tabla de datos:
x Y ln Y X2 (ln Y)2 X*ln Y

1900 375 5.9269 3,610,000 35.1285 11,261.1594

1920 735 6.5999 3,686,400 43.5583 12,671.7514

1940 1220 7.1066 3,763,600 50.5039 13,786.8159

1960 1845 7.5202 3,841,600 56.5539 14,739.6597

1980 2333 7.7549 3,920,400 60.1386 15,354.7223

2000 3800 8.2428 4,000,000 67.9430 16,485.5127

Σ=11700 Σ=43.1513 Σ=22,822,000 Σ=313.8262 Σ=84,299.6215

 Estimadores:
∑ 𝑋 × ∑ ln 𝑌
∑ 𝑋 × ln 𝑌 −
𝐿𝑛 𝑏 = 𝑛
(∑ 𝑋) 2
∑ 𝑋2 −
𝑛
(11,700)(43.1513)
84,299.6215 −
ln 𝑏 = 6
(11,700)2
22,822 − 6
ln 𝑏 = 0.022083

10
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

𝑏 = 𝑒 0.022083
𝑏 = 1.02232

∑ ln 𝑦 − ln 𝑏 × ∑ 𝑥
Ln 𝑎 =
𝑛

43.1513 − 0.022083 × 11,700


ln 𝑎 =
6
ln 𝑎 = −35.8699

𝑎 = 2.6416𝑥10−16
𝑎 = 0.00000000000000026416

 Ecuación Final: Yi = 1.02232 × (2.6416 × 10−16 ) 𝑋𝑖

c. Grado de ajuste:
El coeficiente de determinación se calcula así:
∑ 𝑥 × ∑ ln 𝑦
ln 𝑏 × (∑ 𝑥 𝑙𝑛 𝑦 − )
𝑛
𝑟2 =
(∑ ln 𝑦)2
∑(ln 𝑦)2 −
𝑛

(11,700)(43.1513)
0.022083 (84,299.6215 − )
6
𝑟2 =
(43.1513)2
313.8262 − 6
= 0.9787

Se puede concluir que el grado de ajuste del modelo es


alto, por lo que el modelo es confiable para hacer
predicciones.

d. Análisis de varianza:
1. Suma de cuadrados de la regresión:
(∑ 𝑥)(∑ 𝑙𝑛 𝑦)
𝑆𝐶𝑅 = 𝐿𝑛 𝑏 × (∑ 𝑥 𝑙𝑛 𝑦 − )
𝑛
(11,700)(43.1513)
𝑆𝐶𝑅 = 0.022083 (84,299.6215 − )
6
= 3.4137
2. Suma de cuadrados totales:
(∑𝐿𝑛 𝑌)2
𝑆𝐶𝑇 = ∑(𝐿𝑛 𝑌)2 −
n

11
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

(43.1513)2
𝑆𝐶𝑇 = 313.8262 − = 3.4870
6
3. Suma de cuadrados del error:
𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑅 = 3.4870 − 3.4137 = 0.0733
4. Grados de libertad:
𝐺𝐿𝑅 = 1
𝐺𝐿𝑇 = 𝑛 − 1 = 6 − 1 = 5
𝐺𝐿𝐸 = 𝑛 − 2 = 6 − 2 = 4
5. Cuadrados medios de la regresión:
𝑆𝐶𝑅 3.4137
𝐶𝑀𝑅 = = = 3.4137
1 1
6. Cuadrados medios del error:
𝑆𝐶𝐸 0.0733
𝐶𝑀𝐸 = = = 0.01832
𝑛−2 4
7. “F” calculada:
𝐶𝑀𝑅 3.4137
= = 186.33
𝐶𝑀𝐸 0.01832

8. “F” tabulada: 𝐹𝑡 = (1; 4; 1%) = 21.197


9. Tabla ANVA:
Fuente de Grados Suma de Cuadrado F F
Variación de cuadrados medio calculada tabulada
libertad
Regresión 1 3.4137 3.4137 186.33 21.19*
Error 4 0.0733 0.01832
Total 5 3.4870

Debido a que F calculada es mayor que F tabulada, se


rechaza la Ho y se acepta la Ha, con lo cual se
concluye que el modelo sí explica el fenómeno en
estudio y que los resultados obtenidos no se deben a
la casualidad.

e. Población para el año 2010:


Para esto, simplemente se utiliza la ecuación
anteriormente encontrada por estimación, sustituyendo el
valor de x por 2010

𝑌𝑖 = 1.02232 × (2.6416 × 10−16 )2010 = 4998.26

En algunas calculadoras e incluso computadoras, este


cálculo puede no ser posible de realizar, en cuyo caso se
puede aplicar la operación equivalente por medio de los
logaritmos de los estimadores:

12
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

𝐿𝑛 𝑌 = −35.8694 + 0.02208 × 2010 = 8.51684

Finalmente: 𝑌 = 𝑒 8.51684 = 4998.26

f. Prueba de hipótesis con 𝑏 = 1 y 𝛼 = 0.01:


Inicialmente se plantea las alternativas:
Ho: b = 1
Ha: b ≠ 1
A continuación, se obtiene el error standard de b:
0.01832
𝑆𝑏 = √
(11700)2
22,822000 6
𝑆𝑏 = 0.0016

El valor de t de student de calcula de la siguiente manera:


(el logaritmo de 1 es cero)
0.022083 − 0
𝑡= = 13.716
0.00161

El valor de t se obtiene en la tabla de t de student, con 6-2


= 4 grados de libertad y (1-.99)/2 = 0.005 de α, siendo el
valor igual a 4.604

Finalmente, dado que t calculada es mayor que la


tabulada, se concluye al 99% que el coeficiente b no es
igual a 1.

g. Intervalo de confianza para “a” y “b” con 𝛼 = 0.05:


El valor de t de student al 95% con 4 grados de libertad
es= 2.776
 Intervalo de confianza para el logaritmo de b:

0.01832
0.022083 ± 2.776 × √
(11700)2
22822000 − 6
= 0.022083 ± 0.00449

El intervalo final será entonces el siguiente:


0.017593 ≤ 𝐿𝑛 𝑏 ≤ 0.026573

13
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

 Intervalo de confianza para a:

0.01832 × 11700
−35.8699 ± 2.776 × √
(11700)2
6 × (22822000 − )
6
= −35.8699 ± 0.1983

El intervalo final para el logaritmo de a sería:


−36.0682 ≤ 𝐿𝑛 𝑎 ≤ −35.6716

3. 2. Modelo de Análisis de Regresión Logarítmica o Potencial

3. 2. 1. Definición
Este modelo de regresión es una alternativa cuando el modelo
lineal no logra un coeficiente de determinación apropiado, o
cuando el fenómeno en estudio tiene un comportamiento que
puede considerarse potencial o logarítmico. La forma más
simple de tratar de establecer la tendencia es a través de un
diagrama de dispersión o nube de puntos, tal como la siguiente:

Este modelo también es conocido como potencial, Cobb-


Douglas de primer grado o exponencial inverso.
3. 2. 2. Ecuación características

La función que define el modelo es la siguiente:


𝑌𝑖 = 𝐴 ∗ 𝑋𝑖𝐵
En la cual:
𝑌𝑖 : 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒, 𝑖 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛
𝐴, 𝐵 ∶ 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑒𝑐𝑢𝑎𝑐𝑖ó𝑛, 𝑞𝑢𝑒 𝑠𝑜𝑛 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑜𝑠
𝑋𝑖 : 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑖 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒
La ecuación se transforma aplicando logaritmos de ambos
lados, con lo cual se convierte a una forma lineal:
ln 𝑦𝑖 = ln 𝑎 + 𝑏 ∗ ln 𝑥𝑖

14
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

3. 2. 3. Tabla de datos

Para el ajuste de un conjunto de datos al modelo geométrico


de regresión, se construye la siguiente tabla de datos:

𝒙 𝒚 𝐥𝐧 𝒙 𝐥𝐧 𝒚 (𝒍𝒏 𝒙)𝟐 (𝒍𝒏 𝒚)𝟐 𝒍𝒏 𝒙 ∗ 𝒍𝒏 𝒚

.. .. .. .. .. ..

∑ 𝐥𝐧 𝒙 ∑ 𝐥𝐧 𝒚 ∑(𝐥𝐧 𝒙)𝟐 ∑(𝐥𝐧 𝒚)𝟐 ∑ 𝒍𝒏 𝒙 ∗ 𝒍𝒏 𝒚


Debido a las propiedades de los logaritmos, ningún valor de “x”
ni de “y” puede ser negativo. En tal caso, lo que se hace es
definir un valor de x o de y muy pequeño (Ejemplo: 0.00000001)
Se puede trabajar con logaritmos naturales o logaritmos base
10.
3. 2. 4. Estimadores del Modelo Potencial

Los estimadores para el ajuste del modelo se calculan de la


siguiente manera:
∑ ln 𝑥 ∗ ∑ ln 𝑦
∑ ln 𝑥 ∗ ln 𝑦 −
𝑏= 𝑛 ln 𝑎
2
(∑ ln 𝑥)
∑(ln 𝑥)2 −
𝑛
∑ ln 𝑦 − 𝑏 ∗ ∑ ln 𝑥
=
𝑛
Será necesario utilizar antilogaritmos para obtener el valor final
de “a”.
3. 2. 5. Análisis de varianza para la Regresión No Lineal
3. 2. 5. 1. ANVA para el Modelo Potencial

Con el objeto de determinar si el modelo explica o no


el fenómeno en estudio, se realiza el análisis de
varianza, que se calcula de la siguiente manera:
LAS HIPOTESIS DE PRUEBA EN EL ANVA ES:
Ho: El modelo no explica el fenómeno en estudio
Ha: El modelo sí explica el fenómeno en estudio
Fórmulas:
∑ ln 𝑥 ∗ ∑ ln 𝑦
𝑆𝐶𝑅 = 𝑏 ∗ (∑ ln 𝑥 ∗ ln 𝑦 − )
𝑛

15
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

(∑ ln 𝑦)2
𝑆𝐶𝑇 = ∑(ln 𝑦)2 −
𝑛
𝑆𝐶𝑅
𝐶𝑀𝑅 =
1
𝑆𝐶𝐸
𝐶𝑀𝐸 =
𝑛−2
𝐶𝑀𝑅
𝐹𝑐𝑎𝑙 =
𝐶𝑀𝐸

Fuente de Grados Suma de Cuadrado Fcal. Ft


Variación de cuadrados medio
libertad
Regresión 1 𝑆𝐶𝑅 𝐶𝑀𝑅 𝐹𝑐𝑎𝑙
Error 𝑛−2 𝑆𝐶𝑇 − 𝑆𝐶𝑅 𝐶𝑀𝐸
Total 𝒏−𝟏 𝑺𝑪𝑻 𝒏−𝟏

 Para buscar en la tabla la F tabulada, se usan


en el numerador los grados de libertad de regresión
y en el denominador los grados de libertad del error,
de acuerdo con el nivel de significancia escogido (los
más usuales son al 5% y al 1%)

 Si el valor de F calculada es mayor que el de F


tabulada, se rechaza Ho, en caso contrario se
acepta.

Grado de ajuste del modelo

Para determinar el grado de ajuste del modelo, se


calcula el coeficiente de correlación, de la siguiente
manera:

∑ ln 𝑥 ∗ ∑ ln 𝑦
𝑏 ∗ (∑ ln 𝑥 ∗ ln 𝑦 −
𝑟2 = 𝑛
2
(∑ ln 𝑦)
∑(ln 𝑦)2 −
𝑛

El valor de r2 tiene un rango entre 0 y 1. No puede


obtenerse valores negativos.
3. 2. 5. 2. ANVA para los coeficientes “a” y “b”
Para el coeficiente a:
Se puede probar la hipótesis de que el coeficiente a
es igual a un valor a´, para lo cual se sigue el siguiente
procedimiento:
a) Se define la hipótesis:

16
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

H0= a=a´
Ha= a≠a´
b) Se calcula el error standard para a con la
siguiente fórmula:
𝐶𝑀 𝐸𝑟𝑟𝑜𝑟 ∗ ∑(ln 𝑥)2
𝑆𝑎 = √ 2
(∑ ln 𝑥)
𝑛 ∗ (∑(ln 𝑥)2 − 𝑛

El cuadrado medio del error se obtiene del


análisis de varianza

c) Se calcula el estadístico de prueba:

ln 𝑎 − ln 𝑎´
𝑡=
𝑆𝑎

d) Se obtiene en la tabla de t de student el


estadístico comparador, con los siguientes datos:
𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑: 𝑛 − 2

𝑛𝑖𝑣𝑒𝑙: 2

Dato:
𝑠𝑖 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 > 𝑡𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑎 , 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0
𝑠𝑖 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 < 𝑡𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑎 , 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻0
Para el coeficiente b:
Para probar la hipótesis de que el coeficiente b es
igual a un valor b´, se procede de la siguiente
manera:
a) Se plantea la hipótesis:
H0= b=b´
Ha= b≠b´

b) Sb es conocido como el error standard de b y se


calcula de la siguiente manera:

𝐶𝑀 𝐸𝑟𝑟𝑜𝑟
𝑆𝑏 = √
∑(ln 𝑥)2
∑(ln 𝑥)2 −
𝑛

El cuadrado medio del error se obtiene del


análisis de varianza.
c) Se calcula el estadístico:

17
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

𝑏 − 𝑏´
𝑡=
𝑠𝑏

d) Se busca en la tabla de t de student el valor


tabulado para los siguientes datos:
𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑: 𝑛 − 2

𝑛𝑖𝑣𝑒𝑙: 2

Dato:
𝑠𝑖 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 > 𝑡𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑎 , 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0
𝑠𝑖 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 < 𝑡𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑎 , 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻0
3. 2. 6. Intervalos de confianza
3. 2. 6. 1. Intervalos de confianza para el coeficiente “a”

El intervalo de confianza para el coeficiente a se


calcula así:

𝐶𝑀 𝐸𝑟𝑟𝑜𝑟 ∗ ∑(ln 𝑥)2


𝐼𝐶 = ln 𝑎 +
−𝑡 ∗ √
(∑ ln 𝑥)2
𝑛 ∗ (∑(ln 𝑥)2 − )
𝑛

- El cuadrado medio del error se obtiene del análisis


de varianza
- El valor de t se obtiene de la tabla de t de student:
𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑: 𝑛 − 2

𝑛𝑖𝑣𝑒𝑙: 2

3. 2. 6. 2. Intervalos de confianza para el coeficiente “b”

El intervalo de confianza para el coeficiente b se


calcula así:

𝐶𝑀 𝐸𝑟𝑟𝑜𝑟
𝐼𝐶 = 𝑏 +
−𝑡 ∗ √ (∑ ln 𝑥)
2
∑(ln 𝑥)2 −
𝑛

- El cuadrado medio del error se obtiene del


análisis de varianza.
- El valor de t se obtiene de la tabla de t de
student:

𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑: 𝑛 − 2 𝑛𝑖𝑣𝑒𝑙: 2

18
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

3. 2. 7. Caso práctico

Se realizó un estudio comparativo del nivel de ruido (en


decibeles) producido por discotecas rodantes, se procedió a
evaluar diferentes niveles de potencia (en vatios). Los datos
finales fueron:
POTENCIA DECIBELES
100 60
500 80
1000 90
5000 99
10000 120

En base a los datos anteriores:


a) Construya un diagrama de dispersión
b) Efectúe la estimación del modelo logarítmico
c) Determine el grado de ajuste e interprételo
d) Elabore el análisis de varianza
e) ¿Qué lectura se obtendría con una potencia de 3000 vatios?
f) Pruebe la hipótesis de que b=1 con un 99% de confianza
g) Calcule intervalos de confianza al 95% para a y b.

a) Diagrama de Dispersión

El diagrama de dispersión muestra una tendencia logarítmica,


pues aunque hay incrementos fuertes de potencia, los niveles
de ruido no crecen excesivamente.

b) Estimadores del modelo:


 Tabla de Datos:

19
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

𝒙 𝒚 𝐥𝐧 𝒙 𝐥𝐧 𝒚 (𝒍𝒏 𝒙)𝟐 (𝒍𝒏 𝒚)𝟐 𝒍𝒏 𝒙


∗ 𝒍𝒏 𝒚
100 60 4,6052 4,0943 21,2076 16,7637 18,8552
500 80 6,2146 4,3820 38,6214 19,2022 27,2326
1000 90 6,9078 4,4998 47,7171 20,2483 31,0836
5000 99 8,5172 4,5951 72,5426 21,1151 39,1375
1000 120 9,2103 4,7875 84,8304 22,9201 44,0944
0
35,455 22,358 264,919 100,249 160,403
1 8 0 3 3
 Estimadores del modelo:
∑ ln 𝑥 ∗ ∑ ln 𝑦
∑ ln 𝑥 ∗ ln 𝑦 −
𝑏= 𝑛
2
2 (∑ ln 𝑥)
∑(ln 𝑥) −
𝑛
35,4551 ∗ 22,3588
160,4033 −
𝑏= 5
(35,4551)2
264,9190 −
5
𝑏 = 0.13746
∑ ln 𝑦 − 𝑏 ∗ ∑ ln 𝑥
ln 𝑎 =
𝑛
22,3588 − (0,13746 ∗ 35,4551)
ln 𝑎 =
5
ln 𝑎 = 3,4970
𝑎 = е3,4970 = 33,01625
Ecuación final:

𝑦𝑖 = 𝑎 ∗ 𝑥𝑖𝑏
𝑦 = 33,01625 ∗ 𝑥 0,13746
c) Grado de ajuste del modelo:
El coeficiente de determinación se calcula así:

∑ ln 𝑥 ∗ ∑ ln 𝑦
𝑏 ∗ (∑ ln 𝑥 ∗ ln 𝑦 −
𝑟2 = 𝑛
2
(∑ ln 𝑦)
∑(ln 𝑦)2 −
𝑛
35,4551 ∗ 22,3588
0,13746 ∗ (160,4033 − )
2
𝑟 = 5 = 0.9590
(22,3588)2
100,2493 −
5

20
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

Se puede concluir que el grado de ajuste del modelo es alto,


por lo que el modelo es confiable para hacer predicciones.
d) Análisis de varianza del modelo
Fuente Grados Suma de Cuadrado Fcal. Ft(0.01)
de de cuadrados medio
Variación libertad
Regresión 1 0.2552 0.2552 70.8889 34.12
Error 3 0.0109 0.0036
Total 𝟒 𝟎. 𝟐𝟔𝟔𝟏

(35.4551 ∗ 22.3588
𝑆𝐶𝑅 = 0.13746 ∗ (160.4033 − ) = 0.2552
5
(22.3588)2
𝑆𝐶𝑇 = 100.2493 − = 0.2661
5
𝑆𝐶𝐸 = 0.2661 − 0.2552 = 0.0109
Debido a que F calculada es mayor que F tabulada, se rechaza
la Ho y se acepta la Ha, con lo cual se concluye que el modelo
sí explica el fenómeno en estudio y que los resultados
obtenidos no se deben a la casualidad.
e) ¿Qué lectura en decibeles se obtiene al aplicar una potencia
de 3,000 vatios?
Para esto, simplemente se utiliza la ecuación anteriormente
encontrada por estimación, sustituyendo el valor de x por 3,000
𝑦 = 33,01625 ∗ 30000,13746 = 99.241
h) Pruebe la hipótesis de que b=1 con un 99% de confianza
H0= b=1
Ha= b≠1
A continuación, se obtiene el error standard de b:

𝐶𝑀 𝐸𝑟𝑟𝑜𝑟
𝑆𝑏 = √
(∑ ln 𝑥)2
∑(ln 𝑥)2 −
𝑛

0.0036
𝑆𝑏 = √ = 0.0163
(35.4551)2
264.9190 −
5

El valor de t de student de calcula de la siguiente manera: (el


logaritmo de 1 es cero)

21
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

𝑏 − 𝑏´
𝑡=
𝑠𝑏
1 − 0.13746
𝑡= = 52.9166
0.0163
El valor de t se obtiene en la tabla de t de student
𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑: 5 − 2 = 3
(1−0.99)
𝑛𝑖𝑣𝑒𝑙: = 0.005
2

Obteniendo el valor de: 5.841


Dato:
𝑠𝑖 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 > 𝑡𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑎 , 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0
𝑠𝑖 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 < 𝑡𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑎 , 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻0
Finalmente, dado que t calculada es mayor que la tabulada, se
concluye al 99% que el coeficiente b no es igual a 1.
g) Calcule intervalos de confianza al 95% para a y b
El valor de t de student al 95% con 3 grados de libertad es=
3.182
Intervalo de confianza para b:

𝐶𝑀 𝐸𝑟𝑟𝑜𝑟
𝐼𝐶 = 𝑏 +
−𝑡 ∗ √ (∑ ln 𝑥)
2
∑(ln 𝑥)2 −
𝑛

0.0036
𝐼𝐶 = 0.13746 +
−3.182 ∗ √
35.45512
264.9190 −
5

𝐼𝐶 = 0.13746 +
−0.05195

El intervalo final será entonces el siguiente:


0.13746 − 0.05195 ≤ 𝑏 ≤ 0.13746 + 0.05195
0.08551 ≤ 𝑏 ≤ 0.18941
Intervalo de confianza para a:

𝐶𝑀 𝐸𝑟𝑟𝑜𝑟 ∗ ∑(ln 𝑥)2


𝐼𝐶 = ln 𝑎 +
−𝑡 ∗ √
(∑ ln 𝑥)2
𝑛 ∗ (∑(ln 𝑥)2 − )
𝑛

22
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

0.0036 ∗ 264.9190
𝐼𝐶 = 3.4970 +
−3.182 ∗ √
35.45512
5 ∗ (264.9190 − )
5

𝐼𝐶 = 3.4970 +
−0.37814

El intervalo final para el logaritmo de a sería:


3.4970 − 0.3781 ≤ 𝐿𝑛 𝑎 ≤ 3.4970 + 0.3781
3.1189 ≤ 𝐿𝑛 𝑎 ≤ 3.8751

4. Ejercicios propuestos
1) Tenemos:
km minutos
(𝑿) (𝒀)
200 120
1000 160
2000 180
10000 198
20000 240

En base a los datos anteriores y aplicando el método potencial:


a) Construya un diagrama de dispersión
b) Efectúe la estimación del modelo logarítmico
c) Determine el grado de ajuste e interprételo
d) Elabore el análisis de varianza (Ftab(0.01))
Desarrollo

a) Diagrama de dispersión:

300

250

200

150

100

50

0
0 5000 10000 15000 20000 25000

23
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

b) Estimación del modelo logarítmico

Tabla de datos:

200 120 5,2983 4,7875 28,0720 22,9202 25,3656


1000 160 6,9078 5,0752 47,7177 25,7577 35,0585
2000 180 7,6009 5,193 57,7737 26,9672 39,4715
10000 198 9,2103 5,2883 84,8296 27,9661 48,7068
20000 240 9,9035 5,4806 98,0793 30,0370 54,2771
Σ 38,9208 25,8246 316,4723 133,6482 202,8795

Estimadores del modelo:

∑ ln 𝑥 ∗ ∑ ln 𝑦
∑ ln 𝑥 ∗ ln 𝑦 −
𝑏= 𝑛
2
(∑ ln 𝑥)
∑(ln 𝑥)2 −
𝑛
38.9208 ∗ 25.8246
202.8795 −
𝑏= 5
(38.9208)2
316.4723 −
5
𝑏 = 0.1375
∑ ln 𝑦 − 𝑏 ∗ ∑ ln 𝑥
ln 𝑎 =
𝑛
25.8246 − 0.1375 ∗ 38.9208
ln 𝑎 =
5
ln 𝑎 = 4.0946
𝑎 = е4.0946 = 60.0153
Ecuación final:
𝑦𝑖 = 𝑎 ∗ 𝑥𝑖𝑏
𝑦 = 60.0153 ∗ 𝑥 0.1375
c) Grado de ajuste del modelo:
El coeficiente de determinación se calcula así:
∑ ln 𝑥 ∗ ∑ ln 𝑦
𝑏 ∗ (∑ ln 𝑥 ∗ ln 𝑦 −
𝑟2 = 𝑛
2
(∑ ln 𝑦)
∑(ln 𝑦)2 −
𝑛

24
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

38.9208 ∗ 25.8246
0,1375 ∗ (202.8795 − )
2
𝑟 = 5 = 0.9590
(25.8246)2
133.6482 −
5
Se puede concluir que el grado de ajuste del modelo es alto, por lo
que el modelo es confiable para hacer predicciones.

d) Análisis de varianza del modelo

Fuente de G. De Suma de Cuadrado Fcal. Ft(0.01)


libertad cuadrados medio
Variación
Regresión 1 0.2553 0.2553 70.9167 34.12
Error 3 0.0109 0.0036
Total 4 0.2662

(38.9208∗25.8246
𝑆𝐶 𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 = 0.1375 ∗ (202.8795 − ) = 0.2553
5

(25.8246)2
𝑆𝐶 𝑇𝑜𝑡𝑎𝑙𝑒𝑠 = 133.6482 − = 0.2662
5

𝑆𝐶 𝐸𝑟𝑟𝑜𝑟 = 0.2662 − 0.2553 = 0.0109


Debido a que F calculada es mayor que F tabulada, se rechaza la Ho
y se acepta la Ha, con lo cual se concluye que el modelo sí explica el
fenómeno en estudio y que los resultados obtenidos no se deben a la
casualidad.
2) Se tienen los siguientes valores para las variables:
X Y
15 6
55 8
105 9
505 10

En base a los datos anteriores y aplicando el método potencial:


a) Construya un diagrama de dispersión
b) Efectúe la estimación del modelo logarítmico
c) ¿Qué lectura se obtendría con una potencia de 600 (x)?

25
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

Desarrollo:
a) Construya un diagrama de dispersión

12

10

0
0 100 200 300 400 500 600

b) Efectúe la estimación del modelo logarítmico

Tabla de Datos:

15 6 2,7081 1,7918 7,3338 3,2105 4,8524


55 8 4,0073 2,0794 16,0585 4,3239 8,3328
105 9 4,654 2,1972 21,6597 4,8277 10,2258
505 10 6,2246 2,3026 38,7456 5,3020 14,3328
Σ 17,594 8,371 83,7976 17,6641 37,7437
Estimadores del modelo
∑ ln 𝑥 ∗ ∑ ln 𝑦
∑ ln 𝑥 ∗ ln 𝑦 −
𝑏= 𝑛
2
(∑ ln 𝑥)
∑(ln 𝑥)2 −
𝑛
17.594 ∗ 8.371
37.7437 −
𝑏= 4
(17.594)2
83.7976 − 4
𝑏 = 0.1441
∑ ln 𝑦 − 𝑏 ∗ ∑ ln 𝑥
ln 𝑎 =
𝑛
8.371 − (0,1441 ∗ 17.594)
ln 𝑎 =
4
ln 𝑎 = 1.4589
𝑎 = е1.4589 = 4.3012
Ecuación final: 𝑦𝑖 = 𝑎 ∗ 𝑥𝑖𝑏 𝑦 = 4.3012 ∗ 𝑥 0.1441

26
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

c) ¿Qué lectura se obtendría con una potencia de 600 (x)?

Para esto, simplemente se utiliza la ecuación anteriormente


encontrada por estimación, sustituyendo el valor de x por 600
𝑦 = 4.3012 ∗ 6000,1441 = 10.8124
3) Se tiene:
POTENCIA DECIBELES
300 30
1500 40
3000 45
15000 49
30000 60
150000 65
En base a los datos anteriores y aplicando el método potencial:
a) Construya un diagrama de dispersión
b) Efectúe la estimación del modelo logarítmico
c) Elabore el análisis de varianza(Ftab(0.01))

Desarrollo
a) Construya un diagrama de dispersión

70
60
50
40
30
20
10
0
0 50000 100000 150000 200000

b) Efectúe la estimación del modelo logarítmico


Tabla de Datos:

300 30 5,7038 3,4012 32,5333 11,5682 19,3998


1500 40 7,3132 3,6889 53,4829 13,6080 26,9777
3000 45 8,0064 3,8067 64,1024 14,4910 30,4780
15000 49 9,6158 3,8918 92,4636 15,1461 37,4228
30000 60 10,309 4,0943 106,2755 16,7633 42,2081
150000 65 11,9184 4,1744 142,0483 17,4256 49,7522
Σ 52,8666 23,0573 490,9060 89,0021 206,2385

27
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

Estimadores del modelo

∑ ln 𝑥 ∗ ∑ ln 𝑦
∑ ln 𝑥 ∗ ln 𝑦 −
𝑏= 𝑛
2
(∑ ln 𝑥)
∑(ln 𝑥)2 −
𝑛
52.8666 ∗ 23.0573
206.2385 −
𝑏= 6
(52.8666)2
490.9060 − 6
𝑏 = 0.1227
∑ ln 𝑦 − 𝑏 ∗ ∑ ln 𝑥
ln 𝑎 =
𝑛
23.0573 − (0,1227 ∗ 52.8666)
ln 𝑎 =
6
ln 𝑎 = 2.7618
𝑎 = е2.7618 = 15.8283
Ecuación final:

𝑦𝑖 = 𝑎 ∗ 𝑥𝑖𝑏
𝑦 = 15.8283 ∗ 𝑥 0.1227

c) Elabore el análisis de varianza

Fuente de Grados Suma de Cuadrado Fcal. Ft(0.01)


Variación de cuadrados medio
libertad
Regresión 1 0.3777 0.3777 83.9333 21.20

Error 4 0.0179 0.0045


Total 𝟓 𝟎. 𝟑𝟗𝟓𝟔

(52.8666 ∗ 23.0573
𝑆𝐶 𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 = 0.1227 ∗ (206.2385 − )
6
= 0.3777
(23.0573)2
𝑆𝐶 𝑇𝑜𝑡𝑎𝑙𝑒𝑠 = 89.0021 − = 0.3956
6
𝑆𝐶 𝐸𝑟𝑟𝑜𝑟 = 0.3956 − 0.3777 = 0.0179

28
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

Debido a que F calculada es mayor que F tabulada, se rechaza


la Ho y se acepta la Ha, con lo cual se concluye que el modelo
sí explica el fenómeno en estudio y que los resultados
obtenidos no se deben a la casualidad.
4) Se tienen los siguientes valores para “X” y “Y”:

X Y
1920 385
1940 745
1960 1230
1980 1855
2000 2343
2020 3810

En base a los datos anteriores y aplicando el método


exponencial:

a) Construya un diagrama de dispersión


b) Efectúe la estimación del modelo geométrico

Desarrollo:

En base a los datos anteriores:


a) Construya un diagrama de dispersión

4500

4000

3500

3000

2500

2000

1500

1000

500

0
1900 1920 1940 1960 1980 2000 2020 2040

29
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

b) Efectúe la estimación del modelo geométrico

Tabla de datos:
𝒙 𝒚 𝐥𝐧 𝒚 𝒙𝟐 (𝐥𝐧 𝒚)𝟐 𝒙 ∗ 𝐥𝐧 𝒚
1920 385 5,9532 3686400 35,4406 11430,144
1940 745 6,6134 3763600 43,7371 12829,996
1960 1230 7,1148 3841600 50,6204 13945,008
1980 1855 7,5256 3920400 56,6347 14900,688
2000 2343 7,7592 4000000 60,2052 15518,4
2020 3810 8,2454 4080400 67,9866 16655,708
Σ 11820 10368 43,2116 23292400 314,6245 85279,944

Estimadores del modelo:


11820 ∗ 43.2116
85279.944 −
ln 𝑏 = 6
118202
23292400 − 6
ln 𝑏 = 0.0219
𝑏 = е0.0219 = 1.0221
43.2116 − 0.0219 ∗ 11820
ln 𝑎 =
6
ln 𝑎 = −35.9411
𝑎 = е−35.9411 = 2.4602𝑥10−16

Ecuación final:
𝑦 = 1.0221 ∗ (2.4602𝑥10−16 )𝑥

30
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

5. Conclusiones
o En el análisis de regresión una de las dos variables, que llamamos
“X”, puede considerarse como variable ordinaria e independiente, es
decir se puede medir sin error apreciable. La otra variable “Y”, es una
variable aleatoria y depende en términos de “X”.
o El objetivo es hallar la función que describa aproximadamente el
diagrama de puntos anterior, en el rango considerado de la variable
“X”. A tal efecto en primer lugar elegimos una clase de funciones de
donde seleccionaremos alguna función apropiada, en este caso se
aplica la ecuación del modelo exponencial y potencial.

o La aplicación de distintas regresiones sobre un mismo problema nos


permite realizar comparaciones, sin limitarse solamente al caso lineal,
sino también se puede ampliar con el análisis de regresión y
correlación no lineal.

o La facilidad de que nos brindan las nuevas tecnologías que permiten


en poco tiempo efectuar comparaciones que nos permitan la correcta
elección de un modelo adecuado, que describa los datos en
problemas de los modelos exponencial y potencial, así como nos
proporciona elementos de juicio suficientes para la toma de
decisiones en condiciones de incertidumbre.

o El análisis de la varianza y la prueba de hipótesis de los modelos son


muy parecidos en forma y estructura, pero el procedimiento y la
aplicación de las formulas las vuelve un proceso distinto.

31
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

6. Recomendaciones
 Un modelo de regresión con un alto porcentaje de variaciones
explicado puede no ser bueno para predecir, ya que el que la mayoría
de los puntos se encuentren cercanos a la recta de regresión, no
implica que todos lo estén, y puede ocurrir, que justamente para aquel
rango de valores en el que el investigador está interesado, se alejen
de la recta, y por tanto, el valor predicho puede alejarse mucho de la
realidad.
 Se debe de tener en cuenta, que se esta trabajando con logaritmos
neperianos. El proceso es mucho más simple y fácil de interpretar y
analizar. Además, se cuenta con suficiente información acerca del
procedimiento de los dos modelos trabajados.
 El diagrama de dispersión se puede trabajar con el software EXCEL.
También se puede trabajar el análisis de datos (regresión y
correlación) y la aplicación de otros softwares muy sencillos, pero con
permisos y licencias.
 Debemos de considerar las variaciones entre las dos variables (X y
Y) y los datos de los resultados para llegar a una interpretación y
análisis concreto.

32
Análisis de Regresión y Correlación No Lineal: Modelo Exponencial y Potencial

7. Referencias bibliográficas y linkografías


 https://es.scribd.com/doc/69226443/Regresion-No-Lineal

 http://aprendeconalf.es/estadistica/ejercicios/regresion-no-lineal.html

 https://support.minitab.com/es-mx/minitab/18/help-and-how-
to/modeling-statistics/regression/supporting-topics/nonlinear-
regression/understanding-nonlinear-regression/

 https://explorable.com/es/la-correlacion-estadistica

 http://www.soarem.org.ar/Documentos/50%20Minaard.pdf

 http://biplot.usal.es/problemas/libro/6%20%20Regresion.pdf

33