Está en la página 1de 18

1

Contenido
Introducción.................................................................................................................................3
Objetivos......................................................................................................................................3
Desarrollo del tema......................................................................................................................3
Ecuación característica.............................................................................................................3
Tabla de datos..........................................................................................................................3
Estimadores del modelo...........................................................................................................4
Análisis de varianza para la regresión......................................................................................4
Grado de ajuste del modelo......................................................................................................4
Pruebas de Hipótesis para el modelo........................................................................................5
Para el coeficiente b.............................................................................................................5
Para el coeficiente a..............................................................................................................5
Intervalos de confianza.............................................................................................................5
Para el coeficiente b.............................................................................................................5
Para el coeficiente a..............................................................................................................6
Para la media de y................................................................................................................6
Para la estimación de y.........................................................................................................6
Cálculo de estimadores, coeficiente de determinación y análisis de varianza mediante el uso
de matrices...............................................................................................................................6
Ejemplo 01...............................................................................................................................7
Ejemplo 02.............................................................................................................................13
Conclusiones..............................................................................................................................15
Referencias bibliográficas..........................................................................................................16
Anexos.......................................................................................................................................16

2
Introducción
Este modelo de regresión es una alternativa cuando el modelo lineal no logra un coeficiente de
determinación apropiado, o cuando el fenómeno en estudio tiene un comportamiento que puede
considerarse potencial o logarítmico. La forma más simple de tratar de establecer la tendencia es
a través de un diagrama de dispersión o nube de puntos, tal como la siguiente:

Este modelo también es conocido como potencial, Cobb-Douglas de primer grado o exponencial
inverso.

Objetivos
Estudiar el modelo de regresión logarítmica
Determinar si el modelo explica o no el fenómeno en estudio

Desarrollo del tema


Ecuación característica
La función que define el modelo es la siguiente:

Y i= A∗Xi B∗E

En la cual:
Yi:       Variable dependiente, i esima observación
A, B:   Parámetros de la ecuación, que generalmente son desconocidos
E:        Error asociado al modelo
X i :       Valor de la í-esima observación de la variable independiente

Al sustituir los parámetros por estimadores, el modelo adopta la siguiente forma:

y i=a∗x i b

La ecuación se transforma aplicando logaritmos de ambos lados, con lo cual se convierte a una
forma lineal:
ln y i=ln a+b∗ln x i
Tabla de datos
Para el ajuste de un conjunto de datos al modelo geométrico de regresión, se construye la
siguiente tabla de datos:

X Y Ln x Ln y (ln x)2 (ln y)2 Ln X*ln y

.. .. .. .. .. ..

3
Σln x Σln y Σ(ln x)2 Σ(lny)2 ΣLnx*lny
Debido a las propiedades de los logaritmos, ningún valor de X ni de  Y puede ser negativo. En
tal caso, lo que se hace es definir un valor de x o de y muy pequeño (Ej: 0.00000001)
Se puede trabajar con logaritmos naturales o logaritmos base 10.

Estimadores del modelo


Los estimadores para el ajuste del modelo se calculan de la siguiente manera

∑ ln ⁡(x)∑ ln ⁡( y)
∑ ln ( x )∗ln ( y )− n
b= 2
( ∑ ln ⁡( x))
2
∑ (ln ⁡( x)) − n

ln ( a )=
∑ ln ( y )−b∗∑ ln ⁡( x)
n

Será necesario utilizar antilogaritmos para obtener el  valor final de a .

Análisis de varianza para la regresión


Con el objeto de determinar si el modelo explica o no el fenómeno en estudio, se realiza el
análisis de varianza, que se calcula de la siguiente manera

Fuente de Grados de Suma de cuadrados Cuadrado F calculada F


Variación libertad medio tabulada
Regresión          1 b*(ΣLnxlny-Σ(Lnx)*Σ(lny)/n) S.C. Reg/1 C.M.Reg/C.M
.Error
Error       n-2 S.C. Total- S.C. Regresión S.C. Error/(n-2)
Total       n-1 Σ(lny)2-(Σlny)2 /n n-1

Ho: El modelo no explica el fenómeno en estudio


Ha: El modelo sí explica el fenómeno en estudio

 Para buscar en la tabla la F tabulada, se usan el numerador los grados de libertad de


regresión y en el denominador, de acuerdo al nivel de significancia escogido (los más usuales
son al 5% y al 1%)
 Si el valor de F calculada es mayor que el de F tabulada, se rechaza Ho, en caso
contrario se acepta

Grado de ajuste del modelo


Para determinar el grado de ajuste del modelo, se calcula el coeficiente de determinación, de la
siguiente manera
r 2=b∗¿¿

El valor de r2  tiene un rango entre 0 y 1. No puede obtenerse valores negativos

Pruebas de Hipótesis para el modelo

4
Para el coeficiente b
Para probar la hipótesis de que el coeficiente b es igual a un valor b´,  ser igual a cero, se
procede de la siguiente manera:

i) Se plantea la hipótesis   Ho:b=b´ y la alternativa Ha:  b≠ b´


ii) Se calcula el estadístico:
b−b '
t=
sb
El cuadrado medio del error se obtiene del análisis de varianza.

cuadrado medio del error


sb = √
∑ (ln ( x ))2
√ ∑ (ln ( x ))2− n

iii) Se busca en la tabla de t de student el valor tabulado para los siguientes datos:
      n-2 grados de libertad y un nivel α/2

iv) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso contrario, se
acepta.

Para el coeficiente a
       Se puede probar la hipótesis de que el coeficiente a es igual a un valor a´, para lo cual se
sigue el siguiente procedimiento:

i) Se define la hipótesis:  Ho: a=a´ y la alternativa Ha: a≠a´


ii) Se calcula el error standard para a con la siguiente fórmula:

cuadrado medio del error∗∑ (ln ⁡(x))2


sx=

√ 2
n∗( ∑ ln ( x ) ) −
n
2
( ∑ ln ⁡( x ))

  El cuadrado medio del error se obtiene del análisis de varianza


iii) Se calcula el estadístico de prueba:
ln ( a )−ln ⁡(a' )
t=
sx

iv) Se obtiene en la tabla de t de student el estadístico comparador, con los siguientes datos: n-2
grados de libertad y nivel α/2
v)  Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso contrario, la
hipótesis se acepta

Intervalos de confianza

Para el coeficiente b
       El intervalo de confianza para el coeficiente b se calcula así:

5
t∗√ cuadrado medio del error
IC ≔ b ±
√∑ ¿¿¿¿¿
El cuadrado medio del error se obtiene del análisis de varianza
       El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2

Para el coeficiente a
       El intervalo de confianza para el coeficiente a se calcula así:

t∗√ cuadradomediodelerror∗∑ ( ln ⁡( x))2


ln ( a ) ±
√ n∗¿ ¿ ¿

El cuadrado medio del error se obtiene del análisis de varianza


El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2

Para la media de y
Un intervalo de confianza para la respuesta media de y, dado x 0  sería:

1
ln ( ý ) ±t∗√ cuadrado medio del error∗
√ n
+ ¿ ¿ ¿¿

 El cuadrado medio del error se obtiene del análisis de varianza


       El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2
       El valor de xm  que aparece en la fórmula es el promedio de valores de los logaritmos de  x.

Para la estimación de y
El intervalo de confianza para la estimación de y, dado un valor de x 0 se obtiene de la siguiente
manera:
1

ln ( ^y ) ±t∗ √ cuadrado medio del error∗ 1+ + ¿ ¿¿ ¿
n

El cuadrado medio del error se obtiene del análisis de varianza


El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2
El valor de xm  que aparece en la fórmula es el promedio de valores de x

6
Cálculo de estimadores, coeficiente de determinación y análisis de varianza mediante el uso de
matrices
Un método alternativo para realizar los cálculos, es el uso de matrices. En este caso, el
procedimiento es el siguiente:

i) Formar la matriz x: (matriz de variable independiente), agregando la primera columna


formada por unos:
       
1 Ln x1
1 Ln x2
... .....
1 Ln xn

ii)  Formar el vector de logaritmos de y

Ln y1
Ln y2
.....
Ln yn

iii) Formar la matriz x transpuesta (x´)

1 1 ... 1
Ln x1 Ln x2 ... Ln xn

iv) Calcular el producto matricial X T X


V)  Calcular la inversa del producto [ o sea( X T X )−1 ¿
vi)  Calcular el producto X T Y
vii)  Calcular el producto( X T X )−1 *( X T Y ¿=¿ b
El resultado de esta operación es el vector de coeficientes de regresión (el primero es el
logaritmo de a y el segundo es b). El valor de b sale directamente, mientras que el de a está en
forma logarítmica, de modo que para formar la ecuación original se obtiene el  antilogaritmo.
viii)  Para el cálculo del análisis de varianza, se tienen las siguientes operaciones matriciales:

Fuente de Grados de Suma de cuadrados Cuadrado F calculada F


Variación libertad medio tabulada
Regresión          1 b´( x´ )(y)- nym2 S.C. Reg/1 C.M.Reg/C.M.Error *

7
Error       n-2 y´y-b( x´ )(y) S.C.
Error/(n-2)
Total       n-1 y´y- nym2 n-1

El valor de ym  que aparece en las fórmulas es el promedio de los logaritmos de y

ix) Finalmente, el coeficiente de determinación por  matrices se obtiene de la siguiente manera:

r2=  {b´(x´)(y)- nym2}/(y´y- nym2)

Ejemplo 01
Se realizó un estudio comparativo del nivel de ruido (en decibeles) producido por discotecas
rodantes, se procedió a evaluar diferentes niveles de potencia (en vatios). Los datos finales
fueron:

POTENCIA DECIBELES
100 60
500 80
1000 90
5000 99
10000 120

 En base a los datos anteriores:

8
a) Construya un diagrama de dispersión
b) Efectúe la estimación del modelo logarítmico.
c) Determine el grado de ajuste e interprételo
d) Elabore el análisis de varianza y discútalo
e) ¿Qué lectura se obtendría con una potencia de 3000 vatios?
f) Pruebe la hipótesis que b=1 con un 99% de confianza
g) Calcule intervalo de confianza al 95% para a y b.
h) Efectúe la estimación del modelo, el anova y obtenga el coeficiente de determinación por
medio de matrices.

DESARROLLO
a)    Diagrama de Dispersión

El diagrama de dispersión muestra una tendencia logarítmica, pues aunque hay incrementos
fuertes de potencia, los niveles de ruido no crecen excesivamente.

b) Estimadores del modelo

i)             Tabla de Datos:

X y Ln(x) Ln (y) (ln (x))2 (ln (y))2 Ln(x)*Ln(y)


100 60 4.6052 4.0943 21.2076 16.7637 18.8552
500 80 6.2146 4.3820 38.6214 19.2022 27.2326
1000 90 6.9078 4.4998 47.7171 20.2483 31.0836
5000 99 8.5172 4.5951 72.5426 21.1151 39.1375
10000 120 9.2103 4.7875 84.8304 22.9201 44.0944
SUMAS: 35.4551 22.3588 264.9190 100.2493 160.4033

9
ii)            Estimadores del modelo

35.4551∗22.3588
160.4033−
5
b= =0.1374
(35.4551)2
264.919−
5

22.3588−0.1374∗35.4551
=3.497
5

a=e 3.497=33.0164

y=33.0164∗X 0.1374

c)            Grado de ajuste del modelo


El coeficiente de determinación se calcula así:

35.4551−22.3588
R 2=
(
0.1374∗ 160.4033−
5 ) =0.9586
2
(22.3588 )
100.2493−
5

Se puede concluir que el grado de ajuste del modelo es alto, por lo que el modelo es confiable
para hacer predicciones.
suma de cuadrados de regresión:

suma de cuadrados total


d)            Análisis de varianza del modelo

iii)           Suma de cuadrados del error: 0.2661-0.255= 0.0111


iv)           Grados de libertad de regresión=1
v)            Grados de libertad totales= 5-1=4
vi)           Grados de libertad del error=5-2=3

10
vii)         Cuadrado medio de regresión= 0.255/1=0.255
viii)        Cuadrado medio del error= 0.0111/3=0.0037
ix)           F Calculada=0.255/0.0037=68.91
x)            F Tabulada (1,3,0.01)= 34.12
xi)           Tabla de Andeva:

Fuente de Grados de Suma de cuadrados Cuadrado F F


Variación libertad medio calculada tabulada
Regresión       1 0.2550  0.255  68.91    34.12*
Error       4 0.0111  0.0037
Total       5 0.2661

Debido a que F calculada es mayor que F tabulada, se rechaza la Ho y se acepta la Ha, con lo
cual se concluye que el modelo si explica el fenómeno en estudio y que los resultados obtenidos
no se deben a la casualidad.

e) Qué lectura en decibeles se obtiene al aplicar una potencia de 3,000 vatios?


Para esto, simplemente se utiliza la ecuación anteriormente encontrada por estimación,
sustituyendo el valor de x por 3,000

y= 33.164*(3000)0.1374=99.63

Se puede aplicar la operación equivalente por medio de los logaritmos de los estimadores:

ln y= 3.497+0.1374*Ln(3,000)=4.59707

Finalmente, y=e4.59707=99.63

f) Pruebe la hipótesis de que b=1 con un 99% de confianza


    Inicialmente se plantea Ho: b=1 y su alterna Ha: b≠1
    A continuación se obtiene el error standard de b:

11
sb = √ 0.0037 =0.0165
(35.455)2
√ 264.919−
5
El valor de t de student de calcula de la siguiente manera: (el logaritmo de 1 es cero)

El valor de t se obtiene en la tabla de t de student, con 5-2=3


grados de libertad y (1-.99)/2=0.005 de α, siendo el valor igual a 5.841
Finalmente, dado que t calculada es mayor que la tabulada, se concluye al 99% que el
coeficiente b no es igual a 1.

g) Calcule intervalos de confianza al 95% para a y b 


     El valor de t de student al 95% con 3 grados de libertad es= 3.182
Intervalo de confianza para  b:

0.0037
IC=0.1374 ± 3.182∗

√ 264.919−
( 35.4551 )2
5
=0.1374 ± 0.5266

El intervalo final será entonces el siguiente:  -0.3892< B< 0.664

Intervalo de confianza para a:


0.0037∗264.919
3.497 ± 3.182∗

√(
5∗ 264.919−
( 35.4551 )2
5 )
=3.497 ± 0.3833

El intervalo final para el logaritmo de a sería: 3.1137< ln A <3.8803

i)     Ajuste del modelo y análisis de varianza mediante matrices:

1 4.6052

[ ]
16.2146
Matriz x:       16.9078
1 8.5172
19.2103

Matriz x transpuesta (x’)   

12
1 1 1 1 1
4.6052 6.2146 6.9078 8.5172 9.2103
         

     4.09430
                     4.3820
            Y=    4.4998
                     4.5595
                     4.7875
                    

Producto x’x: 

5 35.4551
35.4551 264.9191 

Matriz inversa de x’x:

3.9228  -0.5250
-0.5250 0.07403

Producto x ´ y

22.8231
163.5535 

Producto Final b=(x´x)-1*  (x ´ y)

3.6644 
0.1269 

Análisis de varianza
Suma de cuadrados de regresión= b’x’y- nym2= 0.255

13
 ym= 22.3588/5=4.47176
Suma de cuadrados total=y’y- nym2=0.2661
Suma de cuadrados del error =: 0.2661-0.255=0.0111
Grados de libertad de regresión=1
Grados de libertad totales= 5-1=4
Grados de libertad del error=5-2=3
Cuadrado medio de regresión= 0.255/1=0.255
Cuadrado medio del error= 0.0111/3=0.0037
F Calculada=0.255/0.0037=68.91
F Tabulada (1,3,0.01)= 34.12
Análisis de  Varianza Final:

Fuente de Grados de Suma de cuadrados Cuadrado F F


Variación libertad medio calculada tabulada
Regresión       1 0.255  0.255   68.91  34.12*
Error       3 0.0111  0.0037
Total       4 0.2661

0.255
r 2= =0.958
0.2661

Ejemplo 02
La empresa Saga Falabella Perú invierte dinero en publicidad para obtener una utilidad al mes
como se detalla en el siguiente cuadro:

x:dinero invertido en publicidad


y: utilidad en miles de dólares
mes x y
enero 1 2.5
febrero 2 3.2
marzo 3 3.7
abril 4 4
mayo 5 4.2
a) Hallar la ecuación de regresión logarítmica por el método de mínimos cuadrados
Y^ =a+b∗ln( x)
1. Haciendo el diagrama de dispersión

14
Modelo de regresion logaritmica
4.5

utilidad en miles de dolares


4
3.5
3
2.5
2
1.5
1
0.5
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5

dinero invertido en publicidad en miles de dolares

2. Linealizar el modelo
Y^ =a+b∗x ' Donde x ' =ln ⁡( x)
Y además

∑ y=n∗a+b∗∑ x '
∑ x ' y=a∗∑ x ' + b ∑ x '2

mes x x'=ln(x) y x'y (x')^2


enero 1 0 2.5 0 0
febrero 2 0.69314718 3.2 2.21807098 0.480453014
marzo 3 1.09861229 3.7 4.06486547 1.206948961
abril 4 1.38629436 4 5.54517744 1.921812056
mayo 5 1.60943791 4.2 6.75963923 2.590290394
4.78749174 17.6 18.5877531 6.199504424

Reemplazando valores

17.6=5∗a+4.7874917∗b
18.587753=4.7874917∗a+6.1995044∗b

3. Resolviendo el sistema por el método matricial en el software máxima

15
a= 2.4912
b= 1.0745

Y^ =2.4912+1.0745∗ln( x)

Modelo de regresion logaritmica


4.5
utilidad en miles de dolares

4 f(x) = 1.07 ln(x) + 2.49


3.5
3
2.5
2
1.5
1
0.5
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5

dinero invertido en publicidad en miles de dolares

b) Estimar la utilidad de la empresa cuando se ha invertido 5800 dólares


x=5.8

16
Y^ =2.4912+1.0745∗ln (5,8)

Y^ =4.380
La utilidad de la empresa es de 4380 dólares
c) Cuando se invirtió en publicidad, si la empresa genero 6800 dólares de utilidad
^ =6.8
d) Y

6.8=2.4912+ 1.0745∗ln ( x )
6.8−2.4912=1.0745∗ln ( x )
4.3088
ln ( x )= =4.01
1.0745

e ln ( x )=e 4.01

x=e 4.01
x=55.1469
La inversión estimada será de 55146.9 dólares

Conclusiones
La regresión logarítmica sirve para usarlo cuando el diagrama de dispersión no tiende a una
línea recta.
El modelo e regresión logarítmica no es recomendado para usarlo en problemas relacionados a
los negocios ya que su crecimiento es demasiado lento.

Referencias bibliográficas

Referencias bibliográficas

https://reyesestadistica.blogspot.com/2011/07/analisis-de-regresion-logaritmica.html

https://www.bing.com/videos/search?
q=+modelo+de+regresion+logaritmica&&view=detail&mid=3FF20E8EBFF3AAB4A83E3FF20E8E

17
BFF3AAB4A83E&&FORM=VRDGAR&ru=%2Fvideos%2Fsearch%3Fq%3D%2Bmodelo%2Bde
%2Bregresion%2Blogaritmica%26qs%3Dn%26form%3DQBVR%26sp%3D-1%26pq
%3Dsupuestos%2Bde%2Bmodelo%2Bde%2Bregresion%2Blogaritmica%26sc%3D0-44%26sk
%3D%26cvid%3D6C84B17A01124033B98B283D4DCACC67

Anexos

18

También podría gustarte