Está en la página 1de 11

時間序列期中報告

全球二氧化碳排放量模型配適

目錄
一. 諸論
二. 資料分析
2.1 流程簡述
2.2 模型配適
2.3 參數估計
2.4 模型診斷
2.5 預測
三. 結論

授課老師:周若珍 教授

作者:謝宗震 9624515

2008/5/4
一、諸論

最新公佈的一項研究顯示,2000 年至 2004 年期間,全球二氧化碳排放量每年增加 3.2%,大幅超過


1990 年至 1999 年年均 1.1%的增長率。根據這項研究,1980 年全球二氧化碳排放量約為 50 億噸,之後
持續增加,至 2006 年已超過 80 億噸。

儘管有證據顯示,二氧化碳是地球暖化和破壞的生態系統變因之一,但其排放量則是在近年來顯著

的加快。我們從 www.earth-policy.org 中取得 1851-2006 年的全球二氧化碳排放量(百萬噸/年) ( y t ) ,由

Fig.1 (a), (b), (c) 我們可以發現 1851-1900 間,二氧化碳排放之平均增加量為 9.80 百萬噸,1901-1950


之二氧化碳排放平均增加量為 22 百萬噸,1951-2006 則暴增為 1.2 億噸。我們可以發現近來二氧化碳
排放量持續增加,且其增加量越來越可觀。這也是二氧化碳排放量這個議題越來越受到大家的重視的
原因之一。

本文主要想討論的問題是,如何利用這筆資料與時間序列課程中所學的方法,加以應用與切合。嘗試
用時間序列模型配適該筆資料,再進一步預測未來數年可能的值,最後依據二氧化碳排放量之成長
趨勢分析其結果。至於配適的過程請參閱第二章,分析結果請參閱第三章。
Million Tons of Carbon Dioxide

Million Tons of Carbon Dioxide


500

1400
300

1000
100

600

1850 1860 1870 1880 1890 1900 1900 1910 1920 1930 1940 1950

Time Time

(a) (b)
Million Tons of Carbon Dioxide

Million Tons of Carbon Dioxide


2000 4000 6000 8000

6000
2000
0

1950 1960 1970 1980 1990 2000 1850 1900 1950 2000

Time Time

(c) (d)

/ . (b) 1901-1950二氧化碳排放量 百萬噸年


Fig. 1 (a) 1851-1900 二氧化碳排放量 百萬噸年 / .
(c) 1951-2006
二氧化碳排放量 百萬噸年. / (d) 1851-2006 百萬噸年.
二氧化碳排放量 /
二. 資料分析

2.1 流程簡述

本文所要研究的資料為 1850~2006 年全球二氧化碳排放量(百萬噸/年),其資料出自於


http://www.earth-policy.org/Indicators/CO2/index.htm。在本章節中,首先,我們選擇 1851-1990 年的
資料,來進行時間序列模型的配適(2.2 節)。選模之後即進行參數估計,並試圖比較不同估計方式
對於本資料的好壞(2.3 節)。找出模型再進行模型診斷,診斷內容包跨,比較幾個已選擇的模型之
好壞,殘差是否符合無自我相關與常態等性質(2.4 節)。最後我們對所選之模型進行預測,再以
1991-2006 年的資料去檢驗模型的好壞,並試圖預測未來百年全球二氧化碳的排放量。

y_t sqrt(y_t)
8000

sqrt(data1)

60
data1

4000

20
0

1850 1900 1950 2000 1850 1900 1950 2000

Time Time
(a) (b)

log(y_t)
4 5 6 7 8 9
log(data1)

Fig. 2 Consinder data transfrom.


(a) none.

(b) yt .
(c) log( yt ).
1850 1900 1950 2000

Time
(c)
2.2 模型配適

由 Fig.2 (a)可以發現二氧化碳排放量增長速率極快,所以我們在做模型配時前,可以考慮把數列
開根號或是取自然對數。很顯然的,把原始數列取根號或對數之後,該數列變得較接近一條斜直
線。如此,配適之模型應該較不複雜。又因為取對數之後的值較小,且遇過把數列取自然對數 ( z )
t
之後再來分析的經驗較豐富,故我們選擇把原始數列取對數來做分析。由 Fig.3 (a)可以知道,
,即該數列存在強烈正相關,故應考慮時間序列模型來配適。
1  0.98,  2  0.95,  3  0.93

0 5 10
z_t
8

4 5 6 7 8
lco2
7
lco2
6

1860 1880 1900 1920 1940 1960 1980


5

Time
4

lag 1
z_t
8

1.0
7

ACF
lco2

0.0
6

-1.0
5

0 5 10 15 20
4

lag 2 Lag

z_t
8

1.0
7

Partial ACF
lco2

0.0
6
5

-1.0

5 10 15 20
4

lag 3
Lag

(a) (b)

(1-B) z_t (1-B)^2 z_t


0.15

0.0 0.2
lco2.d1

lco2.d2
-0.15 0.00

-0.3

1860 1880 1900 1920 1940 1960 1980 1860 1880 1900 1920 1940 1960 1980

Time Time

(1-B) z_t (1-B)^2 z_t


1.0

1.0
ACF

ACF
0.0

0.0
-1.0

-1.0

0 5 10 15 20 0 5 10 15 20

Lag Lag

(1-B) z_t (1-B)^2 z_t


1.0

1.0
Partial ACF

Partial ACF
0.0

0.0
-1.0

-1.0

5 10 15 20 5 10 15 20

Lag Lag

(c) (d)

Fig 3. (a) scatter plot for lag1 lag2 lag3. (b) z t ts


、plot 、
ACF PACF.
(c) zt ts z 
2
、plot 、
ACF PACF. (c) t
ts
、plot 、
ACF PACF.
觀察 Fig.3(b) 其 ACF 有下降趨勢(取 AR(1) (M1)),但沒有表現出迅速衰減的特徵,PACF 在 lag=1

時很大並接近 1,而自 lag=2 之後均不顯著。故判斷數列很可能存在單位根,故考慮一次差分 (zt )

與二次差分 ( zt ) 來配適模型。觀察 Fig.3 (c) 發現 zt 其 ACF 在 lag1 之後 rk 均很小,而 PACF 值均


2

不顯著,故猜測模型為 White noise 型式,即 ARIMA(0,1,0) (M2),當我們把資料取對數時,資料

呈現接近斜直線的型式,因此在做一次差分之後,有此結果並不意外。觀察 Fig.2 (d) ( zt ) 其 ACF


2

在 lag2 之後 rk  0.2 ,而 PACF 在 lag1, lag2 稍大之外,其餘較不顯著,故選擇 ARIMA(2,2,1) (M3)

作為第三個初步的模型。

2.3 參數估計

M1. AR(1)

由 conditional sum of square 法得知 (括號內是 s.e. for estimator)

zt  6.4798(2.3096)  0.9996(0.0005) zt 1 (2.3.1)

由 mle 法得知

zt  6.3617(2.3108)  0.9996(0.0005) zt 1 (2.3.2)

M2. ARIMA(0,1,0)

由 conditional sum of square 法得知

zt  at ,  =0.03426118,  2  0.00280 (2.3.5)


由 mle 法得知

zt  at ,  =0.03426118,  2  0.00280 (2.3.5)

M3. ARIMA(2,2,1)

由 conditional sum of square 法得知

 2 zt  0.0382(0.0905) zt 1  0.1254(0.0897) zt  2 (2.3.5)


 at  0.9458(0.0410) at 1

由 mle 法得知

 2 zt  0.0383(0.0905) zt 1  0.1254(0.0897) zt  2 (2.3.5)


 at  0.9458(0.0410) at 1

從以上 6 個式子可以觀察出,M1 與 M3 中使用 CSS 和 MLE 兩種方法所估計出來的值差異不大。


而 M1 模型中的   0.9996  1 ,可以知道 M1 與 M2 是類似的。在之後的章節中,我們採用 M1 與
1
M3 來進行模型診斷,其中取用 CSS 法作為主要的參數估計法。
2.4 模型診斷
Standardized Residuals Standardized Residuals
1

1
-1
-1

-3
-3

1860 1880 1900 1920 1940 1960 1980


1860 1880 1900 1920 1940 1960 1980
Time
Time

ACF of Residuals ACF of Residuals


0.4 0.8

0.4 0.8
ACF

ACF
-0.2

-0.2
0 5 10 15 20 0 5 10 15 20
Lag Lag

p values for Ljung-Box statistic p values for Ljung-Box statistic


0.8

0.8
p value

p value
0.4

0.4
0.0

0.0
2 4 6 8 10 2 4 6 8 10

lag lag

(a) (b)

Fig. 4 Diagnostic of the residuals modle M1 M3.


(a) from AR(1).
(b) ARIMA(2,2,1).

Table 1. Summary for fit model M1 , M3.

M1 M3
order (1,0,0) (2,2,1)
̂ 2 by CSS 0.003953 0.002789
log likelihood by CSS 183.72
207.26

AIC by CSS -365.13 -406.52


BIC by CSS -358.50 -397.72
H 0 : Residuals are non-autocorrelation.
P-value of Box-Pierce test See Fig. 4
H 0 : Residuals form normal distribution.
P-value of Kolmogorov-Smirnov test 0.05764 0.06558
H 0 : Residuals form normal distribution.
P-value of Shapiro-Wilk normality test <0.001 <0.001
從 Fig. 4 與 Table 1.可知:

 三種配適模型殘差符合無自我相關。
 在 Shapiro-Wilk 常態檢定下 M1, M3 均得出不出自常態分布。
 由 Pak. J. Inform. and Technol. 2003 知 Shapiro-Wilk test 有較大的檢定力,故得知三種配適模型
之殘差均不出自常態分布。
 由 ̂ 2 、log likelihood 、AIC、BIC,選取 M3 來配適似乎會有較佳的結果的( ̂ 2 最小、log
likelihood 最大、AIC 與 BIC 均最小)。

2.5 預測

Table 2. Compare with M1, M3 by forecasts from 1991 to 2006.

M1 M3
Year Real data Forecasts S.E. Forecasts S.E.
1991 8.7502 8.7162 0.062 8.7432 0.052
6 8
1992 8.7302 8.7154 0.088 8.7717 0.075
6 3
1993 8.7328 8.7146 0.108 8.7991 0.090
5 3
1994 8.7553 8.7138 0.125 8.8263 0.104
2 6
1995 8.7776 8.7130 0.140 8.8536 0.118
0 6
1996 8.8022 8.7122 0.153 8.8810 0.132
3 2
1997 8.8305 8.7114 0.165 8.9083 0.145
6 5
1998 8.8229 8.7106 0.177 8.9357 0.158
0 6
1999 8.8253 8.7098 0.187 8.9630 0.171
7 6
2000 8.8509 8.7090 0.197 8.9903 0.184
8 7
2001 8.8701 8.7082 0.207 9.0177 0.197
4 7
2002 8.8772 8.7074 0.216 9.0450 0.210
6 7
2003 8.9232 8.7066 0.225 9.0724 0.223
4 9
2004 8.9759 8.7058 0.233 9.0997 0.237
9 0
2005 9.0077 8.7050 0.242 9.1270 0.250
0 3
2006 9.0335 8.7041 0.249 9.1544 0.263
9 7
RMSE 0.6717 0.4435
MAE 2.2027 1.6368

由 Table 2. 可知 M1 的預測,大約是在 8.7 附近做略有遞減的小幅震盪。M3 的預測值隨著時間的增


加而增加,這和實際數列資料雷同,不過其預測值比實際值略高一些。再比較 RMSE(Root Mean
Square Error)與 MAE(Mean Absolute Error),均是 M3 最小,因此選擇 M3 當作最後的配適模型。
Fig. 5 是 zt 未來 60 年的預測圖。

Fig. 5 zt with forecasts at 1991.


A line : zt ( log( yt ) ) form 1900 to 1990.
B line : forecasting from 1991 to 2050.
C line : 95% limit C.I. for the forecasts.

三、結論
由 Fig.6 可以發現,全球二氧化碳的排放量完全沒有降低的趨勢,且呈現驚人的指數遞增型式,也就
是說將資料取對數之後,理當是一條斜值線產生。故可以利用迴歸配適出 1851-2100 二氧化碳的排放
模型,即 Fig.5 的曲線 C。

zt  4.4298  0.0308( x  1850), x  1851- 2100. (3.1.1)


yt  exp{4.4298  0.0308( x  1850)}, x  1851- 2100. (3.1.2)

這條曲線稍有高估,卻也不失為一個好的估計,然而本篇文章主要是在探討時間序列的方法,因此
不此多做著墨。

就我們的預測,一百年後,二氧化碳排放量將達到 725 億噸,大約是 2006 年的 8.6 倍。據研究顯示,


除了開發中國家人口增加和經濟成長之外,越來越多國家為了維持一定的經濟規模與產值,因而加
大溫室氣體的排放量。這也如模型所預測,未來二氧化碳的排放量將呈現爆炸性的增長,倘若二氧化
碳真是地球暖化之重要變因,我們應當立刻醒悟這件事情的嚴重性,並積極找出有力的方法,以抑
止二氧化碳的排放。

CO2 emissions

A:real data 1900-2006


60000

B:forecasts 2007-2100
C:Regression fit
40000
data1

20000
0

1900 1950 2000 2050 2100

Time
Fig.6 CO2 emissions 1900-2006 and forecast 2007-2100

四、參考文獻

1. Box, G.E.P., Jenkins, G.M., and Reinsel, G.C. (1994). Time Series Analysis: Forecasting and Control,
third edition. Prentice Hall, Upper Saddle River, N.J.
2. Shumway, R.H., Stoffer, D.S., (2006). Time Series Analysis and Its Applications With R Examples,
second edition. Springer Texts in Statistics.
3. 林茂文(2006). 時間數列分析與預測, 第三版. 華泰文化事業股份有限公司, 台北.
4. Carbon Dioxide Emissions Accelerating Rapidly. http://www.earth-policy.org/
5. AIT 不願面對的真相 官方部落格: http://www.iamcool.net/AIT/blog/8838