1.3.1 描述性時序分析
早期的時序分析通常都是通過直觀的數據比較或繪圖觀測,尋找序列中蘊含的發展規律,這種分析方法就成為描述性時序分析。古埃及人發現尼羅河泛濫的規律就是依靠這種分析方法。而在天文、物理、海洋學等自然科學領域,這種簡單的描述性時序分析方法也常常使人們發現意想不到的規律。
比如根據《史記 貨殖列傳》記載,早在春秋戰國時期,范蠡和計然就提出我國農業生產具有“六歲穰、六歲旱,十二歲一大饑”的自然規律。《越絕書 計倪內經》則描述的更加詳細,“太陰三歲處金則穰,三歲處氺則毀,三歲處木則康,三歲處火則旱......天下六歲一穰,六歲一康,凡十二歲一饑”。
用現代漢語來表述就是“木星繞天空運行,運行三年,如果處于金位,則該年為大豐收年;如果處于水位,則該年為大災年;再運行三年,如果處于木位,則該年為小豐收年,如果處于火位,則該年為小災年,所以天下平均六年一個大豐收年,六年一個小豐收年,十二年為一個大饑荒”。這是2500多年前,我國對農業生成具有3年一個小波動,12年左右一個大周期的記錄,是一個典型的描述性時間序列分析。
描述性時序序列分析方法是人民在認識自然、改造自然的過程中發現的實用方法,對于很多自然現象,只要人們觀察時間足夠長,就能運描述性時序分析發現蘊含在時間里的自然規律,根據自然規律,做恰當的政策安排,就能有利于社會的發展和進步。
人們沒有采取任何復雜的模型或分析方法,僅僅是按照時間序列收集數據,描述和呈現序列的波動,就了解到小麥產量的周期波動特征,產生該周期特征的氣候原因以及周期波動對價格的影響。操作簡單,直觀有效是描述性時間序列分析方法的突出特點。它通常也是人們進行統計時序分析的第一步,通過圖示的方法直觀的反映出序列的波動特征。
1.3.2 統計時序分析
隨著研究領域的不斷拓廣,人們發現單純的描述性時序分析有很大的局限性,在金融、保險、法律、人口、心理學等社會科學研究領域,隨機變量的發展通常會呈現出非常強的隨機性,想通過對時序序列簡單的觀察和描述,總結出隨機變量發展變化的規律,并準確預測出它們將來的走勢通常是非常困難的。
為了更準確的估計隨機時序發展變化的規律,從20世紀20年代開始,學術界利用數理統計學原理分析時序序列。研究重心從總結表現現象轉移到分析序列值內在的相互關系上,由此開辟了一門應用統計學科,時序序列分析。
縱觀時間序列分析方法的發展歷史可以將時間序列分析方法分為兩大類。
一 頻域分析方法
頻域分析方法也成為頻譜分析或譜分析方法
早期的頻譜分析方法假設任何一種無趨勢的時間序列都可以分解成若干不同頻率的周期波動,借助傅里葉分析從頻率的角度揭示時間序列的規律,后來又借助了傅里葉變換,用正弦、余弦項之和來逼近某個函數。20世紀60年代,burg在分析地震信號時提出最大熵譜值估值理論,該理論克服了傳統譜分析所有雇的分辨率不高和頻率漏泄等缺點,使得譜分析僅以一個新階段,稱之為現代譜分析階段。
目前譜分析方法主要用于電器工程,信息工程,物理學,天文學,海洋學和氣象科學等領域,它是一種非常有用的縱向數據分析方法,但是由于譜分析過程一般都比較復雜,研究人員通常需要很強的數學基礎才能熟練使用它,同時它的分析結果也比較抽象,不易于進行直觀的解釋,所以譜分析方法的使用具有很大的局限性。
二 時域分析法
時域(time domain)分析方法主要是從序列自相關的角度解釋時間序列的發展規律。相對于譜分析方法,它具有理論基礎扎實、操作步驟規范、分析結果易于解釋等有點。目前它已經廣泛應用于自然科學和社會科學的各個領域,成為時間序列分析的主流方法。本書就是介紹時域分析方法。
時域分析方法的基本思想是事件的發展通常都具有一定的慣性,這種慣性用統計的語言來描述就是序列值之間存在一定的相互關系,而且這種相互關系具有某種統計規律。我們分析的重點就是尋找這種規律,并擬合出適當的數學模型來描述這種規律,進而利用這個擬合模型來預測序列未來的走勢。
時域分析方法具有相對固定的分析套路,通常都遵循如下分析步驟:
- 第一步:考慮觀察值序列的特征
- 第二步:根據序列的特征選擇適當擬合模型
- 第三步:根據序列的觀察數據確定模型的口徑
- 第四步:檢驗模型,優化模型
- 第五步:利用擬合好的模型來推斷序列的其他統計性質或預測序列將來的發展。
時域分析方法的產生最早可以最早追溯到1987年,英國統計學家G.M.JenKins聯合出版了 Times Series Ananlysis Forecasting and Control一書。在書中,Box和Jenkins在總結前人的基礎上,系統的闡述了對求和自回歸移動平均(autoregressive integrated moving average)ARIMA模型的識別、估計、檢驗及預測的原理和方法。這些知識現在被稱為經典的時序序列分析方法,是時域分析的核心方法。為了紀念Box和Jinkens對時間序列的發展的特殊貢獻,現在人們也常把ARIMA模型稱為Box-Jenkins模型。
Box-Jenkins模型實際上是主要運用于單變量、同方差的線性模型。隨著人們對各領域時序序列的深入研究,發現該經典模型在理論和應用上都還存在許多局限性。所以近20年來,統計學家紛紛轉向多變量場合、異方差場合和非線性場合的時序序列分析方法的研究,并且取得了突破進展。
異方差
- 美國統計學家、計量經濟學家Robert F Engle在1982年提出了自回歸條件異方差(ARCH)模型
- Bollerslov在1985年提出了廣義自回歸條件異方差模型(GARCH)
- Nelson等人又提出了指數廣義自回歸條件異方差(EGARCH)模型,方差無窮廣義自回歸條件異方差(IGARCH)和依均值廣義自回歸條件異方差(GARCH-M)模型
非線性場合
- Granger和Andersen在1987年提出了雙線性模型
- Howell Tong與1987年提出門限自回歸模型
- Priestley于1980年提出了狀態相依模型
- Hamilton于1989年提出了馬爾科夫轉移模型
- Lewis和Stevens于1991年提出了多元適應回歸樣條方法
- Carlin于1992年提出了非線性狀態空間建模的方法
- Chen和Tsay于1993年提出了非線性可加自回歸模型