公式只能傳圖片?,好多公式都沒寫上,但是,不管有沒有公式,寫得一樣無趣至極,在中國人民大學出版社出版的王燕編著的<<應用時間序列分析(第三版)>>的基礎上寫的,文中說的第幾頁都是指這本書的第幾頁,我大概列了一下基本概念,理論,方法,方便了解整個分析過程步驟,之后會給出python處理代碼的,計算過程幫你解決,想當年我們還是手寫計算出來的,最多加個計算器,公式一大堆,闊怕.
一.時間序列分析
按照時間的順序把隨機事件變化發展的過程記錄下來就構成了一個時間序列.對時間序列進行觀察,研究,找尋它變化的規律,預測它將來的走勢就是時間序列分析.
時間序列分析又分為平穩時間序列分析和非平穩時間序列分析(非平穩時間序列又細分為非平穩序列的確定性分析和非平穩序列的隨機分析),這節主要說平穩序列
二.時間序列的預處理
拿到一個觀察值序列之后,首先對它的平穩性和純隨機性進行檢驗,這兩個重要的檢驗成為序列的預處理.根據檢驗的結果將序列分為不同的類型,對不同類型序列采用不同的分析方法.
2.1 平穩性的檢驗
嚴平穩:只有當序列所有的統計性質都不會隨著時間的推移而發生變化時,該序列才能被認為平穩
.
寬平穩:序列的統計性質主要由它的低階矩決定,只要保證序列低階矩平穩(二階),就能保證序列的主要性質近似穩定.寬平穩也稱為弱平穩或二階平穩.
平穩序列性質:均值和方差為常數
通常直觀的檢驗方法有時序圖檢驗和自相關圖檢驗,觀察時序圖,在某一范圍波動的通常是平穩的,另外還有兩種準確的判別方法:特征根判別和平穩域判別,具體運算過程不講,有興趣可翻閱45-46頁查看,后面說到再講怎么判斷.
2.2純隨機性檢驗
純隨機序列:平穩序列值之間沒有任何相關性的序列成為純隨機序列,這意味著該序列過去的行為對將來的發展沒有絲毫影響.從統計分析的角度而言,純隨機序列沒有任何分析價值.純隨機序列也稱為白噪聲序列.
白噪聲序列的性質:純隨機性和方差齊性.純隨機指序列各項直接沒有任何相關關系,方差齊性指序列中每個變量的方差都相等,如果不滿足方差齊性,就稱序列具有異方差性質.
純隨機性檢驗:檢驗序列是否為純隨機序列,即滿足樣本自相關系數為0.根據Barlett定理(延遲非0期的樣本自相關系數將近似服從均值為0方差為序列觀察期數倒數的正態分布),可以通過構造檢驗統計量來檢驗序列的純隨機性.
三:平穩序列的模型
3.1.AR模型
AR模型屬于平穩時間序列的分析模型
p階自回歸模型,簡記AR(p),隨機干擾序列為0均值白噪聲序列,當期隨機干擾與過去的序列值無關,一般分許AR模型的相關關系時,都簡化為中心化模型,具體公式過程可參考中國人民大學出版社出版的王燕編著的<應用時間序列分析(第三版)>43-44頁,下面說的第幾頁均是指這本書的第幾頁.
AR模型平穩性判別:1.特征根判別:p個特征根在單位圓內則平穩(絕對值小于1),從而也可推導出自回歸系數多項式的根都在單位圓外(絕對值大于1)
平穩域判斷:AR(1)的平穩域在[-1,1]范圍內,AR(2)的平穩域是一個三角性區域,公式見46-47
AR模型的性質:均值為常數,方差有界也是常數
自相關系數性質:拖尾性和呈指數衰減(即短期相關性)
偏自相關系數性質:平穩AR(p)的偏自相關系數具有p階截尾性
3.2.MA模型
MA模型屬于平穩時間序列的分析模型
簡記MA(q),隨機干擾序列為0均值白噪聲序列,分析時同樣先中心化模型
性質:常數均值,常數方差,自協方差函數只與滯后階數相關,且q階截尾,自相關系數q階截尾,偏自相關拖尾
3.3.ARMA模型
ARMA模型屬于平穩時間序列的分析模型
簡記ARMA(p,q),當q=0時,ARMA模型退化成AR(p)模型,當p=0時,ARMA模型退化成MA(q)模型
模型的平穩性由自回歸部分的平穩性決定
性質:均值常數,自相關系數不截尾,偏自相關系數不截尾
四.平穩序列建模過程.即AR,MA,ARMA的建模過程
1.通過序列預處理判定為平穩非白噪聲序列,如果非平穩,則采用接下來要說的ARIMA模型,這里只說平穩的過程.直觀時序圖法,或特征根絕對值<1和平穩域
2.計算ACF和PACF,其中ACF是樣本的自相關系數,PACF是樣本的偏自相關系數.
3.根據ACF個PACF性質選擇適當的ARMA(p,q)模型進行擬合,p=0則為MA(q),q=0則為AR(p),這個過程也叫定階過程,即選取不同的p,q,如果樣本自相關系數或偏自相關系數在最初的d階明顯超過2倍標準差范圍,而后幾乎95%的自相關關系數都落在2倍標準差范圍內,而且由非零自相關關系數衰減為小值波動的過程非常突然,這是成為自相關系數截尾,截尾階數為d,如果超過5%的樣本自相關系數落入2倍標準差范圍之外,或者由顯著非常的自相關系數衰減為小值波動過程比較緩慢或者非常連續,成為自相關系數不截尾,即拖尾,由拖尾與截尾,再根據上圖AR,MA,ARMA的截尾拖尾性質表確定用哪個模型
4.然后估計未知參數值,估計方法有矩估計,極大似然估計,最小二乘估計.矩估計比較粗糙,精度一般不高,常被用做確定極大似然估計和最小二乘估計迭代計算的初始值.極大似然估計計算復雜(經過迭代算法),但計算機可幫助實現計算,精度高,具有估計得一致性,漸近正態性和漸近有效性等統計性質,是一種非常優良的參數估計方法.最小二乘估計通常也是通過迭代法求出,精度高,實際運用中最常用的是條件最小二乘估計方法.
5.檢驗有效性:模型顯著性檢驗即為殘差序列的白噪聲檢驗,先做出原假設和備擇假設,在通過計算LB統計量,在這個統計量下比較P值與alpha,P值大于0.05則認為這個擬合模型的殘差序列屬于白噪聲序列,模型擬合顯著有效.參數的顯著性檢驗即要檢驗每一個未知參數是否顯著非零,如果某個參數不顯著,其對應的自變量對因變量的影響不明顯,則可剔除該自變量,最終模型由一系列參數顯著非零的自變量表示.做出原假設:某個參數為0,通過計算最終可以構造出用于檢驗位置參數顯著性的t檢驗統計量T,當P值<alpha,拒絕原假設,認為該參數顯著(計算推導過程78頁).
6.模型優化:同一個序列可以構造多個擬合模型,例如可以構造MA(2),也可以構造AR(1),兩個都顯著有效,為了選擇最優,按照AIC準則(最小信息量準則)和SBC準則進行選擇,使AIC函數達到最小的模型被認為是最優模型,當樣本容量趨于無窮大時,其選擇的模型不收斂于真實模型.而BIC模型彌補了他的不足,,BIC后也稱SBC,所以選擇AIC和SBC函數值達到最小的八個模型作為最終擬合模型,這樣得到的最優模型就是一個相對最優模型
7.最后就可以利用擬合的模型預測序列的將來走勢了.最常用的預測方法是線性最小方差預測,線性是指預測值為觀察值序列的線性函數(即計算出模型后,把后面每一期的數值代入方程,得到預測值),最小方差是指預測方差達到最小.預測只適合做短期預測
8.修正預測:隨著時間不斷發展,會不斷獲得新的觀察值,修正預測就是把新的值加進去提高精度.重新獲得p個新觀察值,修正誤差和修正方差公式在92頁