⑴ 非平穩時間序列可以預測股票走勢嗎
一般把非平穩時間序列轉化為平穩時間序列的方法是取n階差分法。
比如舉個例子,假設xt本身是不平穩的時間序列,如果xt~I(1) ,也就是說x的1階差分是平穩序列。
那麼 xt的1階差分dxt=x(t)-x(t-1) 就是平穩的序列 這時dt=x(t-1)
如果xt~I(2),就是說xt的2階差分是平穩序列的話
xt的1n階差分dxt=x(t)-x(t-1) 這時xt的1階差分依然不平穩,
那麼 對xt的1階差分再次差分後,
xt的2階差分ddxt=dxt-dxt(t-1)便是平穩序列 這時dt=-x(t-1)-dxt(t-1)
n階的話可以依次類推一下。
⑵ 時間序列在股市有哪些應用
時間序列分析在股票市場中的應用
摘要
在現代金融浪潮的推動下,越來越多的人加入到股市,進行投資行為,以期得到豐厚的回報,這極大促進了股票市場的繁榮。而在這種投資行為的背後,越來越多的投資者逐漸意識到股市預測的重要性。
所謂股票預測是指:根據股票現在行情的發展情況地對未來股市發展方向以及漲跌程度的預測行為。這種預測行為只是基於假定的因素為既定的前提條件為基礎的。但是在股票市場中,行情的變化與國家的宏觀經濟發展、法律法規的制定、公司的運營、股民的信心等等都有關聯,因此所謂的預測難於准確預計。
時間序列分析是經濟預測領域研究的重要工具之一,它描述歷史數據隨時間變化的規律,並用於預測經濟數據。在股票市場上,時間序列預測法常用於對股票價格趨勢進行預測,為投資者和股票市場管理管理方提供決策依據。
⑶ 一支簡單的股票價格預測的數學模型!!!!
對於股票價格只能是在理論上,換句話說是在你自己的期望預期。
而對於股票價格預測一般是從他的基本面上來考慮。
你可以試試下面的方法:
杜邦財務分析法及案例分析
摘要:杜邦分析法是一種財務比率分解的方法,能有效反映影響企業獲利能力的各指標間的相互聯系,對企業的財務狀況和經營成果做出合理的分析。
關鍵詞:杜邦分析法;獲利能力;財務狀況
獲利能力是企業的一項重要的財務指標,對所有者、債權人、投資者及政府來說,分析評價企業的獲利能力對其決策都是至關重要的,獲利能力分析也是財務管理人員所進行的企業財務分析的重要組成部分。
傳統的評價企業獲利能力的比率主要有:資產報酬率,邊際利潤率(或凈利潤率),所有者權益報酬率等;對股份制企業還有每股利潤,市盈率,股利發放率,股利報酬率等。這些單個指標分別用來衡量影響和決定企業獲利能力的不同因素,包括銷售業績,資產管理水平,成本控制水平等。
這些指標從某一特定的角度對企業的財務狀況以及經營成果進行分析,它們都不足以全面地評價企業的總體財務狀況以及經營成果。為了彌補這一不足,就必須有一種方法,它能夠進行相互關聯的分析,將有關的指標和報表結合起來,採用適當的標准進行綜合性的分析評價,既全面體現企業整體財務狀況,又指出指標與指標之間和指標與報表之間的內在聯系,杜邦分析法就是其中的一種。
杜邦財務分析體系(TheDuPontSystem)是一種比較實用的財務比率分析體系。這種分析方法首先由美國杜邦公司的經理創造出來,故稱之為杜邦財務分析體系。這種財務分析方法從評價企業績效最具綜合性和代表性的指標-權益凈利率出發,層層分解至企業最基本生產要素的使用,成本與費用的構成和企業風險,從而滿足通過財務分析進行績效評價的需要,在經營目標發生異動時經營者能及時查明原因並加以修正,同時為投資者、債權人及政府評價企業提供依據。
一、杜邦分析法和杜邦分析圖
杜邦模型最顯著的特點是將若干個用以評價企業經營效率和財務狀況的比率按其內在聯系有機地結合起來,形成一個完整的指標體系,並最終通過權益收益率來綜合反映。採用這一方法,可使財務比率分析的層次更清晰、條理更突出,為報表分析者全面仔細地了解企業的經營和盈利狀況提供方便。
杜邦分析法有助於企業管理層更加清晰地看到權益資本收益率的決定因素,以及銷售凈利潤率與總資產周轉率、債務比率之間的相互關聯關系,給管理層提供了一張明晰的考察公司資產管理效率和是否最大化股東投資回報的路線圖。
杜邦分析法利用各個主要財務比率之間的內在聯系,建立財務比率分析的綜合模型,來綜合地分析和評價企業財務狀況和經營業績的方法。採用杜邦分析圖將有關分析指標按內在聯系加以排列,從而直觀地反映出企業的財務狀況和經營成果的總體面貌。
杜邦財務分析體系如圖所示:
二、對杜邦圖的分析
1.圖中各財務指標之間的關系:
可以看出杜邦分析法實際上從兩個角度來分析財務,一是進行了內部管理因素分析,二是進行了資本結構和風險分析。
權益凈利率=資產凈利率×權益乘數
權益乘數=1÷(1-資產負債率)
資產凈利率=銷售凈利率×總資產周轉率
銷售凈利率=凈利潤÷銷售收入
總資產周轉率=銷售收入÷總資產
資產負債率=負債總額÷總資產
2.杜邦分析圖提供了下列主要的財務指標關系的信息:
(1)權益凈利率是一個綜合性最強的財務比率,是杜邦分析系統的核心。它反映所有者投入資本的獲利能力,同時反映企業籌資、投資、資產運營等活動的效率,它的高低取決於總資產利潤率和權益總資產率的水平。決定權益凈利率高低的因素有三個方面--權益乘數、銷售凈利率和總資產周轉率。權益乘數、銷售凈利率和總資產周轉率三個比率分別反映了企業的負債比率、盈利能力比率和資產管理比率。
(2)權益乘數主要受資產負債率影響。負債比率越大,權益乘數越高,說明企業有較高的負債程度,給企業帶來較多地杠桿利益,同時也給企業帶來了較多地風險。資產凈利率是一個綜合性的指標,同時受到銷售凈利率和資產周轉率的影響。
(3)資產凈利率也是一個重要的財務比率,綜合性也較強。它是銷售凈利率和總資產周轉率的乘積,因此,要進一步從銷售成果和資產營運兩方面來分析。
銷售凈利率反映了企業利潤總額與銷售收入的關系,從這個意義上看提高銷售凈利率是提高企業盈利能力的關鍵所在。要想提高銷售凈利率:一是要擴大銷售收入;二是降低成本費用。而降低各項成本費用開支是企業財務管理的一項重要內容。通過各項成本費用開支的列示,有利於企業進行成本費用的結構分析,加強成本控制,以便為尋求降低成本費用的途徑提供依據。
企業資產的營運能力,既關繫到企業的獲利能力,又關繫到企業的償債能力。一般而言,流動資產直接體現企業的償債能力和變現能力;非流動資產體現企業的經營規模和發展潛力。兩者之間應有一個合理的結構比率,如果企業持有的現金超過業務需要,就可能影響企業的獲利能力;如果企業佔用過多的存貨和應收賬款,則既要影響獲利能力,又要影響償債能力。為此,就要進一步分析各項資產的佔用數額和周轉速度。對流動資產應重點分析存貨是否有積壓現象、貨幣資金是否閑置、應收賬款中分析客戶的付款能力和有無壞賬的可能;對非流動資產應重點分析企業固定資產是否得到充分的利用。
三、利用杜邦分析法作實例分析
杜邦財務分析法可以解釋指標變動的原因和變動趨勢,以及為採取措施指明方向。下面以一家上市公司北汽福田汽車(600166)為例,說明杜邦分析法的運用。
福田汽車的基本財務數據如下表:
(一)對權益凈利率的分析
權益凈利率指標是衡量企業利用資產獲取利潤能力的指標。權益凈利率充分考慮了籌資方式對企業獲利能力的影響,因此它所反映的獲利能力是企業經營能力、財務決策和籌資方式等多種因素綜合作用的結果。
該公司的權益凈利率在2001年至2002年間出現了一定程度的好轉,分別從2001年的0.097增加至2002年的0.112.企業的投資者在很大程度上依據這個指標來判斷是否投資或是否轉讓股份,考察經營者業績和決定股利分配政策。這些指標對公司的管理者也至關重要。
公司經理們為改善財務決策而進行財務分析,他們可以將權益凈利率分解為權益乘數和資產凈利率,以找到問題產生的原因。
表三:權益凈利率分析表
福田汽車權益凈利率=權益乘數×資產凈利率
2001年0.097=3.049×0.032
2002年0.112=2.874×0.039
通過分解可以明顯地看出,該公司權益凈利率的變動在於資本結構(權益乘數)變動和資產利用效果(資產凈利率)變動兩方面共同作用的結果。而該公司的資產凈利率太低,顯示出很差的資產利用效果。
(二)分解分析過程:
權益凈利率=資產凈利率×權益乘數
2001年0.097=0.032×3.049
2002年0.112=0.039×2.874
經過分解表明,權益凈利率的改變是由於資本結構的改變(權益乘數下降),同時資產利用和成本控制出現變動(資產凈利率也有改變)。那麼,我們繼續對資產凈利率進行分解:
資產凈利率=銷售凈利率×總資產周轉率
2001年0.032=0.025×1.34
2002年0.039=0.017×2.29
通過分解可以看出2002年的總資產周轉率有所提高,說明資產的利用得到了比較好的控制,顯示出比前一年較好的效果,表明該公司利用其總資產產生銷售收入的效率在增加。總資產周轉率提高的同時銷售凈利率的減少阻礙了資產凈利率的增加,我們接著對銷售凈利率進行分解:
銷售凈利率=凈利潤÷銷售收入
2001年0.025=10284.04÷411224.01
2002年0.017=12653.92÷757613.81
該公司2002年大幅度提高了銷售收入,但是凈利潤的提高幅度卻很小,分析其原因是成本費用增多,從表一可知:全部成本從2001年403967.43萬元增加到2002年736747.24萬元,與銷售收入的增加幅度大致相當。下面是對全部成本進行的分解:
全部成本=製造成本+銷售費用+管理費用+財務費用
2001年403967.43=373534.53+10203.05+18667.77+1562.08
2002年736747.24=684559.91+21740.962+25718.20+5026.17通過分解可以看出杜邦分析法有效的解釋了指標變動的原因和趨勢,為採取應對措施指明了方向。
在本例中,導致權益利潤率小的主原因是全部成本過大。也正是因為全部成本的大幅度提高導致了凈利潤提高幅度不大,而銷售收入大幅度增加,就引起了銷售凈利率的減少,顯示出該公司銷售盈利能力的降低。資產凈利率的提高當歸功於總資產周轉率的提高,銷售凈利率的減少卻起到了阻礙的作用。
由表4可知,福田汽車下降的權益乘數,說明他們的資本結構在2001至2002年發生了變動2002年的權益乘數較2001年有所減小。權益乘數越小,企業負債程度越低,償還債務能力越強,財務風險程度越低。這個指標同時也反映了財務杠桿對利潤水平的影響。財務杠桿具有正反兩方面的作用。在收益較好的年度,它可以使股東獲得的潛在報酬增加,但股東要承擔因負債增加而引起的風險;在收益不好的年度,則可能使股東潛在的報酬下降。該公司的權益乘數一直處於2~5之間,也即負債率在50%~80%之間,屬於激進戰略型企業。管理者應該准確把握公司所處的環境,准確預測利潤,合理控制負債帶來的風險。
因此,對於福田汽車,當前最為重要的就是要努力減少各項成本,在控製成本上下力氣。同時要保持自己高的總資產周轉率。這樣,可以使銷售利潤率得到提高,進而使資產凈利率有大的提高。
四、結論
綜上所述,杜邦分析法以權益凈利率為主線,將企業在某一時期的銷售成果以及資產營運狀況全面聯系在一起,層層分解,逐步深入,構成一個完整的分析體系。它能較好的幫助管理者發現企業財務和經營管理中存在的問題,能夠為改善企業經營管理提供十分有價值的信息,因而得到普遍的認同並在實際工作中得到廣泛的應用。
但是杜邦分析法畢竟是財務分析方法的一種,作為一種綜合分析方法,並不排斥其他財務分析方法。相反與其他分析方法結合,不僅可以彌補自身的缺陷和不足,而且也彌補了其他方法的缺點,使得分析結果更完整、更科學。比如以杜邦分析為基礎,結合專項分析,進行一些後續分析對有關問題作更深更細致分析了解;也可結合比較分析法和趨勢分析法,將不同時期的杜邦分析結果進行對比趨勢化,從而形成動態分析,找出財務變化的規律,為預測、決策提供依據;或者與一些企業財務風險分析方法結合,進行必要的風險分析,也為管理者提供依據,所以這種結合,實質也是杜邦分析自身發展的需要。分析者在應用時,應注意這一點。
⑷ 什麼時候用回歸分析,什麼時候用時間序列
兩者的核心區別在於對數據的假設回歸分析假設每個數據點都是獨立的,而時間序列則是利用數據之間的相關性進行預測。
本文會先說明兩者對數據的具體假設差異,再說明AR模型為什麼雖然看上去像回歸分析但還是有差別,最後也提到一個常見的混淆兩者後在金融方向可能出現的問題。
回歸分析對數據的假設:獨立性在回歸分析中,我們假設數據是相互獨立的。這種獨立性體現在兩個方面:一方面,自變數(X)是固定的,已被觀測到的值,另一方面,每個因變數(y)的誤差項是獨立同分布,對於線性回歸模型來說,誤差項是獨立同分布的正態分布,並且滿足均值為0,方差恆定。
這種數據的獨立性的具體表現就是:在回歸分析中,數據順序可以任意交換。在建模的時候,你可以隨機選取數據循序進行模型訓練,也可以隨機選取一部分數據進行訓練集和驗證集的拆分。也正因為如此,在驗證集中,每個預測值的誤差都是相對恆定的:不會存在誤差的積累,導致預測准確度越來越低。
時間序列對數據的假設:相關性但對於時間序列分析而言,我們必須假設而且利用數據的相關性。核心的原因是我們沒有其他任何的外部數據,只能利用現有的數據走向來預測未來。因此,我們需要假設每個數據點之間有相關性,並且通過建模找到對應的相關性,利用它去預測未來的數據走向。這也是為什麼經典的時間序列分析(ARIMA)會用ACF(自相關系數)和PACF(偏自相關系數)來觀察數據之間的相關性。
ACF和PACF分別用兩種方式衡量數據點與數據點之間的相關性時間序列對相關性的假設直接違背了回歸分析的獨立性假設。在多段時間序列預測中,一方面,對於未來預測的自變數可能無法真實的觀察到,另一方面,隨著預測越來越遠,誤差會逐漸積累:你對於長遠未來的預測應該會比近期預測更不確定。因此,時間序列分析需要採用一種完全不同的視角,用不同的模型去進行分析研究。
AR模型和線性回歸模型的「相似」和區別時間序列分析中一個基礎模型就是AR(Auto-Regressive)模型。它利用過去的數據點來預測未來。舉例而言,AR(1)模型利用當前時刻的數據點預測未來的值,它們的數學關系可以被表示為:
它的表達形式的確和線性回歸模型非常類似,甚至連一般的AR(n)模型都和線性回歸有很高的相似性。唯一的差別就是等式右邊的自變數(X)變成了過去的因變數(y)
而正是因為這一點微小的差異,導致兩者的解完全不同。在AR模型中,由於模型自變數成為了過去的因變數,使得自變數與過去的誤差之間有相關性。而這種相關性使得
利用線性模型得到的AR模型的解會是有偏估計(biased)。對於上述結論的實際證明需要引入過多的概念。在此我們只對AR(1)模型作為一個特例來分析。不失一般性,我們可以通過平移數據將AR(1)模型表示成如下的形式:
對於這類模型,線性回歸會給出以下的估計值:對於一般的線性回歸模型而言,由於所有的自變數都會被視為已經觀測到的真實值。所以當我們取均值的時候,我們可以把分母當作已知,通過過去觀測值和未來誤差無關的性質得到無偏的結論。
利用回歸模型預測AR模型的數據模擬結果:參數估計會是有偏估計事實上,我們會用線性回歸模型去近似求解AR模型。因為雖然結果會是有偏的,但是卻是一致估計。也就是說,當數據量足夠大的時候,求解的值會收斂於真實值。這里就不再做展開了。
忽視獨立性的後果:金融方向的常見錯誤希望看到這里你已經弄懂了為什麼不能混淆模型的假設:尤其是獨立性或相關性的假設。接下來我會說一個我見過的
因為混淆假設導致的金融方向的錯誤隨著機器學習的發展,很多人希望能夠將機器學習和金融市場結合起來。利用數據建模來對股票價格進行預測。他們會用傳統的機器學習方法將得到的數據隨機的分配成訓練集和測試集。利用訓練集訓練模型去預測股票漲跌的概率(漲或跌的二維分類問題)。然後當他們去將模型應用到測試集時,他們發現模型的表現非常優秀——能夠達到80~90%的准確度。但是在實際應用中卻沒有這么好的表現。
造成這個錯誤的原因就是他們沒有認識到數據是高度相關的。對於時間序列,我們不能通過隨機分配去安排訓練集和測試集,否則就會出現「利用未來數據」來預測「過去走向」的問題。這個時候,即使你的模型在你的測試集表現出色,也不代表他真的能預測未來股價的走向。
總結時間序列和回歸分析的主要區別在於對數據的假設:回歸分析假設每個數據點都是獨立的,而時間序列則是利用數據之間的相關性進行預測。雖然線性回歸和AR模型看上去有很大的相似性。但由於缺失了獨立性,利用線性回歸求解的AR模型參數會是有偏的。但又由於這個解是一致的,所以在實際運用中還是利用線性回歸來近似AR模型。忽視或假設數據的獨立性很可能會造成模型的失效。金融市場的預測的建模尤其需要注意這一點。
⑸ 怎麼用excel對股票收盤價進行時間序列分析
最好附上內容
⑹ 如何用Arma模型做股票估計
時間序列分析是經濟領域應用研究最廣泛的工具之一,它用恰當的模型描述歷史數據隨時間變化的規律,並分析預測變數值。ARMA模型是一種最常見的重要時間序列模型,被廣泛應用到經濟領域預測中。給出ARMA模型的模式和實現方法,然後結合具體股票數據揭示股票變換的規律性,並運用ARMA模型對股票價格進行預測。
選取長江證券股票具體數據進行實證分析
1.數據選取。
由於時間序列模型往往需要大樣本,所以這里我選取長江證券從09/03/20到09/06/19日開盤價,前後約三個月,共計60個樣本,基本滿足ARMA建模要求。
數據來源:大智慧股票分析軟體導出的數據(股價趨勢圖如下)
從上圖可看出有一定的趨勢走向,應為非平穩過程,對其取對數lnS,再觀察其平穩性。
2.數據平穩性分析。
先用EVIEWS生成新序列lnS並用ADF檢驗其平穩性。
(1)ADF平穩性檢驗,首先直接對數據平穩檢驗,沒通過檢驗,即不平穩。
可以看出lnS沒有通過檢驗,也是一個非平穩過程,那麼我們想到要對其進行差分。
(2)一階差分後平穩性檢驗,ADF檢驗結果如下,通過1%的顯著檢驗,即數據一階差分後平穩。
可以看出差分後,明顯看出ADF Test Statistic 為-5.978381絕對值是大於1%的顯著水平下的臨界值的,所以可以通過平穩性檢驗。
3.確定適用模型,並定階。可以先生成原始數據的一階差分數據dls,並觀測其相關系數AC和偏自相關系數PAC,以確定其是為AR,MA或者是ARMA模型。
(1)先觀測一階差分數據dls的AC和PAC圖。經檢驗可以看出AC和PAC皆沒有明顯的截尾性,嘗試用ARMA模型,具體的滯後項p,q值還需用AIC和SC具體確定。
(2)嘗試不同模型,根據AIC和SC最小化的原理確定模型ARMA(p,q)。經多輪比較不同ARMA(p,q)模型,可以得出相對應AIC 和 SC的值。
經過多次比較最終發現ARMA(1,1)過程的AIC和SC都是最小的。最終選取ARIMA(1,1,1)模型作為預測模型。並得出此模型的具體表達式為:
DLS t = 0.9968020031 DLS (t-1)- 1.164830718 U (t-1) + U t
4.ARMA模型的檢驗。選取ARIMA(1,1,1)模型,定階和做參數估計後,還應對其殘差序列進行檢驗,對其殘差的AC和Q統計檢驗發現其殘差自相關基本在0附近,且Q值基本通過檢驗,殘差不明顯存在相關,即可認為殘差中沒有包含太多信息,模型擬合基本符合。
5.股價預測。利用以上得出的模型,然後對長江證券6月22日、23日、24日股價預測得出預測值並與實際值比較如下。
有一定的誤差,但相比前期的漲跌趨勢基本吻合,這里出現第一個誤差超出預想的是因為6月22日正好是禮拜一,波動較大,這里正驗證了有研究文章用GARCH方法得出的禮拜一波動大的結果。除了禮拜一的誤差大點,其他日期的誤差皆在接受范圍內。
綜上所述,ARMA模型較好的解決了非平穩時間序列的建模問題,可以在時間序列的預測方面有很好的表現。藉助EViews軟體,可以很方便地將ARMA模型應用於金融等時間序列問題的研究和預測方面,為決策者提供決策指導和幫助。當然,由於金融時間序列的復雜性,很好的模擬還需要更進一步的研究和探討。在後期,將繼續在這方面做出自己的摸索。
⑺ 數據挖掘相關問題
2.聚類結果{2,4,10,12,3,11}{20}{30,25}
3.移動平均結果
{10.83333333
10.33333333
11.16666667
10.33333333
11.83333333
12.5
10.83333333
11.33333333
10.5
11.33333333
9.833333333
9.166666667
}
4.預測股票價格的方法:時間序列方法
⑻ 時間序列預測方法有哪些分類,分別適合使用的情況是
時間序列預測方法根據對資料分析方法的不同,可分為:簡單序時平均數法、加權序時平均數法、移動平均法、加權移動平均法、趨勢預測法、指數平滑法、季節性趨勢預測法、市場壽命周期預測法等。
1、簡單序時平均數法只能適用於事物變化不大的趨勢預測。如果事物呈現某種上升或下降的趨勢,就不宜採用此法。
2、加權序時平均數法就是把各個時期的歷史數據按近期和遠期影響程度進行加權,求出平均值,作為下期預測值。
3、簡單移動平均法適用於近期期預測。當產品需求既不快速增長也不快速下降,且不存在季節性因素時,移動平均法能有效地消除預測中的隨機波動。
4、加權移動平均法即將簡單移動平均數進行加權計算。在確定權數時,近期觀察值的權數應該大些,遠期觀察值的權數應該小些。
5、指數平滑法即根用於中短期經濟發展趨勢預測,所有預測方法中,指數平滑是用得最多的一種。
6、季節趨勢預測法根據經濟事物每年重復出現的周期性季節變動指數,預測其季節性變動趨勢。
7、市場壽命周期預測法,適用於對耐用消費品的預測。這種方法簡單、直觀、易於掌握。
(8)時間序列預測股票價格方法擴展閱讀:
時間序列預測法的特徵
1、時間序列分析法是根據過去的變化趨勢預測未來的發展,前提是假定事物的過去延續到未來。運用過去的歷史數據,通過統計分析,進一步推測未來的發展趨勢。不會發生突然的跳躍變化,是以相對小的步伐前進;過去和當前的現象,可能表明現在和將來活動的發展變化趨向。
2.時間序列數據變動存在著規律性與不規律性
時間序列中的每個觀察值大小,是影響變化的各種不同因素在同一時刻發生作用的綜合結果。從這些影響因素發生作用的大小和方向變化的時間特性來看,這些因素造成的時間序列數據的變動分為四種類型:趨勢性、周期性、隨機性、綜合性。
⑼ 時間序列預測法的步驟有哪些
時間序列預測法的有以下幾個步驟。
第一步,收集歷史資料,加以整理,編成時間序列,並根據時間序列繪成統計圖。時間序列分析通常是把各種可能發生作用的因素進行分類,傳統的分類方法是按各種因素的特點或影響效果進行分類:
①長期趨勢;
②季節變動;
③循環變動;
④不規則變動。
第二步,分析時間序列。
時間序列中的每一時期的數值都是由許許多多不同的因素同時發生作用後的綜合結果。
第三步,求時間序列的長期趨勢(T)、季節變動(S)和不規則變動(I)的值,並選定近似的數學模式來代表它們。對於數學模式中的諸未知參數,使用合適的技術方法求出其值。
第四步,利用時間序列資料求出長期趨勢、季節變動和不規則變動的數學模型後,就可以利用它來預測未來的長期趨勢值T和季節變動值S,在可能的情況下預測不規則變動值I。然後用以下模式計算出未來的時間序列的預測值Y。
加法模式:T+S+I=Y乘法模式:T乘以S乘以I=Y
如果不規則變動的預測值難以求得,就只求長期趨勢和季節變動的預測值,以兩者相乘之積或相加之和為時間序列的預測值。如果經濟現象本身沒有季節變動或不需預測分季分月的資料,則長期趨勢的預測值就是時間序列的預測值,即T=Y。但要注意這個預測值只反映現象未來的發展趨勢,即使很准確的趨勢線在按時間順序的觀察方面所起的作用本質上也只是一個平均數的作用,實際值將圍繞著它上下波動。
⑽ 怎麼用機器學習模型做時間序列預測
SVM理論是在統計學習理論的基礎上發展起來的,由於統計學習理論和SVM方法對有限樣本情況下模式識別中的一些根本性的問題進行了系統的理論研究,很大程度上解決了以往的機器學習中模型的選擇與過學習問題、非線性和維數災難、局部極小點問題等。應用SVM進行回歸預測的步驟具體如下:
1)實驗規模的選取,決定訓練集的數量、測試集的數量,以及兩者的比例;2)預測參數的選取;3)對實驗數據進行規范化處理;4)核函數的確定;5)核函數參數的確定。其中參數的選擇對SVM的性能來說是十分重要的,對於本文的核函數使用RBF核函數,對於RBF核函數,SVM參數包括折衷參數C、核寬度C和不敏感參數E。目前SVM方法的參數、核函數的參數選擇,在國際上都還沒有形成統一的模式,也就是說最優SVM演算法參數選擇還只能是憑借經驗、實驗對比、大范圍的搜尋和交叉檢驗等進行尋優。實際應用中經常為了方便,主觀設定一個較小的正數作為E的取值,本文首先在C和C的一定范圍內取多個值來訓練,定下各個參數取值的大概范圍,然後利用留一法來具體選定參數值
股價時間序列的SVM模型最高階確定
股價數據是一個時間序列,從時間序列的特徵分析得知,股價具有時滯、後效性,當天的股價不僅還與當天各種特徵有關,還與前幾天的股價及特徵相關,所以有必要把前幾天的股價和特徵作為自變數來考慮。最高階確定基本原理是從低階開始對系統建模,然後逐步增加模型的階數,並用F檢驗對這些模型進行判別來確定最高階n,這樣才能更客觀反映股票價格的時滯特性。具體操作步驟如下:假定一多輸入單輸出回歸模型有N個樣本、一個因變數(股價)、m- 1個自變數(特徵),由低階到高階遞推地採用SVM模型去擬合系統(這兒的拓階就是把昨天股價當做自變數,對特徵同時拓階),並依次對相鄰兩個SVM模型採用F檢驗的方法判斷模型階次增加是否合適[ 7]。對相鄰兩模型SVM ( n)和SVM ( n+ 1)而言,有統計量Fi為:Fi=QSVR (n)- QSVR( n+1)QSVR (n)1N - m n - (m -1)mi =1,2,,, n(1)它服從自由度分別為m和(N - m n - (m -1) )的F分布,其中QSVR (n)和QSVR( n+1)分別為SVR ( n)和QSVR( n+1)的剩餘離差平方和,若Fi< F(?,m, N-m n- (m-1) ),則SVM (n )模型是合適的;反之,繼續拓展階數。
前向浮動特徵篩選
經過上述模型最高階數的確定後,雖然確定了階數為n的SVM模型,即n個特徵,但其中某些特徵對模型的預測精度有不利影響,本文採用基於SVM和留一法的前向浮動特徵特徵篩選演算法選擇對提高預測精度有利影響的特徵。令B= {xj: j=1,2,,, k}表示特徵全集, Am表示由B中的m個特徵組成的特徵子集,評價函數MSE (Am)和MSE (Ai) i =1,2,,, m -1的值都已知。本文採用的前向浮動特徵篩選演算法如下[9]:1)設置m =0, A0為空集,利用前向特徵篩選方法尋找兩個特徵組成特徵子集Am(m =2);2)使用前向特徵篩選方法從未選擇的特徵子集(B -Am)中選擇特徵xm +1,得到子集Am+1;3)如果迭代次數達到預設值則退出,否則執行4);4)選擇特徵子集Am+1中最不重要的特徵。如果xm+1是最不重要的特徵即對任意jXm +1, J (Am +1- xm+1)FJ(Am +1- xj)成立,那麼令m = m +1,返回2) (由於xm+1是最不重要的特徵,所以無需從Am中排除原有的特徵);如果最不重要的特徵是xr( r =1,2,,, m )且MSE (Am+1- xr) < MSE (Am)成立,排除xr,令A'm= Am+1- xr;如果m =2,設置Am= A'm,J (Am) = J (A'm), ,返回2),否則轉向步驟5);5)在特徵子集A'm中尋找最不重要的特徵xs,如果MSE (A'm- xs)EM SE (Am-1),那麼設置Am= A'm, MSE (Am)= MSE (A'm),返回2);如果M SE (A'm- xs) < M SE (Am -1),那麼A'm從中排除xs,得到A'm-1= Am- xs,令m = m -1;如果m =2,設置Am= A'm, MSE (Am) = MSE (A'm)返回2),否則轉向5)。最後選擇的特徵用於後續建模預測。
預測評價指標及參比模型
訓練結果評估階段是對訓練得出的模型推廣能力進行驗證,所謂推廣能力是指經訓練後的模型對未在訓練集中出現的樣本做出正確反應的能力。為了評價本文模型的優劣,選擇BPANN、多變數自回歸時間序列模型( CAR)和沒有進行拓階和特徵篩選的SVM作為參比模型。採用均方誤差(mean squared error, MSE)和平均絕對誤差百分率(mean ab-solute percentage error, MAPE)作為評價指標。MSE和MAP定義如下:M SE=E(yi- y^i)2n( 2)MAPE=E| yi- y^i| /yin( 3)其中yi為真值, y^i為預測值, n為預測樣本數。如果得出M SE, MAPE結果較小,則說明該評估模型的推廣能力強,或泛化能力強,否則就說明其推廣能力較差