基于SVM和多特征融合的滬銅期貨價格預測分析論文
基于SVM和多特征融合的滬銅期貨價格預測分析論文
期貨(Futures)與現貨完全不同,現貨是實實在在可以交易的貨(商品),期貨主要不是貨,而是以某種大眾產品如棉花、大豆、石油等及金融資產如股票、債券等為標的標準化可交易合約。因此,這個標的物可以是某種商品(例如黃金、原油、農產品),也可以是金融工具。以下是學習啦小編今天為大家精心準備的:基于SVM和多特征融合的滬銅期貨價格預測分析相關論文。內容僅供參考閱讀,希望大家能夠喜歡。
基于SVM和多特征融合的滬銅期貨價格預測分析全文如下:
一、研究背景和目的
銅是人類最早發(fā)現的金屬之一,被廣泛應用到電氣電子工業(yè)、機械制造、化學工業(yè)、建筑工業(yè)、醫(yī)學和國防工業(yè)等。在中國,銅在有色金屬材料的消費量近次于鋁。隨著我國經濟快速穩(wěn)步發(fā)展,已成為全球銅消費最大的國家。我國作為銅資源相對短缺國家,每年需進口大量銅礦。但由于銅市的價格波動,對消費者、生產與經營者的利益造成了重大影響。因此,通過研究銅期貨價格規(guī)律,可以一定程度上規(guī)避價格風險,穩(wěn)定經濟健康發(fā)展。
本文研究的內容是基于SVM統計機器學習方法,融合宏觀經濟因素、銅現貨、LME銅期貨價格和美元匯率來研究上海銅期貨價格預測。
二、相關工作介紹
目前國內學者對于滬銅期貨價格研究關注于兩個方面:一是研究國外期銅和上海期銅價格的相關關系;二是研究上海銅現貨價格與上海期銅價格的相關關系。
蔣序標[1]研究倫敦金屬交易所(LME)和上海期貨交易所(SHFE)期貨銅的價格引導關系。其結論為倫敦銅期貨價格只單向滯后引導滬銅期貨價格, 滬銅期貨對于倫敦銅期貨價格無滯后價格引導關系。芮執(zhí)多[2]將SHFE、LME和紐約商業(yè)交易所(COMEX)中銅期貨價格聯動關系做了動態(tài)分析。其結論為LME的銅期貨定價能力最強,而SHFE也具有了一定的國際影響力。
田新民[3]通過協整方法及因果關系分析研究滬銅與倫銅的價格引導關系,得出倫敦金融交易所銅期貨價格對于上海期貨交易所的銅期貨價格具有主導作用的結論。同時,SHFE的銅期貨價格的影響力也在增強。劉勃[4]通過協整與向量自回歸方法,研究倫敦金屬交易所期銅、上海期貨交易所期銅和上海銅現貨價格之間的關系。
實證顯示,上述三者因素具有長期均衡關系,并且倫敦期銅價格具有主導價格發(fā)現作用。趙亮[5]通過Granger協整分析,得出滬銅期貨與倫敦銅期貨價格具有協整關系,并且滬銅期貨價格對于倫敦銅期貨價格具有一定的影響作用。王淑嫻[6]通過分析倫敦銅期貨價格、上海鋁期貨價格、燃油期貨價格和江西銅業(yè)股票價格,得出滬銅價格的主要影響因素是倫敦銅期貨價格的結論。方燕[7]通過對滬銅期貨價格與現貨價格的實證分析,得出滬銅期貨價格與現貨價格在長期與短期具有不同的影響系數。顧浩[8]通過實證方法,分析得出滬銅期貨與現貨價格存在協整關系,并研究了存在協整關系的原因。
三、本文工作介紹
本文通過SVM統計機器學習方法,融合宏觀經濟因素(包括居民消費者價格指數(CPI)、工業(yè)品出產價格指數(PPI)、采購經理人指數(PMI)、城鎮(zhèn)固定資產投資、工業(yè)增加值增長、貨幣供應量、海關進出口增減情況、全國股票交易統計和新增信貸數據)、銅現貨價格、LME銅期貨價格和美元匯率多特征因素,分析預測上海銅期貨價格變動。
數據采用上海期貨交易所銅期貨合約cu1402在2013年2月19日至2013年12月30日的交易數據,其包括每日的開盤價、最高價、最低價、收盤價、結算價、成交量、成交金額等。銅現貨價格采用同期上海期貨交易所滬銅連續(xù)交易數據,其包括每日開盤價、最高價、最低價、收盤價和成交量。
宏觀經濟因素采用同期數據包括居民消費者價格指數(全國、城鎮(zhèn)、農村的當月、同比增長、環(huán)比增長和累計增長)、工業(yè)品出產價格指數(當月、當月同比增長和累計)、采購經理人指數(制造業(yè)、非制造業(yè)的指數、同比增長)、城鎮(zhèn)固定資產投資(當月、同比增長、環(huán)比增長、自年初累計)、工業(yè)增加值增長(同比增長和累計增長)、貨幣供應量(流通中的現金M0、貨幣M1、貨幣和準貨幣M2的數量、同比增長和環(huán)比增長)、海關進出口增減情況一覽表(當月出口、當月進口、累計出口和累計進口的金額、同比增長和環(huán)比增長)、全國股票交易(上海、深圳的發(fā)行總股本、市價總值、成交金額、成交量、A股最高綜合股指指數和A股最低綜合股價指數)和新增信貸數據(當月、同比增長、環(huán)比增長和累計)。
LME銅期貨數據采用同期數據包括當日的開盤價、收盤價、最高價、最低價和成交量。美元匯率采用同期數據包括當日的收盤價、開盤價、最高價、最低價和百分比變化。模型輸入數據包括以上特征,輸出數據為預測下一日的開盤價、最高價、最低價和收盤價。
支持向量機(support vector machines,SVM)是一種二類分類模型。其基本模型是定義在特征空間上的間隔最大的線性分類器。因此,支持向量機的學習策略就是間隔最大化,可看作是一個求解凸二次規(guī)劃的問題。支持向量機包括線性可分支持向量機、線性支持向量機和非線性支持向量機。
本文采用非線性支持向量機,使用核技巧和軟間隔最大化來學習模型。其中,核函數在當輸入空間為歐式空間、特征空間為希爾伯特空間時,表示從輸入空間映射到特征空間得到的特征向量間的內積。因此,通過使用核函數將輸入空間中的非線性分類問題轉換為在高維特征空間學習線性分類問題。
四、模型結果
采用SVM方法訓練測試模型,其中輸入的多特征包括當日滬期銅合約cu1402數據、宏觀經濟數據、銅現貨價格、LME銅期貨價格和美元匯率,預測下一天滬期銅合約cu1402的開盤價、最高價、最低價和收盤價。
從預測結果可以看出,在向前預測25天之內的滬銅價格時,累計平均誤差最小,在500元~600元之間。以25天為分界線,預測超過25天滬銅價格時,隨著時間推移累計平均誤差不斷變大。其原因有兩點:一是時間推移,各種條件已發(fā)生變化,因此訓練的模型的預測有效降低;二是銅期貨合約后期成交量變化和成交金額會變化較大,由于滬期銅在后期之后交易波動變大,訓練模型的有效性較低。
也得知預測25天內,價格累計平均誤差隨著時間推移,不斷減小。其原因是在較小一段時間內,隨著時間推移,輸入的特征因素對于未來期銅的價格的累計誤差減小。從開盤價、收盤價、最高價和最低價預測上看,都存在一個大約向前25天左右的累計平均誤差最小。因此,此模型在使用時,可基于未來25天預測情況進行投資,實現累計平均誤差最小,也即風險最小。
五、輸入特征重要性分析
利用logistic回歸方法,分析影響開盤價、最高價、最低價和收盤價預測準確度的輸入特征。
重要的輸入特征為滬銅期貨歷史每日開盤價、最高價、最低價、收盤價、結算價、漲跌1(收盤價-前一日結算價)、漲跌2(結算價-前一日結算價)、成交量、成交金額和持倉量,居民消費者價格指數,工業(yè)品出廠價格指數的當月和當月同比增長,采購經理人指數,城鎮(zhèn)固定資產投資同比增長,貨幣供應量M2的同比增長,深圳股票交易所發(fā)行總股本和成交量,上海交易所最高和最低的綜合股價指數,當月新增信貸數據,滬銅現貨歷史每日收盤價、開盤價、最高價和最低價,LME銅期貨歷史每日收盤價、開盤價、最高價、最低價和成交量,美元匯率的歷史每日收盤價、開盤價、最高價和百分比變化。
六、下一步工作
需要進一步降低價格預測的誤差,一方面可以選擇更多輸入特征,另一方面使用更有效的算法。另外,可以考慮如何將此模型融入到實際交易策略中,來輔助交易判斷。(作者單位:對外經濟貿易大學金融學院)