當前位置:
首頁 > 最新 > 安信證券–機器學習與量化投資:避不開的那些事

安信證券–機器學習與量化投資:避不開的那些事

研報簡介

本文為研報解讀系列第3

研報標題:機器學習與量化投資:避不開的那些事

發布時間:2018年2月、3月

券商:安信證券

作者:楊勇、周袤等人

策略類型:金融工程主題報告

系列專題:機器學習與量化投資專題1至3

推薦理由

在投資交易方面,人工智慧最便捷的科學應用領域就是量化交易。目前,國內的量化投資還基本等同於多因子模型的狀態,多因子模型來源於Barra結構化風險模型,導致的普遍現象是,在各個不同的量化投資之間,模型框架是一致的,不一致的是選股因子。

值得慶幸的是,國內一些私募基金已經開始將人工智慧的三個子領域:機器學習、自然語言處理、知識圖譜,融入到自己的策略中,並嘗試獲取收益。本期推薦的系列報告以「機器學習與量化投資」為話題,從機器學習的演算法、交易策略,甚至機器學習在量化投資的機遇與挑戰等方面,進行深入探討,相信讀者讀完之後能夠對機器學習和量化投資這兩者的聯繫形成一個嶄新的認識,將激發出的新思路融入到自己的模型中去。

內容概要

這裡的內容概要將推薦的本期系列報告進行了再整理和濃縮,力圖使陳述出的邏輯更清晰、更合理,更多的詳細內容可以參考原文(索引參考,報告1關鍵詞:神經網路;報告2關鍵詞:機器學習;報告3關鍵詞:商品策略)。

首先,本系列報告介紹的主要機器學習演算法有深度神經網路(DeepNeural Network,以下簡稱DNN)和隨機森林(Random Forest):

深度神經網路是深度學習的基礎,從神經網路技術起源說起,擁有輸入層、輸出層和一個隱含層的感知機(perceptron)將輸入的特徵向量通過隱含層變換達到輸出層,在輸出層得到分類結果,之後引入多個隱含層形成了多層感知機(multilayerperceptron),多層感知機擺脫了早期離散傳輸函數的束縛,使用Sigmoid或tanh等連續函數模擬神經元對激勵的響應,利用預訓練方法緩解局部最優解問題後,提升隱含層的神經網路就是深度神經網路(見圖1)。

圖1:DNN的基本結構

隨機森林屬於集成學習,可以視為是Bagging(套袋法)在決策樹上的運用。機器學習中決策樹主要用於分類和回歸,樹中的每一個節點表示某一特徵的判斷條件,其分支表示符合節點條件的對象。葉子節點表示對象所屬的預測結果。隨機森林則由許多決策樹構成,每棵決策都由隨機的部分樣本的部分特徵進行訓練,它只接受了部分的訓練數據,因此每棵決策樹都是一個弱學習器。然後,通過Bagging所有的弱學習器--決策樹,比如投票(分類問題)或者取均值(回歸問題),得到一個強學習器--隨機森林(見圖2)。

圖2:Bagging的原理

另外,本系列報告中機器學習相關演算法的衍生討論在此不再敖述。

其次,由於篇幅有限,此處主要介紹了本系列報告中的兩個交易策略。

以大盤為策略標的:

運用標準神經網路回歸對過去的模式進行識別,並預測未來。也即,用當前實時數據與過去所有數據進行模式匹配,若過去模式顯示會大概率上漲下跌,則相應做多做空,否則不做操作。數據源來自天軟、萬得,主要是中證500指數,滬深300指數,以及對應的期貨主力合約,時間跨度為:2007年1月至2017年1月,整體策略表現如下。

以大宗商品為策略標的:

本商品策略通過機器學習對未來一周的走勢進行預測,判斷不同商品(焦炭、白糖、鐵礦石、玻璃、焦炭、動力煤、螺紋鋼)的大概率的多空方向。若觸及多頭閥值,則下多單,若觸及空頭閥值,則下空單,否則沒有倉位。每周周末計算信號,周初第一天以時間加權平均價格(TWAP)調倉。取2011年1月至2017年1月間的日交易數據為研究對象,整體策略表現如下。

最後,與傳統的線性模型相比,以上引入機器學習後的策略表現較好,年化收益有所提升。

研報索取


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器學習 的精彩文章:

「Google機器學習速成課程」您看了嗎?
全球互聯、5G、機器學習……從2018美國衛星大會看衛星行業的格局還會怎麼變

TAG:機器學習 |