全市場都下跌了,這套LLM智能體選出的策略累計收益超50%,重點是代碼開源!
1. 背景
在量化交易領域,Alpha因子挖掘是核心焦點之一:探索和提煉那些能夠預測資產收益的預測信號。
圖片
尤金·法瑪提出了有效市場假說(Efficient Market Hypothesis,EMH),指出股票價格是所有市場可用信息的反映,股票價格應當全面反映市場內所有可獲取的信息。
隨著研究的深入,當前 Alpha 挖掘過程存在三大主要挑戰:
-(1)傳統方法的僵化性:金融領域中識別 Alpha 因子的傳統方法往往依賴于啟發式規則和金融專業知識。這些基于規則的方法通常僅在特定市場條件下表現出色,缺乏適應不同市場動態的靈活性。
-(2)數據的多樣性與整合:近期研究探索了運用機器學習技術從諸如經濟新聞、社交媒體趨勢和歷史價格走勢等多樣數據源中挖掘 Alpha 因子。
-(3)對市場變化的適應性:市場動態變幻莫測,在一種環境中表現良好的策略在另一種環境中可能失效。
近年來,運用深度學習方法來預測市場并形成策略逐漸成為主流。在不同市場條件下有效地挖掘和利用 Alpha 因子仍是一項重大議題。
為解決這一問題,作者提出了一個新框架,借助大型語言模型(LLMs)的能力來進行 Alpha 挖掘和策略優化。
2. 實現思路
作者提出的新框架,目前已經作為開源代碼發布在:??https://anonymous.4open.science/r/Automate-Strategy-Finding-with-LLM-in-Quant-investment-ADA2/??
圖片
如上圖所示,新框架由三個核心組件構成:
?種子阿爾法工廠(Seed Alphas Factory):利用大型語言模型(LLMs)來過濾和分類多模態數據,從而構建出強大的種子Alpha集合。
?多智能體決策流程(Multi-Agent Decision-Making Process):運用多模態多智能體決策流程。多智能體方式能夠納入不同的風險觀點,增強策略在不同市場條件下的適應性和穩健性。此階段產生的成果是生成適合當前市場狀態和風險偏好的Alpha因子列表。
?權重優化方式(Weight Optimization Approach):通過深度神經網絡(DNN)優化所選阿爾法的權重以預測未來收益,為動態且適應性強的投資策略奠定基礎。
2.1 種子阿爾法工廠:LLM 過濾與分類
利用大型語言模型(LLMs)的總結和分類能力,加速對近期阿爾法挖掘研究的理解,并為進一步發展構種子阿爾法工廠。
使用了名為“Alpha Grail”的 ChatGPT 定制版本來執行 LLM 過濾和分類任務。Alpha Grail 的主要作用是通過處理與阿爾法相關的研究文檔,協助量化研究人員構建種子阿爾法工廠。
給 Alpha Grail 的具體指令是:
總結文檔信息,幫助量化研究人員依照傳統金融類別構建種子阿爾法工廠,確保每個類別的種子阿爾法相互獨立。
圖片
作者提供了 11 份 阿爾法挖掘 研究不同背景的文檔,具體文檔如上圖。通過這些文檔,Alpha Grail 生成了9個列別 100 個種子 Alpha 因子(如下圖),如動量、均值回歸、波動率和基本面分析。
圖片
圖片
圖片
LLM 過濾與分類階段也融合了多模態處理能力。通過納入研究文檔中的文本、圖像、表格和圖形等多模態數據源,LLM 能夠對種子阿爾法進行更全面的分析和分類。多模態方法增強了 LLM 捕捉研究中復雜細節和關系的能力,有利于生成更強大和多樣化的種子Alpha因子庫。
2.2 多模態和多智能體評估Alpha因子集
通過多模態和多智能體系統對阿爾法因子進行全面評估和篩選。通過整合不同的數據源并利用多個分析視角,確保對種子阿爾法進行多元化和深入的評估。
使用了包含文本、數字、視覺和多媒體輸入的多模態數據,使得整個評估過程更為豐富和全面。通過整合這些不同的數據類型,能夠全面了解市場狀況和阿爾法因子的表現。
圖片
上表列出了評估框架中使用的五種數據類型。這種整體性方法有助于對市場動態進行細致的理解,并增強評估過程的穩健性。
多智能體系統由各種智能體組成,每個智能體都具有不同的風險偏好和投資策略。
智能體主要任務包括:
? 分析多模態數據,并依據各自的標準評估種子阿爾法。
? 進行風險偏好分析,根據其預定義的風險參數評估種子阿爾法。
? 選擇符合其風險偏好和市場分析的阿爾法因子,確保在不同市場情形下的相關性和穩健性。
為了提高所選阿爾法因子的可靠性,實施了置信度評分機制。每個智能體根據其分析和歷史表現為阿爾法因子分配置信度分數,反映智能體對阿爾法因子預測能力和穩健性的評估。
所選的阿爾法因子運用歷史市場數據進行嚴格的回測,以評估它們在各種市場條件下的表現。對于確定最終策略中最具潛力的阿爾法因子至關重要。
關鍵評估指標包括信息系數(IC)和夏普比率等性能指標。每個類別的種子阿爾法因子必須達到特定的置信度分數閾值才能被納入最終選擇,以確保只選取最可靠和穩健的阿爾法因子。
為了實現選擇過程的自動化,設計了基于類別的阿爾法選擇算法。該算法依據置信度分數從不同類別中識別和挑選阿爾法。輸入包括多個類別,每個類別包含一組阿爾法和一個置信度閾值。算法從一個空的選定阿爾法集合開始,并遍歷每個類別,使用 SelectBestAlphas 函數確定最有前景的候選者。評估每個阿爾法的置信度分數,超過閾值的被納入最終集合。
這個過程對所有類別重復進行,確保從所有類別中嚴格挑選出符合置信度標準的阿爾法。最終輸出是一組成功通過置信度評估的選定阿爾法。
2.3 最優權重阿爾法策略
為優化所選種子阿爾法的權重,運用深度神經網絡(DNN)將阿爾法值擬合至未來收益。
網絡架構包含三層:輸入層、隱藏層和輸出層。
? 輸入層將從歷史收盤價得出的每日阿爾法計算作為輸入特征。
? 隱藏層配備了十個節點,采用 ReLU 激活函數引入非線性并增強模型的學習能力。
? 輸出層由單個節點構成,用于預測未來收益。
為確保模型的泛化能力并防止過擬合,使用了單獨的驗證集。
構建了一個基于歷史阿爾法值預測未來收益的強大框架,從而形成有效的投資策略。DNN 模型通過隱藏層處理輸入數據,利用學習到的權重和偏差進行轉換。最終輸出通過在輸出層應用另一組權重、偏差和激活函數生成。
3. 效果評估
RQ1:該框架能否根據市場條件差異捕獲新的阿爾法?
圖片
作者提出了一種提示架構(如上圖),將多模態市場信息融入大型語言模型(LLM),以達成多模態知識提取,并在不同的市場條件下選取最優的種子阿爾法。
通過整合來自金融新聞情緒的文本數據、公司財務報表的數值數據和交易圖表的視覺數據,新框架提供了全面的股票分析。這種數據融合確保了全面的市場觀點,增強了決策能力。上下文分析依照市場趨勢和行業表現調整參數,確保相關且準確的阿爾法選擇。實驗證實了該框架在不同市場條件下進行多模態知識提取和動態阿爾法選擇的有效性。
圖片
如上圖,在案例 1 中,運用 2021 年 12 月 31 日至 2022 年 9 月 30 日的上證 50 公司公告、財務報表、K 線圖和交易圖表,所選的阿爾法包含動量和基于成交量的指標,如價格動量、相對強弱指標(RSI)、平滑異同移動平均線(MACD)、移動平均線、布林帶、成交量、市值和每股收益調整。
在案例 2 中,著重于增量更新的上證 50 相關新聞、股票評論和中國宏觀經濟指數,所選的阿爾法強調了波動性和經濟因素,包括平均真實波動幅度(ATR)、布林帶比率、帶延遲的基于成交量的指標、毛利潤和營業收入比率以及高低價格比較。
表明通過整合不同的數據源并采用先進的分析模型捕捉新的投資機會。這種動態方式確保所選的阿爾法與當前市場條件相關并做出響應,增強了投資策略的穩健性和有效性。
RQ2:由LLM驅動的Alpha因子挖掘框架是否優于現有框架?
在評估所選種子阿爾法信號的性能時,主要指標是信息系數(IC,Information Coefficient)。這些指標可以用來衡量阿爾法值對未來回報的預測能力。
信息系數(IC)衡量預測的Alpha值與實際未來回報之間的相關性。通過皮爾遜相關系數進行量化,該系數評估兩個變量之間的線性關系。較高的 IC 表明更強的預測關系,意味著阿爾法值在預測回報方面更有效。
評估了四個最常見的阿爾法類別:動量、均值回歸、波動性、基本面和增長。
圖片
上圖展示了每個類別的平均 IC 值。結果表明,由大語言模型驅動的框架在所有類別中始終取得了更高的平均 IC 值,特別是在波動性和基本面方面,表明與傳統框架相比具有更出色的交易有效性。
RQ3:新框架選出的策略能否持續跑贏市場?
圖片
上表展示由新框架生成的 12 個阿爾法的示例組合,在上證 50 成分股進行評估。
權重組合 IC 值頗高,為-0.0587。盡管部分種子阿爾法單獨的 IC 值相對較低,但將其移除會致使重新訓練的組合權重顯著降低,表明它們在整體性能中起著關鍵作用。
例如,如果移除阿爾法#6,權重組合將降至-0.055;一旦移除阿爾法#11,權重組合將僅為 0.0491。表明由大型語言模型選取的種子阿爾法集有效地協同運作,提供了強大的預測能力。
為了回答新框架能否持續跑遠市場這個問題,作者在 2023 年 1 月 1 日至 2023 年 12 月 31 日期間,在上證 50 數據集上運用了一種簡易的投資方法進行了回測。
根據股票的阿爾法值進行排序,挑選表現最優的股票進行投資。在選定的股票中均勻分配資金,為降低交易成本,每天的交易數量限制在5只以內。
圖片
在實驗中,設定每日選股上限為13只,交易上限為5只。測試期間各策略凈值的變化如上圖所示。盡管并未專門追求絕對收益的最大化,但在回測中卻展現出了卓越的表現,相較于其他方法,實現了最高的盈利。
2023年的回測結果顯示,累計回報率達到了53.17%,與此同時,指數下跌了11.73%,EFund下跌了9.17%,Boshi Fund下跌了8.81%。還將新框架與其他阿爾法挖掘方法進行了對比,結果表明,新框架在市場中能夠獲得最大的利潤。
本文轉載自??大語言模型論文跟蹤??,作者:HuggingAGI
