近年來,隨著人工智能(AI)技術(shù)的飛速發(fā)展,量化投資領(lǐng)域正迎來新一輪深刻變革。
以生成式AI為代表的新一代模型興起,顛覆了傳統(tǒng)數(shù)據(jù)處理方式,促使基金公司加速探索AI的深度應(yīng)用。面對海量且復(fù)雜的金融市場數(shù)據(jù),算力資源分配與穩(wěn)定性也逐漸成為AI量化模型的制勝關(guān)鍵。
不過,盡管AI技術(shù)在量化投資領(lǐng)域展現(xiàn)出強大潛力,模型的“黑盒”特征以及相應(yīng)的可解釋性不足依然困擾著業(yè)界。多家機構(gòu)指出,AI模型要真正發(fā)揮作用,還需要提升模型的透明度與可解釋性。
量化投資邁入AI時代
近年來,AI技術(shù)的快速發(fā)展已引發(fā)量化投資領(lǐng)域的新一輪變革,尤其是生成式AI模型的出現(xiàn),使得數(shù)據(jù)應(yīng)用場景發(fā)生深刻變化,傳統(tǒng)的因子模式也面臨巨大的沖擊,中大型基金公司開始紛紛探索AI的深度應(yīng)用。
在接受券商中國記者采訪時,路博邁基金副總經(jīng)理、CIO兼基金經(jīng)理魏曉雪詳細(xì)闡述了人工智能技術(shù)在量化投資中的關(guān)鍵作用。在梳理量化策略模型的發(fā)展史時,魏曉雪介紹稱,量化1.0是簡單選股策略階段,以基本統(tǒng)計方法為主,使用簡單數(shù)學(xué)模型進(jìn)行投資分析,主要依賴于人工挖掘因子,波動控制具有一定的局限性。量化2.0是多因子模型階段,使用多因子模型捕捉線性信息,通過更多樣的數(shù)據(jù)集提高準(zhǔn)確性與穩(wěn)定性,缺點是人工依賴度高。量化3.0則是AI加高頻交易,使用AI機器學(xué)習(xí)算法識別和捕捉非線性的股票高頻特征,預(yù)測短期股票價格波動。不過,這一模型也有缺點,即因子衰減快,預(yù)測周期較短。
隨著DeepSeek正式落地,路博邁的量化3.5模型也在此基礎(chǔ)上應(yīng)運而生。其選股頻率為周度調(diào)整,這一高頻更新特征也是AI量化效率的重要體現(xiàn)。路博邁基金認(rèn)為,相較于傳統(tǒng)模型通常采用的月度調(diào)整機制,量化3.5通過更高頻次的動態(tài)調(diào)整,能夠更有效地捕捉短期市場機會,展現(xiàn)出更強的靈活性和適應(yīng)性。
浙商基金也表示,LLM模型被不斷優(yōu)化,極大地降低了文本數(shù)據(jù)的應(yīng)用難度,量化可以利用的文本數(shù)據(jù)呈指數(shù)級增加,量變引發(fā)質(zhì)變。日常實踐中,多模態(tài)、生成式大模型對于日常工作的輔助,對于認(rèn)知的重構(gòu)已經(jīng)非常顯著。未來,AI量化投資方法會不會有天翻地覆的變化,也值得期待。
浙商基金多年來也在AI賦能量化投資上深耕。通過內(nèi)部智能投研系統(tǒng)Lucy,投研團隊可以跟蹤分門別類的數(shù)據(jù),同時基于AI模型學(xué)習(xí)的結(jié)果以及主觀研究的經(jīng)驗,給出對應(yīng)的投資建議。這使得AI模型的輔助幾乎滲透到所有公司在管產(chǎn)品中,而投資經(jīng)理和研究員在主動研究時也會向AI模型尋求建議和幫助。
算力是AI量化投資的基石
AI技術(shù)在量化投資中的運用,與金融市場數(shù)據(jù)的爆炸式增長息息相關(guān)。在魏曉雪看來,在傳統(tǒng)的數(shù)據(jù)處理中,投資者主要依賴價格、成交量等結(jié)構(gòu)化數(shù)據(jù),而隨著信息技術(shù)的飛速發(fā)展,新聞、社交媒體、財報文本等非結(jié)構(gòu)化數(shù)據(jù)的涌現(xiàn),給投資分析帶來了巨大挑戰(zhàn)。AI技術(shù),特別是自然語言處理和圖像識別等技術(shù),能夠高效地處理和分析這些海量的多維度數(shù)據(jù),挖掘出傳統(tǒng)方法難以捕捉的信息。
目前,路博邁集團量化策略的管理規(guī)模已接近百億美元,覆蓋發(fā)達(dá)市場和新興市場的股票與債券。因此,算力成為支持策略運行的關(guān)鍵。魏曉雪透露,路博邁總部每天處理的數(shù)據(jù)量已達(dá)太字節(jié)(1024GB)級別,相關(guān)的數(shù)據(jù)處理經(jīng)驗?zāi)軌蛑С帜P透咝幚砗A繑?shù)據(jù),并進(jìn)行持續(xù)優(yōu)化。
銀河基金對DeepSeek-R1的觀察同樣證明了算力的重要性。1月20日,DeepSeek-R1正式發(fā)布并同步開源模型權(quán)重。然而,由于短期內(nèi)用戶需求的大量爆發(fā),造成了自有算力緊張,2月6日,該模型暫停了API服務(wù)充值。這也從側(cè)面說明,面對大規(guī)模用戶需求時,算力資源的分配與系統(tǒng)穩(wěn)定性成為制約AI模型發(fā)展的關(guān)鍵因素。
針對國產(chǎn)大模型目前面臨的算力穩(wěn)定性問題,銀河基金的基金經(jīng)理鄭巍山指出,國產(chǎn)算力的發(fā)展需要深入到基礎(chǔ)設(shè)施層面進(jìn)行分析。具體而言,算力層作為AI大模型迭代的載體,主要分為AI算力芯片、AI服務(wù)器和AI組網(wǎng)三個方面。
其中,AI算力芯片是AI算力的核心,需求有望率先擴張。當(dāng)前市場以GPU和ASIC芯片為主導(dǎo),盡管全球市場長期被海外廠商占據(jù),但國產(chǎn)廠商正在加速追趕并逐步縮小差距。
AI服務(wù)器則是算力的重要載體,有望在AI算力芯片的發(fā)展下進(jìn)一步擴張。市場需求將伴隨芯片發(fā)展而進(jìn)一步擴張,尤其是涉及GPU、印制電路板(PCB)、存儲等關(guān)鍵電子元器件領(lǐng)域的發(fā)展值得持續(xù)關(guān)注。
最后,AI服務(wù)器通過通信連接實現(xiàn)大規(guī)模AI組網(wǎng)集群,用來支持超大參數(shù)的大模型訓(xùn)練,也就是AI組網(wǎng)。組網(wǎng)規(guī)模的持續(xù)擴大將直接推動光模塊、銅纜連接、交換機等設(shè)備需求的增長。
AI量化需突破“黑盒”困境
雖然當(dāng)前AI技術(shù)為量化投資帶來了諸多突破,但在多家機構(gòu)看來,現(xiàn)階段模型仍是偏“黑盒”的特征,可解釋性較弱,制約了其在金融領(lǐng)域的進(jìn)一步深入應(yīng)用。
浙商基金指出,當(dāng)下端到端賦能投資的AI模型、機器學(xué)習(xí)模型還是仍是通過堆砌大量數(shù)據(jù)和構(gòu)造比較復(fù)雜的模型去輸出結(jié)果。這樣,一方面可解釋性不高,可能不適應(yīng)金融場景,另一方面可能存在模型過擬合的問題。
尤其在生成式模型爆發(fā)后,模型在研報閱讀、財報梳理、簡單的代碼生成等方面具有強大優(yōu)勢,但生成式模型的發(fā)散思考能力又與傳統(tǒng)量化的偏確定性投資建議存在沖突。這意味著,雖然生成式模型的應(yīng)用顯著提高了可解釋性,但也帶來了可追溯性降低的問題。
對此,浙商基金認(rèn)為,未來AI量化投資的發(fā)展方向應(yīng)當(dāng)還是以多模態(tài)的生成式模型為主,為了追求可驗證的投資能力,需要部分約束生成式模型的發(fā)散能力,提升更為準(zhǔn)確的歷史先驗知識的占比,加強與人類智慧的合作,讓AI模型真正讀懂人類的需求,特別是投資領(lǐng)域的需求。
滬上一位公募研究人士向券商中國記者表示,盡管AI技術(shù)在量化投資中的應(yīng)用為市場預(yù)測、風(fēng)險控制和策略優(yōu)化提供了許多創(chuàng)新途徑,但也存在不少局限性。首先,金融市場數(shù)據(jù)通常存在噪聲較多、非平穩(wěn)性強的問題。AI模型容易過度擬合歷史數(shù)據(jù)中的異常情況,降低了預(yù)測的可靠性。此外,歷史數(shù)據(jù)中的隨機因素和特定時期的極端事件也可能被模型誤讀,導(dǎo)致實際市場表現(xiàn)不及預(yù)期。
與此同時,模型所假設(shè)的理想市場條件與現(xiàn)實交易環(huán)境存在較大差距,頻繁的交易可能帶來顯著的交易成本、滑點及流動性風(fēng)險,進(jìn)一步影響策略的實際效果。此外,由于金融市場易受政治、經(jīng)濟以及心理因素的多重干擾,突發(fā)的“黑天鵝”事件通常超出模型的預(yù)測能力,這也意味著純粹依靠歷史數(shù)據(jù)訓(xùn)練的模型在面對極端市場狀況時可能表現(xiàn)欠佳。
排版:王璐璐
校對:蘇煥文??