投研應用從人力密集到 AI 增強(2)

分享

投研應用從人力密集到 AI 增強(2)

 

更進一步的應用,是利用機器學習做「異常檢測」。在足夠大的樣本下,模型可以學習一家公司在不同景氣階段的「正常財務行為」模式,一旦新報表出現與既有模式明顯不一致的情況(例如收入增速大幅飆升,但現金流並未跟上;或費用率突然出現「整齊」下滑),系統便會自動標記為「需要人工關注的點」。這類工具對於識別財務風險、會計調整甚至潛在造假,都有一定輔助價值。

 

當然,AI並不能取代專業的會計判斷。例如會計政策變更、一次性資產減值、並購重組等事件往往需要結合管理層披露與行業背景才能正確理解。AI在這裡扮演的,更像是一位「極度勤奮、不會疲勞的高級研究助理」:它可以幫你把十年財報、數十家公司、上百個指標全部算好、畫圖好,但怎麼解讀這些數字,仍然需要人類分析師結合理論、經驗與直覺來做最後判斷。

 

非結構化文字變成可回測的數據

 

如果說財報是「結構化數字的世界」,那麼投資研究中更棘手的,其實是大量非結構化文本:董事會聲明、管理層討論與分析(MD&A)、業績會議紀要、券商報告、新聞稿、監管文件,乃至社交媒體與論壇上的討論。這些內容往往包含最關鍵的前瞻信息與語氣變化,但過去很難被系統化利用。自然語言處理(NLP)的進步,正在改變這一點。

 

一方面,NLP可以對文本做語意理解與標註,將文本拆解為可以量化和統計的特徵。例如,對公司業績會議紀要進行情緒分析,衡量管理層在談及收入、成本、需求、競爭時使用正向或負向詞語的頻率和強度,並追蹤這些情緒指標與未來盈利表現之間的關聯。已有學術研究利用NLP對對沖基金經理的評論文本構建「基金情緒指標」,發現情緒變化與基金收益和景氣循環之間存在顯著關聯。

 

另一方面,NLP也讓「跨語言研究」變得更可行。以前,全球投資者要覆蓋多個語言市場,需要配置不同語言背景的分析師,如今,多語言大模型可以在同一框架下處理中文、英文、日文等文本,將其統一投射到共同的語意空間。這意味著,投資機構在做跨市場比較時,能夠用相似標準對不同語言的公司披露與新聞內容進行打分與排序,降低了語言壁壘。

 

更重要的是,NLP與「替代數據」(alternative data)的結合,使得原本難以利用的資訊來源成為可回測的因子。根據機構調查,大約50%的機構投資者認為 NLP 與情緒相關數據,是未來最具潛在超額收益的替代數據類型之一。這不僅包括傳統財經新聞的語氣分析,也涵蓋社交媒體「聲量」、企業招聘廣告文本、產品評論甚至政策文件的措辭變化。對量化研究者而言,這些曾經被稱為「軟信息」的內容,如今可以被轉化為可量化、可回測的硬指標。

 

內容支持: 華通證券國際(WTF.US)

 

 

分享