某派
量化投資入門系列
下載 App
因子投資:方法與實踐 封面

因子投資:方法與實踐

流派 · 量化投資
大師 · 入門系列
聽 56 分鐘解讀 · 讀約 11,743 字精讀
在某派 App 聽音訊解讀
一句話定位 把因子投資從學術公式變成可操作的A股實戰體系

這篇講什麼

中文世界第一本系統講多因子投資的實操教材。從學術研究到 A 股實證,把因子從 Fama-French 三因子講到 Smart Beta,既嚴謹也接地氣。

一九九二年,兩個經濟學家發表了一篇論文,把此前四十年的主流投資理論打了個措手不及。他們用近三十年的真實資料說明:你以為能解釋股票漲跌的那個公式,其實解釋不了什麼。這件事的影響遠不止學術圈——它直接催生了今天規模以萬億美元計的「因子投資」行業,從量化基金到你在券商App裡看到的Smart Beta ETF,背後都是同一套邏輯。但大多數人對這套邏輯的瞭解,停留在「聽說過」三個字。這本書想做的事,是把這套邏輯從頭捋清楚:因子到底是什麼?它為什麼能賺錢,賺的是誰的錢?在A股這個和美股氣質截然不同的市場裡,它還管用嗎?什麼時候會失效?讀完你會發現,因子投資既不是什麼神秘的黑箱,也不是穩賺不賠的公式——它是一種有邊界、有代價、需要真正理解才能用的思維方式。

誰該讀這一篇

本篇 6 個核心觀點

試聽第一章音訊解讀

第 1 章 · 什麼是因子:從 CAPM 到 Fama-French
知性男聲 · 約 14 分鐘
App 內還有 220+ 大師案例都已配音訊解讀 下載 App 繼續聽 →

精讀全文

第 1 章 · 什麼是因子:從 CAPM 到 Fama-French

如果有人告訴你,股市裡的賺錢機會,其實是有規律可循的——你信嗎?幾十年來,全球最聰明的一批人,用資料、用模型、用幾十年的歷史去驗證這件事。他們找到的答案,叫做「因子」。

想象一個問題。

你買了一支股票,賺了錢。

這錢,是你運氣好?還是你承擔了某種風險,市場給你的補償?

聽起來像哲學題。但這個問題,在過去七十年裡,讓無數經濟學家、數學家、基金經理爭得頭破血流。

而這本書,就是要把這場爭論的答案,清清楚楚擺在你面前。

---

**全書導覽**

這本書叫《因子投資:方法與實踐》,作者是石川等人。

這本書我們會分四章來讀。

第一章,我們從最基礎的問題切入——什麼是因子?從最早的單因子模型 CAPM,到後來顛覆它的法瑪-弗倫奇三因子模型,我們搞清楚「因子」這個詞到底在說什麼。

第二章,我們深入五個經典因子,看資料怎麼說。價值、規模、動量、盈利、投資——每一個背後,都有真實的歷史資料在撐腰。

第三章,我們走到實操層面。聰明貝塔 ETF、多因子打分、A 股的特殊性——因子怎麼真正落地成一個投資組合?

第四章,我們踩剎車。回測陷阱、資料探勘偏差、因子擁擠——因子投資的邊界在哪裡?什麼情況下它會失效?

好,現在我們從第一章開始。

---

**故事從一九五二年說起**

那一年,一個二十五歲的年輕人,坐在芝加哥大學圖書館裡,讀到一篇改變他一生的論文。

這個年輕人叫哈里·馬科維茨。那篇論文,是他自己寫的。

他提出了一個在當時看來幾乎是異端的想法:投資不能只看收益,必須同時看風險。而風險,可以用波動率來衡量。更重要的是,把不同資產組合在一起,可以在不降低收益的前提下,降低整體風險。

這就是現代投資組合理論的起點。

但馬科維茨的理論有一個問題——太複雜了。他的模型需要計算每兩支股票之間的相關性。如果你有一百支股票,你需要計算將近五千個相關係數。在那個沒有電腦的年代,根本沒法用。

---

**威廉·夏普的簡化**

十年後,一九六四年。

威廉·夏普站出來說:我來簡化它。

他的核心想法是這樣的——與其追蹤每兩支股票之間的關係,不如找一個「公共驅動力」。這個公共驅動力,就是整個市場的漲跌。

他的邏輯是:一支股票的價格波動,可以分成兩部分。

第一部分,跟市場一起動。市場漲,它漲;市場跌,它跌。這部分叫「系統性風險」,是無法透過分散投資消除的。

第二部分,是它自己獨特的波動。這部分叫「非系統性風險」,可以透過買很多支股票來對沖掉。

夏普說:既然非系統性風險可以消除,市場就不應該給你補償。真正應該被補償的,只有系統性風險。

這個系統性風險,用一個希臘字母來衡量——

貝塔。

---

**CAPM:一個優雅的世界**

夏普的模型,叫資本資產定價模型,簡稱 CAPM。

它的邏輯極其簡潔:一支股票的預期收益,等於無風險利率,加上貝塔乘以市場風險溢價。

用大白話說就是——你承擔的市場風險越高,你的預期回報就應該越高。

貝塔等於一,就是跟市場同步。貝塔等於二,市場漲百分之十,你漲百分之二十;市場跌百分之十,你跌百分之二十。

這個模型,漂亮。優雅。簡單。

一九九〇年,威廉·夏普因此拿到了諾貝爾經濟學獎。

但是——

等等。

---

**資料打臉**

如果 CAPM 是對的,那麼世界上應該只有一個變數能解釋股票收益的差異:貝塔。

高貝塔的股票,長期表現應該更好。

你猜資料怎麼說?

不對。

從二十世紀六十年代開始,就有研究者發現,高貝塔的股票,長期表現並沒有顯著優於低貝塔的股票。

更麻煩的是,有人發現了一些 CAPM 完全解釋不了的現象。

比如,小公司的股票,長期回報高於大公司。

比如,低市淨率的股票(也就是「便宜」的股票),長期回報高於高市淨率的股票。

CAPM 對這些現象的解釋是:沒有解釋。

這叫「異象」。

---

**法瑪和弗倫奇出場**

一九九二年。

尤金·法瑪和肯尼斯·弗倫奇發表了一篇論文。

這篇論文,在學術界引發了地震。

他們用美國股市從一九六三年到一九九〇年,將近三十年的資料,系統地檢驗了 CAPM。

結論?

石川在書中的核心觀點是:貝塔與股票截面收益之間,幾乎沒有顯著的正相關關係。

換句話說——

CAPM,在資料面前,敗了。

但法瑪和弗倫奇沒有止步於此。他們接著問:那什麼變數,能更好地解釋股票收益的差異?

他們找到了兩個。

第一個:規模。小公司股票,系統性地跑贏大公司股票。

第二個:價值。低市淨率股票(價值股),系統性地跑贏高市淨率股票(成長股)。

---

**三因子模型誕生**

法瑪和弗倫奇把這兩個變數,加上原來的市場因子,合在一起,構建了一個新模型。

三個因子。

第一,市場因子:整體市場相對無風險利率的超額收益。

第二,規模因子 SMB:小公司股票組合,減去大公司股票組合的收益差。SMB 是英文「小減大」的縮寫。

第三,價值因子 HML:高市淨率比率股票組合,減去低市淨率比率股票組合的收益差。HML 是英文「高減低」的縮寫。

這就是法瑪-弗倫奇三因子模型。

它對股票收益差異的解釋力,遠超 CAPM。

---

**但「因子」到底是什麼?**

好,到這裡,你可能已經有點暈了。

讓我們停下來,把最關鍵的概念說清楚。

因子,到底是什麼?

石川在書中寫道:因子是能夠系統性地解釋一組資產收益差異的、可量化的特徵變數。

注意這裡的每一個詞。

「系統性」——不是偶爾,是長期、穩定、跨市場地存在。

「解釋收益差異」——不是解釋某一支股票的絕對漲跌,而是解釋為什麼這組股票跑贏那組股票。

「可量化的特徵變數」——必須能用資料算出來,不能是「感覺這公司不錯」。

---

**因子背後的兩種邏輯**

這裡有一個根本性的爭論,至今沒有完全平息。

為什麼這些因子會帶來超額收益?

有兩種解釋。

第一種:風險補償。

這是法瑪自己的立場。他認為,價值股之所以長期跑贏,是因為它們更危險。便宜的公司,往往是陷入困境的公司。你買它,承擔了更大的財務風險。市場給你的高回報,是對這個風險的補償。

第二種:行為偏差。

另一批學者認為,這跟風險沒關係。是因為投資者不理性。大家系統性地高估成長股,低估價值股,導致價值股被低估,未來回報更高。

這兩種解釋,對投資者的含義完全不同。

如果是風險補償——那你得問自己:我願意承擔這個風險嗎?

如果是行為偏差——那你得問自己:這個偏差會永遠存在嗎?還是有一天會被套利掉?

---

**動量因子:法瑪最不願意承認的那個**

說到這裡,必須提一個因子。

動量。

一九九三年,馬克·卡哈特等人發現了一個現象:過去三到十二個月漲得好的股票,接下來三到十二個月,往往還會繼續漲。

這就是動量效應。

這個發現,讓法瑪非常不舒服。

因為動量效應,很難用風險來解釋。一支股票漲得好,它的風險並沒有系統性地增加。但它的未來回報,卻顯著更高。

這更像是行為偏差的證據——投資者反應不足,好訊息沒有被立刻充分定價,於是價格慢慢地繼續上漲。

動量因子,成了因子投資世界裡最有爭議、也最有實戰價值的因子之一。

---

**當下對映:A 股的因子世界**

說到這裡,你可能會問:這些都是美國市場的研究,A 股有用嗎?

有意思的是,A 股的因子有效性,和美股既有相似,也有不同。

比如,A 股的動量效應,在歷史上並不像美股那麼穩定,甚至在某些時期出現了反轉效應——就是短期漲得好的股票,反而接下來跌。

而價值因子和規模因子,在 A 股歷史上有過相當顯著的表現,尤其是小市值效應,在二〇一五年之前,幾乎是 A 股最強的因子之一。

但這些有效性,會隨著市場結構的變化而變化。

這也是這本書後面要深入討論的問題。

---

**本章小結**

好,我們來整理一下今天講的脈絡。

從馬科維茨的組合理論,到夏普的 CAPM,人們曾經相信:市場風險(貝塔),是解釋股票收益差異的唯一因子。

但資料不買賬。

法瑪和弗倫奇用將近三十年的美股資料證明:規模和價值,能解釋 CAPM 解釋不了的部分。

三因子模型由此誕生。

而「因子」這個概念,也從此成為量化投資的核心語言——它是一種對收益來源的拆解,是對「錢從哪裡來」這個問題的系統性回答。

---

但是,知道因子存在,只是第一步。

真正的問題來了:這些因子,在歷史資料裡,到底表現如何?

價值因子 HML、規模因子 SMB、動量因子 MOM,還有後來加入的盈利因子和投資因子——它們各自的歷史收益是多少?波動有多大?在哪些年份失效過?

資料,會告訴我們一個比理論更復雜、也更真實的故事。

下一章,我們就來看:經典五因子,資料怎麼說?

第 2 章 · 經典五因子:資料怎麼說

五個因子,聽起來像五件武器。

但武器好不好用,得看資料說話。

價值、規模、動量、盈利、投資——這五個詞背後,藏著幾十年的市場真相。今天,我們來看看,數字到底支不支援這套理論。

上一章,我們講了因子投資的理論地基。

從 CAPM 的單因子世界,到法瑪和弗倫奇的三因子模型,核心邏輯只有一句話:超額收益,是風險的補償。市場不是白給你錢的,你賺到的,是你承擔了某種系統性風險。

今天,我們不聊理論了。

我們來看資料。

---

**先說一個場景。**

一九九二年。

法瑪和弗倫奇發表了那篇改變投資界的論文。他們翻遍了美國股市幾十年的資料,問了一個簡單粗暴的問題:到底是什麼,在驅動股票的長期回報?

結論震動了整個學界。

不是市場貝塔。

不是公司大小。

是兩個東西同時在起作用——規模,和價值。

小公司,長期跑贏大公司。

低估值股票,長期跑贏高估值股票。

這兩個發現,就是因子投資的起點。

---

**第一個因子:價值因子,HML**

HML,三個字母。

H 是高賬面市值比,L 是低賬面市值比,M 是減號。

翻譯成人話就是:買便宜的,賣貴的,看誰賺得多。

石川等人在書中寫道,價值因子的邏輯非常直觀——便宜貨往往被市場低估,而低估終究會被糾正。

但資料怎麼說?

美國市場,從一九二六年到近年,HML 因子的年化超額收益大約在

**百分之四到五。**

聽起來不多?

別急。這是每年,持續幾十年,穩定跑出來的。

更關鍵的是,這個收益不是靠運氣堆出來的。統計顯著性很高。換句話說,這不是噪音,這是訊號。

但等等——

有沒有哪段時間,價值因子失效了?

有。

二零一零年代,成長股橫掃一切。科技巨頭的估值越來越高,但股價還在漲。價值投資者一邊罵市場瘋了,一邊眼睜睜看著自己的組合跑輸大盤。

這一段,很痛苦。

但書裡的核心觀點是:因子不是每年都有效,但它的有效性,經得起長週期的檢驗。短期失效,不代表邏輯破了,代表的是——你需要更長的耐心。

---

**第二個因子:規模因子,SMB**

SMB,小公司減大公司。

邏輯也很簡單:小公司流動性差,資訊透明度低,市場關注少,所以承擔了更高的風險,理應獲得更高的補償。

資料支援嗎?

美國市場,SMB 的長期年化超額收益大約是

**百分之二到三。**

比價值因子小一點。

但問題來了。

近年來,有很多研究開始質疑規模因子。他們說,如果你把資料裡的「微型股」——那些極小極小的公司——剔除掉,規模效應就幾乎消失了。

這是一個很重要的提醒。

因子,有時候是真實的風險補償。有時候,是資料裡的噪音和倖存者偏差。

怎麼區分?

這就是為什麼我們需要反覆驗證,在不同市場、不同時期、不同方法下,看它是不是還在。

---

**第三個因子:動量因子,MOM**

停一下。

動量因子,是這五個裡面最「反直覺」的一個。

價值和規模,好歹有風險邏輯撐著。但動量是什麼?

漲得好的股票,繼續漲。跌得慘的股票,繼續跌。

這聽起來,像是在說廢話。

但資料偏偏就是這樣。

尤金·法瑪(Eugene Fama)本人,最初對動量因子是牴觸的。他是有效市場假說的旗手,他怎麼可能接受「過去漲就會繼續漲」這種說法?

但數字擺在面前,他也沒法否認。

動量因子在美國市場的年化超額收益,大約是

**百分之八到十。**

這是五個因子裡最高的。

但風險也最高。

動量策略有一個致命弱點——崩潰。

當市場發生劇烈反轉,動量組合會在極短時間內遭受毀滅性損失。二零零九年三月,金融危機觸底反彈,之前跌得最慘的股票突然暴漲,動量多頭組合在幾周內損失慘重。

石川等人在書中對此有清醒的表述,他的核心觀點是:動量因子的高收益,是對「崩潰風險」的補償。天下沒有免費的午餐,高回報背後,是你必須承擔的尾部風險。

---

**第四個因子:盈利因子,RMW**

RMW,盈利能力強的公司減去盈利能力弱的公司。

這個因子是法瑪和弗倫奇在二零一五年擴充套件五因子模型時加進來的。

邏輯很直接:盈利好的公司,內在價值更高,長期回報更好。

但有意思的地方在哪裡?

盈利因子,和價值因子,在某種程度上是「反著的」。

便宜的股票,往往盈利不好。盈利好的股票,往往估值不低。

所以當你同時持有價值因子和盈利因子,它們會互相「對沖」一部分。

這不是壞事。

這是分散化。

資料上,RMW 在美國市場的年化超額收益大約是

**百分之三到四。**

更重要的是,它和其他因子的相關性低,加進組合裡,能顯著改善風險調整後的收益。

---

**第五個因子:投資因子,CMA**

CMA,保守投資的公司減去激進投資的公司。

什麼叫激進投資?就是一個公司不停地擴張,大量買資產,大量花錢。

市場的規律是:過度投資的公司,長期股價表現往往不好。

為什麼?

有幾種解釋。

一種是風險解釋:保守的公司風險更低,但市場對它們的定價也更低,所以反而有超額收益。

另一種是行為解釋:管理層過度自信,亂投資,損害了股東利益,市場最終會懲罰這種行為。

哪種解釋對?

老實說,學界還沒有定論。

但資料是清楚的。CMA 在美國市場的年化超額收益大約是

**百分之三左右。**

---

**那麼,A 股呢?**

說了這麼多美國資料,A 股的情況怎麼樣?

這是一個非常值得關注的問題。

因為 A 股和美股,是兩個性格完全不同的市場。

A 股散戶比例更高,資訊不對稱更嚴重,市場情緒波動更劇烈。

結果是什麼?

動量因子在 A 股,歷史上有效性相對較弱——甚至有時候是「反轉效應」,也就是漲多了反而要跌。

價值因子在 A 股,有效,但波動更大,需要更長的持有周期。

規模因子在 A 股,歷史上非常顯著——小公司跑贏大公司的現象,在 A 股比美股更明顯。

但這裡有一個當下的對映需要注意。

二零二三年之後,A 股的市場結構在發生變化。機構化程度在提高,量化資金規模在擴大。當越來越多的人用同一套因子策略在市場裡操作,這些因子還會繼續有效嗎?

這個問題,我們先在這裡埋下一顆種子。

---

**五個因子,放在一起看**

讓我們退後一步,把五個因子放在一起。

價值、規模、動量、盈利、投資。

它們有一個共同點:

在長週期資料裡,都有統計顯著的超額收益。

但它們也有一個共同的侷限:

沒有一個因子,能在所有時期都有效。

這就是為什麼,單押一個因子,是危險的。

這就是為什麼,多因子組合,才是實踐的方向。

但組合怎麼配?權重怎麼定?A 股的因子有沒有特殊性?調倉多久一次才合適?

資料給了我們信心,但實操還有一大堆問題沒解決。

理論懂了,資料也看了——但真正要把這套東西用起來,你知道最大的攔路虎是什麼嗎?下一章,我們進入真實的投資組合構建,看看 Smart Beta 和多因子策略,在實戰裡到底長什麼樣。

第 3 章 · 組合實操:Smart Beta 與多因子配置

你已經知道了價值、規模、動量這些因子。但知道因子是一回事,真正用它們賺錢,是另一回事。調倉頻率怎麼定?多個因子怎麼組合?A 股的因子有效嗎?今天我們直接進實操。

上一章我們把五大經典因子拆開來看了個遍——價值、規模、動量、盈利、投資。資料擺在那裡,長期來看,這些因子確實能帶來超額收益。核心結論就一句話:因子有效,但不是每年都有效,你需要足夠長的耐心和足夠寬的視野。

今天,我們不聊資料了。

我們來聊怎麼用。

---

**先回到一個具體的時間節點。**

二〇〇六年。

美國市場上出現了一批奇怪的 ETF。

它們不跟蹤市值加權的標普五百指數,而是按照股息率、低波動、基本面指標來選股、加權。基金公司給它們起了一個好聽的名字——

Smart Beta。

聰明貝塔。

言下之意,普通的市值加權指數是「笨貝塔」,而這些按因子構建的指數,才是「聰明的」。

這個名字一齣,整個被動投資圈都被點燃了。投資者問:我能不能既享受指數基金的低成本、高透明度,又能順手賺到因子溢價?

答案是:理論上,可以。

但現實,遠比理論複雜。

---

**Smart Beta 到底是什麼?**

石川等人在書中的核心觀點是:Smart Beta 本質上是因子投資的產品化。它把學術界發現的因子——價值、低波動、動量、質量——打包成可交易的指數產品,讓普通投資者也能系統性地暴露在這些因子上。

聽起來很美。

但停一下。

你有沒有想過一個問題:同樣是「價值因子 ETF」,不同產品的表現可以差到天壤之別。

為什麼?

因為「價值」這個詞,背後藏著幾十種不同的定義方式。

有的產品用市淨率。有的用市盈率。有的用企業價值倍數。有的把這三個混在一起打分。

定義不同,選出來的股票池就不同。

股票池不同,收益就不同。

所以買 Smart Beta ETF 之前,你最需要做的一件事,不是看過去三年的收益率——

而是開啟它的招募說明書,搞清楚它到底用的是哪個因子、怎麼定義的。

這是第一個坑。

---

**然後我們來說第二個更大的問題:多因子怎麼組合?**

假設你現在手上有五個因子:價值、規模、動量、盈利、低波動。

你會怎麼用它們?

最直覺的做法是:每個因子單獨建一個組合,然後把五個組合等權重加在一起。

這叫「因子組合混合法」。

簡單。粗暴。有一定效果。

但石川在書中指出,還有一種更精細的做法——

多因子打分法。

具體是什麼意思?

你不是先建五個單因子組合,再把它們加在一起。

而是對每一隻股票,同時在五個維度上打分,算出一個綜合得分,然後直接按綜合得分選股。

這兩種方法,區別大嗎?

大。

舉個例子。

假設有一隻股票,價值得分極高,但動量得分極低。

用「因子組合混合法」,這隻股票會進價值因子組合,但不會進動量因子組合。兩個組合加在一起,它的權重被稀釋了,但還是有一定暴露。

用「多因子打分法」,這隻股票的綜合得分可能只是中等,直接被排在中間梯隊,拿不到高權重。

哪種更好?

沒有絕對答案。

但多因子打分法的優勢在於:它能篩選出在多個維度上同時表現優秀的股票,而不是在某一個維度上極端突出的股票。

這類股票,往往更穩健。

---

**說到 A 股,我們必須單獨拿出來聊。**

因為 A 股的因子有效性,和美股是不一樣的。

這一點,石川等人在書中有非常直接的表述:A 股市場有其獨特的結構性特徵,這些特徵會顯著影響因子的有效性。

具體說,有幾個關鍵差異。

第一,A 股的動量因子,歷史上表現並不穩定。

在美股,動量效應非常顯著——過去半年漲得好的股票,未來半年大機率還會繼續漲。

但在 A 股,這個規律要弱得多。

為什麼?

A 股的散戶比例遠高於美股。散戶喜歡追漲殺跌,但也喜歡「買跌」,認為漲多了要跌、跌多了要漲。這種行為模式,會在一定程度上抵消動量效應。

第二,A 股的價值因子,在某些時期有效,在某些時期完全失靈。

二〇一五年那場牛市,你還記得嗎?

市場幾乎不看基本面,什麼概念熱就買什麼。傳統意義上的「低估值」股票,在那段時間大幅跑輸市場。

價值因子,在極度情緒化的市場裡,會暫時失效。

第三,A 股的規模因子,歷史上非常顯著——

小市值股票長期跑贏大市值股票。

但這背後,有一部分原因是 A 股的退市制度不完善,小市值公司被殼資源炒作,帶來了一種「虛假的」規模溢價。

隨著註冊制推進、退市加速,這部分溢價正在被壓縮。

所以在 A 股做因子投資,不能照搬美股的經驗。

你需要重新驗證,重新校準。

---

**現在我們來說一個很多人忽略的實操問題:調倉頻率。**

你建好了一個多因子組合。

多久換一次倉?

每天?每週?每月?每季度?

直覺上,你可能覺得換得越勤,越能跟上因子訊號的變化,收益越好。

停。

這個直覺是錯的。

石川等人在書中明確指出:調倉頻率越高,交易成本越高,對淨收益的侵蝕就越嚴重。

A 股的交易成本,包括印花稅、佣金、衝擊成本,加在一起,對於小市值股票來說,單次換倉的成本可以達到百分之零點五甚至更高。

百分之零點五。

聽起來不多?

一年換倉十二次,雙邊來回,成本可能吃掉你百分之十二的收益。

這已經是很多因子年化超額收益的全部了。

所以,調倉頻率不是越高越好。

大多數實證研究表明,對於基於基本面的價值、盈利類因子,月度或季度調倉是比較合理的頻率。

對於動量類因子,可以適當提高頻率,但也不宜超過月度。

這不是精確的公式,但是一個有用的經驗範圍。

---

**最後,我們來說一個更深層的問題:容量與擁擠度。**

這是很多散戶投資者沒想到過的問題。

因子策略,有沒有「裝不下錢」的問題?

答案是:有。

而且非常嚴重。

想象一下。

某個因子策略在過去十年的回測中表現極好。於是越來越多的機構開始用它。大家都在買同樣的股票,都在同樣的時間點買入、賣出。

會發生什麼?

買入的時候,大家一起把價格推高,導致買入成本上升。

賣出的時候,大家一起拋售,導致賣出價格下跌,衝擊成本急劇擴大。

這就叫因子擁擠。

石川等人在書中對此有深刻的警示:當某個因子策略被過多資金追逐時,它的超額收益會被侵蝕,極端情況下甚至會出現「因子崩潰」——所有持有這個因子的組合同時大幅虧損。

二〇〇七年八月。

美國量化基金圈發生了一件著名的事件,後來被稱為「寬客危機」。

那一週,幾乎所有量化多因子基金同時出現了巨大虧損。

原因就是:太多基金持有了太相似的因子組合。當其中一家基金因為流動性壓力開始強制平倉,引發了連鎖反應,所有人同時踩踏出逃。

這不是理論。

這是真實發生過的歷史。

所以,容量是因子策略的天花板。

當你管理的資金體量足夠大,你必須考慮:你的買賣行為本身,會不會影響市場價格?你的策略,還有多少超額收益的空間?

對於普通個人投資者來說,這個問題不那麼緊迫。

但對於想要認真做量化投資的人,這是繞不開的現實約束。

---

**好,我們來做個小結。**

今天這一章,我們從理論走進了實操。

Smart Beta 是因子投資的產品化,但你要看清楚它用的是哪個因子、怎麼定義的。

多因子打分法,能篩出在多個維度同時優秀的股票,比簡單疊加更精細。

A 股有自己的因子邏輯,不能照搬海外經驗,需要獨立驗證。

調倉頻率要和交易成本做權衡,頻繁換倉會把超額收益吃光。

容量和擁擠度,是因子策略的隱形天花板。

這些,是把因子從論文變成真金白銀必須面對的問題。

但是——

等等。

你有沒有想過一個更根本的問題?

我們講了這麼多因子,這麼多策略,這麼多資料。

這些資料,是真的嗎?

回測出來的收益,是真實可以拿到手的收益嗎?

還是說,我們只是在用歷史資料,講一個自己想聽的故事?

下一章,我們要進入這本書最讓人不安的部分——

回測過擬合、資料探勘偏差、因子衰減。

量化投資的邊界,到底在哪裡?

你準備好了嗎?

第 4 章 · 陷阱與邊界:回測過擬合與因子衰減

你有沒有想過——一個在歷史資料上完美執行的策略,上線第一天就開始虧錢?這不是運氣問題,也不是市場變了。很可能,從一開始,那個策略就是假的。今天這一章,我們來聊量化投資最危險的那道坎。

上一章我們把因子投資的實操層面走了一遍。

Smart Beta、多因子打分、A 股的特殊性、調倉頻率……

核心結論是:因子有效,但要落地,細節決定生死。

今天,我們來收尾。

不聊怎麼賺錢了。

我們來聊——怎麼避免被坑。

---

**先還原一個場景。**

二〇〇七年。

華爾街。

一家量化對沖基金的研究員,盯著螢幕上的回測報告。

年化收益,三十二個百分點。

最大回撤,不超過八個百分點。

夏普比率,兩點一。

他把報告遞給基金經理,說:這個策略跑了十五年的歷史資料,非常穩。

基金經理點點頭。

上線。

然後——

二〇〇七年八月,量化危機爆發。

那一週,幾乎所有用類似邏輯構建的量化基金,同時鉅虧。

有的單週跌了百分之二十。

為什麼?

策略沒問題。

邏輯沒問題。

但有一件事,他們忽略了。

---

**這件事,叫做回測過擬合。**

什麼是回測過擬合?

簡單說:你用歷史資料找規律,找著找著,找出了一個「假規律」。

它在歷史資料上表現完美,因為它本來就是從這段歷史資料裡「挖」出來的。

你把資料挖了一遍又一遍,換引數、換週期、換組合方式,直到找到一個看起來很好的結果。

然後你以為這是「發現」。

其實,你只是在做資料擬合。

石川在書中寫道,這個問題的本質是:研究者在不知不覺中,把歷史資料的「噪聲」當成了「訊號」。

停。

這句話要細品。

噪聲,是隨機的波動。

訊號,是真實存在的規律。

歷史資料裡,兩者混在一起。

你的模型越複雜,引數越多,它就越能「解釋」歷史——但它解釋的,很可能是噪聲。

等到真實市場來了,噪聲消失了,你的策略就垮了。

---

**有多嚴重?**

美國學者坎貝爾·哈維做過一個統計。

金融學術期刊上發表的因子研究,數量超過——

三百個。

三百個因子。

每一個,在論文裡都有統計顯著性支撐。

但他的核心觀點是:其中相當大比例,可能根本經不起樣本外檢驗。

為什麼?

因為發表偏差。

做研究的人,找到了有效的因子,就發表。

找到了無效的因子,就不發表。

於是你看到的,全是「有效」的。

這就像一個賭場,只把贏錢的客人推出來做廣告。

你看到的,全是贏家。

---

**這在量化圈有個專門的名字:資料探勘偏差。**

英文叫 Data Snooping Bias。

石川在書中特別強調,這是量化投資領域最隱蔽、也最致命的陷阱之一。

為什麼隱蔽?

因為你自己都不知道自己在挖資料。

你以為你在做嚴謹的研究。

你有邏輯、有假設、有統計檢驗。

但如果你在同一批資料上反覆測試,哪怕每次都「有邏輯」,最終結論的可靠性也在下降。

統計學有個概念叫「多重檢驗」。

你做一次檢驗,誤報機率是百分之五。

你做二十次檢驗,至少有一次誤報的機率——

超過六成。

六成。

所以,當你看到一個「顯著有效」的因子,第一個問題不是「它為什麼有效」,而是——

它被測試過多少次?

---

**好,假設你的因子是真實的。**

假設它經過了嚴格的樣本外驗證。

假設它不是資料探勘的產物。

然後呢?

然後你還有另一個問題。

叫做因子擁擠。

---

**再還原一個場景。**

二〇一五年到二〇一八年。

A 股市場。

量化投資開始大規模興起。

越來越多的私募基金、公募基金,開始用同樣的因子——

低估值、高動量、小市值。

大家都在用。

大家都在買同樣的股票。

這些股票的價格,被推高了。

因子還有效嗎?

短期看,更有效了——因為更多人買,價格漲得更快。

但這只是幻覺。

等到某一天,市場風格切換,或者某個大型機構開始減倉——

所有用同樣因子的策略,同時觸發賣出訊號。

同時賣。

流動性枯竭。

價格暴跌。

這就是因子擁擠的崩塌方式。

不是慢慢失效,而是——

突然斷裂。

---

**這個場景,和二〇〇七年華爾街的量化危機,本質上是一回事。**

太多人用同樣的邏輯,同樣的因子,同樣的進出場規則。

市場一旦異動,所有人同時踩踏。

書中的核心觀點是:因子的有效性,不是一個靜態的存在,而是動態的,會隨著使用它的資金規模變化。

當一個因子被發現、被廣泛使用,它的超額收益就開始被侵蝕。

這不是陰謀,這是市場競爭的自然結果。

你發現了一個金礦。

你挖。

別人也發現了。

也挖。

金礦挖空了。

超額收益,消失了。

---

**那因子輪動呢?**

有人說:沒關係,因子會輪動。

價值因子失效的時候,動量因子有效。

動量因子失效的時候,質量因子有效。

我只要跟著輪,不就行了?

聽起來很聰明。

但等等。

你怎麼知道,現在輪到哪個因子?

如果你用歷史資料來判斷因子輪動規律——

你又回到了回測過擬合的陷阱裡。

因子輪動本身,也需要預測。

而預測,是量化投資裡最難的事。

石川在書中對此相當剋制,他的態度是:因子輪動有其邏輯,但對輪動時機的預測,目前沒有可靠的方法。

剋制。

這兩個字,我覺得是整本書最值錢的地方。

---

**來看一個當下的對映案例。**

二〇二三年,A 股市場。

有一批次化基金,用的是超高頻的小市值因子策略。

在某些階段,年化收益非常亮眼。

但二〇二四年初,監管收緊,市場流動性結構變化,小市值股票集體暴跌。

那些策略,單週最大回撤超過二十個百分點。

很多投資者不理解:明明歷史資料這麼好,為什麼突然就不行了?

答案就在這本書裡。

第一,策略可能本身就存在過擬合——在特定市場結構下「挖」出來的,換個環境就失效。

第二,因子擁擠——太多資金用同樣邏輯,同樣的崩塌方式。

第三,容量限制——策略的超額收益,和它能承載的資金規模,是反比關係。規模越大,越難賺。

這不是某家基金的失誤。

這是量化投資的結構性邊界。

---

**那量化投資,到底有沒有用?**

有用。

但你要知道它的邊界在哪裡。

邊界一:回測不等於未來。

任何策略,都要做樣本外驗證。

不是用同一批資料的後半段,而是真正的「未來資料」——也就是實盤檢驗。

邊界二:因子有效性是動態的。

今天有效,不代表明天有效。

規模越大,超額收益越難維持。

邊界三:輪動難以預測。

不要試圖精確踩點。

分散配置多個因子,才是更穩健的做法。

邊界四:市場不是靜止的實驗室。

你的策略進入市場,市場就會改變。

這是量化投資和物理學最大的不同——

你觀測它,它就變了。

---

**回頭看這本書。**

我們從第一章開始,從 CAPM 單因子講起,到法瑪和弗倫奇的三因子模型,搞清楚了「因子」這個概念到底是什麼。

第二章,我們把五大經典因子一一拆解,用資料說話——價值、規模、動量、盈利、投資,每一個背後都有真實的風險溢價邏輯。

第三章,我們落到實操層面,Smart Beta 怎麼選,多因子怎麼配,A 股有哪些特殊性,容量和擁擠度怎麼考量。

第四章,也就是今天,我們來到了這本書最冷靜的地方——

陷阱在哪裡,邊界在哪裡。

作者真正想告訴我們的,不是「因子投資包賺不賠」,而是:

這是一套有邏輯、有證據支撐的方法論。

但它不是魔法。

它需要你理解它的侷限,尊重它的邊界,然後在這個框架內,做出更理性的決策。

合上這本書,帶走的不是一個策略,而是一種思維方式:

用證據說話,但永遠對證據保持懷疑。

用證據說話,但永遠對證據保持懷疑。—— 石川等,因子投資:方法與實踐,核心方法論總結

本篇出現的關鍵概念

貝塔 (Beta)
衡量一支股票相對於整體市場波動幅度的係數。貝塔等於1代表與市場同步,等於2代表市場漲10%時該股漲20%、跌10%時跌20%。CAPM理論認為貝塔是唯一應被補償的風險來源,但法瑪和弗倫奇的實證研究證明,高貝塔並不系統性地帶來更高長期回報,這是三因子模型取代CAPM的核心依據。
HML因子 (High Minus Low)
法瑪-弗倫奇三因子模型中的價值因子,由高賬面市值比股票組合減去低賬面市值比股票組合的收益差構成。直白理解是買便宜股票、賣貴股票的超額收益。美國市場1926年至今年化超額收益約4-5%,但在2010年代成長股主導的市場環境中曾經歷較長時間的顯著失效期。
Smart Beta
因子投資的產品化形式,指按照價值、低波動、動量、質量等因子而非傳統市值加權方式構建的指數產品。2006年前後在美國市場興起。核心優勢是低成本、透明度高、系統性暴露於因子溢價。但同名產品因因子定義方式不同(市淨率、市盈率或企業價值倍數)可能導致選股池和收益表現差異懸殊,購買前必須核查招募說明書中的具體因子定義。
因子擁擠 (Factor Crowding)
當大量資金同時使用相同因子策略進行交易時,因子的超額收益會被壓縮甚至消失的現象。以A股為例,2023年後量化資金規模快速擴大,越來越多機構使用相似的多因子模型,導致原本有效的因子訊號在執行層面產生擁擠,是因子投資在實踐中面臨的核心風險之一,也是本書第四章重點討論的邊界問題。

關於入門系列

入門系列

《因子投資:方法與實踐》由石川、劉洋溢、連祥斌合著,於2020年由電子工業出版社出版,是中文世界第一本系統講述多因子投資方法論的實操教材。 石川擁有物理學博士背景,長期深耕量化投資領域,曾任職於國內頭部量化私募機構。他的研究路徑代表了一批從理工科轉型金融的量化從業者的典型軌跡:從學術嚴謹性出發,試圖在中國本土市場驗證和修正西方成熟的因子投資理論。 這本書的寫作背景是2010年代末中國量化投資行業的快速擴張期。彼時A股市場的機構化程度仍相對較低,量化策略的超額收益空間尚未被充分壓縮,但學界和業界之間存在明顯的知識斷層——學術論文大多以英文發表且高度技術化,普通從業者和投資者難以直接應用。 本書的核心貢獻在於三個層面:第一,系統梳理了從CAPM到法瑪-弗倫奇五因子模型的理論演進脈絡,為中文讀者提供了完整的學術背景;第二,用A股歷史資料對五大經典因子進行了本土實證檢驗,明確指出A股因子有效性與美股的異同;第三,將多因子打分、Smart Beta配置、回測方法論等實操內容以中文語境呈現,填補了理論與實踐之間的空白。 本書出版後成為國內量化投資從業者和CFA/FRM備考者的重要參考書目,也是高校金融工程課程的推薦讀物之一。

檢視入門系列全部投資筆記 →

本篇 6 句最值得抄進筆記的話

常見問題

因子投資和價值投資有什麼區別
價值投資通常依賴投資者對個股的定性判斷,核心是評估企業內在價值與市場價格的差距。因子投資則是將價值這一概念量化為可計算的指標(如市淨率、市盈率),系統性地應用於大量股票的篩選和組合構建,不依賴對單一公司的深度研究。兩者在邏輯起點上有重疊——都認為便宜的股票長期回報更好——但執行方式截然不同。因子投資更接近規則驅動的系統化策略,價值投資更依賴個人判斷和集中持倉。
法瑪弗倫奇三因子模型和五因子模型有什麼區別
三因子模型由法瑪和弗倫奇於1992年提出,包含市場因子、規模因子SMB和價值因子HML,能解釋大部分CAPM無法解釋的股票收益差異。2015年,他們在三因子基礎上新增了盈利因子RMW(盈利能力強減弱的公司)和投資因子CMA(保守投資減激進投資的公司),構成五因子模型。五因子模型對股票收益的解釋力更強,但也有研究指出它在加入盈利和投資因子後,價值因子HML的獨立解釋力有所下降。
A股小市值效應現在還有效嗎
A股小市值效應在2015年之前極為顯著,是歷史上最強的本土因子之一。但2016年後,隨著監管趨嚴、殼資源價值下降以及機構投資者佔比提升,小市值效應明顯減弱。2021年至2023年間,大盤價值股階段性跑贏小盤股的情況多次出現。目前學界和業界的主流觀點是:A股小市值效應仍存在但已大幅收窄,且在流動性差的極小市值股票中依然有殘留,但考慮到交易成本和衝擊成本,實際可獲取的超額收益已遠低於歷史回測資料。
普通投資者怎麼用因子投資
對於沒有量化程式設計能力的普通投資者,最直接的路徑是通過Smart Beta ETF獲得因子暴露。目前A股市場已有跟蹤價值、低波動、紅利、基本面加權等因子的ETF產品。選擇時需注意三點:第一,看清楚產品的因子定義方式,同樣叫價值ETF的產品可能用市淨率或市盈率,選股結果差異很大;第二,關注換手率和費率,高換手的因子策略會侵蝕實際收益;第三,做好持有周期預期管理,單一因子可能連續數年跑輸市場,多因子組合能降低這種波動。
因子投資會失效嗎,什麼情況下會失效
因子投資存在三類主要失效風險。第一是週期性失效:每個因子都有表現低迷的階段,價值因子在2010年代成長股主導期曾連續多年跑輸,這屬於正常的因子輪動,不代表因子邏輯破裂。第二是結構性失效:當市場環境發生根本變化(如機構化程度大幅提升),原本有效的因子可能被永久性套利掉。第三是因子擁擠:當大量資金使用相同策略,因子訊號的預測能力下降,且在市場壓力時期可能引發集中拋售。區分週期性失效和結構性失效,是因子投資實踐中最難也最關鍵的判斷。

讀完這篇,你還會喜歡

在某派 App 繼續學習
220+ 大師案例 · 知性男聲音訊解讀 · 與 25 位大師 1v1 對話
完整音訊版 10 大投資流派 25 位大師 1v1 對話 離線收聽
下載某派 App
App Store 評分 4.7 · 已上架美區中文
在某派 App 聽 56 分鐘完整音訊解讀
含 220+ 大師案例 · 與 25 位大師 1v1 對話
下載 App