這篇講什麼
中文世界第一本系統講多因子投資的實操教材。從學術研究到 A 股實證,把因子從 Fama-French 三因子講到 Smart Beta,既嚴謹也接地氣。
一九九二年,兩個經濟學家發表了一篇論文,把此前四十年的主流投資理論打了個措手不及。他們用近三十年的真實資料說明:你以為能解釋股票漲跌的那個公式,其實解釋不了什麼。這件事的影響遠不止學術圈——它直接催生了今天規模以萬億美元計的「因子投資」行業,從量化基金到你在券商App裡看到的Smart Beta ETF,背後都是同一套邏輯。但大多數人對這套邏輯的瞭解,停留在「聽說過」三個字。這本書想做的事,是把這套邏輯從頭捋清楚:因子到底是什麼?它為什麼能賺錢,賺的是誰的錢?在A股這個和美股氣質截然不同的市場裡,它還管用嗎?什麼時候會失效?讀完你會發現,因子投資既不是什麼神秘的黑箱,也不是穩賺不賠的公式——它是一種有邊界、有代價、需要真正理解才能用的思維方式。
誰該讀這一篇
- 如果你已經讀過不少價值投資書籍,知道市盈率和市淨率是什麼,但每次看到量化投資相關內容就被一堆希臘字母和公式勸退,不清楚因子到底是什麼意思、和自己的選股邏輯有什麼關係,這本書會用清晰的敘事邏輯幫你把學術概念翻譯成可理解的投資語言。
- 如果你正在考慮配置Smart Beta ETF或者因子類基金產品,但面對市場上幾十種標榜價值、低波動、質量的產品不知道如何甄別,不確定它們背後的因子定義是否嚴謹、歷史資料是否可信,這本書能幫你建立一套評估框架,不再被產品名稱和短期業績牽著走。
- 如果你有一定的量化或資料分析基礎,想系統學習多因子模型的構建邏輯,瞭解價值、規模、動量、盈利、投資五大因子在A股市場的實證表現,以及如何將多因子打分法落地成真實的投資組合,這本書提供了從理論到A股資料驗證的完整路徑。
本篇 6 個核心觀點
- 1CAPM模型在資料面前已經失效。法瑪和弗倫奇用1963年至1990年近三十年美國股市資料證明,貝塔與股票截面收益之間幾乎沒有顯著正相關關係。高貝塔股票並不系統性地跑贏低貝塔股票,這意味著以貝塔作為唯一定價因子的CAPM無法解釋真實市場中的收益差異。
- 2五大經典因子均有長期統計顯著的超額收益,但幅度和風險特徵差異明顯。美國市場資料顯示:價值因子HML年化約4-5%,規模因子SMB約2-3%,動量因子MOM約8-10%但伴隨崩潰風險,盈利因子RMW約3-4%,投資因子CMA約3%。沒有任何一個因子在所有時期都持續有效。
- 3因子背後存在兩種根本性解釋,至今未有定論。風險補償派認為價值股長期跑贏是因為它們承擔了更高的財務困境風險;行為偏差派認為是投資者系統性錯誤定價導致。這兩種解釋對投資者的實踐含義完全不同:前者要求你評估自己的風險承受能力,後者要求你判斷市場偏差是否會被套利消除。
- 4動量因子是五個因子中收益最高也最危險的一個。年化超額收益約8-10%,但在市場劇烈反轉時會遭受毀滅性損失。2009年3月金融危機觸底反彈時,動量多頭組合在數週內損失慘重。這種尾部風險是動量因子高收益的真實來源,不是可以免費獲取的超額利潤。
- 5A股因子有效性與美股存在顯著差異。A股動量效應歷史上不穩定,部分時期甚至出現反轉效應;價值因子有效但波動更大;小市值效應在2015年之前極為顯著,是A股歷史上最強的因子之一。隨著2023年後機構化程度提升和量化資金規模擴大,這些因子的有效性正在發生結構性變化。
- 6多因子打分法優於簡單的因子組合混合法。混合法是先建單因子組合再等權疊加;打分法是對每隻股票在多個因子維度同時評分,篩選綜合得分高的股票。打分法能選出在多個維度同時表現優秀的股票,而非某一維度極端突出的股票,組合穩健性更高,是實操中更推薦的多因子配置路徑。
試聽第一章音訊解讀
精讀全文
第 1 章 · 什麼是因子:從 CAPM 到 Fama-French
如果有人告訴你,股市裡的賺錢機會,其實是有規律可循的——你信嗎?幾十年來,全球最聰明的一批人,用資料、用模型、用幾十年的歷史去驗證這件事。他們找到的答案,叫做「因子」。
想象一個問題。
你買了一支股票,賺了錢。
這錢,是你運氣好?還是你承擔了某種風險,市場給你的補償?
聽起來像哲學題。但這個問題,在過去七十年裡,讓無數經濟學家、數學家、基金經理爭得頭破血流。
而這本書,就是要把這場爭論的答案,清清楚楚擺在你面前。
---
**全書導覽**
這本書叫《因子投資:方法與實踐》,作者是石川等人。
這本書我們會分四章來讀。
第一章,我們從最基礎的問題切入——什麼是因子?從最早的單因子模型 CAPM,到後來顛覆它的法瑪-弗倫奇三因子模型,我們搞清楚「因子」這個詞到底在說什麼。
第二章,我們深入五個經典因子,看資料怎麼說。價值、規模、動量、盈利、投資——每一個背後,都有真實的歷史資料在撐腰。
第三章,我們走到實操層面。聰明貝塔 ETF、多因子打分、A 股的特殊性——因子怎麼真正落地成一個投資組合?
第四章,我們踩剎車。回測陷阱、資料探勘偏差、因子擁擠——因子投資的邊界在哪裡?什麼情況下它會失效?
好,現在我們從第一章開始。
---
**故事從一九五二年說起**
那一年,一個二十五歲的年輕人,坐在芝加哥大學圖書館裡,讀到一篇改變他一生的論文。
這個年輕人叫哈里·馬科維茨。那篇論文,是他自己寫的。
他提出了一個在當時看來幾乎是異端的想法:投資不能只看收益,必須同時看風險。而風險,可以用波動率來衡量。更重要的是,把不同資產組合在一起,可以在不降低收益的前提下,降低整體風險。
這就是現代投資組合理論的起點。
但馬科維茨的理論有一個問題——太複雜了。他的模型需要計算每兩支股票之間的相關性。如果你有一百支股票,你需要計算將近五千個相關係數。在那個沒有電腦的年代,根本沒法用。
---
**威廉·夏普的簡化**
十年後,一九六四年。
威廉·夏普站出來說:我來簡化它。
他的核心想法是這樣的——與其追蹤每兩支股票之間的關係,不如找一個「公共驅動力」。這個公共驅動力,就是整個市場的漲跌。
他的邏輯是:一支股票的價格波動,可以分成兩部分。
第一部分,跟市場一起動。市場漲,它漲;市場跌,它跌。這部分叫「系統性風險」,是無法透過分散投資消除的。
第二部分,是它自己獨特的波動。這部分叫「非系統性風險」,可以透過買很多支股票來對沖掉。
夏普說:既然非系統性風險可以消除,市場就不應該給你補償。真正應該被補償的,只有系統性風險。
這個系統性風險,用一個希臘字母來衡量——
貝塔。
---
**CAPM:一個優雅的世界**
夏普的模型,叫資本資產定價模型,簡稱 CAPM。
它的邏輯極其簡潔:一支股票的預期收益,等於無風險利率,加上貝塔乘以市場風險溢價。
用大白話說就是——你承擔的市場風險越高,你的預期回報就應該越高。
貝塔等於一,就是跟市場同步。貝塔等於二,市場漲百分之十,你漲百分之二十;市場跌百分之十,你跌百分之二十。
這個模型,漂亮。優雅。簡單。
一九九〇年,威廉·夏普因此拿到了諾貝爾經濟學獎。
但是——
等等。
---
**資料打臉**
如果 CAPM 是對的,那麼世界上應該只有一個變數能解釋股票收益的差異:貝塔。
高貝塔的股票,長期表現應該更好。
你猜資料怎麼說?
不對。
從二十世紀六十年代開始,就有研究者發現,高貝塔的股票,長期表現並沒有顯著優於低貝塔的股票。
更麻煩的是,有人發現了一些 CAPM 完全解釋不了的現象。
比如,小公司的股票,長期回報高於大公司。
比如,低市淨率的股票(也就是「便宜」的股票),長期回報高於高市淨率的股票。
CAPM 對這些現象的解釋是:沒有解釋。
這叫「異象」。
---
**法瑪和弗倫奇出場**
一九九二年。
尤金·法瑪和肯尼斯·弗倫奇發表了一篇論文。
這篇論文,在學術界引發了地震。
他們用美國股市從一九六三年到一九九〇年,將近三十年的資料,系統地檢驗了 CAPM。
結論?
石川在書中的核心觀點是:貝塔與股票截面收益之間,幾乎沒有顯著的正相關關係。
換句話說——
CAPM,在資料面前,敗了。
但法瑪和弗倫奇沒有止步於此。他們接著問:那什麼變數,能更好地解釋股票收益的差異?
他們找到了兩個。
第一個:規模。小公司股票,系統性地跑贏大公司股票。
第二個:價值。低市淨率股票(價值股),系統性地跑贏高市淨率股票(成長股)。
---
**三因子模型誕生**
法瑪和弗倫奇把這兩個變數,加上原來的市場因子,合在一起,構建了一個新模型。
三個因子。
第一,市場因子:整體市場相對無風險利率的超額收益。
第二,規模因子 SMB:小公司股票組合,減去大公司股票組合的收益差。SMB 是英文「小減大」的縮寫。
第三,價值因子 HML:高市淨率比率股票組合,減去低市淨率比率股票組合的收益差。HML 是英文「高減低」的縮寫。
這就是法瑪-弗倫奇三因子模型。
它對股票收益差異的解釋力,遠超 CAPM。
---
**但「因子」到底是什麼?**
好,到這裡,你可能已經有點暈了。
讓我們停下來,把最關鍵的概念說清楚。
因子,到底是什麼?
石川在書中寫道:因子是能夠系統性地解釋一組資產收益差異的、可量化的特徵變數。
注意這裡的每一個詞。
「系統性」——不是偶爾,是長期、穩定、跨市場地存在。
「解釋收益差異」——不是解釋某一支股票的絕對漲跌,而是解釋為什麼這組股票跑贏那組股票。
「可量化的特徵變數」——必須能用資料算出來,不能是「感覺這公司不錯」。
---
**因子背後的兩種邏輯**
這裡有一個根本性的爭論,至今沒有完全平息。
為什麼這些因子會帶來超額收益?
有兩種解釋。
第一種:風險補償。
這是法瑪自己的立場。他認為,價值股之所以長期跑贏,是因為它們更危險。便宜的公司,往往是陷入困境的公司。你買它,承擔了更大的財務風險。市場給你的高回報,是對這個風險的補償。
第二種:行為偏差。
另一批學者認為,這跟風險沒關係。是因為投資者不理性。大家系統性地高估成長股,低估價值股,導致價值股被低估,未來回報更高。
這兩種解釋,對投資者的含義完全不同。
如果是風險補償——那你得問自己:我願意承擔這個風險嗎?
如果是行為偏差——那你得問自己:這個偏差會永遠存在嗎?還是有一天會被套利掉?
---
**動量因子:法瑪最不願意承認的那個**
說到這裡,必須提一個因子。
動量。
一九九三年,馬克·卡哈特等人發現了一個現象:過去三到十二個月漲得好的股票,接下來三到十二個月,往往還會繼續漲。
這就是動量效應。
這個發現,讓法瑪非常不舒服。
因為動量效應,很難用風險來解釋。一支股票漲得好,它的風險並沒有系統性地增加。但它的未來回報,卻顯著更高。
這更像是行為偏差的證據——投資者反應不足,好訊息沒有被立刻充分定價,於是價格慢慢地繼續上漲。
動量因子,成了因子投資世界裡最有爭議、也最有實戰價值的因子之一。
---
**當下對映:A 股的因子世界**
說到這裡,你可能會問:這些都是美國市場的研究,A 股有用嗎?
有意思的是,A 股的因子有效性,和美股既有相似,也有不同。
比如,A 股的動量效應,在歷史上並不像美股那麼穩定,甚至在某些時期出現了反轉效應——就是短期漲得好的股票,反而接下來跌。
而價值因子和規模因子,在 A 股歷史上有過相當顯著的表現,尤其是小市值效應,在二〇一五年之前,幾乎是 A 股最強的因子之一。
但這些有效性,會隨著市場結構的變化而變化。
這也是這本書後面要深入討論的問題。
---
**本章小結**
好,我們來整理一下今天講的脈絡。
從馬科維茨的組合理論,到夏普的 CAPM,人們曾經相信:市場風險(貝塔),是解釋股票收益差異的唯一因子。
但資料不買賬。
法瑪和弗倫奇用將近三十年的美股資料證明:規模和價值,能解釋 CAPM 解釋不了的部分。
三因子模型由此誕生。
而「因子」這個概念,也從此成為量化投資的核心語言——它是一種對收益來源的拆解,是對「錢從哪裡來」這個問題的系統性回答。
---
但是,知道因子存在,只是第一步。
真正的問題來了:這些因子,在歷史資料裡,到底表現如何?
價值因子 HML、規模因子 SMB、動量因子 MOM,還有後來加入的盈利因子和投資因子——它們各自的歷史收益是多少?波動有多大?在哪些年份失效過?
資料,會告訴我們一個比理論更復雜、也更真實的故事。
下一章,我們就來看:經典五因子,資料怎麼說?
第 2 章 · 經典五因子:資料怎麼說
五個因子,聽起來像五件武器。
但武器好不好用,得看資料說話。
價值、規模、動量、盈利、投資——這五個詞背後,藏著幾十年的市場真相。今天,我們來看看,數字到底支不支援這套理論。
上一章,我們講了因子投資的理論地基。
從 CAPM 的單因子世界,到法瑪和弗倫奇的三因子模型,核心邏輯只有一句話:超額收益,是風險的補償。市場不是白給你錢的,你賺到的,是你承擔了某種系統性風險。
今天,我們不聊理論了。
我們來看資料。
---
**先說一個場景。**
一九九二年。
法瑪和弗倫奇發表了那篇改變投資界的論文。他們翻遍了美國股市幾十年的資料,問了一個簡單粗暴的問題:到底是什麼,在驅動股票的長期回報?
結論震動了整個學界。
不是市場貝塔。
不是公司大小。
是兩個東西同時在起作用——規模,和價值。
小公司,長期跑贏大公司。
低估值股票,長期跑贏高估值股票。
這兩個發現,就是因子投資的起點。
---
**第一個因子:價值因子,HML**
HML,三個字母。
H 是高賬面市值比,L 是低賬面市值比,M 是減號。
翻譯成人話就是:買便宜的,賣貴的,看誰賺得多。
石川等人在書中寫道,價值因子的邏輯非常直觀——便宜貨往往被市場低估,而低估終究會被糾正。
但資料怎麼說?
美國市場,從一九二六年到近年,HML 因子的年化超額收益大約在
**百分之四到五。**
聽起來不多?
別急。這是每年,持續幾十年,穩定跑出來的。
更關鍵的是,這個收益不是靠運氣堆出來的。統計顯著性很高。換句話說,這不是噪音,這是訊號。
但等等——
有沒有哪段時間,價值因子失效了?
有。
二零一零年代,成長股橫掃一切。科技巨頭的估值越來越高,但股價還在漲。價值投資者一邊罵市場瘋了,一邊眼睜睜看著自己的組合跑輸大盤。
這一段,很痛苦。
但書裡的核心觀點是:因子不是每年都有效,但它的有效性,經得起長週期的檢驗。短期失效,不代表邏輯破了,代表的是——你需要更長的耐心。
---
**第二個因子:規模因子,SMB**
SMB,小公司減大公司。
邏輯也很簡單:小公司流動性差,資訊透明度低,市場關注少,所以承擔了更高的風險,理應獲得更高的補償。
資料支援嗎?
美國市場,SMB 的長期年化超額收益大約是
**百分之二到三。**
比價值因子小一點。
但問題來了。
近年來,有很多研究開始質疑規模因子。他們說,如果你把資料裡的「微型股」——那些極小極小的公司——剔除掉,規模效應就幾乎消失了。
這是一個很重要的提醒。
因子,有時候是真實的風險補償。有時候,是資料裡的噪音和倖存者偏差。
怎麼區分?
這就是為什麼我們需要反覆驗證,在不同市場、不同時期、不同方法下,看它是不是還在。
---
**第三個因子:動量因子,MOM**
停一下。
動量因子,是這五個裡面最「反直覺」的一個。
價值和規模,好歹有風險邏輯撐著。但動量是什麼?
漲得好的股票,繼續漲。跌得慘的股票,繼續跌。
這聽起來,像是在說廢話。
但資料偏偏就是這樣。
尤金·法瑪(Eugene Fama)本人,最初對動量因子是牴觸的。他是有效市場假說的旗手,他怎麼可能接受「過去漲就會繼續漲」這種說法?
但數字擺在面前,他也沒法否認。
動量因子在美國市場的年化超額收益,大約是
**百分之八到十。**
這是五個因子裡最高的。
但風險也最高。
動量策略有一個致命弱點——崩潰。
當市場發生劇烈反轉,動量組合會在極短時間內遭受毀滅性損失。二零零九年三月,金融危機觸底反彈,之前跌得最慘的股票突然暴漲,動量多頭組合在幾周內損失慘重。
石川等人在書中對此有清醒的表述,他的核心觀點是:動量因子的高收益,是對「崩潰風險」的補償。天下沒有免費的午餐,高回報背後,是你必須承擔的尾部風險。
---
**第四個因子:盈利因子,RMW**
RMW,盈利能力強的公司減去盈利能力弱的公司。
這個因子是法瑪和弗倫奇在二零一五年擴充套件五因子模型時加進來的。
邏輯很直接:盈利好的公司,內在價值更高,長期回報更好。
但有意思的地方在哪裡?
盈利因子,和價值因子,在某種程度上是「反著的」。
便宜的股票,往往盈利不好。盈利好的股票,往往估值不低。
所以當你同時持有價值因子和盈利因子,它們會互相「對沖」一部分。
這不是壞事。
這是分散化。
資料上,RMW 在美國市場的年化超額收益大約是
**百分之三到四。**
更重要的是,它和其他因子的相關性低,加進組合裡,能顯著改善風險調整後的收益。
---
**第五個因子:投資因子,CMA**
CMA,保守投資的公司減去激進投資的公司。
什麼叫激進投資?就是一個公司不停地擴張,大量買資產,大量花錢。
市場的規律是:過度投資的公司,長期股價表現往往不好。
為什麼?
有幾種解釋。
一種是風險解釋:保守的公司風險更低,但市場對它們的定價也更低,所以反而有超額收益。
另一種是行為解釋:管理層過度自信,亂投資,損害了股東利益,市場最終會懲罰這種行為。
哪種解釋對?
老實說,學界還沒有定論。
但資料是清楚的。CMA 在美國市場的年化超額收益大約是
**百分之三左右。**
---
**那麼,A 股呢?**
說了這麼多美國資料,A 股的情況怎麼樣?
這是一個非常值得關注的問題。
因為 A 股和美股,是兩個性格完全不同的市場。
A 股散戶比例更高,資訊不對稱更嚴重,市場情緒波動更劇烈。
結果是什麼?
動量因子在 A 股,歷史上有效性相對較弱——甚至有時候是「反轉效應」,也就是漲多了反而要跌。
價值因子在 A 股,有效,但波動更大,需要更長的持有周期。
規模因子在 A 股,歷史上非常顯著——小公司跑贏大公司的現象,在 A 股比美股更明顯。
但這裡有一個當下的對映需要注意。
二零二三年之後,A 股的市場結構在發生變化。機構化程度在提高,量化資金規模在擴大。當越來越多的人用同一套因子策略在市場裡操作,這些因子還會繼續有效嗎?
這個問題,我們先在這裡埋下一顆種子。
---
**五個因子,放在一起看**
讓我們退後一步,把五個因子放在一起。
價值、規模、動量、盈利、投資。
它們有一個共同點:
在長週期資料裡,都有統計顯著的超額收益。
但它們也有一個共同的侷限:
沒有一個因子,能在所有時期都有效。
這就是為什麼,單押一個因子,是危險的。
這就是為什麼,多因子組合,才是實踐的方向。
但組合怎麼配?權重怎麼定?A 股的因子有沒有特殊性?調倉多久一次才合適?
資料給了我們信心,但實操還有一大堆問題沒解決。
理論懂了,資料也看了——但真正要把這套東西用起來,你知道最大的攔路虎是什麼嗎?下一章,我們進入真實的投資組合構建,看看 Smart Beta 和多因子策略,在實戰裡到底長什麼樣。
第 3 章 · 組合實操:Smart Beta 與多因子配置
你已經知道了價值、規模、動量這些因子。但知道因子是一回事,真正用它們賺錢,是另一回事。調倉頻率怎麼定?多個因子怎麼組合?A 股的因子有效嗎?今天我們直接進實操。
上一章我們把五大經典因子拆開來看了個遍——價值、規模、動量、盈利、投資。資料擺在那裡,長期來看,這些因子確實能帶來超額收益。核心結論就一句話:因子有效,但不是每年都有效,你需要足夠長的耐心和足夠寬的視野。
今天,我們不聊資料了。
我們來聊怎麼用。
---
**先回到一個具體的時間節點。**
二〇〇六年。
美國市場上出現了一批奇怪的 ETF。
它們不跟蹤市值加權的標普五百指數,而是按照股息率、低波動、基本面指標來選股、加權。基金公司給它們起了一個好聽的名字——
Smart Beta。
聰明貝塔。
言下之意,普通的市值加權指數是「笨貝塔」,而這些按因子構建的指數,才是「聰明的」。
這個名字一齣,整個被動投資圈都被點燃了。投資者問:我能不能既享受指數基金的低成本、高透明度,又能順手賺到因子溢價?
答案是:理論上,可以。
但現實,遠比理論複雜。
---
**Smart Beta 到底是什麼?**
石川等人在書中的核心觀點是:Smart Beta 本質上是因子投資的產品化。它把學術界發現的因子——價值、低波動、動量、質量——打包成可交易的指數產品,讓普通投資者也能系統性地暴露在這些因子上。
聽起來很美。
但停一下。
你有沒有想過一個問題:同樣是「價值因子 ETF」,不同產品的表現可以差到天壤之別。
為什麼?
因為「價值」這個詞,背後藏著幾十種不同的定義方式。
有的產品用市淨率。有的用市盈率。有的用企業價值倍數。有的把這三個混在一起打分。
定義不同,選出來的股票池就不同。
股票池不同,收益就不同。
所以買 Smart Beta ETF 之前,你最需要做的一件事,不是看過去三年的收益率——
而是開啟它的招募說明書,搞清楚它到底用的是哪個因子、怎麼定義的。
這是第一個坑。
---
**然後我們來說第二個更大的問題:多因子怎麼組合?**
假設你現在手上有五個因子:價值、規模、動量、盈利、低波動。
你會怎麼用它們?
最直覺的做法是:每個因子單獨建一個組合,然後把五個組合等權重加在一起。
這叫「因子組合混合法」。
簡單。粗暴。有一定效果。
但石川在書中指出,還有一種更精細的做法——
多因子打分法。
具體是什麼意思?
你不是先建五個單因子組合,再把它們加在一起。
而是對每一隻股票,同時在五個維度上打分,算出一個綜合得分,然後直接按綜合得分選股。
這兩種方法,區別大嗎?
大。
舉個例子。
假設有一隻股票,價值得分極高,但動量得分極低。
用「因子組合混合法」,這隻股票會進價值因子組合,但不會進動量因子組合。兩個組合加在一起,它的權重被稀釋了,但還是有一定暴露。
用「多因子打分法」,這隻股票的綜合得分可能只是中等,直接被排在中間梯隊,拿不到高權重。
哪種更好?
沒有絕對答案。
但多因子打分法的優勢在於:它能篩選出在多個維度上同時表現優秀的股票,而不是在某一個維度上極端突出的股票。
這類股票,往往更穩健。
---
**說到 A 股,我們必須單獨拿出來聊。**
因為 A 股的因子有效性,和美股是不一樣的。
這一點,石川等人在書中有非常直接的表述:A 股市場有其獨特的結構性特徵,這些特徵會顯著影響因子的有效性。
具體說,有幾個關鍵差異。
第一,A 股的動量因子,歷史上表現並不穩定。
在美股,動量效應非常顯著——過去半年漲得好的股票,未來半年大機率還會繼續漲。
但在 A 股,這個規律要弱得多。
為什麼?
A 股的散戶比例遠高於美股。散戶喜歡追漲殺跌,但也喜歡「買跌」,認為漲多了要跌、跌多了要漲。這種行為模式,會在一定程度上抵消動量效應。
第二,A 股的價值因子,在某些時期有效,在某些時期完全失靈。
二〇一五年那場牛市,你還記得嗎?
市場幾乎不看基本面,什麼概念熱就買什麼。傳統意義上的「低估值」股票,在那段時間大幅跑輸市場。
價值因子,在極度情緒化的市場裡,會暫時失效。
第三,A 股的規模因子,歷史上非常顯著——
小市值股票長期跑贏大市值股票。
但這背後,有一部分原因是 A 股的退市制度不完善,小市值公司被殼資源炒作,帶來了一種「虛假的」規模溢價。
隨著註冊制推進、退市加速,這部分溢價正在被壓縮。
所以在 A 股做因子投資,不能照搬美股的經驗。
你需要重新驗證,重新校準。
---
**現在我們來說一個很多人忽略的實操問題:調倉頻率。**
你建好了一個多因子組合。
多久換一次倉?
每天?每週?每月?每季度?
直覺上,你可能覺得換得越勤,越能跟上因子訊號的變化,收益越好。
停。
這個直覺是錯的。
石川等人在書中明確指出:調倉頻率越高,交易成本越高,對淨收益的侵蝕就越嚴重。
A 股的交易成本,包括印花稅、佣金、衝擊成本,加在一起,對於小市值股票來說,單次換倉的成本可以達到百分之零點五甚至更高。
百分之零點五。
聽起來不多?
一年換倉十二次,雙邊來回,成本可能吃掉你百分之十二的收益。
這已經是很多因子年化超額收益的全部了。
所以,調倉頻率不是越高越好。
大多數實證研究表明,對於基於基本面的價值、盈利類因子,月度或季度調倉是比較合理的頻率。
對於動量類因子,可以適當提高頻率,但也不宜超過月度。
這不是精確的公式,但是一個有用的經驗範圍。
---
**最後,我們來說一個更深層的問題:容量與擁擠度。**
這是很多散戶投資者沒想到過的問題。
因子策略,有沒有「裝不下錢」的問題?
答案是:有。
而且非常嚴重。
想象一下。
某個因子策略在過去十年的回測中表現極好。於是越來越多的機構開始用它。大家都在買同樣的股票,都在同樣的時間點買入、賣出。
會發生什麼?
買入的時候,大家一起把價格推高,導致買入成本上升。
賣出的時候,大家一起拋售,導致賣出價格下跌,衝擊成本急劇擴大。
這就叫因子擁擠。
石川等人在書中對此有深刻的警示:當某個因子策略被過多資金追逐時,它的超額收益會被侵蝕,極端情況下甚至會出現「因子崩潰」——所有持有這個因子的組合同時大幅虧損。
二〇〇七年八月。
美國量化基金圈發生了一件著名的事件,後來被稱為「寬客危機」。
那一週,幾乎所有量化多因子基金同時出現了巨大虧損。
原因就是:太多基金持有了太相似的因子組合。當其中一家基金因為流動性壓力開始強制平倉,引發了連鎖反應,所有人同時踩踏出逃。
這不是理論。
這是真實發生過的歷史。
所以,容量是因子策略的天花板。
當你管理的資金體量足夠大,你必須考慮:你的買賣行為本身,會不會影響市場價格?你的策略,還有多少超額收益的空間?
對於普通個人投資者來說,這個問題不那麼緊迫。
但對於想要認真做量化投資的人,這是繞不開的現實約束。
---
**好,我們來做個小結。**
今天這一章,我們從理論走進了實操。
Smart Beta 是因子投資的產品化,但你要看清楚它用的是哪個因子、怎麼定義的。
多因子打分法,能篩出在多個維度同時優秀的股票,比簡單疊加更精細。
A 股有自己的因子邏輯,不能照搬海外經驗,需要獨立驗證。
調倉頻率要和交易成本做權衡,頻繁換倉會把超額收益吃光。
容量和擁擠度,是因子策略的隱形天花板。
這些,是把因子從論文變成真金白銀必須面對的問題。
但是——
等等。
你有沒有想過一個更根本的問題?
我們講了這麼多因子,這麼多策略,這麼多資料。
這些資料,是真的嗎?
回測出來的收益,是真實可以拿到手的收益嗎?
還是說,我們只是在用歷史資料,講一個自己想聽的故事?
下一章,我們要進入這本書最讓人不安的部分——
回測過擬合、資料探勘偏差、因子衰減。
量化投資的邊界,到底在哪裡?
你準備好了嗎?
第 4 章 · 陷阱與邊界:回測過擬合與因子衰減
你有沒有想過——一個在歷史資料上完美執行的策略,上線第一天就開始虧錢?這不是運氣問題,也不是市場變了。很可能,從一開始,那個策略就是假的。今天這一章,我們來聊量化投資最危險的那道坎。
上一章我們把因子投資的實操層面走了一遍。
Smart Beta、多因子打分、A 股的特殊性、調倉頻率……
核心結論是:因子有效,但要落地,細節決定生死。
今天,我們來收尾。
不聊怎麼賺錢了。
我們來聊——怎麼避免被坑。
---
**先還原一個場景。**
二〇〇七年。
華爾街。
一家量化對沖基金的研究員,盯著螢幕上的回測報告。
年化收益,三十二個百分點。
最大回撤,不超過八個百分點。
夏普比率,兩點一。
他把報告遞給基金經理,說:這個策略跑了十五年的歷史資料,非常穩。
基金經理點點頭。
上線。
然後——
二〇〇七年八月,量化危機爆發。
那一週,幾乎所有用類似邏輯構建的量化基金,同時鉅虧。
有的單週跌了百分之二十。
為什麼?
策略沒問題。
邏輯沒問題。
但有一件事,他們忽略了。
---
**這件事,叫做回測過擬合。**
什麼是回測過擬合?
簡單說:你用歷史資料找規律,找著找著,找出了一個「假規律」。
它在歷史資料上表現完美,因為它本來就是從這段歷史資料裡「挖」出來的。
你把資料挖了一遍又一遍,換引數、換週期、換組合方式,直到找到一個看起來很好的結果。
然後你以為這是「發現」。
其實,你只是在做資料擬合。
石川在書中寫道,這個問題的本質是:研究者在不知不覺中,把歷史資料的「噪聲」當成了「訊號」。
停。
這句話要細品。
噪聲,是隨機的波動。
訊號,是真實存在的規律。
歷史資料裡,兩者混在一起。
你的模型越複雜,引數越多,它就越能「解釋」歷史——但它解釋的,很可能是噪聲。
等到真實市場來了,噪聲消失了,你的策略就垮了。
---
**有多嚴重?**
美國學者坎貝爾·哈維做過一個統計。
金融學術期刊上發表的因子研究,數量超過——
三百個。
三百個因子。
每一個,在論文裡都有統計顯著性支撐。
但他的核心觀點是:其中相當大比例,可能根本經不起樣本外檢驗。
為什麼?
因為發表偏差。
做研究的人,找到了有效的因子,就發表。
找到了無效的因子,就不發表。
於是你看到的,全是「有效」的。
這就像一個賭場,只把贏錢的客人推出來做廣告。
你看到的,全是贏家。
---
**這在量化圈有個專門的名字:資料探勘偏差。**
英文叫 Data Snooping Bias。
石川在書中特別強調,這是量化投資領域最隱蔽、也最致命的陷阱之一。
為什麼隱蔽?
因為你自己都不知道自己在挖資料。
你以為你在做嚴謹的研究。
你有邏輯、有假設、有統計檢驗。
但如果你在同一批資料上反覆測試,哪怕每次都「有邏輯」,最終結論的可靠性也在下降。
統計學有個概念叫「多重檢驗」。
你做一次檢驗,誤報機率是百分之五。
你做二十次檢驗,至少有一次誤報的機率——
超過六成。
六成。
所以,當你看到一個「顯著有效」的因子,第一個問題不是「它為什麼有效」,而是——
它被測試過多少次?
---
**好,假設你的因子是真實的。**
假設它經過了嚴格的樣本外驗證。
假設它不是資料探勘的產物。
然後呢?
然後你還有另一個問題。
叫做因子擁擠。
---
**再還原一個場景。**
二〇一五年到二〇一八年。
A 股市場。
量化投資開始大規模興起。
越來越多的私募基金、公募基金,開始用同樣的因子——
低估值、高動量、小市值。
大家都在用。
大家都在買同樣的股票。
這些股票的價格,被推高了。
因子還有效嗎?
短期看,更有效了——因為更多人買,價格漲得更快。
但這只是幻覺。
等到某一天,市場風格切換,或者某個大型機構開始減倉——
所有用同樣因子的策略,同時觸發賣出訊號。
同時賣。
流動性枯竭。
價格暴跌。
這就是因子擁擠的崩塌方式。
不是慢慢失效,而是——
突然斷裂。
---
**這個場景,和二〇〇七年華爾街的量化危機,本質上是一回事。**
太多人用同樣的邏輯,同樣的因子,同樣的進出場規則。
市場一旦異動,所有人同時踩踏。
書中的核心觀點是:因子的有效性,不是一個靜態的存在,而是動態的,會隨著使用它的資金規模變化。
當一個因子被發現、被廣泛使用,它的超額收益就開始被侵蝕。
這不是陰謀,這是市場競爭的自然結果。
你發現了一個金礦。
你挖。
別人也發現了。
也挖。
金礦挖空了。
超額收益,消失了。
---
**那因子輪動呢?**
有人說:沒關係,因子會輪動。
價值因子失效的時候,動量因子有效。
動量因子失效的時候,質量因子有效。
我只要跟著輪,不就行了?
聽起來很聰明。
但等等。
你怎麼知道,現在輪到哪個因子?
如果你用歷史資料來判斷因子輪動規律——
你又回到了回測過擬合的陷阱裡。
因子輪動本身,也需要預測。
而預測,是量化投資裡最難的事。
石川在書中對此相當剋制,他的態度是:因子輪動有其邏輯,但對輪動時機的預測,目前沒有可靠的方法。
剋制。
這兩個字,我覺得是整本書最值錢的地方。
---
**來看一個當下的對映案例。**
二〇二三年,A 股市場。
有一批次化基金,用的是超高頻的小市值因子策略。
在某些階段,年化收益非常亮眼。
但二〇二四年初,監管收緊,市場流動性結構變化,小市值股票集體暴跌。
那些策略,單週最大回撤超過二十個百分點。
很多投資者不理解:明明歷史資料這麼好,為什麼突然就不行了?
答案就在這本書裡。
第一,策略可能本身就存在過擬合——在特定市場結構下「挖」出來的,換個環境就失效。
第二,因子擁擠——太多資金用同樣邏輯,同樣的崩塌方式。
第三,容量限制——策略的超額收益,和它能承載的資金規模,是反比關係。規模越大,越難賺。
這不是某家基金的失誤。
這是量化投資的結構性邊界。
---
**那量化投資,到底有沒有用?**
有用。
但你要知道它的邊界在哪裡。
邊界一:回測不等於未來。
任何策略,都要做樣本外驗證。
不是用同一批資料的後半段,而是真正的「未來資料」——也就是實盤檢驗。
邊界二:因子有效性是動態的。
今天有效,不代表明天有效。
規模越大,超額收益越難維持。
邊界三:輪動難以預測。
不要試圖精確踩點。
分散配置多個因子,才是更穩健的做法。
邊界四:市場不是靜止的實驗室。
你的策略進入市場,市場就會改變。
這是量化投資和物理學最大的不同——
你觀測它,它就變了。
---
**回頭看這本書。**
我們從第一章開始,從 CAPM 單因子講起,到法瑪和弗倫奇的三因子模型,搞清楚了「因子」這個概念到底是什麼。
第二章,我們把五大經典因子一一拆解,用資料說話——價值、規模、動量、盈利、投資,每一個背後都有真實的風險溢價邏輯。
第三章,我們落到實操層面,Smart Beta 怎麼選,多因子怎麼配,A 股有哪些特殊性,容量和擁擠度怎麼考量。
第四章,也就是今天,我們來到了這本書最冷靜的地方——
陷阱在哪裡,邊界在哪裡。
作者真正想告訴我們的,不是「因子投資包賺不賠」,而是:
這是一套有邏輯、有證據支撐的方法論。
但它不是魔法。
它需要你理解它的侷限,尊重它的邊界,然後在這個框架內,做出更理性的決策。
合上這本書,帶走的不是一個策略,而是一種思維方式:
用證據說話,但永遠對證據保持懷疑。
用證據說話,但永遠對證據保持懷疑。—— 石川等,因子投資:方法與實踐,核心方法論總結
本篇出現的關鍵概念
- 貝塔 (Beta)
- 衡量一支股票相對於整體市場波動幅度的係數。貝塔等於1代表與市場同步,等於2代表市場漲10%時該股漲20%、跌10%時跌20%。CAPM理論認為貝塔是唯一應被補償的風險來源,但法瑪和弗倫奇的實證研究證明,高貝塔並不系統性地帶來更高長期回報,這是三因子模型取代CAPM的核心依據。
- HML因子 (High Minus Low)
- 法瑪-弗倫奇三因子模型中的價值因子,由高賬面市值比股票組合減去低賬面市值比股票組合的收益差構成。直白理解是買便宜股票、賣貴股票的超額收益。美國市場1926年至今年化超額收益約4-5%,但在2010年代成長股主導的市場環境中曾經歷較長時間的顯著失效期。
- Smart Beta
- 因子投資的產品化形式,指按照價值、低波動、動量、質量等因子而非傳統市值加權方式構建的指數產品。2006年前後在美國市場興起。核心優勢是低成本、透明度高、系統性暴露於因子溢價。但同名產品因因子定義方式不同(市淨率、市盈率或企業價值倍數)可能導致選股池和收益表現差異懸殊,購買前必須核查招募說明書中的具體因子定義。
- 因子擁擠 (Factor Crowding)
- 當大量資金同時使用相同因子策略進行交易時,因子的超額收益會被壓縮甚至消失的現象。以A股為例,2023年後量化資金規模快速擴大,越來越多機構使用相似的多因子模型,導致原本有效的因子訊號在執行層面產生擁擠,是因子投資在實踐中面臨的核心風險之一,也是本書第四章重點討論的邊界問題。
關於入門系列
《因子投資:方法與實踐》由石川、劉洋溢、連祥斌合著,於2020年由電子工業出版社出版,是中文世界第一本系統講述多因子投資方法論的實操教材。 石川擁有物理學博士背景,長期深耕量化投資領域,曾任職於國內頭部量化私募機構。他的研究路徑代表了一批從理工科轉型金融的量化從業者的典型軌跡:從學術嚴謹性出發,試圖在中國本土市場驗證和修正西方成熟的因子投資理論。 這本書的寫作背景是2010年代末中國量化投資行業的快速擴張期。彼時A股市場的機構化程度仍相對較低,量化策略的超額收益空間尚未被充分壓縮,但學界和業界之間存在明顯的知識斷層——學術論文大多以英文發表且高度技術化,普通從業者和投資者難以直接應用。 本書的核心貢獻在於三個層面:第一,系統梳理了從CAPM到法瑪-弗倫奇五因子模型的理論演進脈絡,為中文讀者提供了完整的學術背景;第二,用A股歷史資料對五大經典因子進行了本土實證檢驗,明確指出A股因子有效性與美股的異同;第三,將多因子打分、Smart Beta配置、回測方法論等實操內容以中文語境呈現,填補了理論與實踐之間的空白。 本書出版後成為國內量化投資從業者和CFA/FRM備考者的重要參考書目,也是高校金融工程課程的推薦讀物之一。
檢視入門系列全部投資筆記 →本篇 6 句最值得抄進筆記的話
- 因子是能夠系統性地解釋一組資產收益差異的、可量化的特徵變數。—— 《因子投資:方法與實踐》本篇
- 因子不是每年都有效,但它的有效性,經得起長週期的檢驗。短期失效,不代表邏輯破了,代表的是你需要更長的耐心。—— 《因子投資:方法與實踐》本篇
- 動量因子的高收益,是對崩潰風險的補償。天下沒有免費的午餐,高回報背後,是你必須承擔的尾部風險。—— 《因子投資:方法與實踐》本篇
- Smart Beta本質上是因子投資的產品化。它把學術界發現的因子打包成可交易的指數產品,讓普通投資者也能系統性地暴露在這些因子上。—— 《因子投資:方法與實踐》本篇
- 股票的預期收益,不能僅由市場貝塔解釋。規模和價值,能解釋CAPM解釋不了的部分。—— 尤金·法瑪與肯尼斯·弗倫奇,1992年論文《股票預期收益的橫截面》
- 有效市場並不意味著所有異象都是噪音。有些異象是真實的風險溢價,有些是資料探勘的產物,區分它們是因子研究最核心的挑戰。—— 尤金·法瑪,2010年訪談



