這篇講什麼
資料預測專家西爾弗寫的預測哲學——為什麼聰明人也會預測錯?怎麼從海量噪聲中找出真正的訊號?
二〇〇八年金融危機前夕,華爾街最聰明的人們手握海量資料,用著最精密的模型,得出了同一個結論:風險可控。然後,一切崩塌了。這不只是一次金融失敗,更是一次預測的集體失敗。有意思的地方在這裡——失敗的原因不是資料太少,恰恰相反,可能是資料太多了。納特·西爾弗在《訊號與噪聲》裡提出了一個讓人不舒服的問題:我們以為資訊越多判斷越準,但如果大多數資訊都是噪聲,更多資料只會讓我們更自信地犯錯。這本書不是在教你「如何預測未來」,而是在拆解一件更根本的事——為什麼我們總是高估自己看清現實的能力,以及有沒有一種更誠實的方式來面對不確定性。讀完你可能會發現,那些在市場裡頻繁發聲、言之鑿鑿的人,往往是最不可信的那批人。
誰該讀這一篇
- 如果你習慣用技術指標、財報資料或宏觀新聞做投資決策,卻發現資訊越看越多、判斷卻越來越混亂,不知道哪些資料真正有預測價值、哪些只是讓你感覺在認真研究的背景噪音,這篇精讀會幫你建立一套區分訊號與噪聲的底層框架,從根本上改變你處理資訊的方式。
- 如果你對量化投資感興趣,但總覺得模型回測漂亮、實盤卻頻繁失效,不理解為什麼歷史資料擬合得越好反而越容易虧錢,想搞清楚過擬合、反身性這些概念在實際市場中意味著什麼,西爾弗對金融預測困難性的系統分析會給你一個清醒的認知校準。
- 如果你是對機率思維、認知偏誤或決策科學感興趣的讀者,想了解為什麼政治學家菲利普·泰洛克追蹤三百名專家二十年後得出令人沮喪的結論,以及貝葉斯定理如何從一個十八世紀牧師的遺稿變成現代預測科學的核心工具,這篇精讀提供了有資訊密度的系統梳理。
本篇 6 個核心觀點
- 1資料增加不等於訊號增加。西爾弗的核心論點是:資訊爆炸時代,噪聲的增速往往超過訊號。以股市為例,觀察年度回報時訊號與噪聲比約為5比1,但縮短至日線級別,這一比例驟降至1比45。這意味著每天盯盤處理的資訊中,超過97%是對預測毫無幫助的隨機波動,努力程度與準確率之間並不存線上性關係。
- 2過度自信是專家預測失敗的系統性根源。政治學家菲利普·泰洛克歷時二十年、收集近三百名專家逾八萬條預測判斷後發現,這些專家的整體準確率與隨機猜測相差無幾。更反直覺的是,媒體曝光度越高的專家,預測準確率反而越低;而那些習慣承認不確定性、給出機率區間而非確定性結論的分析師,校準表現更為可靠。
- 3貝葉斯思維的本質是持續更新,而非一次性判斷。托馬斯·貝葉斯在1763年發表的遺作提出了一個核心機制:先建立基於歷史資料的先驗機率,再用新證據系統性地修正這一機率,得出後驗判斷。西爾弗認為,好的預測者與壞的預測者最根本的區別,不在於最終是否猜對,而在於每個時間節點上能否給出經過合理校準的機率估算。
- 4金融市場的反身性使預測工具本身成為市場變數。天氣預報不會改變天氣,但金融預測會改變市場價格。當足夠多的參與者使用同一個模型時,模型所發現的定價錯誤會被迅速套利消除,模型隨即失效。這一機制意味著,金融市場中任何有效的預測方法都具有自我毀滅的傾向,這是金融預測比氣象、醫學等領域從根本上更困難的原因之一。
- 5模型的幻覺源於歷史資料的邊界。2008年金融危機中,華爾街主流風險模型集體失效,根本原因不是計算錯誤,而是這些模型用歷史資料訓練,而歷史資料中不存在全國性房價大幅下跌的記錄。黑天鵝事件按定義不會出現在歷史樣本里。2020年新冠疫情再次驗證了這一點:幾乎所有經濟預測模型在全球停擺面前同時失效,西爾弗早在2012年便已寫下這一警告。
- 6機率表述而非確定性表述,是更誠實也更有效的預測形式。西爾弗通過對比美國國家氣象局與私人氣象公司的預報資料發現,國家氣象局的機率預報校準度顯著更高——他們說70%降雨機率,實際降雨率接近七成。而私人公司因為使用者更厭惡漏報雨天,系統性地誇大降雨機率。這說明激勵結構會扭曲先驗判斷,預測者必須識別並剝離自身的利益偏向,才能做出真正校準過的機率估算。
試聽第一章音訊解讀
精讀全文
第 1 章 · 為什麼聰明人也會預測錯
二〇〇八年,全球最聰明的一批經濟學家、銀行家、評級機構,手握海量資料,配備最精密的模型——然後,他們集體預測錯了。為什麼?是資料不夠多?還是模型不夠好?納特·西爾弗說:都不是。問題出在更根本的地方。
你有沒有遇到過這種時刻——
某個專家信誓旦旦地說,這次經濟一定軟著陸。某個分析師拍著胸脯說,這隻股票下個季度必漲。某個氣象臺預報明天百分之百晴天,結果你出門就被淋成落湯雞。
我們活在一個預測氾濫的時代。
但預測的準確率,從來沒有因為資料更多、模型更復雜而顯著提升。
這是為什麼?
這就是納特·西爾弗寫《訊號與噪聲》想回答的問題。
---
**先認識一下這本書的作者。**
納特·西爾弗,美國統計學家、預測專家。他創辦了大名鼎鼎的「五三八」網站——名字來自美國選舉人團的總票數。
二〇〇八年美國總統大選,他用統計模型預測了五十個州中的四十九個州的選舉結果。
四十九個。
二〇一二年,他做到了五十個州全對。
在一個滿地「專家」的世界裡,這個成績讓人無法忽視。但西爾弗不是來炫耀的。他寫這本書,是為了拆解一個更深的問題:
為什麼大多數預測都是錯的?
而那些做對的預測,又是怎麼做到的?
---
**這本書我們會分四章來讀。**
第一章,也就是今天,我們從西爾弗的核心命題切入——預測為什麼這麼難?訊號和噪聲究竟是什麼關係?我們會看到,聰明人犯錯,往往不是因為不夠聰明,而是因為陷入了一個叫「過度自信」的陷阱。
第二章,我們深入貝葉斯思維。這是西爾弗全書最核心的工具——一種用機率來思考、用證據來更新判斷的方式。聽起來像數學,但其實是一種思維習慣。
第三章,我們聚焦金融市場。西爾弗專門分析了為什麼金融預測比其他領域更難——市場有反身性,黑天鵝隨時出現,模型越複雜,反而越容易出問題。
第四章,落腳到行動。不確定性無法消除,但我們可以在不確定中做出更好的決策。西爾弗給出了成為更好預測者的具體路徑。
好,現在我們進入第一章。
---
**先從一個場景說起。**
二〇〇七年底,美國房地產市場開始出現裂縫。
但華爾街的主流聲音是什麼?
「這只是區域性調整。」「次貸規模有限,不會系統性蔓延。」「我們的模型顯示,風險可控。」
當時花旗集團的執行長查克·普林斯說了一句後來被反覆引用的話,大意是:只要音樂還在響,你就得繼續跳舞。
音樂還在響。
然後,音樂停了。
二〇〇八年,雷曼兄弟倒閉,全球金融危機爆發,數萬億美元財富蒸發,數以百萬計的普通人失去工作和住房。
那些最聰明的人,手握最多的資料,用著最複雜的模型——
全部預測錯了。
西爾弗在書中寫道,這場危機不只是金融的失敗,更是預測的失敗。人們把噪聲當成了訊號,把模型的精密當成了現實的可靠。
---
**什麼是訊號,什麼是噪聲?**
這是西爾弗整本書的核心命題。
他的定義很清晰:
訊號,是真實存在的、能幫助我們理解世界的資訊。
噪聲,是隨機的、無規律的、會干擾我們判斷的資料。
問題在哪裡?
問題在於,訊號和噪聲長得太像了。
你看到一組資料,它可能是真實趨勢,也可能只是隨機波動。你看到一個模式,它可能是規律,也可能是你的大腦在隨機點之間強行連線。
人類的大腦,天生不擅長區分這兩者。
西爾弗的核心觀點是:我們生活在一個資訊爆炸的時代,但更多的資訊不等於更多的訊號。很多時候,資料越多,噪聲也越多,反而讓我們更容易迷失。
停。
這個觀點值得反覆想一想。
我們通常以為,資料越多越好,資訊越多越準確。但西爾弗說,不對。
他舉了一個例子。假設你在預測一場棒球比賽的結果。你有球員的擊球率、投手的ERA、球隊的主客場勝率、天氣情況、草坪溼度……資料堆成山。
但如果你不知道哪些資料是真正有預測力的,哪些只是背景噪音,你的預測可能還不如一個只看最近十場比賽的老球迷。
資料本身不是答案。
區分訊號和噪聲,才是答案。
---
**那為什麼聰明人也會預測錯?**
西爾弗給出了幾個關鍵原因。
**第一,過度自信。**
研究顯示,當人們說某件事「百分之九十確定」的時候,他們實際上只有大約百分之七十到七十五的準確率。
百分之九十的自信,換來百分之七十五的準確率。
這個偏差,在專家身上更嚴重,不是更輕。
為什麼?因為專家掌握更多資訊,這讓他們感覺更確定,但感覺確定和實際準確是兩回事。
西爾弗在書中特別提到了一個著名的研究——政治學家菲利普·泰洛克花了二十年時間,收集了近三百名政治和經濟專家的預測,總計八萬多條判斷。
結果怎樣?
這些專家的預測準確率,還不如隨機猜測高多少。
更扎心的是——
越是媒體上頻繁出現的「大嘴」專家,預測越不準。
越是那些謹慎、承認不確定性的分析師,預測反而更可靠。
**第二,把相關性當因果性。**
這是資料分析中最常見的陷阱。
兩件事同時發生,不代表一件事導致了另一件事。
西爾弗舉了一個極端的例子:美國某些縣的有機食品銷售量,和自閉症發病率高度相關。
你能因此說有機食品導致自閉症嗎?
當然不能。
但在金融市場上,這種錯誤每天都在發生。某個指標和股市上漲同步了三年,分析師就開始把它當成預測工具。然後第四年,這個關係突然消失了。
因為它本來就不是訊號,只是噪聲。
**第三,模型的幻覺。**
二〇〇八年金融危機中,那些複雜的風險模型,有一個共同的問題——它們是用歷史資料訓練出來的。
但歷史資料裡,沒有「歷史上從未發生過的事」。
黑天鵝,按定義,不會出現在歷史資料裡。
所以模型告訴你風險極低,不是因為風險真的低,而是因為那種風險從來沒被見過、沒被記錄、沒被納入模型。
西爾弗的核心觀點是:模型是對現實的簡化,而不是現實本身。當我們把模型的輸出當成現實的真相,麻煩就來了。
---
**說到這裡,我想給你一個當下的對映。**
現在是人工智慧大爆發的時代。
各種AI模型被用來預測股價、預測經濟走勢、預測使用者行為。資料量比二〇〇八年大了不知道多少倍,模型的複雜程度也是指數級提升。
但有一件事沒變——
這些模型,依然是用歷史資料訓練的。
它們依然無法預測「歷史上從未發生過的事」。
二〇二〇年新冠疫情爆發,幾乎所有的經濟預測模型在那一刻集體失效。不是因為模型不夠好,而是因為這種規模的全球停擺,不在任何歷史資料裡。
西爾弗早在二〇一二年就寫下了這個警告。
今天讀來,依然有效。
---
**那我們該怎麼辦?**
西爾弗沒有說「放棄預測」。他說的是:
承認不確定性,是做好預測的第一步。
這聽起來很反直覺。我們通常覺得,好的預測者應該自信、果斷、給出明確答案。
但西爾弗說,恰恰相反。
真正好的預測,是用機率說話,而不是用確定性說話。
不是「明年經濟會衰退」,而是「明年經濟衰退的機率是百分之四十」。
不是「這隻股票會漲」,而是「基於現有資訊,這隻股票上漲的可能性更大,但我可能是錯的」。
這種思維方式,有一個名字。
貝葉斯思維。
這就是我們下一章要深入探討的核心工具。
---
西爾弗在書的前言裡有一句話,大意是這樣的:
預測不是為了證明自己正確,而是為了在不確定中做出更好的判斷。
這個區別,看起來微小,實則天壤之別。
如果你預測是為了證明自己正確,你會傾向於選擇確定性高的表述,迴避承認錯誤,把模型的輸出當成真相。
如果你預測是為了做出更好的判斷,你會主動尋找反駁自己的證據,承認模型的侷限,把每一次預測錯誤當成更新認知的機會。
前者,是噪聲製造機。
後者,才是訊號捕捉者。
---
好,第一章我們先到這裡。
今天我們看到了預測失敗的三個根源——過度自信、混淆相關與因果、模型的幻覺。也看到了西爾弗給出的方向:用機率思考,承認不確定性。
但這只是方向。
具體怎麼做?有沒有一套可以操作的思維框架?
三百年前,一個英國牧師在遺作裡留下了一個公式。這個公式後來改變了統計學、醫學、情報分析,甚至影響了現代投資決策。
它叫貝葉斯定理。
它到底是什麼?為什麼西爾弗說,它是區分好預測者和壞預測者最重要的工具?
我們下一章見。
第 2 章 · 貝葉斯思維:從機率到行動
你有沒有想過——你每天做的每一個判斷,其實都是一次機率計算?只是大多數人算錯了。有一個兩百多年前的牧師,用一個簡單到離譜的公式,徹底改變了人類對「不確定性」的理解。今天我們就來拆開它。
上一章我們講了預測的悖論——資料越來越多,模型越來越複雜,但預測的準確率並沒有因此提升。核心原因是:我們分不清訊號和噪聲。那今天的問題來了,既然噪聲無處不在,我們到底該怎麼思考?西爾弗給出的答案,是一個名字聽起來很學術、但本質上極其實用的工具。
貝葉斯定理。
---
**先認識一個人。**
託馬斯·貝葉斯。
英國牧師,十八世紀。
他不是數學家,不是經濟學家,甚至不是職業學者。他只是一個對「上帝存在的機率」感到好奇的神學家。
他在世時,這篇論文從未發表。
他死後兩年,一七六三年,他的朋友幫他把手稿整理出來,投給了英國皇家學會。
就這樣,一篇差點被歷史淹沒的論文,成了現代機率論的基石。
停。
你可能要問了:一個牧師寫的東西,跟我的投資決策有什麼關係?
關係大了。
---
**貝葉斯定理到底在說什麼?**
用最簡單的話說,就是四個字:
用證據更新。
西爾弗在書中寫道,貝葉斯定理的核心不是一個公式,而是一種思維方式——你對世界的判斷,不應該是一個固定的答案,而應該是一個隨時可以被新證據修正的機率。
聽起來簡單。
但大多數人不是這樣思考的。
大多數人的思維模式是什麼?是「我認為」。是「我感覺」。是一旦形成判斷,就開始找證據來支援它,而不是用證據來更新它。
這就是確認偏誤。
這就是為什麼聰明人也會預測錯。
---
**來還原一個歷史場景。**
一九四五年,二戰結束前夕。
美國情報機構面對一個問題:日本會不會在本土決戰?
大量情報湧來。有的說日本已經精疲力竭,有的說日本本土還有數百萬士兵。有的說天皇想議和,有的說軍部堅決抵抗。
情報分析員們怎麼處理這些資訊?
大多數人選擇了自己「相信」的那一套,然後把其他資訊當作噪聲過濾掉。
結果呢?
沒有人預測到廣島之後日本會迅速投降。
沒有人預測到一顆炸彈就能改變整個戰局。
為什麼?
因為他們的判斷是靜態的。他們沒有一個機制,讓新證據真正改變自己的機率估算。
這就是貝葉斯思維缺席的代價。
---
**那貝葉斯思維是怎麼運作的?**
三個步驟。
第一步:先驗機率。
在你看到任何新證據之前,你對這件事的基礎判斷是什麼?
舉個例子。你在路上撿到一個錢包。你會不會想「這是陷阱」?
你的先驗機率,來自你的經驗、常識、歷史資料。大多數撿到的錢包不是陷阱——這就是你的先驗。
第二步:新證據。
你開啟錢包,裡面有一張便條,寫著「如有拾獲請聯絡某某某」,還有一疊現金。
這是新證據。
第三步:更新機率。
你把先驗機率和新證據結合起來,得出一個新的判斷——後驗機率。
這個錢包大機率不是陷阱,而是有人真的丟了錢包。
你的行動隨之改變:你打電話聯絡失主。
---
聽起來很直覺化,對嗎?
但等等。
真正難的,不是這個流程。
真正難的,是兩件事。
第一:你的先驗機率從哪裡來?
第二:你願不願意在證據面前,真的改變自己的判斷?
---
**先說先驗機率。**
西爾弗的核心觀點是:先驗機率不能憑感覺,必須有資料基礎。
但人類天生不擅長這件事。
我們對罕見事件的機率估算,系統性地偏高。
我們對常見事件的機率估算,系統性地偏低。
為什麼?
因為我們用的是記憶,不是統計。
飛機失事的新聞你記得清清楚楚,但你忘了全年坐飛機死亡的機率是多少。
百萬分之零點零七。
而開車上路的死亡率,是坐飛機的將近一百倍。
但大多數人覺得坐飛機更危險。
這就是先驗機率被情緒汙染的結果。
---
**再說第二件難事:你願不願意更新?**
這才是真正的戰場。
西爾弗在書中舉了一個讓人印象深刻的例子——氣象預報員。
他發現,美國國家氣象局的預報員,在機率校準上做得相當好。他們說「明天有百分之七十的降雨機率」,真實降雨率確實接近七成。
但私人氣象公司呢?
他們的預報系統性地誇大了降雨機率。
為什麼?
因為使用者更害怕「沒帶傘被淋溼」,而不是「帶了傘沒用上」。
所以氣象公司把機率往高處報,迎合使用者心理。
這叫什麼?
這叫激勵扭曲了先驗。
你以為你在做機率判斷,其實你在做利益判斷。
---
**這件事放到投資裡,會發生什麼?**
想一想。
二零零七年,次貸危機前夜。
華爾街的風險模型都在說:房價不會大幅下跌。
為什麼?
因為過去幾十年的資料裡,全國性的房價大跌從未發生過。
先驗機率:房價崩盤的可能性極低。
但新證據呢?
次級貸款違約率開始攀升。
槓桿率創歷史新高。
金融機構開始悄悄對衝自己的風險敞口。
這些都是訊號。
但大多數人沒有更新自己的機率。
為什麼?
因為更新意味著承認自己之前的判斷可能有問題。
因為更新意味著要放棄已經押注的倉位。
因為更新有成本,不更新有藉口。
結果呢?
雷曼兄弟倒閉。
金融海嘯。
數以萬億計的財富蒸發。
---
**貝葉斯思維的真正價值,在這裡。**
它不是讓你預測未來。
沒有人能預測未來。
它是讓你在不確定的世界裡,持續做出比別人更合理的判斷。
西爾弗的核心觀點是:好的預測者,不是那些最終被證明正確的人,而是那些在每一個時間節點上,都能給出最準確機率估算的人。
注意這個區別。
結果正確,可能是運氣。
過程合理,才是能力。
---
**一個當下的對映案例。**
你在考慮要不要買某隻基金。
你看到它過去三年年化收益百分之二十。
你的第一反應是什麼?
大多數人的第一反應是:這隻基金很牛,應該買。
但貝葉斯思維會怎麼問?
先驗機率:一個基金能持續跑贏市場的機率,歷史資料告訴我們,大約只有百分之十到二十。
新證據:過去三年收益百分之二十。
這個證據,是真實的阿爾法,還是恰好趕上了牛市的貝塔?
這兩者的機率,你有沒有認真估算過?
如果沒有,你的決策就不是貝葉斯的,而是情緒的。
---
**最後,西爾弗在書中提到了一個讓人警醒的概念:過度自信。**
他說,大多數人在做預測時,給出的置信區間太窄了。
什麼意思?
你說「我九成把握明年經濟會復甦」,但如果真的讓一百個人各做一百次這樣的判斷,那些聲稱九成把握的預測,實際準確率可能只有六成。
這個差距,叫做校準誤差。
校準誤差越小,你的機率判斷越可靠。
校準誤差越大,你的自信只是一種幻覺。
貝葉斯思維的訓練,本質上就是縮小這個誤差的過程。
---
好。
今天我們把貝葉斯思維拆開看了一遍。
先驗機率,證據更新,後驗判斷。
聽起來清晰,但有一個問題,我們還沒有回答。
貝葉斯思維有一個前提——你需要有可靠的歷史資料來建立先驗。
但如果這個領域,歷史資料本身就是靠不住的呢?
如果這個領域,你的預測行為本身,就會改變預測的結果呢?
金融市場,就是這樣一個地方。
下一章我們要進入一個更硬的問題:為什麼金融預測,比天氣預報難得多?為什麼越多人用同一個模型,這個模型就越快失效?金融市場裡的「噪聲」,到底有多危險?
第 3 章 · 為什麼金融預測特別困難
你有沒有想過,為什麼那些拿著最好資料、最貴模型的華爾街精英,依然會在金融危機面前集體失明?不是他們不聰明。恰恰相反——正是因為他們太聰明瞭,才會犯下最致命的錯誤。
上一章我們講了貝葉斯思維。
核心是什麼?
不要把機率當成固定答案,而是把它當成一個可以不斷更新的起點。每當新證據出現,你就調整你的判斷。這聽起來很合理,很科學。
但是——
今天的問題來了。
如果你把這套工具搬進金融市場,會發生什麼?
---
**二零零七年。**
美國。
花旗集團的執行長,查克·普林斯,接受了一家媒體的採訪。
記者問他:次貸市場的風險這麼大,你們為什麼還在繼續擴張?
他的回答,後來成了金融史上最著名的一句話。
他說:
「只要音樂還在響,你就必須站起來跳舞。」
當時沒有人把這句話當成警告。
大家都以為,他說的是一種策略。
一年後,次貸危機全面爆發。花旗集團虧損超過兩百七十億美元。查克·普林斯離職。
音樂停了。
而幾乎所有人,都沒有提前坐下來。
---
為什麼?
這就是納特·西爾弗在《訊號與噪聲》第六、七章裡,試圖回答的核心問題。
他的核心觀點是:金融市場,是所有預測領域裡最難的那一個。
不是之一。
是最難。
為什麼?
因為金融市場有一個其他領域都沒有的特性——
**反身性。**
---
什麼叫反身性?
我來給你舉一個例子。
你預測明天會下雨。
這個預測,不會讓明天真的下雨。
天氣不會因為你的判斷而改變。
但金融市場不一樣。
你預測某隻股票要漲。
你買入。
你的朋友看到你買了,也買入。
更多人看到有人買,也跟著買。
股價真的漲了。
你的預測,變成了現實的一部分。
西爾弗在書中寫道:金融市場是少數幾個「預測行為本身會影響預測結果」的系統。你不是一個站在玻璃後面觀察市場的旁觀者,你是市場的一部分。你的每一個判斷,都在改變你試圖判斷的那個東西。
停。
想想這意味著什麼。
如果你的模型足夠準確,足夠多的人開始用它,這個模型就會失效。
因為市場已經把你的預測價格進去了。
這不是悖論,這是金融市場的基本執行邏輯。
---
好,反身性是第一道坎。
第二道坎,更隱蔽。
叫做:**資料噪聲**。
---
很多人覺得,金融市場是資料最豐富的地方。
這話沒錯。
股票價格每秒都在更新。交易量、波動率、換手率,數以億計的資料點,即時生成。
但西爾弗要告訴你一件反直覺的事:
資料越多,不一定噪聲越少。
有時候恰恰相反。
他在書中提出了一個關鍵區分——
訊號,是那些真正與未來結果相關的資訊。
噪聲,是那些看起來像訊號、但其實什麼都不是的隨機波動。
而在金融市場裡,噪聲的比例,遠遠超過你的想象。
西爾弗在書中引用了一組資料:
如果你觀察股市的年度回報,訊號與噪聲的比例大約是——
**五比一。**
訊號佔五分之一,噪聲佔五分之四。
但如果你把時間視窗縮短到每天,這個比例會變成什麼?
**一比四十五。**
每四十五份資訊裡,只有一份是真正有用的訊號。
你每天盯著盤面,重新整理報價,看K線,讀資訊——
你處理的東西,百分之九十七以上,是噪聲。
---
這就解釋了一個你可能早就注意到的現象。
為什麼那些做短線交易的人,大多數最終都虧錢?
不是因為他們不努力。
而是因為他們越努力,接觸的噪聲越多,被噪聲帶偏的次數也越多。
他們把噪聲當成了訊號。
然後做了決策。
然後虧了錢。
然後再去尋找更多資料,試圖找到「真正的訊號」。
然後迴圈往復。
---
第三道坎,也是最致命的一道。
叫做:**過擬合**。
---
這個詞,來自統計學。
但它描述的現象,你在金融市場裡隨處可見。
什麼叫過擬合?
簡單說:你的模型,對歷史資料擬合得太好了。
好到什麼程度?
好到它不再是在描述規律,而是在描述歷史的每一個偶然細節。
舉個例子。
假設你發現,過去二十年裡,每當美國橄欖球超級碗的冠軍來自美國聯合會,股市當年就會上漲。
這是真實存在過的「規律」,叫做超級碗指標。
有人真的用它來預測股市。
這就是過擬合。
你從歷史資料裡挖出了一個相關性,但這個相關性,和股市的真實執行機制,沒有任何因果關係。
它只是一個巧合。
但如果你的資料足夠多,你總能找到這樣的巧合。
西爾弗的核心觀點是:當你擁有的變數越來越多,而樣本量沒有相應增加,過擬合幾乎是不可避免的。
金融市場尤其危險。
因為歷史資料極其豐富,但真正的「獨立樣本」其實非常少。
一百年的股市歷史,聽起來很多。
但如果你在研究經濟週期,一百年裡完整的大週期,可能只有寥寥幾個。
你用幾個週期擬合出來的模型,拿去預測下一個週期——
這和用三次考試成績預測你一生的命運,沒有本質區別。
---
好,現在我們來說第四道坎。
也是最讓人絕望的那一道。
叫做:**黑天鵝**。
---
二零零八年,雷曼兄弟倒閉前的那個夏天。
華爾街上最頂尖的風險模型,幾乎都在說同一件事:
系統性風險,很低。
他們用的是「在險價值」模型,也叫 VaR。
這個模型告訴他們,類似一九二九年大蕭條那樣的崩潰,發生機率極低,低到可以忽略不計。
然後。
崩潰發生了。
為什麼模型失效了?
因為這些模型,都是用正常時期的資料訓練出來的。
它們假設,過去的分佈,代表未來的分佈。
但黑天鵝事件,恰恰是那些在歷史資料裡幾乎不存在的極端情況。
你用沒有黑天鵝的資料,建立了一個不包含黑天鵝的模型,然後用這個模型預測黑天鵝出現的機率——
結果當然是:機率極低。
這不是預測失誤。
這是方法論層面的根本性錯誤。
西爾弗在書中寫道:我們傾向於低估那些超出我們經驗範圍的風險。不是因為我們愚蠢,而是因為我們的模型,本質上是對過去的總結,而不是對未來的探索。
---
把這四道坎放在一起,你就明白了為什麼金融預測這麼難。
反身性——你的預測本身改變了市場。
資料噪聲——你處理的大部分資訊,都是幹擾。
過擬合——你的模型記住了歷史,但沒有理解規律。
黑天鵝——最重要的事件,往往在你的模型邊界之外。
---
這裡我想做一個當下的對映。
二零二三年,人工智慧投資熱潮席捲全球。
大量量化基金開始用機器學習模型預測市場。
這些模型,訓練資料量是人類有史以來最大的。
算力是前所未有的。
結果呢?
很多模型,在牛市裡表現驚豔。
然後遇到了一次政策突變,或者一次地緣衝突,或者一次意外的利率決議——
模型啞火了。
為什麼?
因為這些模型,依然在用歷史資料預測未來。
依然在用正常時期的規律,應對異常時期的衝擊。
反身性、噪聲、過擬合、黑天鵝——
這四個問題,不會因為算力變強而消失。
它們是金融市場的結構性特徵。
---
那麼,西爾弗的意思是不是:金融預測毫無意義,乾脆放棄?
不是。
他的意思是:你需要對自己的預測,保持一種特定的謙遜。
不是虛偽的謙遜,不是客套話。
而是一種真正建立在理解不確定性基礎上的謙遜。
他說,最好的預測者,不是那些試圖消滅不確定性的人,而是那些學會了在不確定性裡導航的人。
這兩者,有著本質的區別。
消滅不確定性,是幻覺。
在不確定性裡導航,是技能。
---
所以,下一個問題自然就來了。
既然金融市場這麼難預測,既然噪聲這麼多,黑天鵝隨時可能出現——
我們到底該怎麼做決策?
光知道「要謙遜」是不夠的。
謙遜是一種態度,但它不是一個方法。
那個方法,叫什麼?
下一章,我們來看:一個真正能在不確定性中幫你做更好決策的框架,到底長什麼樣?它和你現在的思維方式,究竟有多大的差距?
第 4 章 · 在不確定性中做更好的決策
你有沒有想過——
預測這件事,能不能練?
有人說天賦決定一切。有人說資料才是王道。
但納特·西爾弗在這本書的最後,給出了一個讓人意外的答案。
不是天賦,不是演算法。
是一種思維習慣。
上一章我們講了金融預測為什麼特別難。
核心是什麼?
市場會對預測本身做出反應。你一預測,世界就變了。加上資料噪聲、黑天鵝事件、過度擬合的模型——金融市場幾乎是人類已知最難預測的系統之一。
但西爾弗沒有在這裡停下來。
他接著問了一個更重要的問題:
既然預測這麼難,我們該怎麼辦?
就這樣放棄嗎?
---
停。
放棄不是答案。
西爾弗在書中明確說:預測的目標從來不是「百分之百正確」,而是「比隨機猜測更好」。
這一章,我們來講最後一塊拼圖。
機率校準。元認知。以及,成為一個更好的預測者,到底意味著什麼。
---
**先講一個場景。**
二零一零年。
美國一家研究機構做了一項長達二十年的追蹤實驗。
研究物件是兩百八十四位「專家」——經濟學家、政治分析師、戰略顧問。
研究者讓他們對未來做出預測,然後記錄結果。
二十年後,資料出來了。
結論讓所有人都難堪。
這些專家的預測準確率——
比隨機猜測好不了多少。
有些領域,甚至還不如隨機。
這個研究的主持人,就是心理學家菲利普·泰特洛克。
西爾弗在書中大量引用了他的研究成果。
泰特洛克發現,這些專家有一個共同的特點:
他們太自信了。
不是普通的自信,是一種叫做「過度自信」的認知偏差。
他們說「我有九成把握」的時候,實際正確率只有七成。
他們說「我基本確定」的時候,錯誤率高得驚人。
---
這就是西爾弗在第八章花大量篇幅討論的核心問題:
**機率校準。**
什麼叫校準?
簡單說:你說你有八成把握,那你「有八成把握」的事情,最終應該有八成是對的。
不多也不少。
如果你說了一百件「八成把握」的事,結果只有五十件是對的——
那你的機率就沒有校準好。
你高估了自己。
西爾弗的核心觀點是:好的預測者,不是那些「總是說對的人」,而是那些「說出的機率和現實高度吻合的人」。
這是兩件完全不同的事。
---
**那怎麼校準?**
西爾弗給出了一個讓人意外的工具。
不是更好的模型。
不是更多的資料。
是——
**元認知。**
元認知,就是「對自己的認知過程進行思考」。
說白了:你要能看見自己是怎麼想的。
你為什麼得出這個結論?
你用了哪些證據?
你忽略了哪些反面資訊?
你的情緒有沒有影響你的判斷?
西爾弗在書中寫道,優秀的預測者有一個共同習慣——
他們會主動尋找讓自己不舒服的證據。
注意這個詞:不舒服。
不是尋找支援自己觀點的證據,而是專門去找那些會推翻自己判斷的資訊。
這在心理學上叫做「反向確認偏差」的訓練。
普通人的本能是什麼?
找到支援自己的證據,然後停下來。
優秀的預測者呢?
找到支援自己的證據,然後繼續問:但是,有沒有我沒看到的東西?
---
**停一下。**
我們來看一個當下的例子。
二零二二年,美聯儲開始加息。
當時市場上有兩種聲音。
一種說:通脹是暫時的,加息會很快結束。
另一種說:通脹已經結構化,加息會持續很久。
大多數人選擇了第一種。
為什麼?
因為第一種讓人舒服。
加息結束意味著資產價格會反彈,意味著不用承受痛苦,意味著一切都會好起來。
但現實呢?
加息持續了將近兩年。
那些堅持第一種判斷的人,一次次「等待反轉」,一次次被套牢。
這不是因為他們不聰明。
這是因為他們沒有做機率校準——
他們的「九成把握」,從一開始就是情緒,不是機率。
---
**回到西爾弗的框架。**
第九章,他提出了一個非常具體的決策工具。
他把預測者分成兩種型別,借用了古希臘的一個比喻:
**狐狸**和**刺蝟**。
刺蝟型的人,有一個核心的大理論,然後用這個理論解釋一切。
他們觀點鮮明,上電視好看,聽起來特別有說服力。
但他們的預測準確率——
很差。
因為現實太複雜,一個大理論裝不下所有的變數。
狐狸型的人呢?
他們沒有一個統一的大理論。
他們同時持有多個相互矛盾的視角。
他們說話不那麼斬釘截鐵,甚至有時候讓人覺得「你到底在說什麼」。
但他們的預測準確率——
顯著更高。
西爾弗的核心觀點是:在不確定的世界裡,擁抱矛盾,比堅守一個宏大敘事,更接近真相。
---
**這對我們普通人意味著什麼?**
意味著:
當有人用一套完整的、自洽的、聽起來無懈可擊的理論來告訴你「市場一定會怎樣」——
你要警惕。
越是聽起來完美的預測,越可能是刺蝟在說話。
越是充滿「但是」「然而」「另一方面」的分析,反而越可能更接近真實。
---
**第十章,西爾弗講到了一個更深的問題。**
他問:我們為什麼這麼不擅長處理不確定性?
答案指向人類的本能。
我們的大腦,是在幾萬年前的環境裡進化出來的。
那個環境的特點是什麼?
資訊少,但行動要快。
草叢裡有動靜——是老虎還是風?
你沒有時間做機率分析,你要立刻做決定。
這種本能幫助我們的祖先活了下來。
但在金融市場裡——
這個本能是致命的。
市場的訊號是模糊的,噪聲是巨大的,結果是延遲的。
我們的大腦想要確定性,想要立刻行動,想要一個清晰的故事。
於是我們把噪聲當成訊號,把巧合當成規律,把運氣當成能力。
西爾弗在書中寫道,他的核心觀點是:
承認不確定性,不是軟弱,而是誠實。
把「我不知道」說出來,不是失敗,而是校準的開始。
---
**那麼,成為更好的預測者,到底有沒有可能?**
有。
西爾弗給出了幾個非常具體的建議。
**第一:用機率說話,不用確定性說話。**
不要說「市場會漲」,要說「我認為市場有六成機率上漲」。
這不是在模糊責任,而是在強迫自己誠實面對不確定性。
**第二:記錄你的預測,然後回頭看。**
這一點聽起來簡單,但幾乎沒有人真的在做。
你上個月說的「我覺得這隻股票會漲」——
後來怎麼樣了?
你有沒有記錄下來,然後認真覆盤?
如果沒有,你就永遠不知道自己的校準有多差。
**第三:區分運氣和能力。**
這一次賺錢了,是因為你判斷對了,還是因為你運氣好?
這一次虧錢了,是因為你判斷錯了,還是因為你遇到了黑天鵝?
不把這兩件事分清楚,你就無法從經驗中真正學習。
**第四:更新,而不是辯護。**
當新證據出現,你的第一反應是什麼?
是去解釋為什麼這個證據不重要?
還是認真考慮它是否改變了你的判斷?
好的預測者,把改變主意當成進步,而不是丟臉。
---
**我們來做一個歷史場景的還原。**
二零一二年,美國總統大選。
納特·西爾弗本人,用他的統計模型,預測歐巴馬會贏得選舉。
當時很多政治評論員嘲笑他。
說他的模型太簡單,說政治不是數學,說他不懂真實的選情。
甚至有人專門寫文章,預測羅姆尼會贏。
理由聽起來都很有道理:經濟不好,現任總統通常會輸,民調有誤差……
選舉結果出來了。
歐巴馬贏了。
西爾弗的模型,準確預測了五十個州中的五十個州的結果。
百分之百。
但西爾弗自己怎麼說?
他說:這不代表我的模型是完美的。
這隻代表,這一次,訊號比噪聲更強。
下一次,可能就不一樣了。
這句話,才是這本書最核心的精神。
---
**整書收束。**
回頭看這本書,我們走過了四章。
第一章,我們看見了預測的悖論——聰明人為什麼也會預測錯,因為他們混淆了訊號和噪聲。
第二章,我們學到了貝葉斯思維——機率不是答案,而是一個隨證據不斷更新的起點。
第三章,我們看見了金融市場的特殊性——反身性、黑天鵝、過擬合,讓這裡成為最難預測的戰場。
第四章,我們回到了人本身——校準、元認知、狐狸思維,這才是面對不確定性的真正武器。
西爾弗真正想告訴我們的,不是一套預測公式。
而是一種態度:
對不確定性保持誠實,對自己的判斷保持懷疑,對新的證據保持開放。
這本書合上之後,你可能不會變成一個更準確的預測者。
但你會變成一個——
更清醒的人。
而在投資這件事上,清醒,已經贏過了大多數人。
承認不確定,比假裝確定,更接近真相。—— 納特·西爾弗,訊號與噪聲第十章核心觀點提煉
本篇出現的關鍵概念
- 訊號與噪聲 (Signal vs. Noise)
- 西爾弗對資訊質量的核心二分法。訊號指真實存在、對理解未來有預測力的資訊;噪聲指隨機波動、無規律、會干擾判斷的資料。兩者外觀極為相似,人腦天生傾向於在隨機點之間強行識別模式。在金融市場日線資料中,訊號與噪聲比約為1比45,這是短線交易者系統性虧損的資訊理論根源。
- 貝葉斯定理 (Bayes' Theorem)
- 由英國牧師托馬斯·貝葉斯在1763年發表的遺作中提出。核心機制為:以歷史資料建立先驗機率,結合新證據計算後驗機率,實現判斷的持續更新。西爾弗將其視為區分優質預測者與劣質預測者最重要的思維工具,本質上是一套將不確定性量化並動態修正的認知框架,而非單純的數學公式。
- 反身性 (Reflexivity)
- 金融市場特有的屬性:預測行為本身會影響被預測物件的結果。當大量投資者採用同一模型並據此交易,模型發現的價格訊號會被市場迅速消化,導致模型失效。這與天氣預報根本不同——預報不會改變天氣,但金融預測會改變價格。反身性是金融預測比其他領域從結構上更困難的核心原因之一。
- 校準誤差 (Calibration Error)
- 預測者主觀置信度與實際準確率之間的系統性偏差。泰洛克對近三百名專家的二十年追蹤研究顯示,當專家聲稱90%把握時,實際準確率往往只有70%至75%。校準誤差越小,說明預測者對自身不確定性的估算越誠實、越精準。西爾弗認為,縮小校準誤差是成為更好預測者的核心訓練目標。
關於進階系列
納特·西爾弗(Nate Silver)1978年生於美國密歇根州東蘭辛市,畢業於芝加哥大學經濟學系。他的職業起點並非學術界,而是棒球資料分析領域。2003年至2005年間,他開發了一套名為PECOTA的棒球球員績效預測系統,該系統通過歷史相似球員的統計軌跡預測當前球員的未來表現,在職業棒球分析圈引發廣泛關注。 2008年,西爾弗將統計預測方法遷移至政治選舉領域,創辦FiveThirtyEight網站(名稱取自美國選舉人團總票數538票)。當年美國總統大選,他的模型正確預測了50個州中49個州的選舉結果;2012年大選,他實現了50個州全部命中。這兩次預測使他成為美國公共知識領域最具辨識度的資料分析師之一。 《訊號與噪聲》出版於2012年,是西爾弗對自身預測實踐的系統性反思,也是他對整個預測科學的批判性梳理。書中涵蓋氣象預報、地震預測、棒球分析、政治選舉、金融市場、撲克博弈等多個領域,核心論點一以貫之:預測失敗的根源不是資料不足,而是人類無法有效區分訊號與噪聲,以及拒絕在證據面前更新自己的判斷。 西爾弗本人是撲克玩家,這一經歷深刻影響了他對機率和不確定性的理解——撲克要求玩家在資訊不完整的條件下持續做出機率最優的決策,而不是追求每一手牌的確定性結果。這與貝葉斯思維的核心精神高度吻合,也構成了本書最重要的方法論底色。
檢視進階系列全部投資筆記 →本篇 6 句最值得抄進筆記的話
- 預測不是為了證明自己正確,而是為了在不確定中做出更好的判斷。—— 《訊號與噪聲》前言
- 我們生活在一個資訊爆炸的時代,但更多的資訊不等於更多的訊號。很多時候,資料越多,噪聲也越多,反而讓我們更容易迷失。—— 《訊號與噪聲》第一章
- 越是媒體上頻繁出現的大嘴專家,預測越不準;越是那些謹慎、承認不確定性的分析師,預測反而更可靠。—— 《訊號與噪聲》,引述泰洛克研究
- 模型是對現實的簡化,而不是現實本身。當我們把模型的輸出當成現實的真相,麻煩就來了。—— 《訊號與噪聲》第一章
- 好的預測者,不是那些最終被證明正確的人,而是那些在每一個時間節點上,都能給出最準確機率估算的人。—— 《訊號與噪聲》第二章
- 只要音樂還在響,你就必須站起來跳舞。—— 花旗集團執行長查克·普林斯,2007年媒體採訪,被《訊號與噪聲》第三章引用



