信号与噪声

听 54 分钟解读 · 读约 11,736 字精读

一句话定位数据越多不等于预测越准，贝叶斯思维才是穿透噪声的核心武器

这篇讲什么

数据预测专家西尔弗写的预测哲学——为什么聪明人也会预测错？怎么从海量噪声中找出真正的信号？

二〇〇八年金融危机前夕,华尔街最聪明的人们手握海量数据,用着最精密的模型,得出了同一个结论:风险可控。然后,一切崩塌了。这不只是一次金融失败,更是一次预测的集体失败。有意思的地方在这里——失败的原因不是数据太少,恰恰相反,可能是数据太多了。纳特·西尔弗在《信号与噪声》里提出了一个让人不舒服的问题:我们以为信息越多判断越准,但如果大多数信息都是噪声,更多数据只会让我们更自信地犯错。这本书不是在教你「如何预测未来」,而是在拆解一件更根本的事——为什么我们总是高估自己看清现实的能力,以及有没有一种更诚实的方式来面对不确定性。读完你可能会发现,那些在市场里频繁发声、言之凿凿的人,往往是最不可信的那批人。

谁该读这一篇

如果你习惯用技术指标、财报数据或宏观新闻做投资决策，却发现信息越看越多、判断却越来越混乱，不知道哪些数据真正有预测价值、哪些只是让你感觉在认真研究的背景噪音，这篇精读会帮你建立一套区分信号与噪声的底层框架，从根本上改变你处理信息的方式。
如果你对量化投资感兴趣，但总觉得模型回测漂亮、实盘却频繁失效，不理解为什么历史数据拟合得越好反而越容易亏钱，想搞清楚过拟合、反身性这些概念在实际市场中意味着什么，西尔弗对金融预测困难性的系统分析会给你一个清醒的认知校准。
如果你是对概率思维、认知偏误或决策科学感兴趣的读者，想了解为什么政治学家菲利普·泰洛克追踪三百名专家二十年后得出令人沮丧的结论，以及贝叶斯定理如何从一个十八世纪牧师的遗稿变成现代预测科学的核心工具，这篇精读提供了有信息密度的系统梳理。

本篇 6 个核心观点

1数据增加不等于信号增加。西尔弗的核心论点是：信息爆炸时代，噪声的增速往往超过信号。以股市为例，观察年度回报时信号与噪声比约为5比1，但缩短至日线级别，这一比例骤降至1比45。这意味着每天盯盘处理的信息中，超过97%是对预测毫无帮助的随机波动，努力程度与准确率之间并不存在线性关系。
2过度自信是专家预测失败的系统性根源。政治学家菲利普·泰洛克历时二十年、收集近三百名专家逾八万条预测判断后发现，这些专家的整体准确率与随机猜测相差无几。更反直觉的是，媒体曝光度越高的专家，预测准确率反而越低；而那些习惯承认不确定性、给出概率区间而非确定性结论的分析师，校准表现更为可靠。
3贝叶斯思维的本质是持续更新，而非一次性判断。托马斯·贝叶斯在1763年发表的遗作提出了一个核心机制：先建立基于历史数据的先验概率，再用新证据系统性地修正这一概率，得出后验判断。西尔弗认为，好的预测者与坏的预测者最根本的区别，不在于最终是否猜对，而在于每个时间节点上能否给出经过合理校准的概率估算。
4金融市场的反身性使预测工具本身成为市场变量。天气预报不会改变天气，但金融预测会改变市场价格。当足够多的参与者使用同一个模型时，模型所发现的定价错误会被迅速套利消除，模型随即失效。这一机制意味着，金融市场中任何有效的预测方法都具有自我毁灭的倾向，这是金融预测比气象、医学等领域从根本上更困难的原因之一。
5模型的幻觉源于历史数据的边界。2008年金融危机中，华尔街主流风险模型集体失效，根本原因不是计算错误，而是这些模型用历史数据训练，而历史数据中不存在全国性房价大幅下跌的记录。黑天鹅事件按定义不会出现在历史样本里。2020年新冠疫情再次验证了这一点：几乎所有经济预测模型在全球停摆面前同时失效，西尔弗早在2012年便已写下这一警告。
6概率表述而非确定性表述，是更诚实也更有效的预测形式。西尔弗通过对比美国国家气象局与私人气象公司的预报数据发现，国家气象局的概率预报校准度显著更高——他们说70%降雨概率，实际降雨率接近七成。而私人公司因为用户更厌恶漏报雨天，系统性地夸大降雨概率。这说明激励结构会扭曲先验判断，预测者必须识别并剥离自身的利益偏向，才能做出真正校准过的概率估算。

试听第一章音频解读

第 1 章 · 为什么聪明人也会预测错

知性男声 · 约 14 分钟

App 内还有 220+ 大师案例都已配音频解读下载 App 继续听 →

精读全文

第 1 章 · 为什么聪明人也会预测错

二〇〇八年，全球最聪明的一批经济学家、银行家、评级机构，手握海量数据，配备最精密的模型——然后，他们集体预测错了。为什么？是数据不够多？还是模型不够好？纳特·西尔弗说：都不是。问题出在更根本的地方。

你有没有遇到过这种时刻——

某个专家信誓旦旦地说，这次经济一定软着陆。某个分析师拍着胸脯说，这只股票下个季度必涨。某个气象台预报明天百分之百晴天，结果你出门就被淋成落汤鸡。

我们活在一个预测泛滥的时代。

但预测的准确率，从来没有因为数据更多、模型更复杂而显著提升。

这是为什么？

这就是纳特·西尔弗写《信号与噪声》想回答的问题。

---

**先认识一下这本书的作者。**

纳特·西尔弗，美国统计学家、预测专家。他创办了大名鼎鼎的"五三八"网站——名字来自美国选举人团的总票数。

二〇〇八年美国总统大选，他用统计模型预测了五十个州中的四十九个州的选举结果。

四十九个。

二〇一二年，他做到了五十个州全对。

在一个满地"专家"的世界里，这个成绩让人无法忽视。但西尔弗不是来炫耀的。他写这本书，是为了拆解一个更深的问题：

为什么大多数预测都是错的？

而那些做对的预测，又是怎么做到的？

---

**这本书我们会分四章来读。**

第一章，也就是今天，我们从西尔弗的核心命题切入——预测为什么这么难？信号和噪声究竟是什么关系？我们会看到，聪明人犯错，往往不是因为不够聪明，而是因为陷入了一个叫"过度自信"的陷阱。

第二章，我们深入贝叶斯思维。这是西尔弗全书最核心的工具——一种用概率来思考、用证据来更新判断的方式。听起来像数学，但其实是一种思维习惯。

第三章，我们聚焦金融市场。西尔弗专门分析了为什么金融预测比其他领域更难——市场有反身性，黑天鹅随时出现，模型越复杂，反而越容易出问题。

第四章，落脚到行动。不确定性无法消除，但我们可以在不确定中做出更好的决策。西尔弗给出了成为更好预测者的具体路径。

好，现在我们进入第一章。

---

**先从一个场景说起。**

二〇〇七年底，美国房地产市场开始出现裂缝。

但华尔街的主流声音是什么？

"这只是局部调整。""次贷规模有限，不会系统性蔓延。""我们的模型显示，风险可控。"

当时花旗集团的首席执行官查克·普林斯说了一句后来被反复引用的话，大意是：只要音乐还在响，你就得继续跳舞。

音乐还在响。

然后，音乐停了。

二〇〇八年，雷曼兄弟倒闭，全球金融危机爆发，数万亿美元财富蒸发，数以百万计的普通人失去工作和住房。

那些最聪明的人，手握最多的数据，用着最复杂的模型——

全部预测错了。

西尔弗在书中写道，这场危机不只是金融的失败，更是预测的失败。人们把噪声当成了信号，把模型的精密当成了现实的可靠。

---

**什么是信号，什么是噪声？**

这是西尔弗整本书的核心命题。

他的定义很清晰：

信号，是真实存在的、能帮助我们理解世界的信息。

噪声，是随机的、无规律的、会干扰我们判断的数据。

问题在哪里？

问题在于，信号和噪声长得太像了。

你看到一组数据，它可能是真实趋势，也可能只是随机波动。你看到一个模式，它可能是规律，也可能是你的大脑在随机点之间强行连线。

人类的大脑，天生不擅长区分这两者。

西尔弗的核心观点是：我们生活在一个信息爆炸的时代，但更多的信息不等于更多的信号。很多时候，数据越多，噪声也越多，反而让我们更容易迷失。

停。

这个观点值得反复想一想。

我们通常以为，数据越多越好，信息越多越准确。但西尔弗说，不对。

他举了一个例子。假设你在预测一场棒球比赛的结果。你有球员的击球率、投手的ERA、球队的主客场胜率、天气情况、草坪湿度……数据堆成山。

但如果你不知道哪些数据是真正有预测力的，哪些只是背景噪音，你的预测可能还不如一个只看最近十场比赛的老球迷。

数据本身不是答案。

区分信号和噪声，才是答案。

---

**那为什么聪明人也会预测错？**

西尔弗给出了几个关键原因。

**第一，过度自信。**

研究显示，当人们说某件事"百分之九十确定"的时候，他们实际上只有大约百分之七十到七十五的准确率。

百分之九十的自信，换来百分之七十五的准确率。

这个偏差，在专家身上更严重，不是更轻。

为什么？因为专家掌握更多信息，这让他们感觉更确定，但感觉确定和实际准确是两回事。

西尔弗在书中特别提到了一个著名的研究——政治学家菲利普·泰洛克花了二十年时间，收集了近三百名政治和经济专家的预测，总计八万多条判断。

结果怎样？

这些专家的预测准确率，还不如随机猜测高多少。

更扎心的是——

越是媒体上频繁出现的"大嘴"专家，预测越不准。

越是那些谨慎、承认不确定性的分析师，预测反而更可靠。

**第二，把相关性当因果性。**

这是数据分析中最常见的陷阱。

两件事同时发生，不代表一件事导致了另一件事。

西尔弗举了一个极端的例子：美国某些县的有机食品销售量，和自闭症发病率高度相关。

你能因此说有机食品导致自闭症吗？

当然不能。

但在金融市场上，这种错误每天都在发生。某个指标和股市上涨同步了三年，分析师就开始把它当成预测工具。然后第四年，这个关系突然消失了。

因为它本来就不是信号，只是噪声。

**第三，模型的幻觉。**

二〇〇八年金融危机中，那些复杂的风险模型，有一个共同的问题——它们是用历史数据训练出来的。

但历史数据里，没有"历史上从未发生过的事"。

黑天鹅，按定义，不会出现在历史数据里。

所以模型告诉你风险极低，不是因为风险真的低，而是因为那种风险从来没被见过、没被记录、没被纳入模型。

西尔弗的核心观点是：模型是对现实的简化，而不是现实本身。当我们把模型的输出当成现实的真相，麻烦就来了。

---

**说到这里，我想给你一个当下的映射。**

现在是人工智能大爆发的时代。

各种AI模型被用来预测股价、预测经济走势、预测用户行为。数据量比二〇〇八年大了不知道多少倍，模型的复杂程度也是指数级提升。

但有一件事没变——

这些模型，依然是用历史数据训练的。

它们依然无法预测"历史上从未发生过的事"。

二〇二〇年新冠疫情爆发，几乎所有的经济预测模型在那一刻集体失效。不是因为模型不够好，而是因为这种规模的全球停摆，不在任何历史数据里。

西尔弗早在二〇一二年就写下了这个警告。

今天读来，依然有效。

---

**那我们该怎么办？**

西尔弗没有说"放弃预测"。他说的是：

承认不确定性，是做好预测的第一步。

这听起来很反直觉。我们通常觉得，好的预测者应该自信、果断、给出明确答案。

但西尔弗说，恰恰相反。

真正好的预测，是用概率说话，而不是用确定性说话。

不是"明年经济会衰退"，而是"明年经济衰退的概率是百分之四十"。

不是"这只股票会涨"，而是"基于现有信息，这只股票上涨的可能性更大，但我可能是错的"。

这种思维方式，有一个名字。

贝叶斯思维。

这就是我们下一章要深入探讨的核心工具。

---

西尔弗在书的前言里有一句话，大意是这样的：

预测不是为了证明自己正确，而是为了在不确定中做出更好的判断。

这个区别，看起来微小，实则天壤之别。

如果你预测是为了证明自己正确，你会倾向于选择确定性高的表述，回避承认错误，把模型的输出当成真相。

如果你预测是为了做出更好的判断，你会主动寻找反驳自己的证据，承认模型的局限，把每一次预测错误当成更新认知的机会。

前者，是噪声制造机。

后者，才是信号捕捉者。

---

好，第一章我们先到这里。

今天我们看到了预测失败的三个根源——过度自信、混淆相关与因果、模型的幻觉。也看到了西尔弗给出的方向：用概率思考，承认不确定性。

但这只是方向。

具体怎么做？有没有一套可以操作的思维框架？

三百年前，一个英国牧师在遗作里留下了一个公式。这个公式后来改变了统计学、医学、情报分析，甚至影响了现代投资决策。

它叫贝叶斯定理。

它到底是什么？为什么西尔弗说，它是区分好预测者和坏预测者最重要的工具？

我们下一章见。

第 2 章 · 贝叶斯思维：从概率到行动

你有没有想过——你每天做的每一个判断，其实都是一次概率计算？只是大多数人算错了。有一个两百多年前的牧师，用一个简单到离谱的公式，彻底改变了人类对"不确定性"的理解。今天我们就来拆开它。

上一章我们讲了预测的悖论——数据越来越多，模型越来越复杂，但预测的准确率并没有因此提升。核心原因是：我们分不清信号和噪声。那今天的问题来了，既然噪声无处不在，我们到底该怎么思考？西尔弗给出的答案，是一个名字听起来很学术、但本质上极其实用的工具。

贝叶斯定理。

---

**先认识一个人。**

托马斯·贝叶斯。

英国牧师，十八世纪。

他不是数学家，不是经济学家，甚至不是职业学者。他只是一个对"上帝存在的概率"感到好奇的神学家。

他在世时，这篇论文从未发表。

他死后两年，一七六三年，他的朋友帮他把手稿整理出来，投给了英国皇家学会。

就这样，一篇差点被历史淹没的论文，成了现代概率论的基石。

停。

你可能要问了：一个牧师写的东西，跟我的投资决策有什么关系？

关系大了。

---

**贝叶斯定理到底在说什么？**

用最简单的话说，就是四个字：

用证据更新。

西尔弗在书中写道，贝叶斯定理的核心不是一个公式，而是一种思维方式——你对世界的判断，不应该是一个固定的答案，而应该是一个随时可以被新证据修正的概率。

听起来简单。

但大多数人不是这样思考的。

大多数人的思维模式是什么？是"我认为"。是"我感觉"。是一旦形成判断，就开始找证据来支持它，而不是用证据来更新它。

这就是确认偏误。

这就是为什么聪明人也会预测错。

---

**来还原一个历史场景。**

一九四五年，二战结束前夕。

美国情报机构面对一个问题：日本会不会在本土决战？

大量情报涌来。有的说日本已经精疲力竭，有的说日本本土还有数百万士兵。有的说天皇想议和，有的说军部坚决抵抗。

情报分析员们怎么处理这些信息？

大多数人选择了自己"相信"的那一套，然后把其他信息当作噪声过滤掉。

结果呢？

没有人预测到广岛之后日本会迅速投降。

没有人预测到一颗炸弹就能改变整个战局。

为什么？

因为他们的判断是静态的。他们没有一个机制，让新证据真正改变自己的概率估算。

这就是贝叶斯思维缺席的代价。

---

**那贝叶斯思维是怎么运作的？**

三个步骤。

第一步：先验概率。

在你看到任何新证据之前，你对这件事的基础判断是什么？

举个例子。你在路上捡到一个钱包。你会不会想"这是陷阱"？

你的先验概率，来自你的经验、常识、历史数据。大多数捡到的钱包不是陷阱——这就是你的先验。

第二步：新证据。

你打开钱包，里面有一张便条，写着"如有拾获请联系某某某"，还有一叠现金。

这是新证据。

第三步：更新概率。

你把先验概率和新证据结合起来，得出一个新的判断——后验概率。

这个钱包大概率不是陷阱，而是有人真的丢了钱包。

你的行动随之改变：你打电话联系失主。

---

听起来很直觉化，对吗？

但等等。

真正难的，不是这个流程。

真正难的，是两件事。

第一：你的先验概率从哪里来？

第二：你愿不愿意在证据面前，真的改变自己的判断？

---

**先说先验概率。**

西尔弗的核心观点是：先验概率不能凭感觉，必须有数据基础。

但人类天生不擅长这件事。

我们对罕见事件的概率估算，系统性地偏高。

我们对常见事件的概率估算，系统性地偏低。

为什么？

因为我们用的是记忆，不是统计。

飞机失事的新闻你记得清清楚楚，但你忘了全年坐飞机死亡的概率是多少。

百万分之零点零七。

而开车上路的死亡率，是坐飞机的将近一百倍。

但大多数人觉得坐飞机更危险。

这就是先验概率被情绪污染的结果。

---

**再说第二件难事：你愿不愿意更新？**

这才是真正的战场。

西尔弗在书中举了一个让人印象深刻的例子——气象预报员。

他发现，美国国家气象局的预报员，在概率校准上做得相当好。他们说"明天有百分之七十的降雨概率"，真实降雨率确实接近七成。

但私人气象公司呢？

他们的预报系统性地夸大了降雨概率。

为什么？

因为用户更害怕"没带伞被淋湿"，而不是"带了伞没用上"。

所以气象公司把概率往高处报，迎合用户心理。

这叫什么？

这叫激励扭曲了先验。

你以为你在做概率判断，其实你在做利益判断。

---

**这件事放到投资里，会发生什么？**

想一想。

二零零七年，次贷危机前夜。

华尔街的风险模型都在说：房价不会大幅下跌。

为什么？

因为过去几十年的数据里，全国性的房价大跌从未发生过。

先验概率：房价崩盘的可能性极低。

但新证据呢？

次级贷款违约率开始攀升。

杠杆率创历史新高。

金融机构开始悄悄对冲自己的风险敞口。

这些都是信号。

但大多数人没有更新自己的概率。

为什么？

因为更新意味着承认自己之前的判断可能有问题。

因为更新意味着要放弃已经押注的仓位。

因为更新有成本，不更新有借口。

结果呢？

雷曼兄弟倒闭。

金融海啸。

数以万亿计的财富蒸发。

---

**贝叶斯思维的真正价值，在这里。**

它不是让你预测未来。

没有人能预测未来。

它是让你在不确定的世界里，持续做出比别人更合理的判断。

西尔弗的核心观点是：好的预测者，不是那些最终被证明正确的人，而是那些在每一个时间节点上，都能给出最准确概率估算的人。

注意这个区别。

结果正确，可能是运气。

过程合理，才是能力。

---

**一个当下的映射案例。**

你在考虑要不要买某只基金。

你看到它过去三年年化收益百分之二十。

你的第一反应是什么？

大多数人的第一反应是：这只基金很牛，应该买。

但贝叶斯思维会怎么问？

先验概率：一个基金能持续跑赢市场的概率，历史数据告诉我们，大约只有百分之十到二十。

新证据：过去三年收益百分之二十。

这个证据，是真实的阿尔法，还是恰好赶上了牛市的贝塔？

这两者的概率，你有没有认真估算过？

如果没有，你的决策就不是贝叶斯的，而是情绪的。

---

**最后，西尔弗在书中提到了一个让人警醒的概念：过度自信。**

他说，大多数人在做预测时，给出的置信区间太窄了。

什么意思？

你说"我九成把握明年经济会复苏"，但如果真的让一百个人各做一百次这样的判断，那些声称九成把握的预测，实际准确率可能只有六成。

这个差距，叫做校准误差。

校准误差越小，你的概率判断越可靠。

校准误差越大，你的自信只是一种幻觉。

贝叶斯思维的训练，本质上就是缩小这个误差的过程。

---

好。

今天我们把贝叶斯思维拆开看了一遍。

先验概率，证据更新，后验判断。

听起来清晰，但有一个问题，我们还没有回答。

贝叶斯思维有一个前提——你需要有可靠的历史数据来建立先验。

但如果这个领域，历史数据本身就是靠不住的呢？

如果这个领域，你的预测行为本身，就会改变预测的结果呢？

金融市场，就是这样一个地方。

下一章我们要进入一个更硬的问题：为什么金融预测，比天气预报难得多？为什么越多人用同一个模型，这个模型就越快失效？金融市场里的"噪声"，到底有多危险？

第 3 章 · 为什么金融预测特别困难

你有没有想过，为什么那些拿着最好数据、最贵模型的华尔街精英，依然会在金融危机面前集体失明？不是他们不聪明。恰恰相反——正是因为他们太聪明了，才会犯下最致命的错误。

上一章我们讲了贝叶斯思维。

核心是什么？

不要把概率当成固定答案，而是把它当成一个可以不断更新的起点。每当新证据出现，你就调整你的判断。这听起来很合理，很科学。

但是——

今天的问题来了。

如果你把这套工具搬进金融市场，会发生什么？

---

**二零零七年。**

美国。

花旗集团的首席执行官，查克·普林斯，接受了一家媒体的采访。

记者问他：次贷市场的风险这么大，你们为什么还在继续扩张？

他的回答，后来成了金融史上最著名的一句话。

他说：

"只要音乐还在响，你就必须站起来跳舞。"

当时没有人把这句话当成警告。

大家都以为，他说的是一种策略。

一年后，次贷危机全面爆发。花旗集团亏损超过两百七十亿美元。查克·普林斯离职。

音乐停了。

而几乎所有人，都没有提前坐下来。

---

为什么？

这就是纳特·西尔弗在《信号与噪声》第六、七章里，试图回答的核心问题。

他的核心观点是：金融市场，是所有预测领域里最难的那一个。

不是之一。

是最难。

为什么？

因为金融市场有一个其他领域都没有的特性——

**反身性。**

---

什么叫反身性？

我来给你举一个例子。

你预测明天会下雨。

这个预测，不会让明天真的下雨。

天气不会因为你的判断而改变。

但金融市场不一样。

你预测某只股票要涨。

你买入。

你的朋友看到你买了，也买入。

更多人看到有人买，也跟着买。

股价真的涨了。

你的预测，变成了现实的一部分。

西尔弗在书中写道：金融市场是少数几个"预测行为本身会影响预测结果"的系统。你不是一个站在玻璃后面观察市场的旁观者，你是市场的一部分。你的每一个判断，都在改变你试图判断的那个东西。

停。

想想这意味着什么。

如果你的模型足够准确，足够多的人开始用它，这个模型就会失效。

因为市场已经把你的预测价格进去了。

这不是悖论，这是金融市场的基本运行逻辑。

---

好，反身性是第一道坎。

第二道坎，更隐蔽。

叫做：**数据噪声**。

---

很多人觉得，金融市场是数据最丰富的地方。

这话没错。

股票价格每秒都在更新。交易量、波动率、换手率，数以亿计的数据点，实时生成。

但西尔弗要告诉你一件反直觉的事：

数据越多，不一定噪声越少。

有时候恰恰相反。

他在书中提出了一个关键区分——

信号，是那些真正与未来结果相关的信息。

噪声，是那些看起来像信号、但其实什么都不是的随机波动。

而在金融市场里，噪声的比例，远远超过你的想象。

西尔弗在书中引用了一组数据：

如果你观察股市的年度回报，信号与噪声的比例大约是——

**五比一。**

信号占五分之一，噪声占五分之四。

但如果你把时间窗口缩短到每天，这个比例会变成什么？

**一比四十五。**

每四十五份信息里，只有一份是真正有用的信号。

你每天盯着盘面，刷新报价，看K线，读资讯——

你处理的东西，百分之九十七以上，是噪声。

---

这就解释了一个你可能早就注意到的现象。

为什么那些做短线交易的人，大多数最终都亏钱？

不是因为他们不努力。

而是因为他们越努力，接触的噪声越多，被噪声带偏的次数也越多。

他们把噪声当成了信号。

然后做了决策。

然后亏了钱。

然后再去寻找更多数据，试图找到"真正的信号"。

然后循环往复。

---

第三道坎，也是最致命的一道。

叫做：**过拟合**。

---

这个词，来自统计学。

但它描述的现象，你在金融市场里随处可见。

什么叫过拟合？

简单说：你的模型，对历史数据拟合得太好了。

好到什么程度？

好到它不再是在描述规律，而是在描述历史的每一个偶然细节。

举个例子。

假设你发现，过去二十年里，每当美国橄榄球超级碗的冠军来自美国联合会，股市当年就会上涨。

这是真实存在过的"规律"，叫做超级碗指标。

有人真的用它来预测股市。

这就是过拟合。

你从历史数据里挖出了一个相关性，但这个相关性，和股市的真实运行机制，没有任何因果关系。

它只是一个巧合。

但如果你的数据足够多，你总能找到这样的巧合。

西尔弗的核心观点是：当你拥有的变量越来越多，而样本量没有相应增加，过拟合几乎是不可避免的。

金融市场尤其危险。

因为历史数据极其丰富，但真正的"独立样本"其实非常少。

一百年的股市历史，听起来很多。

但如果你在研究经济周期，一百年里完整的大周期，可能只有寥寥几个。

你用几个周期拟合出来的模型，拿去预测下一个周期——

这和用三次考试成绩预测你一生的命运，没有本质区别。

---

好，现在我们来说第四道坎。

也是最让人绝望的那一道。

叫做：**黑天鹅**。

---

二零零八年，雷曼兄弟倒闭前的那个夏天。

华尔街上最顶尖的风险模型，几乎都在说同一件事：

系统性风险，很低。

他们用的是"在险价值"模型，也叫 VaR。

这个模型告诉他们，类似一九二九年大萧条那样的崩溃，发生概率极低，低到可以忽略不计。

然后。

崩溃发生了。

为什么模型失效了？

因为这些模型，都是用正常时期的数据训练出来的。

它们假设，过去的分布，代表未来的分布。

但黑天鹅事件，恰恰是那些在历史数据里几乎不存在的极端情况。

你用没有黑天鹅的数据，建立了一个不包含黑天鹅的模型，然后用这个模型预测黑天鹅出现的概率——

结果当然是：概率极低。

这不是预测失误。

这是方法论层面的根本性错误。

西尔弗在书中写道：我们倾向于低估那些超出我们经验范围的风险。不是因为我们愚蠢，而是因为我们的模型，本质上是对过去的总结，而不是对未来的探索。

---

把这四道坎放在一起，你就明白了为什么金融预测这么难。

反身性——你的预测本身改变了市场。

数据噪声——你处理的大部分信息，都是干扰。

过拟合——你的模型记住了历史，但没有理解规律。

黑天鹅——最重要的事件，往往在你的模型边界之外。

---

这里我想做一个当下的映射。

二零二三年，人工智能投资热潮席卷全球。

大量量化基金开始用机器学习模型预测市场。

这些模型，训练数据量是人类有史以来最大的。

算力是前所未有的。

结果呢？

很多模型，在牛市里表现惊艳。

然后遇到了一次政策突变，或者一次地缘冲突，或者一次意外的利率决议——

模型哑火了。

为什么？

因为这些模型，依然在用历史数据预测未来。

依然在用正常时期的规律，应对异常时期的冲击。

反身性、噪声、过拟合、黑天鹅——

这四个问题，不会因为算力变强而消失。

它们是金融市场的结构性特征。

---

那么，西尔弗的意思是不是：金融预测毫无意义，干脆放弃？

不是。

他的意思是：你需要对自己的预测，保持一种特定的谦逊。

不是虚伪的谦逊，不是客套话。

而是一种真正建立在理解不确定性基础上的谦逊。

他说，最好的预测者，不是那些试图消灭不确定性的人，而是那些学会了在不确定性里导航的人。

这两者，有着本质的区别。

消灭不确定性，是幻觉。

在不确定性里导航，是技能。

---

所以，下一个问题自然就来了。

既然金融市场这么难预测，既然噪声这么多，黑天鹅随时可能出现——

我们到底该怎么做决策？

光知道"要谦逊"是不够的。

谦逊是一种态度，但它不是一个方法。

那个方法，叫什么？

下一章，我们来看：一个真正能在不确定性中帮你做更好决策的框架，到底长什么样？它和你现在的思维方式，究竟有多大的差距？

第 4 章 · 在不确定性中做更好的决策

你有没有想过——

预测这件事，能不能练？

有人说天赋决定一切。有人说数据才是王道。

但纳特·西尔弗在这本书的最后，给出了一个让人意外的答案。

不是天赋，不是算法。

是一种思维习惯。

上一章我们讲了金融预测为什么特别难。

核心是什么？

市场会对预测本身做出反应。你一预测，世界就变了。加上数据噪声、黑天鹅事件、过度拟合的模型——金融市场几乎是人类已知最难预测的系统之一。

但西尔弗没有在这里停下来。

他接着问了一个更重要的问题：

既然预测这么难，我们该怎么办？

就这样放弃吗？

---

停。

放弃不是答案。

西尔弗在书中明确说：预测的目标从来不是"百分之百正确"，而是"比随机猜测更好"。

这一章，我们来讲最后一块拼图。

概率校准。元认知。以及，成为一个更好的预测者，到底意味着什么。

---

**先讲一个场景。**

二零一零年。

美国一家研究机构做了一项长达二十年的追踪实验。

研究对象是两百八十四位"专家"——经济学家、政治分析师、战略顾问。

研究者让他们对未来做出预测，然后记录结果。

二十年后，数据出来了。

结论让所有人都难堪。

这些专家的预测准确率——

比随机猜测好不了多少。

有些领域，甚至还不如随机。

这个研究的主持人，就是心理学家菲利普·泰特洛克。

西尔弗在书中大量引用了他的研究成果。

泰特洛克发现，这些专家有一个共同的特点：

他们太自信了。

不是普通的自信，是一种叫做"过度自信"的认知偏差。

他们说"我有九成把握"的时候，实际正确率只有七成。

他们说"我基本确定"的时候，错误率高得惊人。

---

这就是西尔弗在第八章花大量篇幅讨论的核心问题：

**概率校准。**

什么叫校准？

简单说：你说你有八成把握，那你"有八成把握"的事情，最终应该有八成是对的。

不多也不少。

如果你说了一百件"八成把握"的事，结果只有五十件是对的——

那你的概率就没有校准好。

你高估了自己。

西尔弗的核心观点是：好的预测者，不是那些"总是说对的人"，而是那些"说出的概率和现实高度吻合的人"。

这是两件完全不同的事。

---

**那怎么校准？**

西尔弗给出了一个让人意外的工具。

不是更好的模型。

不是更多的数据。

是——

**元认知。**

元认知，就是"对自己的认知过程进行思考"。

说白了：你要能看见自己是怎么想的。

你为什么得出这个结论？

你用了哪些证据？

你忽略了哪些反面信息？

你的情绪有没有影响你的判断？

西尔弗在书中写道，优秀的预测者有一个共同习惯——

他们会主动寻找让自己不舒服的证据。

注意这个词：不舒服。

不是寻找支持自己观点的证据，而是专门去找那些会推翻自己判断的信息。

这在心理学上叫做"反向确认偏差"的训练。

普通人的本能是什么？

找到支持自己的证据，然后停下来。

优秀的预测者呢？

找到支持自己的证据，然后继续问：但是，有没有我没看到的东西？

---

**停一下。**

我们来看一个当下的例子。

二零二二年，美联储开始加息。

当时市场上有两种声音。

一种说：通胀是暂时的，加息会很快结束。

另一种说：通胀已经结构化，加息会持续很久。

大多数人选择了第一种。

为什么？

因为第一种让人舒服。

加息结束意味着资产价格会反弹，意味着不用承受痛苦，意味着一切都会好起来。

但现实呢？

加息持续了将近两年。

那些坚持第一种判断的人，一次次"等待反转"，一次次被套牢。

这不是因为他们不聪明。

这是因为他们没有做概率校准——

他们的"九成把握"，从一开始就是情绪，不是概率。

---

**回到西尔弗的框架。**

第九章，他提出了一个非常具体的决策工具。

他把预测者分成两种类型，借用了古希腊的一个比喻：

**狐狸**和**刺猬**。

刺猬型的人，有一个核心的大理论，然后用这个理论解释一切。

他们观点鲜明，上电视好看，听起来特别有说服力。

但他们的预测准确率——

很差。

因为现实太复杂，一个大理论装不下所有的变量。

狐狸型的人呢？

他们没有一个统一的大理论。

他们同时持有多个相互矛盾的视角。

他们说话不那么斩钉截铁，甚至有时候让人觉得"你到底在说什么"。

但他们的预测准确率——

显著更高。

西尔弗的核心观点是：在不确定的世界里，拥抱矛盾，比坚守一个宏大叙事，更接近真相。

---

**这对我们普通人意味着什么？**

意味着：

当有人用一套完整的、自洽的、听起来无懈可击的理论来告诉你"市场一定会怎样"——

你要警惕。

越是听起来完美的预测，越可能是刺猬在说话。

越是充满"但是""然而""另一方面"的分析，反而越可能更接近真实。

---

**第十章，西尔弗讲到了一个更深的问题。**

他问：我们为什么这么不擅长处理不确定性？

答案指向人类的本能。

我们的大脑，是在几万年前的环境里进化出来的。

那个环境的特点是什么？

信息少，但行动要快。

草丛里有动静——是老虎还是风？

你没有时间做概率分析，你要立刻做决定。

这种本能帮助我们的祖先活了下来。

但在金融市场里——

这个本能是致命的。

市场的信号是模糊的，噪声是巨大的，结果是延迟的。

我们的大脑想要确定性，想要立刻行动，想要一个清晰的故事。

于是我们把噪声当成信号，把巧合当成规律，把运气当成能力。

西尔弗在书中写道，他的核心观点是：

承认不确定性，不是软弱，而是诚实。

把"我不知道"说出来，不是失败，而是校准的开始。

---

**那么，成为更好的预测者，到底有没有可能？**

有。

西尔弗给出了几个非常具体的建议。

**第一：用概率说话，不用确定性说话。**

不要说"市场会涨"，要说"我认为市场有六成概率上涨"。

这不是在模糊责任，而是在强迫自己诚实面对不确定性。

**第二：记录你的预测，然后回头看。**

这一点听起来简单，但几乎没有人真的在做。

你上个月说的"我觉得这只股票会涨"——

后来怎么样了？

你有没有记录下来，然后认真复盘？

如果没有，你就永远不知道自己的校准有多差。

**第三：区分运气和能力。**

这一次赚钱了，是因为你判断对了，还是因为你运气好？

这一次亏钱了，是因为你判断错了，还是因为你遇到了黑天鹅？

不把这两件事分清楚，你就无法从经验中真正学习。

**第四：更新，而不是辩护。**

当新证据出现，你的第一反应是什么？

是去解释为什么这个证据不重要？

还是认真考虑它是否改变了你的判断？

好的预测者，把改变主意当成进步，而不是丢脸。

---

**我们来做一个历史场景的还原。**

二零一二年，美国总统大选。

纳特·西尔弗本人，用他的统计模型，预测奥巴马会赢得选举。

当时很多政治评论员嘲笑他。

说他的模型太简单，说政治不是数学，说他不懂真实的选情。

甚至有人专门写文章，预测罗姆尼会赢。

理由听起来都很有道理：经济不好，现任总统通常会输，民调有误差……

选举结果出来了。

奥巴马赢了。

西尔弗的模型，准确预测了五十个州中的五十个州的结果。

百分之百。

但西尔弗自己怎么说？

他说：这不代表我的模型是完美的。

这只代表，这一次，信号比噪声更强。

下一次，可能就不一样了。

这句话，才是这本书最核心的精神。

---

**整书收束。**

回头看这本书，我们走过了四章。

第一章，我们看见了预测的悖论——聪明人为什么也会预测错，因为他们混淆了信号和噪声。

第二章，我们学到了贝叶斯思维——概率不是答案，而是一个随证据不断更新的起点。

第三章，我们看见了金融市场的特殊性——反身性、黑天鹅、过拟合，让这里成为最难预测的战场。

第四章，我们回到了人本身——校准、元认知、狐狸思维，这才是面对不确定性的真正武器。

西尔弗真正想告诉我们的，不是一套预测公式。

而是一种态度：

对不确定性保持诚实，对自己的判断保持怀疑，对新的证据保持开放。

这本书合上之后，你可能不会变成一个更准确的预测者。

但你会变成一个——

更清醒的人。

而在投资这件事上，清醒，已经赢过了大多数人。

承认不确定，比假装确定，更接近真相。—— 纳特·西尔弗，信号与噪声第十章核心观点提炼

本篇出现的关键概念

信号与噪声 (Signal vs. Noise): 西尔弗对信息质量的核心二分法。信号指真实存在、对理解未来有预测力的信息；噪声指随机波动、无规律、会干扰判断的数据。两者外观极为相似，人脑天生倾向于在随机点之间强行识别模式。在金融市场日线数据中，信号与噪声比约为1比45，这是短线交易者系统性亏损的信息论根源。
贝叶斯定理 (Bayes' Theorem): 由英国牧师托马斯·贝叶斯在1763年发表的遗作中提出。核心机制为：以历史数据建立先验概率，结合新证据计算后验概率，实现判断的持续更新。西尔弗将其视为区分优质预测者与劣质预测者最重要的思维工具，本质上是一套将不确定性量化并动态修正的认知框架，而非单纯的数学公式。
反身性 (Reflexivity): 金融市场特有的属性：预测行为本身会影响被预测对象的结果。当大量投资者采用同一模型并据此交易，模型发现的价格信号会被市场迅速消化，导致模型失效。这与天气预报根本不同——预报不会改变天气，但金融预测会改变价格。反身性是金融预测比其他领域从结构上更困难的核心原因之一。
校准误差 (Calibration Error): 预测者主观置信度与实际准确率之间的系统性偏差。泰洛克对近三百名专家的二十年追踪研究显示，当专家声称90%把握时，实际准确率往往只有70%至75%。校准误差越小，说明预测者对自身不确定性的估算越诚实、越精准。西尔弗认为，缩小校准误差是成为更好预测者的核心训练目标。

关于进阶系列

进阶系列

纳特·西尔弗（Nate Silver）1978年生于美国密歇根州东兰辛市，毕业于芝加哥大学经济学系。他的职业起点并非学术界，而是棒球数据分析领域。2003年至2005年间，他开发了一套名为PECOTA的棒球球员绩效预测系统，该系统通过历史相似球员的统计轨迹预测当前球员的未来表现，在职业棒球分析圈引发广泛关注。 2008年，西尔弗将统计预测方法迁移至政治选举领域，创办FiveThirtyEight网站（名称取自美国选举人团总票数538票）。当年美国总统大选，他的模型正确预测了50个州中49个州的选举结果；2012年大选，他实现了50个州全部命中。这两次预测使他成为美国公共知识领域最具辨识度的数据分析师之一。《信号与噪声》出版于2012年，是西尔弗对自身预测实践的系统性反思，也是他对整个预测科学的批判性梳理。书中涵盖气象预报、地震预测、棒球分析、政治选举、金融市场、扑克博弈等多个领域，核心论点一以贯之：预测失败的根源不是数据不足，而是人类无法有效区分信号与噪声，以及拒绝在证据面前更新自己的判断。西尔弗本人是扑克玩家，这一经历深刻影响了他对概率和不确定性的理解——扑克要求玩家在信息不完整的条件下持续做出概率最优的决策，而不是追求每一手牌的确定性结果。这与贝叶斯思维的核心精神高度吻合，也构成了本书最重要的方法论底色。

查看进阶系列全部投资笔记 →

本篇 6 句最值得抄进笔记的话

预测不是为了证明自己正确，而是为了在不确定中做出更好的判断。—— 《信号与噪声》前言
我们生活在一个信息爆炸的时代，但更多的信息不等于更多的信号。很多时候，数据越多，噪声也越多，反而让我们更容易迷失。—— 《信号与噪声》第一章
越是媒体上频繁出现的大嘴专家，预测越不准；越是那些谨慎、承认不确定性的分析师，预测反而更可靠。—— 《信号与噪声》，引述泰洛克研究
模型是对现实的简化，而不是现实本身。当我们把模型的输出当成现实的真相，麻烦就来了。—— 《信号与噪声》第一章
好的预测者，不是那些最终被证明正确的人，而是那些在每一个时间节点上，都能给出最准确概率估算的人。—— 《信号与噪声》第二章
只要音乐还在响，你就必须站起来跳舞。—— 花旗集团首席执行官查克·普林斯，2007年媒体采访，被《信号与噪声》第三章引用

常见问题

纳特·西尔弗的信号与噪声主要讲什么

《信号与噪声》出版于2012年，核心问题是：为什么在数据爆炸的时代，预测的准确率并没有显著提升？西尔弗通过气象、地震、棒球、金融、政治等多个领域的案例，论证预测失败的根源不是数据不足，而是三个系统性错误：过度自信导致置信区间过窄、将相关性误读为因果性、以及把模型输出当成现实真相。全书的核心解决方案是贝叶斯思维——用概率而非确定性来表达判断，并随新证据持续更新。

贝叶斯思维怎么用在投资决策中

贝叶斯思维在投资中的应用分三步：第一，建立先验概率，基于历史数据而非直觉，例如主动基金长期跑赢市场的历史概率约为10%至20%；第二，识别新证据，判断某只基金过去三年的超额收益是真实阿尔法还是牛市贝塔；第三，更新后验判断，将先验与新证据结合，得出经过校准的概率估算，而非直接被近期业绩吸引。关键在于，每当市场出现新信息时，主动问自己：这个证据应该让我的判断往哪个方向移动多少？

为什么短线交易者大多数亏钱

西尔弗在书中给出了一个信息论层面的解释。股市日线数据中，信号与噪声的比例约为1比45，意味着每天处理的市场信息中超过97%是随机波动，对预测未来价格没有实质帮助。短线交易者接触的数据频率越高，被噪声误导的次数也越多。他们把随机波动识别为趋势，据此下单，产生交易成本，然后在下一个噪声信号出现时再次操作。这是一个系统性的信息处理错误，而非执行层面的问题。

2008年金融危机为什么没有被模型预测到

西尔弗的分析指向两个根本原因。第一，华尔街的风险模型用历史数据训练，而美国历史上从未出现过全国性房价大幅下跌，因此模型的先验概率中，这一风险几乎为零。第二，反身性机制导致市场参与者集体低估尾部风险——当所有人都相信房价不会崩，杠杆率就会持续攀升，直到系统脆弱性积累到临界点。2007年次级贷款违约率上升、金融机构悄悄对冲风险敞口等信号已经出现，但大多数人没有用这些证据更新自己的概率判断。

菲利普·泰洛克的专家预测研究结论是什么

政治学家菲利普·泰洛克（Philip Tetlock）历时二十年，追踪近三百名政治和经济领域专家，收集逾八万条预测判断。研究结论发表后引发广泛关注：这些专家的整体预测准确率与随机猜测相差无几。更具体的发现是，媒体曝光度高、风格鲜明、善于给出确定性结论的专家，预测准确率反而更低；而那些思维方式更为谨慎、习惯承认不确定性、愿意给出概率区间的分析师，校准表现更好。泰洛克后来将这两类人分别称为刺猬型（坚守单一大理论）和狐狸型（综合多元视角），狐狸型预测者系统性地优于刺猬型。