这篇讲什么
数据预测专家西尔弗写的预测哲学——为什么聪明人也会预测错?怎么从海量噪声中找出真正的信号?
二〇〇八年金融危机前夕,华尔街最聪明的人们手握海量数据,用着最精密的模型,得出了同一个结论:风险可控。然后,一切崩塌了。这不只是一次金融失败,更是一次预测的集体失败。有意思的地方在这里——失败的原因不是数据太少,恰恰相反,可能是数据太多了。纳特·西尔弗在《信号与噪声》里提出了一个让人不舒服的问题:我们以为信息越多判断越准,但如果大多数信息都是噪声,更多数据只会让我们更自信地犯错。这本书不是在教你「如何预测未来」,而是在拆解一件更根本的事——为什么我们总是高估自己看清现实的能力,以及有没有一种更诚实的方式来面对不确定性。读完你可能会发现,那些在市场里频繁发声、言之凿凿的人,往往是最不可信的那批人。
谁该读这一篇
- 看懂为什么数据越多反而越容易做出错误判断
- 理解贝叶斯思维如何帮你在新证据出现时及时修正观点
- 学会区分市场里真实有效的信号与制造焦虑的噪声
试听第一章音频解读
精读全文
第 1 章 · 为什么聪明人也会预测错
二〇〇八年,全球最聪明的一批经济学家、银行家、评级机构,手握海量数据,配备最精密的模型——然后,他们集体预测错了。为什么?是数据不够多?还是模型不够好?纳特·西尔弗说:都不是。问题出在更根本的地方。
你有没有遇到过这种时刻——
某个专家信誓旦旦地说,这次经济一定软着陆。某个分析师拍着胸脯说,这只股票下个季度必涨。某个气象台预报明天百分之百晴天,结果你出门就被淋成落汤鸡。
我们活在一个预测泛滥的时代。
但预测的准确率,从来没有因为数据更多、模型更复杂而显著提升。
这是为什么?
这就是纳特·西尔弗写《信号与噪声》想回答的问题。
---
**先认识一下这本书的作者。**
纳特·西尔弗,美国统计学家、预测专家。他创办了大名鼎鼎的"五三八"网站——名字来自美国选举人团的总票数。
二〇〇八年美国总统大选,他用统计模型预测了五十个州中的四十九个州的选举结果。
四十九个。
二〇一二年,他做到了五十个州全对。
在一个满地"专家"的世界里,这个成绩让人无法忽视。但西尔弗不是来炫耀的。他写这本书,是为了拆解一个更深的问题:
为什么大多数预测都是错的?
而那些做对的预测,又是怎么做到的?
---
**这本书我们会分四章来读。**
第一章,也就是今天,我们从西尔弗的核心命题切入——预测为什么这么难?信号和噪声究竟是什么关系?我们会看到,聪明人犯错,往往不是因为不够聪明,而是因为陷入了一个叫"过度自信"的陷阱。
第二章,我们深入贝叶斯思维。这是西尔弗全书最核心的工具——一种用概率来思考、用证据来更新判断的方式。听起来像数学,但其实是一种思维习惯。
第三章,我们聚焦金融市场。西尔弗专门分析了为什么金融预测比其他领域更难——市场有反身性,黑天鹅随时出现,模型越复杂,反而越容易出问题。
第四章,落脚到行动。不确定性无法消除,但我们可以在不确定中做出更好的决策。西尔弗给出了成为更好预测者的具体路径。
好,现在我们进入第一章。
---
**先从一个场景说起。**
二〇〇七年底,美国房地产市场开始出现裂缝。
但华尔街的主流声音是什么?
"这只是局部调整。""次贷规模有限,不会系统性蔓延。""我们的模型显示,风险可控。"
当时花旗集团的首席执行官查克·普林斯说了一句后来被反复引用的话,大意是:只要音乐还在响,你就得继续跳舞。
音乐还在响。
然后,音乐停了。
二〇〇八年,雷曼兄弟倒闭,全球金融危机爆发,数万亿美元财富蒸发,数以百万计的普通人失去工作和住房。
那些最聪明的人,手握最多的数据,用着最复杂的模型——
全部预测错了。
西尔弗在书中写道,这场危机不只是金融的失败,更是预测的失败。人们把噪声当成了信号,把模型的精密当成了现实的可靠。
---
**什么是信号,什么是噪声?**
这是西尔弗整本书的核心命题。
他的定义很清晰:
信号,是真实存在的、能帮助我们理解世界的信息。
噪声,是随机的、无规律的、会干扰我们判断的数据。
问题在哪里?
问题在于,信号和噪声长得太像了。
你看到一组数据,它可能是真实趋势,也可能只是随机波动。你看到一个模式,它可能是规律,也可能是你的大脑在随机点之间强行连线。
人类的大脑,天生不擅长区分这两者。
西尔弗的核心观点是:我们生活在一个信息爆炸的时代,但更多的信息不等于更多的信号。很多时候,数据越多,噪声也越多,反而让我们更容易迷失。
停。
这个观点值得反复想一想。
我们通常以为,数据越多越好,信息越多越准确。但西尔弗说,不对。
他举了一个例子。假设你在预测一场棒球比赛的结果。你有球员的击球率、投手的ERA、球队的主客场胜率、天气情况、草坪湿度……数据堆成山。
但如果你不知道哪些数据是真正有预测力的,哪些只是背景噪音,你的预测可能还不如一个只看最近十场比赛的老球迷。
数据本身不是答案。
区分信号和噪声,才是答案。
---
**那为什么聪明人也会预测错?**
西尔弗给出了几个关键原因。
**第一,过度自信。**
研究显示,当人们说某件事"百分之九十确定"的时候,他们实际上只有大约百分之七十到七十五的准确率。
百分之九十的自信,换来百分之七十五的准确率。
这个偏差,在专家身上更严重,不是更轻。
为什么?因为专家掌握更多信息,这让他们感觉更确定,但感觉确定和实际准确是两回事。
西尔弗在书中特别提到了一个著名的研究——政治学家菲利普·泰洛克花了二十年时间,收集了近三百名政治和经济专家的预测,总计八万多条判断。
结果怎样?
这些专家的预测准确率,还不如随机猜测高多少。
更扎心的是——
越是媒体上频繁出现的"大嘴"专家,预测越不准。
越是那些谨慎、承认不确定性的分析师,预测反而更可靠。
**第二,把相关性当因果性。**
这是数据分析中最常见的陷阱。
两件事同时发生,不代表一件事导致了另一件事。
西尔弗举了一个极端的例子:美国某些县的有机食品销售量,和自闭症发病率高度相关。
你能因此说有机食品导致自闭症吗?
当然不能。
但在金融市场上,这种错误每天都在发生。某个指标和股市上涨同步了三年,分析师就开始把它当成预测工具。然后第四年,这个关系突然消失了。
因为它本来就不是信号,只是噪声。
**第三,模型的幻觉。**
二〇〇八年金融危机中,那些复杂的风险模型,有一个共同的问题——它们是用历史数据训练出来的。
但历史数据里,没有"历史上从未发生过的事"。
黑天鹅,按定义,不会出现在历史数据里。
所以模型告诉你风险极低,不是因为风险真的低,而是因为那种风险从来没被见过、没被记录、没被纳入模型。
西尔弗的核心观点是:模型是对现实的简化,而不是现实本身。当我们把模型的输出当成现实的真相,麻烦就来了。
---
**说到这里,我想给你一个当下的映射。**
现在是人工智能大爆发的时代。
各种AI模型被用来预测股价、预测经济走势、预测用户行为。数据量比二〇〇八年大了不知道多少倍,模型的复杂程度也是指数级提升。
但有一件事没变——
这些模型,依然是用历史数据训练的。
它们依然无法预测"历史上从未发生过的事"。
二〇二〇年新冠疫情爆发,几乎所有的经济预测模型在那一刻集体失效。不是因为模型不够好,而是因为这种规模的全球停摆,不在任何历史数据里。
西尔弗早在二〇一二年就写下了这个警告。
今天读来,依然有效。
---
**那我们该怎么办?**
西尔弗没有说"放弃预测"。他说的是:
承认不确定性,是做好预测的第一步。
这听起来很反直觉。我们通常觉得,好的预测者应该自信、果断、给出明确答案。
但西尔弗说,恰恰相反。
真正好的预测,是用概率说话,而不是用确定性说话。
不是"明年经济会衰退",而是"明年经济衰退的概率是百分之四十"。
不是"这只股票会涨",而是"基于现有信息,这只股票上涨的可能性更大,但我可能是错的"。
这种思维方式,有一个名字。
贝叶斯思维。
这就是我们下一章要深入探讨的核心工具。
---
西尔弗在书的前言里有一句话,大意是这样的:
预测不是为了证明自己正确,而是为了在不确定中做出更好的判断。
这个区别,看起来微小,实则天壤之别。
如果你预测是为了证明自己正确,你会倾向于选择确定性高的表述,回避承认错误,把模型的输出当成真相。
如果你预测是为了做出更好的判断,你会主动寻找反驳自己的证据,承认模型的局限,把每一次预测错误当成更新认知的机会。
前者,是噪声制造机。
后者,才是信号捕捉者。
---
好,第一章我们先到这里。
今天我们看到了预测失败的三个根源——过度自信、混淆相关与因果、模型的幻觉。也看到了西尔弗给出的方向:用概率思考,承认不确定性。
但这只是方向。
具体怎么做?有没有一套可以操作的思维框架?
三百年前,一个英国牧师在遗作里留下了一个公式。这个公式后来改变了统计学、医学、情报分析,甚至影响了现代投资决策。
它叫贝叶斯定理。
它到底是什么?为什么西尔弗说,它是区分好预测者和坏预测者最重要的工具?
我们下一章见。
第 2 章 · 贝叶斯思维:从概率到行动
你有没有想过——你每天做的每一个判断,其实都是一次概率计算?只是大多数人算错了。有一个两百多年前的牧师,用一个简单到离谱的公式,彻底改变了人类对"不确定性"的理解。今天我们就来拆开它。
上一章我们讲了预测的悖论——数据越来越多,模型越来越复杂,但预测的准确率并没有因此提升。核心原因是:我们分不清信号和噪声。那今天的问题来了,既然噪声无处不在,我们到底该怎么思考?西尔弗给出的答案,是一个名字听起来很学术、但本质上极其实用的工具。
贝叶斯定理。
---
**先认识一个人。**
托马斯·贝叶斯。
英国牧师,十八世纪。
他不是数学家,不是经济学家,甚至不是职业学者。他只是一个对"上帝存在的概率"感到好奇的神学家。
他在世时,这篇论文从未发表。
他死后两年,一七六三年,他的朋友帮他把手稿整理出来,投给了英国皇家学会。
就这样,一篇差点被历史淹没的论文,成了现代概率论的基石。
停。
你可能要问了:一个牧师写的东西,跟我的投资决策有什么关系?
关系大了。
---
**贝叶斯定理到底在说什么?**
用最简单的话说,就是四个字:
用证据更新。
西尔弗在书中写道,贝叶斯定理的核心不是一个公式,而是一种思维方式——你对世界的判断,不应该是一个固定的答案,而应该是一个随时可以被新证据修正的概率。
听起来简单。
但大多数人不是这样思考的。
大多数人的思维模式是什么?是"我认为"。是"我感觉"。是一旦形成判断,就开始找证据来支持它,而不是用证据来更新它。
这就是确认偏误。
这就是为什么聪明人也会预测错。
---
**来还原一个历史场景。**
一九四五年,二战结束前夕。
美国情报机构面对一个问题:日本会不会在本土决战?
大量情报涌来。有的说日本已经精疲力竭,有的说日本本土还有数百万士兵。有的说天皇想议和,有的说军部坚决抵抗。
情报分析员们怎么处理这些信息?
大多数人选择了自己"相信"的那一套,然后把其他信息当作噪声过滤掉。
结果呢?
没有人预测到广岛之后日本会迅速投降。
没有人预测到一颗炸弹就能改变整个战局。
为什么?
因为他们的判断是静态的。他们没有一个机制,让新证据真正改变自己的概率估算。
这就是贝叶斯思维缺席的代价。
---
**那贝叶斯思维是怎么运作的?**
三个步骤。
第一步:先验概率。
在你看到任何新证据之前,你对这件事的基础判断是什么?
举个例子。你在路上捡到一个钱包。你会不会想"这是陷阱"?
你的先验概率,来自你的经验、常识、历史数据。大多数捡到的钱包不是陷阱——这就是你的先验。
第二步:新证据。
你打开钱包,里面有一张便条,写着"如有拾获请联系某某某",还有一叠现金。
这是新证据。
第三步:更新概率。
你把先验概率和新证据结合起来,得出一个新的判断——后验概率。
这个钱包大概率不是陷阱,而是有人真的丢了钱包。
你的行动随之改变:你打电话联系失主。
---
听起来很直觉化,对吗?
但等等。
真正难的,不是这个流程。
真正难的,是两件事。
第一:你的先验概率从哪里来?
第二:你愿不愿意在证据面前,真的改变自己的判断?
---
**先说先验概率。**
西尔弗的核心观点是:先验概率不能凭感觉,必须有数据基础。
但人类天生不擅长这件事。
我们对罕见事件的概率估算,系统性地偏高。
我们对常见事件的概率估算,系统性地偏低。
为什么?
因为我们用的是记忆,不是统计。
飞机失事的新闻你记得清清楚楚,但你忘了全年坐飞机死亡的概率是多少。
百万分之零点零七。
而开车上路的死亡率,是坐飞机的将近一百倍。
但大多数人觉得坐飞机更危险。
这就是先验概率被情绪污染的结果。
---
**再说第二件难事:你愿不愿意更新?**
这才是真正的战场。
西尔弗在书中举了一个让人印象深刻的例子——气象预报员。
他发现,美国国家气象局的预报员,在概率校准上做得相当好。他们说"明天有百分之七十的降雨概率",真实降雨率确实接近七成。
但私人气象公司呢?
他们的预报系统性地夸大了降雨概率。
为什么?
因为用户更害怕"没带伞被淋湿",而不是"带了伞没用上"。
所以气象公司把概率往高处报,迎合用户心理。
这叫什么?
这叫激励扭曲了先验。
你以为你在做概率判断,其实你在做利益判断。
---
**这件事放到投资里,会发生什么?**
想一想。
二零零七年,次贷危机前夜。
华尔街的风险模型都在说:房价不会大幅下跌。
为什么?
因为过去几十年的数据里,全国性的房价大跌从未发生过。
先验概率:房价崩盘的可能性极低。
但新证据呢?
次级贷款违约率开始攀升。
杠杆率创历史新高。
金融机构开始悄悄对冲自己的风险敞口。
这些都是信号。
但大多数人没有更新自己的概率。
为什么?
因为更新意味着承认自己之前的判断可能有问题。
因为更新意味着要放弃已经押注的仓位。
因为更新有成本,不更新有借口。
结果呢?
雷曼兄弟倒闭。
金融海啸。
数以万亿计的财富蒸发。
---
**贝叶斯思维的真正价值,在这里。**
它不是让你预测未来。
没有人能预测未来。
它是让你在不确定的世界里,持续做出比别人更合理的判断。
西尔弗的核心观点是:好的预测者,不是那些最终被证明正确的人,而是那些在每一个时间节点上,都能给出最准确概率估算的人。
注意这个区别。
结果正确,可能是运气。
过程合理,才是能力。
---
**一个当下的映射案例。**
你在考虑要不要买某只基金。
你看到它过去三年年化收益百分之二十。
你的第一反应是什么?
大多数人的第一反应是:这只基金很牛,应该买。
但贝叶斯思维会怎么问?
先验概率:一个基金能持续跑赢市场的概率,历史数据告诉我们,大约只有百分之十到二十。
新证据:过去三年收益百分之二十。
这个证据,是真实的阿尔法,还是恰好赶上了牛市的贝塔?
这两者的概率,你有没有认真估算过?
如果没有,你的决策就不是贝叶斯的,而是情绪的。
---
**最后,西尔弗在书中提到了一个让人警醒的概念:过度自信。**
他说,大多数人在做预测时,给出的置信区间太窄了。
什么意思?
你说"我九成把握明年经济会复苏",但如果真的让一百个人各做一百次这样的判断,那些声称九成把握的预测,实际准确率可能只有六成。
这个差距,叫做校准误差。
校准误差越小,你的概率判断越可靠。
校准误差越大,你的自信只是一种幻觉。
贝叶斯思维的训练,本质上就是缩小这个误差的过程。
---
好。
今天我们把贝叶斯思维拆开看了一遍。
先验概率,证据更新,后验判断。
听起来清晰,但有一个问题,我们还没有回答。
贝叶斯思维有一个前提——你需要有可靠的历史数据来建立先验。
但如果这个领域,历史数据本身就是靠不住的呢?
如果这个领域,你的预测行为本身,就会改变预测的结果呢?
金融市场,就是这样一个地方。
下一章我们要进入一个更硬的问题:为什么金融预测,比天气预报难得多?为什么越多人用同一个模型,这个模型就越快失效?金融市场里的"噪声",到底有多危险?
第 3 章 · 为什么金融预测特别困难
你有没有想过,为什么那些拿着最好数据、最贵模型的华尔街精英,依然会在金融危机面前集体失明?不是他们不聪明。恰恰相反——正是因为他们太聪明了,才会犯下最致命的错误。
上一章我们讲了贝叶斯思维。
核心是什么?
不要把概率当成固定答案,而是把它当成一个可以不断更新的起点。每当新证据出现,你就调整你的判断。这听起来很合理,很科学。
但是——
今天的问题来了。
如果你把这套工具搬进金融市场,会发生什么?
---
**二零零七年。**
美国。
花旗集团的首席执行官,查克·普林斯,接受了一家媒体的采访。
记者问他:次贷市场的风险这么大,你们为什么还在继续扩张?
他的回答,后来成了金融史上最著名的一句话。
他说:
"只要音乐还在响,你就必须站起来跳舞。"
当时没有人把这句话当成警告。
大家都以为,他说的是一种策略。
一年后,次贷危机全面爆发。花旗集团亏损超过两百七十亿美元。查克·普林斯离职。
音乐停了。
而几乎所有人,都没有提前坐下来。
---
为什么?
这就是纳特·西尔弗在《信号与噪声》第六、七章里,试图回答的核心问题。
他的核心观点是:金融市场,是所有预测领域里最难的那一个。
不是之一。
是最难。
为什么?
因为金融市场有一个其他领域都没有的特性——
**反身性。**
---
什么叫反身性?
我来给你举一个例子。
你预测明天会下雨。
这个预测,不会让明天真的下雨。
天气不会因为你的判断而改变。
但金融市场不一样。
你预测某只股票要涨。
你买入。
你的朋友看到你买了,也买入。
更多人看到有人买,也跟着买。
股价真的涨了。
你的预测,变成了现实的一部分。
西尔弗在书中写道:金融市场是少数几个"预测行为本身会影响预测结果"的系统。你不是一个站在玻璃后面观察市场的旁观者,你是市场的一部分。你的每一个判断,都在改变你试图判断的那个东西。
停。
想想这意味着什么。
如果你的模型足够准确,足够多的人开始用它,这个模型就会失效。
因为市场已经把你的预测价格进去了。
这不是悖论,这是金融市场的基本运行逻辑。
---
好,反身性是第一道坎。
第二道坎,更隐蔽。
叫做:**数据噪声**。
---
很多人觉得,金融市场是数据最丰富的地方。
这话没错。
股票价格每秒都在更新。交易量、波动率、换手率,数以亿计的数据点,实时生成。
但西尔弗要告诉你一件反直觉的事:
数据越多,不一定噪声越少。
有时候恰恰相反。
他在书中提出了一个关键区分——
信号,是那些真正与未来结果相关的信息。
噪声,是那些看起来像信号、但其实什么都不是的随机波动。
而在金融市场里,噪声的比例,远远超过你的想象。
西尔弗在书中引用了一组数据:
如果你观察股市的年度回报,信号与噪声的比例大约是——
**五比一。**
信号占五分之一,噪声占五分之四。
但如果你把时间窗口缩短到每天,这个比例会变成什么?
**一比四十五。**
每四十五份信息里,只有一份是真正有用的信号。
你每天盯着盘面,刷新报价,看K线,读资讯——
你处理的东西,百分之九十七以上,是噪声。
---
这就解释了一个你可能早就注意到的现象。
为什么那些做短线交易的人,大多数最终都亏钱?
不是因为他们不努力。
而是因为他们越努力,接触的噪声越多,被噪声带偏的次数也越多。
他们把噪声当成了信号。
然后做了决策。
然后亏了钱。
然后再去寻找更多数据,试图找到"真正的信号"。
然后循环往复。
---
第三道坎,也是最致命的一道。
叫做:**过拟合**。
---
这个词,来自统计学。
但它描述的现象,你在金融市场里随处可见。
什么叫过拟合?
简单说:你的模型,对历史数据拟合得太好了。
好到什么程度?
好到它不再是在描述规律,而是在描述历史的每一个偶然细节。
举个例子。
假设你发现,过去二十年里,每当美国橄榄球超级碗的冠军来自美国联合会,股市当年就会上涨。
这是真实存在过的"规律",叫做超级碗指标。
有人真的用它来预测股市。
这就是过拟合。
你从历史数据里挖出了一个相关性,但这个相关性,和股市的真实运行机制,没有任何因果关系。
它只是一个巧合。
但如果你的数据足够多,你总能找到这样的巧合。
西尔弗的核心观点是:当你拥有的变量越来越多,而样本量没有相应增加,过拟合几乎是不可避免的。
金融市场尤其危险。
因为历史数据极其丰富,但真正的"独立样本"其实非常少。
一百年的股市历史,听起来很多。
但如果你在研究经济周期,一百年里完整的大周期,可能只有寥寥几个。
你用几个周期拟合出来的模型,拿去预测下一个周期——
这和用三次考试成绩预测你一生的命运,没有本质区别。
---
好,现在我们来说第四道坎。
也是最让人绝望的那一道。
叫做:**黑天鹅**。
---
二零零八年,雷曼兄弟倒闭前的那个夏天。
华尔街上最顶尖的风险模型,几乎都在说同一件事:
系统性风险,很低。
他们用的是"在险价值"模型,也叫 VaR。
这个模型告诉他们,类似一九二九年大萧条那样的崩溃,发生概率极低,低到可以忽略不计。
然后。
崩溃发生了。
为什么模型失效了?
因为这些模型,都是用正常时期的数据训练出来的。
它们假设,过去的分布,代表未来的分布。
但黑天鹅事件,恰恰是那些在历史数据里几乎不存在的极端情况。
你用没有黑天鹅的数据,建立了一个不包含黑天鹅的模型,然后用这个模型预测黑天鹅出现的概率——
结果当然是:概率极低。
这不是预测失误。
这是方法论层面的根本性错误。
西尔弗在书中写道:我们倾向于低估那些超出我们经验范围的风险。不是因为我们愚蠢,而是因为我们的模型,本质上是对过去的总结,而不是对未来的探索。
---
把这四道坎放在一起,你就明白了为什么金融预测这么难。
反身性——你的预测本身改变了市场。
数据噪声——你处理的大部分信息,都是干扰。
过拟合——你的模型记住了历史,但没有理解规律。
黑天鹅——最重要的事件,往往在你的模型边界之外。
---
这里我想做一个当下的映射。
二零二三年,人工智能投资热潮席卷全球。
大量量化基金开始用机器学习模型预测市场。
这些模型,训练数据量是人类有史以来最大的。
算力是前所未有的。
结果呢?
很多模型,在牛市里表现惊艳。
然后遇到了一次政策突变,或者一次地缘冲突,或者一次意外的利率决议——
模型哑火了。
为什么?
因为这些模型,依然在用历史数据预测未来。
依然在用正常时期的规律,应对异常时期的冲击。
反身性、噪声、过拟合、黑天鹅——
这四个问题,不会因为算力变强而消失。
它们是金融市场的结构性特征。
---
那么,西尔弗的意思是不是:金融预测毫无意义,干脆放弃?
不是。
他的意思是:你需要对自己的预测,保持一种特定的谦逊。
不是虚伪的谦逊,不是客套话。
而是一种真正建立在理解不确定性基础上的谦逊。
他说,最好的预测者,不是那些试图消灭不确定性的人,而是那些学会了在不确定性里导航的人。
这两者,有着本质的区别。
消灭不确定性,是幻觉。
在不确定性里导航,是技能。
---
所以,下一个问题自然就来了。
既然金融市场这么难预测,既然噪声这么多,黑天鹅随时可能出现——
我们到底该怎么做决策?
光知道"要谦逊"是不够的。
谦逊是一种态度,但它不是一个方法。
那个方法,叫什么?
下一章,我们来看:一个真正能在不确定性中帮你做更好决策的框架,到底长什么样?它和你现在的思维方式,究竟有多大的差距?
第 4 章 · 在不确定性中做更好的决策
你有没有想过——
预测这件事,能不能练?
有人说天赋决定一切。有人说数据才是王道。
但纳特·西尔弗在这本书的最后,给出了一个让人意外的答案。
不是天赋,不是算法。
是一种思维习惯。
上一章我们讲了金融预测为什么特别难。
核心是什么?
市场会对预测本身做出反应。你一预测,世界就变了。加上数据噪声、黑天鹅事件、过度拟合的模型——金融市场几乎是人类已知最难预测的系统之一。
但西尔弗没有在这里停下来。
他接着问了一个更重要的问题:
既然预测这么难,我们该怎么办?
就这样放弃吗?
---
停。
放弃不是答案。
西尔弗在书中明确说:预测的目标从来不是"百分之百正确",而是"比随机猜测更好"。
这一章,我们来讲最后一块拼图。
概率校准。元认知。以及,成为一个更好的预测者,到底意味着什么。
---
**先讲一个场景。**
二零一零年。
美国一家研究机构做了一项长达二十年的追踪实验。
研究对象是两百八十四位"专家"——经济学家、政治分析师、战略顾问。
研究者让他们对未来做出预测,然后记录结果。
二十年后,数据出来了。
结论让所有人都难堪。
这些专家的预测准确率——
比随机猜测好不了多少。
有些领域,甚至还不如随机。
这个研究的主持人,就是心理学家菲利普·泰特洛克。
西尔弗在书中大量引用了他的研究成果。
泰特洛克发现,这些专家有一个共同的特点:
他们太自信了。
不是普通的自信,是一种叫做"过度自信"的认知偏差。
他们说"我有九成把握"的时候,实际正确率只有七成。
他们说"我基本确定"的时候,错误率高得惊人。
---
这就是西尔弗在第八章花大量篇幅讨论的核心问题:
**概率校准。**
什么叫校准?
简单说:你说你有八成把握,那你"有八成把握"的事情,最终应该有八成是对的。
不多也不少。
如果你说了一百件"八成把握"的事,结果只有五十件是对的——
那你的概率就没有校准好。
你高估了自己。
西尔弗的核心观点是:好的预测者,不是那些"总是说对的人",而是那些"说出的概率和现实高度吻合的人"。
这是两件完全不同的事。
---
**那怎么校准?**
西尔弗给出了一个让人意外的工具。
不是更好的模型。
不是更多的数据。
是——
**元认知。**
元认知,就是"对自己的认知过程进行思考"。
说白了:你要能看见自己是怎么想的。
你为什么得出这个结论?
你用了哪些证据?
你忽略了哪些反面信息?
你的情绪有没有影响你的判断?
西尔弗在书中写道,优秀的预测者有一个共同习惯——
他们会主动寻找让自己不舒服的证据。
注意这个词:不舒服。
不是寻找支持自己观点的证据,而是专门去找那些会推翻自己判断的信息。
这在心理学上叫做"反向确认偏差"的训练。
普通人的本能是什么?
找到支持自己的证据,然后停下来。
优秀的预测者呢?
找到支持自己的证据,然后继续问:但是,有没有我没看到的东西?
---
**停一下。**
我们来看一个当下的例子。
二零二二年,美联储开始加息。
当时市场上有两种声音。
一种说:通胀是暂时的,加息会很快结束。
另一种说:通胀已经结构化,加息会持续很久。
大多数人选择了第一种。
为什么?
因为第一种让人舒服。
加息结束意味着资产价格会反弹,意味着不用承受痛苦,意味着一切都会好起来。
但现实呢?
加息持续了将近两年。
那些坚持第一种判断的人,一次次"等待反转",一次次被套牢。
这不是因为他们不聪明。
这是因为他们没有做概率校准——
他们的"九成把握",从一开始就是情绪,不是概率。
---
**回到西尔弗的框架。**
第九章,他提出了一个非常具体的决策工具。
他把预测者分成两种类型,借用了古希腊的一个比喻:
**狐狸**和**刺猬**。
刺猬型的人,有一个核心的大理论,然后用这个理论解释一切。
他们观点鲜明,上电视好看,听起来特别有说服力。
但他们的预测准确率——
很差。
因为现实太复杂,一个大理论装不下所有的变量。
狐狸型的人呢?
他们没有一个统一的大理论。
他们同时持有多个相互矛盾的视角。
他们说话不那么斩钉截铁,甚至有时候让人觉得"你到底在说什么"。
但他们的预测准确率——
显著更高。
西尔弗的核心观点是:在不确定的世界里,拥抱矛盾,比坚守一个宏大叙事,更接近真相。
---
**这对我们普通人意味着什么?**
意味着:
当有人用一套完整的、自洽的、听起来无懈可击的理论来告诉你"市场一定会怎样"——
你要警惕。
越是听起来完美的预测,越可能是刺猬在说话。
越是充满"但是""然而""另一方面"的分析,反而越可能更接近真实。
---
**第十章,西尔弗讲到了一个更深的问题。**
他问:我们为什么这么不擅长处理不确定性?
答案指向人类的本能。
我们的大脑,是在几万年前的环境里进化出来的。
那个环境的特点是什么?
信息少,但行动要快。
草丛里有动静——是老虎还是风?
你没有时间做概率分析,你要立刻做决定。
这种本能帮助我们的祖先活了下来。
但在金融市场里——
这个本能是致命的。
市场的信号是模糊的,噪声是巨大的,结果是延迟的。
我们的大脑想要确定性,想要立刻行动,想要一个清晰的故事。
于是我们把噪声当成信号,把巧合当成规律,把运气当成能力。
西尔弗在书中写道,他的核心观点是:
承认不确定性,不是软弱,而是诚实。
把"我不知道"说出来,不是失败,而是校准的开始。
---
**那么,成为更好的预测者,到底有没有可能?**
有。
西尔弗给出了几个非常具体的建议。
**第一:用概率说话,不用确定性说话。**
不要说"市场会涨",要说"我认为市场有六成概率上涨"。
这不是在模糊责任,而是在强迫自己诚实面对不确定性。
**第二:记录你的预测,然后回头看。**
这一点听起来简单,但几乎没有人真的在做。
你上个月说的"我觉得这只股票会涨"——
后来怎么样了?
你有没有记录下来,然后认真复盘?
如果没有,你就永远不知道自己的校准有多差。
**第三:区分运气和能力。**
这一次赚钱了,是因为你判断对了,还是因为你运气好?
这一次亏钱了,是因为你判断错了,还是因为你遇到了黑天鹅?
不把这两件事分清楚,你就无法从经验中真正学习。
**第四:更新,而不是辩护。**
当新证据出现,你的第一反应是什么?
是去解释为什么这个证据不重要?
还是认真考虑它是否改变了你的判断?
好的预测者,把改变主意当成进步,而不是丢脸。
---
**我们来做一个历史场景的还原。**
二零一二年,美国总统大选。
纳特·西尔弗本人,用他的统计模型,预测奥巴马会赢得选举。
当时很多政治评论员嘲笑他。
说他的模型太简单,说政治不是数学,说他不懂真实的选情。
甚至有人专门写文章,预测罗姆尼会赢。
理由听起来都很有道理:经济不好,现任总统通常会输,民调有误差……
选举结果出来了。
奥巴马赢了。
西尔弗的模型,准确预测了五十个州中的五十个州的结果。
百分之百。
但西尔弗自己怎么说?
他说:这不代表我的模型是完美的。
这只代表,这一次,信号比噪声更强。
下一次,可能就不一样了。
这句话,才是这本书最核心的精神。
---
**整书收束。**
回头看这本书,我们走过了四章。
第一章,我们看见了预测的悖论——聪明人为什么也会预测错,因为他们混淆了信号和噪声。
第二章,我们学到了贝叶斯思维——概率不是答案,而是一个随证据不断更新的起点。
第三章,我们看见了金融市场的特殊性——反身性、黑天鹅、过拟合,让这里成为最难预测的战场。
第四章,我们回到了人本身——校准、元认知、狐狸思维,这才是面对不确定性的真正武器。
西尔弗真正想告诉我们的,不是一套预测公式。
而是一种态度:
对不确定性保持诚实,对自己的判断保持怀疑,对新的证据保持开放。
这本书合上之后,你可能不会变成一个更准确的预测者。
但你会变成一个——
更清醒的人。
而在投资这件事上,清醒,已经赢过了大多数人。
承认不确定,比假装确定,更接近真相。—— 纳特·西尔弗,信号与噪声第十章核心观点提炼
关于进阶系列
纳特·西尔弗是美国统计学家,「五三八」网站创始人。二〇〇八年美国大选,他用统计模型预测了五十个州中四十九个州的结果;二〇一二年,他做到了全部命中。这本书出版于二〇一二年,迅速成为数据分析领域的标志性读物,被广泛引用于金融、政策和科学讨论中。它的价值不在于提供预测公式,而在于系统梳理了人类在不确定性面前最常犯的思维错误。在信息过载已成常态的今天,这本书的核心问题比出版时更迫切。
查看进阶系列全部投资笔记 →本篇 1 句最值得抄进笔记的话
- 承认不确定,比假装确定,更接近真相。—— 纳特·西尔弗,信号与噪声第十章核心观点提炼