模型思考者

723 阅读14分钟

[TOC]

模型思考者

《模型思考者》出自佩奇开的一个“模型思维课”,刚开始在大学里面,后来放到网上就成了网红课了,目前已经有超过100万人在学习。我们连续地去分析了《系统性思维》,《第五项修炼》,不知不觉都触碰到了"模型"的概念,那么我们接下来就详细描述下模型是什么。

当然,在《模型思考者》里面列举了大量的模型,在此我们只把一些我觉得有意思的模型给大家描述一下。期望同学们有时间把整个书看一遍,相信即使看的时候记不住,身体里也会种下一颗小种子。总有一天小种子会长成参天大树。

1. 模型是什么

1.1 思考正规化

要想用高级方法研究问题,需要把思考给正规化。那么什么叫做正规化?

打个比方,比方一个小孩和一个大人踢球,大人用力一踢肯定能踢得比小孩儿远。然后呢我们就得到一个规律:力气越大球就会越远。

这样的思考方式没问题,但是就是太落后了。当你去研究如果我的力气大了两倍,球被踢出去的距离增加了多少之类的这种问题就没有办法解决了。我们中文里面的成语大量存在这种成语,包括《孙子兵法》在内,都只限于低层次的模糊关系的逻辑里面。

而生活在复杂现实世界内,现代人很难依赖那些成语典故进行决策,它本身没有办法做各种推理。那怎么办呢?现代人应该使用更高级的思考方式进行决策,最起码一点,一个简单的数学公式就可以表达出上文中出现的踢球速度与球的飞行速度之间的关系。这个时候你脑子里的就不是一个简单的模糊的关系,而是一个可以支持精细化推演的踢球模型了。

这个过程,我们称为思考的正规化。

模型是对真实世界的抽象,只有抽象的东西,才是属于逻辑世界的。建立了模型,你才能做推演。

我们针对"正规化了的思考"做两点定义:

  1. 模型中包含的各种实体,包括人或组织或物品以及这些实体之间的相互关系,必须都有非常明确的定义。
  2. 模型本身是可以做精细化推导的。

1.2 从数据到智慧

为了进一步理解模型,我们考虑一个认知上的金字塔。

金字塔的最底层是数据。数据代表各种事件和现象,比如你出门看见下雨了,这就是一个数据。数据本身没有组织和结构,也没有意义。数据只能告诉你发生了什么,并不能让你理解为什么会发生。

数据的上一层是信息。信息是结构化的数据。你看见下雨只是数据,但如果有人统计哈尔滨市在2019年7月份这一个月总共下了多少雨,这就不是简单的数据了,而是信息。信息是很有用的,可以用来做分析和解读。

信息再往上一层是知识。知识能把信息组织起来,告诉我们事件之间的逻辑联系。有云导致下雨,因为下雨所以天气变得凉快,这都是知识。成语典故和思维套路都是知识。模型,则可以说是一种高级知识,能解释一些事情,还能做预测。

认知金字塔的最上一层,是智慧。智慧是识别和选择相关知识的能力。

你可能掌握很多模型,但是具体到这个问题到底该用哪个模型,敢不敢用这个模型,则是智慧。

从数据到智慧,这是真正意义上的认知升级。如果一个人浑浑噩噩地混日子,只体验而不知道总结,他得到的就只有数据。有人偶尔看看新闻,知道现在发生的事情都是什么意思,他就获得了信息。有人能从经验中总结一些规律,还从书本上学到一些说法,他就拥有了知识。

那为什么有很多人说“学了很多知识,却仍然过不好这一生”呢?因为有知识不等于有智慧。有智慧,会选择该用哪个知识,能使用模型做出决策,而且还真敢去执行,那才是真本事。

从数据到智慧,你会发现越往上就越主观。信息已经是个性化的总结。知识中的因果关系已经是主观的判断。而智慧,更可以说是一种艺术。到底该选哪个模型?没有固定的操作流程。

经济学家有句名言说“所有模型都是错的,其中有一些是有用的。”模型说的不是真实世界,而是对真实事件的抽象和简化。你必须忽略很多因素,才能让问题可以推演。而这么做的危险是你可能得到完全错误的结论。

所以你需要了解每个模型的优点和局限性。你需要有举一反三的能力。你需要有创造性。

总结来说,模型是对真实世界的一种主观抽象描写,代表正规化的思考。模型通过严谨的定义和数学逻辑关系,允许我们做精致的推演,从而获得精确交流、解释、判断、设计、预测、探索和采取行动的能力。而选择什么样的模型、选择一个还是几个模型,则是智慧。

1.3 多模型思考

有一个统计学大师,叫乔治·博克斯曾经说过,所有的模型都是错的。他本质上的意思是,模型只在特定的尺度上成立。也就是说,面对复杂事物,只用一个模型进行概括,进行观察往往是不全面的,这将会导致得到的结论与事实的真相差距很远。所以,要想理解真实世界,我们需要的不是模型,而是多模型。通过使用多个模型的组合,将事物拼凑出来,这将会大大提高判断的准确。

多模型思维,是一种抛弃习惯经验,切换思考逻辑的能力。

2. 模型实例

这部分将会从书中挑出一些有意思的模型案例,以后慢慢丰富起来。书内的模型分为23组,每组又会有好几个模型组成,因此全部会有100个左右。这些都是前辈们留下的精华。这些模型我先在这里列举一下:

正态分布、幂律分布、线性模型、非线性模型、与价值和权力有关的模型、网络模型、广播模型、扩散模型和传染模型、对不确定性建模随机游走、路径依赖模型、局部互动模型、李雅普诺夫函数与均衡、马尔可夫模型、系统动力学模型、基于阈值的模型、空间竞争模型与享受竞争模型、博弈论模型、合作模型、与集体行动有关的问题、与机制设计有关的模型、信号模型、学习模型、多臂老虎机问题、崎岖景观模型。

而这里呢,就简单把一些我觉得有意思的模型单独摘出来。

2.1 分布模型

这是开篇第一组模型,也是最容易理解的一组模型。但是这组模型的应用场合却相当多。

分布模型细分会有两种,即正态分布和幂律分布。

正态分布,也叫常态分布。你可以把它想象成,一个追求平均,一切资源均等的世界。简单说,就是在所有的样本中,那个最接近常态的平均值占比最大。比如人的身高,大多数人,都是不高不矮,比较接近平均身高。再比如高考分数,大多数人都处在一个不太高,也不太低的分数区间。满分和零分,都非常罕见。而幂律分布是,平均值的比例优势消失了。你可以把它想象成,一个赢家通吃的世界。在所有的样本中,少数人,占据了大多数资源。比如财富,少部分人,拥有着社会的大部分财富。再比如流量,网络上的大V,占据着绝大多数流量。而剩下的大多数,粉丝都很少。

比如,让你设计公共汽车上的扶手高度。考虑到人的身高是正态分布,特别高的和特别矮的都是少数,它的高度就应该是,一个不高不矮的人,伸手恰好能够到的高度。但是,假如你在林业部门工作,要维护一整片森林。你就要意识到,森林火灾这件事,是幂律分布。也就是,火灾的发生率虽然很低,但是,它造成的损失非常大。这时,你就要重视防火抢险工作,为此储备大量的资源。

当然,这些都是事后的观察总结。我们更关心的,是面对一个陌生的系统时,怎么判断,它到底是遵循正态分布,还是幂律分布?这个标准其实很简单,那就是看,样本之间,会不会相互影响。假如样本之间是独立的,比如身高,张三的身高,影响不到李四的身高。那么你就可以判断,身高遵循的是正态分布。假如样本之间相互关联,彼此影响,这个系统就遵循幂律分布。比如森林大火,一棵树着火,十有八九会点着周围的树。再比如财富,越有钱的人,就越能获得赚钱的机会,财富之间存在关联交易,它就会呈现出幂律分布。 在面对一个具体的项目时,假如在正态分布和幂律分布这件事上,你判断错了,就很可能会导致失控。比如,波士顿的中央隧道工程,是美国有史以来最昂贵的公路项目,从1991年盖到2006年,一共花了140亿美元,是当初预算的三倍。这就是因为,用错了概率模型。 一开始,人们认为,隧道工程遵循着正态分布,也就是,各个环节之间相互独立,不会彼此影响。像挖掘地沟、设计墙壁、建造顶盖,大家各顾各的,谁也不妨碍谁。所以,在初期规划时,每个步骤的成本都是固定的,并没有留出太多的余地。 但是,真到了施工,你就会发现,事情没那么简单。比如,制作顶盖的时候,出了一些问题,你就得拆除原有的顶盖。这就意味着你要破坏墙壁,回头墙壁也得跟着重做。墙壁里的线管,也得重新铺。每个环节环环相扣,最终,一个小问题,演变成了一组相互制约的大问题。但是,这些其实是可以在前期规划时避免的。假如你意识到,这是一个幂律分布的系统,就会在前期加大沟通成本,并且为风险控制,留出更多的余地。

这是第一组模型,分布模型。它的作用是,帮我们合理的规划资源,控制风险。

2.2 网络模型

网络模型,这个会稍微简单一些。网络模型使用用网络化的方式,来看待人群。不要把人群看成一个个孤立的点,而是看成一张网。它的价值是,可以帮你快速找到,问题的突破口。 咱们还是从一个问题说起。假设,在一个城市里,突然爆发了病毒,蔓延速度很快。针对这个病毒,有一种特效疫苗。但疫苗的数量很有限,只能给少部分人注射。请问,你应该把疫苗给谁? 可能有人说,当然是先给老幼妇孺啊,这些人抵抗力低,更需要疫苗。也可能有人说,应该先给那些各行各业的精英,他们是社会的中流砥柱。还可能有人说,为了公平起见,应该抽签,把一切交给运气。 但是,从网络模型的角度看,其实还有一个更科学的办法。假如把人群看成一张网,把每个人看成一个节点,人和人之间的联系,看成是节点之间的连接线。你会发现,有节点跟周围的连接特别充分,这些人特别容易跟别人发生接触。可能是因为他人缘好,也可能是因为他的工作需要跟人打交道。假如这些人感染,他们马上就会传染给其他的人。所以,按照网络模型,应该先把疫苗给这些人。这样能更有效地控制疫情蔓延。 再比如,你要向市场推广一个新产品,也可以把拥有最多连接的节点,当成种子用户,先发给他们试用,然后让他们帮你推广。总之,不管你想扩散观点还是控制问题,通过网络模型,我们都可以快速找到,一个问题的突破口。这个突破口,往往就是拥有最多连接数的节点。

2.3 路径依赖

用数学语言来说,所谓路径依赖,就是过去发生的事件,会改变未来事件发生的概率。

最先想到的一个例子就是现在都在用的QWERTY键盘。有个说法认为这种键盘的字母排列布局其实是不合理的,当初的人之所以把键盘设计成这个样子,是为了降低人们的打字速度,防止老式打字机的键杆撞在一起卡壳。

那现在的键盘都没有键杆了,打字速度再快都能承受,为什么还用这个不合理的QWERTY布局呢?因为路径依赖。最早的打字机,不管是出于什么原因,使用QWERTY布局,当时的用户就不得不学习这种布局。用户已经适应了,再出新的键盘也只好使用这个布局。因为谁也不愿意重新练习一套打字技能,现在有人发明了有更合理键位布局的键盘也无法流行开来。由此一代一代的新用户适应键盘,新键盘适应用户,我们就被锁定在了QWERTY布局之中。历史上的小事件,彻底改变了后世路径的概率。路径依赖表明能流行可以跟任何东西都没关系,纯粹是因为早期的偶然选择,导致了流行这个而不是那个。

路径依赖给我们的教训是一个东西能流行可能并不是因为它的品质好,而是因为它的运气好 —— 或者说,它早期的运营比较成功。以前录像带标准的 VHS 和 Betamax 之争,后来高清DVD标准的蓝光和 HD 之争,都是哪方的越人多,哪方的优势就越大。剧情都是一开始相持不下,后来有一两家大公司临阵倒戈,突然打破平衡,导致一方有了一个小小的优势,而因为每个媒体公司都想提高自己的兼容性,这个小小的优势就足以说服其他公司加入你的阵营了。

3. 总结

模型其实是一个人最底层的思维系统。它比知识和方法,还要底层。有时候,你做事的方法可能都对,但就是达不到预期的结果。归根结底,很可能就是用错了模型。比如在职场上,有人抱怨,为什么我天天加班,对领导唯命是从,但升职加薪却没我的份?其实说到底,他是在用友谊模型看待工作。觉得自己付出了忠诚,就应该获得同样的忠诚。还有人把工作当作打仗,用战争模型。有人把公司当成家,用家庭模型。当然,咱们在这不是要说谁对谁错,而是想说,很多时候,模型比方法更重要。假如你发现,自己做事的方法都没问题,但就是无法获得预期的结果。你可能要反思,是不是在一开始,就用错了模型。