课堂笔记 《Model Thinking》

Section 1 Why Model?

Why Model?

  • intelligence citizens of the world
  • think more clearly
  • using and understanding data
  • using models to decide, strategize, and design

这里Scott教授用奥德修斯的故事作为例子说明model是用来干什么的——将我们固定在桅杆上,限制我们只能在某个范围内进行思考。
也就是,model是为了简化问题而存在的,本质是为了给我们的决策提供一个锚点,让我们更加容易地去排除其他因素考虑问题的解决。
(官方note见这里

Section 2 Segregation and Peer Effects

现象:人们的表现会呈现趋同性。
比如人们的居住呈现隔离(种族隔离,收入隔离),人们跟趋向于跟自己一样的人住在一起。

又比如在社会里面突然就发生大规模暴动,或者观看表演的人们会突然全部起来鼓掌。或者突然大家都买同一款帽子。

上面分别对应了Sorting和Peer Effect。

  • Sorting:我不喜欢现在的环境,我要换到一个我喜欢的环境。
  • Peer Effect:大家都这样做了,我也这样做吧。

虽然最后结果从宏观的角度上来讲,都是群体趋同,但是从微观,从个体的角度讲,这两种心理几乎是完全相反的。我简单地理解为,第一种人是有着自己坚定的信念:我和大家不一样,不是我的问题,是环境的问题(中二病);第二种人立场较模糊,也不准备改变环境,而是改变自己的意见。(墙头草)。

对于Sorting,讲述了Schelling Model。

  • 是一个Agent Based Model(包括Agents,behaviors和outcomes三部分)。
  • 有趣现象一:30%的初始容忍度,最后可能会导致70%以上的隔离:微观行动≠宏观现象
  • 有趣现象二:80%的初始容忍度,将不能导向稳定,人们会不断的移动。
  • 使用$\frac{1}{2}\vert\frac{b}{B}-\frac{y}{Y}\vert$来计算隔离度。

对于Peer Effect,有两个模型。

Granoveor’s Model

  • “尾巴带动狗”效应——先有第一个吃螃蟹的人,后来才有可能人人都来吃螃蟹。
  • 引发的两个因素可能是:
    • 更低的触发阈值
    • 群体中阈值的多样性(variation)

Standing Ovations(起立鼓掌)

  • 比Granoveor’s Model的表达要复杂,需要考虑,表演的质量Q,人们的阈值S,误差或者多样性(E)。以及设置了两个rules。
  • 有趣现象:很棒的表演(因为有着很高的Q)和很烂的表演(人们期望变低,因而引发很低的S)都有很大可能带来掌声。
  • 引发的因素可能有
    • 更高的表演质量Q
    • 人们更低的阈值
    • 更多的Peer Effect
    • 观众的多样性
    • celebrity,名人效应
    • Big group,即表现会跟小伙伴们趋同

Section 3 Aggregation

Aggregation会带来“More is different”,即聚合后的整体不只是个体之间的简单叠加,而可能具有了个体不具有的属性和功能。比如,“湿”的感觉是有一堆水分子之间产生某种化学键的效应,才产生出来的。

1.个体决策是独立的情况:
当Aggregation中的每个个体的决策都是独立的时候,那么最后决策的概率分布呈现的是正态分布。课上举了抛硬币的例子(个体的决策是二项分布,整体的分布会呈现正态分布)。从这里,提到了摩托罗拉的“Six Sigma”原则——即样本呈现正态分布时候,偏离均值超过6个sigma距离的样本几乎不会在实际情况中出现。下图出自wiki

具体到决策上,假设客户平均需要500根香蕉,如果知道sigma是10,那么对于VIP,预留560根香蕉。(这个老师很喜欢香蕉)

2.个体决策是相关的情况:
当个体决策是相关的时候,情况会一下子变得很复杂,下面讲了两个模型:

  • Game of Life:生存游戏,在2D空间上进行,对于每个个体有两个规则:(1)如果原来是关的,邻居里面有(不多不少的)3个邻居是开的,那么打开(2)如果原来是开的,邻居里面有2个或者3个是开的,那么继续保持开状态,否则就关掉。
    之后也是用NetLogo来进行演示。大概意思是,不同的初始模式(由几个个体聚合成的),可能只有一点点改变,但是却能呈现出来很多的表现:有些是周期性变化,有些是平移,有些是像具有了生命一样随机游走。
  • 1D Cellular Automata: 上面的GoL的结果是不可穷尽的,而在GoL之前,有更加简单的1D模型。
    如下图,对一个个体(格子),它的明亮状态只取决于自身状态以及左右个体的状态(GoL的邻居有8个,这里是2个),对于对于输出有2^8=256中编码方式。于是提出模型的作者写了一本1000页的书来穷尽地描述它们的变化。

3.个体决策有偏好的时候会怎么影响群体(Aggregation Preference)
比如有三个个体,他们对苹果,香蕉和椰子的偏好是这样的:

那么对于他们三个构成的群体,偏好就会变成这样:

可以看到产生了循环。结论:简单聚合个体的偏好可能会导致群体偏好产生悖论(Paradox)

Section 4 Decision Models

这个章节讲的是决策。
决策模型的两个原则:一个是nomative,一个是positive。个人理解前者表示该模型对不同的事情具有普适性,后者表示该模型能够对决策起到帮助的作用。
这个章节讲了三个跟决策有关的模型:Multi-Criterion,Spatial Choice, Decision Tree。
都是很直观的模型,只是使用时候可能要注意一些要点。

  • Multi-Criterion:需要注意到的是对于每个Criterion,每个人的评判标准是不一致的,所以需要对每个Criterion进行加权。
  • Spatial Choise:即最近邻,需要注意的是这里的维度需要满足Spatial原则,比如,买电脑时候,价格不满足Spatial原则——其他因素不变的时候我们总是希望价格越低越好,而屏幕尺寸满足Spatial原则——其他因素不变的时候,我们对屏幕尺寸的期望是在一个固定范围内波动的。
  • Decision Tree:这个很直观,也很有用:(1)帮助我们判断不同choice之前的收益(2)帮助我们判断一个信息对于我们决策的价值(3)当别人(或者我们自己)做出决策后,可以反推出TA(或自己)的决策趋向性(去机场碰运气换机票回家看父母的例子)

总的来说,在这个章节的收获是:虽然有了决策模型,但是模型的参数是我们主观上面设置的,所以最重要的依然是我们怎么去看待不同Criterion之间的价值。

Section 5 Thinking Electrons

标题,“想一个电子一样思考”,大概意思是说,电子是不会思考的,如果我们要model人类的行为,那么也需要简化成一个简单的模型。
本章节讲了三类模型,Rational,Behavior,Rule Based。

  1. Rational:

    即假设人类都是死理性派,对于一个事情(可以是decision或者game,前者只与自己有关,后者需要考虑到其他人),都有一个objective function,然后对其进行optimize。

  2. Behavior:

    Rational是不合常理的,因为通常人们都不是理性的——有时候我们是根据直觉,有时候我们并没有那么多的时间去让我们理性地思考每一件事。所以假设人们会存在偏差(bias)。有四种偏差:

    • Prospect Theory:对于收益,人们趋向保守(100%给400,还是50%给1000,人们一般选前者);对于损失,人们趋向冒险。(100%损失400,还是50%损失1000,人们一般选后者)
    • Hyperbolic discounting:对于近期的收益会特别关心,对于未来的收益的关心程度会呈现双曲线的快速下降。(今天得到1000明天得到1005?一般会选今天就得到1000;一年后得到1000和一年零一天得到1005?一般会选一年零一天得到1005)
    • Status Quo Bias: 改变问卷的否定时态,会带来很大的不同(你是否愿意进行器官捐赠?你是否不愿意进行器官捐赠?)
    • Based Rate Bias:让人们连续说出两个数字,这两个数字通常会很相近。

    综上所述,Behavior模型的意思是说:它假设人们从behavior上来说是不rational的,而是由bias的。

  3. Rule Based:

    从某个角度来说,Rational和Behavior都可以看成是某种Rule。不过这里的Rule通常都是简单而直接的,比如Section 2介绍的Schelling Aggregation Model。又比如“tit for tat”。

如何选择使用模型?通常是取决于实际的情况是怎样的,然后选择跟实际情况更相符的。

Section 6 Categorical and Linear Model

  1. Categorical model类似我们定义了很多个小盒子,然后我们把物体放到小盒子里面。这个能起到最简单的过滤作用。


    将水果和零食分开,卡路里的方差会降低低很快,也就是说这个是一个合理的分类(具体用一个叫R-square的规则衡量,这里是90.2%)。

  2. Correltaion is not Causation.这句话在这个课上又一次被强调:拥有骑马队的学校一般是好学校的原因不是因为他有骑马队,而可能是因为它有资源,所以导致了他有骑马队。(尽管只有相关性没有因果性,我们依然可以选择有骑马队的学校来就读,因为确实是好学校的概率比较大)
  3. Linear Model


    评估一个线性模型的几个参数:

    • R-square:衡量模型的可解释性
    • Coefficient:衡量因素的重要性
    • SE:衡量因素的偏离情况
    • P-Value:衡量因素符号翻转的几率
  4. 从Linear到nonLinear
    • 将函数分段,认为每段是linear
    • 对因素进行非线性变换
  5. Big Coefficient vs New Reality。由于存在多峰值问题,究竟是要选择往模型中的有大系数的因数投钱了,还是往新的未知领域投钱了?
  6. 所以让我再次想起来,模型是一种对现实的评估,我们需要关心的是:
    • 模型能够解释多少实际情况呢?(对于这个章节,用的是R-square)
    • 以及模型能够帮助我们做什么?(对于这个章节,是Big Coefficient)
    • 模型的局限是什么?(对于这个章节,一个是非线性的情况,另外一个是多峰值的情况)

Section 7 Tipping Points

提到一本书,《引爆点》

  • Kick vs Tip:Tipping的意思是在某个点突然发生跃迁——注意,指数性(爆炸性)增长跟Tipping是由区别的,前者依然是“增长”,后者是直接“跳跃”。比如“压垮骆驼的最后一根稻草”说的是tipping。
  • 两个Tipping模型,Percolation Model(森林防火,银行破产的传导,谣言在社交网络的传播,创新:大量的原始积累,突然有一天就连成一条通路);SIS Model:当一种病达到某个阈值后,才会成为传染病。
  • 区分Diffusion Model和SIS model:前者是增长,后者是跃迁(可以联想到sigmoid的loss function和SVM的loss function,后者是前者的“Tipping Version”)
  • Tipping可以分成Direct和Contextual的,前者是引发大连锁的小事件(二战导火索),后者是改变一点环境参数而导致的大事件(比如SIS model);还可以分成Between Class和Within Class,这个没有太细讲,大致意思是如果跃迁后状态不可知,那就是Between Class的。
  • 最后给出了Tipping的Measurement:一个是Diversity Index,另外一个是Entropy。Diversity是基于对“多样性”的衡量,Entropy是基于对“要猜多少次才能猜到”的衡量。

Section 8 Economic Growth

  • 由于复利(compounding)的存在,收入和增长率之间呈现的是指数量级的增长(Exponential Growth)。可以用“rule of 72”来初略估计:72除以增长率,基本就是翻一番的时间。比如一个国家的GDP的年增长率为2%,那么大概72/2=36年,GDP会翻一番。
  • Simple Growth Model:当investment和depreciation相等(Equilibrium)的时候,实现了output的最大化,也就是,会停止增长。反映出来的是,如果depreciation是线性(linear)的,那么output是凹(concave)的。
  • Solow Growth Model:引入了Technology的变量,认为Technology的innovation能够突破原来Simple Growth Model的Equilibrium,达到一个更高的Equilibrium。
  • 《Why Nations Fail》的三个观点:
    1. Growth requires a strong central government to protect capital and investment but that government cannot be controlled by a select few(需要中央来保护增长,同时中央不能过于“中央”)
    2. Extraction limits growth by lowering investment in innovation and capital(过早套现会限制增长)
    3. Growth requires creative destruction(科技进步,那么带来的旧产业的淘汰,和其工人的失业)

Section 9 Diversity and Innovation

  • 解决一个问题取决于Perspectives和Heuristic。前者是如何定义一个问题,更好的定义(角度)会带来更少的局部最优点;后者是如何去解决问题,应用更好的搜索算法能够更快更好地找到极值点。
  • 说明Perspectives作用的一个例子:如何将纸牌游戏转换成tic-tac-toc来获得全局最优
  • Heuristic算法举例:(1)Do the Opposite(2)Big Rocks First.然而,根据No Free Lunch的理论,不存在普适的Heuristic算法。但是针对某个特定问题,会有特定的较好的Heuristic算法。
  • Team能够通过共享信息来减少局部最优解——Team的局部最优解的集合是每个member的局部最优的交集。所以,Team能够带来Diversity,所以不容易被stuck住。
  • Recombination:对不同的Heuristic算法进行组合能够产生多样的效果——新的Innovation是旧的东西之间的再次组合和提升。

Section 10 Markov Processes

Markov Processes(以下简称MP)表示的是一种经过迭代后会趋于稳定的模型。前提是该模型满足四个条件:

  • 有限状态
  • 固定的转移概率
  • 能够从任意状态到任意状态(不存在死状态)
  • 没有简单的互换(A B互相切换)
    满足上面四个条件后,随着迭代MP会慢慢均衡到达Equilibrium Point,这是一种Statistical Equilibrium,即状态之间依然在不停的交互,但是位于某状态下的个体的数目已经不会变化。
    所以,需要改变一个MP最后的Equilibrium Point,下面方法是无效的:
  • 改变初始状态
  • 改变历史
  • 改变中间转移
    不过,这些能够加速或者延缓MP达到稳态的速度,所以还是有影响的。
    想从根本上改变Equilibrium Point,需要改变MP的转移概率。举例:一位老师如果想学生更加喜欢他的课,那么课上突然让学生笑10分钟是没有用的,而是应该去认真备课,并且力求让学生理解课上的内容。

Section 11 Lypunov Functions

  1. Lypunov Functions需要满足两个条件
    • 存在最大值(或者最小值)
    • 每个阶段都至少增加k(或者至少减少k)
  2. 当一个一个模型满足Lypunov Function条件时,那么它最后会达到平衡状态。
  3. Lypunov可以解析城市的自管理现象——当大家都避免拥挤的时候,那么最后每个地方都会趋向于不那么刚刚好的情况
  4. Lypunov被外部因素影响的时候,很可能不再成立:如交换椅子符合lypunov,交换办公室则不一定——因为换了座位可能会引起第二轮交换,导致了系统一直扰动,不能进入平衡状态
  5. 一个函数是Lypunov时候,可以很容易地计算出它什么时候实现均衡,但是系统有可能有多个均衡点,所以最后的均衡点不一定是最优的——比如交换水果的那个样例。
  6. Lypunov和Markov有两个主要的不同点:
    • 多个可能的均衡点 vs 唯一的均衡点
    • 能否达到均衡受外部条件影响 vs 能否达到均衡不受外部条件影响

Section 12 Cordination and Culture

简单来说,局部的同调导致了全局上具有了多种多样的文化。

  • Pure Coordination:跟身边的人同调,这符合Lyapunov,所以最后会达到均衡状态——类似之前的Schelling Model,同类人聚在一起,然后不同类型的人有明显的分开边界。
  • Pure Cordination vs Standing Ovation:差别主要是前者如果要保持不同,损失要比后者大很多。
  • Inefficient Coordination:说明简单的同调并不能带来最优值,比如美国拒绝使用公制计数而使用英制计数——从实际角度说,公制更加有优势,但是周围的人都用英制,也唯有用英制了。
  • Axelrod’s Culture Model:解释了Thick Boudaries现象,系统均衡后,住的很近的两个人,要么他们很像,要么他们很不像。
  • Bednar etal Model:教授自己带研究生做的模型,比起上一个模型,加入了Coordinate因素和Small Error,最后能够解释为什么一个群体整体来说很集中,但是存在很少的离群点的现象。

Section 13 Path Dependence

讲的是一种“我当前的表现依赖于我过于的表现”的模型。跟下面的random walking截然不同。

  • Urls model
    • Bernoulli,如果一开始取出红球,那么继续加红球。造成的结果是outcome千千万,而且出现概率都相等。
    • Polya,如果一开始取出红球,那么我补一个蓝球。造成的结果是outcome是最后取出红蓝球的期望是一致的。
    • 上述两个模型,都不是路径依赖的。
  • Externalities:加入了外部影响,就有可能形成路径依赖了,比如事件与事件之间相互影响,那么先做哪件事后做哪件事就有差别了。

Section 14 Network

作为IT圈的人,Network太熟悉了,内容比较少,围绕三方面展开:

  • Logic: How it form? Random, Small World, Preferential Attachment(e.g. Internet).
  • Structure: measures, e.g. Degrees, Path Length, Clustering Coefficient …
  • Function: what it does, e.g. Six Degrees

Section 15 Randomness and Random Walks

这一章讨论的是“天赋和运气”(skill & luck)。这在《思考,快与慢》的17章的“回归到平均”说的应是同一个东西。

  • 因为什么会产生随机性?Noise、Error、Uncertainty、Complexity。
  • Skill-luck Model: Outcome = a*Luck + (1-a)*Skill, a in (0,1)。

    模型用的第二点即上面提到的“回归到平均”:如果有一天表现很好,那么第二天表现变差的可能很大;如果有一天表现不好,第二天表现变好的可能很大;最后表现回复到个人的平均水平。
  • The Paradox of Skill:当大家的skill都差不多的时候,胜负几乎只靠运气决定。
  • Binary Random Walk,抛硬币是一个典型的二项随机游走问题,有三个结论:

    • 抛偶数次硬币,最后得分的期望是0
    • 对于每个得分k,随机游走都会达到k和-k无限次
    • 对于每个数字k,随机游走都有可能连续出现k次head或者k次tail

    这里再次提到了“Regression to the mean”的效应。以及否认了打球时候“hot head”的不存在。以及对“No Free Lunch”做了解释,认为“好”的标准一直改变,公司也需要充分发挥主观能动性,来对抗随机和未知。
    还有“小数定律”(也是联想到了《思考快与慢》的章节了):我们看到的只是全局的一部分,但是却默认地认为这就能够代表全局。

  • Normal Random Walk和Efficient Market Hypothesis:想说明的是,股市是一种对过于没有记忆的random walk,所以做出预测是不靠谱的。
    当然EMH也不是绝对正确,被提出了两点质疑:Too Much Flutuation和Consistent Winner。不过随机游走也是有Consistent Winner的,只不过概率比较小。
  • Finite Memory Random Walk:加了时间依赖,相对客观一点。

Section 16 Colonel Blotto

讲的是资源错配问题。

  • 这是一个零和游戏
  • 当两方资源一致时候,任何策略都可以被打败。(这里可以联系上一章的the Paradox of skill)
  • 它结合了均衡和随机:选择随机的策略,最后胜负达到一个均衡。(类似于石头剪子布)
  • 但如何一方的资源丰富,那么有可能达到必胜。而作为资源不足的一方,增加战场才有可能扭转战机。

Section 17 Prisoner’s Dilemma

囚徒困境,一个经常被提到模型。

  • 从集体的角度讲,鼓励合作,从个人的角度讲,趋向背叛。
  • 该模型唯一的平衡是双方都选择背叛,该平衡称为纳什平衡(Nash Equilibrium),但是它不是帕累托最优(Pareto Efficient)的。
  • 如何在囚徒困境模型中鼓励大家合作,7个方法,前5个是自然的,后两个是人工的:
    1. Repeated:如果人们需要重复博弈,那么趋向合作(不然会被以牙还牙)
    2. Reputation:如果合作能够带来好名声(以帮助后面的博弈),那么人们趋向合作。
    3. Networks:如果网络中的人都趋向于合作,那么采取合作会比较有利(反之亦然)
    4. Group:如果与其他组别竞争,组内合作会增加打败对方组别的胜率
    5. Kin:如果有亲缘关系,我们会考虑更多的合作
    6. Laws:通过制定法律来限制人们的背叛
    7. Incentives:通过引导来让人们实现合作
  • 如果囚徒困境中的囚徒大于2,那么问题拓展为Collective Action Model,本质上跟两人的囚徒困境一样,集体鼓励合作,个人趋向背叛。(公共鱼塘问题,大家会趋向过度捕捞,最终导致资源耗尽)
  • 应对Collective Action Model问题,让人们趋于合作的解决方法的思路大致也是上文的7点,作者举了几个例子,其中一个是通过分区或者轮流使用公共区来解决放牧的问题。然后提到没有方法是万能的,需要具体问题具体分析。

Section 18 Mechanism Design

这章感觉讲得有点虚,理论大于实际。

  • Mechanism Design是说通过设计以下三点来推动项目的实施:
    1. The rules of the game
    2. The actions people can take
    3. Payoffs associated with the actions
  • 好的Mechanism Design能够对付Hidden Action和Hidden Information
  • 例子一:根据绩效进行鼓励(根据生产出来多少好的产品来给工资)
  • 例子二:通过限定工作总量来区分好跟坏的工程师(假设好工程师同等强度下,付出更少)
  • 例子三,拍卖会:19min,举了三种拍卖方式,Ascdending Price, Second Price,Seal Price。在理性情况下,这三者起到的效果是一致的——出价最高的出价人能够用1/2的心理价位获得自己想要的商品。
  • 例子四,公共项目:用Pivot Mechanism,能够让人们趋向报出真实的心理价位。
  • Mechanism Design的目标有四:

    1. Efficient:项目是有效的,能够有益处的
    2. Always Join:大家都积极参与,不需要强迫
    3. Incentive Compatible:大家都会趋向真实报价
    4. Balanced:项目最后能够实行

    同时满足上述四者的Mechanism是不存在,比如Pivot Mechanism就不满足第四条。

Section 19 Learning Models: Replicator Dynamics

Replicator Dynamics认为人们会学习回报(payoff)比较高的人,于是整个种群呈现一种往优势发展的趋势。

  • 主要考虑的因素有两个,使用某种策略的人的比例,以及使用该策略带来的回报。
  • 直观来说,使用某种策略的人越多,那么后续使用该策略的人也会很多,如果某个策略回报比较大,那么后续使用该策略的人也会变多
  • 案例1,从鞠躬到握手。最后人们会趋向于握手,达到最优解。
  • 案例2,从小破车到SUV。最后人们会趋向SUV,达到的却不是最优解。说明了Replicator Dynamic在学习方面的局限性。
  • Fisher’s Theorem融合了三个模型:

    • There is no cardinal
    • Rugged Landscape
    • Replicator dynamics

    得到的结论是,种群内差异越大,进化越快。

  • Fisher vs 6sigma:适用于不同的情况,前者适用于变化的环境,后者适用于不变的环境。作者在这里对谚语进行了讽刺:之所以存在相悖的谚语,是因为使用者脱离语境和上下文。No Free Lunch决定了世界上没有万金油方法,需要结合问题具体分析。

Section 20 Prediction and the Many Model Thinker

本课程的最后一章。

  • 目前学到了用于做Predict的模型有三个:
    1. Categories
    2. Linear Models
    3. Markov Models
  • Diversity Prediction Theorem告诉我们,用多样的策略,能够加强predict的准确度。其公式是$Crowd’s Error = Average Error - Diversity$
  • 根据Diversity Prediction Theorem我们可以总结出2点:
    1. 集体的智慧来自一群明智但思考角度不同的人
    2. 集体的疯狂来自一群愚蠢但思考角度雷同的人
  • 最后又回顾了各种模型,以及强调了不仅要培养模型思维,还要培养多模型思维,最后提到,本课只是model的入门课,有兴趣的人需要学习更多的model来充实内容

本课程结束。

很久没有更新网站,发现多了不少评论和问题,无法一一回复,如果现在仍有问题请再次留言 :) 2016.03.29