Section 1 Why Model?
Why Model?
- intelligence citizens of the world
- think more clearly
- using and understanding data
- using models to decide, strategize, and design
这里Scott教授用奥德修斯的故事作为例子说明model是用来干什么的——将我们固定在桅杆上,限制我们只能在某个范围内进行思考。
也就是,model是为了简化问题而存在的,本质是为了给我们的决策提供一个锚点,让我们更加容易地去排除其他因素考虑问题的解决。
(官方note见这里)
Section 2 Segregation and Peer Effects
现象:人们的表现会呈现趋同性。
比如人们的居住呈现隔离(种族隔离,收入隔离),人们跟趋向于跟自己一样的人住在一起。
又比如在社会里面突然就发生大规模暴动,或者观看表演的人们会突然全部起来鼓掌。或者突然大家都买同一款帽子。
上面分别对应了Sorting和Peer Effect。
- Sorting:我不喜欢现在的环境,我要换到一个我喜欢的环境。
- Peer Effect:大家都这样做了,我也这样做吧。
虽然最后结果从宏观的角度上来讲,都是群体趋同,但是从微观,从个体的角度讲,这两种心理几乎是完全相反的。我简单地理解为,第一种人是有着自己坚定的信念:我和大家不一样,不是我的问题,是环境的问题(中二病);第二种人立场较模糊,也不准备改变环境,而是改变自己的意见。(墙头草)。
对于Sorting,讲述了Schelling Model。
- 是一个Agent Based Model(包括Agents,behaviors和outcomes三部分)。
- 有趣现象一:30%的初始容忍度,最后可能会导致70%以上的隔离:微观行动≠宏观现象
- 有趣现象二:80%的初始容忍度,将不能导向稳定,人们会不断的移动。
- 使用$\frac{1}{2}\vert\frac{b}{B}-\frac{y}{Y}\vert$来计算隔离度。
对于Peer Effect,有两个模型。
Granoveor’s Model
- “尾巴带动狗”效应——先有第一个吃螃蟹的人,后来才有可能人人都来吃螃蟹。
- 引发的两个因素可能是:
- 更低的触发阈值
- 群体中阈值的多样性(variation)
Standing Ovations(起立鼓掌)
- 比Granoveor’s Model的表达要复杂,需要考虑,表演的质量Q,人们的阈值S,误差或者多样性(E)。以及设置了两个rules。
- 有趣现象:很棒的表演(因为有着很高的Q)和很烂的表演(人们期望变低,因而引发很低的S)都有很大可能带来掌声。
- 引发的因素可能有
- 更高的表演质量Q
- 人们更低的阈值
- 更多的Peer Effect
- 观众的多样性
- celebrity,名人效应
- Big group,即表现会跟小伙伴们趋同
Section 3 Aggregation
Aggregation会带来“More is different”,即聚合后的整体不只是个体之间的简单叠加,而可能具有了个体不具有的属性和功能。比如,“湿”的感觉是有一堆水分子之间产生某种化学键的效应,才产生出来的。
1.个体决策是独立的情况:
当Aggregation中的每个个体的决策都是独立的时候,那么最后决策的概率分布呈现的是正态分布。课上举了抛硬币的例子(个体的决策是二项分布,整体的分布会呈现正态分布)。从这里,提到了摩托罗拉的“Six Sigma”原则——即样本呈现正态分布时候,偏离均值超过6个sigma距离的样本几乎不会在实际情况中出现。下图出自wiki
具体到决策上,假设客户平均需要500根香蕉,如果知道sigma是10,那么对于VIP,预留560根香蕉。(这个老师很喜欢香蕉)
2.个体决策是相关的情况:
当个体决策是相关的时候,情况会一下子变得很复杂,下面讲了两个模型:
- Game of Life:生存游戏,在2D空间上进行,对于每个个体有两个规则:(1)如果原来是关的,邻居里面有(不多不少的)3个邻居是开的,那么打开(2)如果原来是开的,邻居里面有2个或者3个是开的,那么继续保持开状态,否则就关掉。
之后也是用NetLogo来进行演示。大概意思是,不同的初始模式(由几个个体聚合成的),可能只有一点点改变,但是却能呈现出来很多的表现:有些是周期性变化,有些是平移,有些是像具有了生命一样随机游走。 - 1D Cellular Automata: 上面的GoL的结果是不可穷尽的,而在GoL之前,有更加简单的1D模型。
如下图,对一个个体(格子),它的明亮状态只取决于自身状态以及左右个体的状态(GoL的邻居有8个,这里是2个),对于对于输出有2^8=256中编码方式。于是提出模型的作者写了一本1000页的书来穷尽地描述它们的变化。
3.个体决策有偏好的时候会怎么影响群体(Aggregation Preference)
比如有三个个体,他们对苹果,香蕉和椰子的偏好是这样的:
那么对于他们三个构成的群体,偏好就会变成这样:
可以看到产生了循环。结论:简单聚合个体的偏好可能会导致群体偏好产生悖论(Paradox)
Section 4 Decision Models
这个章节讲的是决策。
决策模型的两个原则:一个是nomative,一个是positive。个人理解前者表示该模型对不同的事情具有普适性,后者表示该模型能够对决策起到帮助的作用。
这个章节讲了三个跟决策有关的模型:Multi-Criterion,Spatial Choice, Decision Tree。
都是很直观的模型,只是使用时候可能要注意一些要点。
- Multi-Criterion:需要注意到的是对于每个Criterion,每个人的评判标准是不一致的,所以需要对每个Criterion进行加权。
- Spatial Choise:即最近邻,需要注意的是这里的维度需要满足Spatial原则,比如,买电脑时候,价格不满足Spatial原则——其他因素不变的时候我们总是希望价格越低越好,而屏幕尺寸满足Spatial原则——其他因素不变的时候,我们对屏幕尺寸的期望是在一个固定范围内波动的。
- Decision Tree:这个很直观,也很有用:(1)帮助我们判断不同choice之前的收益(2)帮助我们判断一个信息对于我们决策的价值(3)当别人(或者我们自己)做出决策后,可以反推出TA(或自己)的决策趋向性(去机场碰运气换机票回家看父母的例子)
总的来说,在这个章节的收获是:虽然有了决策模型,但是模型的参数是我们主观上面设置的,所以最重要的依然是我们怎么去看待不同Criterion之间的价值。
Section 5 Thinking Electrons
标题,“想一个电子一样思考”,大概意思是说,电子是不会思考的,如果我们要model人类的行为,那么也需要简化成一个简单的模型。
本章节讲了三类模型,Rational,Behavior,Rule Based。
- Rational:
即假设人类都是死理性派,对于一个事情(可以是decision或者game,前者只与自己有关,后者需要考虑到其他人),都有一个objective function,然后对其进行optimize。
- Behavior:
Rational是不合常理的,因为通常人们都不是理性的——有时候我们是根据直觉,有时候我们并没有那么多的时间去让我们理性地思考每一件事。所以假设人们会存在偏差(bias)。有四种偏差:
- Prospect Theory:对于收益,人们趋向保守(100%给400,还是50%给1000,人们一般选前者);对于损失,人们趋向冒险。(100%损失400,还是50%损失1000,人们一般选后者)
- Hyperbolic discounting:对于近期的收益会特别关心,对于未来的收益的关心程度会呈现双曲线的快速下降。(今天得到1000明天得到1005?一般会选今天就得到1000;一年后得到1000和一年零一天得到1005?一般会选一年零一天得到1005)
- Status Quo Bias: 改变问卷的否定时态,会带来很大的不同(你是否愿意进行器官捐赠?你是否不愿意进行器官捐赠?)
- Based Rate Bias:让人们连续说出两个数字,这两个数字通常会很相近。
综上所述,Behavior模型的意思是说:它假设人们从behavior上来说是不rational的,而是由bias的。
- Rule Based:
从某个角度来说,Rational和Behavior都可以看成是某种Rule。不过这里的Rule通常都是简单而直接的,比如Section 2介绍的Schelling Aggregation Model。又比如“tit for tat”。
如何选择使用模型?通常是取决于实际的情况是怎样的,然后选择跟实际情况更相符的。
Section 6 Categorical and Linear Model
- Categorical model类似我们定义了很多个小盒子,然后我们把物体放到小盒子里面。这个能起到最简单的过滤作用。
将水果和零食分开,卡路里的方差会降低低很快,也就是说这个是一个合理的分类(具体用一个叫R-square的规则衡量,这里是90.2%)。 - Correltaion is not Causation.这句话在这个课上又一次被强调:拥有骑马队的学校一般是好学校的原因不是因为他有骑马队,而可能是因为它有资源,所以导致了他有骑马队。(尽管只有相关性没有因果性,我们依然可以选择有骑马队的学校来就读,因为确实是好学校的概率比较大)
- Linear Model
评估一个线性模型的几个参数:- R-square:衡量模型的可解释性
- Coefficient:衡量因素的重要性
- SE:衡量因素的偏离情况
- P-Value:衡量因素符号翻转的几率
- 从Linear到nonLinear
- 将函数分段,认为每段是linear
- 对因素进行非线性变换
- Big Coefficient vs New Reality。由于存在多峰值问题,究竟是要选择往模型中的有大系数的因数投钱了,还是往新的未知领域投钱了?
- 所以让我再次想起来,模型是一种对现实的评估,我们需要关心的是:
- 模型能够解释多少实际情况呢?(对于这个章节,用的是R-square)
- 以及模型能够帮助我们做什么?(对于这个章节,是Big Coefficient)
- 模型的局限是什么?(对于这个章节,一个是非线性的情况,另外一个是多峰值的情况)
Section 7 Tipping Points
提到一本书,《引爆点》
- Kick vs Tip:Tipping的意思是在某个点突然发生跃迁——注意,指数性(爆炸性)增长跟Tipping是由区别的,前者依然是“增长”,后者是直接“跳跃”。比如“压垮骆驼的最后一根稻草”说的是tipping。
- 两个Tipping模型,Percolation Model(森林防火,银行破产的传导,谣言在社交网络的传播,创新:大量的原始积累,突然有一天就连成一条通路);SIS Model:当一种病达到某个阈值后,才会成为传染病。
- 区分Diffusion Model和SIS model:前者是增长,后者是跃迁(可以联想到sigmoid的loss function和SVM的loss function,后者是前者的“Tipping Version”)
- Tipping可以分成Direct和Contextual的,前者是引发大连锁的小事件(二战导火索),后者是改变一点环境参数而导致的大事件(比如SIS model);还可以分成Between Class和Within Class,这个没有太细讲,大致意思是如果跃迁后状态不可知,那就是Between Class的。
- 最后给出了Tipping的Measurement:一个是Diversity Index,另外一个是Entropy。Diversity是基于对“多样性”的衡量,Entropy是基于对“要猜多少次才能猜到”的衡量。
Section 8 Economic Growth
- 由于复利(compounding)的存在,收入和增长率之间呈现的是指数量级的增长(Exponential Growth)。可以用“rule of 72”来初略估计:72除以增长率,基本就是翻一番的时间。比如一个国家的GDP的年增长率为2%,那么大概72/2=36年,GDP会翻一番。
- Simple Growth Model:当investment和depreciation相等(Equilibrium)的时候,实现了output的最大化,也就是,会停止增长。反映出来的是,如果depreciation是线性(linear)的,那么output是凹(concave)的。
- Solow Growth Model:引入了Technology的变量,认为Technology的innovation能够突破原来Simple Growth Model的Equilibrium,达到一个更高的Equilibrium。
- 《Why Nations Fail》的三个观点:
- Growth requires a strong central government to protect capital and investment but that government cannot be controlled by a select few(需要中央来保护增长,同时中央不能过于“中央”)
- Extraction limits growth by lowering investment in innovation and capital(过早套现会限制增长)
- Growth requires creative destruction(科技进步,那么带来的旧产业的淘汰,和其工人的失业)
Section 9 Diversity and Innovation
- 解决一个问题取决于Perspectives和Heuristic。前者是如何定义一个问题,更好的定义(角度)会带来更少的局部最优点;后者是如何去解决问题,应用更好的搜索算法能够更快更好地找到极值点。
- 说明Perspectives作用的一个例子:如何将纸牌游戏转换成tic-tac-toc来获得全局最优
- Heuristic算法举例:(1)Do the Opposite(2)Big Rocks First.然而,根据No Free Lunch的理论,不存在普适的Heuristic算法。但是针对某个特定问题,会有特定的较好的Heuristic算法。
- Team能够通过共享信息来减少局部最优解——Team的局部最优解的集合是每个member的局部最优的交集。所以,Team能够带来Diversity,所以不容易被stuck住。
- Recombination:对不同的Heuristic算法进行组合能够产生多样的效果——新的Innovation是旧的东西之间的再次组合和提升。
Section 10 Markov Processes
Markov Processes(以下简称MP)表示的是一种经过迭代后会趋于稳定的模型。前提是该模型满足四个条件:
- 有限状态
- 固定的转移概率
- 能够从任意状态到任意状态(不存在死状态)
- 没有简单的互换(A B互相切换)
满足上面四个条件后,随着迭代MP会慢慢均衡到达Equilibrium Point,这是一种Statistical Equilibrium,即状态之间依然在不停的交互,但是位于某状态下的个体的数目已经不会变化。
所以,需要改变一个MP最后的Equilibrium Point,下面方法是无效的: - 改变初始状态
- 改变历史
- 改变中间转移
不过,这些能够加速或者延缓MP达到稳态的速度,所以还是有影响的。
想从根本上改变Equilibrium Point,需要改变MP的转移概率。举例:一位老师如果想学生更加喜欢他的课,那么课上突然让学生笑10分钟是没有用的,而是应该去认真备课,并且力求让学生理解课上的内容。
Section 11 Lypunov Functions
- Lypunov Functions需要满足两个条件
- 存在最大值(或者最小值)
- 每个阶段都至少增加k(或者至少减少k)
- 当一个一个模型满足Lypunov Function条件时,那么它最后会达到平衡状态。
- Lypunov可以解析城市的自管理现象——当大家都避免拥挤的时候,那么最后每个地方都会趋向于不那么刚刚好的情况
- Lypunov被外部因素影响的时候,很可能不再成立:如交换椅子符合lypunov,交换办公室则不一定——因为换了座位可能会引起第二轮交换,导致了系统一直扰动,不能进入平衡状态
- 一个函数是Lypunov时候,可以很容易地计算出它什么时候实现均衡,但是系统有可能有多个均衡点,所以最后的均衡点不一定是最优的——比如交换水果的那个样例。
- Lypunov和Markov有两个主要的不同点:
- 多个可能的均衡点 vs 唯一的均衡点
- 能否达到均衡受外部条件影响 vs 能否达到均衡不受外部条件影响
Section 12 Cordination and Culture
简单来说,局部的同调导致了全局上具有了多种多样的文化。
- Pure Coordination:跟身边的人同调,这符合Lyapunov,所以最后会达到均衡状态——类似之前的Schelling Model,同类人聚在一起,然后不同类型的人有明显的分开边界。
- Pure Cordination vs Standing Ovation:差别主要是前者如果要保持不同,损失要比后者大很多。
- Inefficient Coordination:说明简单的同调并不能带来最优值,比如美国拒绝使用公制计数而使用英制计数——从实际角度说,公制更加有优势,但是周围的人都用英制,也唯有用英制了。
- Axelrod’s Culture Model:解释了Thick Boudaries现象,系统均衡后,住的很近的两个人,要么他们很像,要么他们很不像。
- Bednar etal Model:教授自己带研究生做的模型,比起上一个模型,加入了Coordinate因素和Small Error,最后能够解释为什么一个群体整体来说很集中,但是存在很少的离群点的现象。
Section 13 Path Dependence
讲的是一种“我当前的表现依赖于我过于的表现”的模型。跟下面的random walking截然不同。
- Urls model
- Bernoulli,如果一开始取出红球,那么继续加红球。造成的结果是outcome千千万,而且出现概率都相等。
- Polya,如果一开始取出红球,那么我补一个蓝球。造成的结果是outcome是最后取出红蓝球的期望是一致的。
- 上述两个模型,都不是路径依赖的。
- Externalities:加入了外部影响,就有可能形成路径依赖了,比如事件与事件之间相互影响,那么先做哪件事后做哪件事就有差别了。
Section 14 Network
作为IT圈的人,Network太熟悉了,内容比较少,围绕三方面展开:
- Logic: How it form? Random, Small World, Preferential Attachment(e.g. Internet).
- Structure: measures, e.g. Degrees, Path Length, Clustering Coefficient …
- Function: what it does, e.g. Six Degrees
Section 15 Randomness and Random Walks
这一章讨论的是“天赋和运气”(skill & luck)。这在《思考,快与慢》的17章的“回归到平均”说的应是同一个东西。
- 因为什么会产生随机性?Noise、Error、Uncertainty、Complexity。
- Skill-luck Model: Outcome = a*Luck + (1-a)*Skill, a in (0,1)。
模型用的第二点即上面提到的“回归到平均”:如果有一天表现很好,那么第二天表现变差的可能很大;如果有一天表现不好,第二天表现变好的可能很大;最后表现回复到个人的平均水平。 - The Paradox of Skill:当大家的skill都差不多的时候,胜负几乎只靠运气决定。
Binary Random Walk,抛硬币是一个典型的二项随机游走问题,有三个结论:
- 抛偶数次硬币,最后得分的期望是0
- 对于每个得分k,随机游走都会达到k和-k无限次
- 对于每个数字k,随机游走都有可能连续出现k次head或者k次tail
这里再次提到了“Regression to the mean”的效应。以及否认了打球时候“hot head”的不存在。以及对“No Free Lunch”做了解释,认为“好”的标准一直改变,公司也需要充分发挥主观能动性,来对抗随机和未知。
还有“小数定律”(也是联想到了《思考快与慢》的章节了):我们看到的只是全局的一部分,但是却默认地认为这就能够代表全局。- Normal Random Walk和Efficient Market Hypothesis:想说明的是,股市是一种对过于没有记忆的random walk,所以做出预测是不靠谱的。
当然EMH也不是绝对正确,被提出了两点质疑:Too Much Flutuation和Consistent Winner。不过随机游走也是有Consistent Winner的,只不过概率比较小。 - Finite Memory Random Walk:加了时间依赖,相对客观一点。
Section 16 Colonel Blotto
讲的是资源错配问题。
- 这是一个零和游戏
- 当两方资源一致时候,任何策略都可以被打败。(这里可以联系上一章的the Paradox of skill)
- 它结合了均衡和随机:选择随机的策略,最后胜负达到一个均衡。(类似于石头剪子布)
- 但如何一方的资源丰富,那么有可能达到必胜。而作为资源不足的一方,增加战场才有可能扭转战机。
Section 17 Prisoner’s Dilemma
囚徒困境,一个经常被提到模型。
- 从集体的角度讲,鼓励合作,从个人的角度讲,趋向背叛。
- 该模型唯一的平衡是双方都选择背叛,该平衡称为纳什平衡(Nash Equilibrium),但是它不是帕累托最优(Pareto Efficient)的。
- 如何在囚徒困境模型中鼓励大家合作,7个方法,前5个是自然的,后两个是人工的:
- Repeated:如果人们需要重复博弈,那么趋向合作(不然会被以牙还牙)
- Reputation:如果合作能够带来好名声(以帮助后面的博弈),那么人们趋向合作。
- Networks:如果网络中的人都趋向于合作,那么采取合作会比较有利(反之亦然)
- Group:如果与其他组别竞争,组内合作会增加打败对方组别的胜率
- Kin:如果有亲缘关系,我们会考虑更多的合作
- Laws:通过制定法律来限制人们的背叛
- Incentives:通过引导来让人们实现合作
- 如果囚徒困境中的囚徒大于2,那么问题拓展为Collective Action Model,本质上跟两人的囚徒困境一样,集体鼓励合作,个人趋向背叛。(公共鱼塘问题,大家会趋向过度捕捞,最终导致资源耗尽)
- 应对Collective Action Model问题,让人们趋于合作的解决方法的思路大致也是上文的7点,作者举了几个例子,其中一个是通过分区或者轮流使用公共区来解决放牧的问题。然后提到没有方法是万能的,需要具体问题具体分析。
Section 18 Mechanism Design
这章感觉讲得有点虚,理论大于实际。
- Mechanism Design是说通过设计以下三点来推动项目的实施:
- The rules of the game
- The actions people can take
- Payoffs associated with the actions
- 好的Mechanism Design能够对付Hidden Action和Hidden Information
- 例子一:根据绩效进行鼓励(根据生产出来多少好的产品来给工资)
- 例子二:通过限定工作总量来区分好跟坏的工程师(假设好工程师同等强度下,付出更少)
- 例子三,拍卖会:19min,举了三种拍卖方式,Ascdending Price, Second Price,Seal Price。在理性情况下,这三者起到的效果是一致的——出价最高的出价人能够用1/2的心理价位获得自己想要的商品。
- 例子四,公共项目:用Pivot Mechanism,能够让人们趋向报出真实的心理价位。
Mechanism Design的目标有四:
- Efficient:项目是有效的,能够有益处的
- Always Join:大家都积极参与,不需要强迫
- Incentive Compatible:大家都会趋向真实报价
- Balanced:项目最后能够实行
同时满足上述四者的Mechanism是不存在,比如Pivot Mechanism就不满足第四条。
Section 19 Learning Models: Replicator Dynamics
Replicator Dynamics认为人们会学习回报(payoff)比较高的人,于是整个种群呈现一种往优势发展的趋势。
- 主要考虑的因素有两个,使用某种策略的人的比例,以及使用该策略带来的回报。
- 直观来说,使用某种策略的人越多,那么后续使用该策略的人也会很多,如果某个策略回报比较大,那么后续使用该策略的人也会变多
- 案例1,从鞠躬到握手。最后人们会趋向于握手,达到最优解。
- 案例2,从小破车到SUV。最后人们会趋向SUV,达到的却不是最优解。说明了Replicator Dynamic在学习方面的局限性。
Fisher’s Theorem融合了三个模型:
- There is no cardinal
- Rugged Landscape
- Replicator dynamics
得到的结论是,种群内差异越大,进化越快。
- Fisher vs 6sigma:适用于不同的情况,前者适用于变化的环境,后者适用于不变的环境。作者在这里对谚语进行了讽刺:之所以存在相悖的谚语,是因为使用者脱离语境和上下文。No Free Lunch决定了世界上没有万金油方法,需要结合问题具体分析。
Section 20 Prediction and the Many Model Thinker
本课程的最后一章。
- 目前学到了用于做Predict的模型有三个:
- Categories
- Linear Models
- Markov Models
- Diversity Prediction Theorem告诉我们,用多样的策略,能够加强predict的准确度。其公式是$Crowd’s Error = Average Error - Diversity$
- 根据Diversity Prediction Theorem我们可以总结出2点:
- 集体的智慧来自一群明智但思考角度不同的人
- 集体的疯狂来自一群愚蠢但思考角度雷同的人
- 最后又回顾了各种模型,以及强调了不仅要培养模型思维,还要培养多模型思维,最后提到,本课只是model的入门课,有兴趣的人需要学习更多的model来充实内容
本课程结束。