课堂笔记《Model Thinking》

Section 1 Why Model?

Why Model?

intelligence citizens of the world

think more clearly

using and understanding data

using models to decide, strategize, and design

这里Scott教授用奥德修斯的故事作为例子说明model是用来干什么的——将我们固定在桅杆上，限制我们只能在某个范围内进行思考。
也就是，model是为了简化问题而存在的，本质是为了给我们的决策提供一个锚点，让我们更加容易地去排除其他因素考虑问题的解决。
（官方note见这里）

Section 2 Segregation and Peer Effects

现象：人们的表现会呈现趋同性。
比如人们的居住呈现隔离（种族隔离，收入隔离），人们跟趋向于跟自己一样的人住在一起。

又比如在社会里面突然就发生大规模暴动，或者观看表演的人们会突然全部起来鼓掌。或者突然大家都买同一款帽子。

上面分别对应了Sorting和Peer Effect。

Sorting：我不喜欢现在的环境，我要换到一个我喜欢的环境。

Peer Effect：大家都这样做了，我也这样做吧。

虽然最后结果从宏观的角度上来讲，都是群体趋同，但是从微观，从个体的角度讲，这两种心理几乎是完全相反的。我简单地理解为，第一种人是有着自己坚定的信念：我和大家不一样，不是我的问题，是环境的问题（中二病）；第二种人立场较模糊，也不准备改变环境，而是改变自己的意见。（墙头草）。

对于Sorting，讲述了Schelling Model。

是一个Agent Based Model（包括Agents，behaviors和outcomes三部分）。
有趣现象一：30%的初始容忍度，最后可能会导致70%以上的隔离：微观行动≠宏观现象
有趣现象二：80%的初始容忍度，将不能导向稳定，人们会不断的移动。
使用$\frac{1}{2}\vert\frac{b}{B}-\frac{y}{Y}\vert$来计算隔离度。

对于Peer Effect，有两个模型。

Granoveor’s Model

“尾巴带动狗”效应——先有第一个吃螃蟹的人，后来才有可能人人都来吃螃蟹。
引发的两个因素可能是：
- 更低的触发阈值
- 群体中阈值的多样性(variation)

Standing Ovations(起立鼓掌)

比Granoveor’s Model的表达要复杂，需要考虑，表演的质量Q，人们的阈值S，误差或者多样性（E）。以及设置了两个rules。
有趣现象：很棒的表演（因为有着很高的Q）和很烂的表演（人们期望变低，因而引发很低的S）都有很大可能带来掌声。
引发的因素可能有
- 更高的表演质量Q
- 人们更低的阈值
- 更多的Peer Effect
- 观众的多样性
- celebrity，名人效应
- Big group，即表现会跟小伙伴们趋同

Section 3 Aggregation

Aggregation会带来“More is different”，即聚合后的整体不只是个体之间的简单叠加，而可能具有了个体不具有的属性和功能。比如，“湿”的感觉是有一堆水分子之间产生某种化学键的效应，才产生出来的。

1.个体决策是独立的情况：
当Aggregation中的每个个体的决策都是独立的时候，那么最后决策的概率分布呈现的是正态分布。课上举了抛硬币的例子（个体的决策是二项分布，整体的分布会呈现正态分布）。从这里，提到了摩托罗拉的“Six Sigma”原则——即样本呈现正态分布时候，偏离均值超过6个sigma距离的样本几乎不会在实际情况中出现。下图出自wiki

具体到决策上，假设客户平均需要500根香蕉，如果知道sigma是10，那么对于VIP，预留560根香蕉。（这个老师很喜欢香蕉）

2.个体决策是相关的情况：
当个体决策是相关的时候，情况会一下子变得很复杂，下面讲了两个模型：

Game of Life：生存游戏，在2D空间上进行，对于每个个体有两个规则：（1）如果原来是关的，邻居里面有（不多不少的）3个邻居是开的，那么打开（2）如果原来是开的，邻居里面有2个或者3个是开的，那么继续保持开状态，否则就关掉。
之后也是用NetLogo来进行演示。大概意思是，不同的初始模式（由几个个体聚合成的），可能只有一点点改变，但是却能呈现出来很多的表现：有些是周期性变化，有些是平移，有些是像具有了生命一样随机游走。
1D Cellular Automata: 上面的GoL的结果是不可穷尽的，而在GoL之前，有更加简单的1D模型。
如下图，对一个个体（格子），它的明亮状态只取决于自身状态以及左右个体的状态（GoL的邻居有8个，这里是2个），对于对于输出有2^8=256中编码方式。于是提出模型的作者写了一本1000页的书来穷尽地描述它们的变化。

3.个体决策有偏好的时候会怎么影响群体（Aggregation Preference）
比如有三个个体，他们对苹果，香蕉和椰子的偏好是这样的：

那么对于他们三个构成的群体，偏好就会变成这样：

可以看到产生了循环。结论：简单聚合个体的偏好可能会导致群体偏好产生悖论（Paradox）

Section 4 Decision Models

这个章节讲的是决策。
决策模型的两个原则：一个是nomative，一个是positive。个人理解前者表示该模型对不同的事情具有普适性，后者表示该模型能够对决策起到帮助的作用。
这个章节讲了三个跟决策有关的模型：Multi-Criterion，Spatial Choice, Decision Tree。
都是很直观的模型，只是使用时候可能要注意一些要点。

Multi-Criterion:需要注意到的是对于每个Criterion，每个人的评判标准是不一致的，所以需要对每个Criterion进行加权。
Spatial Choise：即最近邻，需要注意的是这里的维度需要满足Spatial原则，比如，买电脑时候，价格不满足Spatial原则——其他因素不变的时候我们总是希望价格越低越好，而屏幕尺寸满足Spatial原则——其他因素不变的时候，我们对屏幕尺寸的期望是在一个固定范围内波动的。
Decision Tree：这个很直观，也很有用：（1）帮助我们判断不同choice之前的收益（2）帮助我们判断一个信息对于我们决策的价值（3）当别人（或者我们自己）做出决策后，可以反推出TA（或自己）的决策趋向性（去机场碰运气换机票回家看父母的例子）

总的来说，在这个章节的收获是：虽然有了决策模型，但是模型的参数是我们主观上面设置的，所以最重要的依然是我们怎么去看待不同Criterion之间的价值。

Section 5 Thinking Electrons

标题，“想一个电子一样思考”，大概意思是说，电子是不会思考的，如果我们要model人类的行为，那么也需要简化成一个简单的模型。
本章节讲了三类模型，Rational，Behavior，Rule Based。

Rational:

即假设人类都是死理性派，对于一个事情（可以是decision或者game，前者只与自己有关，后者需要考虑到其他人），都有一个objective function，然后对其进行optimize。
Behavior：
Rational是不合常理的，因为通常人们都不是理性的——有时候我们是根据直觉，有时候我们并没有那么多的时间去让我们理性地思考每一件事。所以假设人们会存在偏差（bias）。有四种偏差:
- Prospect Theory:对于收益，人们趋向保守（100%给400，还是50%给1000，人们一般选前者）；对于损失，人们趋向冒险。（100%损失400，还是50%损失1000，人们一般选后者）
- Hyperbolic discounting：对于近期的收益会特别关心，对于未来的收益的关心程度会呈现双曲线的快速下降。（今天得到1000明天得到1005？一般会选今天就得到1000；一年后得到1000和一年零一天得到1005？一般会选一年零一天得到1005）
- Status Quo Bias: 改变问卷的否定时态，会带来很大的不同（你是否愿意进行器官捐赠？你是否不愿意进行器官捐赠？）
- Based Rate Bias：让人们连续说出两个数字，这两个数字通常会很相近。
综上所述，Behavior模型的意思是说：它假设人们从behavior上来说是不rational的，而是由bias的。
Rule Based:

从某个角度来说，Rational和Behavior都可以看成是某种Rule。不过这里的Rule通常都是简单而直接的，比如Section 2介绍的Schelling Aggregation Model。又比如“tit for tat”。

如何选择使用模型？通常是取决于实际的情况是怎样的，然后选择跟实际情况更相符的。

Section 6 Categorical and Linear Model

Categorical model类似我们定义了很多个小盒子，然后我们把物体放到小盒子里面。这个能起到最简单的过滤作用。

将水果和零食分开，卡路里的方差会降低低很快，也就是说这个是一个合理的分类（具体用一个叫R-square的规则衡量，这里是90.2%）。
Correltaion is not Causation.这句话在这个课上又一次被强调：拥有骑马队的学校一般是好学校的原因不是因为他有骑马队，而可能是因为它有资源，所以导致了他有骑马队。（尽管只有相关性没有因果性，我们依然可以选择有骑马队的学校来就读，因为确实是好学校的概率比较大）
Linear Model
评估一个线性模型的几个参数：
- R-square：衡量模型的可解释性
- Coefficient：衡量因素的重要性
- SE:衡量因素的偏离情况
- P-Value：衡量因素符号翻转的几率
从Linear到nonLinear
- 将函数分段，认为每段是linear
- 对因素进行非线性变换
Big Coefficient vs New Reality。由于存在多峰值问题，究竟是要选择往模型中的有大系数的因数投钱了，还是往新的未知领域投钱了？
所以让我再次想起来，模型是一种对现实的评估，我们需要关心的是：
- 模型能够解释多少实际情况呢？（对于这个章节，用的是R-square）
- 以及模型能够帮助我们做什么？（对于这个章节，是Big Coefficient）
- 模型的局限是什么？（对于这个章节，一个是非线性的情况，另外一个是多峰值的情况）

Section 7 Tipping Points

提到一本书，《引爆点》

Kick vs Tip：Tipping的意思是在某个点突然发生跃迁——注意，指数性（爆炸性）增长跟Tipping是由区别的，前者依然是“增长”，后者是直接“跳跃”。比如“压垮骆驼的最后一根稻草”说的是tipping。
两个Tipping模型，Percolation Model(森林防火，银行破产的传导，谣言在社交网络的传播，创新：大量的原始积累，突然有一天就连成一条通路)；SIS Model：当一种病达到某个阈值后，才会成为传染病。
区分Diffusion Model和SIS model：前者是增长，后者是跃迁（可以联想到sigmoid的loss function和SVM的loss function，后者是前者的“Tipping Version”）
Tipping可以分成Direct和Contextual的，前者是引发大连锁的小事件（二战导火索），后者是改变一点环境参数而导致的大事件（比如SIS model）；还可以分成Between Class和Within Class，这个没有太细讲，大致意思是如果跃迁后状态不可知，那就是Between Class的。
最后给出了Tipping的Measurement：一个是Diversity Index，另外一个是Entropy。Diversity是基于对“多样性”的衡量，Entropy是基于对“要猜多少次才能猜到”的衡量。

Section 8 Economic Growth

由于复利（compounding）的存在，收入和增长率之间呈现的是指数量级的增长（Exponential Growth）。可以用“rule of 72”来初略估计：72除以增长率，基本就是翻一番的时间。比如一个国家的GDP的年增长率为2%，那么大概72/2=36年，GDP会翻一番。
Simple Growth Model：当investment和depreciation相等（Equilibrium）的时候，实现了output的最大化，也就是，会停止增长。反映出来的是，如果depreciation是线性(linear)的，那么output是凹(concave)的。
Solow Growth Model：引入了Technology的变量，认为Technology的innovation能够突破原来Simple Growth Model的Equilibrium，达到一个更高的Equilibrium。
《Why Nations Fail》的三个观点：
1. Growth requires a strong central government to protect capital and investment but that government cannot be controlled by a select few（需要中央来保护增长，同时中央不能过于“中央”）
2. Extraction limits growth by lowering investment in innovation and capital（过早套现会限制增长）
3. Growth requires creative destruction（科技进步，那么带来的旧产业的淘汰，和其工人的失业）

Section 9 Diversity and Innovation

解决一个问题取决于Perspectives和Heuristic。前者是如何定义一个问题，更好的定义（角度）会带来更少的局部最优点；后者是如何去解决问题，应用更好的搜索算法能够更快更好地找到极值点。
说明Perspectives作用的一个例子：如何将纸牌游戏转换成tic-tac-toc来获得全局最优
Heuristic算法举例：（1）Do the Opposite(2)Big Rocks First.然而，根据No Free Lunch的理论，不存在普适的Heuristic算法。但是针对某个特定问题，会有特定的较好的Heuristic算法。
Team能够通过共享信息来减少局部最优解——Team的局部最优解的集合是每个member的局部最优的交集。所以，Team能够带来Diversity，所以不容易被stuck住。
Recombination:对不同的Heuristic算法进行组合能够产生多样的效果——新的Innovation是旧的东西之间的再次组合和提升。

Section 10 Markov Processes

Markov Processes（以下简称MP）表示的是一种经过迭代后会趋于稳定的模型。前提是该模型满足四个条件：

有限状态
固定的转移概率
能够从任意状态到任意状态（不存在死状态）
没有简单的互换（A B互相切换）
满足上面四个条件后，随着迭代MP会慢慢均衡到达Equilibrium Point，这是一种Statistical Equilibrium，即状态之间依然在不停的交互，但是位于某状态下的个体的数目已经不会变化。
所以，需要改变一个MP最后的Equilibrium Point，下面方法是无效的：
改变初始状态
改变历史
改变中间转移
不过，这些能够加速或者延缓MP达到稳态的速度，所以还是有影响的。
想从根本上改变Equilibrium Point，需要改变MP的转移概率。举例：一位老师如果想学生更加喜欢他的课，那么课上突然让学生笑10分钟是没有用的，而是应该去认真备课，并且力求让学生理解课上的内容。

Section 11 Lypunov Functions

Lypunov Functions需要满足两个条件
- 存在最大值（或者最小值）
- 每个阶段都至少增加k（或者至少减少k）
当一个一个模型满足Lypunov Function条件时，那么它最后会达到平衡状态。
Lypunov可以解析城市的自管理现象——当大家都避免拥挤的时候，那么最后每个地方都会趋向于不那么刚刚好的情况
Lypunov被外部因素影响的时候，很可能不再成立：如交换椅子符合lypunov，交换办公室则不一定——因为换了座位可能会引起第二轮交换，导致了系统一直扰动，不能进入平衡状态
一个函数是Lypunov时候，可以很容易地计算出它什么时候实现均衡，但是系统有可能有多个均衡点，所以最后的均衡点不一定是最优的——比如交换水果的那个样例。
Lypunov和Markov有两个主要的不同点：
- 多个可能的均衡点 vs 唯一的均衡点
- 能否达到均衡受外部条件影响 vs 能否达到均衡不受外部条件影响

Section 12 Cordination and Culture

简单来说，局部的同调导致了全局上具有了多种多样的文化。

Pure Coordination：跟身边的人同调，这符合Lyapunov，所以最后会达到均衡状态——类似之前的Schelling Model，同类人聚在一起，然后不同类型的人有明显的分开边界。
Pure Cordination vs Standing Ovation：差别主要是前者如果要保持不同，损失要比后者大很多。
Inefficient Coordination：说明简单的同调并不能带来最优值，比如美国拒绝使用公制计数而使用英制计数——从实际角度说，公制更加有优势，但是周围的人都用英制，也唯有用英制了。
Axelrod’s Culture Model：解释了Thick Boudaries现象，系统均衡后，住的很近的两个人，要么他们很像，要么他们很不像。
Bednar etal Model：教授自己带研究生做的模型，比起上一个模型，加入了Coordinate因素和Small Error，最后能够解释为什么一个群体整体来说很集中，但是存在很少的离群点的现象。

Section 13 Path Dependence

讲的是一种“我当前的表现依赖于我过于的表现”的模型。跟下面的random walking截然不同。

Urls model
- Bernoulli，如果一开始取出红球，那么继续加红球。造成的结果是outcome千千万，而且出现概率都相等。
- Polya，如果一开始取出红球，那么我补一个蓝球。造成的结果是outcome是最后取出红蓝球的期望是一致的。
- 上述两个模型，都不是路径依赖的。
Externalities：加入了外部影响，就有可能形成路径依赖了，比如事件与事件之间相互影响，那么先做哪件事后做哪件事就有差别了。

Section 14 Network

作为IT圈的人，Network太熟悉了，内容比较少，围绕三方面展开：

Logic： How it form? Random, Small World, Preferential Attachment(e.g. Internet).
Structure: measures, e.g. Degrees, Path Length, Clustering Coefficient …
Function： what it does, e.g. Six Degrees

Section 15 Randomness and Random Walks

这一章讨论的是“天赋和运气”（skill & luck）。这在《思考，快与慢》的17章的“回归到平均”说的应是同一个东西。

因为什么会产生随机性？Noise、Error、Uncertainty、Complexity。
Skill-luck Model: Outcome = a*Luck + (1-a)*Skill, a in (0,1)。

模型用的第二点即上面提到的“回归到平均”：如果有一天表现很好，那么第二天表现变差的可能很大；如果有一天表现不好，第二天表现变好的可能很大；最后表现回复到个人的平均水平。
The Paradox of Skill：当大家的skill都差不多的时候，胜负几乎只靠运气决定。
Binary Random Walk，抛硬币是一个典型的二项随机游走问题，有三个结论：
- 抛偶数次硬币，最后得分的期望是0
- 对于每个得分k，随机游走都会达到k和-k无限次
- 对于每个数字k，随机游走都有可能连续出现k次head或者k次tail
这里再次提到了“Regression to the mean”的效应。以及否认了打球时候“hot head”的不存在。以及对“No Free Lunch”做了解释，认为“好”的标准一直改变，公司也需要充分发挥主观能动性，来对抗随机和未知。
还有“小数定律”（也是联想到了《思考快与慢》的章节了）：我们看到的只是全局的一部分，但是却默认地认为这就能够代表全局。
Normal Random Walk和Efficient Market Hypothesis：想说明的是，股市是一种对过于没有记忆的random walk，所以做出预测是不靠谱的。
当然EMH也不是绝对正确，被提出了两点质疑：Too Much Flutuation和Consistent Winner。不过随机游走也是有Consistent Winner的，只不过概率比较小。
Finite Memory Random Walk:加了时间依赖，相对客观一点。

Section 16 Colonel Blotto

讲的是资源错配问题。

这是一个零和游戏
当两方资源一致时候，任何策略都可以被打败。（这里可以联系上一章的the Paradox of skill）
它结合了均衡和随机：选择随机的策略，最后胜负达到一个均衡。（类似于石头剪子布）
但如何一方的资源丰富，那么有可能达到必胜。而作为资源不足的一方，增加战场才有可能扭转战机。

Section 17 Prisoner’s Dilemma

囚徒困境，一个经常被提到模型。

从集体的角度讲，鼓励合作，从个人的角度讲，趋向背叛。
该模型唯一的平衡是双方都选择背叛，该平衡称为纳什平衡（Nash Equilibrium），但是它不是帕累托最优(Pareto Efficient)的。
如何在囚徒困境模型中鼓励大家合作，7个方法，前5个是自然的，后两个是人工的：
1. Repeated：如果人们需要重复博弈，那么趋向合作（不然会被以牙还牙）
2. Reputation：如果合作能够带来好名声（以帮助后面的博弈），那么人们趋向合作。
3. Networks：如果网络中的人都趋向于合作，那么采取合作会比较有利（反之亦然）
4. Group：如果与其他组别竞争，组内合作会增加打败对方组别的胜率
5. Kin：如果有亲缘关系，我们会考虑更多的合作
6. Laws：通过制定法律来限制人们的背叛
7. Incentives：通过引导来让人们实现合作
如果囚徒困境中的囚徒大于2，那么问题拓展为Collective Action Model，本质上跟两人的囚徒困境一样，集体鼓励合作，个人趋向背叛。（公共鱼塘问题，大家会趋向过度捕捞，最终导致资源耗尽）
应对Collective Action Model问题，让人们趋于合作的解决方法的思路大致也是上文的7点，作者举了几个例子，其中一个是通过分区或者轮流使用公共区来解决放牧的问题。然后提到没有方法是万能的，需要具体问题具体分析。

Section 18 Mechanism Design

这章感觉讲得有点虚，理论大于实际。

Mechanism Design是说通过设计以下三点来推动项目的实施：
1. The rules of the game
2. The actions people can take
3. Payoffs associated with the actions
好的Mechanism Design能够对付Hidden Action和Hidden Information
例子一：根据绩效进行鼓励（根据生产出来多少好的产品来给工资）
例子二：通过限定工作总量来区分好跟坏的工程师（假设好工程师同等强度下，付出更少）
例子三，拍卖会：19min，举了三种拍卖方式，Ascdending Price, Second Price，Seal Price。在理性情况下，这三者起到的效果是一致的——出价最高的出价人能够用1/2的心理价位获得自己想要的商品。
例子四，公共项目：用Pivot Mechanism，能够让人们趋向报出真实的心理价位。
Mechanism Design的目标有四：
1. Efficient：项目是有效的，能够有益处的
2. Always Join：大家都积极参与，不需要强迫
3. Incentive Compatible：大家都会趋向真实报价
4. Balanced：项目最后能够实行
同时满足上述四者的Mechanism是不存在，比如Pivot Mechanism就不满足第四条。

Section 19 Learning Models: Replicator Dynamics

Replicator Dynamics认为人们会学习回报（payoff）比较高的人，于是整个种群呈现一种往优势发展的趋势。

主要考虑的因素有两个，使用某种策略的人的比例，以及使用该策略带来的回报。
直观来说，使用某种策略的人越多，那么后续使用该策略的人也会很多，如果某个策略回报比较大，那么后续使用该策略的人也会变多
案例1，从鞠躬到握手。最后人们会趋向于握手，达到最优解。
案例2，从小破车到SUV。最后人们会趋向SUV，达到的却不是最优解。说明了Replicator Dynamic在学习方面的局限性。
Fisher’s Theorem融合了三个模型：
- There is no cardinal
- Rugged Landscape
- Replicator dynamics
得到的结论是，种群内差异越大，进化越快。
Fisher vs 6sigma：适用于不同的情况，前者适用于变化的环境，后者适用于不变的环境。作者在这里对谚语进行了讽刺：之所以存在相悖的谚语，是因为使用者脱离语境和上下文。No Free Lunch决定了世界上没有万金油方法，需要结合问题具体分析。

Section 20 Prediction and the Many Model Thinker

本课程的最后一章。

目前学到了用于做Predict的模型有三个：
1. Categories
2. Linear Models
3. Markov Models
Diversity Prediction Theorem告诉我们，用多样的策略，能够加强predict的准确度。其公式是$Crowd’s Error = Average Error - Diversity$
根据Diversity Prediction Theorem我们可以总结出2点：
1. 集体的智慧来自一群明智但思考角度不同的人
2. 集体的疯狂来自一群愚蠢但思考角度雷同的人
最后又回顾了各种模型，以及强调了不仅要培养模型思维，还要培养多模型思维，最后提到，本课只是model的入门课，有兴趣的人需要学习更多的model来充实内容

本课程结束。

在路上

课堂笔记 《Model Thinking》