skip to content

读后记-用博弈的思维看世界

/ 9 min read

📑 目录

概述

这本书是蒋文华老师写的, 属于博弈论的入门书籍

题图为党岭

读后记

囚徒困境

有一个很经典的囚徒困境

警方同时逮捕了 A, B 两名嫌疑犯,但没有足够证据指控二人有罪。

警察在两个独立的不能互通信息的审讯室分别对 A,B 进行审讯

两人都有两个选择 1 坦白 2 抗拒(沉默不认罪)

规矩简单来说就是: 坦白从宽, 抗拒从严

一个人坦白, 一个人沉默, 则前一个人当场释放, 后一个人需要服刑 5 年

两个人都坦白, 则两个人都需要服刑 3 年

两个人都沉默, 则两个人只需要服刑 0.5年

另外 A, B 不会有道德负担, 他们只为自己的利益考虑

image-20201025165626474

虽然对于 A, B 两者整体有一个最好的结局, 两人都被判 0.5 年

我们这里假设 A 的心理

  • 如果 B 沉默, 那对于 A 来说, 自己坦白的收益最高, 可以直接释放;
  • 如果 B 坦白, 则对于 A 来说坦白收益最高, 只被判 3 年, 而如果沉默, 会被判 5 年;

我们可以看到, 不管 B 做出何种策略, 对 A 来说, 坦白的收益是最高的.

同理 B 也是一样.

所以我们通常看到的结局就是, AB 都坦白, 然后同时被判 3 年, 这显然和 都沉默的结局 , 都被判 0.5 年有很大的差距.

  • 假设嫌疑犯B坦白的概率为 m , 则 沉默的概率为 1-m
    • 如果 A 坦白, 则期望为 m * -3 + (1-m) * 0
    • 如果 A 沉默, 则期望为 m * -5 + (1-m) * -0.5
    • 显然 A 坦白的期望 > A 沉默时的沉默

甚至当我们把条件改成 如果两个人都沉默, 则两个人都直接释放

我们还是假设 A 的心理

  • 如果 B 沉默, 那对于 A 来说, 自己坦白和沉默 的收益是一样的, 都是直接释放;
  • 如果 B 坦白, 则对于 A 来说坦白收益最高, 只被判 3 年, 而如果沉默, 会被判 5 年;

我们前面提到, AB 无法交流, 对 A 来说, 坦白是最好的选择 (期望最高) ; 同理 B 也是这样的;

我们可以看到 A , B 双方虽然可以获得更好的结局, 但如果他是一个理性人, 则仍然会选择收益更高的选项 - 坦白, 这个对于整体来说不算完美的结局. 在一定条件下, 每个人的自利选择, 却带来了双方最差的结局

理性人:

  1. 认知的理性, 人是自我利益的判断者
  2. 行为的理性, 人是自我利益的追求者

即在博弈中, 假设参与者都是理性的, 每一方都能在决策时充分考虑到他当前面临的局势, 也会顾及对方的行动对自己造成的影响与后果, 根据各种推测选择使自己利益最大化地策略

真实世界的囚徒困境

关于真实世界的囚徒困境也很普遍

  • 公地的悲剧

    • 一群牧民在一块固定大小的草原放牧, 牧民为了自己的利益尽可以多养牛羊, 最后草场退化, 牧民们失去了牛羊
  • 气候变暖

    • 虽然气候变暖已经成为了事实, 但各个国家很少能放弃自己的利益, 减少各类温室气体的排放
  • 枪打出头鸟

    • 在一群人面对威胁或者损失时, 第一个采取行动的决定往往是很难做出的, 因为这种行为虽然能为团体带来利益, 但也意味着行动者将付出惨痛代价
  • 多数人的暴政

    • 他们先是来抓共产党, 我没有说话, 因为我不是共产党。 他们接着来抓犹太人, 我没有说话, 因为我不是犹太人。 他们又来抓工会会员, 我没有说话, 因为我不是工会会员。他们再来抓天主教徒, 我没有说话, 因为我是新教教徒。 他们最后来抓我, 这时已经没有人还被留着给我说话了。
      • 马丁·尼莫拉牧师,波士顿犹太人大屠杀纪念碑铭文,1945年
  • 可持续发展

    • 可持续发展的代价是什么呢
  • 人民公社

    • 出工不出力
  • 有时我们能预想到一个更好的结局, 但执行起来时, 往往因为每个人的利益问题, 导致了一个更差的结局

破解囚徒困境

看完整本书, 我仍然觉得破解囚徒困境很难, 书中提到了破解的 3 种措施

  1. 道德教化
  2. 财产私有
  3. 温故知新

我的理解如下

  1. 道德和法律是整个人类社会利益的维护者

    • 我很难想象没有法律和道德 + 人的自私自利 会给整个社会带来什么
  2. 有效的交流沟通, 可以促进人们达成目标一致

    • 就像囚徒 A B 一样, 有效的沟通, 可以使得双方的利益最大化
    • GRIT 逐步 graduat , 互惠 reciprocat , 主动 initiative 地减少紧张 tension reduction
      • 查尔斯·奥斯古德 Osgood 提出的一个和解方式
      • GRIT 要求一方在宣布希望调和的意愿之后, 做出一些小的意在降低冲突的行为. 发起调和的一方, 在实施每一个表示调和的行为之前都生命这种希望减少紧张的主张, 并邀请对手进行回报
      • 在逐步建立信任的过程中, 到达一个双方更好的结局的平衡点
  3. 带有一些利他主义

    • 在自私的基因这本书中, 也讲到了关于囚徒困境的问题(第12章)

    • 吸血蝙蝠的利他主义, 饱食的蝙蝠会捐赠一些给不走运的同伴

  4. 在规则制定时, 尽可能避免产生囚徒困境

    • 就像今年诺贝尔经济学奖得主研究的拍卖理论一样

    • 有兴趣的可以搜索下

      • 频谱拍卖
      • 肾脏交换
      • 自私路由

最后, 引用一段话

为众人抱薪者,不可使其冻毙于风雪。

为大众谋福利者,不可使其孤军奋战。

为自由开路者,不可使其困顿于荆棘。

参考

  1. 用博弈的思维看世界 - 蒋文华
  2. 斯坦福算法博弈论二十讲 - Tim Roughgarden
  3. 频谱拍卖
  1. 肾脏交换