再读曼昆《经济学原理》 篇四:Adidas如何制服了“等等党”?囚徒困境的应用示例
编写理由
暂时跳过了《经济学原理中》需要简单量化的成本、收益部分,进入令人期待的博弈论(game theory)环节,“囚徒困境”(prisoners’ dilemma)作为特别重要的博弈论经典场景,在生活中的应用可谓是非常广泛。
先用Adidas来做本次引入囚徒困境的开篇例子,也刚好是因为在今年的1月6日Adidas出了一个很奇葩的活动模式,6日0点起各商品在京东和天猫官方旗舰店均开始打折活动,但优惠券需要在6日的10点可以领取(反薅1元)。这种鲜见的放券模式无疑就给消费者制造了一个困境,是凌晨0点就买特价的呢,还是做个小“等等党”上午10点领了券再买?
有兴趣的可以看一下当时这个爆料下的评论,大家对这种现优惠后放券的模式评价各异。
囚徒困境
先说一下什么是博弈论:
博弈论,研究人们在不同策略的情况下如何行事。
直白了讲就是一个人在做一件事情的时候,考虑到其他参与者的反应后,自己要如何做的“策略说明书”。
而作为博弈论的经典案例“囚徒困境”,则是要说明为什么有时保持合作是困难的,即便是合作能让原本不合作的人情况更好,因为利己主义的存在、缺乏绝对的信任、惩罚性后果很严重等因素,他们仍会走向不合作。
Adidas让人放弃做“等等党”案例
简要介绍Adidas在1月6日的那次活动设定:
大致的情况描述是1月6日10点会有一张1000-300的优惠券放出,并且可以叠加每300-30的津贴优惠,做到1000-390元。在0点的时候只有一张减100的券和每300-30的津贴可以叠加,优惠力度小于到10点领券后。
Harden4代的多个配色在0点时的活动到手价格大概是619元,如果等到10点的话则可以做到478元,只要稍微“等等”,就能节省100多元,那么是否有人愿意做这个“等等党”呢?
简化假设
因为参与人数相对较多,而库存相对较少,为了简化说明,不妨以下假设只有两个人A和B要参与这次的Adidas的Harden4代球鞋的购买,但是库存仅有1双,二人都是理性的,他们每个人要考虑是否0点买还是10点买。
假设2人均认为这双鞋值900元,也就是说如果低于900元的话他们都愿意购买,那么0点买则可以给个人带来281的收益,10点买则带来422的收益。如果二人在同一时间购买这就有1双库存,那么拼手速二人都是公平竞争,每个人只有一半的概率能得到这双鞋,这时每个人的收益期望相当于个人购买收益的一半,即在0点二人决定抢的话,二人的收益期望各为140.5,如果10点二人抢的话收益期望为211。
如此,将二人做0点买还是10点买的决策以及收益的期望列成一个表,则如下:
A的想法:
对于A而言,他会考虑B是如何决策的。A想如果B选择0点购买,那么自己0点买期望收益是140.5,10点的话库存已经没了,有机会抢到比没有机会抢到更好,因此A选择0点抢;如果B选择10点购买,那么自己0点买必然能买到,收益是281,而10点的话则要去抢,期望收益只有211,按照收益来评估的话还是0点更划算。
因此,无论B选择0点买还是10点买,A都是0点买更好,这时这种策略被称为是占优策略(dominant strategy)。
B的想法:
因为A和B是对称的,所以同样也是无论A选择0点买还是10点买,对于B都是0点买的期望收益更高,因此0点买也是B的占优策略。
均衡情况
所以这样就会让平衡(均衡)落在A和B都选择0点购买的这个情况里,也就是“等等党”都不做了。反观如果A和B都选择10点买的话,双方的期望收益都变味211,相比140.5会更好(对应Adidas店铺的收益就变差了),但是10点买并不是好的选择,因为只要别人改变为0点买就会变得更好,而“想10点买”的人就会变得更差。
不排除1月6日当天现实购买的时候还有人会想着等等10点买看看情况,但是实践证明早就被一些“放弃做等等党的”在0点时买清仓了。
公有地悲剧问题
第二个示例,来看一下上一章介绍过的一个经济学关于外部性的重要理论——公有地悲剧,具体可以参阅上一篇内容。
公有地悲剧作为经济学里的一则经典寓言,解读了公有资源中每个使用者都会出于其自身的需求对共有资源过度使用,其行为对其他使用者所造成的负外部性,最终影响了公有资源的效率,每个人出于个人最大化考虑的公有资源过度使用反而让每个参与者向不利的方向演化。
同样还是简化模型
以小黄和小红两个人在一个商街里造鞋卖鞋为例,各自安静的造鞋卖鞋,每天都能赚到1000元;
当然他们发现了这个“安静环境”作为公有资源是可以被利用起来的,自己开业就发出叮叮咣咣的声音可以吸引更多的游客,自己可以赚到1400元,但是对门的安静造鞋卖鞋的那位就只能赚500元;
如果两个人都要对这个公有资源“安静环境”过度使用,两个人一开业就同时叮叮咣咣的,则原本吸引游客的响动就变成了这条商街的大噪声污染源,导致人流减少,最终两个人每天都只能赚800元。
小红的想法:
如同Adidas给A和B创造的困境一样,小红认为如果小黄选择安静,那么我叮咣可以赚1400,安静可以赚1000,这时候我选择叮咣对我更好;如果小黄选择叮咣,那么如果我选择安静我只能拿500,但是我也叮咣我还会至少有800,所以我还要选择叮咣。那么叮叮咣咣对于我来讲就是个占优策略。
小黄的想法:
和小红一样,也是叮叮咣咣才是占有策略。因此这种情况下二者在没有非常强的协商下都会选择对自己更好的策略,即他们占优策略实现的均衡,两个人都叮叮咣咣各拿800,比原本两个人安安静静的各拿1000都更差了。
这是一个典型的公有地悲剧问题,出于利己而对公共资源的任意使用会让双方走向公有地悲剧的均衡,这是双方相比于都安安静静的更不利了。
协商合作是否可以打破囚徒困境?
继续接着看前一则小红小黄造鞋卖鞋的例子,两个人协商是否有效呢?
单次无约束合作无效
如果二人只有这么一次的合作机会,二者的协商又没有其他的法律手段进行强制约束的话,那么即便是小红和小黄都和对方说“咱们都安安静静的各拿1000是不是更好”,他们也很难维持这种平衡。
以小红为例,合作一次就跑路的情况下,双方完全无法构成信任关系。小黄说的他会选择开业安静,小红是不会信的,因为小红会认为小黄在小红开业安静的时候选择自己叮叮咣咣而多赚400,这样反而小红自己的收益更少了。因此小红不会相信小黄会老老实实的选择开业安静,这样小红自己也只会选择在任何情况下都更有利于自己的策略,还是开业就叮叮咣咣。这样,仅一次的无信任合作平衡被打破了。
单次强约束合作可能有效
对比前一种情况的无强制约束下,这次比如说加入了法律效力约束,二者协商之后签了个合同:如果某一方开业叮叮咣咣,就需要当天赔付给另一方450元。这个也相当于由公权力变相干涉,公权力的法律严格约束该协议,有一方违反合同则严格执行赔付。
那么此时在选择叮叮咣咣时,二者的收益会由于强约束而发生变化,选择开业叮叮咣咣的人其当天收益会减450、另一方加450,即一个人叮叮咣咣另一个安静的话两个人最终各得950元。如此的话双方的收益列表变为如下:
此时对于小红和小黄双方,他们的占优策略都发生了变化,安静成为了双方的占优策略,这时的均衡就是二者都选择开业即安静,双方的收益也更好了,也避免了公有地悲剧的发生。
长期协商合作有效性
如果说短期的一次无信任合作是无效的,那么长期看来即便是无信任协商合作的也同样具有有效性,其原因如下:
小红和小黄就是对门的商铺,两个人都会在这个地方一直经营下去,即存在着长期的合作。这时双方都会考虑到,双方在初始的两个人均保持安静的情况下,假如有一天小黄率先起异心开始叮叮咣咣了,那么小红也就没有理由再傻傻的保持安静了,从次日起小红的策略也会选择一直叮叮咣咣下去,而小黄也会意识到这一点。这样初始时(小红,小黄)的收益就从每一天都是(1000,1000),由某一天的小黄贪心成(500,1400)引起了后续一连串持续的(800,800)。
以上这种策略无论如果有双方提前的无强约束的约定,也会形成可信的惩罚威胁,或者说即便双方没有过共识,但是出于对彼此收益的认知,也会默认形成这种“以眼还眼”的惩罚性策略。此时考虑虽然某一天小黄自己因为异心而额外收益了400元,但是这种额外收益是不可持续的,并且代价是未来的所有的天每天的收益相比初始情况都要少200元,一直经营下去的未来所有天收益都减少,小黄的异心想法则会让自己的整体收益变得更差。因此这种长期的协商合作,可以保证小黄和小红前期有足够天数的有效合作共同维持安静的环境。(此处暂时不展开有限天数、无限天数的长期合作的区别,有兴趣的可以自己逆向思维思考一下,二者还是有比较大的区别的)
模拟“囚徒困境”的虚拟示例
以下假设用A和B这两个人“造谣者”举例吧,两个人有意或无意传播了一些消息出来被认定为是“造谣者”,当然被某一级别的权力部门认定后,根据二人表现给予相应的处罚。
“造谣者”嫌疑的处境
有“造谣者”嫌疑的A和B被分别问话,被告知“因为你们的言论已对公众造成了影响,我们会就此对你们予以口头警告并告知单位(相当于造成1点伤害);当然,如果你承认了你们是在造谣,而你的伙伴坚持他在说实话,那么你相当于有了揭发事实检举的功劳,我们会撤销对于你的处罚,而你的伙伴因为情节恶劣会提升其判罚(相当于对你队友造成10点伤害),反之你队友承认造谣但是你坚持你们在说实话,那么提升判罚的就是你;如果你们二人均表现‘良好’,同时承认了你们在造谣,那就各自下发训诫书并公开你们造谣行为(相当于造成2点伤害)。”
那么对于A和B二人的判罚(即造成伤害,伤害越小越好)情况如下:
每个人的决策
通过前面的例子,大家应该能看出来无论是对于A还是对于B,承认都是其占优策略。即当B选择承认时,A选择承认自己受到的伤害更少;B选择不承认时,A选择承认也是伤害更少,所以A有理由选择承认让自己免受重罚。同时,即便是A和B关系要好,但是在分开告之时,因为自己不承认是有极大可能性面临着极大的10点伤害,况且承认还是伙伴的占优策略,所以保险起见也还是承认了比较好。因此,最后很大的可能性二者都会选择均衡的同时承认,这样二者也就面临被下训诫书和公告其为“造谣者”的惩罚了。至于二人是否是在说真话还是在造谣,在这个虚拟的场景下并不影响均衡。
总结
博弈论是经济学里有别于其他量化和计算为主的一门以逻辑为主的理论,囚徒困境更是博弈论的经典代表,通过囚徒困境可以解释现实生活中为什么很多时候明明有让大家都变更好的选择但是却不这样做。
博弈论部分我翻了一下曼昆《经济学原理》里涉及的主要就这一些,如果大家感兴趣的话可以查看中国人民大学出版社翻译的《策略博弈》或者其他的相关书籍,会介绍更多的经典理论和精彩示例。当然,如果各位的对博弈论很感兴趣的话并且认为燃尽这些举例离你们不远,也欢迎留言,燃尽视情况对这部分可以做超出本系列的展开。
有哪些思考的错误也欢迎指出,同学们下期再见!
[已注销]
校验提示文案
chonglou
校验提示文案
黑白不倒翁
校验提示文案
不聪明的曹操
校验提示文案
值友5153704206
校验提示文案
寻路小司机
鬼冢虎fans发来贺电。
校验提示文案
我是大宝子
校验提示文案
榴莲小丸子
校验提示文案
D_WW
校验提示文案
Aosii
校验提示文案
叁戒
校验提示文案
revengy
校验提示文案
海山有龙
校验提示文案
Fzoneeeee
校验提示文案
hiitsme
校验提示文案
liuyan7105
校验提示文案
激昂石岸
校验提示文案
众儿子们平身
校验提示文案
会计小霸王
校验提示文案
只有张大妈
校验提示文案
沃梅又闻花
校验提示文案
哈哈1111
校验提示文案
banban2
校验提示文案
啓晟
校验提示文案
有钱就是使劲花
校验提示文案
不会编段子的段子手
校验提示文案
garcia52111
校验提示文案
草莓和土豆在一起
校验提示文案
_车前草_
校验提示文案
只睡半张床
校验提示文案
飞天虫虫
校验提示文案
批发大户
反正怎么打折我都不买 没钱
校验提示文案
爱笑的猴子321
校验提示文案
tooky
校验提示文案
值友1849625142
校验提示文案
韩三岁
校验提示文案
值友5153704206
校验提示文案
为什么不让我改昵称
校验提示文案
摄影光头强
校验提示文案
青岛淮扬菜
校验提示文案