囚徒困境与经济学的若干问题探讨
The problems of the prisoner dilemma and economics/JiaojiaoJia
要】囚徒困境是博弈论中的一个重
要模型,其主要反映个人理性与集体理性的不一致,如何在实现个人利益的前提下保证集体利益是解决囚徒困境的主要症结。本文首先介绍了囚徒困境模型,其次介绍了囚徒困境在经济学领域中的一些应用及现实意义,在此基础上最后简单介绍了一些摆脱囚徒困境的方法。
【关键词】囚徒困境博弈个人理性集体理性
Abstract :This paper firstly introduces the prisoner dilemma model, and then introduces some of the applications and realistic signifi-cance of the prisoner's dilemma in economics. Based on it, it finally introduces some methods to escape from the prisoner's dilemma.
【摘
1. 囚徒困境模型介绍
“囚徒困境”模型是塔克于1950年提出的,是博弈论中的经典范例,属于完全信息的静态博弈的一种,同时也是经典的非合作博弈。其在经济管理的各个领域,在资源利用和环境保护,以及政治、军事和法律等许多领域都有很广泛的应用和现实意义。
警察对两个囚犯合伙犯罪的囚犯分开进行审讯,如果两个人都坦白,则各自会被判8年有期徒刑;如果两个人都抵赖,则各自会被判1年有期徒刑;如果只有一个人选择坦白,则选择坦白的人会被释放,而另外一个人会被判10年有期徒刑。囚徒困境的前提假定为两个囚犯都是自私和理性的,对于囚犯A 和B 来说,无论对方怎么选择,我选择坦白的收益都会大于选择抵赖的收益,即囚犯A 和B 的占优策略都是坦白,最终纳什均衡为(坦白,坦白)。
囚徒困境反映了个人理性和集体理性的矛盾,即个人利益的最大化往往不能实现团体利益的最大化。每个人都考虑自身利益最大化,选择自己的占优策略,从而使得两个人都坦白。即使两囚犯在被警察抓住之前建立一个攻守同盟(死不坦白) ,这个攻守同盟也没有用,因为它不构成纳什均衡,没有人有积极性去遵守协定。
2. 囚徒困境与经济学2.1价格战和产量战
在有两个企业的寡头市场上,两个企业形成“同盟”,同时选择垄断产量,从而使得产品和利润处于较高水平。但是,在两个企业都选择垄断产量时,其中一个企业提高自己的产量会使得其利润提高,总会有企业为了自己的利益选择私自提高产量,这样的结果会使得两个企业最终都提高产量,这样两个企业的利润都低于垄断产量下的利润,个人的理性却导致了帕累托低效率。
近些年来,电信行业、家电行业等许多行业都会陷入“囚徒困境”价格战,从而使得整个
行业的价格和利润降低。不过,一方面,价格的
降低和利润的下降有时会使企业大力改进生产技术,从而提高生产效率,降低生产成本,另一方面也会淘汰落后产业,促进产业整合,优化产业结构。
2.2公共品的供给及公共资源的过度浪费任何物品,如果一个群体中的任何个人能够消费它,它就不能不被那一集团中的其他人消费,公共品的这种性质使得在其在供给中会出现“搭便车”的现象,即公共品供给不足甚至无供给。关于公共资源的浪费,最有名的例子为公地悲剧,公地作为一项资源或财产有许多拥有者,他们中的每一个都有使用权,但没有权利阻止其他人使用,当约定了最优放牧数量时,某一个牧民增加放牧数量是有利的。但是,负的外部效应的存在会使得边际社会成本增加,从而使得边际社会成本大于边际社会收益,即会造成过度放牧,草地枯竭。同样对于过度砍伐的森林、过度捕捞的渔业资源及污染严重的河流和空气,都是“公地悲剧”的典型。
2.3国家之间的贸易战在国际贸易中,各国会根据比较优势理论进行分工,并参与国际贸易,各国都希望出口自己的优势产业,保护本国的劣势产业,提高其在国内市场的竞争力。如果两国都实行自由贸易政策,此时两国互相利用资源,利益互增。但是,一国为保护国内比较劣势产业会限制进口,实行贸易保护政策,在两国同时实行贸易保护政策下,两国会产生相应的贸易摩擦,此时会使两国利益都受到很大损失。
2.4经济制度的制定
囚徒困境给了这样一个重要的结论:一种制度安排,要发生效力,必须是一种纳什均衡,否则这种制度安排便不能成立。
3. 走出囚徒困境囚徒困境问题中“理性人”的个人利益与集体利益相矛盾,使得在追求自身利益最大化的同时忽略了集体利益,并造成了帕累托低效率,在现实经济问题当中,要走出囚徒困境,最重要的问题在于解决个人利益与集体利益冲突的问题。
3.1重复博弈
在静态博弈中,作为纳什均衡的结果,两个囚犯都会选择策略(坦白,坦白)。在重复博弈中,如果博弈的次数是有限的,最终的均衡结果仍为(坦白,坦白)。然而在无限次的重复博弈中,参加者更需要考虑的是重复博弈后取得的平均收益,而不是某一次具体对局的结果,每一次对局的历史都影响着双方下一次对局的策略选择。如果不存在贴现因子,则会出现双方都选择抵赖的结果;如果存在贴现因子,当贴现因子足够大时,双方都会重视未来各期的收益,此时也会出现(抵赖,抵赖)的结果。因此,在无限次重复博弈中,囚徒困境的问题可能会得到解决。
3.2合理的奖惩制度和选择性的激励
设立相应的法律政策或者对参与者行为进行监督,奖励合作一方,对于不合作一方给予超过其不合作收益的惩罚,使其没有动力偏离合作,从而协调个人利益与集体利益的矛盾。同时,可以选择性的奖励为集体利益做出贡献的人和惩罚“搭便车”的人,以此来解决公共品的供给不足问题。
3.3可置信的威胁
如果没有相应的约束机制,参与者都没有动力去遵守“同盟”约定,囚徒困境的问题仍然得不到解决。如果一方做出可置信威胁的承诺,另一方相信威胁的存在,则会选择合作,使得合作成为博双方的均衡解,从而使得参与者走出囚徒困境。
参考文献:[1]张维迎《. 博弈论与信息经济学》[M],上海:上海三联出版社,2004(11).
[2]马本江、邱菀华《论. 摆脱囚徒困境的途径》[J],生产力研究,2004(10).
[3]卢现祥,朱巧玲《. 新制度经济学》[M],北京:北京大学出版社,2007.
[4]谢识予《. 经济博弈论》[M],上海:复旦大学出版社,2007.
作者简介:贾姣姣(1987.10-),女,河南许昌人,四川大学经济学院09级数量经济学硕士,研究方向:数理经济学。
(作者单位:四川大学经济学院)
囚徒困境与经济学的若干问题探讨
The problems of the prisoner dilemma and economics/JiaojiaoJia
要】囚徒困境是博弈论中的一个重
要模型,其主要反映个人理性与集体理性的不一致,如何在实现个人利益的前提下保证集体利益是解决囚徒困境的主要症结。本文首先介绍了囚徒困境模型,其次介绍了囚徒困境在经济学领域中的一些应用及现实意义,在此基础上最后简单介绍了一些摆脱囚徒困境的方法。
【关键词】囚徒困境博弈个人理性集体理性
Abstract :This paper firstly introduces the prisoner dilemma model, and then introduces some of the applications and realistic signifi-cance of the prisoner's dilemma in economics. Based on it, it finally introduces some methods to escape from the prisoner's dilemma.
【摘
1. 囚徒困境模型介绍
“囚徒困境”模型是塔克于1950年提出的,是博弈论中的经典范例,属于完全信息的静态博弈的一种,同时也是经典的非合作博弈。其在经济管理的各个领域,在资源利用和环境保护,以及政治、军事和法律等许多领域都有很广泛的应用和现实意义。
警察对两个囚犯合伙犯罪的囚犯分开进行审讯,如果两个人都坦白,则各自会被判8年有期徒刑;如果两个人都抵赖,则各自会被判1年有期徒刑;如果只有一个人选择坦白,则选择坦白的人会被释放,而另外一个人会被判10年有期徒刑。囚徒困境的前提假定为两个囚犯都是自私和理性的,对于囚犯A 和B 来说,无论对方怎么选择,我选择坦白的收益都会大于选择抵赖的收益,即囚犯A 和B 的占优策略都是坦白,最终纳什均衡为(坦白,坦白)。
囚徒困境反映了个人理性和集体理性的矛盾,即个人利益的最大化往往不能实现团体利益的最大化。每个人都考虑自身利益最大化,选择自己的占优策略,从而使得两个人都坦白。即使两囚犯在被警察抓住之前建立一个攻守同盟(死不坦白) ,这个攻守同盟也没有用,因为它不构成纳什均衡,没有人有积极性去遵守协定。
2. 囚徒困境与经济学2.1价格战和产量战
在有两个企业的寡头市场上,两个企业形成“同盟”,同时选择垄断产量,从而使得产品和利润处于较高水平。但是,在两个企业都选择垄断产量时,其中一个企业提高自己的产量会使得其利润提高,总会有企业为了自己的利益选择私自提高产量,这样的结果会使得两个企业最终都提高产量,这样两个企业的利润都低于垄断产量下的利润,个人的理性却导致了帕累托低效率。
近些年来,电信行业、家电行业等许多行业都会陷入“囚徒困境”价格战,从而使得整个
行业的价格和利润降低。不过,一方面,价格的
降低和利润的下降有时会使企业大力改进生产技术,从而提高生产效率,降低生产成本,另一方面也会淘汰落后产业,促进产业整合,优化产业结构。
2.2公共品的供给及公共资源的过度浪费任何物品,如果一个群体中的任何个人能够消费它,它就不能不被那一集团中的其他人消费,公共品的这种性质使得在其在供给中会出现“搭便车”的现象,即公共品供给不足甚至无供给。关于公共资源的浪费,最有名的例子为公地悲剧,公地作为一项资源或财产有许多拥有者,他们中的每一个都有使用权,但没有权利阻止其他人使用,当约定了最优放牧数量时,某一个牧民增加放牧数量是有利的。但是,负的外部效应的存在会使得边际社会成本增加,从而使得边际社会成本大于边际社会收益,即会造成过度放牧,草地枯竭。同样对于过度砍伐的森林、过度捕捞的渔业资源及污染严重的河流和空气,都是“公地悲剧”的典型。
2.3国家之间的贸易战在国际贸易中,各国会根据比较优势理论进行分工,并参与国际贸易,各国都希望出口自己的优势产业,保护本国的劣势产业,提高其在国内市场的竞争力。如果两国都实行自由贸易政策,此时两国互相利用资源,利益互增。但是,一国为保护国内比较劣势产业会限制进口,实行贸易保护政策,在两国同时实行贸易保护政策下,两国会产生相应的贸易摩擦,此时会使两国利益都受到很大损失。
2.4经济制度的制定
囚徒困境给了这样一个重要的结论:一种制度安排,要发生效力,必须是一种纳什均衡,否则这种制度安排便不能成立。
3. 走出囚徒困境囚徒困境问题中“理性人”的个人利益与集体利益相矛盾,使得在追求自身利益最大化的同时忽略了集体利益,并造成了帕累托低效率,在现实经济问题当中,要走出囚徒困境,最重要的问题在于解决个人利益与集体利益冲突的问题。
3.1重复博弈
在静态博弈中,作为纳什均衡的结果,两个囚犯都会选择策略(坦白,坦白)。在重复博弈中,如果博弈的次数是有限的,最终的均衡结果仍为(坦白,坦白)。然而在无限次的重复博弈中,参加者更需要考虑的是重复博弈后取得的平均收益,而不是某一次具体对局的结果,每一次对局的历史都影响着双方下一次对局的策略选择。如果不存在贴现因子,则会出现双方都选择抵赖的结果;如果存在贴现因子,当贴现因子足够大时,双方都会重视未来各期的收益,此时也会出现(抵赖,抵赖)的结果。因此,在无限次重复博弈中,囚徒困境的问题可能会得到解决。
3.2合理的奖惩制度和选择性的激励
设立相应的法律政策或者对参与者行为进行监督,奖励合作一方,对于不合作一方给予超过其不合作收益的惩罚,使其没有动力偏离合作,从而协调个人利益与集体利益的矛盾。同时,可以选择性的奖励为集体利益做出贡献的人和惩罚“搭便车”的人,以此来解决公共品的供给不足问题。
3.3可置信的威胁
如果没有相应的约束机制,参与者都没有动力去遵守“同盟”约定,囚徒困境的问题仍然得不到解决。如果一方做出可置信威胁的承诺,另一方相信威胁的存在,则会选择合作,使得合作成为博双方的均衡解,从而使得参与者走出囚徒困境。
参考文献:[1]张维迎《. 博弈论与信息经济学》[M],上海:上海三联出版社,2004(11).
[2]马本江、邱菀华《论. 摆脱囚徒困境的途径》[J],生产力研究,2004(10).
[3]卢现祥,朱巧玲《. 新制度经济学》[M],北京:北京大学出版社,2007.
[4]谢识予《. 经济博弈论》[M],上海:复旦大学出版社,2007.
作者简介:贾姣姣(1987.10-),女,河南许昌人,四川大学经济学院09级数量经济学硕士,研究方向:数理经济学。
(作者单位:四川大学经济学院)