设为首页收藏本站

泰安论坛

 找回密码
 注册会员

QQ登录

只需一步,快速开始

快捷登录

搜索
显示全部楼层 收藏
查看: 6195|回复: 2

今天我们来讲一讲博弈论,“双赢就是中国赢两次”

[复制链接]
 

发帖IP:中国山东泰安

2万

帖子

1685

威望

4万

银币

四品知府

Rank: 19Rank: 19Rank: 19Rank: 19Rank: 19Rank: 19

 楼主| 发表于 21-10-25 14:46 | 显示全部楼层 |阅读模式 | 来自山东

今天我们来讲一讲博弈论,“双赢就是中国赢两次”这句话最早的出处在哪里?现在已经不重要了,我们没必要用《说文解字》的那一套方法来继续纠结这一类的小问题。考据学是一种治学方法,对于材料的必要考据,有助于加深对理论知识的理解,但是,不要为了考据而考据,不要做无聊的考据,不要像孔乙己一样学“茴香豆的茴到底有几种写法”这么low的学问。


我们要了解博弈论的历史,了解博弈论的历史,就是用考据学的治学方法来理解博弈论以及双赢的概念。


第一:博弈论


什么是博弈?具有竞争或对抗性质的行为称之为博弈行为。象棋、围棋、赌博、游戏等等都是博弈,在英语里称之为“game”。


赌博


博弈论,就是对策论,简单来说就是:研究在游戏中获胜策略的理论。


博弈论实际上有两个重要的概念,一个是零和博弈,还有一个是非零和博弈,我们通常所说的双赢,其实就是非零和博弈。


关于零和博弈和非零和博弈的概念,我们也用最简单的语言来解析一下:



博弈论的最早研究者恩斯特·策梅洛


零和博弈,是指非合作博弈,博弈双方的利益之和为零,一方有所得,另一方必有所失。最典型的零和博弈就是赌博,两个人玩赌博,就是一方要赢钱,另一方要输钱的,所以,我们处理事情,不能有赌徒心理。


象棋不是零和博弈,因为无论是中国象棋,还是国际象棋都存在和局的情况,和局其实就是指非零和博弈。当然,和局的前提,必须要建立规则,双方在遵守规则的情况下,才可能有和局,如果都不遵守规则,则不可能出现和局。


玩吃鸡游戏,则不可能出现和局,打到最后,必有一个队会吃鸡,胜利只属于吃鸡的那个队,因此,绝大多数的电子游戏,不存在零和博弈的可能。(青少年不能沉迷于电子游戏)


从某种程度上来说,象棋中的和棋就是非零和博弈,自己的幸福不一定是建立在他人的痛苦之上。但是,和局并没有让双方都得到好处,因此,严格来讲,非零和博弈,就是指自己所得到的利益,与另一方所失去的利益,大小不一定相等。非零和博弈在人类的经济活动中是非常常见的,非零和博弈其实就是双赢。


第二:囚徒困境


为了更好地理解非零和博弈,我们用“囚徒困境”这个实验来说明,1950年,就职于兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔做了这个经典实验。


警察逮捕了甲、乙两名嫌疑犯,但是呢,没有足够的证据指控他们有罪,于是,就把甲和乙分别关进了两个牢房,让两个人无法串供,然后,警察分别和这两个人会面,并给他们三个选择:



囚徒


第一,如果甲乙双方,有一人认罪,并提供证据指控对方,并且在对方保持沉默的情况下,那么,认罪的一方,立即释放,而沉默的一方,将被判10年有期徒刑。


第二,如果甲乙双方都保持沉默,什么话都不说,那么,双方被都会被判半年有期徒刑。


第三,如果甲乙双方都互相检举,指控对方有罪,那么,双方都会被判5年有期徒刑。


列位,如果是甲乙双方中的一员,大家该如何选择?


实际上,每个人在经过理性的考虑之后,都会选择检举对方,然后,要么立即释放,要么被判5年有期徒刑。为什么没有人选择第二种方案呢?第二种方案其实是最好的,互相都保持沉默,这样双方的利益都最大化了。但是呢,每个人在经过理性的考虑之后,往往是不愿意沉默的,因为你一旦沉默,就意味着另外一方可能检举你,他立即释放了,而你就会被判10年有期徒刑,但是,如果你不沉默,选择检举对方,就意味着第一种方案(最优)和第三种方案(居中)就会出现,即:你要么是立即释放,要么就是被判5年有期徒刑,但是,绝不会被判10年。在双方都追求各自的利益最大化时,都互相检举了,然后,他们都被判了5年有期徒刑。


双方都各自追求利益最大化,然后,都被判了5年有期徒刑的结果在经济学领域也被称之为纳什均衡。


如果甲乙双方选择合作,都保持沉默,那么,双方被都只会被判半年有期徒刑,这种结果,符合双方的整体利益,达到了双方整体利益的最大化,这在经济学领域被称之为帕累托最优。


囚徒困境的实验,证明了纳什均衡与帕累托最优,是冲突的,当每一个人都追求自身的利益最大化时,整体的利益不一定是最大化的。


意大利经济学家帕累托


在司法活动中,警察当然是极力避免双方串供(合作)的,但是,在实际的经济活动中,人们是可以互相合作并达到帕累托最优的,这就是合作的意义,也是双赢的真实含义。囚徒困境引起的双方都互相检举的行为,也可以称之为“双输”,即参与博弈的双方都互有损失。


第三:合作的意义


在市场经济体制下,市场是优化资源配置的决定性力量,市场交换的结果一定是帕累托最优的,也就是非零和博弈,即博弈双方存在合作的可能性,双方得益之和是一个不确定的变量,而不是零。


为了理解帕累托最优,我们也来举一个例子来说明:


社会上同时存在一个百万富翁和一个将要饿死的乞丐,并且这个乞丐没有任何的资源和服务,可以提供给这个富翁,富翁要不要给一块面包给这个乞丐呢?显然,是不需要的,因为富翁给了这个乞丐一个面包之后,他没有任何的资源和服务返还给富翁,富翁干嘛要施舍一块面包,把钱无偿转移到乞丐的身上呢?不给乞丐一块面包,就是帕累托最优,即非零和博弈。


但是呢,这个乞丐因为得到这块面包之后,而活命了,乞丐的福利和幸福感就极大地提高了,那么,富翁就应该施舍一块面包给这个乞丐,从这个意义上来讲,这也是帕累托最优和非零和博弈。


非零和博弈、帕累托最优,在中国古代历史上,最经典的案例,就是宋太祖的杯酒释兵权。


北宋建隆三年(公元962年)七月初九日,赵匡胤在退朝之后,单独留下石守信、高怀德、王审琦等高级将领宴饮,酒至半酣,太祖说:“我非尔曹不及此。然吾为天子,殊不若为节度使之乐。吾终夕未尝安枕而卧。”石守信问宋太祖为何如此?太祖又说:“是不难知矣。居此位者,谁不欲为之?”石守信等人听了这句话之后大惊失色,连忙说道:“陛下何出此言,如今天命已定,谁敢再有异心?”太祖又说道:“人孰不欲富贵,一旦有以黄袍加汝之身,虽欲不为,其可得乎?”



宋太祖赵匡胤


石守信等人顿首涕泣,希望宋太祖指一条生路给他们,宋太祖说:“人生驹过隙尔,不如多积金,市田宅,以遗子孙,歌儿舞女,以终天年,君臣之间,无所猜嫌,不亦善乎?”


第二天,这些高级将领们都称病不朝,纷纷表示要辞职,然后,宋太祖给了他们优厚的待遇,广置田宅、歌儿舞女,颐养天年。宋太祖和石守信等高级将领之间,实现了非零和博弈、帕累托最优,即双赢,避免了“黄袍加身”的一幕再度重演,从而彻底结束了五代以来的动荡不安。


帕累托最优的概念,最早是由意大利经济学家、社会学家维尔弗雷多·帕累托发现的,帕累托后来还发现了帕累托法则。帕累托法则就是八二法则,因为帕累托发现了一个有趣的自然现象:80%的豌豆产量来自20%的植株,与此同时,他还发现了有趣的经济现象:意大利约有80%的土地由20%的人口所有。


帕累托法则在很多领域都被应用了,比如,在企业管理领域,人们发现80%的销售额来自20%的客户。


帕累托法则的发现实际上就是证明了人类是无知的,16世纪至17世纪发生的科学革命的意义就是承认了人类的无知,正如以色列历史学家尤瓦尔·赫拉利在《人类简史》一书中所说中的那样,“现代科学是一套独特的知识体系,独特之处也就在于公开承认这‘整套体系’都对一些‘最重要的问题’一无所知。”


经济学是一门社会科学,社会科学也是科学,在市场经济体制下,市场是优化资源配置的决定性力量,这一点我们必须要承认,充分发挥市场的作用,就是承认人类的无知、尊重客观的科学规律,市场经济是人类在经济活动中自然产生的规则秩序。


但是,市场有的时候也会失灵,市场失灵从某种程度上来说并不是因为市场经济本身自然产生的规则秩序导致的,而是受到很多人为因素的干扰而导致的,是人的非理性选择导致的,比如:垄断、交易成本和信息不对称、强买强卖等等,市场失灵就需要发挥政府的作用。


1982年,经济学家在德国的科隆大学又做了一个著名的实验,称之为“最后通牒博弈(Ultimatum Game)”。古典经济学家和新古典经济学家,都支持自由市场经济,反对政府过度干预经济,反对凯恩斯主义经济学的相关学说,并且假设每个经济人都是理性的。但是,这个“最后通牒博弈”彻底颠覆了新古典经济学的一些说法。


英国新古典经济学家阿尔弗雷德·马歇尔


这个实验有两名参与者甲和乙,现在有100美元准备分配给甲和乙,如果两人中的一人提出一种资源分配方案,获得了另外一个人的同意,那么,就按照这种方案进行资源分配,如果另外一个人没有同意的话,那么,两人什么都得不到。按照古典经济学家和新古典经济学家的说法,假设每一个人都是理性的经济人,并且追求利益的最大化,那么,甲提出的方案,一定是自己拥有99美元,然后分1美元给乙。但是,实验的结果,颠覆了古典经济学家的认知,甲自己得到99美元,乙得到1美元,乙就会觉得自己受到了侮辱,他干脆就不要这1美元了,只有当甲给出足够多的资源(30美元或40美元)给乙时,乙才会同意这个方案,因此,分配方案,是趋向于每个人都得到50美元的。


在采集部落社会中,人类学家也观察到了相同的现象,一个男人出去打猎,获得了一只野鹿,他会将这只鹿分给每一个人。灵长类动物黑猩猩也是如此,一只黑猩猩抓到猎物,同样也会分享给每一个伙伴。这个问题说明了动物之间的交流,是非常复杂的,而不仅仅是依靠简单的冷冰冰的数学工具。


因此,双赢不是一个人赢两次,而是互惠互利。我们要承认人类的无知,“现代科学是一套独特的知识体系,独特之处也就在于公开承认这‘整套体系’都对一些‘最重要的问题’一无所知。”孔子说:“知之为知之,不知为不知,是知(智慧)也。”



发帖IP:中国上海

4318

帖子

197

威望

9275

银币

七品知县

Rank: 13Rank: 13Rank: 13Rank: 13

发表于 21-10-25 16:59 | 显示全部楼层 | 来自上海
三胖一家的教授都是高级砖家级别的兽

发帖IP:中国山东泰安

7545

帖子

85

威望

9777

银币

六品通判

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

发表于 21-10-26 10:17 | 显示全部楼层 | 来自山东
您需要登录后才可以回帖 登录 | 注册会员

本版积分规则