| 博弈是一种选择 |
1 博弈与不确定性
1.1 博弈的奥妙在于不确定
博弈从字面上来看,包括“博采”、“赌博”“对弈”两个内容,都是具有不确定性的活动,博采成功的概率奇低,对弈要看对手是高手还是低手,即使是低手也有可能让你放松警惕而“大意失荆州”,所以都是不确定的。
在博弈中,最大的不确定性来自于对对手的非常有限的了解,如果有博弈者象“诸葛亮智算花容”那样对敌人的决策、判断了解的那么透,就不用博弈了,你肯定是胜利的一方,“知己知彼、百战不殆”,《孙子兵法》在2000千年前就这么论述了。
1.2不确定性的描述
不确定性就是从你了解到对象的信息不足以得出事情发展的结果的情形。在通常情况下,我们在平原地区,水烧到100度左右就开了,这是确定的。但你随手抛掷一枚硬币到桌上,国徽还是字朝上,则是不确定的。有一门科学是研究事件发生的不确定性的,就是“概率论”。
如果事件的结果是有限个的话,比如“国徽朝上”、“字朝上”两种,我们可以通过大量的重复试验,比如抛掷硬币10000次,然后计算国徽朝上的次数。大家都知道,应该有5000次左右是国徽向上,这样就给出了一个概率的概念,
A事件发生的概率p=事件A发生的次数/试验总数
对于抛硬币这样的事件,如果硬币不是特制的魔术币,一般情况向上、向下的概率相等,为1/2。用这样的方法我们可以计算很多概率:
比如,一副扑克,去掉大猫、小猫,共52张,任意抽取3张,其中三张同为A的概率有多大,三张同花色概率有多大,等等,这就是平时大家玩“扎金花”的赌博游戏。发生概率的大小依次为:豹子、同花顺、顺子、同花、对子、杂牌。5个人玩,相当于任意抽取15张牌分5组,如果你拿了豹子,基本上可以确定你是第一大牌,当你拿了豹子,别人也拿豹子的概率非常之小,几乎可以不计,但也有发生的时候。
生活中我们对不确定的事件,一般也能形成一种判断,比如,“人生苦多乐少,不如意之事十有八九。。。。。”这是金庸《笑傲江湖》的西湖梅庄大庄主临死前说的话,也算一种对人生不确定的事件进行概率计算的结果。
但人类大脑的思维,经常表现为回避不确定性的,有非理性的倾向,可能经历中“好事多磨”对大脑形成了不良的激励。
问题:如果让你选择,
A 接受100美元的馈赠;B 以50%的概率抽取300美元的抽奖;
那么,你会选择那一个?
很多人都选择了A。并不是大家不懂数学,而是生活中的不确定性太多,为解决不确定性可能要花费很高的信息成本,所以简单的选择就是A。(现代经济学中有一个分支是专门研究人的非理性的,行为经济学。2003年诺将授予卡尼曼、特维斯基教授)。
人类的感情生活中的不确定性更多,因此,需要更多的理性来分辨、处理,这里有首歌《雾里看花》:
“雾里看花 水中望月,
你能分辨这变幻莫测的世界?
涛走云飞 花开花谢,
你能把握这摇曳多姿的季节?
烦恼最是无情夜,
笑语欢颜难道说那就是亲热?
温存未必就是休贴,
你知哪句是真 哪一句是假?
哪一句是情丝凝结?
借我借我一双慧眼吧,
让我把这纷扰,
看得清清楚楚明明白白
真真切切”
在二人博弈中,每个人对对方的感情把握都是模糊的,不确定的,因此,为一点点小事都会苦恼异常。这种感受,凡是有关感情经历的人都有深刻的苦涩(甜蜜)的体验。所以那英这首歌,很快就唱红了。
但是,这双慧眼,谁能借给你呢?
如果我说大家都来学习博弈论好了,可能没有人有意见吧。
2 博弈的局
当我们把博弈提升到一种理论,实际上已经进行了很多理论上的假设和抽象,把生活中的人类在与其他人共同竞争、合作等关系处理中的选择问题,抽象归纳为理论模型,这样就是博弈中的“局”。局的概念设定了博弈的背景条件和规则,“当局者迷”说的就是大家局限在具体的环境条件中,理性思维受到干扰,不能很理性的把握“局”的本质问题。
在生活中,我们很多情况下不能处理好一些关系,就是对“局”的认识不够,比如企业里部门经理总觉得总经理的秘书过于飞扬跋扈,一个大专生,刚工作几年,哪里来这么大的脾气?后来发现秘书是董事长的丫头,部门经理一下子懊悔万分。这样看公司的局,一下子就有了新的看法。
如何把生活中的局,提炼成理论,我们看看下面的几个例子。
2.1 囚徒困境
两个小偷作案未遂,被抓起来,警方怀疑他们是几个月前另一个案子的罪犯
决定对其进行各个击破,将他们隔离起来。给他们的政策是:
“如果都坦白,把赃物交回,罚款100;”
“如果坦白,对方抗拒,则罚款50;”
“如果抗拒,而对方坦白,罚款1000;”
“如果都抗拒,则释放”
这样,对每个小偷都面临一个选择问题,怎样选择才能使得自己损失最小。博弈论把这个问题归纳成著名的囚徒困境问题。
坦 白 -100, -100 -50, -1000
抗 拒 -1000, -50 0, 0
从小偷的决策问题,我们看形成博弈的局需要几个假设:
局中人的假设
博弈论中,我们都假设局中人是绝对自私自利的人,唯一的追求个人的收益
最大化、损失最小化,而不考虑其他因素。生活中的人可能考虑很多因素,如情感、好恶等等,但科学抽象的结果,我们假设居中人都追求个人利益的最大化。
局中人的理性
博弈论中一般都假设博弈方都相当聪明,能在已知条件下追求个人利益的最
大化,即,对手不会犯愚蠢的错误。历史上很多战争中,都有“大意失荆州”的案例,其中关键的因素是低估的敌人的智力。博弈论中假设都是聪明的人,每个人都有足够的理性来玩。
信息条件
信息条件指每个博弈方掌握博弈的游戏规则以及对对手的了解情况。这里引入一个概念:完全信息。
完全信息指每个博弈方了解自己、对手的选择、每种选择后双方的收益情况。即,熟悉游戏规则。但对对方究竟如何选择,并不知道。因此这里的完全信息也不是说你对敌人的祖宗三代、个人嗜好什么都知道,你仅仅知道对手是个聪明的、自私自利的人,也知道在这一局中由于两个人的不同选择而得到不同的收益。
非合作
在警察审问小偷过程中,两个小偷的选择都是独立选择的,没有合作窜供的
可能,因此,这种博弈称之为非合作博弈。
静态
静态博弈也是一个新概念:相对于下棋一类的博弈而言,小偷可能被审问几次,但都不知道相关的对方信息,和经过深思熟虑之后的一次选择是一致的。这样的博弈,博弈方一次选择,称为静态博弈,主要相对于下棋中双方根据对方的选择不断进行新的选择而言的。
现实生活中没有绝对的静态博弈,但是很多情况下,当你在一段时间内进行独立选择之后可以近似的看为静态博弈,这是一种理论上的抽象。
静态博弈一般相对于动态而言,什么是动态呢?就像下棋,每个棋手总是不断根据对方的招数改变自己的应对,所以是动态。
2.2 博弈的分类
从上面的分析中,很多读者已经通过联想,想到了很多博弈模式,例如,完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。但是,博弈论一般不研究合作博弈。这和生活中的情况有很大的出入,生活中,小孩子成长过程培养和别人的合作是一个重要的内容,一个人如果不同别人合作无法取得事业的成功。当然,真正的成功认识需要独立的思考和选择,特别是从事领导工作,更像是在搞博弈。
3、博弈方的选择
从前面的分析指导,博弈本质上是博弈方根据信息进行的一种理性的选择。博弈论对每个人的选择称之为“纯策略空间”。为什么叫空间?这里的意思大概指选择范围吧,“纯”是什么意思呢?则是相对于后来的“混合策略空间”而言。
3.1 纯策略
纯策略就是指博弈开始设定的每个人有几种选择,如囚徒困境中的小偷,只有“坦白”、“抗拒”两种选择。
3.2混合策略
混合策略要用到概率的概念。如小被警察抓住的小偷,他是否坦白也许和心境、对同伴的认识、身体状况决定,如果我们用数学语言来描述,可能有这样的结果:
坦白的可能性是60%,抗拒的可能性是40%。
在某种意义上,这也表示了一种模糊的选择。那么如果假设另一个小偷的选择是:
坦白的可能性是50%,抗拒的可能性也是50%
这两个人博弈的结果中,各自的收益是多少?
这个计算不是很复杂,但需要体会其逻辑思路:
坦 白 -100, -100 -50, -1000
抗 拒 -1000, -50 0, 0
我们看小偷甲。
在坦白的情况下,其收益为:(-100)×0.5+(-50)×0.5=-125
其中,0.5是小偷乙选择的概率。
小偷甲抗拒的情况下,其收益为:(-1000)×0.5+(0)×0.5=-500
由于小偷甲的选择坦白和抗拒的概率分别为0.4和0.6
可以算出小偷甲的收益为:0.4×(-125)+0.6×(-500)=-350
怎么选择,其收益都是负的,让人想到一句歇后语“贼娃子打官司,场场输”。
用同样的办法,我们也可以算出小偷乙的收益值。这种方法,是我们对不确定性的估计的常用方法,也是博弈论的基础。很多人可能想,现实生活中,我们从来不计算概率来决定我们的工作或者生活,其实你每日每时都在使用概率论,是你不自觉罢了。生活中有很多不确定性的东西,人的理性把握一般分为可能发生、不可能发生、很可能发生、一定发生几种,概率在0.3-0.5一般为可能发生,0.5-0.7一般为很可能发生,0.8以上的时候为大概率事件,特别是超过0.9基本上是肯定发生了。
尽管对概率有判断,但真正作出决定的时候,还受情绪状态影响。如果正好春风得意,“小乔初嫁”,那么对于有利的事情,判断其是否发生时候,可能倾向于事情都会向好的一面发展。沮丧的时候,容易认为好事不容易发生,坏事尽管概率不高也肯定发生。“屋漏偏逢连阴雨,船破适逢打头风”,就是这种心境的写照。范仲淹的《岳阳楼记》超越了这种个人感触的限制,所以成了一篇名作。当然,其突破是进入了一个更高的道德范畴“仁”的境界,而不是更理性的算计自己的得失,这是我们要讲清楚的。
3.3 策略空间
博弈论中的策略空间,一般指得是博弈方对所有可选择的对象中,可能选择的概率组合,例如(坦白,抗拒)所对应的(0.4,0.6)。
|
|