当前位置:首页 > 柯维洞见 > 柯维思想体系漫谈|双赢思维中的博弈论思想
柯维思想体系漫谈|双赢思维中的博弈论思想
在给客户授课的过程中,我发现有一些学员对于“双赢思维”的可行性心存忧虑,认为这过于理想,只是一种“宣传口号”。在这篇文章中,我想结合一门与此话题有密切关系的学科——博弈论,来解读柯维先生在“双赢思维”中所提出的主要观点。

熟悉七个习惯的朋友们都知道,习惯4双赢思维是提高人际效能的核心习惯,它一方面以习惯123所构成的“个人成功”为基础,另一方面也是培养习惯5知彼解己和习惯6统合综效的思维起点。


在给客户授课的过程中,我发现有一些学员对于“双赢思维”的可行性心存忧虑,认为这过于理想,只是一种“宣传口号”。在这篇文章中,我想结合一门与此话题有密切关系的学科——博弈论,来解读柯维先生在“双赢思维”中所提出的主要观点。




博弈论(Game Theory),又叫“对策论”,是一门以数学为基础,同时结合行为学、心理学等的交叉学科。“博弈”在中国古代就是下围棋的意思,就像棋手的思维一样,这门学问研究的就是在考虑对方决策的前提下,怎样做出最佳决策以实现目标的过程。博弈论的创始人是匈牙利裔美籍数学家和计算机科学家——冯.诺伊曼。传说他的智商比爱因斯坦还要高。在二战末尾时期,美国在研发第一颗原子弹的过程中遇到了数学难题,正是冯.诺伊曼突破了难题,同时还协助研发了全世界第一台电子计算机ENIAC。直到今天我们用的电脑全部都是基于“冯.诺伊曼架构”。




而七个习惯所研究的是人际关系,怎么会跟博弈论发生关系呢?


你还记得柯维先生提出的“互赖”(Interdependency)概念吧?人类社会中,每个人为了实现自己的诉求,必须与他人缔结或长期或短期的各种关系,这种现象就是“互赖”。而每一种互赖关系都可以看成是一个“博弈”的过程。人们在处理人际关系时都有自己的习惯,柯维先生谈到了其中最常见的四种:双赢,赢输,输赢和双输。从博弈论的角度来看,每一种习惯就是一种“博弈策略”,关系中所有利益相关人的策略共同决定了最终的结果(比如问题解决方案或利益分配方案)。所以,博弈论中的很多模型、结论和工具都可以移植过来解读人际关系。


比如,很多培训老师在讲解双赢思维时都会采用一个体验性的游戏,叫做“X/Y游戏”或者“红牌/黑牌游戏”,不管叫什么名字,这个游戏的根源就来自博弈论中最著名的思想实验——囚徒的困境(The Prisoner’s Dilemma)。


囚徒的困境是在上世纪50年代由两位研究博弈论的数学家设计出来的一个实验,它的具体描述大家可以自行搜索查询。简单地讲,这个游戏反映出现实人际关系中的一种非常常见的“窘境”,那就是:每个人都从自身出发,精准地计算了各种可能性,然后做出了最“理性”,也就是最能保护自己利益的决策。然而,当每个人都这样想这样做时,最后的结果从整体上却不是最优的。换句话说,每个人都为了追求自己的“赢”而做出了看似“合理”的选择,但是,最后的结果却是每个人都“输”了。这种尴尬的局面正是“困境”的含义。


除了“囚徒的困境”以外,博弈论还有一些精辟的结论,对人际关系很有启发意义。比如伴随着各方的策略和选择,慢慢地人际关系就会“演化”为某一种“平衡”状态,这种平衡没那么容易打破。


就好像在刚才的例子中,两个囚徒一旦出于某种原因进入了“双输”的对抗状态,这种平衡就不容易改变。因为每一方都会猜忌对方的动机和行为,认为即使我愿意合作,但是对方可能不但不配合反而会利用,那样我就会吃大亏,因此我宁愿保持和忍耐双输的现状。


这种“没有人愿意先改变”的平衡态,在博弈论中有个专门的术语叫“纳什均衡”。这是为了纪念美国传奇数学家约翰.纳什,他首先用数学证明了这种平衡态的存在,获得了1994年诺贝尔经济学奖。有一部20年前的好莱坞电影《美丽心灵》,讲的就是纳什先生的人生传奇。




把上面的概念推广一下,现实中的人们常常就像那些被困的“囚徒”,每个人都想争取自己的赢,但是在不知不觉之中就陷入了“双输”的纳什均衡之中。


柯维先生说:长远来看,一段关系只有“双赢”或者“双输”两种结果。从博弈论的观点来看,在某种条件下,“双赢”也可以成为一种纳什均衡。但是,这个过程必然很不容易,它需要人们具备勇气、智慧和技巧。现实中更常见的现象是陷入“双输”局面的囚徒困境。其原因就像柯维先生所说的:惯常表现遵循的是“最小阻力”(least resistance)法则,大多数人并不愿意消耗脑筋,甚至冒着有损自己当前利益的风险去追求更好的结果。只有那些真正想要追求“更高效能”的人,才会愿意克服阻力做出改变现状的尝试。


对“双赢”的追求,可以看成是在现状基础上的一种改善。柯维先生经常说“妥协”是解决问题的常见方式,而“双赢”就是不满足于最简单的妥协,而是不断追求“更优解”的过程。



这个过程也可以参照一个博弈论中的概念,来自意大利经济学家帕累托,叫做“帕累托改善”(Pareto Improvement),它的意思是在不损害一方利益的前提下,使另一方的利益有所改善(不损人前提下更利己,或者不损己前提下更利人)。显然,帕累托改善就是追求双赢的过程。从理论上讲,任何一个博弈关系中存在某种状态是帕累托改善的极致,被称为“帕累托最优”(Pareto Optimal)。但这只是个纯理论的概念,现实中,没有人事先知道这个“最优”到底在哪里。而追求双赢,就是关系中至少一方愿意摆脱“简单妥协”的诱惑,克服惰性和对不确定性的恐惧,对“帕累托最优”不断贴近的过程。


那么问题来了,真的能实现“帕累托改善”吗?蛋糕就是这么大,你多吃一口我不就要少吃一口吗?




柯维先生在回答这个问题时引用了一个博弈论的术语——零和博弈(zero-sum game),意思是一种双方损益叠加后永远是零的博弈关系。


在绝对的零和博弈中,资源和利益固定,确实无法实现帕累托改善,比如体育比赛的排名或者某些金融市场的规则。但是,从整个人类社会的角度来看,上面这些情况是非常“特殊”的,而且往往是一种人为刻意设计出来的制度。


人类社会中更广泛、自然存在的是“互赖”关系,这是任何生物赖以生存的生态系统的本质。生态系统内部并不是零和博弈,而是“正和”的。在习惯六统合综效中,柯维先生例举了森林、动物群落等很多例子。


比上面的结论更重要的是:即使一个原本看起来像是“零和博弈”的系统,在一定的条件下,也可以被发展成“正和”。这时“帕累托改善”/双赢就有了可能性。


那么哪些条件有利于“双赢”的达成呢?下面我借助博弈论中对“合作”现象的研究结论,以及柯维先生的主张,做一个简短解释。


01

重复


如果是“一锤子买卖”,博弈中的双方都倾向于让自己的当前利益最大化,此时谈“双赢”就很困难。比如,在车站、旅游景点的商品通常是价高质低,根本原因就在于一次交易。显然,如果是在长期、重复博弈的关系,比如小区的餐厅,这种做法就完全行不通。这就像柯维先生所说的:长期关系中,“赢输”思维短期带来的“赢”,往往变成了长期的“输”。所以,为了促进合作,首先自己应该注重短期利益与长期关系的平衡。然后,也要提醒对方不要只看眼前利益。如果能培养对方具备一定的前瞻性,双赢相对就容易一些。这就好比在分蛋糕时,告诉孩子们不止这一次,而是以后他俩会一直在一起分蛋糕,这时合作性就会自然涌现。


02

信誉


之前我们讲过,想要突破“囚徒的困境”,一大难点就是人们互相怀疑和猜忌,这种猜忌不但使得“纳什均衡”难以被打破,甚至会相互攻击而使局面恶化。如果你看过科幻小说《三体》中的《黑暗森林》,也许对一个概念还有印象——猜疑链。在小说中正是因为在不同宇宙飞船中的人们缺乏沟通,相互的猜疑形成了链锁反应,最终几乎导致了全军覆没的结局。这可以看成是一个宇宙尺度上的“囚徒的困境”。


柯维先生说:正直的品格是双赢的基础。如果没有信誉作为基础,“双赢”就会变成一种流于形式的空洞技巧。


信誉需要在人际交往中建立。这正是柯维先生借助“情感账户”的比喻所提出的主张,比如长期坚持信守承诺、表达尊重、明确期望等关键的“存款行为”。


在富兰克林柯维公司的经典解决方案《信任的速度》中,还提出了一个特别适用于打断“猜疑链”的沟通技巧——主动表明自己的动机。为了鼓励对方愿意摆脱囚徒困境,走上双赢之路,在沟通的最开始就要坦诚表明自己的动机是追求对双方都更好的结果,而非谋求单边利益。这样做就可以增强自己的信誉,激发对方合作的意愿。


03

升维


如果双方诉求完全都在同一个维度,那么因为利益固定,就无法实现双赢。但是,在真实的世界,每个人的诉求都是多样化的,即使同一个维度,不同人重视的程度也不会完全一样。人们通常只能看到其中最重要、最明显同时也是最直接冲突的维度,并且在此维度进行简单妥协以达成一致。实际上,如果能够发现隐性维度,进而增加利益的整体维度,就有可能通过资源的错配实现帕累托改善。这种“升维”的思想,正是柯维博士所说的:要在更高的层面上寻找“第三选择”(双赢方案)。


比如两个人分蛋糕,都想吃更多。但是,如果他们在分蛋糕之前经过充分沟通,也许存在这种可能:A更喜欢奶油的口感但觉得蛋糕太噎,B更喜欢蛋糕的清香但认为奶油有些腻。A讨厌饭后打扫卫生,B每天都收拾卫生已经习惯了……显然,类似这样的信息维度越多,创造“双赢”的可能性就越大。


这些“隐性”的信息只有通过充分沟通才有可能曝光。所以柯维先生说,双赢的基础是人的“成熟度”,也就是在冲突性的沟通中,既能理解他人的感受又能争取让他人理解自己想法的平衡。如果一个人既能“体谅”他人又有“勇气”表达自我,那么就有更大概率在沟通中获得更多维度的信息,而这构成了在后面创造帕累托改善的基础。


04

群体选择


“群体选择”本来是来自生物进化论的一个术语,意思是自然选择的“物竞天择,适者生存”的法则不但作用在生物个体身上,也会作用于生物群体这个层级上。那些能更好地在内部合作的动物群体,虽然每个个体都做出了牺牲,但是群体有更大几率生存、繁衍和扩大。相反,如果一个群体内的个体互不合作,一味倾轧,虽然那些胜出的强势而自私的个体暂时获得了更多资源,但是这个群体却会在与其他群体的竞争中慢慢落败,从而被自然选择淘汰并消亡。


人类社会中的商业现象也是如此。比如苹果公司在2007年推出App Store时确定了与开发者的利益分配比例是3:7,让开发者拿大头。按照苹果公司的地位当然可以修改规则让自己拿得更多,但那样app开发者的投入意愿就会降低,就有可能转投安卓阵营。那样的话,iOS生态系统就不会成长到今天这么壮观。在这个三七开的制度下,看起来苹果当年牺牲了不少利益,但是生态系统的蓬勃发展使得它在后面这些年获得了大得惊人的利益。这也就是俗话说的“把蛋糕做大”背后的博弈论原理。


柯维先生有一段现场授课视频,是他和一个壮汉掰手腕的游戏。学员不太容易看明白,从群体选择的角度就容易解释:他们两个人组成了一个生态系统(群体),如果双方是纯粹的竞争甚至敌对的态度,那么长期讲并不能让自己获得最大利益。更聪明的做法是在竞争的同时保持一定合作性,虽然短期看可能牺牲了一些利益,但这个生态系统会加速发展,从而在市场中赢取更多总的利益,这也就是“通过合作把蛋糕做大”


当然,并不是每个人都同样地相信蛋糕能做大,有些人会认为蛋糕是固定的,永远不可能做大。这种思维,柯维先生称之为“匮乏心态”(Scarcity Mentality)。而那些相信蛋糕可以做大,总是有空间尝试佩雷托改善的思维,就是“富足心态”(Abundance Mentality)。伟大的发明家爱迪生有一句名言:“There is always a better way”(总有更好的办法),可以说是一种富足心态的表现。


以上就是促进合作与双赢的几个关键因素:创造长期关系(重复博弈)、树立个人信誉、增加利益维度,以及考虑群体选择。


实际上,双赢思维不仅仅是个人习惯,与当时大的社会环境也密切相关。社会的发展阶段往往能够影响人们心态的“匮乏”或是“富足”。


比如每一次革命性的新技术爆发时,老旧的生产模式被淘汰,原来的工作机会骤减,竞争的收益率严重降低,人们的心态自然倾向于悲观和匮乏,用现在流行的话来讲就是“内卷”。但是,随着时代的演进,总会有新的市场、新的工作机会被创造出来。比如蒸汽机被发明时,传统的纺织业手工作坊大批倒闭,行业内卷严重,那时的作坊从业者一定不会相信双赢。不过,随着技术的发展,在新的维度上,更加广阔的市场被无中生有地创造出来,工作和财富的机会都变得更加富足。


从这个规律出发,我觉得可以补充一个“把蛋糕做大”的观点:也许我们正身处某个特定的历史阶段,原来吃了多年的蛋糕可能已经无法做大,甚至还有缩小的趋势。这时应该提醒自己,相信人类社会发展的历史规律:蛋糕萎缩的同时,很可能新的“披萨饼”产生了。这张饼刚出现时毫不起眼,但是,在未来很多年是可以做大的。积极寻找和适应这种新的机会,就是主动积极和富足心态的体现。




这篇文章的最后,我想分享一个博弈论中很有趣的实验结论,以回答人们对双赢思维另外一个常见疑虑,那就是:坚持双赢思维长期来讲能带来更大的收益,道理我都懂,但因为说的全都是“长期”,现在看不见结果,怎么才能让我现在的信心就更强呢?


这个问题确实很难,因为验证人际关系中的长期结果可能需要数年甚至数十年的时间。不过,自从有了计算机的程序和算法以后,人们就可以方便地通过程序来快速模拟长期的结果。


美国密歇根大学有一位研究博弈论与政治学的教授,叫罗伯特.阿克塞尔罗德(Robert Axelrod),他早在1980年左右就用计算机程序模拟过囚徒困境中的博弈问题。他举办了一场“博弈奥林匹克”,向全世界征集了十几种博弈策略,简单来讲可以分成这么几类:


1. 赢输:永远对抗

2. 输赢:永远合作

3. 先善意,再看情况:从合作开始,视对方反应确定后续行动

4. 先恶意,再看情况:从对抗开始,视对方反应确定后续行动

5. 随机:合作还是对抗完全随机


罗伯特让这些程序两两混在一起,捉对厮杀了200轮,并且跟踪和统计每个策略最后的总得分。得出的结论是:


游戏刚开始时,“赢输”策略收益明显,但是,随着时间延续,“赢输”策略无法继续维持高收益,其效果被时间吞噬和抹平。有点像俗话中说的“不是不报,时候未到”。


最后收益最高的策略属于上面的第3类,也就是“先善意,再看情况”的原则。这就是著名的重复博弈中的善意优势——长期关系中,合作的收益大于对抗。


柯维先生说:双赢思维是经营人际关系的一种哲学。这个计算机模拟实验最终胜出的是一个非常简单的策略,叫做“Tit for Tat”,该策略中的四条简单原则也构成了经营人际关系的双赢哲学思想:


先表善意:保持开放的富足心态,愿意先信任对方,鼓励合作之路,并观察对方的反应。


投桃报李:如果对方愿意合作,则予以回报,争取长期维系双赢状态。


针锋相对:如果对方背叛和利用这种善意,则应该予以反制措施,避免自己利益继续受损(避免输赢思维),必要时解除这段关系(柯维先生所说的No deal 不成交)。


既往不咎:如果对方在背叛一段时间后,出于某种原因愿意重新回归合作,那么我不会因为“怀恨在心”而继续报复,而是愿意配合对方重回正轨(柯维先生所说的“愿意原谅”、“不要让今天被昨天绑架”)。


好了,让我们总结一下:博弈论是一门基于严格数学论证的科学,它可以解释人类社会中很多政治、经济的复杂现象。而七个习惯中的双赢思维,相当于是在日常人际关系中博弈论思想的应用。柯维博士用通俗的语言和故事解释了深奥难懂的数学结论。


柯维先生一贯主张遵循“原则”才能提高效能。博弈论的法则可以说就是制约长期人际关系的原则,它普遍适用,古、今、中、外影响力无处不在。希望这篇文章帮助你提升对原则的认识,在你最重要的人际关系中,持续寻求帕累托改善,取得更加双赢的理想结果。

了解更多
产品介绍
经典案例
应用工具
理论基础
公开课
研讨会
柯维洞见
相关资源
版权声明 © 2016 Franklin Covey Co. 保留所有权利 沪ICP备16035145号-1