一. 什么是博弈论?
博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
博弈论就是描述和研究行为者之间的策略相互依存和相互作用的一种决策理论。
博弈实际上就是如何在现有条件下做出最优选择的一种策略。
博弈论也叫做对策论,或称赛局理论,是研究具有斗争或竞争性质的现象的理论和方法。可以简单的说,博弈论就是运用你的智慧和理性思维,在纷繁的选择中能够使你的利益达到最大化的一门科学。
二. 博弈的基本概念
1、参与人(players):一个博弈中独立决策、独立承担结果的主体。
2、策略(actions or moves):参与人在博弈的某个时点的决策变量。
3、得益或支付、报酬(pay off):指在一个特定的策略组合下参与人得到的确定效用水平,或者是指参与人得到的期望效用水平。
4、博弈的结果(result):顾名思义。
博弈的分类, 从行动的先后次序来分,博弈可以分为 静态博弈 和 动态博弈。
静态博弈指在博弈中,参与人同时选择行动,或虽非同时但后行动者并不知道前行动者采取了什么具体行动;
动态博弈指的是参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动的博弈。
三. 著名的“囚徒困境”
警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境和面临的选择:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判10年徒刑;果两人都坦白认罪,则他们将被各判8年监禁。问:两个罪犯会如何选择(即是坦白还是抵赖)?
站在囚徒B的角度,如果囚徒A坦白, 他选择坦白的代价是8年,选择不坦白的代价是10年,显然会选择坦白更优。如果囚徒A不坦白,他选择坦白的代价是不用坐牢,选择不坦白的代价是1年,因此最优选择也是坦白。
因此囚徒B经过衡量,最佳选择都是坦白。囚徒A同理,也按相同的逻辑,选择坦白。最终两人都被判8年。殊不知,如果两人都约好不坦白,他们都只需被判1年,但他们没有得到警察给予的机会事先约好一致:不坦白。虽然得到了自己的最优解,但并非是两人共同的最佳选择。这就是博弈得到的结果。
四.个人感悟
1.对于个人最优的选择,但对整体来说可能不是最佳结果。
比如,我们给客户报价,如果大家都往低的价格报,低价可以帮助自己中标,但对整个市场来说,以后就会进入恶性循环,带来的集体利益受损。个人利益的最大化,并没有带来整体利益的最大化。
这个社会往往在不同阶段,因为各方的争夺而处于那个阶段的相对平衡,即纳什均衡。比如大国之间的博弈,不同时期的房地产调控,都在反复博弈。
2.博弈的思维:做事需要提前考虑对手的反应,甚至预估到后面发展的两三步,甚至五六步。
比如,与领导或员工沟通,就需要预估到自己说出的话,可能会带来什么结果,面对可能的结果,处理方式是什么?类似下象棋能看五步,就是一种博弈思维。高手过招,仿佛一切都在运筹帷幄之中。
借用《老子·道德经·第三十三章》
知人者智, 自知者明;
胜人者力, 自胜者强。
了解他人的人,只能算是聪明。能够了解自己的人,才算是真正的有智慧。能够战胜别人只能算是有力,能够战胜自己才能算是真正的强者。
小胜者术, 大胜者德。
坚持以德为主,以术为辅。人的成功七分靠德,三分靠术。如果想要取得很小的胜利,那么,只需要有智慧就可以了,但是,如果想要取得更大的成功,就不能只依靠智慧了,更要依靠人品。
《孙子兵法》上说,不谋全局者,不足以谋一域。
想要取得大成功,就要长远的目光,豁达的胸怀,不能专注于自身细小的得失。
人到最后,拼的是人品,徒有聪明的人,只看重短期利益,人品好的人,却看得更加长远。
在IT职场中,国林哥遇见过各类性格的同事,真正把自己职业生涯走好的人,离不开综合素质,所以千万不要认为掌握一门技术就可以保证自己的位置,殊不知自己的一言一行都在影响着未来的职业发展,与职场伙伴们共勉!