6.0 前言
本文介绍一下多Agent交互过程中的一些概念,并且我保证能给你在人类社会中的工作生活学习带来启发。
6.1 效用和偏好
6.1.1 不知道什么是效用?那我告诉你什么是边际效应递减!
想象一个人,他总资产只有1块钱,然后你给他100万,他是不是会很开心?
然后你再想,一个人,他总共有1亿元,然后你给他100万,他会很开心吗?最起码没第一个人开心,都不用在银行存多久,银行经理就会屁颠屁颠的跑过来跟你谈买理财产品了,那绝对就不止100万了。
然后想象一个人,他负债5亿美元(别问为啥负债就变成美元了),你给他补100万美元,他会好受一点么?当然。
但你再想一个人,他负债刚好100万美元,你给他补完,他不欠钱了,他会好受的,而且肯定是比第一个人好受。
所以效果如图:
这就是效用的特点,而且这也解释清楚了边际效应递减是什么样的。
6.2 多Agent相遇
6.3 优势策略与Nash平衡
6.4 竞争与零和交互
6.5 囚犯两难
囚徒困境,这个概念是不是听烂了,以至于听到都不感到新奇了。是不是?然而,它背后的传达的理念可是很坏的,那就是人类存在这种情况,不要合作啦!不合作对双方都好!那些道学家就叽叽歪歪:“哎呀!天要塌了!这世间还有不和睦共处的理吗!!!”别急,我们接下来看:
6.5.1 人们不全是思想家
首先就是很多情况下,确实是这样,都不合作反而能更有好处。但人们不常常都是理性的,或者换句话说“吃亏是福”。
6.5.2 另一个囚犯是我的孪生兄弟
参见困境的两人出生下来就没有分开过,配合默契,思考同步。这种情况下,自然是都能逃脱法律的制裁啦。
6.5.3 人不是理性的
感情一冲动,我就是不招!你打我啊你打我啊~
6.5.4 未来的阴影
咱就是说,我们不是只玩一轮,是玩很多轮,并且这一轮记得上一轮的合作情况。我们看书上对这个是怎么分析的:
6.5.5 Axelrod的比赛
总结就是什么呢?做了实验,有几个der,发现最能来事的那个der,就是首先合作,然后模仿对手的行为做策略的。
所以总结出来做人来事的原则是什么呢?
6.6 其他的2*2对称交互
6.6.1 猎鹿游戏
6.6.2 小鸡游戏
6.7 多Agent系统的依赖关系
6.8 注释和进一步阅读
习题