注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

天地不仁,以万物为Googol!

天行有常,不以物喜,不以己悲……

 
 
 

日志

 
 

《合作的进化》  

2009-01-23 23:08:34|  分类: 积累 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
恩……《合作的进化》这书看完了很久了,几次想动笔写下点什么,但每次打开页面都觉得其实也无甚可写——书里的结论清晰明了,我总不能再抄一遍书吧……不过,想来想去,这里空着也是空着,还是写点什么吧。

先给出结论:多次重复囚徒博弈环境下,善意的一报还一报策略在众多“人能想出来的的策略“里表现最佳。同时,在边界遵循多次重复囚徒博弈的群体边界演化博弈中,一报还一报依旧表现出众。

这里的表现最佳是指,在与其他所有策略的博弈足够多次后,一报还一报的平均收益最高;表现出众是指,在足够时间的群体边界博弈后,使用一报还一报策略的群体数量,在所有策略里排名第二。

原因是,一报还一报兼具:善良,策略清晰,可被激怒。善良是指,一报还一报以合作为开端,在博弈中不主动背叛;策略清晰是指,一报还一报的策略很容易被对手识别出来;可被激怒是指,当对手背叛时,一报还一报立刻在下一轮以背叛作为惩罚。

再细节的展开,请去查书。

有一个值得注意的结论,一报还一报之所以如此有效,是因为这种策略实际是在引导,甚至是强迫对方合作,而不是拼命的打压对方。在单次博弈中,一报还一报因为从不先背叛,因此永远比对方的收益低,但由于绝大多数策略(包括所有的善良策略和根据博弈历史伺机背叛的投机策略),在经历足够多轮博弈后,都可以识别出一报还一报的策略,并察觉只有双方的合作才能保证自己收益最大化,使得在博弈到一定次数后,进入双方默认合作的底部,或者对方偶然背叛,紧接着再示好以求合作。这正是现代社会追求双赢的一种数学模型。如果双方都能认识到合作而不是在某次博弈中背叛以谋求局部利益最大,这时才真的能把自己的收益最大化。

另一方面,评判策略是否有效的标准,并不是在博弈中的双方谁的收益大,而是在和同等策略的博弈下,哪个策略的收益大。囚徒博弈和零和博弈不一样。零和博弈里,由于总收益不变,因此互相博弈的两个策略可以根据互相的收益状况来判定优劣,但是囚徒困境这类非零和博弈有个最大的不同,根据双方的策略,总收益是变化的。也就是说,虽然在某种策略下,A可以胜过B,但如果换一种策略,虽然可能A和B的收益一样,甚至B的收益更多,但是与之前A的策略比起来,A和B都可以获得更多的收益,也就是说,B新得的收益并不是来自A(相反,A所失掉的收益也并没有给B),因此这种”比对方好就是好“的思想,在这种博弈环境下是错误的。

不过,这个博弈模型没有考虑到可能有的合作的噪声,比如想法可能被错误的实施,或者被误解,导致本来的合作变成了背叛这类情况。《合作的复杂性》一书里有提到。但是这本书考虑现实的因素太多,虽然结果和事实相符,但似乎少了数学的简洁明快,没有《合作的进化》看起来有意思。

最后……我想写的基本都写到了,但是组织的不好,大家凑合看吧……《合作的进化》,力荐给各位。
  评论这张
 
阅读(790)| 评论(12)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017