首页 热点资讯 义务教育 高等教育 出国留学 考研考公
您的当前位置:首页正文

你若犯我,我必还之——TFT以牙还牙策略

2024-12-18 来源:化拓教育网

在一个小环境里,人和人的关系变的微妙。生态圈,无论在哪个朝代、哪个环境,一定会存在。看过这样一个录相,二个狼群,女儿率领的狼群侵占了母亲的地盘,并试图将之赶尽杀绝。母亲率领的狼群不得不远离原有的优质地盘,深入狮群的腹地谋生。但是求胜心切的女儿狼群仍然不放过她们,母亲被迫无奈下,将之引上一条不归之路。

录相很生动,加上深沉浑厚的播音员讲解,那种残酷的生存状态,剥开脉脉的温情,变成赤裸裸的生与死的竞争,面面变得生动。

合作,双方共赢。

你合作,我合作,女儿的狼群和母亲的狼群相安无事,共同抵御强大的外敌,对抗恶劣的自然环境。

但是实际的情况并非如此,背叛,你背叛,我背叛。女儿背叛在前,对母亲的狼群死追不放,最后母亲不得不出手,设置陷阱。

这段珍贵的视频,让人唏嘘感慨。

听起来是不是很耳熟?是的,这是《跃迁》中的片段——TFT以牙还牙策略。

1980年,密歇根大学学美国政治科学教授阿克塞尔罗德设立了个大赛,他邀请一群博弈论学者每人设计一个程序,来玩一场200轮的“多重囚徒困境”游戏,看最后什么策略会胜出。

最后获得最高分的是一个最简单的程序。这个程序由苏联裔计算机科学家阿纳托尔·拉波彼特编写,名叫“ Tit for Tat”(意为“以牙还牙”,以下简称TFT)。

 这个结果引来了各界极大的兴趣,于是更大规模的第二轮游戏开始。这一次,6个国家的62个团队参赛,很多是计算机爱好者,还有进化论博士、计算机科学家。游戏的规则也有所升级不再是200轮,而是以200为公约数的随机数字,防止大家在最后一轮作弊。毕竟,人生也一样,谁知道这是不是最后一回见面呢?

神奇的是,最后胜利的依然是最简单的TFT,而且依然赢了大截。

TFT到底使用了什么策略?

它的策略简单到你无法相信,就两条:

第一步,合作

以后每一步,重复对手的行动--你合作我合作,你背叛我背叛。

TFT用了一个最简单的方式鼓励别人和你实现共赢,这个策略的成功用这4个词解释:善良、可激怒、宽容、简单。

1、善良:TFT的第一步总是在表达善意,总是选择合作,而且水远不会主动背叛

2、可激怒:当对方出现背叛行为,及时识别并且一定要报复,不要让背叛者没有损失。我们平常称之为勇气。

3、宽容:不因为对方的背叛而长期怀恨在心,没完没了地报复,而是让对方调整自己,重新回到合作轨道上来,既往不咎,恢复合作。

4、简单:逻辑清晰简单,易于识别,能让对方在较短时间理解策略。而且就一套策略,不管对方现在得分多少,是强是弱,都这么干。

TFT的人际策略是陌生人社会里很好的策略,同样可应用在真实的商战、人际交往模式中。

人们在生活环境中,也经常会遇到类似的事情。实际上,在有限的资源、有限的地盘、狭小的生态圈,TFT策略的应用就变得特别重要。

小明和小王是好朋友。但是她们研究的领域相近,最近单位要选一位成员去参加一个国际性的交流。注意一下,只有一个指标。

小明想去,小王也想去。

怎么办?

小明找到领导老吴,给她送了一堆的礼物,当然还有高明的赞美之词。

小王为人老实,除了踏踏实实工作,人际交往能力比较弱。

毫无疑问,最后指标由小明获得。

小王很伤心。因为在简单的她看来,公平竞争,就应该是公开、公平、公正的。凭心而论,如果小明很想去,如果小明跟她说,她也会让出这个指标,大不了这次小明去,下次自己有机会再去。而且在机会和朋友之间,小王更看重的是朋友。可是小明的作法让她很伤心,她感觉到自己被背叛了。因此,小王开始疏远小明。

这是典型的你背叛,我背叛案例。

老权和老李是国学领域的专家。最近,他们出席一个论坛,二个人都是演讲嘉宾。在公开场合,老权和老李相视而笑,对自己的竞争对手非常尊重。尊重的是实力、能力、人品,所以,竞争归竞争,哪怕是同行业,该竞争的时候竞争,能合作就合作,坦荡磊落。

这是典型的你合作, 我合作的案例。

TFT用了一个最简单的方式鼓励别人和你实现共赢,这个策略的成功用这4个词解释:善良、可激怒、宽容、简单。

在小王和小明的案例中,小王是善良的,但是,她还是被小明给激怒了,接下来小王需要的是调整自己的心态,因为小明的做法虽然不地道,但是,小王很重视和小明的关系,她还是希望能找到机会和好如初。

在老权和老李的案例中,老权和老李就简单多了,双方都很大气,竞争是公开的,双方的关系是就事论事,对事不对人的。

我们发现,越是成就大事的人,心胸越开阔,眼界越高远。而且他们对TFT策略应用的越自如。而往往两败俱伤的,是那些私心过重、私欲过重的人。所以,你会有意无意就感觉到来自他的敌意,他以为自己掩饰的很好,但实际上,他并不知道自己的行为已经泄露了他的合作策略。而实际上,我们可以思考这样的方式:我不喜欢你的观点,但是我同意你的价值观。我不同意你的价值观,但是我尊重你的观点。

这种现象也有很多人做过研究。如下面这个案例:

"囚徒困境"是1950年美国兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为"囚徒困境"。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。囚徒困境(prisoner's dilemma ):两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护、人际关系等方面,也会频繁出现类似情况。

但是,这样就完全没有办法破解了吗?不一定。我们来看一个新的研究,无名氏定理宣称,囚徒困境博弈是存在解决方案的,这个解决方案是“重复博弈”。而这个解决方案的成立至少要求两个必要条件:

1. 博弈必须是无限次,或者至少,博弈的参与人认为博弈是无限次的;

2. 参与人要有足够的耐心,用指数贴现的跨期效用函数来说,就是贴现因子足够接近 1。

那么,很多人自然就会有想法:当这两个假设不成立的时候,是否存在合作的可能性?因此,应该考虑的是“有限次囚徒困境博弈是否存在合作”。因为毕竟,有很多静态博弈当中就是存在合作现象的。事实上,在过去的接近四十年的时间里,“囚徒困境中的合作”是行为经济学家率领一众社会学家、人类学家甚至是生物学家对传统经济学的一次大反扑。这次反扑来自于大约在 1982 年人们观察到了最后通牒博弈中的合作行为。最后通牒博弈并不是囚徒困境博弈,但是它们之间其实并不是全然没有联系,特别是这个问题而言。这类博弈实际上描绘了“有限轮讨价还价博弈”中的最后一轮,在这个博弈最原初的“故事”中,两个议价者都已经丧失了耐心,于是一个议价者提出了一个报价,并威胁对方:要么接受这个报价,要么谈判破裂。在双边垄断的背景下,如果谈判破裂双方都无利可图,所以预期到这一点的报价者应该会尽可能地压缩对方得到的交易剩余。

所以,一个非常简单的策略,职场中,你合作我合作,你背叛,我背叛。你若犯我,我必还之。

就是这么简单。

显示全文