团队推理:解决协调难题外文翻译资料

2022-12-19 17:33:23

英语原文共 14 页，剩余内容已隐藏，支付完成后下载完整资料

团队推理:解决协调难题

Andrew M. Colman1和Natalie Gold2

摘要：在许多日常活动中，个体在协调自己的行为上有着共同的利益。正统的博弈论无法解释在共同利益博弈中选择对所有人都最有利的结果这种直观而明显的协调形式。团队合作理论提供了一个令人信服的解决方案，它提出，人们有时会被激励去最大化团队的集体收益，并且他们会采用一种从偏好到决策的独特的推理模式。这也为社会困境中的合作提供了一个令人信服的解释。对团队推理及其相关理论的回顾表明，如何将团队推理融入到群体认同的心理学理论和社会价值取向理论中，对这些现象有更深入的理解。

关键词：常识。合作。协调。游戏理论。组标识。社会困境。社会价值取向。团队的推理

在斯坦利·库布里克(Stanley Kubrick)执导的1960年电影《斯巴达克斯》(Spartacus)接近尾声时，一位罗马将军向一群奴隶发表讲话，这些奴隶在起义中被抓获，他提出，如果他们认出他们的领袖斯巴达克斯(Spartacus)，就释放他们，让他们重返奴隶制。为了救他的战友，

斯巴达克斯(柯克·道格拉斯饰)站起身来说:我是斯巴达克斯。其他奴隶们立即站了起来，彼此之间没有任何商量，他们也一个接一个地站起来，声称自己是斯巴达克斯，从而阻止罗马将军把他们的领袖或其他人单独挑出来接受特别的惩罚。这是一个戏剧性的协调例子，是社会互动的最基本过程之一，每当两个或两个以上的个体为了达到一个共同的目标而试图使他们的行为一致时，就会表现出来。

协调是一种基本的合作形式，相对而言被研究人员所忽视，可能部分是因为它是如此熟悉和常见，但它正开始引起注意(例如，Thomas, Scioli, Haque， amp; Pinker, 2014)。令人惊讶的是，因为它看起来如此简单和明显，结果却被正统的博弈论所解释。正统的博弈论是一种高度发达的理论，旨在解释互动决策。协调从而似乎是一个典型的例子类型的现象被海德(1958),b面纱的显著性,使得很多直觉心理学见解眼睛看不见我们的科学必须穿^ (p。7)。在本文中,我们展示了团队rea-soning令人信服地解决这个问题和理论也提供了一个令人信服的解释在社会困境的合作。我们回顾了团队推理的文献，包括理论问题和实验证据，为了平衡和完整，我们更简要地讨论了合作民族的主要竞争理论和相关的社会心理学理论。我们展示了如何通过整合团队推理来显著加强某些心理学理论。在详细讨论这些问题之前，有必要先谈谈博弈论以及它为何不能解释协作。

博弈理论

虽然对特定问题的博弈论分析可能是复杂和难以理解的，但博弈论的基本思想是简单和直接的。任何两个或两个以上的决策者在不同的行为方式之间做出选择的社会互动，在技术层面上都是一场游戏，前提是结果取决于他们所有的选择，而且他们对可能的结果有一致的偏好。事实上，每个有趣而重要的人际、政治和经济互动都可以通过游戏来建模，至少在原则上是这样。博弈论的概念工具首先由冯bull;诺依曼和摩根斯特恩(1944)详细阐述，它将决策者(玩家)、他们的行为方式(策略)和他们的偏好(回报)形式化，并做出两个重要假设。首先是一种微弱的理性假设，即考虑到玩家在行动时的偏好、知识和信仰，他们在任何情况下都是按照自己的最佳利益(如他们所见)行事。第二个常识假设是游戏的规范，包括玩家的策略集和偏好，以及玩家在第一个假设意义上的合理性，都是游戏中的常识;这意味着所有玩家都知道这些事实，所有玩家都知道这些事实，所有玩家都知道这些事实，所有玩家都知道这些事实，所有玩家都知道这些事实。常识在博弈论中是一个默认的假设，直到它被路易斯明确地引入并命名(1969年，52-69页)。从这些原始的概念和假设出发，该理论的主要目标仅仅是计算出随之而来的逻辑含义，并试图确定理性玩家将如何在特定的游戏或游戏类中行动，以及由此产生的结果。

博弈论横跨行为科学和社会科学。此外，至少有一位有影响力的科学家认为，梅纳德·史密斯和普赖斯(1973)将进化论扩展到生物学领域，是自达尔文以来进化论最重要的进步之一(道金斯，1976，第90页)。因此，值得注意的是，该理论在某些基本情况下完全失败，其中最引人注目的是战略协调。特别是，非合作博弈论(非合作博弈论的一个分支，研究的是参与者之间无法达成可强制执行的协议的相互作用)似乎无法解释作为一种基本协调形式的收益优势。

回报优势

Harsanyi和Selten (1988, pp. 80 - 90,355 - 359)在他们关于非合作博弈均衡选择的诺贝尔奖获奖著作中，详细讨论了收益优势，特别是与Aumann (1987, p. 3)版本的猎鹿有关

游戏，如图1左边所示。玩家1选择行C(合作)和行之间D(缺陷),玩家2列C和D之间的独立选择,和游戏的结果是选择策略的四个细胞相交,与回报玩家1和2所示,按照惯例。Aumann(1990)在后来的出版物中再次讨论了这款游戏，他提到了它的名字(他之前从未这样做过)，但在脚注中评论道:BWe并没有成功地找到这个故事的根源^(第206页)。事实上，这个游戏是以法国哲学家卢梭(Rousseau, 1755, Part 2, paragraph 9)在讨论公民社会早期发展时提出的一个假想的战略互动而命名的。卢梭设想的猎人需要协调他们的行动(C)抓鹿(瑟夫),一个需要合作的努力,但每个试图缺陷从联合企业(D)选择和追逐野兔(lievre),一个较小的猎物,每个能赶上没有其他的帮助。在Aumann版的游戏中,联合倒戈(7)的收益略低于单边变节的回报(8)——我们可以想象,一个猎人略有不太可能抓一只野兔如果两个猎人同时缺陷,也许是因为两个会追着相同的hare-but回报小于共同合作的回报(9);单侧C选项没有得到(0)

在图1的右边是一个模板，通常用来定义任何对称的2times;2博弈。根据模板,Aumann(1987年,p . 1990)猎鹿博弈由不等式定义R gt; T gt; p gt;美国最初版本引入博弈论和被刘易斯(1969年,p . 7)隐含收益结构R gt; T = p gt; S,但Aumann的战略属性和刘易斯的版本非常相似。和其他游戏一样，猎鹿游戏模拟了潜在的无限范围的社会互动(对于一个屠夫和一个面包师决定是否协调他们的行动和销售热狗的完全不同的场景，见Thomas et al.， 2014)。包括Skyrms(2004)在内的一些权威人士将猎鹿游戏视为社会生活进化的基本模型。

在猎鹿博弈中(图1，左)，由于C策略是彼此的最佳响应，结果(C, C)是纳什均衡。在C选项的选择上，任何一个玩家都无法获得更好的收益。在C选项的选择上，任何一个玩家都无法获得更好的收益。根据一个重要的间接论点，可以追溯到冯·诺依曼和摩根斯特恩(1944年，节)

猎鹿博弈游戏有时是令人困惑的保证,引入了森(1969),其中R gt; P gt; T gt;美国森提供了以下解释涉及两人面临的选择去讲座或呆在家里:BBoth认为在一起演讲最好的选择;两者都是，呆在家里是第二好的选择;最糟糕的是，他或她在hellip;hellip;不含其他

图1左:奥曼猎鹿游戏，R gt; T gt; P gt; s。右:对称2times;2游戏的广义模板

在任何博弈中，唯一合理的策略配置(每个参与者一个)必然是纳什均衡。要了解为什么会这样，请注意常识假设意味着，在任何唯一的rational策略概要中，每个参与者都能够预测合作伙伴的策略，因为每个参与者都知道合作伙伴是rational的，因此必然选择惟一可用的rational策略;但如果这个策略配置文件不是纳什均衡，那么至少有一个参与者会选择一个不是最佳答案的策略，这违反了理性假设;因此，策略概要必须是纳什均衡。

Aumann猎鹿的比赛(图1),出现并发症的事实结果(D, D)也是一个纳什equilibrium-against D-chooser,球员收到7通过选择D但零选择C不对称(C, D)和(D C)结果不是纳什均衡。很容易让人想到，理性的参与者会通过选择C来协调博弈，因为(C, C)均衡比(D, D)均衡(博弈论术语)更适合双方，因为(C, C)是收益主导的。在任何博弈中，均衡e的弱支付优于另一个均衡f，如果每个参与者在e中获得的收益至少和在f中一样好，且至少有一个参与者获得了更好的收益;当每个玩家在e游戏中获得的收益都比在f游戏中获得的收益高得多时，就会出现强收益现象。经济学家和政治学家有时把收益优势称为帕累托优势。值得注意的是，在奥曼的猎鹿游戏中，(C, C)具有(强烈的)收益优势这一事实并没有为玩家提供一个选择C策略的理由，而这一理由可以从标准假设中分离出来。问题是C不是无条件的最佳选择:

90年代中期的演讲;这个名字可能最早出现在巴沙拉赫和斯塔尔(2000)。利用图1(右)中的模板，由不等式和等式R gt; P gt; S = T = 0定义Hi-Lo对策。它本质上是一个猎鹿游戏，非对角单元格的收益为零;(H, H)和(L, L)是纳什均衡，(H, H)与(L, L)相比具有较强的收益优势，就像在猎鹿游戏中一样。任何在主对角线上有正收益(R, R)和(P, P)且其它地方没有收益的2times;2对策

关于0，值得指出的是，在博弈论中，收益被假定为效用，表示玩家的偏好由他们自己的选择决定或揭示。效用是在区间尺度上测量的，该尺度在正线性(仿射)变换之前是唯一的，并且在不同的参与者之间是不同的;因此，在游戏中的所有收益中添加一个常量，或者将它们都乘以一个正的常量，将保持游戏的策略属性不变。因此，任何一组可以通过正线性变换转换成指定模式的收益也是一个Hi-Lo博弈。

尽管近乎孩童般的天真,无数的错口游戏模型战略相互作用在日常生活中,从两人决定寻找彼此分开后在购物中心(比另一个位置更方便)两个汽车司机决定哪一方的窄路去当救护车需要通过在紧急情况下(在某些方面比另一侧)。Colman, Pulford, and Lawrence(2014)给出了R = 2, P = 1的说明性场景，如图2所示:

三个孩子被困在着火的大楼里，其中两个在一个房间里，第三个在远处的第二个房间里。邻居休息,刚刚足够的时间来拯救两个孩子在第一个房间或独生子女在第二个房间里,但救援只能成功如果灭火器的另一个邻居,他发现了一个不同的入口点,正面直对相同的房间。如果两个孩子都去第一间房，那么里面的两个孩子就会被救出来，如果两个孩子都去第二间房，那么那个房间里的一个孩子就会被救出来;但是如果每个邻居都去不同的房间，那么没有一个孩子会获救。(36页)

假设邻居们更愿意救尽可能多的孩子，而且每个邻居都知道对方的孩子

入口，这个燃烧的建筑场景的战略结构与图2所示的Hi-Lo游戏相匹配，第一个房间对应H，第二个房间对应L。

Aumann猎鹿的游戏,虽然(C, C)均衡收益占主导地位,占主导地位(D, D)均衡的风险在某种意义上定义的数学由哈萨尼和Selten(1988年,页82 - 89),和风险优势选择D .直观地提供了一个积极的原因很明显,D是更安全:C选择风险可能的收益为零,而最糟糕的回报从7 D的选择。在Hi-Lo博弈中，风险占主导地位并不会导致复杂性，H似乎是一种无需动脑筋的策略选择。但再次仔细的分析显示,每个球员都有一个理由选择H当且仅当有理由期待实验选择也就不可能有这样的原因,因为实验有一个理由选择H当且仅当有理由期待第一个玩家选择它。我们陷入了一个恶性循环，根据博弈论的标准假设，这两个玩家都没有任何理由更喜欢H而不是L。

尽管存在这样的恶性循环，Hi-Lo游戏在人类决策者中引发了一种强大的直觉，即H是理性的选择，实验证据证实几乎所有玩家都选择了它(Bardsley, Mehta, Starmer， amp; Sugden, 2010)。是什么导致了这种现象?经典博弈论不能简单地通过(H, H)是收益主导的事实来解释它。Harsanyi和Selten(1988)为了在博弈^ (pp. 357-359)中实现均衡选择的Bgeneral理论，因此提出了在标准理性假设中增加一个pay - off-dominance原理作为公理。根据这一原则，理性的参与者在他们存在的任何时候都选择支付-支配均衡。Harsanyi和Selten承认，这是一个令人不满意的临时解决方案，无法深入了解它所要适应的现象。Harsanyi(1995)在被Aumann(1990)的一个论点所说服后不久就放弃了它，该论点认为收益-支配纳什均衡不是自我强制的。例如，在猎鹿游戏中，只要游戏是一款没有可强制执行协议的非合作游戏，即使是游戏前交流的可能性也不能使家达到收益-主导均衡(Harsanyi, 1995, p. 94，脚注3，斜体)。

解释协调

协调互动决策的一直是一个被忽视的方面,尤其是在关系的大量研究关注,一直致力于“囚徒困境”游戏,多人合作社会困境,单方面的背叛收益回报高于联合合作(评论,看到Balliet,穆德,和范

兰格,2011;Balliet amp; Van Lange, 2013;Ledyard, 1995)。Thomas等(2014)将协调称为互利合作和社会困境型利他合作。协调的问题,是一个有趣的比无私的合作和更基本的现象:球员如何协调payoff-dominant结果,不仅在游戏中有多个纳什均衡也是更普遍的共同利益游戏中,一个单一的结果回报主宰所有其他结果,纳什平衡与否?撇开那些涉及改变游戏规格的理论不谈，比如那些允许玩家之间重复的理论(如Aumann amp; Sorin, 1989)或无成本的廉价对话^(如Anderlini, 1999;法雷尔,1988;在我们转向团队推理之前，有几个谬论需要简要地提一下。

两个常见的谬误

首先是一个谬论，许多人在最初遇到收益支配问题时都会屈服。这是一种相信，仅仅是显著性就可以解释协调。一个突出的结果是一个突出于其他结果，或在某种程度上显得突出或独特的结果，它可以作为协调的焦点。许多年前,谢林(1960)表明,人们非常擅

剩余内容已隐藏，支付完成后下载完整资料

资料编号：[19875]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容！立即支付

注册

找回密码