== 系统问题，暂停聊天功能。==
【征集】西西河的经济学，及清流措施，需要主动参与者，『稷下学宫』新认证方式，24年网站打算和努力目标

主题：265-Nichola Raihani：论惩罚的进化原理 -- 万年看客

共:💬2 🌺10 新:

老视野待整

分页树展主题 · 全看首页上页下页末页

家园 265-Nichola Raihani：论惩罚的进化原理
https://www.youtube.com/watch?v=E9G0VFCBYb4&list=PL4i9YSoIJiPfAq5TCk7xdVrJlxRAMbay-&index=8&t=998s
今天我想要呈现我的一些研究成果。这是我非常感兴趣的问题：高成本的惩罚行为如何进化而来？我们如何以自然选择的方式来解释惩罚的进化过程？
首先我们要定义一下进化生物学家所谓的惩罚是什么。通常来说，试验经济学与进化生物学所谓的惩罚指的是一个个体付出成本，从而使得另一个作弊的互动伙伴承受更高的成本。一旦在自然界看到短期成本很高的行为，我们总要设法理解这些成本归根结底如何获得收益，因为只有产生收益的行为才能得到自然选择的青睐。传统观点认为惩罚搭档可以使得搭档在未来与你打交道时采取更加合作的姿态。惩罚相当于短期投资，你惩罚你的搭档，向他们施加成本，而惩罚此人的成本可以通过迫使此人日后更加合作来得到补偿。惩罚如何能得到自然选择的青睐是理解人类合作如何进化而来的关键，因为人们普遍认为惩罚是支持大规模高层次人类合作的关键机制之一。我们必须让这些假设接受严格检查，看看它们能否在经验数据面前站得住脚。
基于这些假设我们可以提出两个问题。第一个问题是这一假设多么可靠？遭到惩罚的个体是否真的会变得更加合作？被惩罚是否真的会使作弊者未来表现得更加规矩？另一个问题对于研究人类进化来说尤其重要：人们经常在他们自己是作弊者的首要被害人的时候采取惩罚行为，不过也有些时候集体当中的某一位个人会独自承担惩罚的成本，而全体成员都会收获惩罚投资的收益，作为进化生物学家，我们的兴趣在于高成本惩罚行为怎样从如此复杂的环境当中进化而来？毕竟，人类似乎非常乐于亲手惩罚作弊者，哪怕袖手旁观、听任他人替自己干脏活能为他们带来极大的策略优势。
我们先来审视第一个问题：惩罚是否真能导致被惩罚的目标在未来变得更加合作？在展示人类证据之前，我们先来看看另一种与人类差别极大的物种，也就是清洁鱼。凡是有幸曾经在印度洋与太平洋地区潜水的人们大概都见过这种鱼，大约有8厘米长。这种鱼在珊瑚礁附近有小片的领地，它们为珊瑚礁上的其他鱼提供清洁服务，包括吃掉客户皮肤上的寄生虫，这些寄生虫对客户的健康很有害。许多不同的鱼会造访这些清洁站来去除寄生虫。在画面上可以看到，清洁鱼游进客户的的大嘴里，清除表面残渣与寄生虫。清洁鱼之所以如此适合研究，因为清洁鱼与客户之间不仅存在表面上的合作，还存在利益冲突，因为清洁鱼更喜欢吃客户的活体组织。如果有选择的话，它们更爱吃客户身上的粘液与鳞片，以至于伤害到客户。因此我们必须询问，在这套体系当中，客户如何强迫清洁鱼违背自己的偏好？如何迫使想要作弊的清洁鱼守规矩？
如果你是黄点蛇鳝这样的肉食性大鱼，那么你的策略很简单：清洁鱼要是敢在服务的时候咬你，那就拿清洁鱼当午餐。清洁鱼并不愚蠢，不会咬这些大鱼。但是清洁鱼的大多数客户都是草食性的鱼，所以不能如此威胁清洁鱼。这些客户能做的是激烈地惩罚作弊的清洁鱼。我请大家看几段录像，看看清洁鱼与客户的互动方式……
……总之我们可以看到这就是清洁鱼与客户互动的方式，看起来这里的互动似乎只是单纯的合作，但是清洁鱼往往忍不住作弊，吃两口活组织。避免作弊的方式之一就是凶猛地赶走清洁鱼作为惩罚。一项早期研究表明，遭到惩罚的清洁鱼在一分钟后应对同一位客户的时候作弊的可能性确实有所下降，因此客户的惩罚似乎有效。似乎这就是客户用来强迫清洁鱼违背自身进食偏好的方式。
还有另一个奇怪的情况。清洁鱼生活在一雄多雌的后宫群体里，有时同一地区的一雄一雌两条鱼会为同一条客户服务，我们称为共同检查。想象一下，假日你是客户，两条清洁鱼来清洁你，那么你恐怕会得到很糟的服务，因为不是一条清洁鱼有可能会咬你，而是两条。而且这两条清洁鱼都可能都会在另一条鱼咬你之前忍不住咬你，因为每当客户被咬的时候，两条清洁鱼各有50%的可能遭到针对，换句话说很可能一条鱼吃到了可口的鳞片与粘液，而另一条鱼却必须付出客户叫停服务的成本。如果你是客户，被两条鱼清洁，你就大概会觉得情况非常糟糕，因为你很快就会被咬掉鳞片，却除不掉多少寄生虫。理论上来说，这种情况就是经济家所谓的囚徒困境。两条清洁鱼都有背叛同伴的策略动机，因为无论同伴如何表现，背叛都能带来更高的回报。因此我们的预测是客户会得到更糟糕的服务。奇怪的是，在这种情况下，被一对清洁鱼服务的客户比起只被一条鱼服务的客户反而会得到更好的服务。这就有点奇怪了。为什么会这样？为什么与深陷囚徒悖论的清洁鱼互动的客户比起并非处在这种策略困境的客户反而能够得到更好的服务？这个问题的解决方案就在于惩罚。
我让大家看一段雄清洁鱼和雌清洁鱼为同一位客户服务的视频。可以看到客户如何抽动身体，这表明它被咬了。然后看看雄鱼对雌鱼做了什么——它把雌鱼赶着到处跑。看起来是鲜花，从这视频来看，假如雌鱼要作弊咬客户，那么比雌鱼更大的雄鱼就会凶猛地驱赶雌鱼，惩罚雌鱼作弊欺骗共同客户的行径。这个例子表明了人类所谓的第三方惩罚：一名个体代表被害者来惩罚作弊者。我们奇怪的是，雄鱼的驱赶是否可以作为惩罚？是否会让雌鱼在未来互动当中变得更加合作？
为了检验这一点，我们将好几对清洁鱼送进实验室，训练这些成对的鱼与塑料盘子充当的客户鱼模特进行互动。我们在塑料鱼身上安放两种食物，第一种是明虾，清洁鱼非常喜欢；第二种是鱼肉泥团，它们也喜欢吃，但是并不特别喜欢。清洁鱼很快就学会了在塑料盘子上找东西吃。此外大约只需要六次训练就能教会清洁鱼，如果他们吃了明虾，盘子就会被提出水面。它们很快就意识到，如果想让盘子留在池子里，它们就必须违背偏好吃鱼肉泥而不是吃明虾。我很想知道清洁鱼究竟是特别聪明还是特别愚蠢——它们能学会非常复杂的认知任务，但是我们可以用塑料盘子欺骗它们，让它们以为这是客户鱼，以至于它们甚至开始给塑料盘子提供各种其他服务，例如给盘子的背鳍部位进行按摩。一方面它们非常聪明，另一方面它们又很容易遭到愚弄。所以我们就愚弄了它们，给它们提供塑料盘子，上面有两种食物，用来代表寄生虫与鳞片粘液。我们感兴趣的是雄性对作弊雌性的惩罚是否会让雌性在接下来的互动当中更加合作。
我们模拟了两种情况。雄性和雌性面对同一个塑料盘子，上面有鱼肉泥也有明虾。只要有一条鱼吃了明虾，我们就将盘子收走，两条鱼都要付出互动被终止的代价。第一种情况是雄性和雌性都在鱼缸里，因此雄性可以追逐雌性加以惩罚；另一种情况是在雄性与雌性之间加一块透明隔板，盘子从隔板与鱼缸的缝隙之间插进去，盘子两边各自安放了鱼肉泥与明虾。两条鱼还是在同一个盘子上进食，但是盘子被拿走时雄鱼不能追逐惩罚雌性。问题在于，当惩罚行为遭到预先阻止时，雌性是否更加不可能在下一轮互动当中改善自己的合作倾向？
画面上展示的这些图片体现了从第一轮测试到第二轮测试之间的雌性行为。每一轮测试都分成不加隔板与加隔板两种情况，因此雄性要么可以惩罚雌性，要么不能。一分钟之后进行第二轮测试，再把盘子再放进去，看看雌性的取食趋向有没有什么区别——要么直接吃明虾，要么先吃很多鱼肉泥再吃明虾。我们发现，当惩罚遭到预防时，雌性往往不会改变自己的行为；当雄性可以惩罚雌性时，雌性在下一轮吃虾的可能性更低。所以被雄性惩罚确实降低了雌性在下一轮作弊的可能性。当雄性惩罚雌性之后，雌性会吃下比例更大的鱼肉泥而不是明虾，换句话说它们不会吃那些会让盘子消失的食物。当惩罚被预防时则不会出现这样的情况。雄性投资精力与体力来惩罚雌性的好处在于，如果它们能与更合作的雌性一起提供服务，那么与客户互动的时间也会更长，因此在任何一次试验当中它们自己也可以吃得更多。换言之，即便它们付出了将雌性赶走的短期成本，但是总能得到可靠的长期收益，因为它们可以确定雌性将会更加合作，让它们以后可以吃得更多。这就是来自清洁鱼的证据。
我们再来看看同样的问题在人类身上会怎样表现。很多情况下个体人类也想要作弊，他们可能通过作弊得到更高的回报，也可能招致同伴的惩罚。那么被惩罚是否会让人类在随后的互动当中更倾向合作？有些早期证据证明情况并非如此。画面上是一篇2008年发表在《自然》上的著名论文，作者是安娜.德雷伯（Anna Draber）及其同事。论文起了一个很气人的题目：《赢家不会惩罚》（Winners don’t punish）。这篇论文的主旨是研究囚徒困境：当个体可以选择合作或者背叛时，被搭档惩罚是否会让之前选择背叛的个人接下来更倾向合作？论文的主要结论声称，更加倾向惩罚的人们往往得到的回报最低。玩家越是倾向于惩罚背叛他的伙伴，终局时的总体收益就越低，因为遭到惩罚的同伴到了下一轮往往不会选择更加合作，而是会选择报复上一轮的惩罚者。因此惩罚作弊的人类只会导致冤冤相报的仇恨循环，而不会像清洁鱼实验那样增进合作倾向。实际上，在只有两个玩家参与的游戏当中，应对背叛的最有效方法就是抢在对方之前先一步背叛，而不是付出额外代价去惩罚对方。
这篇论文在2008年发表，我第一次读到论文时心想：“显然他们一定搞错了。他们显然忘记了一点：在自然界，惩罚发生在支配等级之间。只有支配其他个体的更高个体才能施加惩罚，被支配者只能老老实实地接受惩罚并且更加合作。”雄性清洁鱼比雌性体型更大，因此雄性可以惩罚雌性，雌性则惩罚不了雄性。一开始我觉得论文设计的游戏显然不现实。假如游戏的每个参与者都有同样的惩罚能力，那么惩罚肯定不会管用，因为玩家之间不存在使得惩罚得以运作的支配等级。所以我与我的博士研究生们一起重复了论文当中的实验。我们进行了同一个游戏，即二人参与的的囚徒困境游戏，每一位个人都可以选择合作或者背叛，还可以支付成本来惩罚伙伴，但是我们的游戏还包括了玩家之间的权力等级。我们的假设认为，如果我们将游戏设计得更加现实，纳入权力不对称结构，就会颠覆德雷伯的发现，表明惩罚确实能够推进合作，前提是方法必须正确。
原本论文设计的游戏由两个玩家进行囚徒困境博弈，玩家可以选择支付一个筹码来惩罚背叛的对方。我们的改进版游戏区分了强玩家与弱玩家，前者具有强大的惩罚技术，只需要付出一个筹码就能迫使对方支付三个筹码；而后者的惩罚技术较弱，每付出一个筹码只能让对方也支付一个筹码。因此强玩家可以让对方蒙受沉重损失，而弱玩家只能让对方收到较轻的损失。我们在不同的场景展开游戏，首先是对称游戏，即让强玩家与强玩家配对，让弱玩家与弱玩家配对；然后是不对称游戏，让强玩家与弱玩家配对。我们原本认为惩罚在对称游戏当中不管用，因为等级相当的双方可以相互报复；至于在不对称游戏当中，强玩家将会惩罚弱玩家，而弱玩家不会报复，只会更加合作，以此回应强玩家的惩罚。画面展示了游戏的回报矩阵。在一轮游戏当中，假如两个玩家都选择合作，每人可以得到一个筹码；如果一人合作，另一人背叛，背叛者可以得到三个筹码，合作者则要被减去两个筹码；两人都背叛，两人都得不到筹码，不过也都不用被减去筹码。一轮游戏结束后，双方都可以选择是否惩罚对方。根据囚徒悖论，每一轮的利益最大化策略都是背叛，无论对方怎么选择。所以玩家总有背叛的策略动机。我们主张惩罚只有当存在支配等级时才会发生，而且支配玩家施加的惩罚会让较弱的搭档更容易合作，
我们发现了什么？有些实验结果对于我们的假设很有利，例如每个人与强玩家配对时都会更加合作，与弱玩家配对时则没这么合作。弱玩家与平等的弱玩家配对时，选择合作的游戏轮数占比约为0.7，与强玩家配对时的占比则是0.8；强玩家的情况也是一样，强强配对时强玩家选择合作的游戏轮数占比约为0.85，强弱配对时则为0.75。这一结果符合我们的预期。我们发现，在游戏当中原本更倾向于合作的个人同样也更倾向于惩罚。如果你惯于合作而你的伙伴选择背叛，那么你会比自己也选择背叛时更倾向于惩罚背叛的同伴。我们还发现，强玩家比弱玩家更倾向于惩罚，这也符合我们的预测。
但是当我们检视遭到惩罚的人们是否会改变行为时，我们的结果与德雷伯基本一样。我们在研究中发现，与搭档选择不惩罚的玩家相比，被搭档惩罚的人们更不倾向于改变自己接下来的行为。在游戏当中加入惩罚因素并不能促使人们改变自己的行为。实际上，在强强配对的游戏当中——也就是德雷伯研究的思路——遭到强玩家伙伴的惩罚反而会显著降低受罚强玩家接下来的合作倾向：选择背叛而未受惩罚的强玩家在下一轮游戏选择合作的比例是0.7，选择背叛而受到惩罚的强玩家在下一轮游戏选择合作的比例只有0.2。德雷伯与我们的两套实验数据都表明，在囚徒困境博弈当中被伙伴惩罚并不能让人们更加合作。哪怕你的伙伴比你更强，只要他惩罚你，你就更不倾向于在下一轮选择合作。我们的问题是“支配等级是否是惩罚生效的前提”，答案是否定的。在人类博弈当中引入支配等级并不能使得惩罚变得更加有效，我们的假设错了。
这一点让我们想到了关于清洁鱼的另一项研究。这项研究认为惩罚或许在个体没有其他外在选项的时候更有效。我们先来看看外在选项是什么意思，再来看看清洁鱼实验的数据。我们有一整套基于伙伴选择以及个体怎样向市场提供服务的理论，很大程度上借鉴了经济市场理论，在生物学当中我们称为生物市场理论。该理论预测个体在找不到其他互动伙伴的时候最容易诉诸惩罚。你与目前的伙伴拴在一起，而且它们作弊了，那么这一理论预测你应当更乐意惩罚它们；如果你还有其他很多伙伴可以选择，那么你完全可以直接甩掉坏伙伴而不是耗费精力去教训它们。清洁鱼的客户体系提供了很有用的模型来检测这一预测，因为在清洁鱼与客户的交互过程当中有两种客户。其一是本地物种，它们体型较小，栖息领地范围内可能只有一两个清洁站，只能接触到一两条或者一两群清洁鱼；其二是体型更大的造访物种，它们的领地里有好几个清洁站，因此外在选择更多。我们发现，就像生物市场理论预测的那样，没有外在选项的本地客户最倾向于惩罚作弊的清洁鱼。至于访问物种则会采用不同策略，假如它们在某个清洁站遭到欺骗，下次就换个地方。我们在人类身上检测了这一理论：假如我们操纵人类的外在选项，能否促使人们使用惩罚而不是更换伙伴来作为控制伙伴行为的手段？
这次采用的游戏依然就像上次一样是囚徒困境游戏。玩家可以可以选择合作或者背叛，每一轮游戏结束后玩家可以选择惩罚伙伴，也可以选择更换伙伴。我们设定了三种情况来操纵玩家的外在选项。第一种情况没有外在选项，玩家不能更换伙伴；第二种情况下，玩家可以支付筹码更换伙伴；第三种情况下，玩家可以直接跳过下一轮游戏，到了再下一轮游戏就会被分配一个新伙伴。我们很想知道，没有外在选项是否意味着人们更容易惩罚背叛的伙伴，就像清洁鱼那样？我们预测，与特定伙伴拴在一起的第一类玩家最倾向于施加惩罚。我们还没有完全接受上一次试验的结果，因此这一次我们依然预测遭到惩罚的玩家会在接下来的游戏当中更倾向合作。我们还想到，假如惩罚是改变伙伴行为的工具，那么投资惩罚的个体应当主动选择始终与被惩罚的伙伴拴在一起。你不应该先惩罚伙伴然后再更换伙伴，因为这样一来你就不能享受接下来的收益了。就算你对伙伴的惩罚确实让他们变得更加合作，如果他们的合作对象不是你那也白搭。结果我们发现，面对背叛的最常见反应是同样背叛而不是更换或者惩罚伙伴。三种情况下选择同样背叛的轮数占比最高达到70%，最低也有60%。而且与我们的预测完全相反的是，人们在没有外在选项的情况下反而最不倾向于惩罚。第二第三组玩家选择惩罚的轮数占比在20%上下，与伙伴拴在一起的第一组玩家则只有15%左右。我们再一次发现，惩罚并不能促使人们更加合作。
就像上一次试验一样，最能让背叛玩家在下一轮选择合作的因素就是伙伴在上一轮选择合作。惩罚并没有带来额外的好处。有趣的是，人们似乎还会遵循另一套看似不合理的策略：假如他们的伙伴背叛，而且他们有外在选项，那么在50%的情况下人们会首先惩罚伙伴，然后再更换伙伴。他们情愿在一轮之内同时惩罚伙伴以及结束合作关系。这一点实在不能支持“利用惩罚改变伙伴行为，迫使他们在长期更加合作，从而使得惩罚者获得合作互动的收益”这一理论。如果你不能留下来享受这些好处，那就不能认为惩罚被人们用作这种目的。
针对这些研究的批评角度有很多。我完全接受各种批评，我明白批评对于科研非常重要，值得我们应该好好反思。或许我们为惩罚设定的成本不太对，或许正确的设定是支付一个筹码就可以减去伙伴的二十个筹码，问题有可能出在这里；我们的博弈非常程式化且抽象，或许我们需要在这方面多考虑一点；实验室游戏的赌注非常低，生活当中的实际博弈赌注更大；很多研究的受试者都是西方大学生，或许这些学生对于惩罚的抗性高于一般人，以至于我们的取样从一开始就遭到了系统性的污染。考虑到这些因素，这些都是可以针对这些研究展开合理的批评。我们还可以批评研究的逻辑：在二人博弈当中，总可以用背叛来回应背叛，用不着支付惩罚对方的成本。反过来说，如果你惩罚了你的伙伴，那就难免遭到报复，因为他知道肯定是你惩罚了他，而你则躲避不开对方的报复。我很乐意待会跟大家讨论一下这些批评，但是我依然要说，当我们将上述结果与经典的开创性研究相对照的时候，作为一名对于惩罚的进化原理很感兴趣的研究人员，我越发觉得我们对于惩罚的功能从根本上就理解错了。我们认为惩罚是一种加强合作的工具，可以让作弊者变成合作者，但是实际上惩罚并没有这个功能。所以我们来看看其他研究结果有什么说法。
很多人都会觉得画面上这张图很熟悉。这是最经典的惩罚研究，由欧内斯特.菲尔（Ernst Fehr）与西蒙.盖切特（Simon Gaechter）于2002年在《自然》上发表。这项研究与我们的研究非常相似，只不过他们用的是公益博弈而不是囚徒困境博弈，两者区别在于前者参与人数更多。公益博弈有四个人参加，每个人都会得到一笔钱。每一轮游戏开始，你要将一定量的钱投入公共彩池，这轮游戏结束时彩池内的总金额决定了所有玩家的收益。当然，你也可以把钱暗中截留下来，通过别人填充的彩池白蹭收益。就像囚徒悖论一样，我们的预期是人们都很自私，都想搭别人的便车。在没有惩罚机制的情况下确实会发生这种事。人们在最初几轮通常会投入起始金钱的一半，后来他们逐渐意识到其他人在搭便车，于是自己投入的钱数也越来越少。如果引入惩罚机制，那么人们一开始的投资额度就会高于一半，而且始终保持高位。这意味着惩罚促进了公益游戏当中的合作：你会遭到惩罚的事实使得人们更加合作。但是我们与生物经济学家们完全忽略了了一点，尤其是我本人以及这个领域的所有人都犯下了同一个错误：这个实验并不能表明惩罚会让人变得更加合作，而是表明了施加惩罚的威胁会让人们变得更加合作。惩罚本身未必会改变人们的行为，以至于让背叛者变成合作者。更重要的是，许多此类研究都没有控制以下变量：受试者的合作程度之所以提升，或许只是因为身边更多的人们选择合作，因此自己也随大流，而不是因为人们改变了自己的行为从而避免受到惩罚。因为某人身处合作团体而变得更加合作，这个现象叫做条件性合作，可以解释很多这里发生的情况，而并不意味着遭受惩罚会改变人们的行为。
我刚刚向大家展示了一种情况：在集体当中，一名个人惩罚另一名个人的行为可以带来群体层面的获益，无论群体当中的其他个体是否参与了惩罚行为。我们必须回答的重要问题在于惩罚究竟是如何在这么奇怪的情况下进化出来的？惩罚的进化是否取决于惩罚将作弊者转变成合作者的能力？还是说我们的目标从一开始就找错了？许多研究者都认为惩罚的进化原理是所谓的文化群体选择机制。在群体当中有几个惩罚者会让其他群体成员更加合作，从而使得这个群体能够在竞争当中胜过其他群体。惩罚可以将群体中的作弊者变成合作者，这样作为整体的群体比起未必那么合作的其他群体将会更有竞争力。文化群体选择涉及许多我并不想细说的假设，这里我想说这确实有可能是惩罚的进化方式之一，不过我们在实验室与现实世界还见识过很多难以如此解释的现象。如果说惩罚的作用就是将作弊者变成合作者，那么很多现象都解释不通。
首先，人们的惩罚行为往往具有反社会的特质。所谓反社会惩罚的意思是“哪怕你主动合作我也要惩罚你”。在某些文化当中，进行公益博弈时将全部起始金额都投入公共彩池的玩家尽管造福了所有人，却往往会被挑出来遭到惩罚。在希腊的雅典与阿曼的马斯喀特进行的公益博弈实验当中，正当惩罚——即针对作弊行为的惩罚——与反社会惩罚的比例接近一比一。如果说惩罚是为了促进合作，那么肯定不会被用来对付那些早就开始合作的人们。其次，很多研究都表明假如被惩罚者有能力报复惩罚者，那么惩罚就无法促进合作。再次，假如你告诉人们将会进行总共五十轮游戏，很多人在最后几轮的惩罚力度要比之前几轮更强。假如惩罚的作用是推进合作以及改变互动伙伴的行为，那就不该在最后几轮惩罚他们，因为没有好处。这时候无论你再怎么惩罚伙伴，他们也没有改变行为的空间了。
最后，人们之所以要在互动当中惩罚伙伴，究竟是因为他们受到了损失，还是因为他们感到不公平？我们的研究表明，惩罚对于不公平的敏感性远远超过对于作弊的敏感性。假设某人在囚徒困境博弈当中选择合作而对方选择背叛，那么此人不仅会在这一轮损失金钱，而且背叛者还会赚到比他更多的钱。这样一来此人的惩罚行为的动机就说不清楚了，我们不知道他的动机究竟是因为金钱损失还是因为对方的钱在互动结束时比自己更多，研究者必须把这两者分开，唯此才能确定惩罚的真正动机。于是我们做了一个实验来区分两者：依然是二人囚徒博弈，不过允许一位玩家从对方那里偷钱。每一轮的结果有三种可能：偷钱者的钱不如被偷者的多，或者双方钱数一致，又或者偷钱者的钱比被偷者的更多。这样一来我们就能确定，究竟是被偷钱导致人们施加惩罚，还是因为小偷比自己更有钱导致人们施加惩罚。我们发现大多数的惩罚都会发生在偷钱者的钱明显比被偷者更多的时候。这意味着人们做出惩罚决策的首要动机是因为感到不公平，而不是因为感到蒙受损失。
最后，关于怎样看待人类的惩罚行为，我们要提出新的主张。我目前正在写一篇论文，主题是从进化角度出发可以通过哪些方式来理解惩罚，尤其是人类的惩罚。惩罚者支付成本来伤害目标，这一行为从原则上来说可以怎样让惩罚者获益？我一开始着重讨论了惩罚的功能性用途，即惩罚能让目标在未来的互动当中更倾向于与惩罚者合作，但是这一点对于人类来说其实并不重要。我在职业生涯当中收集到的全部实验证据——除了清洁鱼之外——全都不支持这种说法。另一种假说认为，被惩罚目标或许会与惩罚者的亲戚更加合作，从而为惩罚者带来间接的好处，不过我们还没测试过这个假说。还有一种假说认为，或许施加惩罚能让惩罚者获得凶猛可畏的声誉，看在眼里的旁观者会在未来与惩罚者互动时更倾向合作。这也可以是惩罚得到进化的积极选择的方式之一。最后是群体选择机制，今天我没有时间讨论，但是这项理论依然基于惩罚会让被惩罚者更加合作的假设：首先被惩罚者会与惩罚者本人更加合作，然后又会与群体当中的其他所有人更加合作，于是惩罚者或者惩罚者的亲戚就通过群体利益的增长获得了间接的好处。可是今天我呈现的证据似乎并不支持“惩罚会让被惩罚者更加合作”这一理论，这难免让我们怀疑这个社会群体选择的循环。
我最后要主张一条人类的惩罚行为得到自然选择青睐的可能路径。这条路径完全不涉及惩罚对于目标行为可能造成的任何影响。支付较小成本让其他人付出更大代价这一行为之所以在进化层面上有利，仅仅因为这会改变惩罚者与被惩罚者之间的相对收益差距。在这种情况下，我们完全不需要假设惩罚会改变被惩罚者的行为就能让惩罚得到进化的青睐，只要惩罚者能够提升自己相对于被惩罚者的社会地位就足够了。
总结一下，惩罚的手段似乎并不会改变合作者的行为，但是惩罚的可能性却的确会促进合作；我们知道人们经常进行反社会的惩罚行为，而且还会在互动的末尾施加惩罚，哪怕此时被惩罚对象已经没有了进一步改变行为的空间；我们还发现，大致上来说惩罚似乎并不特别关注损失本身，而是更关注不公平。综上所述，我想指出有一种可能的方式可以将这些发现整合成一种新假说。我们的新假说认为惩罚的目的往往是建立针对互动伙伴的压制关系，或者为了拉平乃至提升惩罚者相对于互动伙伴的收益，而不是将作弊者改变为合作者。上述所有关于经济博弈当中的惩罚行为的研究都设定了一比三的交换比——惩罚者花费一个筹码，可以让互动伙伴承担三个筹码的损失——这样一来就构成了拉平相对收益的固有结构。这还意味着当我们使用这种比例时，只要惩罚者的惩罚成本要比被惩罚者遭受的损失更低，我们就不能排除以下可能：人们在这些博弈当中进行惩罚时旨在改变收益结果而不是被惩罚者的行为。唯有这样才能解释为什么人们会在博弈末尾加大惩罚力度以及反社会惩罚为什么会存在：因为惩罚的动机是对于相对地位的关注，对于平等的关注，而不是对于损失的关注。
你或许还想问问，为什么惩罚并不会增进合作。如果我们将惩罚视作争夺支配地位的竞争而不是改变行为的工具，那么遭受惩罚之后轻易选择合作的代价可能非常高昂。在博弈当中，如果你一遭到惩罚就合作，就会发出“此人很容易支配”的信号，别人将会更倾向于强迫你就范，因此这并不是会被自然选择青睐的信号。我们需要更多的理论模型来进一步研究这一理念：以不合作来应对惩罚反而是进化层面的有利做法。
在现实世界当中，地位相当的同辈之间的相互惩罚非常少见，几乎想不到。这方面最好的例子来自狩猎采集社区。值得注意的是，这里的惩罚并非由一名个体针对另一名个体施加，而是群体针对某一名个体施加。狩猎采集社区的男性经常前往邻居的地盘偷牛。这种行为非常危险，有些人害怕了，要么不敢去，要么故意拖拉在大部队末尾，要么干脆当逃兵。这些行为当然让那些敢于亲身偷牛的社区成员蒙受了损失，于是一群年龄相仿的男性会聚集在一起针对逃兵进行基于共识的惩罚。这种场景非常不同于我们为了研究而设计的经济博弈，因为前者并没有留出多少报复惩罚者的空间。这种体制化、合法化的惩罚同样非常重要。这意味着我们通过经济博弈来研究的惩罚之所以无效，是因为人们认为这种惩罚没有合法性，其本质在于相互压制。如果我们想要思考惩罚究竟在什么时候真能促进人类之间的合作，就应该多想想合法性的问题。
在现实社会当中，人类的惩罚情绪的最常见表达方式或许就是传播流言。某人对你做了坏事，你就告诉其他人这个人干了什么坏事。这样可以损害目标的名誉，从而让他承担成本。流言具有与惩罚一样的收益结构：传播流言同样伴随着成本，因为听到流言的人会对传播者抱有负面看法；另一方面你的流言对象也会承受成本，因为你也损害了他的名誉。但是流言或许并不是旨在改变目标行为的同辈惩罚的最佳模型，因为到了传播流言的阶段，你与这位互动伙伴的合作已经结束，你并不打算通过惩罚迫使目标更加合作从而获取收益。流言或许更可能用来增进流言者与被流言者之间的相对地位平等。
最后，惩罚会将鱼类的背叛者变成合作者。但是根据我的研究，尚未发现发现惩罚对于人类也有同样的效果。人类经常会在不可能改变对方行为的前提下惩罚互动伙伴。我们研究的这一类惩罚或许最好视为争夺支配地位的竞争而不是强制合作的机制。我们需要问自己，在这些实验室研究人类行为与在现实世界研究人类行为，究竟会在多大程度上取得互有差别的发现？这也正是我们这个领域未来的前进方向。谢谢大家。
通宝推：bayerno,达菲,
- 复 265-Nichola Raihani：论惩罚的进化原理
  家园 狩猎社区那个，让人想起督战队
  作者的意思似乎在说，惩罚在政治领域内有效，在经济领域则无效。
  强制性、严酷性，这是惩罚合法性带有的特征，就像督战队，对不对就军法从事。

分页树展主题 · 全看首页上页下页末页

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明