一般不可能性定理的一般不相关性
一个幽灵已经在经济学和政治学的课堂和研究班上游荡将近15年了。对这个幽灵——阿罗的不可能性定理,一般解释是,它证明了总合偏好不存在切合实际的方法。本文的目的是驱除这个幽灵,不是要证明其以严格数学形式表述的定理是错误的,而是要表明它无关紧要。我将表明,当选定个人中的消费函数被假定为一种相当简单而且很可能是相互依赖的类型时,如果选民数量很大,这个问题就变得微不足道了。由于要求偏好总和的大部分情况都涉及大量人群,“阿罗问题”将鲜有多少重要性。
在《社会选择与个人价值》一书中,有一章的题目是《作为社会福利判断基础的相似性》。阿罗在其中讨论了各种可能的研究线索,这些线索或许可以导致避开他的证明中各种隐含意义的一种方法。在这一章中,他指出布莱克的单峰偏好曲线特别有希望。将布莱克单峰偏好曲线一般化,以适应多于一维的情况,将给出本文建立于其上的基本模型。因此,要说目前的工作是在遵循着由阿罗指出的路径,那可能是公平的。
纽因和布莱克在《有补充价值判断的委员会决定》一书中首先提出了二维单峰偏好。此书大约与《社会选择与个人价值》同时出版,但阿罗大概不了解这个情况。然而,纽因和布莱克并没有太多考虑有大量选民的案例。这里使用的模型将涉及许多选民,并将用来检验一般不可能性定理。
阿罗定理的证明需要循环多数或投票悖论作为证明的一个步骤。除了数学上的原因外,强调投票悖论也是适当的,因为在民主国家,直接出现在老百姓面前的总合偏好方法就是多数票表决。本文打算证明,多数票表决其实总会出现投票悖论,但是这并不重要。多数票表决不会产生一个“完美”的答案,但它确实产生的答案也不会比不存在投票悖论时更“糟”。任何涉及大量人群的选择过程肯定都会产生有无数小缺陷的结果;如果考虑得足够详细,这种结果总会偏离阿罗的条件。然而,这种偏离太小了,以致没有什么实际意义。
图1
在选举提案的每个微小细节用于选举之前,大部分多数票表决程序都有一些能使表决得到一个结果的安排。这些规则(常常是非正式的,不像命令的规则)意味着,在表决结束时,表决结果中几乎肯定会保留一些多数会赞同的小变化,要是有可能事先把这些小变化带到投票中的话。因此,用阿罗的话说,结果将是强加的,但这个结果将非常接近于完美的结果。举个例子,有一伙人正在为花钱办件事的数额进行表决,考虑的范围在从零到1000万美元之间。这些人的偏好是单峰的。多数票表决最终将导致把中间选民的最佳选择作为结果。然而,如果规定,100美元或100美元以下的数额改变将不予考虑,那么结果通常就不会是最佳的,但与最佳选择的差距也将在100美元以内。这个结果不能满足阿罗的条件,但也没有什么理由为这个事实而烦恼。
为了证明在现实世界的“偏好总合”中,循环多数也同样不重要,我们来看正在决定两件事的一组选民,比如说,用多数票表决对陆军和海军的拨款。在图1中,纵向是给陆军的拨款,横向是给海军的拨款。每个选民个人都有一种最佳组合和一大堆带有通常特征的偏好。为了简化,我们进一步假定,这些选民的最佳选择在这个空间内平等分布,而他们的无差异曲线全都是以他们的最佳选择为中心的正圆形。这后两个假设并不符合现实,而且在以后的一个阶段将被取消。我们还要进一步假定,选民的数量足够多,以致这个空间可以充当选民的代表。换句话说,在图1这个正在讨论空间的两个部分中,较大的部分比较小的部分包含了更多的选民最佳选择。这样就有可能使用简单的欧几里得几何学作为一种分析工具了。
假设我们想要确定图1中B的移动是否能用简单多数票打败由A代表的现状。由于我们已经假定,所有的无差异曲线都是围绕着这些个人最佳选择的正圆形,每个选民都将只对最接近于他的最佳选择的那种备选方案投赞成票。如果我们把A与B用一条直线相连,并在这条线上竖起一条垂直两分线,那么B将更接近于与B处于同一边的所有个人的最佳选择。同样,A也最接近于A所处一边所有人的最佳选择。我们只要注意到这个矩形区域在垂直两分线每一边的大小,就可以对这两种备选方案的得票数做出比较。作为一种捷径,如果垂直两分线通过了这个矩形的中心,A和B的得票数就是相等的。如果垂直两分线不通过中心,那么与中心同在一边的备选方案就将获胜。与A联系在一起的所有点的所在区域,是一个圆心通过A的圆,而A能够打败这个圆之外的任何点,但将被圆内的所有点击败。显然,不可能形成循环。这个过程将最终导致进入中心,因为在任何一对备选方案中,靠近中心的那个备选方案将总是获胜。
这或许可以称为完美的几何模型,其中的选民人数恰好与其所在部分成比例,而这些选民的最佳选择也落入这个部分。考虑到选民的数量是有限的,会出现小的不连续性。两个在大小上区别很小的不同部分,很可能会有同等数量的选民;其实,较小的部分甚至可能包括更多的选民。因此,循环是可能的,但是当作出选择的个人数量增加时,循环就变得越来越不重要了。在图2中,在我们标准形态的正在讨论的空间中有个A点,我已经围绕它画了个圆。为方便,我要假定有999999位选民。这个圆中的任一点是否能击败A,取决于垂直两分线如何与A部分选民的最佳选择相连接。当沿着圆周移动时,我们可以试用圆周上的每一点与A比对。B会击败A,但是C不会。在选民数量有限的情况下,这两种移动之间的变化会是不连续的。例如,B或许有602371位选民,而A有397628位选民。当我们沿着圆周向C移动时,会有一个很小的空间中选票的情况保持不变;然后,它会突然变到602370对397629,这种情况也会在圆周上保持一个很短的部分。不必说,选票保持不变的这个片段会极小,但肯定会存在。
如果我们来看这样一点,在这点上只有比A最起码的多数,500000对499999,在沿圆周向B移动时,就将有一个有限的距离,其中的选票数量是保持不变的,然后,它将变动到A为500000,另一点为499999。然而,考虑到这个有限的距离,可以肯定至少偶尔会有一点能被比它距中心更远的另一点击败。换句话说,多数票表决有可能远离中心,也有可能向中心移动。这个现象使循环成为可能。
然而,考虑到这种不连续性,我们还可以画一条线,把对任何点都能形成多数的点与不能形成多数的点区分开。考虑到我们有999999位选民,这条线无疑会出现在图1中肉眼可见的圆形上。然而,如果用显微镜来考察,我们会看到它并非精确的圆形,还会看到有一些小的部分可以对原来的点形成多数,但它们的位置可能比原来的点距中心更远。但是,请注意,这些部分会非常之小。如果我们原来的点离中心很远(就像图1或图2中的A点),那么,能形成胜过A的多数但离中心更远的那个部分,与能够形成多数又离中心较近的部分相比,就会是微小的。
图2
在这些情况下,除非以尽量小心控制和计划的方式利用提出变革的提案,否则,表决过程就完全有可能导致向中心的迅速移动。糟糕的是,在到达绝对中心之前,收敛不必是连续的。为了靠近中心,既偏好A又离中心较近的部分比原先还要小得多。因此,比第一种情况更可能的是,选中替代A的点会比A离中心更远。循环变得更有可能了。当我们离中心非常近时,从对任何点都可能形成多数的点中随机选出的一点,就会完全有可能比它现在的位置离中心更远一些。然而,在这一点上,大多数选民都会感到,新的提案过分琐细,而且会采取行动换个地方。
对于这一点的讨论,可以用一条我们将称之为“中位线”的线得到简化。中位线是一条穿过两个人的最佳选择,并把剩下的最佳选择要么分为两个均等的“一半”,要么,在最佳选择的数量为奇数时,分为两组,其中一组比另一组多一个最佳选择的线。图3表明了这样一条线和一个点A,A不在这条线上。如果我们从A点画一条垂直线到中位线上,那么,垂直线的基点A’ 就会比A离中位线另一边的所有点和线上的两点更近。因此,它可以对A形成一个多数。实际上,正如图3所示,会有一个小菱形,概括了可能对A形成多数的点。然而,这个菱形的几何图形将依个人最佳选择的准确位置而略有不同,所以我们将仅限于研究这种简单的垂直关系。
图3
大多数这些中位线都会在讨论的空间中央的一个小部分相交。如果我们把这个小部分放得很大,并且只取少数几条中位线,我们就会得到看起来像图4所示的情况。如果我们从A点开始,那么,我们的定理指出,B可以形成对A的多数,另外,C可以形成对B的多数。同样明显的是,还会有其他一些能够对C形成多数的点。在这个一般部分中从任何点开始,都将可能选出一些对该点形成多数的点。因此,没有哪个点能对所有其他的点形成多数。
图4
当然,有一束两分线相交的这个部分非常小,但在某些情况下,相交的点或许远离正在讨论的这个空间的中心。假定有一个呈奇数的点群,我们选择其中在这个正在讨论的空间中最靠外边的一个点。通过这一点有可能画两条线,每条线都通过另一个点。而且每条线都对最佳选择进行了区分,以致线的一边只比另一边多一个最佳选择。这两条线的夹角会极小,但是通过放大这个角,我们得到了图5所示的情况。在这两条线的上方会有499999个最佳选择,下方也有同样数量。这两条线上的三对点构成了我们的总数999999。如果我们从这两条线中无论哪条上的任一点开始,就如A,我们都能向对方引一条垂线,并获得能对第一个点形成多数的一点。重复这一过程,我们就会最终接近于交叉点。根据假定,这个点位于这个空间的最外边。因此,用简单多数表决,很有可能达到这个讨论空间中几乎任何部位的点。无须说,这样的一连串选举是完全不可能的。人们可以轻易地认识到这一点,因为它会涉及很长的一系列选举,而每一次选举都会在多数与少数之间只有一票之差。由于我们在现实世界中从未见过这种情形,我们可以相当自信地说,这种类型远离中心的移动并没有出现。
图5
由于标准的表决程序不支持无限细分的判断,多数票表决不会导致独一无二的结果这一事实似乎没有什么重要性。布莱克定义了“多数人的动议”(majority motion)这个命题,指的是“能够对所有其他有关动议形成一个简单多数”。程序规则使得这样一种动议不大可能将由多数票表决选出。表决结果应该是这样一种动议,它对所有其他动议不能形成简单多数,但只对那些很不同的动议形成简单多数,以致那些动议能在程序规则之下来反对这个简单多数。这个结果是个近似值,但是个令人相当满意的结果。因此,如果没有真正的多数人的动议,如果没完没了的循环就是为获得完美判断的努力可以预见到的结果,表决就根本不会改变结果,即使循环只涉及打算进行一些小的改变,也会被裁定为不符合程序。甚至当循环稍微扩大了一些表决权不明确的范围时,这也只会是个微小的缺陷。只有当循环实质上涉及“行动步骤”,超过了程序规定所能允许的最低限度时,循环才会是个重大问题。
对于现实世界中可能的循环规模的调查,可以通过对选民分布和程序规则的假设来进行,然后,计算各种动议中最可能出现的循环,这些动议必须很不一样,以致必须付诸表决;也可以通过观察现实世界进行。对这种现象的少量事例似乎可以有两种解释。一种是,这种现象确实极少出现,这样就会与上述理论考察相一致;再一种是,即使出现了这些循环,它们的存在也难以觉察。
为了考察在现实世界中循环事例的缺乏不是由于它们极少出现,而是由于难以觉察这种可能性,我们来看一下大多数代议制民主所使用的实际的投票表决方法。根据罗伯特规则,或是根据已存在的数不胜数的变量,这种方法非常复杂。我们不必详细考察这些规则,只要用它们简化的一般形态就足够了。因此,我们来考察下面的做法。有一个改变现状的动议。随后提出了对这一动议的修正案,还有对这一修正案的各种各样的小修正。所有的大小修正都可以被看作是独立的提案。这种做法区别性的特征是,整套提案全都是在投票表决之前提出的,然后按照前面已知的固定顺序进行表决。
假设现状为A。B是提出的一个动议。只有当提议人认为C有可能击败A和B时(或者,在特殊情况下,如果C有可能导致循环停止时,这一点将在下面讨论。),才会提出C。但是,人们可能会犯错误。那么,假设有人一时疏忽提出了修正案C,继之而来的还有小修正D。D是正确计算的结果,并能击败A、B和C。出于我们的目的,我们可以制订一套简单的规则,规定这些动议、修正案和小修正按照与提议时相反的顺序进行表决。因此,D会被用来反对C,而且会取胜;会被用来反对B,也会取胜;然后会被用来反对现状A,并再次取胜。请注意,C是个计算错误,除了使投票表决稍微推迟之外,对于表决没有影响。这类错误是肯定会犯的;人的心中总会冒出一些期待(hope springs eternal in the human breast),但这些期待不会对结果产生影响。因此,我们可以不理睬这些期待。
现在来看一下循环的可能性。在图6中,我们开始于现状A。假定提出了一个动议B,B有可能击败A。不论是出于偶然,还是出于计算,或许会提出另一个动议C,C可能击败B,但可能败于A。喜好A不喜好B的人们故意发明了这样一个循环,但是他们意识到,在直接冲突中,B会取胜才是理性的。当然,这个循环的存在,并未阻止提出其他修正案,比如说D,D可能击败这个循环中的任何一个成员。
图6
然而,如果没有提出D,对C、B和A的投票表决不会马上导致一个明显的循环,因为如果按照规定的顺序投票,就会选择A。但是,这种类型的隐匿循环不会导致稳定的结果。一旦投票表决导致回归现状,就会产生对于进一步改革提案的迫切需要。如果严格规定禁用已经被否决的措施,那么,某种另外的提案,比如说B’,就会被提出来。我们可以期待看到基本上是同样的一系列提案和修正案一遍又一遍地追述。在实际的立法实践中,这类重复的缺失表明,在现实世界的立法活动中几乎没有什么隐匿循环。至此,我们着重关注的是只有两个变量且都是连续变量的情形。这个多维讨论空间结论的一般化是明显的,但转变为不连续变量,这种作用可能就不明显了。在图7中,我们展示了两个变量均为不连续变量的情形,并因此,在讨论空间中只有某些点才可能存在。这个限制条件造成的主要区别在于,现在能够对某个点形成多数的点少得多了。例如,A点仅在有六个点标明为X时才能占多数。对A占多数的诸点之一很可能比A距中心更远或同样远。当点的总数很小时,这些点也会减少,而且处于一个循环中的一系列点也可能很小。小小的中心区——其中的每个点都有另一个点对它形成多数——往往并不存在,只因为在这个区域内的点太少了。另外,循环只是不大可能,并非不可能。如果确实出现了循环,如果点与点之间的距离巨大,因此这个循环肯定涉及政策的巨大差异,那么这个循环的影响可能就不只是略微重要了。总之,在不连续的讨论空间中,循环肯定是极少的,而一旦出现,往往是重要的。
图7
至此,我们的讨论一直基于个人偏好结构的一种特殊相互依赖之上。根据假定,社会状态、产品和法律在许多特征上都是不同的。这些特征中的每个特征都可以沿一轴线进行排列,无论是作为连续变量还是作为一系列的点。假定每个人在由此形成的维度空间中都有一个最佳选择点,再假定当我们从他的最佳选择点向任一方向移开时,这个人的满意度都会下降。这后一个假定,用完全循环的无差异曲线来表示就太强了,所以我们不久后将证明,一个弱一些的假定也成立。同样,我们对于所讨论空间中最佳选择平均分布的假定也是一个简化了的假定,这个假定不久后就会被放弃。然而,将这两个问题置于一边,经济学家们应该会对这个总图提出几点反对意见。这些条件不成立的特殊事例可以创造出来,但是在导致这类偏好体系的环境中,大部分选择问题还是会提出来。每个人都会有一个这类偏好结构的事实,加上他们全都处于同一个多维空间的事实,使他们有相当大的可能形成相互依赖,而我们的结论在本质上就得自这种相互依赖。然而,请注意这种相互依赖相当特殊的形式:我的偏好无论如何都不会影响你的偏好。实际上,只有当我们在同一套备选项中进行选择,而这些备选项又都仅限于能导致我们结论的偏好结构形式时,这种相互依赖才会出现。
至此,我们已经使用了两个不真实的假设:1)无差异曲线全都是正圆形;2)个人的最佳选择平均分布在所讨论的空间。取消这两个假设将使这个模型比较真实。让我们从比较真实的最佳选择分布开始吧。常见的分布大概是这样的:让最佳选择按铃铛的形状进行排列,让其峰值出现在所讨论空间中的某个地方。这种分布对我们的证明没有提出什么特殊问题。还能够建立“中位线”,而且这些中位线也还会大多在分布的峰值附近交叉。这就意味着,会存在向中心的一个小区域移动的同样趋向。同理,一个倾斜的正态分布也不会造成什么特别的困难,尽管大多数中位线的交叉点不一定就在这个分布的峰值上。
图8
多峰分布(multi-peaked distribution)提出了比较多的困难,尽管我能够提出的导致有意义循环的仅有事例都是多峰分布的极端情况。举个例子,如果最佳选择被排列为离散的呈三角形的三组,如图8所示,而且每一组都大致为总量的三分之一,那么,就会在一个有意义规模的区域出现循环。或许,发现这类现象的一般困难可以用把最佳选择分为大致相等但并不导致大循环的四个组来加以形象说明。
如果有大量的人员参与决策过程,取消“无差异曲线是正圆形”的假设不会提出特别的困难。阿罗在写他的书时谈到了选择一个“社会福利函数”的问题,而这显然会使数以百万计的人参与进来。在更为一般的集体选择问题上,通常也会有足够多的个人偏好可以被“加总”,以至可适用于大数法则。既然有大量的个人,任何合理的偏好结构都将以多少与我们的正圆同样的方式被加总。平均说来——有大量选民,平均值是有意义的——多数票表决将选择离多数选民的最佳选择最近的备选项。例如,假定我们有两个100万人的选民组,A和B。假定有两个备选项X和Y,X的位置距A组所有成员的最佳选择近一些,而Y离B组所有成员的最佳选择近一些。我们会预见到,如果这个选择是让这200万选民来做,即便A组中有10万选民的偏好如山的形状那般凸起,表明他们偏好Y而不好X,也会有大约100万张选票选X,有大约100万张选票选Y。之所以会这样,是因为大数法则指出,缺少某种特殊现象,B组中也会有大约10万选民偏好X而不好Y。
但是,请注意,我们这里得到的只是一个大致结果。由于选民平均分布,我们会预见到,小小的随机变量会决定选举。然而,如果这两组的人数不同,差额大于可能的随机变量,结果不会受到影响。因此,考虑不是正圆的无差异曲线,而引进一个相当于随机变量的做法会使我们的结论模糊一些,并扩大这个分布中心的那个小区域,小区域中可以出现少量循环,但并不能从根本上改变我们的结论。
多数票表决过程通常导致一个确定的结果,而这个结果往往是令人相当满意的,这一点不会令从事实践活动的人们感到惊讶。显然,这就是实际发生的情形。阿罗的书提出的真正问题之一是,为什么现实世界的民主运行得相当好,完全不顾理性总合偏好逻辑上的不可能性。我提供的解答就是,没有哪种决策过程会完全满足阿罗的标准,但是非常常见的决策过程在极高的近似程度上满足了这些标准,使我们能够在理论上的不可能性与民主的成功实践之间达成和谐一致。