三、实验情况_外国刑事司法实证研究-QQ阅读男生历史网

上QQ阅读APP看书，第一时间看更新

三、实验情况

（一）研究假设和实验计划

根据前文阐述的理论，将通过实验对以下研究假设进行检验。第一个假设预测了不同初始条件（Ausgangsbedingung）（案卷信息，参与权力的范围）下可能出现的判决差异。第二个假设涉及一个至今未被考虑的方面，即刑事法官和检察官对侦查案卷的不同评价。通过第三和第四个假设可以检验不同的初始条件怎样影响法官对审判程序中信息的记忆。

假设一：如果刑事法官在审判程序开始前就知道侦查案卷的内容，那与不知道案卷信息的情况相比，他在审理后更少作出“存疑时有利被告人”的决定。法官在审判程序中的参与权力（询问证人的机会）越多，这一效应就越强。

假设二：知道案卷信息的情况下，刑事法官会比处于审判长位置上的检察官更少认识到侦查工作中可能的缺陷，因此刑事法官比检察官更少在审理后作出“存疑时有利被告人”的决定。

假设三：知道案卷信息的情况下，对于审判程序中信息的记忆会发生更多错误。

假设四：不知道案卷信息的情况下，如果存在询问证人的机会，那么与不存在这种机会的情形相比，记忆审判程序中的信息时发生的错误更少。

下列假设的基础是起源于Festinger的思考，即当人们对于自己的决定非常肯定并因此相信足以反驳不协调（即与自己决定矛盾的）信息时，他们会积极搜寻不协调的信息。[1]如果人们还赞同社会心理学家Frey的观点——只要已经存在一个暂时的或者说非终局性的决定，人们就会有选择地搜寻信息[2]，那么对于此处的问题可以作出如下预期：相较于法官没有前知识而没有在审判程序前对被告的罪责形成假设的情形，当他由于阅读侦查案卷认为之后作出有罪判决的可能性很大时，为了证实这一前假设，法官会在审判程序中搜寻更多的不协调信息，也就是说会向有利被告的证人提出更多问题。相应的研究假设是：

假设五：知道案卷信息的情况下，法官会在审判程序中对有利被告的证人提出更多问题。

像上文已经简短提及的那样，本研究还要收集有关法官量刑的更确切信息。根据之前做的初步研究我们推测，由于预先给定的导向性数值（Orientierungsvorgabe）的存在，法官拥有的裁量空间被有层次地缩减。导向性数值一方面表现为立法者规定的刑罚幅度，另一方面表现为对特定犯罪量刑时如何利用法定刑罚幅度的信息（“价格区间”）及关于其他法官在这一区间内一般判决何种刑罚的提示。因此，作出有罪判决的法官应该会在量刑时表现出假设六中所述的行为。

假设六：如果告诉一些法官，其他受试者判决的刑罚平均来看处于“价格区间”的上半部分，同时告诉另一些法官，其他受试者的量刑平均处于“价格区间”的下半部分，那么前者判处的平均刑罚会比后者更高。

为了检验这些假设而选择的实验计划中，作为自变量（unabhängige Variable）的“案卷信息”（存在/不存在）和“审判程序中的参与权力”（询问证人的机会：有/无）被系统化地改变，由此产生了如下几种实验条件：

（1）知道案卷信息/有机会询问证人；

（2）不知道案卷信息/有机会询问证人；

（3）知道案卷信息/没有机会询问证人；

（4）不知道案卷信息/没有机会询问证人。

第一种实验条件大致上模拟了德国刑事诉讼程序，第四种则模拟了英美刑事诉讼程序；剩下两种实验条件是检验假设所必需的混合形式。对上述第二个假设的检验通过将上述四种实验条件在刑事法官和检察官中随机（per Zufall）分配来实现。

原本计划还要实现“亲自决定是否开启审判程序”这一条件，但是最后放弃了。因为根据经验，法官和检察官参加这种研究的意愿很低，而每增加一个实验条件都会不可避免地导致受试者数量也要不成比例地增加。此外，即使实现了这一实验条件，所能得到的理论和法律政策上的知识增益预计也很少。一方面是因为它对于假设的检验并无必要，另一方面是因为，如果人们同意司法从业者的观点，开启审判程序的裁定差不多只是例行公事或者说走过场而已。

（二）进行实验

1．参与者

一共58位刑事法官和检察官参与了此项研究（其中刑事法官35人，检察官23人）；他们被随机分配到不同的实验条件。此项研究主要在位于特里尔（Trier）的德国司法学院（Deutsche Richterakademie）中进行，所以参与实验的法官来自整个联邦。此外还有部分研究在费尔登（阿勒尔河）（Verden（Aller））地方法院和海德堡（Heidelberg）地方法院、区法院以及检察院进行。这种情况下，本次研究自然并没有对全联邦的刑事法官和检察官进行有代表性的抽样，对于一个实验来说这也并非必要：前提是——统计学家Sachs写到——“存在随机抽样，在这一过程中总体的每个部分都有一样的机会被选中”。[3]当下众所周知的统计学分析过程使人们能够在少量受试者的帮助下检验假设。如果假设能在仅有较低观测值（Beobachtungswert）的条件下得到证实，那么这一结果甚至应该得到很高的评价，因为“实验者（Experimentator）采用小样本量本来就不利于验证自己的假设”。[4]

2．案卷材料

供受试者评判的案卷基于20世纪70年代末慕尼黑区法院（参审法庭，Schöffengericht）审理的一个真实案件。被告是一个律师，因涉嫌私放犯人未遂而依据《德国刑法典》第120条、第22条和第23条被提起公诉。这一案件以一审宣判无罪告终。选择该案作为实验材料的原因如下：这是一个难以作出判决的案件，被告否认对其不利的案情，判决仅仅建立在证人证言基础上，没有其他物证（Beweisgegenstand）。对仅有的证人证言的评判很困难，因为证言中存在矛盾，且其中的五位证人（所有不利证人以及主要的有利证人）是被羁押人，他们有时会给彼此造成压力。为了实验，我们对该案的侦查案卷和审判记录做了匿名处理，并在保留“真实”案件核心特征的前提下精简了材料篇幅：受试者获得的侦查案卷有46页，审判记录的长度相当于约30页打字机制作的文档。

在此还必须指出一点，侦查案卷中提到的一切可能对判决有重要影响的信息都会在之后的审判程序中出现。这就保障了知道或者不知道案卷信息的两种实验条件下提供给受试者的信息是一样的。

法官和见习公务员（Referendar）参与的初步研究表明，不知道案卷信息时，对这一案件的评价是非常不同的：无罪和有罪大约各占一半。[5]

3．实验过程

研究针对每个受试者单独进行，通过和微型电脑相连的显示屏向受试者呈现同样的审判记录。原本计划的音频/视频方式由于技术原因不可行，因此信息全都是以书面方式出现的。虽然此种信息呈现方式乍一看更贴近现实，但会带来多种方法上的问题，比如必须确保被告和证人在外表、手势、谈吐等方面给不同受试者一样的印象；这只有通过不真实的、乏味的图解方法才能实现，而这又和司法实践没有什么关系了。对我们来说具有根本重要性的是信息加工及其在审判过程中的意义，因此我们重视的是营造能够可靠模拟德国刑事诉讼程序的实验场景，它能给相应实验条件下的受试者以积极方式干预程序的机会：受试者可以从出庭的七位证人中选择两位，在他们做完陈述后对他们提出有关案情的问题；但受试者不知道的是，他们可以询问的永远是案件中的第一和第三位证人。受试者仅被告知，他们只能对两位证人提问——至于是哪两位证人由电脑通过随机程序决定。亲自询问证人有助于提高受试者的注意力，虽然由于技术原因在实验中询问所有证人是不可能的，但是能够询问两位证人的指示应该足以在实验过程中唤起受试者接近司法实践中水平的注意力了。借助特别开发的电脑程序我们解决了如何保障所有受试者，包括那些没有询问证人机会的受试者，获得同等信息量的问题。在没有询问证人机会的条件下，该程序的设计使受试者能从检察官和辩护人对证人的询问中“消极”地获得信息；有机会询问证人的受试者亲自向两位证人提问并且每次得到一段文字作为回答，这种回答与“消极”条件下检察官和辩护人提出的类似问题得到的回答是相同的，也就是说存在询问证人机会时受试者直接和屏幕交流。所有受试者没有通过亲自提问获得的信息都会在之后检察官和辩护人对证人的询问中出现。如果对受试者提出的问题电脑中未存储适合的回答，屏幕上就会出现诸如“不知道”或“记不清了”的套话。见习公务员和检察官参与的试调查（Vorversuch）检验了电脑中是否已经存储了大部分问题的合适答案，因此很少有必要使用这种套话。我们还进行了附加检验，即在没有询问证人机会的条件下同样要求受试者对实验前就指定了的两个证人提问。但这些问题不会得到直接回答，受试者在提出自己的问题后会看到完整的、由检察官和辩护人进行的询问。借此我们再次检验，就对实验至关重要、有询问证人机会的组别而言，电脑中是否已经存储了足够的回答。再次简要重复：有询问证人机会的受试者可以询问两位证人并且从显示屏上获得相应回答；受试者不知道他们提问的是哪两个证人。没有询问证人机会的情境下，受试者得知检察官和辩护人询问证人的情况；此时仅仅为了检验目的而要求受试者对实验开始前指定的两个证人提问，但这些问题不会得到直接回答。在两种实验条件下的信息量是完全相同的。

如果受试者被分配到“知道案卷信息”这一实验条件，那他们会在实验前几天收到侦查案卷；案卷最后一页是一位受试者不认识的法官作出的开启审判程序的裁定。对“不知道案卷信息”的受试者来说，实验直接以在电脑显示屏上呈现的审判程序开始。

所有受试者会在实验开始前被告知，他们的任务是在实验最后作出有关罪责问题的决定。实验过程中他们可以做笔记；但不能“回顾”描述审判程序的文本。受试者可以自己控制文本呈现的速度，所以没有人会有时间上的压力（实验时长平均约为90分钟）。实验结束前，也就是就罪责问题作出决定后，所有受试者都要回答一份调查问卷，它会测量记忆力和偏见（Urteilsverzerrung）。一共11条事实上作出的、从审判记录中截取的证人证言组成了这份问卷的框架。我们根据每条真实证言设计了一到两条类似但是内容已经发生变化的陈述，并将它们放在一起，受试者的任务就是辨认出正确的证言。[6]建构这一测量工具（Meßinstrument）时我们以美国法律心理学家E. Greene的研究为导向。[7]他通过实验方法查明，事实上作出的陈述以及新添加的陈述中，和作出的判决一致的陈述会被更好地记忆。如果受试者作出有罪判决，（在分发有关记忆的调查问卷前）还会询问其量刑结果。

见习公务员和检察官参与的试调查于1984年春季和夏季进行；刑事法官和检察官参与的正式研究始于1984年秋季终于1985年夏季。

（三）实验结果

1．受试者分布

在探讨单项假设的检验结果之前，下表1先简要介绍一下受试者在不同实验条件下的分布（Verteilung）。[8]

表1 受试者分布

下表2进一步对刑事法官和检察官做了区分：

表2 刑事法官和检察官的分布

2．假设一的检验结果

假设一预测，知道案卷信息的刑事法官比不知道案卷信息者更常作出有罪判决；即使法官像德国刑事诉讼程序中一样可以在审判程序中询问证人，这一效应也会出现。下表3提供了刑事法官在不同实验条件下判决行为的概况。

表3 刑事法官的判决行为

引人注目的是，知道案卷信息的所有（!）刑事法官都作出了有罪判决，无论是否具备询问证人的机会。与此相反，法官仅知道审判程序中出现的信息时，没有询问证人机会这一条件下，大部分法官还是判决被告有罪，但有机会询问证人的条件下大部分会作出无罪判决。也就是说，可以于审判程序中询问证人的情况下，假设一预测的案卷信息对判决行为的影响会表现出来。两组之间的差别（有侦查案卷：8人判决有罪/无人判决无罪；无侦查案卷：3人判决有罪/8人判决无罪）非常显著（hochsignifikant），代表概率（Wahrscheinlichkeit）的 p值为．002。统计学比较根据“Fisher精确性检验”（Fisher-Exact-Test）进行，这种方法最初就是为小样本的统计检验的情况而发展的。以下对概率值“p”做一简要解释：“零假设”（Nullhypothese）和“备择假设”（Alternativhypothese）是统计学中的两个重要概念。零假设的内容是，实验组和对照组之间不存在显著差异，即便两组之间不完全相同，这种差异也是由于随机误差造成的。与此相反，备择假设预测是指实验组和对照组之间存在显著差异，这种差异是由实验处理而非随即误差造成的——它构成了实验假设：此处也就是案卷信息对判决行为的影响。可以把p理解为零假设正确的概率。[9]现在概率值p达到了．002（＝0.2%），这一结果意味着，错误地拒绝零假设的概率只有低于1%，只有．002，或者换句话说，这里观察到的两个实验组之间的差别有高于99%的概率不是随机过程或者说偶然导致的。

结束这段短小的关于统计学的题外话之后还是回到我们的实验结果：不能询问证人的条件下，侦查案卷信息对判决结果没有表现出显著影响（表3的右边一栏）；这一结果很容易解释，因为即使没有侦查案卷信息大部分法官也作出有罪判决（5人判决有罪/2人判决无罪）。有趣的是，在不知道侦查案卷信息的条件下比较有机会与没有机会询问证人的两组：有机会询问证人的一组里更多法官判决被告无罪，不能询问证人的一组中更多判决有罪（3人判决有罪/8人判决无罪vs. 5人判决有罪/2人判决无罪；p＝.09，差别显著）。这一结果很重要，因为它提示我们，就像假设四预测的那样，在这两种条件下对信息的加工和记忆是不同的。

3．假设二的检验结果[10]

之前我们预测了刑事法官和检察官不同的判决行为，即法官比检察官更少在审理后作出“存疑时有利被告人”的决定。作出这一预测的理由是，处在审判长位置上的检察官评估侦查结果时会采取批判性更强的立场，因此更常作出“存疑时有利被告人”的决定。就像表4显示的那样，这一猜测被证实了。表4展示了知道案卷信息时的判决行为。

表4 知道案卷信息时刑事法官和检察官的判决行为

无论是否存在询问证人的机会，法官和检察官之前的差异在统计学上都是显著的（可以询问证人：p＝.02；不能询问证人：p＝.01）；因此假设二也被证实了。

甚至不知道案卷信息时刑事法官和检察官之间也存在判决差异，更确切地说是当受试者扮演消极角色，不能询问证人时。

不存在询问证人的机会时（表5右边一栏）刑事法官和检察官之间的差异在统计学上是显著的（p＝.08）。只有当存在询问证人机会时，刑事法官和检察官才会作出同样的判决，即多数判决被告无罪。也就是说，只有在“不知道案卷信息但有询问证人机会”这一条件下，刑事法官才会表现出异于其他实验条件下的判决行为。这一结果是进一步的例证，表明这一条件下实验中呈现的信息被以不同的方式加工——这种不同在于，法官不再对间接证据（Indizien）作出与事先存在的有罪判决概念（Verurteilungs-Schema）[11]方向一致的推断，而是“客观中立”地感知和加工信息。造成这一情况的原因在于，不知道案卷信息导致推断机制不能起作用，只有这样法官才能够意识到对被告罪责的怀疑。

表5 不知道案卷信息时刑事法官和检察官的判决行为

4．假设三的检验结果

假设三部分涉及刚才提到的猜测：我们预测，知道案卷内容时，对于审判程序中信息的记忆会发生更多错误。通过调查问卷考察（详见附录）的11条证人证言中，知道案卷信息的一组平均能正确回忆6.59条，不知道案卷信息的一组平均7.69条，明显超过前者。借助 T检验（TTest）进行的统计学比较得到了有显著性的结果（t ＝2. 05; df ＝52;p＜.05）；也就是说，假设三预测的差别能被证实。进一步的分析中，我们还把记忆表现与作出的判决相关联后再相互比较，得到了如下有趣的结果：知道侦查案卷的内容且作出有罪判决的受试者（法官和检察官）平均能够正确回忆6.35条证言，是所有组别中最少的；与之形成对比的是：知道案卷信息且判决无罪的受试者平均能够正确回忆7.29条证言，不知道案卷信息且判决被告有罪的受试者7.80条，不知道案卷信息且判决被告无罪的受试者7.63条。知道案卷信息且作出有罪判决的受试者的记忆表现都不好，有机会询问证人的组别平均能正确记忆6.4条证言，没有机会询问证人的组别6.3条证言。这再次体现了案卷信息明显的决定性影响：它控制审判程序中对信息的接受，导致特定的判决（通常为有罪判决）。

表6 正确记忆证人证言的数量

5．假设四的检验结果

我们要像刚才那样再次强调，案卷信息显然构成一个决定性因素（Einflußvariable）。如果人们自问，没有前知识时会发生什么，那么他们可以看看以下情况：如果受试者有机会询问证人，那么他们平均能正确记忆8.65条证言；如果与此相反他们更多扮演消极的观察者的角色，那么能够正确记忆的证言的数量明显下降，平均为6.33条。两个实验组别之间的这一差别是统计学上显著的（t＝3.69; df＝25; p＜.01）；也就是说，可以认为假设四已经被证实了，即不知道案卷信息的情况下，如果存在询问证人的机会，那么记忆审判程序中的信息时发生的错误更少。在此我们必须再一次想起，就像上文提及的，“不知道案卷信息但有询问证人机会”是唯一导致多数刑事法官作出无罪判决的实验条件。在这一条件下判决无罪的法官，平均能够正确记忆9.25条证人证言，与所有其他组别相比显示出最低的错误率：这证实了我们已经多次提出的猜测，刑事法官无前知识又能积极主持审判程序的刑事诉讼格局是实现“客观中立”的信息加工的最佳方案。

6．假设五的检验结果

我们的实验建构第一次创造了这样的场景，即受试者可以在实验的、可控的（experimentell-kontrollierbar）条件下询问证人。这样就能在可对比的条件下获得对信息搜寻行为更准确的解释。根据假设五我们预期，与不知道案卷内容就直接进入审判程序者相比，在审判程序前已经根据案卷信息作出了判决有罪的暂时决定的受试者会打听更多的不协调信息来证实自己的前假设。

实验结果证实了这一设想：知道案卷内容时受试者平均对有利被告的证人提出5.1个问题，明显多于不知道案卷内容时的平均1.9个问题。然而类似的差别也出现在对其他证人的询问中，尽管他们是不利被告的证人；知道案卷内容时平均提问4.3个，不知道案卷内容时平均1.9个。可以确定，受试者知道案卷内容时通常比不知道案卷内容时提出更多问题。如果人们还根据受试者作出的判决（有罪/无罪）做进一步区分，那么情况如下：知道案卷内容时，判决有罪者平均提出11.4个问题，反之，判决无罪者平均仅4.8个问题；类似的倾向在不知道案卷内容时也出现了：判决有罪者7.3个问题；判决无罪者2.7个问题。这一结果是值得注意的，因为它表明，判决有罪者通常比判决无罪者打听更多信息。联系上文已经提到过的实验结果可以发现，更大的信息需求并不伴随更好的信息加工：那些知道案卷内容后进入审判程序的受试者提出了最多的问题，但记住了最少的证人证言，并且判决被告有罪。与此相反，不知道案卷内容就进入审判程序的受试者很少利用他们拥有的询问证人的机会，但正确记忆了最多的证人证言，且多数作出了“存疑时有利被告人”的决定。

还应该提到的是，我们还对受试者提出的问题进行了内容分析法（inhaltsanalytisch）的评估。评估显示，无论提问的数量多少，受试者感兴趣的几乎一直是同样的主题（如越狱的过程，怎样获得材料等），考虑到公诉指向的罪行这并不让人意外。从内容方面看，刑事法官和检察官提出的问题并没有差异。

7．假设六的检验结果[12]

最后检验的是，作出有罪判决的受试者是否会根据预先给出的导向性数值（Orientierungswert）对量刑时可用的裁量空间做可预测的缩减。我们先告知受试者，根据《德国刑法典》第120条结合第23条、第49条，私放犯人未遂的刑罚幅度是两年三个月以下的自由刑。他们得到的第二个信息是我们公布的虚构的“价格区间”，他们被告知，德国最近几年对这一罪行判决的刑罚在6个月徒刑缓期执行和18个月徒刑之间。前文提到的两个信息通过同样方式告知所有作出有罪判决的受试者。给出第三个导向性数值时，这些受试者被分为两组：一半作出有罪判决者被告知，其他受试者在实验中判处的平均刑罚是9.4个月徒刑缓期执行，另一半则被告知其他人判处的平均刑罚为11.6个月徒刑缓期执行。根据假设六我们预期量刑结果会向之前提到的两个方向发展：或者是9个月徒刑缓期执行，或者是12个月徒刑缓期执行。实验结果如下：当预先告知他人的量刑平均为9.4个月徒刑缓期执行时，受试者判处的刑罚平均为11.4个月。除了两个例外，都适用缓刑。这一条件下判处的最轻刑罚是6个月徒刑缓期执行，最重刑罚是15个月徒刑。告知他人判处的平均刑罚是11.6个月徒刑缓期执行时，受试者判处的平均刑罚是10.3个月。除了一个例外（13个月徒刑），都适用缓刑。这一组的量刑在6个月徒刑缓期执行和15个月徒刑缓期执行之间；两人判处了罚金。假设六没有被证实，也就是说我们给出的两个关于量刑的导向值对于判处刑罚的轻重无决定性意义；只能确定存在简洁倾向（Prägnanztendenz）[13]，即在两种条件下12个月徒刑缓期执行这一刑罚都是最常见的。

[1] Festinger, L. , Conflict, Decision, and Dissonance. Stanford, Calif. :Stanford Univ. Press, 1964．搜寻到不协调信息后，人们通过对其的成功反驳进一步坚定了对自己决定的信念。——译者注

[2] Frey, D. , Die Theorie der kognitiven Dissonanz. In:D. Frey（Hrsg.）, Kognitive Theorien der Sozialpsychologie. Bern:Huber,1978. Festinger认为有选择地搜寻信息的情况仅发生在人们作出决定后，决定前人们对新信息的接受是不变形、无偏向的。而Frey根据系统研究指出，有选择地搜寻信息的情况在人们作出决定之前就已经出现了。只要人们有了一个暂时的决定，即确定了某个选项，并致力于维持这一决定，信息搜索上的选择性就会发生。——译者注

[3] Sachs, L. , Angewandte Statistik, Heidelberg:Springer,1974.

[4] Irle, M. , Lehrbuch der Sozialpsychologie, Göttingen 1975. Irle的观点是，大样本量的田野调查能够增加实证研究结果的可靠性，但是这并不能作为反对小样本量的实验的理由（考虑到费用，大规模实验一般不可能）。变量之间的微弱联系会因为样本数量增加而被放大，最后实际上微不足道的关系都会被解读成决定性的，仅仅是因为它在统计上达到了一定显著性水平。与此相反，被小样本量的实验证实具有显著性的，变量之间会有很强的决定关系，而且可以很明确地辨认出自变量和因变量。——译者注

[5] Schünemann, B. , Experimentelle Untersuchungen zur Reform der Hauptverhandlung in Strafsachen. In:H. -J. Kerner, H. Kury ＆ K. Sessar（Hrsg.）, Deutsche Forschungen zur Kriminalitätsentstehung und Kriminalitätskontrolle, Bd. 6/2, S. 1109—1152, München:Heymann, 1983a. Schünemann, B. , Bandilla, W. , Geisler, W. , Groß, V. , Hassemer, R. , Informationsverzerrung in der Hauptverhandlung des deutschen Strafverfahrens in Abhängigkeit von Vorinformationen. Bericht aus dem SFB 24 der Universität Mannheim,1983b．此处再次强调所选择案件的案情既能支持不利被告的判决也能支持有利被告的判决。如果出现一面倒的有罪判决，那不是或者主要不是由案情导致的，而是源于其他因素，比如判断者的偏见。——译者注

[6] 该份问卷详见附录。

[7] Greene, E. , Whodunit? Memory for evidence in text. American Journal of Psychology,1981, Vol. 94, No.3,479—496.

[8] 如上文所述，受试者是被随机分配到不同实验条件下的。具体方式是将写有受试者名字的纸条放在口袋里，由实验组织者抽签决定每一位受试者会被分派到哪一组。

[9] 具体而言，零假设指的是两种实验条件之间的实际差别为零，因此实验结果的不同完全是偶然造成的。备择假设正相反，指的是实验结果的不同直接源于实验条件之间的差别，而不仅仅是偶然的产物。只有当实验结果之间的差异无法被完全当做偶然的产物时，我们才能拒绝零假设而接纳备择假设。因此人们需要确定一个界限，超过这一界限时，就认定差异不完全是偶然导致的。零假设正确时，人们有p的概率会得到当前的实验结果，一般认为p＝0.05就是接受或者拒绝零假设的界限。p小于0.05意味着零假设正确时因为偶然原因而出现当前实验结果的可能性小于5%，反过来说当前实验结果有超过95%的可能性是实验条件的真正差异导致的，此时可以拒绝零假设而接受备择假设。所以可以用p值来衡量拒绝零假设而接受备择假设的证据的强弱：p值小于0.01时认为有很强的拒绝零假设的证据；p值在0.01到0.05之间时认为有较强的拒绝零假设的证据；p值在0.05到0.1之间时认为有较弱的拒绝零假设的证据；p值大于0.1时认为没有证据可以拒绝零假设。详见Sachs, L. , Angewandte Statistik, Heidelberg:Springer,1974, S. 91—92. 〔美〕L．沃塞曼：《统计学完全教程》，张波等译，科学出版社2008年版，第117、122—124页。——译者注

[10] 本次实验证实了，检察官和法官对是否存在充分嫌疑的判断存在巨大差异，这引起了研究者进一步探索的兴趣。许乃曼教授进行的另一项关联实验的依据是社会比较理论，即在不确定的情况下人们会以自己认为可靠的比较对象已经作出的判断为导向。将这一理论运用到刑事司法实践中，研究者猜测，法官信任检察官检验侦查结果后作出的判断，如果检察官认定存在充分嫌疑足以提起公诉，那么法官也倾向于作出同样的认定。实验材料是一份关于诈骗罪的侦查案卷，其中有利和不利被告的信息旗鼓相当，预调查也证实了其矛盾性。62位检察官和72位法官被随机分为两组，第一组根据案卷判断是否足以提起公诉，第二组被告知该案已被起诉，根据案卷判断是否开启审判程序。德国刑事诉讼程序中，提起公诉和开启审判程序的嫌疑标准是相同的，即具备充分嫌疑，因此两组之间的差别仅在于是否知道另一个机关已经作出的决定。实验结果证实了研究者提出的两个假设：（1）面对同样的侦查案卷，第一组中大部分决定不起诉，第二组的多数却决定开启审判程序，这一差别在统计学上也是显著的。知道其他机关已经作出的评价的受试者确实倾向于作出与此评价一致的决定。（2）将第一组中的检察官与第二组中的法官的决定相互比较，差距更为悬殊，表明在模拟司法实践（检察官决定是否起诉，法官决定是否开启审判程序）的实验条件下，检察官态度谨慎，法官却对检察官的判断报以极大信任，结果就是法官比检察官更容易认定存在充分嫌疑。参见Schünemann, B. , Bandilla, W. , Groß, V. , Hippler, G. , Experimentelle Untersuchung zur Bewertung gleicher Ermittlungsergebnisse durch Strafrichter und Staatsanwälte, Forschungsprojekt Strafverfahren an der Universität Mannheim,1986.——译者注。

[11] 即法官基于被告很可能有罪的前假设产生的对有罪判决的预期。——译者注。

[12] 本次实验中关于量刑的假设并未被证实，因此许乃曼教授随后专门进行了另外一项研究，通过案卷分析探寻检察官对法官量刑的影响。法官量刑时拥有很大的裁量空间，而起到缩减裁量空间作用的刑罚价目单在大多数犯罪中并不存在，于是人们推测，三个不同因素的共同作用决定了个案中的刑罚，这三个因素是：存在于法官头脑中、根据直觉浮现的个人刑罚理论，法院或者审判组织的量刑实践及审判程序中的互动。而最典型的互动形式就是检察官的求刑。该研究根据社会比较理论提出假设：当法官因为过大的裁量空间而感到不确定时，会以他认为可靠且客观的人的判断为导向来做决定，这个人就是检察官。考虑到安抚被告和公众的需要，法官很可能会以检察官的求刑为上限决定最终刑罚。对曼海姆区法院1977年通过参审法庭审结的180个案件的分析显示，法官的量刑平均比检察官的求刑低18%，与检察官求刑完全一致、低9%—25%、低25%以上的情况大致各占1/3，高于检察官求刑或者宣判无罪的只是极少数。根据当时的判例，一般12个月及以下的徒刑才能适用缓刑，故法官会为了适用缓刑而大幅偏离检察官的求刑，如果去除这一因素，法官量刑与检察官求刑的同步率就更高了。研究还发现，辩护人提出的具体的量刑申请（如12个月徒刑）相比不具体的申请（如从轻判决）更能引发对检察官求刑的偏离。因为法官希望借此避免辩护人诉诸法律救济手段。Schünemann, Daten und Hypothesen zum Rollenspiel zwischen Richter und Staatsanwalt bei der Strafzumessung. In:G. Kaiser, H. Kury＆H-J. Albrecht（Hrsg.）, Kriminologische Forschung in den 80er Jahren:Projektberichte aus der Bundesrepublik Deutschland, Freiburg 1988. ——译者注

[13] 这一表述是格式塔理论应用于法学领域的产物，Rolinski教授的一项研究中对此作了说明。数据分析发现，法官量刑时偏好3、6、9、12等数字，即法官经常判处相应月份的徒刑。Rolinski教授于是运用格式塔理论中的简洁律对此进行解释。格式塔学派的创始人Wertheimer以数学中的“角”为例来说明简洁律的含义：在30度角和150度角之间虽然有很多不同的角度，但并不存在与之一一对应的那么多心理层级，而仅存在三个最重要、最引人注目的层级：锐角、直角和钝角。每个层级都有一定的范围，比如93度角看上去（虽然有些不合适）就像直角。或者说处于这些重要层级之间的层次因为不够简洁而容易被归入上一个或者下一个简洁层级。简洁完形的一个特点是，完形会简化自身。因此简洁倾向可以被理解为良好完形的出现是自动自发的，观察者并没有通过自己的心理活动干预完形的简化，相反，最好的完形自己从相应的条件中产生。格式塔定律不但适用于感知，而且适用于思维过程。将其应用到法官的量刑实践中，则可以把3,6,9,12等数字看作是对刑期刻度表的分割，间隔总为1/4年。这种分割实践了良好完形的标准，如对称、简单、清晰、规律、均衡。具体而言，1/4年（3个月）和3/4年（9个月）围绕半年（6个月）形成对称，1/4年为标准的划分还减少了层次，简化了结构。Rolinski, K. , Die Prägnanztendenz im Strafurteil, Hamburg 1969, S. 29ff．部分名词译法参考〔德〕库尔特·考夫卡：《格式塔心理学原理》，黎炜译，浙江教育出版社1999年版。——译者注