(二)陪审团的审判 陪审团的审判一定是坏得最明显的好主意之一。很难去指责它的发明者们。他们生活的时代,还没有抽样统计和实验设计。他们不是科学家。让我打个比方。如果,最后,有人基于人类不是银鸥而反对我的观点,说明我没表达清楚我的观点。 成年银鸥的喙是明黄色的,在靠近前端处有一个明显的红点。幼鸟用嘴去啄那个红点,促使父母喂自己。诺贝尔奖得主、动物学家也是我在牛津的老师尼康·廷贝亨(Nikon Tinbergen),给尚无后天习得经验的幼鸟摆上一排银鸥脑袋的纸板,喙和点的颜色、形状各不相同。廷贝亨用幼鸟在规定时间内啄纸板的次数,来衡量它们对每一种颜色、形状或两者组合的偏好。目的是为了发现,没有后天习得经验的银鸥幼鸟是否天生就喜欢长长的缀有红点的黄色物体。假如没错,这可能表示,基因让幼鸟提前具备详细的知识,了解它们孵化后的世界—这个世界的食物来自成年银鸥的喙。 且不论研究的起因,也别管研究的结论,如果要在任何实验中得出正确结论的话,就要考虑你必须使用的方法和一定要规避的风险。这些就是普遍适用的原则,它们适用于银鸥幼鸟,同样也适用于人类陪审团。 首先,你显然必须对不止一只幼鸟进行测试。可能一些幼鸟偏爱红色,其他的偏爱蓝色,银鸥幼鸟总体来说不会倾向于喜欢同一种颜色。所以,选取单独一只幼鸟,只能是在测试个体偏见。 所以说,我们必须对不止一只幼鸟进行测试。多少呢?两只够吗?不,三只也不行,现在我们得开始从统计学的角度思考。简单一点儿说,假设在某个实验中,我们要在同样的黄色背景下只比对红点和蓝点,并且要同时把背景亮出来。如果只分开测试两只幼鸟,假设第一只选择红色,它有50%随机的可能性会这样选。现在第二只也碰巧选了红色。哪怕这只鸟是色盲,随机这样选的概率又是50%。两只随机做出选择的鸟碰巧选得一样,这种概率有50%(4种可能性的一半:红红、红蓝、蓝红、蓝蓝)。三只鸟也不够。如果你把所有可能性写出来会发现,单靠运气,“一致裁定”的可能性有25%。从错误原因得出的一致选择的结论,其25%的概率结果高得令人无法接受。 那12只货真价实的幼鸟怎么样?这个不错。如果让12只幼鸟,分别独立地在两个选项中做选择,它们独自偶然得出同一结论的概率低得令人满意,只有1/2048。 但是现在假设,不分别拿我们的12只幼鸟进行测试,而是把它们作为一个整体。我们拿出12只叽喳叫的小鸟,在它们中间放入一个有红点的假鸟和一个有蓝点的假鸟,纸板上装有电子装置,可以自动计算被啄的次数。假设幼鸟群总共有532次啄了红色、0次啄了蓝色。这种大规模的差异表示那12只幼鸟偏爱红色吗?绝对不是。啄的次数并非独立数据。幼鸟可能有强烈的彼此模仿的倾向(以及因锁定效应而自我模仿)。如果一只幼鸟碰巧先啄了红色,其他幼鸟可能去模仿它,整个群体都陷入模仿的疯狂之中。事实上,这正是家养小鸡的做法,银鸥幼鸟也与之非常类似。即使不这样,数据不独立致使实验无效的基本原则依旧。严格来说,12只幼鸟等于1只幼鸟,它们啄的次数加起来不论数量多客观,也仅等同于啄了一下:它们总共只有一个非独立的结果。 下面我们来看看法庭,为什么12名陪审员好过1名法官呢?不是因为他们更明智、更博学或是更善于推理。当然不是,绝对不是。想想在无足轻重的诽谤案中,陪审员造成的巨大破坏。想想陪审员是怎么培养出史上最糟糕的、会哗众取宠的律师们。12名陪审员好过1名法官,就是因为他们人多。让1名法官做出判决,就好像让1只幼鸟为整个银鸥物种代言。12个脑袋比1个好,因为他们代表对证据的12份审视。 但是,为了让辩论有效,这12份审视确实必须独立。但事实当然是不独立的。12名男男女女被反锁在陪审室,就像我们那一窝12只银鸥幼鸟。他们是否的确像幼鸟那样互相模仿呢,也许会吧。这就足以说明1个陪审团好过1名法官的原则无效。 实际上,根据我不幸参加过三个陪审团的记忆,也如文件所记录的那样,陪审团会在极大程度上被一两个很会表达的人所左右。存在着要和一致裁定相统一的巨大压力,而一致裁定进一步破坏了数据独立的原则。增加陪审员人数并无帮助,或帮助不大(严格来说,完全没有帮助)。要增加的,是独立达成裁决的单位个数。 说来奇怪,美国有个奇特的电视转播审判的制度,开启了改进审判制度的真正的可能性。一直到伍德华(Louise Woodward)案件或是辛普森(O. J. Simpson)案件判决结束前,全国上千民众像正式的陪审团一样仔细地审视证据。对比陪审团,大量的观众来电可能产生一个更加公平的裁决。但不幸的是,新闻讨论、广播脱口秀还有普通的八卦,侵犯了数据独立原则,我们又重新回到了起点。不管怎么样,审判的播出还是具有可怕的结果。在伍德华判决之后,网络上充斥着拼写错误、不合语法的恶意,独家报道记者排成长龙,倒霉的主审法官不得不换了电话号码,还雇了一个保镖。 所以,我们要怎么改进这个制度?该把12名陪审员关进12间独立的小屋,让他们独立进行意见投票,要这样形成完全独立的数据吗?如果有反对的声音认为,有的陪审员可能太笨或是无法独立表述清楚,以致无法形成裁决结果,那么留给我们的思考是,为什么这样的人也能被允许进入审判庭呢?或许,要说说,当一群人一起研究解决一个议题时产生的集体智慧。但是仍然不能满足数据独立原则。 是不是所有的案件都应该交由两个独立的陪审团审判?或是3个?或是12个?如果每个陪审团至少有12名成员,这也成本太高了。两个陪审团,每组6个人,或是3个陪审团,每组4个人,可能会改进现有体系。难道没有方法检验这种替代方案的优缺点,或者去比对陪审团审判和法官审判的优点吗? 是有的。我想称之为两种裁决的和谐性测试。它依据的原则是,如果判决有效的话,两种独立判决的方式应该产生一样的结果。单就测试目的来说,我们的代价是,需要两个陪审团庭审同一个案子,且不得与另一个陪审团的任何人交流。最后,我们把两个陪审团关在两个独立的陪审团室,看看他们能不能做出一样的裁决。如果没有,不但证明应该合理怀疑裁决结果,它还会为陪审团制度笼罩上合理的疑云。 为了和法官的审判产生实验性对照,我们需要两位经验丰富的法官聆听同一件案子,也需要他们不与彼此交流,各自得出自己的判决。经过一定数量的审判,哪种制度—陪审团审判还是法官审判—达成一致的分数更高,哪种制度就更好,如果和谐性得分高,可能在将来应用的时候会多获得一些信任。 你敢打赌两个独立的陪审团在伍德华一案中裁决一样吗?你能想象哪怕一个陪审团可以得出对辛普森一案的一致裁决吗?另一方面,在我看来,两个陪审团在和谐性测试中很可能得分都不错。假如我被控一种严重罪行,我想要这样被审判;如果我知道自己有罪,我愿意面对一个我行我素的陪审团,越无知、越有偏见、越任性,越好;如果我是无辜的,鉴于没有多位独立的决策者这种理想的情形,请给我一位法官。