左手画圆 右手画方
上QQ阅读APP看书,第一时间看更新

为什么生命科学领域质疑与“造假”频发

生命科学的造假问题由来已久,近年来多起学术不端事件(例如日本的小保方晴子、中国的韩春雨等)再次将这一问题送到大众视野。本文试图从学科逻辑角度对这一现象进行一些分析。

2016年7—8月间,生命科学圈内又被新的一轮质疑与“造假”疑云笼罩,这次的主角是前不久轰动一时的NgAgo基因编辑技术。主流媒体曾将其视为CRISPR/Cas9的一个颇具竞争力的挑战者,如今其重复性经过超过100个实验室检验后仍显得不够稳定可靠。更有质疑者已经进一步开始怀疑其作者提供的数据是否可靠,并翻出作者的其他文章寻找作伪的可能证据。为什么生命科学领域内的质疑与“造假”看起来如此频发呢?

统计数据表明,生命科学领域的文章撤稿量显著高于其他学科(表1)。根据M. Zhang等人2012年对从1980年到2011年Web of Science上各学科发表文章及撤稿情况的统计(Zhang et al., 2012),属于生命科学领域的生物化学和分子生物学贡献了最多的撤稿量,并且其撤稿率(文中用“每十万篇文章撤稿数”来衡量)也与同属生命科学的药物化学一道高居前列。唯一比其撤稿率高的是晶体学领域,而这主要是因为有中国井冈山大学的钟华和刘涛一次性造假70篇、被Acta Crys. E撤稿的“贡献”。

表1 生命科学领域的文章撤稿量数据统计

他们还对撤稿数多于15篇的杂志进行了统计(Grieneisen et al., 2012),共计22份杂志,除去综合性杂志Nature、Science、PNAS和4份其他领域杂志(物理的Appl. Phys. Lett.,化学的J. Am. Chem. Soc.,晶体的Acta Crys. E,以及材料的J. Hazard Mater.)之外,其他15份都是生命科学相关期刊。被撤稿数最多的15个作者(他们占了总撤稿数的52%)中有10个从事生命科学或医学研究。这些数据表明,生命科学领域的质疑与“造假”频发,并非是错觉,而是事实。

撤稿的主要原因是什么?F. C. Fang等人对PubMed上2047篇被撤稿文章进行了统计(Fang et al., 2012),发现43.4%的撤稿是由于作伪欺诈或涉嫌欺诈,14.2%是由于重复,9.8%是由于抄袭,21.3%是由于错误和误差,其他占11.3%。也就是说,六成以上的撤稿都是人为因素造成的,而其中作伪欺诈又是主要的学术不端形式。这说明,主观的学术不端行为构成生命科学领域质疑和“造假”频发的主要来源。

一般认为,学术不端行为有多种诱因(Fanelli, et al., 2015)。例如,科学研究政策和导向使得急功近利思想产生,不同社会文化对造假和抄袭宽容度不同(例如,欧美以造假为主,东方以抄袭为主),同行评议阶段的不公平现象,科学工作者的职业生涯需求等,甚至性别都可能是影响因素,例如,有研究认为生命科学领域内男性比女性更容易造假(Fang, et al., 2013)。以上多是针对一般学术不端进行的讨论,还不足以充分解释生命科学领域为何存在着如此显著的造假情况。

生命科学领域的根本问题是缺少系统可靠的理论体系,从而缺少明确有效的证伪方法。在纯数学和理论物理领域,伪造数据和过程几乎是不可能的,其原因是每一步都可根据严密逻辑保证其可证伪性。实验物理和化学则相对更宽松些,对实验偶然性的依赖也更大些,但目前理论的进步和分析手段的提高也使得人们能够较为明确地判断真伪。而在生命科学领域,不同的通路和逻辑都有可能成立,这是由于生命系统的复杂性而产生的,因此在其学术研究上往往是发现比发明更重要、更显著。反过来,如果某种发明是以他提出的发现为基础的,那么一般很难直接质疑这种发明的可靠性。

例如,耐高温DNA聚合酶是PCR技术的基础,但人们长期没有开发出这样的酶,直到在黄石公园的火山口中发现了耐高温生物嗜热菌(Thermus aquaticus)才得到了Taq DNA聚合酶。这里,PCR技术就是依赖于发现的发明。再以基因编辑为例,CRISPR/Cas9建立的方法只是提供了基因编辑的一种进路,却不能排它。如果有人声称发现了具有类似作用、但不是这一系统的某种或某几种神奇酶,评审者很难判断它们是否真实存在,一般只能接受作者的陈述。

一旦进入这样的思维范式中,作为评判者的审稿人就只能诉诸两点来判断:一是自身逻辑链条的完整性;二是实验数据的真实性与可靠性。如果文章能够自圆其说,又没有发现明显的实验数据编造情形,那么多数情况下都应当认定为真。接下来的问题是所谓的“自身逻辑链条”能否完整。生物学家赖以生存的众多凝胶电泳实验手段实际上都只能提供间接证据,因为它们并不能反映蛋白或其他大分子的真实结构和组成,只是一系列间接比较的信息。直接的逻辑链条现在还只能来自于结构生物学等十分“Solid”的科学门类。更重要的是,生命科学目前的数理逻辑水平并不高,一般都没有办法给出特定体系的排他性逻辑进路,常常将相关性、因果性和时间先后出现的顺序混为一谈,对回归分析、数值分析等的正确运用场合不甚了了,这些都使得所谓的“自身逻辑链条”可能本身就存在先天不足,因此评审人的意见也要受到很大程度的约束。这是大量生命科学研究的次品甚至赝品也能够在学术期刊上占据一席之地的内在原因。

从外部考虑,生命科学研究的对象与普通大众、与每一个人都息息相关,因此生命科学研究的进展最容易吸引大众的眼光与市场,突破性的进展往往给发现者带来社会地位和社会价值的极大提升,以至于已经达到了可以诱人铤而走险的地步。而生物学术圈内竞争的激烈程度又加剧了这种两极分化,从而进一步激发个别人的一些不良欲望,这与前面分析的学术不端可能来自职业政策要求和急功近利思想是一致的。

自然,在生命科学研究中也存在着话语权竞争和市场化运作的成分。例如,现有生物技术的既得利益者往往会通过质疑和挑战打击新生生物技术,以维持自身地位。而新生技术也可以反过来质疑旧技术,从而达到扩大市场的目的。这些利益关系与一些特定问题的联系可能尤其紧密。不少人呼吁让科学评判只由科学家来做,在涉及现实利益划分的时候就显得过于天真了。基因编辑如今已经是走向商业化的生物技术,涉及它的争论,尤其是非学术期刊、同行评阅发表的言论,都值得以这种视角来进行重新观察。

以上分析可能有坐井观天之局限,但生命科学研究中的这一现象是不可否认的。解决这一问题的根本之道,既不是简单地号召大家提高道德修养,也不能只依靠改革管理体制和期刊发表体系,而应当是通过将生命科学目前的研究逻辑化、规范化,来建立可靠、系统、全面的可证伪思维方式,这样才能从源头上减少生命科学“赝品”研究出现的可能。

定稿于2016年8月2日

发表于微信公众号“听石先生的文字”