施普林格・自然出版集团宣布撤销旗下期刊《肿瘤生物学》的107篇中国肿瘤生物学领域的论文 ( 图片来源: pixabay)
【看中国2017年4月30日讯】由524名中国学者刚刚创下的“新纪录”并不光彩。
4月20日,世界最大学术出版机构之一施普林格・自然(Springer Nature)出版集团(以下简称“施普林格”)宣布撤销旗下期刊《肿瘤生物学(Tumor Biology)》的107篇中国肿瘤生物学领域的论文,涉及来自中国的524名医生及医学生。这些文章发表于2012年至2016年,涉嫌同行评议造假。在作为撤稿第一单位的77家单位中,不乏北京大学第三医院、交通大学医学院、复旦大学及其附属医院等知名机构。
2015年3月,英国现代生物出版社所撤销的43篇论文中,41篇产自中国;8月,德国施普林格出版集团在旗下10本学术期刊上所撤销的64篇论文,绝大多数也来自中国;10月,国际出版巨头爱思唯尔在旗下5种杂志中撤销的9篇论文,则全部来自中国。
2014年科学普及杂志《科学美国人》刊登调查文章说,中国存在涉嫌收钱大量生产抄袭、造假论文的“论文工厂”。文章点名一家叫做“MedChina”的医学服务中心机构,说它生产医学论文。MedChina的地址是上海国定东路200号。网络资料显示,它隶属上海文魁生物科技有限公司。不过,有记者发现这家公司早已搬走, 网络上,MedChina的官网、微博、部落格内容,也被先后删除。
《科学美国人》分析了100多篇学术论文的语汇、包括41篇由中国单位资助的论文后发现,一些论文雷同、像是以工业规模批量生产,有时整段文字几乎完全相同,成为“填词论文”。而这种论文许多来自中国,特别是出自MedChina。该杂志最先识别的100篇涉嫌抄袭的论文中,24篇得到中国国家自然科学基金会的资助,另外17篇的科研津贴来自政府部门。清华大学教授沈阳的研究指出,在买来的论文中,72%属于全文抄袭,24%属于部分抄袭。此前的一份研究报告显示,中国论文买卖的交易额在2009年就已经达到10亿元规模。
该文提到:“在《科学美国人》的一项调查中,通过对100多篇学术文献的遣词进行分析,我们发现了一些令人担忧的模板痕迹——这是一种信号,表明目前有一场大规模的对同行评议系统进行戏弄的尝试。举例来说,发表在2014年《诊断病理学》5月刊上的一篇论文,表面上来看是一篇典型经过同行评议的荟萃分析论文,其作者为中国广西医科大学的8名研究者。在文中,作者评估了XPC基因的不同变种与胃癌之间是否有关联。他们发现这两者之间并无关联,并表示这不是该问题的最终定论:
“However, it is necessary to conduct large sample studies using standardized unbiased genotyping methods, homogeneous gastric cancer patients and well-matched controls. Moreover, gene–gene and gene–environment interactions should also be considered in the analysis. Such studies taking these factors into account may eventually lead to our better, comprehensive understanding of the association between the XPC polymorphisms and gastric cancer risk.”
译文为“然而,运用标准化的无偏的基因分型方法,对同类型胃癌病人和相应的治疗手段进行大样本研究是很有必要的。此外基因与基因、基因与环境的相互作用也应该在分析报告中有所考虑。综合这些因素的研究,可能最终会让我们更好、更全面地理解XPC基因多态性与胃癌风险之间的关联。”
对于一篇极为普通的论文来说,这是一个极为普通的结论,并不应当引发任何警报信号。但是,将其与《欧洲人类遗传学杂志》(European Journal of Human Genetics ,自然出版集团下属杂志)中,早些年发表的一篇关于CDH1基因的变种是否可能与前列腺癌(PCA)相关的荟萃分析论文进行对照的话:
“However, it is necessary to conduct large trials using standardized unbiased methods, homogeneous PCA patients and well-matched controls, with the assessors blinded to the data. Moreover, gene–gene and gene–environment interactions should also be considered in the analysis. Such studies taking these factors into account may eventually lead to our better, comprehensive understanding of the association between the CDH1−160 C/A polymorphism and PCA risk.”
译文为“然而,在评估者对数据单盲的情况下,运用标准化的无偏的基因分型方法,通过对同类型的前列腺癌病人和相应治疗手段进行大量实验是很有必要的。此外基因与基因、基因与环境的相互作用也应该在分析报告中有所考虑,综合这些因素的研究,可能最终会让我们更好、更全面地理解CDH1-160C/A基因多态性与前列腺癌风险之间的关联。”
整段的措辞几乎完全相同,甚至包括“让我们更好更全面的理解”(lead to our better, comprehensive understanding)这个不怎么流畅的短语,唯一实质性的差别就是具体的基因(CDH1而不是XPC)和疾病(胃癌而不是前列腺癌)。
这并非一起简单的抄袭事件。很多看似独立的研究团队一直都在抄袭同一段文章——《公共科学图书馆·综合》(PLOS ONE)上的一篇论文中写的是可能最终会让“我们更好、更全面地理解”XRCC1基因突变和甲状腺癌风险之间的关联;另一篇在《国际癌症杂志》(International Journal of Cancer ,由威立出版社出版)上的论文则是可能最终会让“我们更好、更全面地理解”XPA基因突变与癌症风险之间的关联,诸如此类。有时候措辞之间的变化是很轻微的,但是在十几篇论文之中,我们都能找到几乎一模一样的语句,只是嵌入了不同的基因和疾病名称——就像是“疯狂填词”游戏一般,游戏参与者们在一段文章中填入缺失的字眼。
我们还找到了其他像这样“填空研究”的样例。搜索短语“由于显然不相关而被排除在外”(excluded because of obvious irrelevance),我们找到了超过十几篇各式各样的研究论文。除了其中一篇外,其他均由中国研究者撰写;搜索“使用标准形式,公开发表的研究中的数据”(Using a standardized form, data from published studies),也找到了超过十几篇研究论文——依然,全部来自中国;搜索“贝格尔漏斗图”(Begger's funnel plot)则对应着几十篇文章——再一次,全部来自中国。
“贝格尔漏斗图”尤其能够说明问题,因为实际上,并没有贝格尔漏斗图这种东西。西班牙巴塞罗那基因调节中心的生物学家吉拉姆·菲利翁(Guillaume Filion)表示:“它不存在,这是关键。”一位名叫科林·贝格(Colin Begg)的统计学家和另一位名叫马提亚·埃格尔(Matthias Egger)的统计学家,各自发明了测试工具来寻找综合分析中的偏差——“贝格尔漏斗图”似乎只是这两个名字的意外杂交体。
“贝格尔”这一检测抄袭的方法是菲利翁偶然发现的。他在医学期刊文章中寻找行业动态时,发现这些论文有着几乎完全相同的标题、类似的图表、以及相同的奇怪错误,就像“贝格尔漏斗图”。他猜测这些论文有同一个来源,尽管它们表面上是由不同的作者团队撰写的。“很难想像这28个人都是自己独立发明了一个统计测试的名字。”菲利翁说道,“所以我们非常震惊。”
通过在网上快速检索,我们可以发现有现成的成套服务提供,只需支付一定费用即可成为作者,在同行评议期刊上发表论文。研究者寻找在有声望的国际科学期刊上发表论文的捷径,而这些服务商们正是为了迎合这种需求。《科学美国人》要求一位讲中文的记者与MedChina联系。MedChina是一家提供许多“论题出售”和学术期刊“文章所有权转让”服务的公司。记者假装想要购买学术论文的作者资格,与MedChina的代表商商谈。该代表解释说,这些论文已经基本算是被同行评议期刊接受,唯一需要做的只是一点编辑和润色工作,而价格则取决于目标刊物的影响因子,以及论文是实验性质的,还是荟萃分析性质的。在这次会谈中,MedChina的代表提供了一篇蛋白质与乳头状甲状腺癌的相关性进行荟萃分析的论文。这篇论文计划将要发表在一本期刊影响因子为3.353的期刊上,该论文的作者署名售价为人民币9.3万元。
MedChina出售的这篇论文最可能打算投稿的就是《临床内分泌学》(Clinical Endocrinology),这是5本影响因子为3.353的期刊之一,命题上也最吻合。这本期刊的高级编辑约翰·贝文(John Bevan)表示:“显然,这是一个极受关注的问题。想到这类事情一直在发生,并且越来越泛滥,我深感悲痛。”在《科学美国人》与他联系大约两周后,贝文确认了一篇可疑的论文,题目是关于乳头状甲状腺癌生物指标的,并且论文在修订过程中新加了一名作者。这篇论文最终被鉴定有问题,并被拒绝。
这些可疑的论文中,相当部分的资金支持来自中国政府。第一批被《科学美国人》辨识出来的100篇论文中,就有24篇收到过中国国家自然科学基金会(NSFC)的资金支持;而另有17篇承认收到了其他政府来源的资金支持。中国国家自然科学基金会的主任杨卫确认,有24篇被《科学美国人》认定为可疑的论文,后来被交付到基金会的纪检监察审计局,该局每年调查几百起针对不当行为的指控。杨卫在邮件中写道:“每年NSFC都要执行几十起针对学术不端行为的处罚,但代笔行为则没有那么常见。”
一些出版商到现在才意识到中国的论文工厂问题。“我并不清楚还有一个买卖论文署名权的市场存在。”英国生物医学中心(BioMed Central)负责科研诚信的副主编洁吉莎·帕特尔(Jigisha Patel)表示,但他们中心(隶属于德国斯普林格出版社,发行《诊断病理学》期刊)已经开始注意并警惕这个问题。帕特尔说:“我们现在会调查并着手解决这个问题。”在《科学美国人》联系他们之后的不到两周,生物医学中心宣布,约有50篇手稿是谎称接受过同行评议的。出版商向撤稿监察(Retraction Watch)博客表示,“可能有第三方卷入,并影响了同行评议程序”,这些手稿很可能就来自论文工厂。我们可以看到大约6篇论文的标题和作者。所有这些论文在形式和主题上都非常相似,这意味着其他论文工厂的存在——制作荟萃分析性质的论文,这些论文全都来自中国的作者团队。
其他出版商也已经开始着手对抗可疑论文的泛滥。《公共科学图书馆·综合》的编辑部主任达米安·帕廷森(Damian Pattinson)表示,去年四月,期刊就已经创立了安全措施。他们收到的每一篇荟萃分析论文都必须经过特殊的编辑检查强制作者提交附加信息,包括他们开展研究的目的。“基于以上原因,论文被提交给评议者的比率已经下跌了90%。我们已经非常清楚地意识到这个问题。”英国医学委员会(BMC)、公共科学图书馆以及其他出版商都在使用剽窃检测软件,以试图减少剽窃现象。但是,软件并不是总能解决文章的剽窃问题。帕特尔告诫说,论文工厂“令问题的复杂性更进了一层”,这令人十分忧心。”