(接上篇)
耿同学用大众能理解的语言拆解分析了论文(图源:@耿同学讲故事)
我分析一个论文的数据,也得花三四个小时过一遍。觉得它不对劲的话,我就把这些数据拿出来,去找我的一个朋友,用他公司开发的软件“跑”一遍,这样才能确认问题到底是什么。有的数据,软件告诉我它们是等差数列,我还得看半天才明白,因为它不是“完美”的等差数列。有的数据,是写论文的人把某个数乘个1.05、1.06的得出来的。尽管我算是“专业人士”,我也没法用肉眼就看出来问题在哪,需要借助计算机软件等算力。也正是基于这些时间和资源成本,我是不可能看到一篇论文就深究的。
薛定谔的数据
做学术这些年,我看过不少觉得有假的论文。我接的打假投稿也很多,其中有疑点的不少。真被我拎出来的论文不能说是是冰山一角,只能说是九牛一毛。说实话,在我们这个领域,如果数据编得像一点,根本发现不了。但凡一篇论文不能被“锤死”造假,只要作者还有空间反驳我,我都不会发视频举报。他们可能用来反驳我的理由我都知道,他们能不知道吗?
比如最常见的理由:图片误用。在一个大图里面有好几个小图是重复的,而且不是那种全篇重复,是部分重复。如果真的不小心用错图,通常是复制粘贴,图的大小和位置都不会发生改变,不会有自己操作的痕迹。但是当这些都发生改变的时候,你能明显感觉作者是故意把那张图挪一个位置,做一个旋转或者拉伸放大,让它看起来和之前的不一样,假装是不同实验做出来的结果。
(图源:@耿同学讲故事)
这事儿严不严重,那是仁者见仁,智者见智。我们专业是通过做大量操作性实验来获取数据,记录每次实验数据,最后得出结论。文章中需要附上实验的图片和数据表格,来展示结论得出的过程。但生物学研究和数学、物理这些学科不一样的是,它变量很多,比如实验小鼠的体重、状态,实验室的温度等等,不可控因素也很多,一点改变就可能直接影响结果。所以,图片是怎么来的、数据是否真实客观,这些都很难去核查。
反正现实情况是,如果你因为论文中图片重复被别人质疑了,你说是图片误用,就没人能把你怎么地。补上一张“正确”的图片一点也不难,提出问题,当天就能补上,小鼠、细胞的照片都长一个样,你也不知道这是几年前的照片,还是这个论文实验时的照片,修补成本相当低。
在生物医学圈,真实性充满争议的研究其实不少见。举个例子,由上海药物研究所研究员耿美玉团队宣称他们研发的药物“GV-971”能治疗阿尔兹海默病,论文还发在一个权威学术期刊《细胞研究》(Cell Research)上。
耿美玉论文截图
这个药的上市就引发了一场学术纷争。前首都医科大学校长饶毅曾在自己的公众号上发表多篇文章,质疑这篇论文和药效,说“耿美玉的971是真药的可能性,小于她是中国爱因斯坦的可能性”。学术界有相当多的质疑,比如GV-971Ⅲ期临床有效药物组与安慰剂组在前34周的差值一直维持在0.6分左右,但从第34周开始,安慰剂组突然出现断崖式下滑,从1.5分跌至0.16分。在34-36周仅仅两周内,有效药物组与安慰剂组差值从0.69分扩大至2.54分。
饶毅就公开表示,出现这种情况的原因是研究人员告知安慰剂组病人,他们吃的是安慰剂,涉及实验期间造假。但问题是,饶毅的这个怀疑没有办法得到验证。像这样的质疑最后都只能变成一场“争议”。
就算你做了一遍他的实验,得不出他的数据,你也无法确认,这是因为对方的实验数据有问题,还是因为温度湿度、实验室环境、小鼠健康情况影响实验结果。
我读研的时候有一个师兄,他当时需要做一个实验叫流式细胞术,他都没做过,怎么做都是我教他的,做流式那些管子还是我给他的。最开始,他做实验的时候我就在旁边,实验结果很差。结果一个月之后,他就发了一篇很不错的论文,里面的结果很漂亮,这不符合常理。但我没法说他造假了,我没有证据。
而且,数据不造假,也可以挑选、编辑。
比如说你现在想证明山东人高还是山西人高。你想要证明的结论是山西更高,那我就从山西那边挑50个高的,山东那边挑50个低的,你想要得出什么结论都可以。我管这叫科研“秦桧法”,对我不利的,我编造一个“莫须有”的理由去掉它,只留下对我有利的结果,说这个结果是真的。
《机智的住院医生生活》剧照
据我所知,这么做的人有很多。我是去年5月份,读到博士5年级退学的。如果深究起来,我当年的退学,和这种风气也有关系。
那时候,我一周只有周二和周四两天可以买小鼠。送到实验室之后,小鼠需要静置一周,来适应实验室环境防止应激,然后我才能开始实验。我的药物一般都是慢药物,每天给小鼠注射药物,小鼠要培养几个星期甚至一两个月才能出数据。这一遍流程,走下来最快就一个月了。
实验很苦,战线拉得很长,这种滋味外人很难理解。能考上博士的人,在求学路上,都是天之骄子。我初中的时候,三年里只有2次没考到全班第一。但生物实验失败,是家常便饭,我做20次实验最快要几个月,里面能有1次结果是我想要的,就已经不错了。不断地失败,没有任何正反馈,这种感觉太压抑了。
但要论证一个药物更有效,同样的实验我重复20次,结果其中19次是阴性,1次是阳性,这一次的结果算不算证明了它有效?理智上告诉我不算。但感性上,我做了这么多实验,拿到一个结果,你告诉我它用不了?我接受不了。
《重启人生》剧照
这个时候,我可以找理由:环境不好、操作失误,说我前面19次实验失败都是因为各种原因导致的,就成功这一次是因为只有这次所有条件都做对了。其他几次没做成,我把数据“优化”一下不就行了吗?多少人都是这么干的。我也能拿去投期刊,看起来不会有任何问题。
但我不知道该怎么面对这件事,过不了自己心里那关。那段时间我很迷茫,心理上的压力也很大。那时,我自媒体也有一定收入了,比我毕业找份教职工作的收入还高,所以最后,我选择了退学。 |