要是你或者家人正处于躺在病床上等候癌症治疗这个状态,医生告知你存在一种“突破性”疗法能够延长生命,这时你会欣喜到极点。然而你所不了解的是,这个号称的“突破”或许源自一篇被AI判定为“假货”的论文。在1月30日,《英国医学杂志》所发布的一项研究就像惊雷一般:在1999年至2024年这段时间里的全球260万篇癌症论文当中,超过26万篇疑似是由论文工厂批量伪造出来的。中国的情形格外引人注目——在49.7万篇论文里面,有17.7万篇被标记,其比例高达36%。
论文工厂如何运作
其核心乃是学术造假产业链里的论文工厂,它们以流水线的形式,批量炮制虚假论文,而后售卖予有发表需求的研究者,这些机构的年营收多达数千万美元,业务在全球范围内涉及广泛,于2022年,知名出版社Wiley一次性撤下1.1万篇稿件,关掉19本期刊,然而这仅是所暴露出来的表面现象。
那些造假组织所给予的是“一条龙”式服务,先是数据伪造,接着图表制作,之后论文撰写,最后投稿,全都依据期刊影响因子按明码标价,研究者只要支付费用,在几个月时间里就能拥有一篇“合格”的学术论文,这样的商业模式致使虚假学术成果如同商品一般进行流通。
AI如何识别造假论文
昆士兰大学属位于澳大利亚的科技大学而Adrian Barnett团队所开发的是一套AI检测模型,此模型于已知真假的论文之上进行过训练,其准确率高达91%,它能够识别出人类肉眼难以察觉的“造假腔调”即模板化的句子结构、重复出现的表达模式以及异常的词汇组合方式。
模型居然能够发觉某些特定的问题,比如说错误细胞系的运用。就像BGC - 823、BEL - 7402这类在很大程度上几乎仅仅出现在中国机构论文里的细胞系,被模型标记的比例竟然高达72%。这所代表的是造假者在对实验材料进行选择的时候,都存在着能够被追踪的规律性。
全球论文造假的数据真相
扫描得出的结果表明,全球范围内论文的标记比率,于1999年时为1%,到2022年已飙升至15%以上,呈现出指数级的增长态势。高影响因子的期刊也没能避免被波及,其标记率从原本的零增长到了10%。这意味着造假论文已然渗透到学术金字塔的顶端部位,就连顶级期刊也很难做到完全过滤。
基础研究的范畴之内,属于造假极为严重的区域,其标记的比率超出了百分之十,然而临床流行病学等相关领域,与之相较是相对较低的。缘由是极为简单的:处于实验室里面的基础研究相关数据,是更易于被“发明”出来的,那些造假的人,并不需要真实存在的患者以及繁复的调查过程,仅仅只需要去编造实验记录便可。
中国科研论文的严峻现状
中国的情形格外令人痛心疾首,被标记的论文在全球总量里所占比例达68%,该比例是全球平均水准的3.6倍,还是美国的18倍,这表明每三篇中国癌症论文当中,就有超过一篇存有问题,这个数字背后,是对无数患者以及诚实科研工作者的双重背弃。
需要加以说明的是,模型所做出的标记并不等同于最终给出的定论。假定真实的造假比率仅仅只有百分之十,然而在被标记的论文当中,仍然存在着大约百分之三十的可能性会被错误地判定。即使按照最为保守的估量方法来计算,在中国的这十七点七万篇被标记的论文里面,最少也会有十二点四万篇是确实存在问题的论文。除此之外,论文工厂的最初原产国家不一定和作者所归属的国家是相一致的,中国有可能是最大的“买家”,而并非是唯一的“产地”。
造假论文的三重致命危害
对科研诚信来讲,造假论文如同毒瘤那般侵扰学术体系,它们耗费编辑与审稿人的时间,致使后续研究被误导,全球每年存在数十万篇假论文,使得无数真实科研被掩埋于垃圾信息里,中国诚实学者的国际合作遭遇阻碍,资金以及声誉都遭受损害。
处于现代医学范畴来讲,假数据极有可能直线式误导,临床指南以及药物开发。若医生依据虚假证据去开药,这就相当于拿患者的生命去豪赌。全球的癌症负担已然十分沉重,中国每年新发病例占据全球百分之二十四,死亡病例占到百分之二十六,假研究致使精准医学的进步愈发举步维艰。
对于癌症患者来讲,造假论文的危害是最为直接的,那些夸大疗效、隐瞒副作用的假数据,极有可能致使无效甚至有害的药物得以上市,而后患者耗尽积蓄换来的“希望”,最终得到的却是毒副作用以及绝望,在后疫情时代癌症呈现出年轻化的趋向,原本真实的突破性研究理应加速,然而却被造假者再三拖延。
从根源解决问题的方向
有一场诚信危机呈现眼前,改革科研评价体系成为无法被避开绕越的出路。存在一种现行的“唯论文、唯数量”考核机制,此机制直接促使论文工厂的市场需求得以催生形成。研究者为了达成KPI,不得不去购买论文、发表论文,如此便形成了恶性循环一般的状况。只有转向奖励研究质量而非数量的评价体系,才具备从源头切断需求的可能性。
中国科研领域当中,需要去构建更为严格的诚信审查机制,期刊、高校以及科研机构应当推行运用AI检测工具,用来针对投稿以及已发表的论文展开常态化的筛查,对于查证属实的造假行为,必定要有严厉的惩罚举措,使得造假者付出足够高的代价,继而才可以形成有效的威慑。
十七万篇标记论文可不是些冷冰冰的数目字。它竟称得上是对癌症患者的一种集体性质的背叛。科学可不是那种供人玩乐嬉戏的事物。造假可不是能够快速达成目的所需的便捷途径。它正在耽搁着癌症患者的有效治疗进程。同时它也是在无情地夺取着患者的生命。当我们安卧在病床上满心期冀着希望降临的时候。那希望可绝不会源自充满虚假成分的数据。你觉得。当下现有的科研评价体系究竟还能不能够真正培育出秉持诚实态度的研究者。为彰显对此事的态度。请点赞并且分享这篇文章。以便让更多的人能够清清楚楚地看清这场学术诚信危机所呈现出的真实情形。




