ai造假(AI生成百篇假论文)

林墨 新智元 今天

ai造假(AI生成百篇假论文)(1)


新智元推荐

来源:林墨(ID:linmo_wx)

编辑:克雷格

【新智元导读】署名“IKE ANTKARE”的论文有102篇,让IKE ANTKARE在谷歌学术中的h指数一下飙升到了94,成为计算机科学领域科学家H指数排名第6的学者。实际上,这些是格勒诺布尔大学的CYRIL LABBE教授利用MIT研究人员发明的SCIgen自动生成的。

ai造假(AI生成百篇假论文)(2)

谷歌学术、百度学术等学术搜索引擎以收录范围广泛、免费访问等优势逐渐抢占了学术文献全文的入口,这一点让web of science和Scopus等数据库商紧张不已。

收录范围广便能够建立更庞大的引文网络,因此,谷歌学术、百度学术等学术搜索引擎收录的文献的被引次数更高,所以,一些学者在委托图书馆出具引文报告时,希望以谷歌学术的被引次数为依据,作为自己论文影响力的佐证。

但是,学术搜索引擎中随意的数据给造假提供了极大的空间。

辛辛苦苦几十年,不如一键生成?

格勒诺布尔大学的CYRIL LABBE教授利用MIT研究人员发明的SCIgen,以“IKE ANTKARE”作为作者名(注意哦,作者并非真实存在),自动生成了102篇科研论文,让IKE ANTKARE在谷歌学术中的h指数一下飙升到了94,成为计算机科学领域科学家H指数排名第6的学者。

下图显示了该研究中使用的工具SCIgen,只要在SCIgen网页上的作者栏中输入作者名,程序就可以自动生成一篇拥有完整结构的computer science论文,包括Titles, authors, sections, bibliography, graphs, figures等等。

ai造假(AI生成百篇假论文)(3)

注:SCIgen 论文生成器

请看用SCIgen 论文生成器自动生成了一篇我的论文,是不是挺吓人?

ai造假(AI生成百篇假论文)(4)

注:SCIgen 论文生成器自动生成的论文

如何让谷歌学术收录自动生成的论文?

要想获得谷歌学术中的 h 指数值,首先得让谷歌收录你的论文。CYRIL LABBE用与上文所说的方法,利用SCIgen生成了100篇论文,每篇论文都对所有的100篇论文进行引用,然后生成该论文的html页面,html页面包含论文标题、摘要及PDF全文链接等信息。

ai造假(AI生成百篇假论文)(5)

注:图片来源于参考文献中的论文(伪造论文的引用关系)

为了让谷歌学术能够对这100篇论文进行索引,CYRIL LABBE在这100篇伪造论文的参考文献中加入了1篇真实的已被谷歌学术索引的论文,然后将这100篇论文上传到网上。不久,IKE ANTKARE的h指数就已经飙升到了94,甚至高于爱因斯坦的h指数84。

你可能引用了虚假论文

目前,谷歌学术已经对这批论文进行了处理,但是在百度学术中,仍能看到这些用软件生成的论文及其被引频次

ai造假(AI生成百篇假论文)(6)

注:你可能引用了百度学术中的虚假论文

从这个案例中我们可以看到,数据随意的学术搜索引擎,很容易被人为操纵,因此不宜使用其引文数据作为学术评价的数据源。

参考文献:

LABBÉ, C. (2018). One of the great stars in the scientific firmament. ISSI NEWSLETTER, 6(2), 48-52.

(本文授权转载自:林墨)


ai造假(AI生成百篇假论文)(7)

【加入社群】

新智元 AI 技术 产业社群招募中,欢迎对 AI 技术 产业落地感兴趣的同学,加小助手 aiera2015_3 入群;通过审核后我们将邀请进群,加入社群后务必修改群备注(姓名 - 公司 - 职位;专业群审核较严,敬请谅解)。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页