當前位置:
首頁 > 新聞 > 三個學生開發的學術釣魚軟體,成功忽悠了整個學術圈

三個學生開發的學術釣魚軟體,成功忽悠了整個學術圈

來源:SME科技故事

只需輸入作者名,電腦就能幫你生成一篇「SCI級別」的計算機論文。

摘要、背景介紹、實驗結果、圖表、討論以及結論等都一應俱全。

世上就是有這等美事。

只要你想,一口氣就能搞個幾百篇計算機論文。

儘管SCIgen只是一個網頁程序,但它產出的論文格式可能比一些本科論文還要規範。

這是本人用SCIgen自動生成的論文,SCIgen官方網站為https://pdos.csail.mit.edu/archive/scigen/感興趣的可以自己一試

不過也別高興得太早,到目前為止AI還無法取代人類完成科研任務。

別看這些生成的論文有模有樣,但根本沒有地球人能看得懂。

不是因為太高深,內容純屬是「一本正經地胡說八道」

但這並不要緊,因為在學術界總是會有人上當。

將這些計算機論文,投稿到一些國際學術期刊還會被錄用,極具諷刺意味。

SCIgen界面

學術出版界也是個江湖,同樣魚龍混雜。

並不是所有人,都奔著證明自己或是發現真正有價值的東西而來。

而SCIgen這個程序的誕生,就是為了戲耍學術界的那些「野雞期刊」。

這些只以盈利為目的的野雞期刊也叫掠奪性期刊(Predatory journals

),學術質量與信譽都很低。

他們的日常就是瘋狂地給科研人員發送垃圾郵件,以「徵集論文」之名吸引那些沒有發表經驗的學者上當。

一般來說在論文發表前,學術刊物主編會邀請專業領域內有一定造詣的同行學者,評議論文的質量。

這也叫同行評議,刊物會按評議結果決定是否發表。

但掠奪性期刊,只要錢到位他們都能安排論文的發表,連審都不用審。

因為日常不堪騷擾,麻省理工學院(MIT)計算機科學與人工智慧實驗的幾個學生就看不過去了。

2005年,Dan Aguayo、Max Krohn和Jeremy Stribling三人,決定向這種」水」得不行的期刊和會議宣戰。

從左到右分別為Dan Aguayo、Max Krohn和Jeremy Stribling

那時已臨近學期末,但這MIT三劍客還是花了一兩星期去開發這個小程序。

SCIgen的原理很簡單,有些類似於填詞遊戲

學術論文的格式是非常相似的,它本身就充滿了專業辭彙和固定的句式。

而SCIgen則能夠從固定的詞庫中,隨機抽取出這類計算機領域內的專業術語,以符合語法的方式生成文本。

再加上一些漂亮的圖表和詳細的參考文獻等,就能騙過不少外行。

SCIgen生成的論文中帶有的圖表

但這個軟體真沒多厲害,內行人一看就知道全文是在「胡說八道」。

要怪,就怪一些期刊和會議灌水得太過分了。

不出所料,他們第一篇自動生成的論文就攻破了WMSCI(World Multiconference on Systemics, Cybernetics and Informatics)會議的防線。

這篇論文名為《Rooter:處理接入點與冗餘的典型合一方法》,看似高大上其實內容根本不知所云。

而WMSCI會議,不但接受了這篇假論文,還邀請作者出席會議作報告。

這下可高興壞了MIT三劍客。

畢竟在這之前,他們就聽說WMSCI會議以接受水貨著稱,但沒真想到他們居然這麼水。

於是,他們便把SCIgen攻陷WMSCI的事情經過發到網上。

一波嘲諷下來,這在科研圈立馬引起了廣泛的關注。

畢竟大家早就看不慣這些掠奪性期刊和會議。

這下WMSCI會議是顏面掃地,立馬撤回了對他們團隊的邀請。

不過,失去報告資格,這三劍客反倒來了興緻。

利用在網路上眾籌來的2500美金,他們決定將惡作劇升級,搞一波大的。

這三人,長途跋涉地在同一天趕往了會議所在的佛羅里達州奧蘭多市。

就在大會舉辦的同一地點,他們租了一塊場地,用「假身份」開了一場屬於自己的「分會場」。

「假會議」現場,該有的都有

想要偽裝一場學術會議並不難,和論文灌水一樣只要有錢就夠了。

而報告內容用SCIgen就能無限生成,這種垃圾想要多少就有多少。

除此之外,他們還置辦了一批假的宣傳海報、假名片、假鬍子和假髮等。

反正,這場學術會議的一切都是假的。

但這並不妨礙有人上當,當時來聽他們裝模作樣演講的人還不少。

如果不明真相,或許這些人到現在都仍以為自己是在聽WMSCI的報告。

演講現場,圖中為戴著假髮的Jeremy Stribling

但這場鬧劇,並沒有隨著這場假學術會議的結束而收場。

剛開始,只是IEEE撤銷了對WMSCI會議的資助。

到後來,越來越多人開始使用SCIgen產出的「釣魚文」在其他學術期刊「試水」。

現階段,這三位SCIgen元老已步入職場,深藏功與名。

而他們留下的這款軟體,則將學術界攪得天翻地覆。

例如,德國的學生利用這款神器,就攻下了2008年和2009年在中國武漢舉辦的兩個IEEE國際會議。

當時,Schlangemann教授就被當成知名學者,還被邀請作為會議的主持人出席。

但Schlangemann教授並非真有其人,他只是一個由這位學生創造的虛擬角色。

而這個名字,則源於一部名為Der Schlangemann的德國電影。

Schlangemann教授還有虛擬的個人網站,感興趣可以自行搜索Der Schlangemann的形象,比想像中還要諷刺

現在SCIgen的訪問量依然驚人。每年的瀏覽量仍超過60萬次,無數釣魚文在源源不斷地產出。

這導致了這個頁面,隔幾個月就要崩潰一回。

2013年,法國格勒諾布爾大學的研究員Cyril Labbé就透露了一個令人不安的事實。

他在IEEE和Springer出版公司旗下的期刊中,就發現了超過120篇SCIgen生成的詐文。

對於自己是否已徹底排查出所有亂入的偽論文,Labbé自己心裡也沒底。

因為他本人也無法從有限的訂閱源內下載所有的論文。

這也是學術出版商常常遭到詬病的一點。

想在期刊上發論文需要收取高昂的版面費,但想在上面下載論文則又要付另外一筆費用。

就算是作者本人在學術期刊上發表的論文,想要下載都不能例外,一律收費。

而除了期刊的審核不嚴格,Labbé還揭示了另一個漏洞。

那就是,利用SCIgen這類垃圾論文軟體,竟可以給自己狂刷h指數(H index)

一名科研人員的h指數,是指他至少有h篇論文被引用了至少h次

這是評價個人學術成就的一個新方法。

例如,某人的h指數是20,這表示他已發表的論文中,每篇被引用了至少20次的論文總共有20篇。

但所謂的H指數,在SCIgen的搗亂下就無法起效了。

當時,Labbé就以「IKE ANTKARE」作為作者名(注意,IKE ANTKARE這人並不存在),用SCIgen生成了102篇垃圾論文。

這讓IKE ANTKARE在谷歌學術中的h指數,一下子飆升到了94。

他還一度擠進了計算機科學領域科學家中h指數排名的前六。

當然,為了讓h指數變高,他也用了一點小技巧。

這100篇假論文中,每篇都會對所有作者名為IKE ANTKARE的假論文進行引用。

而為了讓谷歌學術能夠對這100篇論文進行索引,Labbé還在參考文獻中加入了唯一一篇真實的,已被谷歌學術索引的論文。

「我自己引用自己」,就這樣IKE ANTKARE憑一己之力就成了學術界冉冉升起的新星。

這一虛擬人物的h指數,甚至比愛因斯坦還要高。

當然,IKE ANTKARE這顆學術新星隕落得也很快。

因為Labbé已經將自己的一系列騷操作寫成論文,對世人公開了IKE ANTKARE的虛擬身份。

隨後谷歌學術,就對IKE ANTKARE進行了封殺並刪除了他的論文。

Cyril Labbé本人

因為一些知名學術期刊,會對這些計算機生成的詐文照單全收。

那麼,我們就有理由相信一些作者會把SCIgen當作賺錢的工具。

於是,為了揪出這些混入科學期刊的詐文,Labbé就與Springer合作特意開發了一款針對SCIgen的軟體——SciDetect

這款開源軟體,能夠自動檢測出哪些是由SCIgen生成的假論文。

但在這之後,SCIgen的創始人之一Stribling是這樣評價此事的。

「他們開發了一個新程序,而不是制定更好的政策讓所有被接受的論文有更好的評審過程,這事本身就挺搞笑的」。

事實上,SciDetect的作用並不大,想要繞開這個程序的檢測並不難。

Stribling表示,如果這是一場軍備競賽,他敢打賭再次騙過SciDetect只是時間的問題。

事實上,學術釣魚從上個世紀就已經存在了。

早在1996年,量子物理學家艾倫·索卡爾(Alan Sokal)撰寫的一篇科學詐文,就引起了一場「科學大戰」

他將一篇充滿了常識性錯誤的論文,投稿至著名的文化研究雜誌《社會文本》。

標題為《超越界限:走向量子引力的超形式的解釋學》。

結果《社會文本》的五位主編,都沒有發現這是一篇詐文,還一致通過將文章發表。

東窗事發,這立即觸發了一場席捲全球的科學大論戰,世界眾多著名的媒體都參與其中。

艾倫·索卡爾

相比SCIgen,艾倫·索卡爾還是比較有誠意的。

儘管內容還是一本正經地胡說八道,但論文畢竟還是他自己親手炮製的。

他將量子物理學中的術語、後現代主義領軍人物的術語,還有他自己捏造詞句糅合在了一起。

於是便得到了一篇毫無學術內涵,但又充滿「後現代」風格的詐文。

而作為學術釣魚的鼻祖,之後的學術釣魚事件都被稱為「索卡爾的平方」

那麼學術釣魚,何時能消失?很簡單,只有魚兒不上鉤,釣魚就會自動失去意義。

*參考資料


Adam Conner-Simons.How three MIT students fooled the world of scientific journals.MIT News.2015

Jerrusalem.「三傻」大鬧科研塢:我們怎麼釣出了那些水貨?.果殼網專訪.2015

李慧翔.給我一篇假論文,我能騙倒半個地球.南方周末.2013


John Bohannon.Hoax-detecting software spots fake papers.Science.2015

CYRIL LABBE?.One of the great stars in the scientific firmament. ISSI NEWSLETTER.201=

編輯:劉義陽

審核:王小龍


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 科技日報 的精彩文章:

長時間太空旅行對人體有害?NASA找了對雙胞胎宇航員來研究
拔U盤不用再點「安全彈出」了!網友:我點過嗎?

TAG:科技日報 |