「論文寫作障礙」的福音：人類做實驗，A.I.寫文章

知識 01-02

圖片來源： phys.org

撰文 Daniel Engber

翻譯何偉雄

審校魏瀟

自動化學術寫作的未來不遠了，這是件好事。

2014 年，法國的一位研究人員透露了一個關於已發表的學術論文的令人不安的事實：根據他的分析，至少有 120 篇電腦撰寫的稿子被編入了學術會議論文集。這些由程序書寫的文章幾乎是由一些串聯在一起的詞語堆砌起來的，全部由一個名為 SCIgen 的軟體創造——這個軟體最初源於 MIT 的三位研究生 2005 年的一次無心之舉。但是在那之後，一些科學家把 SCIgen 當成了豐富學術簡歷、提升職業地位的工具——這顯然是個重大的醜聞。

一篇 SCIgen 生成的論文來源：betterscience.org

不過，這個醜聞讓克勒門?祖潘基奇（Klemen Zupancic）獲得了靈感。這個 32 歲的分子生物學家和科技企業家認為：「這提醒了我們。」祖潘基奇是 sciNote 的負責人—— sciNote 是一家科技創業公司，該公司建立的目的是改變科學家從使用筆和紙做實驗筆記的現狀，推動他們轉而應用更高效的在線工具。（該公司聲稱他們有大約 2 萬名用戶，其中幾乎一半在美國）。當他讀到機器撰寫的論文混進了學術期刊時，他意識到，這樣的方式可以被用於更為正當的目的。如果軟體可以發表「八股文」式的文章，那麼它也可以寫出一篇有效的科學論文。所以他的公司開始著手開發一個能夠做到這一點的程序。

他們的努力變為了現實——這個名為「Manuscript Writer」的程序在十一月初面世了。它的工作原理是搜索 sciNote 用戶使用的參考文獻，數據和實驗流程，然後把它們串連起來，形成一篇正式學術論文的草稿。這種草稿非常粗糙：軟體甚至寫不出討論部分或者對實驗結果的解釋; 而且根據筆者所知，軟體對文章其他部分的寫作並不比 SCIgen 好。Manuscript Writer 能夠構建起論文的導論部分，它從一系列開放獲取的參考文獻中挑出句子，然後將這些句子隨機地組合起來，生成所謂的「導論」。

Manuscript Writer的使用網址：https://scinote.net/manuscript-writer/

但是，sciNote 系統是可以改進的。理論上，它的 A.I. 可以通過比較用戶已經完成的論文和軟體的「試作品」，從錯誤中學習。鑒於目前自動化新聞報道已經出現，預測出機器撰寫論文的質量會越來越好似乎也並不是什麼瘋狂的想法。也許軟體可以達到和人類科學家的平均寫作水平一樣好（或者一樣差）的程度。

我們應該都很期待這一天的到來。當涉及到用理論來闡述結果的部分時，人類智能是必不可少的，但科學寫作其餘的部分——從論文的導論到實驗，方法和結果的描述——都能夠受益於自動化。

「八股文」的功與過

歷史上學術論文的質量可能比今天糟糕得多。頂級科學家們很久之前就已經開始為同行的糟糕寫作感到惋惜了。例如，1908 年，弗朗西斯·高爾頓（Francis Galton）向皇家文學學會（Royal Society of Literature）提交了「改善科學回憶錄文體的建議」（Suggestions for Improving the Literary Style of Scientific Memoirs）。他寫道：「我在家的時候曾閱讀了許多回憶錄的手稿，其中沒有什麼特別深奧的東西，但是這些手稿表意模糊，語法糟糕，而且文章的結構充斥著錯誤，在第一次讀時幾乎無法理解。 ......這些手稿的作者可能是成功的研究者，但他們的文筆差勁得令人可悲，以至於難以發現其內容的不足之處。「

在高爾頓的抱怨之後，事態進一步發展。科學家們為了方便他們的工作而決定使用通用語，這就意味著世界各地的研究人員不管水平如何都不得不用英文寫作。與此同時，二戰後科技事業的發展以及學術學科的日益細分，使得研究論文更加技術化、形式化。大約在 20 世紀中期，一個沉悶枯燥的模板開始在整個科學領域傳播：首先是導論（Introduction），然後是實驗所用的方法（Method），再然後是結果描述（Result）和討論部分（Discussion）。到上世紀 70 年代，這種「IMRaD」格式在論文寫作中幾乎成為了共識。

來源：wedestroydis.co

隨著這些變化日益根深蒂固，科學寫作不再是一種修辭類型，而是一種傳達數據的工具。現在的論文看起來更像網路上的數據包。如果所有這些數據包都是使用相同的演算法、不經修飾，這隻會使它們更有效率。根據喬納森?奈特（Jonathan Knight）在《自然》雜誌 2003 年的一篇文章中所引用的辭彙分析顯示：在 1900 年，《科學》與《自然》上的論文就像《紐約時報》（New York Times）上的文章一樣容易被大眾所接受。但漸漸地，論文的可讀性逐漸下降，專業術語也變得越來越多。

「我們現在處於一種鼓勵趨同的體系中，」《自然：科學雜誌的歷史》（Making Nature: The History of a Scientific Journal）一書的作者梅林達·鮑德溫（Melinda Baldwin）說。「我們正處於一個不鼓勵人們撰寫優美科學論文的系統中。」現在獨立的研究人員面臨需要大量發表論文的壓力而不得不放棄個人風格。對他們來說最重要的是儘可能快速、清晰地發布他們的結果。

即使是現在，那些非英語母語的科學家，或者只是想省事一些的科學家，也可以把他們論文寫作有償外包給專業人士。對於那些對自己的語言功底不自信或太過忙碌的人來說，自動寫作（automated writing）會更好。A.I. 所生成的每一篇文章可能最終看起來會很相似，但這是一件好事。這縮小了學者語言背景上的差異，他們文章中寫作風格上的缺陷也將被減少。高爾頓對於論文寫作質量的煩惱——表達模糊、語法不好、錯誤的文章布局——都可以從文章中剔除，或者通過論文寫作軟體的一系列更新得以修正。

當然，這種扁平化也會抹去文章可能蘊含的一切魅力或智慧。例如，有史以來最著名的科學論文之一：弗朗西斯·克里克（Francis Crick）和詹姆斯·沃森（James Watson）於 1953 年在《自然》雜誌上發表的關於 DNA 結構的文章。即使這篇論文列出了生物學史上最重要的發現之一，它的作者們也只是在文章中對這項讓他們名垂青史的成果進行了輕描淡寫地闡述：」我們注意到，本文所假設的特定配對表明了遺傳物質可能存在的複製機制。」

寫得太好也是「罪」？

如果他們的論文是由克勒門?祖潘基奇的軟體或類似的東西自動撰寫的話會怎麼樣？我們可能會錯過這二人具有劃時代意義的工作。文章《核酸的分子結構》（Molecular Structure of Nucleic Acids）在寫作上沒有特色，風格枯燥無味，也幾乎沒有其他論文所具有的的優雅。

但是，這可能也是一件好事。

如果糟糕的文筆干擾了論文閱讀——它減慢了實驗和數據的共享和傳輸——那麼好的寫作就正相反：它可以使論文整潔，邏輯順暢; 它消除了歧義，幫助讀者理清它所描述的發現。根據 FiveThirtyEight 的內特·希爾（Nate Silver）的分析，一篇研究論文寫得不好的話人們就很難發現其中的錯誤，但寫得太好也是一樣的。他說，在「平均」水平的論文中，發現錯誤是最容易的，你不會被文筆分散注意力。

心理學實驗為這個想法提供了支持。根據被稱為「流暢性啟發式」（fluency heuristic）的理論，一種表述越容易被人們理解，那麼它看起來就越可信。如果這是真的，那麼寫得不好的論文就會處於不利的地位，它們的可信度會下降——即便支持結果的科學論述是完全合理的。而以簡練有趣的風格撰寫的論文可能更容易被認為是可信的，哪怕它們基於非實質性的證據。但是，如果 A.I. 為我們寫論文，我們就不用擔心我們會成為這種偏見的受害者。每一篇文章都會以平均的方式書寫：不會太差，也不會太好。

從早期的學術期刊開始，人們就認識到了這個問題，並且感到了科學寫作中詭辯式修辭的威脅。1665 年，英國皇家學會（Royal Society of London）出版了第一份專門的科學期刊。在兩年後，英國皇家學會出版的傳記中，托馬斯·斯普拉特（Thomas Sprat）曾自豪地說：「該組織的慣例是拒絕所有的誇大、離題和臃腫的風格，他們要求全體成員用一種緊湊的、樸素的，自然的說話方式：積極地表達、清晰地判斷、自然流利、盡量做到「如同數學一般的明確」。

不過，並不是每個科學家都贊同「慣例」。當皇家學會向這個方向努力時，歷史上其他的一些學者群體更傾向於花哨的表達。科學傳播學者亞歷克斯·齊斯扎（Alex Cziszar）引用了博物學家亞歷山大·馮·洪堡（Alexander von Humboldt）的言論：與其他浪漫主義科學的支持者一樣，洪堡認為「對宇宙中偉大現象的清晰闡述」應該使用「富有創造性的表達」。

齊斯扎說，這一爭論與如何評價一篇論文寫得「好」有關——科學家們是否應該努力追求清晰、優美、效率或其他行文風格——這個問題長久以來一直存在。從 19 世紀晚期開始，許多科學家都傾向於更簡練、平淡的文章。1925 年，兩名醫學雜誌編輯在一篇論文風格指南中寫道:「那些絢麗的、浪漫的風格，充滿了多音節、隱喻性的辭彙，會分散讀者的注意力」，以及「在學術寫作中，沒有必要用非簡練的、盎格魯撒克遜式的術語來表達想法或陳述事實。」

A.I. 的天下

事實上，隨著科學研究越來越多地關注數據，會有更多沉悶而公式化的論文出現。目前，我們在生物醫學領域至少有 2400 萬份參考文獻，1500 萬名科學家正在積極地撰寫論文。哪怕在一個單一的研究領域，即使這些研究都被寫的很清楚，每個研究者依然有太多的知識要吸收。為了更好地處理這些論文，我們將越來越依賴另一種軟體——不是 A.I. 寫作者，而是一個A.I. 閱讀者。這已經實現了：科學家正在使文獻檢索過程變得自動化，而 A.I. 可以一次性通過摘要對數以百萬計的論文進行分類。這樣我們可以從演算法中獲取最大的益處。如果 A.I. 從一開始就是論文寫作者，那它當然也能更好地理解它們。

機器革命還能更進一步嗎？去年，的里雅斯特大學（University of Trieste）的研究人員做出了一些新的東西：A.I. 同行評議。受 SCIgen 的啟發，這些科學家著手編寫了一個能自動生成評議報告的工具。該方案將根據使用者設定的模式對任意一篇論文進行正面，負面或中立的評估。計算機告訴一位作者：「如果你再討論一些關於建立起良好的共享基準的重要性，那麼論文將會更好。「另一個建議是：「確定模型中的關鍵假設是很有用的。」當科學家們把機器生成的評論與真人的評論混合在一起給一群人類讀者閱讀時，計算機生成的評論有四分之一被認為比人類的更有用。

兩條由A.I.生成的論文評議，你覺得有道理嗎？

一旦 A.I. 同行評議得到了充分的升級，它們就可以審閱同樣由 A.I. 撰寫的論文。這之後，下一步應該是顯而易見的：A.I. 科學記者將為我們呈現出由 A.I. 作者發表的最新研究進展。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 科研圈 的精彩文章:

※直面科學界的性騷擾，我們要堅定的說「不」！
※我們從2017等到2018，就是為了你的出現
※為了找出被研究次數最多的基因，他和《自然》一起做了個「明星基因」排行榜
※年度最酷的七大分子
※2017年，你最喜歡的學術傳播文章是哪篇？

TAG:科研圈 |