同行評議制度:保障學術純潔性的堅實防線?
海歸學者發起的公益學術平台
分享信息,整合資源
交流學術,偶爾風月
摘 要
如今,同行評議是發表論文、申請經費的必由之路,然而這一制度並非完美。許多人都抱怨,即使是經過同行評議的期刊,依然會刊登很多有缺陷甚至涉嫌造假的科研成果;而另一種聲音則批評道,同行評議對有根基的思想和體系有利,卻會扼殺科研創新。
本文將為您指出,同行評議從誕生到膺負眾望,其間的過程遠比人們以為的要更迅速、更複雜……
1936年初夏,愛因斯坦和他的助手Nathan Rosen向《Physical Review》提交了一篇關於引力波的論文。在文中,他們提出了一個違背學界共識的觀點,即認為引力波不存在。論文提交六周後,《Physical Review》總編輯John Torrence Tate反饋給了愛因斯坦一份審稿意見,並要求他充分解釋審稿人的質疑。
若在現今學界,大家對這種情況絕對司空見慣了。現代科學家們都默認他們投遞的文章會接受審閱,並且在正式出版前會經歷再次的修訂。然而,當時的愛因斯坦卻不這樣認為。對於他的論文被送往外部評議,他感到震驚和不悅。
愛因斯坦回復Tate道,「我和Rosen將我們的稿子寄給你,並沒有允許你在出版之前將它給別的專家看。因此我們也沒有任何必要回應你這位匿名專家的評論。此外,以後我再也不會給你的雜誌投稿了。」
愛因斯坦說到做到,後來他再也沒有向《Physical Review》投過稿。
我們可以把愛因斯坦的反應看作是一位資深物理學家的驕矜,他認為他的聲譽足以讓他略過同行評議的過程。當我們深入探討同行評議制度的發展史,會發現其後蘊藏著更複雜的圖景。1936年間,同行評議在世界頂尖的期刊裡面並不流行,甚至可以認為《Physical Review》這次行為很是反常。即便在同年,當愛因斯坦向雜誌提交那篇著名的反量子理論的Einstein-Podolsky-Rosen(EPR)論文時,也沒有進行同行評議。
量子
所以,不難理解愛因斯坦為何難以接受這份匿名的評審意見。但是,80年後,同行評議制度幾乎已經被所有領域的專家學者接受。那麼,同行評議何以變得像今天這樣深入人心的呢?
期刊同行評議制度的發端
許多學術研究和世俗觀念都將同行評議歸結於同一源頭,即:1665年,英國皇家學會委派秘書Henry Oldenburg編纂的《Philosophical Transactions》——這通常被視為世界上第一本科學期刊。有的說法認為,Oldenburg當時就意識到,那些將要發表的文章需要聽取相關專家的意見。因此,同行評議誕生了,並且最終成為科學出版中必不可少的一部分。
然而,這種說法的準確性卻開始受到質疑。
這種說法起源於一篇發表在1971年的社會學文章——Harriet Zuckerman和Robert Merton的《科學評估模式:同行評議的制度化、結構和功能》。 Zuckerma和Merton的文章以對《Physical Review》推出同行評議這一決策的分析為基礎,展開了相關社會學研究。該研究極具開創性,《Physics Today》還在其1971年7月號(第28頁)上發表了一個精簡版。Zuckerman和Merton除了認可Oldenburg是同行評議的創始人,還表示自17世紀以來,同行評議的形式和功能幾乎沒有什麼變化。
然而,最近的歷史學研究卻挑戰了Zuckerman和Merton的看法。實際上,對於《Philosophical Transactions》應該刊登什麼內容,Oldenburg很少徵詢外界意見。他對雜誌內容進行的控制有時甚至到了自稱「作者」的程度。這本雜誌並沒有正式的投稿程序,Oldenburg只會刊登他感興趣的東西以及他認為對讀者有價值的東西——這不僅包括實驗論文,還包括對他人研究成果的評論性文章、流行書籍的討論,甚至還有他的私人信件。
儘管Oldenburg確實是科學出版史上的關鍵人物,但也許並不能稱他同行評議的創立者。這個榮譽應該屬於劍橋大學的William Whewell,他還創造了「物理學家」和「科學家」這兩個術語。Whewell在1831年提出,英國皇家學會應該就《Philosophical Transactions》中出版的論文徵集書面形式的評審報告。他還認為,這些評審意見也應在學會的新期刊《Proceedings of the Royal Society of London》上發表,這樣才能達到促進科學討論並為新期刊提供材料的雙重目的。
William Whewell (1794–1866)
英國皇家學會採納了Whewell關於徵集評審報告的建議,但很快就放棄了將它們出版以供公眾討論的想法。雖然少量報告確實曾出現在出版議程中,但到了19世紀30年代中期,這種做法就完全終止了。學會認為,進行評審主要是為了篩查出版物中的錯誤。到了19世紀中葉,《Philosophical Transactions》的評審工作幾乎完全由兩個秘書處管理,一個負責自然科學,另一個負責生物科學。秘書處的成員都是學會中的佼佼者,他們每個人都有一名助理秘書,為出版在《Philosophical Transactions》上的論文安排評審工作。評審報告被定位為機密文件,僅供學會內部使用。許多年來,無論作者的論文有沒有被採納,他們都無法接觸到這些報告。
由於作者無法看到評審意見,所以當時的制度與現在「修改並重新提交」的方式也頗有異處。投稿給《Philosophical Transactions》的文章,要麼被全然接受,要麼被直接拒絕。不過,秘書處偶爾也會鼓勵《Philosophical Transactions》的作者們在將文稿付梓前對文章進行修改。比如物理學家George Gabriel Stokes——他曾擔任學會自然科學秘書處成員三十餘年——就經常通過私人通信給作者們提供修改建議。Stokes會引用《Philosophical Transactions》評審員們有用的評論,而如果Stokes自己也審議過這篇論文,他經常還會發給作者一份完整並附有簽名的評審報告副本。
20世紀初的同行評議制度
在19世紀末,科學界對同行評議的看法發生了重大轉變。隨著人們越來越擔憂科學文獻的整體質量,同行評議制度不再是單純被用以幫助維護科研學會或期刊的聲譽,它越來越多地被看作是科研文獻名譽和可信度的捍衛者,被認為是「防止污水混進純粹科學的河流」。
到20世紀初,同行評議制度已經通用於大多數英文科研學會。理論上講,同行評議應當是開放且廣泛覆蓋的。但實際上,同行評審制度往往被限制在精英科學家的小型關係網中。20世紀初期的評審程序不像我們現在看到的科研期刊評審程序那麼正式,作者通常看不到評審報告。
例如,在《Physical Review》中,評審者知道編輯會為作者的內容袒護辯解,所以經常提交簡短隨意、甚至偶爾帶有諷刺意味的報告。常常擔任評審員的Howard P. Robertson(1903-1961),他曾這樣尖刻地評論道:某篇論文可能用隱形墨水書寫,才能有所改進。
直到1935年,《Physical Review》才向評審員們提供了一個論文的評審標準。而在20世紀60年代以後,對所有論文進行系統的同行評議工作才成為官方政策。
早期手寫的同行評議報告
冷戰前,出版商出版的商業期刊幾乎不會進行系統的評審。但在20世紀,諸如《Philosophical Magazine》和《Nature》等期刊卻仍在堅持論文的內部評議。這些期刊高度重視所刊發的論文,它們之中很多都有能力出眾的編輯在運營。要判定一篇論文的好壞,他們很少在少數十分可靠的顧問之外再諮詢他人。
同樣,許多著名的非英文期刊也非常依賴通過編輯的判斷來選擇內容。這樣的期刊經常把國內一些最受尊敬的科學家納入他們的編輯行列中。例如,普朗克是著名物理學雜誌《Annalen der Physik》編委會的長期成員。無論是否經過外部評審,都很少會有人去質疑普朗克是否有能力審定論文。
一些投資機構進行的外部評議也類似於期刊的評審過程。像洛克菲勒基金會這樣的私人投資機構,它們在一戰後就已經把投資決策權交給信任的中層管理人員。但相比之下,與政府或科研學會相關的投資機構使用外部評議更加廣泛,儘管這種做法在當時來說還不算普遍。
當美國政府於1948年成立國立衛生研究院(NIH)時,它管理科研資助的部門最初在很少或根本沒有進行外部評議的情況下評估撥款申請。第一個提交的提案是NIH附屬的專家學者能否組成一個小型研究部門,而這個提案最終由NIH組成機構的負責人(例如國家癌症研究所所長)決定是否撥款資助。
1950年,美國國家科學基金會(NSF)依據聯邦法律成立,它比NIH更依賴外部專家對提案的意見。有些提案專門採用郵件方式進行審查,即提案副本被郵寄給科學家,科學家再回複評審意見。其他提案則由在華盛頓特區召開的專家小組進行評估。
美國國家科學基金會 NSF
然而,與NIH的情況一樣,關於NSF資金流向的決策權主要還在NSF內部員工手中。董事們決定資助哪些提案,而同行評審意見只被看作是影響他們決策的一個因素。這個因素儘管重要,卻無法從根本上決定NSF是否授予或停止資助。另外,NSF和NIH的同行審議報告都不會發送給資助申請人。提交提案的科學家只能得到一份由政府僱員編寫的簡短摘要,說明提案被接受或拒絕的主要原因。
在冷戰之前,有些期刊或投資機構為了避免外部評審者獲得太大權利,而選擇由內部人員主導,這些機構與更依賴外部評審者的機構相比,顯得缺乏科學性也不太可靠。但愛因斯坦與《Physical Review》發生衝突的故事也表明,那些習慣了靠編輯或基金會董事做出決策的研究人員,不一定會認可外部評審。畢竟,作者為什麼要相信某個匿名的審稿人,而不是相信願意為自己的言論署名的、受人尊敬的編輯或項目負責人呢?
公共信託與同行評議
「同行評議」一詞在20世紀60年代首次出現在科學出版社。有趣的是,這個詞似乎並不是起源於期刊。相反,「同行評議」最初用於描述投資機構(通常是NIH)和醫學界的評審委員會。
「對不同的人來說,同行評議意味著不同的事情,」內科醫生兼研究員Irvine H. Page在1973年美國醫學協會雜誌上的一篇社論中如此評論到。他指出,「對於大多數美國內科醫生來說,這意味著PSRO(專業標準審查組織,它審查對美國醫療保險法的遵守情況)的造訪;對於英國上議院來說,這意味著由同行來檢查自己是否存在道德問題;而對於科學界來說,這意味著研究部門和理事會將核查受資助人的財務狀況和研究前景。」
有意思的是,儘管科學家和編輯們在上世紀70年代為了前述的目的慢慢採納了這個術語,但那時期刊的同行評議並不等同於Page提出的定義。
1975年, NSF的資助項目陷入了一場爭議,這個小插曲將讓同行評議變得更加常見,也將凸顯並鞏固同行評議對於學術界越來越重要的意義。美國的科學家——特別是物理學家,是膺負著曼哈頓計劃的巨大成功進入冷戰時期的。到1953年,美國政府在科學方面投入的開支比戰前增加了25倍,但一直到蘇聯在1957年先於美國發射人造衛星,美國科學界的公眾形象才得到改善。
然而,美國對科研資助的熱情是有限的。早在1966年,國防部的一項研究就得出結論,國防部在基礎研究上的大量投入,並未有效推進諸如新武器等目標的研究。這項研究發表在一份名為《the Project Hindsight report》的文件中,該文件的結論導致一些立法者和評論員更加頻繁地質疑科研支出。科學家們在冷戰初期獲得的社會、經濟地位開始出現動搖,而這篇報告則為它們可能面臨的風險埋下了伏筆。
到1975年,兩個超級大國之間的冷戰已經進入了相對平靜的時期。與蘇聯並駕齊驅似乎變得不那麼重要了,因為美國此時正為經濟危機焦頭爛額。由於它在1973年阿以戰爭中對以色列的支持,幾個主要石油生產國拒絕向美國出售石油,因此美國的石油和天然氣供應出現缺口。而此時美國經濟也開始停滯,通貨膨脹和失業率飆升。由於國會面臨削減稅收、減少開支的壓力,一些國會議員將目光投向了NSF。
NSF最突出的對手是參議員William Proxmire,他熟諳鼓動人心的技巧,是一位經驗豐富的威斯康星州民主黨人。1975年3月,Proxmire開始頒發他著名的「金羊毛獎」,這一獎項將被授予當月他認為最浪費納稅人金錢的政府項目。前兩項金羊毛獎都被授予了NSF資助的項目,分別是威斯康星大學關於人際吸引力的社會學研究及心理學家RonaldHutchinson關於為什麼人類、老鼠和猴子會在壓力下咬緊牙關的研究。Proxmire呼籲NSF「擺脫愛的喧囂」,並宣稱Hutchinson的「無稽之談」已經「讓美國的納稅人製造出了猴子」。
William Proxmire (1915–2005)
與此同時,一位名叫John Conlan的國會議員也開始瘋狂批評NSF在其教育計划上的開支,特別是MACOS(Man: A Course of Study,人類學習課程)和ISIS(Individualized Science Instructional System,個性化科學教育系統)。 MACOS是一個社會科學課程,自20世紀70年代早期開始,在Conlan的家鄉亞利桑那州飽受爭議,批評者聲稱它促進了道德相對主義。針對四年級學生的ISIS項目也被指責在生殖教育上過於露骨。
在討論為何MACOS和ISIS能獲得政府資助的過程中,Conlan與包括基金會董事H. Guyford Stever在內的NSF領導發生了衝突。Conlan向NSF索要完整的評審報告以及審查人員的名單。而Stever回答說,審查人員提交的審議報告受保密承諾的保護,公開審議報告的內容或審查人員的名字將違反NSF政策。然而,Conlan仍堅持索要相關文件。
Conlan說,「我再次提醒您,我是一個負責監督NSF的國會議員。因此,我要求您向我提供提供同行評議者的審查報告——並且要完整的原始版本。」
這場關於NSF撥款的公開辯論以及後續的私人交流,最終導致了NSF同行評審特別監督聽證會的召開。1975年7月,該聽證會在眾議院科學研究和技術委員會召開之前舉行。在為期六天的會議里,國會中的質疑者和證人們詳細地討論了NSF的同行評議過程。
國會大廈
Conlan在他的證詞中指出,NSF的評審制度使決策權集中在董事會成員手中,而沒有給外部評議者的意見以足夠的重視。他聲稱,讓基金會盡職盡責的唯一方法是公布評審報告以及審查人員的姓名。
NSF的團隊參加了聽證會,準備對這些意見做出回應。Stever董事宣布,自1976年1月1日起,申請者將會得到他們評審報告的完整副本,不再僅僅是摘要。然而,Stever也堅持必須通過保持同行評議者的匿名來確保他們的坦誠。NSF的領導人們還表示,在未來,新的審計處將確保董事們的意見在正面或負面的評審報告中佔據更為適當的權重,換句話說,NSF將把更多決策權交到同行評議員手中。
在聽證會之後,NSF資助的教育項目大幅縮減,對MACOS和ISIS的資助幾乎全部被取消。不過,NSF的同行評議改革至少暫時平息了激烈的爭論,並且很快就使這場爭論從公眾視野中消失了。與此同時,Hutchinson起訴Proxmire誹謗,使他捲入了一場訴訟。Proxmire最終向這位心理學家公開道歉,並在未來的金羊毛新聞發布中刪除了個人姓名。
儘管大多數的批評都是針對社會科學的,但是各個學科的科學家們都在關注這場爭論。《Physics Today》對本次聽證會和NSF的政策變化進行了密切的關注。總編輯Harold Davis在一篇社論中指出,聽證會表示:「同行評議是我們決定如何在特定領域分配資金的最佳手段。」
在同一篇社論中,Davis還宣稱,《Physics Today》將向每一位國會議員發出申明,以闡明科學界的內在運作機制。正如Davis所言,「在這個科學技術與社會議題緊密相關的時代,我們將需要更多的同行評議。」
20世紀60年代和70年代是人們對同行評議的觀點轉變的關鍵時期。在20世紀中葉,外部評審僅僅是期刊或投資機構用以決定是否通過申請的標準之一。到冷戰結束時,同行評議已成為保持科學權威的先決條件。
NSF陷入的這一爭議顯著地表明,至少在美國,加強同行評議的原因之一是冷戰期間科學家和公眾之間的關係發生了變化。在上世紀50年代和60年代,基礎研究和應用研究方面的支出都大幅增加。而當人們開始質疑受資助研究的公共價值時,科學家們就面臨著失去公眾信任和削減研究經費的問題。立法者們希望科研支出能夠對公眾負責;科學家們則希望與科學事務的決策權能夠掌握在科學家手中。因此,施行同行評議制度,至少能確保那些最好且最重要的項目得到資助,這是一種折中的解決方法。
同行評議的危機?
如今,同行評議是發表論文、申請經費的必由之路,雖然這一制度並非完美。許多人都抱怨,即使是經過同行評議的期刊,依然會刊登很多有缺陷甚至涉嫌造假的科研成果;而另一種聲音則批評道,同行評議只對有根基的思想和體系有利,會扼殺科研創新。
2014年,PLOS(the publisher Public Library of Science,出版商公共科學圖書館)的共同創始人Michael Eisen告訴《華爾街日報》的記者,科學家和非科學家都需要拋棄「只要通過任何期刊任何形式的同行評審,就說明這個科研成果是正確的」這一觀點。他認為:「這隻意味著這個成果經過少數人(1~4人)的審閱以後,沒有發現任何重大問題。」
PLOS ONE
當前的同行評審制度的另一個缺點是,評審人員不會因其工作而被授予終身職位或是獲得晉陞。不堪重負的科學家們幾乎沒有動力去完成冗長、細緻的審議報告——這些報告早已超過了作為優秀科學公民應履行的最低義務。
在線出版和在線閱讀的方式轉變催生了同行評議的替代方法,比如允許科學家對他們所閱讀的文章發表評論。長期以來,物理學家們一直通過非同行評審的arXiv.org(全球最大的預印本系統)來尋找他們領域的最新出版物,儘管讀者們可能會懷疑這些論文的質量,因為它們僅僅是被發表在arXiv上,還未曾登上過任何期刊。
其他期刊一直在嘗試逐漸改變同行評議制度。美國科學公共圖書館旗下的《PLOS One》是一本著名的開放獲取的期刊,它要求它的評審員們只判斷論文中科學的含金量,不用判斷這項研究的重要性或影響。《PLOS One》政策背後的信念是,後期的科學家們將會證明哪些文章是真正有價值的。另一本期刊《ELife》則注重評審員和編輯之間的溝通,就一篇論文的前景達成統一的決議,而不是給作者多份可能會相互矛盾的報告。
《Physical Review》
在考慮同行評議制度的未來時,探究它的過去是有益的。我們經常把同行評議說成是學術界自從艾薩克·牛頓時代以來穩定不變的部分,但是同行評議的歷史實際上比我們認為的要更短也更複雜,並且同樣飽受爭議。早在1845年,就有人評價同行評審「毋庸置疑地充滿著嫉妒、仇恨和惡意」。換言之,在那時,對同行評議的非議就已經非常普遍。
此外,同行評議最初並不是為了檢測學術不端或確保學術論文的準確性而開發的。Whewell認為,評審報告將會促進學術界的討論;學術界也接納了評審制度以避免刊登不恰當的內容。曾經的主流觀點是,應對論文負責的是作者,而非同行評審員。但及至20世紀,人們開始認為評審員也應對科學文獻的質量負責。直到冷戰結束之後,同行評議才終於作為論文評價的必要環節而被廣泛接受。
同行評審在科學界的作用從來就不是一成不變的。 迄今為止,它的形式和目的總是隨科學家的實踐需求而被不斷塑造、改變——無論這個需求是維護科研共同體的信譽,還是改善科學文獻的質量,抑或是保證科研支出的有效運用。 如果科學家們想要變革同行評審的未來,那麼他們必須得考慮清楚:同行評審將為何種目的服務,而這個目的本身,又是否經過了兩人以上的同行評審?
參考資料
H. Zuckerman, R. Merton, Minerva 9,66 (1971).https://doi.org/10.1007/BF01553188,GoogleScholarCrossref
A. Fyfe, J. McDougall-Waters, N. Moxham, NotesRec.: R. Soc. J. Hist. Sci. 69, 227 (2015).https://doi.org/10.1098/rsnr.2015.0036,GoogleScholarCrossref
A. Csiszar, Nature 532, 306(2016).https://doi.org/10.1038/532306a,GoogleScholarCrossref,CAS
M. Baldwin, in The Age of ScientificNaturalism: Tyndall and His Contemporaries, B. Lightman, M. Reidy, eds., Pickeringand Chatto (2014), p. 171.GoogleScholar
I. Clarke, Isis 106, 70 (2015).https://doi.org/10.1086/681037,GoogleScholarCrossref
R. Lalli, Notes Rec.: R. Soc. J. Hist.Sci. 70, 151 (2016).https://doi.org/10.1098/rsnr.2015.0022,GoogleScholarCrossref
R. Kohler, Partners in Science:Foundations and Natural Scientists, 1900–1945, U. Chicago Press (1991),p. 68.GoogleScholar
I. H. Page, J. Am. Med. Assoc. 225,1240 (1973).https://doi.org/10.1001/jama.1973.03220380052015,GoogleScholarCrossref,CAS
D. Kaiser, Nature 505, 153(2014).https://doi.org/10.1038/505153a,GoogleScholarCrossref
J. Conlan to H. G. Stever, 15 May 1975,in National Science Foundation Peer Review, Special Oversight Hearings, USHouse of Representatives, p. 21.GoogleScholar
M. Eisen, quoted in H. Campbell, WallStreet Journal, 13 July 2014, http://www.wsj.com/articles/hank-campbell-the-corruption-of-peer-review-is-harming-scientific-credibility-1405290747.GoogleScholar


TAG:知社學術圈 |