當前位置:
首頁 > 最新 > 全球科研環境惡化

全球科研環境惡化

美國研究型大學在20世紀的興起是人類文明的偉大成就之一。它將科學塑造成為一種公共利益,並通過培訓、發現和創新改善人類的生存條件。然而,如果因為科學實踐而導致使兩者均能得到蓬勃發展的社會信任和共生關係遭到破壞,那麼我們解決人類與文明本身所面臨的關鍵問題的能力將遭遇挑戰。最近,我們對越來越多不當的激勵機制和學術商業模式可能對科學實踐產生的不利影響進行了研究,進而探索在一些社會領域,科學失去支持對科學研究本身的影響是否可能勝於其他因素對科學的影響。

在過去半個世紀中,科學的激勵和獎勵機制發生了變化,使學術研究者之間形成了過度競爭。如今,兼職教師和客座教授占學術勞動力的76%,這使得大學可以像企業一樣運作,終身教職也變得更加稀缺、令人嚮往。新出現的量化績效指標註重論文數量、引用次數和研究經費。由於對這些指標的依賴性日益嚴重,對社會相關結果和質量的重視程度反而降低。還有人擔心,這些壓力可能會誘使面臨這種過度競爭環境的STEM(科學、技術、工程和數學)學者進行不道德的行為。作者認為有必要對此進行改革,以使學術界和社會契約重新實現科學與社會之間的平衡,從而確保科學作為公共利益的未來角色。

在傳統上,對終身教職的追求幾乎影響著所有決策、優先事項以及研究型大學中年輕教師的科研活動。然而,最近學術界的變化,包括對量化績效指標的重視、對保持不變或不斷減少的聯邦科研經費的過度競爭以及公立和私立大學的私營商業模式的實施,都產生了不良後果和意想不到的結果(見表1)。

量化指標越來越多地支配著教師的招聘、晉陞和終身教職、獎勵和經費的分配等決策,並對出版物數量、引用次數、引用-出版聯合數量(其中最常用的是h指數)、期刊影響因子、總研究經費和專利數量予以密切關注。所有這些措施似乎都遵循古德哈特定律(Goodhart』s law)。該定律認為:當一項措施成為目標時,它就不再是一個合格的衡量標準。因此,量化指標可能會誤導科研評估工作,最終對科研評估產生負面影響。

越來越依賴於量化指標不僅可能造成不公,還可能帶來比它們所取代的體系更糟糕的後果。具體來說,如果獎勵是按比例分配給那些操縱指標的人,那麼古老的主觀性範式(比如朋友體系,或稱私人關係網路)的著名問題就顯得簡單而又容易解決。大多數科學家認為,因量度問題造成的損害已經顯而易見。事實上,71%的研究人員認為,他們所在機構的評估工作可以做得更好。

已有記錄表明,有人在對評估指標進行操縱。最近曝光的內幕披露了一些期刊操縱影響因子的計劃,研究人員利用P值篡改技術(p-hacking)得出一個在統計學上顯著且適宜公布的結果,操縱同行評審過程和過度引用的做法。格勒諾布爾約瑟夫?傅立葉大學的計算機科學家西里爾?拉貝(Cyril Labbé)甚至創造了一個虛構的人物艾克?安特卡雷(Ike Antkare),他通過發表102篇計算機生成的偽造論文,在谷歌學術搜索上獲得了94的高h指數,這超過了愛因斯坦的h指數。實際上,只要在谷歌上搜索就能看到介紹如何在不進行直接欺詐的情況下提高你的h指數的博客。

自第二次世界大戰以來,以引用著述進行衡量的科學成果每9年翻一番。從本質上說,這一知識產業的增長有多少是虛幻成分,或是古德哈特定律的自然結果呢?這才是真正的問題所在。

我們需要考慮質量與數量的作用。如果一個過程過於注重質量而非數量,那麼可能需要更多的盲法研究(參加者不知情的研究),並需要通過「獨立方能複製結果」的考核以及在公開發表前對所有數據進行同行評審。由於過於謹慎,這種體系收效甚微,而且會對稀缺的研究經費造成浪費。在另一個極端,過分強調數量會產生大量不合格的論文。它們缺乏嚴格的實驗設計,幾乎無法或根本無法複製,質量控制不夠、同行評審低於標準(見圖「相對於真實科學進步的數量與質量關係」)。以量化指標來衡量,則會取得明顯的科學進步,但同時也會出現很多錯誤的結果,而研究群體則會陷入困惑:到底什麼是有效的,什麼是無效的?這種體系僅僅製造了一種科學進步的假象。顯然,我們應當在數量和質量之間尋求平衡

偏重產出而非成果,或者說偏重數量而非質量,也可能導致出現「自然選擇的反例」。這種體系更有可能淘汰那些遵循道德和毫無私心的研究人員,同時選擇那些能夠更好地適應不當激勵機制的人。普通學者會被迫採取不道德的做法,以獲得或維持職業生涯。而根據馬克?格蘭諾維特(Mark Granovetter)的《集體行為閾值模式》(Threshold Models of Collective Behaviour, 1978),不道德的行為會根植於職業文化結構和過程中。在這一點上,認為腐敗可以容許或者甚至還有必要的想法佔據上風。引人入勝的軼事式證詞,即那些由功成名就、熱心公益的教授所撰寫的關於他們為什麼要離開曾經熱愛的事業的內容,不斷出現。《高等教育編年史》(Higher Education)甚至為這一流派取了一個名字——Quit Lit。在這一群體中,即使是資深研究人員也會十分理性地解釋他們為什麼會辭去位高權重、報酬豐厚的職位,而不是在一個競爭過度、激勵不當的環境中妥協自己的原則。

簡而言之,儘管與主觀衡量標準相比,量化指標提供了一種表面上具有吸引力的方法來評估科研生產力,但這些指標一旦成為目標,就不再有效,甚至可能適得其反。繼續過分強調量化指標可能會迫使除了最具道德意識的科學家之外的學者降低工作質量,儘可能「走捷徑」,降低真實生產力,並選擇在那些激勵不當的環境中繼續堅持並從容應對。

許多科學團體、研究機構、學術期刊和個人都在試圖糾正量化指標的一些過度行為,其中有些已經簽署了《舊金山科研評估宣言》(DORA)。DORA認識到需要改進對科學研究成果進行評估的方法,並呼籲對研究評估實踐提出挑戰,尤其是目前正在使用的期刊影響因子參數。截至2017年8月1日,共有871個組織和12 788個人簽署了DORA,其中包括美國細胞生物學學會、美國科學促進會、霍華德休斯醫學研究所和《美國國家科學院學報》《自然》《科學》和其他期刊的出版商呼籲淡化影響指標。美國微生物學會最近採取了原則性立場,刪除了所有期刊上的影響因子信息,以避免繼續引導人們對期刊影響因子的不恰當關注。其目的是減緩在研究評估中佔主導地位的不可靠績效指標出現「崩塌」。和其他人一樣,我們並不提倡放棄度量標準,而是在資助機構的決策過程中降低它們的重要性,直到我們可能制定出客觀的措施來更好地體現科學研究的真正價值。

在現代科學競爭激烈的籌資環境中,聯邦政府一直是經費資助不可或缺的來源。在資助研發、創新知識、國家安全、農業、基礎設施和環境衛生等公共事業方面,它一直充當著最重要的角色。從第二次世界大戰開始,聯邦政府在很大程度上承擔了高風險的長期科學研究所需的大部分經費。這類科學研究的前景並不明朗,有時也缺乏明顯的短期社會效益,而且其研究日程往往是由科學家和資助機構制定。聯邦資助基金會已經建立了一個由大學和行業輔助的研究和知識生態系統,它們一起為人類的共同進步做出了歷史性貢獻。

然而,至少在過去10年里,美國聯邦政府在研發方面的支出一直在下降,研究強度(研發預算佔國內生產總值的比例)從20世紀60年代約2%降至0.78%(2014年)。與此同時,預計到2020年,中國的研發經費支出將超過美國

歷史上,美國的大學也培養出了下一代研究人員,他們為公眾傳授教育和知識。但隨著大學逐漸轉變為專註於生產新產品和專利的利潤中心,它們不再強調科學是一項公益事業。

在進入了半個世紀以來資助環境最差的時代之後,研究人員之間的競爭從未如此激烈。在1997年至2014年期間,美國國立衛生研究院(NIH)的資助率從30.5%降至18%。美國國家科學基金會(NSF)的資助率在過去10年停滯不前,一直保持在23% ~ 25%。得益於一些小小的舉措,上述資助率仍遠高於6%,當經費獲取人撰寫經費申請的凈成本等於從研究經費中獲得的凈值時,這種狀況接近收支平衡點。儘管如此,經費撥付環境仍然競爭激烈,容易受到評審者的偏見的影響,嚴重依賴於先前通過數量指標進行衡量的成功之舉。甚至在金融危機爆發之前,諾貝爾獎得主羅傑?科恩伯格(Roger Kornberg)就曾說過:「如果你計劃做的工作實際上無法確保獲得成功,那麼它就不會得到資助。」這些變化將寶貴的時間和資源從科學發現和轉化中分離出來,迫使研究人員花費大量時間撰寫經費申請報告,填寫的文件也越來越多,以便獲得研究經費。

不當激勵機制的穩步發展以及它們在教師研究、招聘和推廣實踐中發揮的重要作用,構成了危及科學完整性的系統性功能障礙。越來越多的證據表明,當今的研究類出版物過於頻繁地受到缺乏可複製性的影響,依賴於帶有偏見的數據集,採用較低或低於標準的統計方法,未能防止研究人員產生偏見,並誇大他們的發現。換句話說,就是過分強調數量而非質量。因此,審查揭示出來的不道德活動水平令人不安。最近,《經濟學人》對大行其道的劣質且不可複製的現代科學研究及其對社會帶來的高經濟成本進行了重點報道。這些報道明確指出,現代科學是不值得信賴的,因此亟需改革。鑒於曝光、披露或承認科學不端行為必須付出高昂代價,我們可以相當肯定地說,我們所看到的遠遠不止這些。對系統性問題的警告至少要追溯到1991年,時任NSF負責人的沃爾特?梅西(Walter E Massey)指出,面對日益激烈的競爭,研究的規模、複雜性和增加的跨學科研究,使科學和工程更容易受到錯誤信息的影響。

NSF將科研不端行為定義為「在研究的計劃、開展或審查過程中,或在報告研究結果時有意偽造、篡改或剽竊的行為」。在美國衛生與公共服務部(包括NIH)和NSF調查的科研不端行為中,有20% ~ 33%的案例被判有罪。在機構層面上,美國調查所有這類科研不端行為需花費1.1億美元。從1992年至2012年,在NIH的資助下發表的291篇科學論文由於行為不端被撤回,而這些科研項目從該機構獲得的直接經費達5 800萬美元。顯然,還有更多的不端行為未被曝光,每年都有一些案例被判定屬於此類。

真實的不端行為發生率很難預測。1987年至2008年對科研不端行為調查的綜合分析表明,有2%的科學家承認至少有過一次不端行為(偽造、篡改或修改數據),有14%的科學家知道自己的同事曾經有過不端行為。最可能的是,考慮到所問問題的敏感性和低反饋率,這些數字要低於真實的發生率。自1975年以來,在生命科學和生物醫學研究中,科學論文撤回的比率增加了10倍,其中67%是由於不端行為造成的。這種增長可能源於以下因素:高規格期刊的誘惑、「病態出版」、不當的不端行為政策、學術文化、職業階段以及不當激勵。從氣候科學到電化學腐蝕,我們都看到了一些已發表的否定科學風氣、損毀科學界信譽的研究成果。

學術界的自治原則強而有力,這是現代研究型大學的一個顯著特徵。科學應該具有自我監督和自我修正的能力。然而,我們已經開始相信,在整個系統中,激勵機制會誘導所有利益相關方「假裝不會發生不端行為」。值得注意的是,科學從未建立一個有效的體制來報告和調查對科研不端行為的檢舉。在彙報研究成果、撰寫研究經費申請書和推廣研究思路方面是否公平的問題上,學者們在很大程度上依賴於不可執行的、不成文的榮譽制度。如今,有令人信服的理由懷疑,科學作為一個整體是否能夠自我修正。我們不是首批認識到這一問題的人。科學家們提出了諸多建議,如開放數據、開放獲取、發表後公開同行評審、元研究以及複製具有里程碑意義的研究作為實踐,以彌補現代科學中高錯誤率的問題。儘管這些糾正措施可能大有裨益,但對個人和機構的不當激勵仍然是根本問題。

也有一些情況例外,即有人對過度炒作的科研新聞稿進行核實,尤其是在那些被認為具有潛在變革能力的領域。然而,熱門研究領域的局限性往往被忽視。因為在現代科學領域,每出現一次熱潮都會給參與者帶來可量化的意外之財,而當科學泡沫破滅時,那些負責人卻幾乎無需承擔什麼後果,所以針對病態科學和資源分配不當的問題唯一有效的審查就是榮譽制度。

不端行為並不局限於出現在學術研究人員身上。在聯邦機構中,同樣存在不當激勵和過度競爭,並因此引發新的機構科研不端行為發生。例如,美國疾病控制與預防中心(CDC)發表了一份關於哥倫比亞特區飲用水危機的錯誤報告,聲稱飲用水中含鉛量極高並未導致當地兒童血液鉛含量升高。在CDC拒絕糾正或為他們的研究成果辯解之後,國會調查人員不得不介入此事,並發現這份報告在科學上站不住腳。遭到國會強烈譴責幾個月後,同一個CDC分支機構撰寫了一個被路透社稱為「有缺陷的」的報告。該報告稱,印第安納州東芝加哥的土壤、水體和空氣均遭到鉛污染,脆弱的兒童和少數族裔會因此受到至少長達5年的傷害。

美國環境保護署(EPA)也在行業期刊發表了基於不存在數據的科學報告。最近,在密歇根州弗林特市出現水危機期間,EPA讓告密者保持沉默。機構之間的競爭日趨激烈,為了獲得被削減的可自由支配經費以及維持現有現金流,他們似乎更傾向於發布「好消息」而非科學數據。在一個可自由支配資金不斷減少的時代,聯邦機構和私營企業類似,都存在資金利益衝突和生存的恐懼。鑒於人們普遍認為聯邦資助機構不存在此類衝突,其科研不端行為的危險性可能與行業資助的研究相當,甚至會超過行業資助的研究,因為沒有任何制衡制度,而這類工作的群體可能會過度信任。

如果我們不對學術型科研企業進行改革,就會對科學造成重大破壞,並損壞科學的聲譽,造成公眾對科學的不信任。被《經濟學人》嘲諷為「龐氏騙局」的現代學術型科研企業依靠的是一套不正當的激勵機制,而50年前,這一制度幾乎是不可想像的。我們相信這一機制對科學的未來構成了真正的威脅。如果不立即採取行動,我們極有可能會創建一種腐敗的職業文化。它類似於職業自行車賽領域暴露的職業文化(即在1999—2005年間,站上領獎台的21名獲勝者有20人被查出服用了興奮劑),不受控制的不當激勵機制營造出來的環境,讓參加比賽的運動員覺得自己不得不作弊。失去利他主義的行動者以及對科學的信任會給公眾和全世界帶來更大的傷害。

所有科學家都渴望科學這個領域能夠比我們剛剛踏足時狀況更佳。國家和聯邦資助經費等重要問題超出了我們的直接控制範圍。然而,當涉及到健康、完整性和公眾對科學及其價值的認識時,我們才是關鍵的行動者。

我們可以公開承認並解決不當激勵和過度競爭的問題,這些問題扭曲了科學,對作為一種公共利益的科學研究構成了危險。要更好地理解這些問題,可以採取一些相對簡單的措施,包括通過對優秀的研究生和成果優異的研究人員進行全面調查,系統挖掘STEM領域專業人士的經驗和理念。

其次,NSF應該委託一個由具有不當激勵方面專業知識的經濟學家和社會科學家組成的小組,讓他們來收集和審查來自各學術領域的意見,包括退休的美國國家科學院成員和傑出的STEM學者。從長遠來看,將科學作為一種公共利益來培養,該小組還可以制定一份「最佳實踐」清單,以指導對招聘和晉陞的候選人進行評估。

第三,我們再也不能假裝科研不端行為的問題不復存在。在本科生和研究生階段,科學和工程專業的學生應該接受有關這些學科的實際指導,這樣他們就可以在遇到問題的時候(而不是假設遇到問題時)採取行動。課程應當包括對現實壓力、激勵機制的評述,因為它們可能提高實施科研不端行為的可能性。

第四,大學可以立即採取措施保護科學研究的完整性,並宣布採取措施減少不當激勵,支持阻止科研不端行為的政策。

最後,也許是最簡單的,除了教學技能,博士課程本身應該接受存在不當激勵的現實,同時促進個性發展,尊重作為公共利益的高質量科學對於人類未來的重要作用。

本文作者:馬克?愛德華茲(Marc A Edwards),弗吉尼亞理工大學特聘教授;悉達多?羅伊(SiddharthaRoy),弗吉尼亞理工大學的環境工程師。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 世界科學 的精彩文章:

撒鹽融化冰雪,你知道真相嗎?

TAG:世界科學 |