當前位置:
首頁 > 新聞 > 用新的機器學習法預測瀕危植物物種

用新的機器學習法預測瀕危植物物種

原創編譯,轉載須註明來源!

世界自然保護聯盟(IUCN)的瀕危物種紅色名錄是研究人員和決策者努力遏制全球物種流失趨勢的有力工具。但是,即使只增加一個物種也不是一項容易的任務,需要花費大量時間進行高成本、嚴格和高度專業化的研究。

由於這些限制,IUCN尚未對大量已知物種進行正式評估,並將其列為五個類別中的一個,從關注度最低的物種到嚴重瀕危的都是如此。這種缺陷在植物界尤其明顯:目前已知的所有植物物種中,只有5%以任何形式出現在IUCN的紅色名錄中。

美國馬里蘭大學昆蟲學助理教授Anahí Espíndola參與開發的一種新方法,利用機器學習和開放獲取數據的能力來預測可能符合IUCN紅名名錄上瀕危狀態的物種。研究團隊創建並訓練了一種機器學習演算法,以評估來自世界各個角落的15萬多種植物,使他們的項目成為迄今為止最大的保護風險評估項目之一。根據研究結果,這些物種中超過10%很可能符合IUCN危險分類。

該演算法是一種預測模型,它適用於任何規模的物種,從全球範圍到單個城市公園。Espíndola及其同事近日已將這項研究發表在《美國國家科學院院刊(PNAS)》上。

Espíndola說:「我們的方法並不是要替代IUCN標準的正式評估。它可以作為一種工具幫助優化評估過程,計算出特定物種面臨風險的概率。最終,我們希望幫助政府和資源管理者決定將有限的資源用於哪些物種的保護。這對於那些研究不足的地區尤其有用。」

Espíndola及其合著者利用全球生物多樣性信息庫(GBIF)和TRY植物性狀資料庫的公開獲取數據建立了這個預測模型。研究負責人Tara Pelletier是Radford大學生物學助理教授,他與Espíndola合作進行了機器學習分析。

然後,Espindola和Pelletier使用GBIF對模型進行訓練,並嘗試從已列入IUCN紅色名錄上相對較小的植物種群中獲取數據。這使得研究人員能夠評估和微調模型的準確性,通過檢查它的預測與所列物種已知的IUCN風險狀態。紅色名錄將未滅絕的物種分為五類:無危的、受到威脅的、易危的、瀕臨滅絕和極度瀕危物種。

然後研究人員將這個模型應用於未被IUCN收錄的成千上萬種植物物種。根據分析結果,超過1.5萬(大概是他們總共評估物種的10%)的物種在很大程度上至少應該被列為將受到威脅的物種。

Espindola及其同事繪製了數據地圖,並在模型的預測中指出了幾個主要的地理趨勢。瀕危物種主要分布在原生生物多樣性程度較高的地區,比如中美洲的熱帶雨林和澳大利亞西南部。該模型表明美國加州和美國東南部也面臨著同樣問題。這些地區是許多地方性物種的家園,這意味著它們在地球上其他地方自然不會出現。

上圖中色調更暖的表明面臨風險的物種數量越多,而色調更冷的顏色表明整體風險更低。圖片來源: Anahí Espíndola and Tara Pelletier

Espíndola說:「當我最初考慮這個項目時,我認為很多生物多樣性程度較高的地區會被研究得比較充分,保護得也比較好。但是我卻發現事實並非如此。很多生物多樣性程度高的地區面臨的風險也更高。當我們看到這個地圖,我們驚訝地發現這一趨勢很明確。地方性物種面臨的風險更高,因為它們通常被限制在一個較少的地區。」

該模型還發現,某些生物多樣性程度較低的地區,比如阿拉伯半島東南海岸,也有大量面臨危險的物種。而這些最危險的區域並沒有得到研究人員們的關注。她希望她的方法能夠通過確定需要進一步研究的地區和物種的方式來填補這些知識空白。

Espíndola說:「如果你想要評估一塊大陸上的所有野生蜜蜂種類,評估之後卻發現只有一種蜜蜂面臨危險,那麼你就把所有的資源用於評估一個低風險區域,雖然這仍然是有幫助的,但是在資源有限的情況下效果就不理想了。我們要防止這種情況發生。我們的分析是全球性的,但是該模型可以通過調整適合任何地理尺度。我們所做的事情是100%開源的,強調了公開可用數據的力量。我們希望研究者能夠利用我們的模型,還希望他們指出錯誤並幫助我們修復,使之變得更好。」

中國生物技術網誠邀生物領域科學家在我們的平台上,發表和介紹國內外原創的科研成果。

本公眾號由中國科學院微生物研究所信息中心承辦

微信公眾號:中國生物技術網

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 中國生物技術網 的精彩文章:

微生物所等在細菌調控元件資源應用中取得進展
抑制腫瘤細胞移動能防止癌症擴散

TAG:中國生物技術網 |