當前位置:
首頁 > 新聞 > 新演算法可檢測文獻中重複圖像

新演算法可檢測文獻中重複圖像

光學顯微鏡能捕捉細胞和器官的顯微照片。而它們的重複圖像可能出現在科學文獻中。

圖片來源:Mikhail Tereshchenko/TASS/Getty

3名科學家日前表示,計算機軟體現在能快速檢測到大量研究文獻中的重複圖像。

在一項日前發表於預印本伺服器bioRxiv的論文中,一個由美國紐約雪城大學機器學習研究人員Daniel Acuna領導的團隊報告稱,其成功利用一種可處理上萬篇生物醫學論文的演算法尋找重複圖像。如果期刊編輯採用類似方法,他們或許能更加簡單地在論文發表前檢查圖像——此事目前需要大量努力並且只有少部分出版物在做。

Acuna 表示,最新成果表明,利用技術檢測重複圖像是可能的。他並沒有公開該演算法,因為其存在可能觸發錯誤指控的風險。相反,Acuna和同事計劃將其授權給期刊和科研誠信辦公室。Acuna介紹說,他已同位於芝加哥的西北大學研究誠信辦公室主任Lauran Qualkenbush探討過該演算法。「對於科研誠信辦公室來說,這將非常有幫助。」Qualkenbush表示,「我非常希望我所在的辦公室將在今年成為試驗場,以便弄清楚如何使用Daniel開發的工具。」

2015年年初,Acuna和兩位同事利用一種演算法從76萬篇論文中提取了260多萬幅圖像。這些文章均來自由美國國立衛生研究院運行的生物醫學文獻資料庫PubMed中的開放獲取部分。獲得的圖像包括細胞、器官和凝膠印跡的顯微照片。隨後,該演算法會將「鏡頭」移到特徵最豐富的區域——顏色和灰度等級變化最大的部分,從而提取每幅圖像中具有特色的數字「印跡」。

在清除諸如箭頭或者流程圖等特徵後,研究團隊最終獲得了約200萬幅圖像。他們僅對比了來自相同的第一和通訊作者的論文中的圖像,以避免每幅圖像都相互比較帶來的計算負荷。同時,即便圖像被旋轉、重新調整了大小或者改變了對比度、顏色,該系統仍能挑選出潛在的重複圖像。

中國生物技術網誠邀生物領域科學家在我們的平台上,發表和介紹國內外原創的科研成果。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 中國生物技術網 的精彩文章:

上海生科院揭示轉錄因子Th-POK在代謝調控中的新功能
科學見證:個性隨時間改變

TAG:中國生物技術網 |