當前位置:
首頁 > 新聞 > 生物圖像的數據集可用於開發新的人工智慧演算法 | 矽谷洞察

生物圖像的數據集可用於開發新的人工智慧演算法 | 矽谷洞察

更多精彩,敬請關注矽谷洞察官方網站(http://www.svinsight.com)

Recursion研發了300多億位元組的數據,它希望這將成為創新機器學習應用程序的「遊樂場」。

生物圖像的數據集可用於開發新的人工智慧演算法 | 矽谷洞察

臨床階段的生物技術公司Recursion宣布發布一個開源的生物數據集RxRx1,該公司已經成立了五年多。

重要性:

數據集由來自1000多個符合實驗條件的人體細胞圖像組成,在不同的人體細胞類型中,幾十個相隔數周或數月產生的生物複製。

數據的收集展現了機器學習社區潛在的巨大資源,超過10萬幅圖像和300多億位元組的數據代表了不同的生物背景。

Recursion首席執行官克里斯·吉布森在一份聲明中說:「為了回答生物學和疾病所面臨的基本問題,以及重新設想藥物發現的模式,我們正在建立世界上最大的、具有相關性的經驗生物學數據集。」

這些數據是在嚴格控制的實驗程序下在多個遞歸站點生成的,也可以為從事機器學習研究的多個領域的科學家提供一個舞台,比如領域適應和k-shot學習——每批實驗數據都包含獨特的實驗變數。

吉布森補充說:「儘管這個數據集規模龐大,但它只佔我們每周遞歸生成的0.4%。我們希望,這個豐富的數據集,結合我們所做努力的範圍,將激勵全世界的機器學習和人工智慧社區,幫助我們完成解碼生物學、從根本上改善生活的使命。」

吉布森預測,如果這一研發成果有助於促使集體努力,新的治療方法將使其更快地推向市場,更多的公司將受到激勵,為更小的市場開發新葯,比如罕見病,因為許多病人仍面臨一個迫切的未得到滿足的需求。

發展趨勢:

生命科學之外的機器學習方法的突飛猛進,得益於大型公共數據集的可用性,如ImageNet和COCO等。

通過這些舉措,Recursion公司的數據集旨在創造資源,幫助社區能夠共同識別和採用新的機器學習方法,使整個生命科學行業受益。

該公司的機器人平台上產生的超過2 pb的生物圖像的相關資料庫有助於機器學習方法揭示候選藥物、作用機制和潛在毒性。

官方發布:

Recursion公司的首席技術官和首席產品官梅森·維克多(Mason Victors)在一份聲明中說:「我們很高興能為數據科學界提供第一個縱向生成的人類細胞生物學圖像數據集,以促進新的機器學習應用。」

通過將實驗生物學和自動化技術與人工智慧在一個大規模並行系統中結合起來,Recursion公司希望提高發現各種適應症潛在藥物的效率,包括遺傳疾病、炎症、免疫學和傳染病。

Recursion公司的數據科學副總裁伯頓·恩蕭(Berton Earnshaw)說:「這個數據集為機器學習研究的多個領域提供了一個很好的平台,比如領域適應和k-shot學習。開發出能夠解釋非隨機實驗雜訊的方法,應該是生命科學界以外的人感興趣的事情。」

作者:Nathan Eddy

鏈接:https://www.educationdive.com/news/report-teach-stem-using-laughter-creative-techniques/553639/

更多精彩,敬請關注矽谷洞察官方網站(http://www.svinsight.com)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 矽谷密探 的精彩文章:

AI幫你記錄人生故事,說給後代聽

TAG:矽谷密探 |