當前位置:
首頁 > 最新 > 大規模異構生物分子關聯網路研究取得進展

大規模異構生物分子關聯網路研究取得進展

中國科學院新疆理化技術研究所多語種信息技術研究室研究生郭鎮豪、易海成在研究員尤著宏的指導下,開展的關於大規模異構生物分子關聯網路的研究「Construction and Comprehensive Analysis of a Molecular Association Network via lncRNA-miRNA-Disease-Drug-Protein Graph」(《構建及綜合分析基於長非編碼RNA-微小RNA-環狀RNA-信使RNA-微生物-疾病-藥物-蛋白質的生物分子關聯網路》)於近日發表在Cells雜誌上。

該工作在國際學術界首次提出了生物分子關聯網路(Molecular Association Network,MAN)的定義,MAN網路系統地集成了8種不同類型的生物分子(包括lncRNA、miRNA、circRNA、mRNA、microbe、disease、drug及protein)及18種關聯關係(包括miRNA-disease、circRNA-disease、circRNA-miRNA、disease-mRNA、disease-microbe、drug-disease、drug-mRNA、drug-microbe、drug-protein、lncRNA-disease、lncRNA-mRNA、lncRNA-miRNA、lncRNA-protein、miRNA-drug、miRNA-mRNA、miRNA-protein、mRNA-protein、protein-protein),並在此基礎上建立了一個預測、發現生物分子間潛在關聯關係的計算模型。多年來,不同生物分子之間如何相互作用以產生適當的細胞行為一直是系統生物學和基因組學界密切關注的科學問題。該研究一方面為整合大規模生物數據以構建快速、高效的計算模型提供了新思路,另一方面對促進理解基因的調控,揭示疾病的分子機理、加速藥物靶標的發現以及藥物重新利用具有重大意義。

後基因組時代的一個關鍵問題是如何系統地建模及表徵細胞內轉錄物或翻譯物之間的關聯關係。高通量「組學」技術的快速發展為此任務奠定了數據基礎,然而很多手工方法鑒定的相互作用的假陽性比較高並且耗時耗力,因此迫切需要開發計算機計算預測工具來為濕實驗提供篩選和指引。針對這一科學問題,該工作依託於目前已有的多種孤立的生物分子關聯關係,整合構建了一個涵蓋長非編碼RNA、微小RNA、環狀RNA、信使RNA、微生物、疾病、藥物及蛋白質的異構生物分子關聯網路。在系統論和整體論的視角上,提出了一個基於節點屬性和節點行為特徵進行生物分子間潛在關聯關係預測的計算框架。具體來說,節點的屬性如蛋白質、RNA的序列通過k-mer特徵來描述,疾病由其表徵的語義相似性來表徵,而藥物由其化學結構的分子指紋來建模,節點的行為特徵則通過圖/網路嵌入學習模型LINE進行表示學習。每個節點通過結合上述屬性和行為信息,進而被表徵成一個低維、稠密的向量。最後通過機器學習模型隨機森林來執行潛在關聯關係預測任務。研究結果表明,此方法能夠提供精確、穩定、覆蓋率高的分子間關聯關係預測結果。該工作為理解生物分子之間的協同關聯關係提供了系統性的視角,將有助於啟發和推動後續系統生物學及生物醫學研究。Cells期刊評審人對這一重大突破給予了很高評價:「作者在展示如何將儘可能多的數據集成到學習框架中以預測新穎有意義的關聯關係方面做出了得體的工作。所呈現的結果是任何應用領域機器學習論文的典型結果。」

該工作得到國家自然科學基金優秀青年科學基金等資助。

圖1.生物分子關聯網路示意圖

圖2.人類大規模異構生物分子關聯網路中分子關聯關係類型

來源:中國科學院新疆理化技術研究所,語音合成技術由科大訊飛提供

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 中科院之聲 的精彩文章:

多謝小行星不殺之恩!「2019 OK」差點把地球KO在2019
中科院、北京市、國家發展改革委聯合調研懷柔科學城

TAG:中科院之聲 |