當前位置:
首頁 > 科技 > 利用機器學習設計多肽,將徹底改變製造肽的方式!

利用機器學習設計多肽,將徹底改變製造肽的方式!

長期以來科學家和工程師們一直對合成肽很感興趣。肽是一種氨基酸鏈,負責在細胞內執行許多功能,它既能模擬自然,又能進行新的活動。例如,設計的肽可以是一種功能藥物,作用於人體的某些區域而不會降解,這對許多肽來說是一項艱巨的任務。但是發現和合成多肽的方法既昂貴又費時,常常需要數月或數年的猜測和失敗。美國西北大學(Northwestern University)的研究人員與康奈爾大學(Cornell University)和加州大學聖地亞哥分校(University of California, San Diego)的合作者合作,開發出一種尋找最優肽序列的新方法:使用機器學習演算法作為合作者。

博科園-科學科普:該演算法分析實驗數據,並對下一個最佳序列提出建議,創建一個來回選擇過程,大大減少了尋找最佳肽段所需的時間。該研究結果於12月7日發表在《自然通訊》(Nature Communications)上,有望為材料科學和化學領域的實驗提供一個新的框架。西北大學教授內森·吉安內斯基(Nathan Gianneschi)是這篇論文的通訊作者表示:我們認為這是我們如何設計分子和材料的下一波潮流,可以結合直覺和演算法的力量,用更少的實驗找到解決方案。Gianneschi是西北大學溫伯格藝術與科學學院化學系的Jacob和Rosaline Cohn教授,也是西北工程學院材料科學與工程系和生物醫學工程系的教授。

基於最優學習(POOL)方法的肽迭代優化研究綜述。圖片:Nature Communications

為了創造這種方法,同時也是西北大學國際納米技術研究所副所長的Gianneschi與康奈爾大學從事操作研究和機器學習的副教授Peter Frazier以及加州大學聖地亞哥分校的化學生物學家和酶學專家Michael Burkart合作,找到了一種更好的方法來製造能夠產生生物材料的肽——特別是能夠以某種方式修飾蛋白質的納米結構和微觀結構。第一步是找到合適的多肽作為這些結構的酶底物。肽是由氨基酸鏈構成的,最長可達20個氨基酸,每種氨基酸有20種不同的可能。由於肽的序列決定了肽的功能,要想找到最優的序列,往往需要進行昂貴的實驗,而這些實驗往往是靠猜測來完成。

實驗人員吉安內斯基(Gianneschi)和伯克特(Burkart)與弗雷澤合作了幾年,開發了一個將實驗數據與機器學習演算法結合起來的系統,以找到創造新材料的最佳策略。Frazier設計了這個演算法,然後兩人一起訓練它,實驗人員開發了一個包含100個多肽的數組,進行實驗來找出哪些多肽能夠正常工作,然後將這些信息輸入到演算法中。然後該演算法推薦了下一輪肽開發需要修改的內容,還推薦了它認為可能失敗的策略。吉安內斯基說:現在我們開始有選擇性了,通過多次完成這一過程,他們能夠找到最優的肽。沒有去猜測和觀察數以百萬計的肽,而是觀察了數以百計的肽,然後非常迅速地匯聚到以全新方式表現的序列上。與隨機突變或猜測相比,該演算法在統計上要成功得多。

雖然這項工作集中在底物上,但是這個過程可以被用於發現任何目的的多肽,比如藥物傳遞,甚至可能被用於發現DNA序列。因為任何一種最優序列都可以被發現,研究人員也不局限於在遺傳密碼中發現的氨基酸序列。下一步將使整個過程自動化,Gianneschi還對使用這種方法尋找聚合物的最佳表面感興趣,特別是用於醫用植入物的聚合物。找到合適的表面與組織或肌肉結合可以幫助防止疤痕組織或植入排斥。可以從本質上發現具有特定功能的序列,這正是肽和核酸在自然界中所起作用的核心,這將徹底改變我們製造肽的方式。

博科園-科學科普|研究/來自:西北大學

參考期刊文獻:《Nature Communications》

DOI: 10.1038/s41467-018-07717-6

博科園-傳遞宇宙科學之美


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 博科園 的精彩文章:

生物塑料不一定有助於減緩氣候變化!
知道恆星雙星是如何形成嗎?

TAG:博科園 |