當前位置:
首頁 > 知識 > 用演算法合成新葯:一場新式卡斯帕羅夫與深藍的巔峰對決

用演算法合成新葯:一場新式卡斯帕羅夫與深藍的巔峰對決

安妮 編譯自 Nature

量子位 出品 | 公眾號 QbitAI

一分子就是一世界。

對藥物研發人員來說,確實這樣。在這篇《Nature》的文章中,渥太華記者Asher Mullard將把你拉進一個葯香世界。

故事即將開場——

2016年,住友製藥的美國子公司Sunovion召集了幾名經驗豐富的研發者,分配給他們一個不一般的任務:

我們來個遊戲吧,看看誰能發現最好的新葯。

擺在研究人員面前的是數百個化學結構,其中只有不足十分之一的結構標註了生物效應信息。研究人員需要從眾多結構中挑選出最合適的幾種,依據他們的化學和生物知識合成藥物。

11名參賽者中,10名糾結了數小時,但有一名參賽者僅用幾毫秒輕鬆得出結果。

它是一個演算法。

作為初創公司Exscientia的化學信息學部負責人,Willem van Hoorn設計了這個計算機程序。當時,Exscientia還是個坐落於英國鄧迪的初創公司,它研究用AI設計藥物,並期望與Sunovion合作。

但Sunovion並沒有把這個小創業公司放在眼裡。「一開始我的信譽岌岌可危,」van Hoorn感慨。經過20幾個遊戲回合後統計比分時,他才終於鬆了口氣。這個演算法好像掌握了一些化學「黑魔法」,擊敗了除一名合成專家外的所有人。

這個「遊戲」開啟了Sunovion與Exscientia開始合作的里程碑。「是這場比賽說服了那些研究人員,」Sunovion的計算化學部主任Scott Brown回憶。

無論學術界還是工業界,想用計算機技術探索奧妙化學世界的大軍不斷增長,而Exscientia也僅是其中一員。

化學家們預測,人類可以合成1060種類藥性分子,比太陽系中的原子還要小。他們希望晶元中的演算法能把數百種硅氧化合物分類比較,幫助研究人員快速、合理地找到最佳候選藥物。

不少支持者認為,這些備選方案讓藥物更安全,減少藥物在臨床試驗中失敗的概率,並能發現新的治療方法,或許它們還能幫助開括未知的領域。

當然,也有不少反對的聲音。很多藥物化學家仍對這種「炒作」行為持懷疑態度,不相信複雜奇妙的化學反應最終能被幾行代碼概括出來。一些AI支持者也承認,很多嘗試達不到預期效果,計算機生成的化合物有時候很難合成出來,有時候反應條件又過於苛刻,合成起來很危險。

「當研究人員不了解這個領域時,計算機生成的合成方法就不太可行了,」van Hoorn說。同時他表示,人類專家可以訓練這些張揚的數字設計師。「我認為一些想法可以在計算機科學家和化學家的介入下實現。」van Hoorn說。

太空探索

想在化學宇宙中遨遊,有張「地圖」是必不可少的。2001年,瑞士伯爾尼大學的化學家Jean-Louis Reymond開始儘可能用電腦繪製化學空間。16年後,他他已經整理出世界上最大的小分子資料庫GDB-17。這是一個巨大的化合物虛擬資料庫,參與研究的原子總數多達17個,形成了1660億個組合,剛好也是Reymond的計算機能應付的數量。「現在,用一台計算機編譯資料庫中的化合物列表僅需要10小時。」Reymond說。

為了弄清這些大量藥物的合成起始點,Reymond想了一種方法拼湊他的化學小宇宙。他從元素周期表中獲取靈感,將化合物聚集在一個多維空間中,結構相似的化合物也會挨在一起。化合物的位置是根據42個特徵分配的,比如每個分子中的碳原子數量。

每種進入市場的藥物,都有數百萬種在結構上與之相似的化合物,可能只是一個氫鍵或雙鍵的位置變化。其中一些可能比進入市場的藥物效果更好,但化學家們不可能完全構想出所有同分異構體。

「你不可能用一支筆和一張紙來對付這些異構體。」Reymond說。

有一種方法幫助解決這個難題,Reymond和他的團隊能通過尋找化合物間的相似點識別出有治療前景的「近鄰」。通過一種特殊的藥物作為起始合成點,研究人員可在3分鐘內對資料庫中所有1660億種化合物進行梳理,篩選出可以合成藥物的最佳備選結構。

在一個概念驗證實驗中,Reymond開始結構用一個已知結構的分子與尼古丁乙醯膽鹼受體結合。這是使神經系統和肌肉功能紊亂的一種途徑,為此他們還編製了344個相關化合物的備用名單。

之後,研究小組合成了其中三種結構,發現有兩種可以有效地激活受體,還能治療老年肌肉萎縮。Reymond說,這種方法就像通過地質地圖尋找金礦。「你需要通過某種方式選擇你要挖掘的地方,」他說。

對計算機來說,這意味著用晶元從化學庫中的海量結構里篩選出與指定蛋白質結合的小分子。首先,研究人員需要用X射線給蛋白質「拍照」,確定其中的結合位點。之後,用分子對接演算法,計算化學家可以通過化合物的集合尋找給定位點的最佳匹配。

隨著計算力的爆炸式增長,這些演算法的能力得到了提高。加州大學舊金山分校的化學家們在Brian Shoichet的帶領下,在2016年展示了這一方法的潛力,找到了一種新的止痛藥。

Shoichet團隊通過篩選300多萬市場上可以買到的化合物找到了最好的一種,選擇性地激活μ-阿片受體信號減輕疼痛,而且不會擾亂β-抑制蛋白密切相關的信號通路。研究人員從巨大的化合物庫中迅速找到了23個最可能化合物。

除了大學教授,Shoichet還有一個雙重身份,他還是加州舊金山的生物技術公司Epiodyne的聯合創始人。Epiodyne想用相同的辦法找到更安全的止痛藥,他們計劃在千萬中之前從未被合成出的化合物中找到容易合成的備選止痛藥。

目前,已經有商業化的藥物開發公司在測試這種方法,比如這個馬薩諸塞州的生物技術公司Nimbus Therapeutics。它將屏幕上的虛擬化合物與自然界產生的化合物相結合。目前還不清楚這種方法是否會促進新葯出現,但該公司首席執行官Don Nicholson表示,這至少在藥物設計項目中,「是個很好的著力點」。

巔峰對決

雖然這些數據搜索方法已經經過嘗試和測試,但計算機只能按照腳本指令執行。機器學習一直走在發現新葯的前沿,演算法用數據和經驗自學哪些化合物與哪些目標結合在一起,找到新模式。大約有12家公司如雨後春筍般湧現,與大型製藥公司合作共同創建藥物追蹤演算法。

Andrew Hopkins是英國藥物研發公司Exscientia的CEO,就證明了這些新方法是可靠的。一種新葯從發現、到優化、到臨床研究一般需要4.5年的時間,化學家通常會合成上千種化合物保證最後能夠得到最優選擇,即便這樣,藥物最終能商業化生產的可能性依然微乎其微。

Exscientia嘗試將一些演算法進行組合(前文提到的驚艷了Sunovion的演算法就是其中一個),演算法的組合或許能夠將藥物研發時間從4.5年降低至1年,並且能夠有效減少前期需要考慮的化合物的數量。

位於加州聖布魯諾的AI藥物設計公司Numerate的CTO Brandon Allgood表示,演算法還能幫助藥物研發人員儘早決定pass掉哪些化合物。

他認為,如果一個化合物在幾個月後的毒性或吸收測試中失敗,那麼之前的研究和測試都將變得沒有意義。在未開始用AI研究化學前,Allgood曾是一名宇宙學家,「用AI控制它只需要一毫秒的時間。」Allgood說。

今年,Numerate已經與製藥公司達成了兩項協議,其中包含與法國Suresnes公司共同創建的合作項目,它們想通過臨床試驗治療心臟衰竭和心律失常。

雖然不斷有新資金流入整個AI製藥行業,但這些計算方法的正確性仍有待證明。與其他學科庫相比,Reymond的收藏價值巨大,但它僅涵蓋了化學宇宙的一小部分。

許多計算出來的備選化合物在實驗室中的合成難度很大,化學家們須費盡心思找到推薦化合物的原材料,這可能需要幾個月甚至更長時間。即便如此,也不能保證這種分子一旦製成就會起效。

Reymond的方法預測了一種化合物的活性譜,但預測準確率僅有5-10%,這就意味著化學家必須在20種以上化合物中選擇,才能找到最符合預期的那種。「我想說,探索化學空間的瓶頸是敢不敢製造這種化合物。」Reymond說。為了達到這個目的,他最近把化學物質庫轉變成一個由1000萬分子組成的短鏈,這些分子很容易製造,但仍然涵蓋了廣泛的屬性。

劍橋大學科學家Mark Murcko認為,計算化學家關注的重點不應該是演算法策略,而更多的是改進他們從中改進數據集。「我知道的最好的預測模型的方法就是持續不斷地喂它,」他說。

對於Exscientia的首席執行官來說,這些合作至關重要。這需要計算科學家花費數十年的時間寫程序來擊敗國際象棋大師。之後,1997年,IBM的深藍就打敗了象棋大師卡斯帕羅夫。但這些失敗並不意味著象棋遊戲的終結。相反,卡斯帕羅夫創造出雙人版象棋玩法,每隊有一個人和一名AI組成。

「人和AI結合可以勝過任何人類,也可以勝過任何演算法,」Hopkins說。他想要同樣的數據處理、創造性和常識改變新葯的發現。「我們就處在卡斯帕羅夫和深藍的巔峰對決時刻。」Hopkins說。

加入社群

量子位AI社群9群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot3入群;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進群請加小助手微信號qbitbot3,並務必備註相應群的關鍵詞~通過審核後我們將邀請進群。(專業群審核較嚴,敬請諒解)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

量子位QbitAI

? ? ? 追蹤AI技術和產品新動態


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 懂不懂常識 的精彩文章:

追蹤印度文明演進的步伐
為啥人民幣沒有3元?恐怕你也不知道
揭秘中國上古姓氏之——盤古氏
揭秘亞歷山大大帝的死亡之謎
一國之君生死成迷,究竟是英年早逝?還是出家為僧?

TAG:懂不懂常識 |