人工智慧應用於新葯研發的範式轉變：只會讓它更強大

知識 05-24

圖片來自mindthebyte.com

編者按：

當下人工智慧應用於新葯篩選進行得如火如荼。以至於很多製藥領域的公司認為人工智慧無所不能，但其中的虛虛實實，並非每個人都能真正看懂。前兩周《知識分子》刊登了李偉和黃牛博士兩篇文章，介紹了人工智慧應用於新葯研發領域的概況，同時指出人工智慧用於新葯研發的不足，如有效靶點太少，大數據訓練出來的人工智慧並不夠「智能」。他們希望行業能將人工智慧這把「好刀」用好，充分發揮它的優勢，揚棄它的不足。近日，同濟大學生物信息學教授劉琦對此提出自己的看法。他認為，人工智慧用於新葯研發的範式發生了轉變：從以靶點為核心到綜合表型的篩選，從大規模大樣本訓練到小樣本的學習。人工智慧這把「好刀」，其實非常鋒利，但回歸到從藥物發現到疾病治療，仍舊是漫長的路程，道路曲折，前途光明。

撰文 | 劉琦（同濟大學教授）

責編 | 葉水送

知識分子為更好的智趣生活ID：The-Intellectual

近日，筆者閱讀了黃牛老師等人於《知識分子》公眾號發表的兩篇關於人工智慧+新葯研發的討論，受益良多。黃牛老師是物理學背景，從「第一性原理」的角度，高屋建瓴地為我們展現了新葯研發波瀾壯闊的圖景，以及應用人工智慧可能存在的若干利與弊。筆者是計算機+生物信息學交叉背景，在這裡也想從我的專業角度來談談對於人工智慧+藥物研發的粗淺認識，不求甚解，但求拋磚引玉。

藥物研發的轉變：從以靶點為核心到綜合表型篩選

首先，正如黃牛老師所說，新葯研發是一個系統工程，從靶點的發現、驗證，到先導化合物的發現與優化，再到候選化合物的挑選及開發，最後進入到臨床研究，可謂九死一生。傳統藥物研發的起點，在於發現疾病相關的有效靶點，靶點已知，後續的藥物研發路徑相對明確，可藉助於各種計算機輔助虛擬篩選技術、高通量組學技術，綜合計算化學、物理學以及結構生物學的相關知識，進行有效的小分子（或者大分子）的篩選與設計。

但藥物靶點的發現，其本質上是由分子生物學和系統生物學學科驅動的。疾病的靶點、突變基因以及功能蛋白的鑒定是一個系統工程，在筆者的知識體系中，是和藥物研發同等複雜的過程。換句話說，藥物靶點的確實是聯繫分子生物學以及藥物研發的一個橋樑，但其本身歸屬於分子生物學範疇。

從這個角度上說，我們談人工智慧是否可用於新靶點的發現，其實是一個偽命題。我們既可以說人工智慧夠應用於新靶點的發現：因為人工智慧的相關技術已大量應用於疾病的靶點預測、高通量數據的分析以及系統生物學的建模過程中。同樣，我們也可以說人工智慧並不是新靶點發現的核心手段，因為靶點發現本身屬於分子生物學的研究範疇，但我們並不能否認人工智慧在靶點發現上，已產生以及將要產生的重要作用。

最近，Cell及其子刊同期發表的近20篇針對TCGA的Pan-cancer分析的系列論文，就是一個典型的案例，這些論文大量使用了高通量組學數據的分析技術以及人工智慧的相關建模方法，來挖掘和分析腫瘤相關的突變位點，可以看到，人工智慧技術已融合到複雜疾病靶標分析的方方面面。

其次，黃牛老師提到了利用人工智慧技術進行海量文獻挖掘來發現新靶點（如Benevolent AI公司的工作等）。正如黃牛老師所說：（1）自然語言處理技術（NLP）是人工智慧技術的一個分支，人工智慧技術在靶點挖掘領域的應用還有其他若干方向。面向海量文本的挖掘是人工智慧比較容易落地的一個應用場景。但是如前所述，靶點發現其本身應該歸屬於分子生物學的研究範疇，所以僅僅分析文獻數據，並不一定能夠發現可靠的靶點；（2）我個人建議將靶點發現和後續的藥物設計分開來討論，相對於靶點發現，人工智慧目前確實在藥物設計層面有更好的應用和落地。

圖1：諾華公司的藥物篩選策略統計（2011-2015）

最後，當前藥物研發的範式正在從單一的以靶點為核心（Target-centric）的模式向整合表型篩選（phenotypic-screening）的模式進行轉換。傳統的藥物研發以靶點為核心，但是我們越來越認識到，複雜疾病是一個綜合系統，單一或者若干個靶點的突變，可能並非是這個疾病發生髮展的根本原因，癌症的靶向葯會產生抗性，因為腫瘤系統不斷地進化並且具有高度的異質性；老年痴呆症（AD）至今為止也沒有發現較為明確的靶點。大多數複雜疾病的發病機制並不清晰，靶點也不明確。

這種情況下，整合表型篩選進行藥物研發越來越受到學術界和工業界的關注[1]。表型篩選系指在不明確疾病靶點以及相關的Mechanism of Action（MoA）的情況下，基於疾病的表型數據（Phenotype Data）進行藥物的篩選和設計。直觀的理解是，我們如果發現某種小分子可逆轉疾病的表型，那麼這個小分子針對於這個疾病即具有潛在成藥性，可進行後續的進一步驗證。同時，小分子的確定反過來也可以幫助疾病靶點的篩選。例如，我們可以通過反向對接技術（Inver-dock）以及網路藥理學的方法（Network Pharmacology）來預測小分子的結合靶點。2011年至2015年，諾華公司的新葯研發統計數據表明，其公司採用表型篩選策略進行藥物篩選的增長率要遠高於以靶點為核心的篩選模式（圖1）。

在黃牛老師文中所提到的楊森公司等利用化合物的細胞圖像數據，進行藥物篩選的Imagenome概念，其本質即是表型篩選的一種體現，這裡的表型即為圖像。在新葯研發領域，我們已經可以基於細胞系的轉錄組表型進行藥物重定位（Drug Repositioning），其典型代表即為面向Broad Institute開發的Connective Map資料庫的挖掘和應用[2]。2011年，美國《科學?轉化醫學》雜誌發表了美國加州大學舊金山分校計算健康信息學研究所所長Atul Butte的工作, 成功地應用了表型篩選的方法，篩選出一種抗消化性潰瘍葯甲氰咪胍（Cimetidine），用於治療非小細胞肺癌 [3]，並進行了in-vitro和in-vivo的驗證。綜上所述，疾病的靶點發現，目前看並非是藥物研發的唯一起點。

北京大學來魯華教授等也在JACS撰文指出，藥物研發的發展趨勢之一是在傳統基於結構的藥物設計的基礎上，走系統生物學的研發模式[4]。正如黃牛老師所說，未來的藥物研發是一個綜合多學科多手段的系統工程，「沒有理由人工智慧應該取代物理，也沒有理由物理應該排斥人工智慧」，我們需要整合大量的高通量組學數據，網路藥理學數據乃至圖像等高維表型數據，面對這些數據，人工智慧技術可以大有作為。

大規模標記樣本：是AI的阿基琉斯之踵？

當前流行的人工智慧模型，特別是深度學習模型（Deep Learning）往往需要大量的標記樣本進行訓練，所以對標記樣本的需求很高。在生物醫學以及藥物研發的應用場景下，標記樣本的獲取依賴於領域專家知識和實驗驗證，故成本比較高。我們看到深度學習在生物醫學領域最先落地的應用場景是病理切片的圖像讀取，相關的人工智慧公司如雨後春筍，一片紅海。究其原因，是因為深度學習這種layer-wise的學習模式，天然適合對圖像這種low-level feature的樣本進行表徵學習（Representation Learning）。通過逐層的網路學習，深度學習可自動學習圖像的High-level feature，一定程度上避免了人工進行特徵工程（Feature Engineering）的繁瑣過程。同時ImageNet等大規模標註的圖像資料庫也為深度學習模型的快速發展提供了可靠的訓練數據來源。

深度學習模型可以很自然的應用於病理圖像分析，門檻相對較低，但是正如黃牛老師所說，我們同樣應該認識到目前病理圖像的深度學習遠未達到臨床可以替代病理醫生的水平，主要原因在於：（1）高質量可靠的病理圖像標記樣本仍然缺乏，模型的泛化能力差；（2）各個公司或者論文發表的預測結果，缺乏統一的獨立測試數據集以及有效的評價標準進行評估；（3）在模型的方法學設計上，還需要更加深入的考慮病理圖像的特點，並且引入先驗的領域知識。

圖2：Yann LeCun對人工智慧若干學習範式的比喻圖

藥物研發領域的標記樣本問題同樣存在，但是筆者認為和病理圖像領域有很大差別：（1）如前所述，藥物研發領域所積累的數據十分多樣化，我們既有各種高通量的組學數據，同時又有各種表型數據（如Image）及文本數據，整合分析多源高維的異質數據，可以一定程度上彌補了我們在單一數據源小樣本層面存在的問題；（2）人工智慧的發展趨勢，也正在從傳統的大樣本訓練向小樣本學習及反饋學習的模式轉變。Yann LeCun形象地比喻利用非監督學習對大量的無標記樣本進行分析是人工智慧這塊「蛋糕的主體」，而強化學習是「蛋糕中美味的櫻桃」（圖2）。

中國科學院上海生命科學研究院陳洛南教授等建立了一套完整有效的基於高維數據小樣本（甚至是單樣本）的疾病靶點標誌物篩選的方法；而近年來發展的弱監督學習（如遷移學習，多任務學習，半監督學習等）、小樣本學習（one/few-shot learning）乃至零樣本學習（zero-shot learning）也逐漸在藥物研發領域應用。筆者團隊在基於遷移學習、多任務學習、半監督學習等小樣本/弱監督學習方法學進行藥物虛擬篩選及組合用藥預測領域進行了一定的探索和嘗試；斯坦福大學的Vijay Pande教授等近期也嘗試用one-shot learning來進行low data drug discovery[5]；而強化學習已被應用於小分子的生成設計[6]；這些工作均是藥物研發領域面向小樣本進行的有益嘗試。

人腦對於客觀事物的理解，並不一定需要大量樣本的訓練，很多時候基於簡單的類比既可以進行學習。DeepMind公司最近在Nature Neuroscience雜誌發表論文探討大腦如何在少量的經驗下進行學習，即「元學習」（meta-learning）或「學習如何學習」（Learning to learn），而對於元學習模式的理解，是我們達到通用智能的重要途徑之一[7]。3月底，Nature雜誌發表了基於人工智慧進行藥物逆合成路線設計的工作，完全借鑒了AlphaGO的思想[化學界誕生了一個「AlphaGo」]，而AlphaGO之後的AlphaGO Zero版本則實現了不需要依賴訓練樣本的對弈模式，藥物研發領域這樣的模式會不會出現？我們拭目以待。

總結來說，對於大規模標記樣本的依賴，到底是不是藥物研發中應用AI的阿喀琉斯之踵（The Achilles" heel of AI）?筆者個人認為不是。其原因如下：（1）藥物研發是一個大量多源多層面數據共存的場景，多源數據的整合分析非常重要，同時也可以彌補單一樣本源的小樣本問題；（2）小樣本學習的發展是人工智慧發展的重要方向，我們期待也相信新的學習範式能夠在藥物研發領域落地。

藥物研發+人工智慧：從數據到治療，還有多遠？

正如黃牛老師所說，藥物研發的每一個階段都有多種可用的方法和技術，各自優缺並存，「擇其善者而用之」。而人工智慧技術，可應用於藥物研發的各個層面（這裡特指靶點篩選，小分子篩選、設計、合成，成藥性評估等實驗驗證前階段。大分子藥物設計較為複雜，不在此次討論範疇）。在這裡，有必要說明一下筆者對於現代人工智慧技術和傳統計算機輔助藥物設計（CADD）之間區別的理解。我所理解的傳統CADD技術，更偏向於以靶點和結構信息為核心的計算機輔助設計，如傳統的定量構效模型的構建（QSAR），基於結構的虛擬篩選（Virtual Screening）等，而現代的人工智慧技術應用已逐漸跳出以靶點和為核心的傳統研發模式，面對的是海量的、多源的、異質性的數據，可以說現代的人工智慧技術在藥物研發中的應用，是以數據為核心驅動的。黃牛老師在第二篇討論中介紹了人工智慧在藥物研發中的若干應用，在這裡，我進一步用圖三進行一個小結。（見圖3）

圖3：人工智慧在藥物研發中的應用場景

由上可見，人工智慧技術幾乎涵蓋藥物研發實驗前所有的步驟。葯明康德公司曾經提出藥物研發的VIC模式，即「VC（風險投資）+IP（知識產權）+CRO（研發外包）」。在這裡，筆者對於VIC提供另外一種解讀，即「Virtual（虛擬）+IP（知識產權）+Capital（資本）」。我個人認為，未來的藥物研發，可在資本的介入和知識產權的保護下，在實驗驗證前最大程度的虛擬化、人工智慧化，由計算機來評估藥物成藥的各個指標，最大程度的降低失敗率，通過選取最可能成藥的小分子進入後續的實驗和臨床驗證，來節省藥物研發成本，縮短藥物研發時間，而後續的實驗和臨床驗證，又可外包至CRO公司批量化完成。

當然，這種想法只是筆者個人的理想，可能不甚成熟。對於人工智慧在藥物研發領域的應用，正如黃牛老師所說，我們既不能過度解讀，也不能固步自封，道路是曲折的，前途是光明的：From data to therapy, a long but prospective way to go。

參考文獻：

[1] Dorothea Haasen et al, How Phenotypic Screening Influenced Drug Discovery: Lessons from Five Years of Practice, ASSAY and Drug Development Technologies, 2017, DOI: 10.1089/adt.2017.796.

[2] Lamb J et al, The Connectivity Map: using gene-expression signatures to connect small molecules, genes, and disease, Science, 2006, Sep 29;313（5795）:1929-35.

[3] Sirota M et al, Discovery and preclinical validation of drug indications using compendia of public gene expression data. Science Translational Medicine, 2011 Aug 17;3（96）:96ra77.

[4] Jianfeng Pei et al, Systems Biology Brings New Dimensions for Structure-Based Drug Design, J. Am. Chem. Soc. , 2014, 136, 11556?11565.

[5] Han Altae-Tran et al, Low Data Drug Discovery with One-Shot Learning, ACS Cent. Sci. , 2017, DOI: 10.1021/acscentsci.6b00367

[6] Marcus Olivecrona et al, Molecular De Novo Design through Deep Reinforcement Learning. 2017, arXiv preprint arXiv:1704.07555.

[7] Jane X. Wang, et al, Prefrontal cortex as a meta-reinforcement learning system, Nature neuroscience，2018，doi:10.1038/s41593-018-0147-8.

製版編輯：黃玉瑩 |

本頁刊發內容未經書面許可禁止轉載及使用

公眾號、報刊等轉載請聯繫授權

商務合作請聯繫

business@zhishifenzi.com

知識分子為更好的智趣生活ID：The-Intellectual

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 知識分子 的精彩文章:

※張月紅：反思中國學術期刊的國際影響力

TAG:知識分子 |