當前位置:
首頁 > 最新 > 基因遇上AI,這家公司如何用人工智慧助力腫瘤早篩?

基因遇上AI,這家公司如何用人工智慧助力腫瘤早篩?

DeepDiagnos(美國)團隊成立於2017年,致力於用人工智慧來篩查早期癌症。DeepDiagnos的核心技術是構建AI模型來逐點掃描基因組的每一個位點,從中找出可能存在的腫瘤相關突變,在癌症剛剛發生的階段就能發出預警。

也許是緣分,從學生時期到工作、再到創業,張新軍從來沒有離開過生物信息領域。

哈爾濱工業大學(哈工大)是國內最早設立生物信息專業的高等院校,這是張新軍夢想的發源地,從本科開始他就在這裡生物信息學知識。後來他創業的團隊也幾乎來自這裡,成員大部分是自己同校的師兄或者同學。

「大家背景比較相似,也比較了解。」他這樣告訴動脈網。

2009年碩士畢業後,張新軍又遠赴美國求學。這次他來到的是美國印第安納大學,研究課題是用機器學習演算法去預測可能導致疾病的基因突變。用在腫瘤基因組的海量數據分析上,可以用來識別相關的驅動突變。這是現在Deep Diagnos演算法模型的雛形。

2015年博士畢業後,張新軍進入了全球最領先的醫療器械公司之一——賽默飛世爾。這家公司測序儀的市場覆蓋率僅次於Illumina。他倒是進入的就是臨床科學部門,負責測序儀上的軟體設計。

「我當時的工作就是設計軟體來分析患者血液中的遊離DNA,檢測出患者是否攜帶一些特定的突變,是否能夠尋找到合適的靶向藥物。」他回憶道。簡而言之,就是伴隨診斷的數據分析處理。

技術的追隨者

2014年開始,二代測序技術使得基因測序行業得到了極大的發展,液體活檢技術也在不斷的成熟,許多公司開始將這項技術用於腫瘤的檢測、輔助制定治療方案、甚至早期篩查。

「通過液體活檢技術,可以從血液裡面檢測到非常微量的循環腫瘤DNA。但僅僅檢測DNA突變是做不到癌症早篩的。」DeepDiagnos CSO胡楊博士表示。

胡楊是他在哈工大的校友,目前在哈佛大學從事博士後研究工作。胡楊在神經/免疫疾病和人類複雜疾病功能注釋及其相關研究領域共發表SCI 論文21 篇(其中第一作者或通訊作者論文15 篇),累計影響因子75。

胡楊與張新軍是我多年好友和同學,也是DeepDiagnos最早的成員。「2017年最開始有創業想法時,我就和胡楊討論過,之後決定一起創建團隊」張新軍回憶道。另外一位合伙人程亮同樣是哈工大的校友,2016 年 9 月被破格評為哈爾濱醫科大學生物信息學院副教授,2017 年被選為中國計算機學會生物信息學專業組委員。

胡楊認為,要實現癌症早篩,必須要解決兩個問題:一個是判斷檢測到的突變是否意味著癌症已經發生;另一個則是判斷癌症發生的部位在哪裡。液體活檢提供了無創檢測的先決條件,即數據產生的環節,但後續對數據的分析則需要依靠強有力的機器學習、深度學習的介入。

「癌症最複雜的問題之一是如何識別驅動型突變,也就是直接導致癌症發生的突變。依靠我們自主研發的AI演算法,我們可以準確識別驅動突變,分析癌症是否已經發生,甚至找到發生病變的位置。」張新軍補充說道,「這樣才算完成了整個篩查的過程。」

2017年,DeepDiagnos團隊組建完成,正式開始了創業征程。Deep Diagnos的團隊成員均來自於哈佛醫學院、斯坦福大學,以及賽默飛世爾、阿斯利康等著名跨國企業。

國內國外團隊算起來差不多10個人,坦白說,目前公司團隊並不大,國外團隊主要負責技術研發、診斷模型設計,國內負責收樣和政府對接工作。

麻雀雖小五臟俱全。

高效篩選腫瘤標誌物,用AI演算法的力量挑戰腫瘤早篩

目前腫瘤早期篩查主要有兩個技術流派,一個是以Grail等公司為代表的甲基化測序路線;另一個則是以John Hopkins大學的CancerSeek為代表的基因突變結合蛋白標誌物的路線。

兩個技術流派代表了不同的方向。甲基化路線是通過提取遊離腫瘤DNA並進行甲基化測序,分析甲基化模式來判斷腫瘤的部位。甲基化的特點在於能夠很好的判斷腫瘤的組織來源。

大家比較熟知的是甲基化在肝癌診斷中的應用,而對於其他癌症,甲基化診斷的研究並不多。而且對於甲基化用於早期癌症診斷的準確性,還沒有非常有說服力的研究數據。

DeepDiagnos採用的則是與CancerSeek類似的技術,這種技術的特點是操作流程相對簡單,演算法模型的穩定性高,而且費用低。只需要檢測固定的一些突變位點和常規血清標誌物,就可以實現準確的腫瘤篩查和並判斷組織來源。

deepDiagnos工作流程圖

張新軍向動脈網介紹說:「2018年4月Grail披露了一批研究數據,從中看來CancerSeek模型的預測效果並不亞於全基因組甲基化數據。而且由於Grail使用的是全基因組甲基化數據,成本至少是CancerSeek的十倍以上。但是CancerSeek也絕非完美,它目前對於I期腫瘤的診斷效果不好,但對於早篩來說一個非常不錯的開始。」

和CancerSeek最大的區別是,DeepDiagnos採用他們自己的AI演算法來精準篩選驅動突變,而CancerSeek是靠「經驗主義」選取常見的驅動突變。AI演算法的明顯優勢在於:如果某種癌症的相關研究較少,僅靠經驗可能無法獲得足夠的突變位點,勢必會影響模型的準確性。而依靠傳統的研究方法去探索新的驅動突變,是一個非常艱難且漫長的過程。

DeepDiagnos自主研發的驅動突變篩選演算法,可以快速的分析完一個患者的全基因組數據,並準確的找出其中的驅動突變。

由於腫瘤患者的基因組差異性高,兩個患者攜帶同一組驅動突變的概率非常低,因此學術界熟知的那些驅動突變無法覆蓋所有的患者。只有依靠強大的AI演算法才可以確保不漏掉任何一個有意義的突變位點。

利用自主研發的演算法,實現高精度的全基因組篩查,發現癌症相關的驅動基因突變

AI演算法的優勢更體現在處理人種差異上。例如對於非小細胞肺癌,東亞患者的EGFR突變率顯著高於歐美患者人群。

因此可以預見,如果只參考常見的驅動突變,可能會漏掉一些亞洲人群的特例。但是對於AI演算法來說,就不存在這個問題。

胡楊介紹,他們的演算法模型主要分為兩個部分。第一部是腫瘤的判斷,他們首先通過演算法挑選出了一系列的突變基因列表,通過這些突變來判斷腫瘤發生的可能性。第二部分則是按照不同疾病分別來構建模型,將檢測到的數據放到模型里進行打分,然後將結果按得分的高低順序排列,分數最高的發生的可能性更高。

「這其實是一個量化的過程。」他這樣解釋。

數據獲取是最大困難

在過去一年裡,團隊主要集中精力在攻克肺癌早篩。「這種癌症發病率高,但是早期患者的預後很好,治療方案發展也比較快,所以早診比較有意義。」胡楊表示。

但演算法模型的開發也並非易事,最大的困難就是高質量數據的獲取。機器學習模型構建好後,需要大量臨床數據用來訓練和測試,樣本量越多,所得出的結果也就越準確。

「隨著收集的數據越來越多,模型的性能會越來越好,演算法部分將是一個持續迭代的過程。」他表示,但收集高質量的數據這個過程本身就是困難的。

通過多年的數據積累,他們擁有了1000多例腫瘤基因組數據,覆蓋多種常見的癌症

他們最先獲取到了部分半公開的數據。但明顯這些數據是不夠的,數據量級和多樣性並不夠。與哈醫大三院接觸多次後,他們終於與醫院達成協議,將臨床科研數據用於模型訓練。

「一開始一種癌症可能只需要幾百例樣本,但隨著產品向市場推進,需要的樣本量會越來越多。」張新軍向動脈網解釋。體外診斷產品推向市場分為三個階段,第一階段叫做前瞻性研究,可能只需要幾百例樣本來驗證原理;第二階段則是多中心獨立試驗,需要的樣本量是上千例;這些試驗都是為了保證產品的可靠性,並為以後的上市審批做準備。

此外,DeepDiagnos還與另外兩家腫瘤醫院也達成並簽署了合作協議,通過這些醫院收集樣本進行前期的科研合作。

他向動脈網透露,目前肺癌早篩的panel已經開發完成,其中包含了多種肺癌相關的突變基因和蛋白標誌物。在此基礎上,他們完成了一套演算法模型開發,能夠分析計算受檢者是否已經發生了癌症,並能夠量化癌症發生的部位和階段。

「這個模型後續還可以擴展到泛癌症。」他補充道。據了解,團隊目前已經開始了結直腸癌診斷模型的研發工作。

產品目標:降價,進入醫保體系

與專註於液態活檢的公司不同,DeepDiagnos給自己的定位是腫瘤I、II期的泛癌症檢測。他們希望通過精準的預測,讓患者在腫瘤發生的早期階段就能夠有所意識、有所行動。

這也使得其產品擁有了多樣的產品形態。一方面,產品能夠像體檢項目一樣,承擔健康監測的職能。例如與保險公司合作,為高危人群提供每1到3年一次的篩查服務;另一方面,它也能夠像其他的體外診斷產品一樣,成為臨床腫瘤輔助診斷的工具。

「和保險結合肯定是要走的一條路。中國有幾億人口的煙民,其中肺癌的高危人群也可能達到一億。這對早篩來說是一個非常大的市場。」胡楊表示,「另外還有一些家族遺傳的突變基因攜帶者,所以體檢市場是非常可觀的。」

「我們最終的願望還是希望產品能夠進入醫保體系。這也是大多數體外診斷(IVD)公司的願望。」他補充道。

儘管相比MRI和PET-Scan檢測,基於液體活檢的早篩成本已經大幅降低,但這個成本離產品的大規模市場普及還有一定距離。

美國的醫療與商業保險結合非常密切,他們可以通過與保險公司合作,幫助保險公司去篩選一批高危的人群,為他們提供規律性的篩查,來減少未來的醫療費用開銷。

對高危患者來講,保險公司的介入則能夠鼓勵更積極的篩查,降低患病風險的同時也為患者減少潛在的醫療費用支出。

「這對保險公司和用戶來說都好事,就好比美國牙醫保險都會提供每年兩次免費的洗牙,來降低未來患上嚴重口腔疾病的概率,為保險公司省錢。」張新軍表示。

「一開始可能會有些高端用戶,通過自己付費的方式進行檢測。但如果能夠進入醫保體系並隨著用戶人群的擴大,成本平攤效果越來越顯著,相信價格會變得十分親民,用戶群體將擴大很多。」他認為,如果最終給到用戶的客單價能夠控制在3000元人民幣內,將會有很大一部分高危人群會在每1-2年內進行一次檢測,每年受檢人群估計在五千萬到一億人次左右。

在進入醫保之前,他們會以臨床實驗室自建項目的方式進行銷售。接下來,肺癌的早篩產品將進入前瞻性臨床研究,並為臨床醫療器械資質申報做好準備。

下一步,人才和科研

目前公司正在準備肺癌早篩產品的臨床試驗工作,並在申請政府資金和政府項目。結直腸癌的產品模型也在研發過程中,後續產品也將緊跟肺癌產品進入市場。

接下來,人才擴展將是重心之一。「現在基本上把周圍的師兄師弟都騷擾了一邊。」張新軍調侃道,「這些人基本上都在哈佛、斯坦福等頂級院校從事科研工作,是目前公司需要的人才。」

另外一方面則是與國內外科研院校的對接,他們希望尋找到更多的美國和中國的科研院校進行合作,對更多的早篩產品進行進一步的開發和驗證,也為後續的臨床試驗奠定基礎。

據悉,公司已經完成了數百萬人民幣的種子輪融資,資金主要用於項目啟動和技術研發,目前有融資需求。

文|周夢亞

添加時請註明:姓名-公司-職位

後台發送關鍵詞即可獲得相關好文

網站、公眾號等轉載請聯繫授權

近期推薦

2018基層醫療創新實踐峰會

聲明:動脈網所刊載內容之知識產權為動脈網及相關權利人專屬所有或持有。文中出現的採訪數據均由受訪者提供並確認。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 腫瘤 的精彩文章:

拆掉腫瘤「短板」,迎來生命新光!
阻擋惡性腫瘤,這4類食物是「盾牌」,要記得多吃點

TAG:腫瘤 |