當前位置:
首頁 > 最新 > 醫療行業的AI落地需要數據先行,這家公司已經跑起來了

醫療行業的AI落地需要數據先行,這家公司已經跑起來了

心如佛、眼如鷹、膽如虎、技如仙。

一個醫生做到「四如」,是張國楨教授對自己團隊的要求。看診經驗豐富的他有「東方神眼」之稱,但有一場比賽,參賽選手的「眼如鷹」卻讓他都深感到佩服。大屏幕上,患者肺部的CT片出現了幾個圓圈,標註結節的位置,這原本都需要資深醫生來診斷,卻被機器迅速地找到了。打入決賽的隊伍選手在講台進行演講,談的卻不是醫學,而是不同的演算法,是最近大熱的AI。

2017阿里巴巴雲棲大會上,以肺部結節的智能診斷為主題的天池醫療AI大賽,別開生面的將前沿的技術和傳統的醫學聯繫到一起。大賽有三個主辦方,其中兩個是我們耳熟能詳的,一個是大賽雲計算平台的提供者阿里雲,另一個則是算力的提供者英特爾。而最後一個主辦方,則是一家創業公司,從事醫療大數據的零氪科技(LinkDoc) 。

零氪CEO張天澤出身醫生世家,但他最早卻是從事IT行業,曾先後供職騰訊、阿里巴巴(雅虎-中國)公司 ,2009年開始創業。最初他做的是醫療行業的傳媒業務,後來才開展數據業務,用他自己的話說「數據業務是被傳媒業務養著」。

的確,中國的醫療行業里,醫院的數據一直是處於孤島狀態,互聯網時代來臨後,數據的價值顯現,技術開始了對傳統行業的改造和賦能,這個浪潮,正沖向傳統的醫療行業。

在天池醫療AI大賽中,零氪提供了兩千份影像數據集,這個數據規模在以往是難以做到的。零氪首席架構師王曉哲告訴記者,這兩千份數據全部經過安全脫敏處理和專家標註,並且是三份標註進行互相核查選出來的合併以後的結果,是世界級最大規模的肺部薄層CT的數據集。

AI在行業落地時,數據的作用是毋庸置疑的,同樣的演算法,不同量級的數據量將導向不同的結果。在翻譯領域,即使用同樣的演算法,谷歌AI的結果也明顯更好,就是因為有更大的數據量。而在醫療行業,數據由於涉及隱私難以獲得。為準備這次比賽的醫療數據,零氪原本邀請了24家知名的醫院參與合作,其中20家接受了邀請,但最終真正參與的只有16家。

另一方面,則是全球參賽者的熱情參與。據阿里雲統計,這次大賽共吸引了20多個國家,2887支隊伍共3953名選手參與。零氪CTO羅立剛告訴記者,這次大賽的主題選用肺部結節的智能診斷,很大的一個原因就是人工智慧深度神經網路的技術,近三年在圖像識別的領域進步很快,而肺部結節的識別正好就是要用圖像演算法來解決的問題,演算法的應用更直接。

技術已經在敲門,數據卻沒準備好,這該怎麼辦

零氪給的回答在兩年前,張天澤期望自己的創業能做到這幾件事:幫助患者看對病,用好葯,付得起錢。而想做到這幾點,要用新的資源去滿足傳統需求,越是基礎、產業鏈上游的資源希望就越大。目前,零氪已經結構化的腫瘤患者病曆數據足有200萬份,覆蓋了900多科室,500多醫院,且幾乎都為排名靠前的三甲醫院(全國三甲醫院總數約2200);胸外科是零氪最早切入的領域,已經切入到了整個細分領域,有了許多新的發現。據了解,過去兩年,在數據上,零氪投入了差不多十個億。

在9月份,零氪組織了全國10家醫院的專家,把接近4萬例肺癌患者的數據合併到一起,現場跑數據跑出了十幾個課題。過去許多有意義的科研想法,在大的數據集和可視化、智能化的Hubble人工智慧科研決策平台上,真正得到了研究實踐。其中有一個關於淋巴結跳躍轉移的科研想法,據現場專家稱,一旦研究成果出現,論文可能會影響國際肺癌病理分期。

先行者,這是零氪在做的事情。但目前距離談成就還為時尚早,200萬腫瘤患者的數據,雖然已經被整理好,但所有權依舊在各自的醫院,而使用權,像十個醫院坐到一起開研討會,用合併的數據,就涉及相互間簽署協議的問題。不過時間是站在零氪這邊的,醫療數據的統一化,對整個醫療體系而言是利大於弊,行業基礎設施的進步,將促進行業整體效率的提升,國家也在這個方向進行引導,這將是未來的趨勢。

王曉哲告訴記者,AI想要在醫療領域落地和發揮作用,大規模統一標準的數據集是必不可少的,數據是一切的基礎。零氪參加這場大賽的另一個目的,也是為了鼓勵業界將數據標準化和公開化,讓跨產業、醫療圈外的人進入到這個圈子裡。而統一標準的制定,還需要未長期的磨合。比如影像設備,目前由於廠家、產品型號等存在差異,影像數據就是天然不統一的。而在存在統一的數據後,AI的進一步落地的道路依舊任重而道遠。

以腫瘤病的影像AI為例,張天澤將其分為三個階段:

第一階段,AI可以檢出病灶(5-10毫米),這一階段需要大量統一標準和質控的醫生標註的影像病例;

第二階段,AI可以鑒別病灶良惡性及病灶分型分期,這一階段需要大量的含有準確病理結果並標註精準的影像病例支撐;

第三階段,AI提供腫瘤病人治療方案優化推薦及預後評估,這一階段不僅需要大量的含有病理結果及精準標註的影像資料,同時還需要病人的治療、手術、用藥、隨訪等連貫的病例數據作為支撐,且不斷進行更新。

目前零氪有近1000名員工,其中約100人是研發人員,剩下的員工多為臨床或醫藥的背景。在數據集成和結構化上,零氪已經維持了相對穩定的狀態,並可以提供自身研發的SaaS和PaaS服務,而基礎的IaaS層,採用了混合模式,一部分在阿里雲,一部 分在天津的自建數據中心。「這一方面是為了降低存儲成本,另一方面,醫療數據比較敏感,需要放在本地。」王曉哲說。在AI上,零氪的醫療AI產品也已經在部分科室開始嘗試應用。

當談到成本如此巨大,什麼時候可以收益的時候,張天澤表示,目前還不適合談收益,基礎設施的投入將是一個長期的過程。醫療行業的產業鏈相對封閉,AI變現的渠道實際有限,張天澤介紹,目前業界將盈利的落腳點基本集中在醫藥企業和保險公司身上,這是產業鏈中需要數據服務,又真正願意支付的參與者。張天澤將醫療大數據和公司盈利的關係比作修高速公路,「修路本身不賺錢,但修好了路,就可以去賺錢了」。

作者 李昊原

微信編輯 張盼盼

審稿編輯 茉莉


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 IT經理世界 的精彩文章:

虛擬動物園是動物的諾亞方舟,沒有牢籠壓抑,只有交流和善意
有人or無人,「新零售」試圖詮釋「千人千面」另一種可能
中國製造遇上AI,產業新時代到來,幫鋼鐵大佬「查驗」殘次品能否秒殺人工?
史無前例的備貨量也沒抗到1分鐘,小米這是怎麼了?
你在睡懶覺時,世界又多出了這些「哇塞」的新玩意

TAG:IT經理世界 |