當前位置:
首頁 > 知識 > 有了它你就不用在實驗室熬到半夜了:「虛擬細胞」或將改變一個領域

有了它你就不用在實驗室熬到半夜了:「虛擬細胞」或將改變一個領域

大概所有做過細胞熒光成像的人都不會同意這是個令人愉快的實驗。從樣品的準備到顯微鏡的調試,再到拍照區域的選擇和成像,每個步驟都複雜繁瑣,而且不能出錯。

不過,這個來自艾倫細胞科學研究所的「虛擬細胞」或許能夠解決這些煩惱——計算機視覺研究員格雷格·約翰遜開發了一個深度學習神經網路,能夠從未被標記的顯微成像中識別出細胞解剖結構,並由此生成複雜的細胞模型。他希望在未來,這項技術能夠節約研究人員在熒光蛋白標記實驗上耗費的精力,大幅提高細胞生物學的研究效率。

圖片來源:Chona Kasinger for Quanta Magazine

來源Quanta Magazine

撰文 John Pavlus

翻譯 張元一

編輯 戚譯引 魏瀟

高中生物課本上關於細胞的部分是錯的。典型的人體細胞,比如某個能夠分化成肌肉、神經、皮膚等任何組織的多能幹細胞,並不完全是一個半透明球體。它的內部構件也不是靜止不動,而是分散分布,就像明膠中的菠蘿塊一樣。實際上,細胞看起來更像是一包半融化的軟糖豆,被塞進一個小小的三明治袋裡。並且其內部構件都在不斷運動,比計算機晶元中的活動還要更精準、複雜。

簡而言之,了解內部細胞的樣子即使在 21 世紀也很困難,更不用說它們各部分之間無數的相互作用了。「把細胞想像成像汽車一樣複雜的機器,不過每 24 小時,車道上的一輛車就會變成兩輛車,然後是四輛,」格雷格·約翰遜(Greg Johnson)說,他是艾倫細胞科學研究所(Allen Institute for Cell Science)的一名計算機視覺和機器學習研究員,「如果你找到世界上最聰明的工程師,要求『給我造一台能做到這樣的機器』,那麼他們一定會被難住。每當我想到人類對細胞運作方式知之甚少時,我就會這樣想。」

為了觀察活細胞的內部運作過程,生物學家目前主要靠基因工程和先進的光學顯微成像技術。(電子顯微鏡可以對細胞內部進行高精度成像,但不適用於活體樣本。)通常,細胞被基因改造以產生熒光蛋白,該蛋白附著於特定的亞細胞結構,如線粒體或微管。當細胞被特定波長的光照射時,熒光蛋白會發光,因而為相關結構提供了視覺標記。然而,這種技術昂貴且耗時,並且它一次只能觀察到細胞的部分結構特徵。

約翰遜有著軟體工程方面的背景,他開始思考:如果研究人員能夠教人工智慧識別細胞的內部特徵並自動標記會怎樣?2018 年,他和艾倫研究所的合作者們實現了這個想法。藉助熒光成像樣本,他們訓練一個深度學習系統識別十幾種亞細胞結構,直到它可以在從未見過的細胞中識別出同樣的結構。更棒的地方在於,經過訓練,約翰遜的系統還可以處理細胞的「明場圖像」,即普通光學顯微鏡獲得的圖像,就像「用手電筒照射細胞」那樣。

相比昂貴的熒光成像實驗,科學家可以使用這種「無標記測定」( label-free determination),對活細胞內部生成高保真 3D 影像。

這些數據還可用於構建理想化細胞的生物學精確模型——就像高中課本上那些整齊標記的圖表,但在科學上更加準確。這是該研究所項目的目標。

「我們希望能夠說,這裡有一個普通的細胞,看看它,解剖它,仔細研究它吧。但是因為它基於數據,所以它還可能涵蓋了所有預期中的變異結果。你可以說,『讓我們來看看這個異常的細胞吧』,然後研究它的構造。」

約翰遜利用機器學習對細胞內部進行可視化的工作開始於 2010 年,當時他在卡內基梅隆大學。不久後,深度學習技術的一系列突破對人工智慧領域帶來了改變。近十年後,約翰遜認為他的活細胞 AI 增強成像方法已經能產出足夠準確的軟體模型,可以減少甚至完全消除對某些實驗的需要。他說:「我們希望能用最便宜的方法拍攝(細胞)圖像,並儘可能多地預測細胞的情況。它是如何構成的?它的基因表達是什麼樣的?它周圍的細胞在做什麼?對我來說,(無標籤測定)只是一個原型,未來的技術還將比這複雜得多。」

Quanta就基礎細胞生物學的挑戰和人工智慧在顯微成像領域的未來應用採訪了約翰遜。為了清楚表述,該採訪已經過縮減和編輯。

Q:為什麼看到活細胞內部如此困難?

A:如果你想觀察一個活細胞,基本上會面臨兩個限制我們可以用激光照射細胞,使這些(熒光蛋白)標籤發光。但是激光是有光毒性的——細胞相當於在沙漠中受著太陽的炙烤。

另一個限制是這些標籤總要附著在細胞自己的蛋白質上,這類蛋白質需要在細胞中移動,需要實現功能。現在,它們上面附著了一個又大又蠢的熒光分子,如果標籤太多,這可能會改變細胞自身的工作方式。有時,當你試圖引入這些熒游標簽時,實驗就無法成功。有時這種熒游標記對細胞甚至是致命的。

Q:在熒游標記成功的情況下,它的效果還不夠好嗎?畢竟它已經給我們帶來了這麼多進展。

A:如果我們繼續沿用汽車的比喻,那麼就像你有一輛完全由玻璃製成的汽車。你可以看到汽車內部的東西,但你無法分辨自己看到了什麼,它們彼此之間又有怎樣的的關係。所以,你用熒光分子作為標籤,來突出汽車中的一兩個部分。現在你可以看到門把手,或者可以看到汽車有多少輪胎了。但有時你會發現,你的「汽車」只有兩個輪子,並且它沒有任何門把手。你會說:「我不知道這是什麼東西。」事實上它是一輛摩托車,但我們甚至都不知道摩托車是什麼,因為此前我們只看到過有四個輪子和門把手的細胞。

如果我們能夠進行活細胞成像,可以在同一時間看到所有細節,那麼生物學研究將發生翻天覆地的變化。我可以拆開汽車,用 X 射線檢查汽車,看車到處行駛。也許我還能自己造一個引擎。至少我們會更好地了解(細胞里)到底發生了什麼。

Q:什麼啟發了你用深度學習去標記細胞內部結構?

A:當我看到人們使用深度學習來生成真實的面孔時(2014 年首次用生成對抗網路實現),我說,「哦,我們可以用它來生成細胞圖像。」這就是我的工作:模擬細胞。我說,「如果我們能夠生成來自某個標記實驗的細胞圖像,並且生物學家也看不出來這些圖像是否真實,那會怎麼樣呢?」如果我們可以做到這一點,從某種意義上說,我們就建立了一個模型,能夠完全模擬該實驗正在做什麼。

Q:這樣是不是存在著風險,讓我們看見實際上並不存在的東西?

A:我們在做的其實是預測實驗結果,讓科學家們可以優先選擇他們覺得有趣的實驗進行研究。

假設我有細胞的照片,軟體可以預測出細胞內某個細胞器,比如線粒體的分布規律。那麼在機器生成的無標記模型中,我們展示的是線粒體位置的預期結果。相當於我們認為這些線粒體所處的平均位置。

理解這個模型的另一種方法是,比如我想要進行一項用熒光蛋白標記細胞的實驗,但我沒有實際執行那個實驗,我手頭只有這些非常便宜的明場顯微鏡圖像。所以我要求機器預測這個熒游標記實驗的結果。然後,如果我在生成的圖像中看到了什麼有趣的東西,我就可以去做那個實驗,(驗證機器的預測結果)。

Q:所以你想用 AI 來幫助我們進行目的更明確的實驗,還是取代實驗?

A:我認為兩種說法都對。一個科學家說過,「實驗的目的就在於證明你的模型是錯的。」因為我們的(深度學習)模型完全由熒光成像實驗數據訓練得來,這意味著每次你做了新的實驗,新的數據表明我的模型出現了錯誤,我都可以把實驗數據加入我的模型中,確保下次做得更好。

這是一個雙贏局面,要麼模型正確預測了實驗結果,要麼模型獲得了新數據,以便下次能做出更準確的預測。

如果把這個過程推到極端,就會得到一個機器學習模型,你可以輸入任何想要模擬的實驗的參數,然後它會返回你要測量的東西。如果你實際去做那個實驗了,實際結果和模型結果一樣的話,那你就獲得了一個在某種基本的層面上理解了生物學的模型。

圖片來源:Chona Kasinger forQuanta Magazine

Q:這種方法有爭議嗎?

A:大約兩三年前,人們會說「我不相信你」。我去會議展示我的工作也會聽到批評的話,翻譯一下就是「帶著這坨垃圾滾吧」。現在人們對這一想法的接受程度大大提高了。在整個細胞生物學成像領域,它很快就被接受了。

Q:是什麼發生了改變?

A:我的博士研究主要是圍繞使用經典的統計建模來做這種事情。這是非常、非常強大的工具。但是這些統計工具可能沒法生成高品質的、看起來足夠真實的細胞圖像。我可以在細胞內畫出一個大概分布,然後說:「更亮的地方就是我期望找到線粒體的地方」,但人們會說,「好吧,這看起來根本就不像一個細胞。」這讓我感到非常沮喪,因為數學過程和概率運算都是正確的。

但是當我們獲得第一張來自無標籤測定模型的圖片時,它們看起來很真實。我們能夠真正看到細胞的各個部分在哪裡。人們驚訝得合不攏嘴。然後我們就按這樣的想法繼續做下去了。

Q:眼見為實?

A:沒錯,就是這樣。而且我們使用明場圖像的操作讓所有人都感到震驚,因為在成像領域,明場圖像通常是一次性數據。當我們拍攝這些組織的明場圖像,即只用普通光源照射樣本進行成像,這只是為了弄清楚樣品在顯微鏡上成像是否清晰。然後它就被塞進硬碟上的某個地方,再也沒有人看它一眼。使用熒光分子進行標記的實驗是昂貴的,但是明場圖像相比之下基本等於不花錢。用這些昂貴的數據訓練(深度學習)模型,然後使用這些模型來預測拍攝的(明場)圖像的細胞內部的構造,這種方式可以節省大量的時間和金錢。

Q:你需要單獨訓練不同的深度學習模型,來識別你研究的細胞中不同的部位。有的部位比其他更容易識別嗎?

A:被膜結構包裹的細胞器,比如細胞核和線粒體,是很容易預測的。其他沒有明顯膜結構的細胞器,如微管或高爾基體,就很難預測。這主要是因為這些物體的密度與它周圍區域的密度差異不大。

Q:您要怎麼打破這些限制?

A:比如可以使用偏振光源替代普通的透射光源,或使用其他利用光學技巧的成像技術,在成像時獲得不同級別的對比度。

或者,如果我要做一個實驗,並且只能使用三個熒游標簽,那麼我可以不把它們用在系統已經可以很好地預測的結構上,而是用在難以預測的結構上,比如肌動蛋白和微管——細胞內的骨架結構。

Q:您和艾倫研究所的其他科學家可以不斷改進這些模型,並基於這些研究開發出「艾倫複合細胞」(integrated cell)。那艾倫研究所之外的科學家們也可以使用這種方法嗎?

A:這是我們整個任務的重要組成部分。當谷歌建立 AlphaGo,擊敗世界上最好的圍棋玩家時,他們的人工智慧學習了 200 多年來出現的所有圍棋棋譜。也許除了亞馬遜和微軟之外,世界上所有其他的機構都無法獲得這樣的資源。我們希望其他人能夠使用我們的細胞模型和技術,在自己的實驗室里進行自己的研究項目,不過他們不一定需要具備我們所達到的那種精度。

我們努力想要實現的事情之一,就是在普通硬體上構建這些模型——只要一台帶顯卡的普通計算機,和一些普通研究人員在普通實驗室中獲取的訓練圖像。我們所有的模型都在大約 30 張(熒游標記細胞結構)圖像上進行了訓練。這是一個研究生在實驗室不到一個下午就能完成的工作量。而且只要花大約 2000 美元,你就能配置一台能夠勝任這項工作的計算機,就實驗室設備而言這是相當便宜的。如果你真的需要構建一個有用的模型,這應該不難做到。

Q:您怎麼看待這項技術的發展?您希望在未來,細胞生物學家能藉助人工智慧的幫助完成怎樣的工作?

A:我們希望可以給細胞拍視頻,觀察內部結構之間的關係變化,並作出預測。

以微管和 DNA 為例。微管通常使細胞保持其形狀,當細胞一分為二的時候,微管將 DNA 拉開,從而在細胞兩側形成兩個拷貝。這種現象眾所周知,它是細胞生物學家最早發現的現象之一。但是這兩種結構之間存在很多關係,這些關係非常微妙——可能很難發現,人眼無法看到它們。我們希望能夠使用這些前沿的計算機視覺和機器學習方法來自動剖析這些結構之間的關係。

Q:這一技術只適用於圖像數據嗎?

A:不,我們無需自我設限。我們可以採集細胞的各種生物信號,進行各種各樣的測量,然後模擬它們之間的關係。再次使用玻璃車的比喻,你不僅可以看到所有部件都有清楚的標籤,還能看到里程數、裝配時間、這些部件的年齡、是否曾經被替換,等等。

你可以將這種技術視為數據驅動、功能強大的虛擬現實顯微鏡。任何我們可以在細胞中觀測的,或者成對觀測的,我們可以把它們相互關聯。每隔五年或十年,科學家就會想出一種新的測量方法。這完全改變了我們看待生物學或一般科學的方式。當科學家們觀察他們的組織樣本時,我們希望他們能拿出這個模型,讓它預測我們可能測量到的細胞的方方面面。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 科研圈 的精彩文章:

喝 100% 的純果汁也會增加早死風險;抽血驗血脂,早餐到底吃不吃?
烏鴉葬禮:有的默哀學習,有的與死者「交配」?

TAG:科研圈 |