當前位置:
首頁 > 最新 > 一種基於原子模型對結構密度圖進行後處理的電鏡圖像恢復演算法

一種基於原子模型對結構密度圖進行後處理的電鏡圖像恢復演算法

近年來,冷凍電鏡已經成為解析生物大分子結構的主要手段之一,自2013年加州大學的程亦凡教授發表近原子解析度的TRPV1(辣椒素受體)通道結構以來,掀起了一場冷凍電鏡領域的解析度革命。由於直接電子探測相機,漂移修正演算法開發等新技術出現,冷凍電鏡結構的解析度有了極大提升,高解析度結構解析類文章發表數目呈爆髮式增長。

與X-ray晶體衍射不同,冷凍電鏡結構重構結果是通過大量二維投影照片加和成為三維結構的,在這一過程中,無法免除電子顯微鏡和探測器的系統傳遞函數對於得到的投影電勢的影響。

冷凍電子顯微鏡成像過程可以用如下計算公式表示:

I(x,y)=f(x,y)*PSF(x,y)+n

*代表卷積,I代表我們得到的圖像,f代表原圖像,PSF代表點擴散函數,n是成像過程中帶來的隨機雜訊。

在頻域空間,該公式可以寫成:

G(u,v)=F(u,v)·CTF(u,v)·MTF(u,v)·ENV(u,v)+N

G表示成像所得的圖像經過傅里葉變換後的分布,F代表原始圖像經過傅里葉變換後的分布,CTF表示襯度傳遞函數,MTF表示模數傳遞函數,ENV表示包絡函數。

我們可以看出,通過電鏡成像最終獲得的顆粒圖像數據是經過CTF, MTF,和包絡函數調製而來的,在這個調製過程中對於原始圖像所造成的相位改變或幅值衰減等作用,被稱為圖像退化函數。常用的單顆粒重構軟體如Relion,EMAN等,在二維均類、三維分類以及重構過程中都會利用維納濾波恢復CTF這一退化函數調製的信息。這樣,最後的重構結果只受到MTF和包絡函數的調製(在不考慮雜訊的條件下)。MTF和包絡函數都是對於結構因子的幅值有調製作用的函數,在一般的後處理過程中,通常認為包絡函數是一個以空間頻率為自變數,以B因子(B factor)為指數的e指數衰減函數,將重構的結果除以這一衰減函數做幅值調整後,即為B Factor修正。在實際應用中,通常需要利用不同的B因子進行振幅修正,選最優結果。而對於較小的B因子,這種修正演算法會導致振幅恢復不完全,從而造成解析度低估;對於過大的B因子,則會造成過分強調高分辨信號,引入雜訊,造成密度圖碎裂的視覺效果。

為了解決後期處理中利用同一B因子進行衰減包絡恢復引入的差錯,歐洲分子生物學實驗室Arjen J Jakobi等人提出了一種基於原子模型對密度圖進行電鏡結構後處理的圖像恢復方法,並將其整合進了利用Python語言編寫的LOCSCALE軟體包,這一軟體包基於科研工作中常用的NumPy和EMAN等的動態庫,編譯簡便,易於使用。相關研究結果發表在elife雜誌2017年12月刊(Jakobi et al. eLife 2017;6:e27131.OI:https://doi.org/10.7554/eLife.27131)。

這一軟體的基本思路在於,不再將包絡函數處理為e指數衰減函數,而是將密度圖與已有的原子模型在相近的空間頻率上比較功率譜差異,繼而以二者的相對值對這一空間頻率上的幅值進行調整,公式如下:

Fcorr(s)=k(s)Fobs(s),

其中,s是空間頻率,Fobs是我們得到的密度圖的傅里葉變換,Fcorr是修正後的密度圖的傅里葉變換,k是二者在這一空間頻率上的振幅比值,可以通過如下式子得到:

k(s)=(∑s±Δs/2∣Fmodel∣2/∑s±Δs/2∣Fobs∣2)1/2,

Fmodel是原子模型的傅里葉變換,其餘定義同上式。

論文中首先對日常常見二維圖片進行測試(如圖1)。圖中從左到右依次為原始大小圖片、細節切割放大、幅值及幅值的旋轉平均。A為原始圖片,將A進行傅里葉變換,保留相位,用隨機雜訊代替幅值得到B,B圖類比於經過調製的圖片;根據原始圖片幅值衰減情況,預估一個負的e指數函數,作為包絡函數,對B圖進行修正得到C;根據原始圖片幅值衰減情況,預估一個平均的e指數函數,作為包絡函數,對C圖進行修正得到D;取A中128*128像素大小的滾動窗口進行參考幅值預估,分塊對D圖進行修正得到E圖。利用上述的思路將幅值進行修正後,可以看到照片的襯度有了明顯提升。因此,作者希望能將這種方法應用到電鏡密度圖上。

圖1.二維圖片B因子修正示意

電鏡結構具有一個我們常見的二維照片不具備的特點,即解析度各處並不一致。所以在文章中,作者認為對於全頻域進行旋轉平均再比較的方法並不能代表各位置真實的幅值差異,而應該將密度圖分成若干塊,將單個分塊的振幅平均與原子模型的振幅平均作對比,k值用來修正幅值。

演算法確定之後,文章中利用了四個已發表的結構,採用了四種後處理方法,對比不同後處理方法的優劣,分別為全局B因子,局部B因子,散射強度修正,和前文提到的LOCSCALE修正,我們從圖中可以看出,經過四種修正演算法處理之後,相比於原始模型,側鏈的解析度都有了很大的提升(圖2),而後兩種後處理方法還能有效降低模型周邊的雜訊水平,但是第三種方法對低頻信號有調製,從側鏈結構重構結果對比來看,最好的還是LOCSCALE演算法。文章作者隨後用LOCSCALE演算法對TRPV1進行後處理的結果(圖3)也呈現了更清晰的二級結構,氨基酸殘基側鏈都清晰可見。

圖2.利用LocScale對Pol III進行後處理之後,解析度有所提升。

圖3.四種後處理方法對EMD-5778(TRPV1)密度圖處理效果比較(Global B-factor處理後,密度圖邊緣呈現出碎裂的視覺效果,而local B-factor與Unsharp Masking方法處理得到的密度圖與LocScale相比低頻信號有所抑制,LocScale處理結果側鏈更加清晰)

那麼,這種後處理方法帶來的細節是否可信呢?Model bias是圖像恢復中需要嚴肅對待的問題。但是在後處理中這個問題並不明顯,因為圖像的相位已經確定,需要調製的只有振幅。文章的作者們依舊對這個問題進行了探究,他們將TRPV1的430-449號氨基酸(組成一個跨膜螺旋)中的436替換為丙氨酸(圖4),計算原子模型後進行修正,發現在經過後處理後的密度圖中這一氨基酸的定位結構沒有出現計算偏差。

圖4.TRPV1的430-439跨膜殘基。將殘基突變後,密度圖處理結果沒有偏差。

接著他們對440號氨基酸進行了同樣的操作,將其替換為色氨酸,進行後處理後,依舊沒有發現偏差,從而證明了這一對振幅進行調整的方法不會產生Model bias。

除了上文提到的優勢,文章作者認為這一演算法的最大用處即在於建模,即由原子模型和電鏡密度圖得到後處理後的密度圖後,因為得到了更精細的密度圖,可以搭建出更好的模型,利用更精細的原子模型進行實空間精修模型,可以達到最佳效果,而這一過程可以重複幾次以進行反覆修正(圖5)。

圖5.根據原子坐標模型迭代完成B因子修正流程示意圖

綜上所述,LOCSCALE作為一種基於電鏡密度圖和原子模型的後處理軟體,可以發揮比B因子後處理更好的效果,對於高解析度結構的詮釋十分有用。

參考文獻:

(1) Jakobi et al. 2017. Model-based local density sharpening of cryo-EM maps eLife. 2017; 6: e27131.001

(2) Rosenthal PB, Henderson R. 2003. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. Journal of MolecularBiology, 333: 721–745.

(3) Afonine PV, Moriarty NW, Mustyakimov M, Sobolev OV, Terwilliger TC,Turk D, Urzhumtsev A, Adams PD. 2015. FEM: feature-enhanced map. Acta Crystallographica.Section D, Biological Crystallography 71: 646–666.

(4) Bai XC, Yan C, YangG, Lu P, Ma D, Sun L, Zhou R, Scheres SHW, Shi Y. 2015. An atomic structure ofhuman gsecretase. Nature. 525: 212–21

(5) Zhao J, Benlekbir S, Rubinstein JL. 2015. Electroncryomicroscopy observation of rotational states in a eukaryotic V-ATPase. Nature. 521: 241–245.

======作者小檔案======

牛彤欣工程師,2017年畢業於中國科學院生物物理研究所孫飛課題組,現在生物物理所生物成像中心擔任圖像數據處理工程師,研究方向為數據採集與存儲系統管理、高性能計算機集群系統管理、電子顯微鏡圖像處理。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 生物成像中心 的精彩文章:

冷凍光電關聯:讓原位微觀生命過程可視化

TAG:生物成像中心 |