科學家完成模式硅藻的蛋白質組精細圖譜
硅藻是一類重要的單細胞光合真核生物,分布廣泛,提供了地球上約20%的初級生產力,對整個地球生物圈意義重大。三角褐指藻(Phaeodactylum tricornutum)是海洋硅藻的模式生物,其基因組序列於2008年公布,但目前基因組的注釋仍很不完善。蛋白基因組學(Proteogenomics)是利用蛋白質組學數據,尤其是高精度的串聯質譜數據,結合基因組和轉錄組數據對基因組進行深度注釋。中國科學院水生生物研究所研究員葛峰學科組前期採用蛋白基因組學的研究策略和方法,完成了模式藍細菌的基因組深度解析 (PNAS,2014,111(52):E5633-E5642)並開發了針對原核生物的蛋白基因組學專業分析軟體GAPP(Molecular & Cellular Proteomics.2016;15(11):3529-3539)。在這些工作的基礎上,葛峰學科組對三角褐指藻的基因組進行了深度解析並構建了蛋白質組精細圖譜。
該學科組通過整合基因組、轉錄組、ESTs序列等多組學數據,並對資料庫進行了縮減,得到去冗餘的三角褐指藻蛋白基因組學資料庫;通過整合基於蛋白和肽段的樣品預分離、雙酶切和高分辨質譜分析技術,獲得高質量的質譜數據;質譜數據的鑒定整合了多種搜索引擎的結果,提高了蛋白鑒定的深度與覆蓋度;並採用更為嚴格的肽段假陽性控制策略,從而提高鑒定結果的可信度;通過開發新的演算法,實現了真核生物中新的可變剪切體的發現與點突變基因的鑒定。該研究精準鑒定到6628個已注釋的編碼基因;對未鑒定到的已注釋基因的深入分析發現,有1895個基因可能並不編碼蛋白;發現了606個新的蛋白編碼基因並校正了506個已注釋的編碼基因,其中有56個新發現的蛋白編碼基因,在之前的研究中被錯誤預測為長鏈非編碼RNA(LncRNA);鑒定到268個可能具有重要功能的微小短肽(micropeptides),21個新的可變剪切體,並修正了73個已注釋基因的可變剪切位點以及58個發生氨基酸突變的基因;通過將開放式與限定式檢索相結合的策略,對三角褐指藻中的翻譯後修飾進行系統鑒定,發現了20多種不同種類的蛋白質翻譯後修飾,這些修飾可能參與調控細胞內眾多的生物學過程並在細胞的逆境適應中起著重要作用。通過以上工作的完成,實現了三角褐指藻基因組的深度注釋,並構建了蛋白質組精細圖譜。
在以上工作的基礎上,該研究還建立了完整的構建真核模式生物的蛋白質組精細圖譜的實驗技術和分析流程,可適用於各種已經測序的真核生物,成為解讀真核生物基因組及其功能分析的重要工具。研究成果「Genome annotation of a model diatom Phaeodactylum tricornutum using an integrated proteogenomic pipeline」在線發表於Molecular Plant。第一作者是高級實驗師楊明坤,通訊作者是葛峰,該研究得到國家重點研發計劃(2016YFA0501304)的資助。
蛋白基因組學方法構建模式硅藻的蛋白質組精細圖譜
來源:中國科學院水生生物研究所


※「黑暗」or「光明」,兩種生活隨意切換
※功能與壽命可調控農膜研究取得進展
TAG:中科院之聲 |