當前位置:
首頁 > 最新 > 老師,我想學多組學整合

老師,我想學多組學整合

實現多組學整合一直是從事組學數據研究旁友(嗯也就是我)心中的夢想。

一方面,從夢幻的層面來說基因組、轉錄組、蛋白組和代謝組的整合,可以多層次解釋你的數據,為全面了解生物系統和機制提供幫助;另一方面,從現實的層面來說,可以讓你的文章逼格飆升,影響因子竄一檔。

我不知道大家組裡會不會有一些入組必讀、行業標杆,反正在我們組有三篇文章被立為金剛標杆。它們都是CPTAC(Clinical Proteomic Tumor Analysis Consortium)出的文章,一篇是結直腸癌(Nature,2014),一篇是乳腺癌(Nature, 2016),還有一篇是卵巢癌(Cell,2016),主要做的東西是蛋白組數據輔助腫瘤分型,從而更好地為不同亞型病人精準醫療。

我們親切地稱它們為「結直腸癌那篇」、「乳腺癌那篇」和「卵巢癌那篇」。

那麼為什麼這三篇文章能發這麼高呢?除了大佬加持,樣本量大,數據質量可靠,癌症分型的必要性等我也數不過來的優勢外……文章的有一部分的亮點還在於他們將病人的轉錄組和基因組的數據(病人都是TCGA中的樣本)都用作蛋白數據分析的輔助,大大提高了整篇文章的豐富性!

針對其中組學糾纏的例子我進行了下整理,有興趣的可以自己看文章哈:

基因組+轉錄組:CNA(copy number alterations,拷貝數變異)與mRNA丰度的相關性(結、乳);

基因組+蛋白組:CNA與蛋白丰度的相關性(三篇);CIN(染色體不穩定性)與蛋白丰度的關係(卵);

轉錄組+蛋白組:mRNA與蛋白丰度的相關性(結,卵);

非糾纏部分主要還是蛋白組的分析,包括蛋白質的定量、聚類和亞型分類、磷酸化組等研究。

組學整合方面約佔所有篇幅的1/3不到一點,相當於基本旋律是唱蛋白組的歌,還有幾小段基因組和轉錄組的和聲。

最近,國家蛋白質組研究中心出了一篇胃癌的蛋白組分析文章,發了Nature Communication。主要走的也是CPTAC的套路,但是因為數據有所差別(沒有mRNA數據,有外顯子測序數據,並且有癌與癌旁的對照加持),所以故事也會有一點不太一樣。但是仔細看一下,多組學整合的方面也一樣做了很多,比如基因突變與蛋白表達量的相關性。

以上主要是蛋白組方面的例子。另外還有比如有人結合基因組、轉錄組數據來尋找新基因的,有結合代謝組、轉錄組數據來發現基因功能的等等,豐富多彩。

其實不難發現,多組學整合主要有兩方面:一個是用其他組學的數據來驗證你所做組學的結果(比如用轉錄組驗證新基因的存在),另一個是觀察多組學間的相互關係(比如基因的突變對蛋白丰度的影響),目的性的不一樣也決定了你的使用方法。

然後就是,多組學整合要求研究者對於各個組學的數據的性質和特點都有所了解,想一想鐵人三項。

最後希望每個做組學的旁友都擁有一雙多組學整合的翅膀,感恩。

文中提及的參考文章如下:

結直腸癌那篇:Zhang B, Wang J, Wang X, et al. Proteogenomic characterization of human colon and rectal cancer[J]. Nature, 2014, 513(7518): 382.

乳腺癌那篇:Mertins P, Mani D R, Ruggles K V, et al. Proteogenomics connects somatic mutations to signalling in breast cancer[J]. Nature, 2016, 534(7605): 55.

卵巢癌那篇:Zhang H, Liu T, Zhang Z, et al. Integrated proteogenomic characterization of human high-grade serous ovarian cancer[J]. Cell, 2016, 166(3): 755-765.

國家蛋白質組研究中心:Ge S, Xia X, Ding C, et al. A proteomic landscape of diffuse-type gastric cancer[J]. Nature communications, 2018, 9(1): 1012.


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 生信人 的精彩文章:

66個水稻泛基因組文獻分享
「零基礎」學習單細胞轉錄組測序

TAG:生信人 |