當前位置:
首頁 > 最新 > 腫瘤癌症研究之DNA測序高級分析

腫瘤癌症研究之DNA測序高級分析

在使用全基因組或全外顯子組測序進行癌症學研究時,首先通常會選擇配對的癌症組織和正常組織來尋找體細胞突變,但這只是研究的第一步。本文總結了在癌症研究中,得到體細胞結果後可以進行哪些後續研究。

1 體細胞突變概況描述

體細胞突變分析完成後,會得到SNV和InDel的體細胞突變位點結果,以及多項統計表格,例如位於不同功能區域的位點比例、不同基因發生的頻率、轉換/顛換髮生的比例等。將這些統計數據可視化,對測序得到的結果做出整體描述,是結果討論中不可或缺的部分。

圖1.體細胞突變頻率和突變頻譜。引自Hodiset al. (2012)

圖1是2012年發表在Cell雜誌的一篇關於黑色素瘤的文章中用於描述體細胞突變結果的插圖。圖1分為三部分,最上面的柱狀圖表示了不同患者體細胞突變頻率(每Mb中體細胞突變的數量),並用綠色和藍色表示了同義突變和非同義突變的比例。中間較大的圖表示了不同基因在不同患者中的突變情況,紅色、黃色、藍色豎線分別表示熱點突變(重要突變),錯義突變或非移碼突變(影響較輕),無義突變、移碼突變或選擇性剪切(影響較重)。黑色實現下方的是發生了拷貝數變異的基因(本文展示的是SNP 6.0基因晶元得到的結果,也可使用測序數據進行計算,見下文),分為拷貝數增加或減少兩類。圖1中展示的基因是根據研究需要來進行選擇的,依據有:突變頻率高的基因、容易發生無義突變的基因、資料庫中有相關記錄的基因等。最下方的圖將突變分為了不同的突變類型,在本文中,由紫外線輻射導致的C>T突變佔據了突變類型的絕大部分。另外,圖裡還提供了每位患者的疾病表型(標題為Origin的一行,分為不同的發病位置)。總之,圖1將研究中的重要數據進行了可視化,使結果一目了然。

2 驅動基因檢測和預測

每一類癌症均會產生大量體細胞突變,而僅有少數基因突變直接促進了癌症的發生和發展,這樣的基因稱為驅動基因(driver genes)。在癌症研究中,尋找驅動基因是一項重要的研究目標。找到這些基因突變,可以幫助我們認識癌症發生的機制,並以此對癌症進行分類和制定相應的治療方案。DriverDB資料庫針對不同種類癌症,列舉了目前已知的驅動基因。使用全基因組重測序或全外顯子測序,可以從體細胞突變數據中將這些驅動基因發生的功能性突變尋找出來。

除已有驅動基因的檢測外,還可以使用測序數據進行新驅動基因的預測。MutSig軟體是一款可靠的驅動基因預測軟體,它的原理是判斷以下特徵是否存在:首先,在由於異質性導致的隨機性體細胞突變的背景中,驅動基因具有相對較高的突變頻率;其次,驅動基因傾向於發生更多的體細胞突變;最後,驅動基因具有更多發生在保守性位點的突變。MutSig分別檢測每種特徵的顯著性,並將它們合併,使用多重假設檢驗篩選出最終的預測結果。目前最新的版本為MutSigCV。

圖2.MutSig軟體原理示意圖

InVEx軟體(Introns VS Exons)也是一款檢測驅動基因的軟體。由於驅動基因外顯子部分的功能性突變在癌症中的重要性,這些突變在癌細胞群體中將受到正選擇(Positive selection),使得這些突變的速率高於平均突變速率,而平均突變速率可由非編碼區來反映(圖3A)。根據這個原理,對於每個基因的外顯子、內含子、UTR區域,對突變進行隨機置換,構建零假設模型。如真實突變顯著偏離零假設,則認為該基因可能為驅動基因(圖3B)。最後,對所有基因的顯著性結果繪製Q-Q plot,其中虛線部分為q ≤ 0.2的基因,灰色區域為p期望值的95%置信區間(圖3C)。

?

圖3.InVEx軟體原理示意圖。引自Hodiset al. (2012)

3 突變頻譜分析

突變頻譜(Mutational signature)分析將突變根據上下文分為了96類,根據突變類型的頻率可檢測到此種癌症的突變頻譜,以揭示導致癌症體細胞突變可能的成因。例如,對於C>A的突變(不考慮在哪一條鏈,因此也包括了G>T),C的上游和下游均有4種可能,排列組合後將有16種可能。除C>A外,還有C>G、C>T、T>A、T>C、T>G一共6種可能性。因此,突變頻譜統計了16×6共96種上下文的可能性,對於每一種均統計了發生的頻率。隨後,使用相關軟體可提取出數據中存在哪些突變頻譜。COSMIC(Catalogue of somatic mutations in cancer)網站總結了常見的突變頻譜(見http://cancer.sanger.ac.uk/cosmic/signatures),並給出了具體的原因和解釋。例如,圖4中Signature1幾乎在所有癌症中均存在,與自發的5-甲基胞嘧啶的脫氨基作用有關。

圖4.Mutational Signature其中的一種「Signature 1」

突變類型也可直接對應到個體的突變情況和對藥物的反應上。Rizvi(2015)等人在對34例非小細胞肺癌患者的研究中,將體細胞突變區分為兩類:高顛換(transversion-high,TH)和低顛換(transversion-low,TL)。根據TCGA資料庫記錄,TH與吸煙史密切相關,而TL通常無吸煙史。研究比較了TH和TL兩類患者的體細胞突變數量和類型,以及對藥物的反應,發現TH(紫色)類型的患者大多有較高的總突變數量,並且接受anti–PD-1免疫療法後效果最好(圖5)。這表明,在全外顯子測序研究中對突變類型進行分析,可以尋找與治療方案之間的相關性。

圖5.突變數量與藥物反應和突變類型的關係。引自Rizvi(2015)

4 癌症克隆進化分析

癌症的克隆進化(clonal evolution)近期已成為一個研究的熱點方向。由於腫瘤具有時空異質性,腫瘤細胞可形成具有遺傳差異的克隆群。在這種情況下,施加靶向藥物無法同時殺死所有的克隆,某些含有耐藥性突變的克隆群將在藥物的選擇壓力下獲得競爭優勢,而逐漸成為疾病複發後主要的克隆群。為了更加細緻地了解腫瘤的「微環境」,我們可以對癌症治療的不同時期(時間尺度)或對不同的轉移灶(空間尺度)進行取樣測序,檢測體細胞突變,根據突變的位置和頻率進行聚類和進化分析。由於腫瘤細胞的異質性,理想情況下應對腫瘤細胞群體進行單個細胞取樣,進行單細胞測序,但由於技術和成本限制,目前的研究多局限在對腫瘤組織樣本或血液的cfDNA進行測序。

PyClone軟體通過使用體細胞突變頻率、拷貝數變異和測序深度數據,通過Bayesian聚類方法將癌症克隆區分出來。Muhammed(2015)等人對一位轉移性乳腺癌患者進行了腫瘤多病灶的進化研究(圖6),樣本包含了轉移組織和血漿。結果表明,通過血漿樣本可以明顯地區分出各個不同的轉移組織,並能夠計算各個克隆在所有癌症細胞中的佔比。研究結果表明,ctDNA可通過使用PyClone來獲得亞克隆的信息,並可通過連續取樣檢測亞克隆頻率的動態變化來觀察癌症進展和耐藥性反應。

圖6.PyClone得出的8個cluster和佔比。引自Muhammed(2015)

對於治療前後的癌症組織進行測序研究,可推測哪些克隆發生了耐藥性突變。Li(2012)等使用全基因組重測序研究了治療前和複發後的急性髓細胞白血病患者的骨髓細胞,通過克隆進化分析區分出了治療前後共有的和特有的克隆,繪製出克隆群在抗腫瘤藥物的壓力選擇下發生的進化(圖7)。在圖7中,灰色的cluster1為建群克隆(Founding cluster),是癌症最初期發生的克隆,其它克隆都是基於cluster1演化而來的。在經過藥物治療後,有的克隆消失(cluster 2),有的則存活到了複發期(cluster 3, 4)並獲得了較高的佔比,並進化出新的克隆(cluster 5)。這表明了急性髓細胞白血病的複發與克隆進化和新突變出現密切相關,凸顯了克隆進化分析在耐藥性和癌症複發相關研究和應用中的重要性。

圖7.治療前和複發後克隆群的進化。引自Li(2012)

5 體細胞CNV和LOH分析

拷貝數變異(Copy Number Variation,CNV)指基因組上序列片段重複數在不同個體之間的差異,是一種發生在染色體結構變異(structural variation)尺度的重複或缺失。雜合性缺失(Loss of Heterozygosity,LOH)也是一種染色體缺失的形式,指一條染色體區段丟失導致多態性等位基因變為單態。已有大量研究表明CNV和LOH可能導致癌症,而且在腫瘤細胞中極易發生,使CNV和LOH已成為研究熱點。在檢測上,較為傳統的方法為原位熒光雜交(FISH)和比較基因組雜交(CGH),但這兩種方法解析度有限,只能檢測到大片段的變異。目前,CNV和LOH檢測的金標準是高密度基因晶元(如Affymetrix SNP6.0或CytoScan晶元)。使用基於測序的檢測方法目前仍存在一些缺陷。例如,捕獲和擴增的偏好性將會為測序深度的估計帶來影響,基因組的GC-bias也會通過mapping過程給基因的覆蓋度帶來影響,而基因的覆蓋度是計算CNV的主要依據。隨著全基因組重測序的廣泛應用,以及演算法的不斷改進,可以預期使用NGS技術對CNV和LOH的估計將更加準確。

Control-FREEC軟體可以使用全基因組深度重測序或全外顯子測序數據進行LOH和體細胞CNV的估計。該軟體通過計算並均一化segments(發生CNV的染色體區段)的拷貝數和B等位基因頻率(beta allele frequency,BAF)來估計CNV和LOH。對於體細胞CNV的估計,需要提供腫瘤樣本和正常對照樣本。結果如圖8所示,左圖為CNV的結果,綠色基線為拷貝數等於2,標為紅色的區域為拷貝數增加的區域,藍色的為減少的區域;右圖為LOH的結果,藍色相對於橙色為發生LOH的區域。

圖8.Control-FREEC軟體得出的CNV(左)和LOH(右)區段

參考文獻

Hodis E, Watson I R, Kryukov G V, et al. A landscape of driver mutations in melanoma.[J]. Cell, 2012, 150(2):251-63.

Rizvi N A, Hellmann M D, Snyder A, et al. Mutational landscape determines sensitivity to PD-1 blockade in non–small cell lung cancer[J]. Science, 2015, 348(6230):124-8.

Murtaza M, Dawson S J, Pogrebniak K, et al. Multifocal clonal evolution characterized using circulating tumour DNA in a case of metastatic breast cancer[J]. Nature Communications, 2015, 6.

Ding L, Ley T J, Larson D E, et al. Clonal evolution in relapsed acute myeloid leukaemia revealed by whole-genome sequencing.[J]. Nature, 2012, 481(7382):506-10.


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 腫瘤 的精彩文章:

非特異性腫瘤怎樣鑒別?看看這個顱腦腫瘤患者確診
類器官技術助力腫瘤精準治療

TAG:腫瘤 |