當前位置:
首頁 > 最新 > 新技術結合多組學,初邁基因組完成圖新時代

新技術結合多組學,初邁基因組完成圖新時代

真核基因組比較複雜,擁有很多重複序列,因此真核生物的基因組de novo組裝一直是科研難點,用以往的測序手段幾乎不可能得到完整的基因組圖譜,NCBI資料庫中擁有完整基因組的物種不到1%。但三代長讀長測序技術的加入,將不可能變成了可能。

在本周發表在Nucleic Acids Research上的一篇文獻中,研究者將Oxford Nanopore Technology(ONT)、PacBio技術和Illumina數據結合,完成了釀酒酵母Saccharomyces cerevisiaeCEN.PK113-7D的完整基因組組裝,並用Nanopore的direct RNA測序技術完成了酵母的全長比較轉錄組分析。

--?-?--內容精鍊--?-?--

基因組組裝及比較基因組學

1. 基因組完成圖組裝

短讀長測序在染色體末端靠近端粒處基因組圖譜構建中存在明顯劣勢(Fig.1e),且缺失了線粒體基因組和Ⅻ染色體中部區域,而三代長讀長測序卻可以準確測出擁有大量重複序列的線粒體基因組和Ⅻ染色體中部區域,表現為更顯著的測序深度(Fig.1d)。

Fig.1 The completeCEN.PK113-7D genome obtained fromde novoassembly and its comparisons

2. 全基因組表觀修飾

在CDS上游的DNA甲基化被認為與轉錄調節相關,本研究利用PacBio測序鑒定出了數千個4mC和6mA修飾,其中359個4mC位點和297個6mA位點位於CDS上游,可能調節這些CDS的轉錄;同時,S. cerevisiae曾被認為不含5mC,但在本研究中,利用ONT技術鑒定出40個5mC修飾(Fig.1c),這些位點均不在CDS上游區域,暗示著可能行使其它功能。

3. 比較基因組學研究

通過比較S.cerevisiaeCEN.PK113-7D基因組與已發表的S.cerevisiaeS228C基因組,發現二者有高度的一致性,共有5969個ORF(Fig.1f)。並且使用LAST軟體比對這兩個基因組,發現了555個染色體重排事件,其中>1kb的區段有35個(Fig.1b)。

Fig.2Results obtained from chromosomal rearrangement analysis

between CEN.PK113-7Dand S288C for synteny in panel (A) and translocation in panel (B).

此外,通過三代的長讀長測序優勢,研究者還分析了32個含有ORF的變異區段並發現其中有12個位於IV、VIII、IX和Ⅻ染色體上的共線性現象及VII染色體上的兩個易位變異(Fig.2A)。此外,研究者還發現了9條染色體上的19個易位事件(Fig.2B)。

比較轉錄組

釀酒酵母在以葡萄糖為碳源的條件下生長會經歷兩個階段(以葡萄糖為碳源的無氧呼吸和葡萄糖耗盡後以乙醇為碳源的有氧呼吸階段)。在這兩個階段之間酵母細胞會對自身基因表達進行調整,以適應新的環境。

研究者用direct RNA測序技術對S. cerevisiaeCEN.PK113-7D生長的這兩個階段進行比較轉錄組測序分析。

1.基因表達量分析

ONT direct RNA測序在以葡萄糖為碳源的生長階段共獲得~509Mb數據,包含~530,000條高質量reads,N50值為1,150 bases;在以乙醇為碳源的生長階段共獲得~623Mb數據,~623,000條高質量reads,N50值為1,263 bases。直接RNA測序得到的兩個生長階段的序列長度與基因組注釋的結果一致(Fig.3A)。通過ONT direct RNA測序技術得到的轉錄本中有超過70%的轉錄本為全長轉錄本(Fig.3C)。

Fig. 3 Summary of thedirect RNA sequencing data

在S.cerevisiae CEN.PK113-7D的兩個生長階段中,有22個轉錄本擁有超過5000條reads,並且Fig.3B展示了不同代謝途徑中,幾個關鍵酶基因的差異性表達。Gene ontology分析(Fig.4)也反映了在這兩個代謝過程中營養方式的改變導致的一系列基因表達的差異。

Fig.4 Heatmap illustration of the directionalenrichment

score of gene-set enrichment analysis of geneontology

2.轉錄本結構分析

傳統的RNA-Seq技術中反轉錄、PCR擴增、短讀長測序都會引入測序偏好性,讓測序數據不能均勻覆蓋整個轉錄本,造成對結果的誤讀和漏讀。研究者通過ONT長讀長測序技術發現在VIII染色體上的兩個基因轉錄時聚合酶II越過了第一個ORF末端,繼續轉錄直到第二個基因終止(Fig.5)。通過將ONT數據(Fig.5上圖)和Illumina數據(Fig.5下圖)進行比較分析,可見ONT的長讀長可以清晰地將這一現象反映出來,而Illumina短讀長則不能完全覆蓋這一區域。

研究者在轉錄組數據中還發現了一些高度可信的非編碼外顯子ORF,例如rRNA、lncRNA及反義RNA等,為更深入的轉錄組學研究提供基礎。

Fig.5The presence of dual transcribed of THI1 and ERG9.i)shows the transcript structure, ii) indicates depth coverage, iii) details the mappedlong reads of direct RNA sequence data.

基於Oxford Nanopore和PacBio的三代長讀長測序技術的發展及應用預示著「基因組草圖時代」將過渡到「基因組完成圖時代」,為比較基因組學研究奠定了堅實的基礎。作為世界領先的三代基因組測序中心,未來組通過增加產能、優化流程、持續擴大前期積累的三代測序優勢;目前已配備有11台GridION X5和2台MinION測序儀,並於2018年1月17日率先通過Oxford Nanopore Technologies Limited(牛津納米孔技術有限公司,ONT)官方認證,獲得Nanopore DNA測序認證服務供應商資質。後續會購入通量更高的PromethION測序儀,致力於為合作夥伴提供高質量、超快捷的基因組學研究測序服務。

參考文獻:Jenjaroenpun P, Wongsurawat T, Pereira R, et al. Complete genomic andtranscriptional landscape analysis using third-generation sequencing: a casestudy ofSaccharomyces cerevisiaeCEN. PK113-7D[J].Nucleic Acids Research, 2018:1-15.

研究內容博大精深,更多詳情請參見文獻原文

圖片來源於網路|侵刪

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Nextomics 的精彩文章:

2018 PAG饕餮盛宴,你準備好了嗎?

TAG:Nextomics |