當前位置:
首頁 > 最新 > 如何利用iso-seq研究無參物種?

如何利用iso-seq研究無參物種?

基於三代長讀長測序技術的全長轉錄組(Iso-Seq),可以直接獲取全長的轉錄本,對於有參考基因組的物種可以幫助完善基因序列和注釋信息;而對於無參考基因組的物種,用處更大:

1.可以獲得比使用二代短讀長序列拼接得到的參考轉錄本更完整準確的參考轉錄組,因此可以在不夠經費進行全基因組de novo測序的情況下用作參考基因組;

2.得到的是全長轉錄本,不需要再利用RACE技術PCR出全長轉錄本;

3.可以分析可變剪切、lncRNA預測等二代無參RNA-seq無法分析的內容。

因此,Iso-Seq技術在沒有參考基因組的物種的研究中有著非常重要的作用。

我國藥用植物資源非常豐富,然而已經完成基因組denovo測序的物種還非常少,絕大部分的藥用植物還是沒有參考基因組序列信息的。另一方面,全基因組denovo測序需要的金錢成本和時間成本都很高,一般的實驗室承受不起。

因此,利用Iso-Seq技術獲取全長轉錄組,研究藥用活性成分合成通路相關基因的序列結構與表達信息,是一種經濟有效的方法。

下面我們通過一篇文章來看看如何利用Iso-Seq研究藥用植物活性成分合成通路相關基因。

文章題目:黃芪全長轉錄組揭示活性成分生物合成相關基因的序列變異

發表雜誌:CellDiscovery

影響因子:2015年出版的新期刊,是cellresearch的子刊,目前還沒有影響因子,但預計在4-6分左右。

黃芪是一種廣泛用於心血管疾病、2型糖尿病、腎炎和腫瘤治療的中藥,具有免疫調節、抗高血糖、抗炎症、抗病毒等的功效。其主要活性成分為黃芪皂苷(Astragalosides, AST), 毛蕊異黃酮(Calycosin)和毛蕊異黃酮-7-O-β-D-葡萄糖苷(Calycosin-7-O-β-D-glucoside, CG)。因此,研究這三種活性成分生物合成通路上的相關基因,有利於闡明相關機理及以後的應用開發。

研究結果

文章分別構建了葉和根的全長轉錄組,利用iso-seq pipeline分別得到了75816和73755條高質量一致性序列。

然後利用已有的Illumina短序列對得到的高質量一致性序列進行糾錯,並用Cogent軟體組裝參考編碼序列,最後分別得到了27 975和22 343條全長參考序列(full-length unique transcript model, UniTransModel)(圖1a,c)。這裡UniTransModel的概念就相當於基因(gene)吧。

圖1. 分析流程

文章還將三代與二代數據進行比較,所用的二代數據是之前使用454平台和Illumina平台測序並已發表文章的數據。比較結果如下:

1. 轉錄本長度:iso-seq得到的轉錄本的長度是二代測序平台(454和Illumina)的兩倍(圖2a);

2. ORF覆蓋度:Iso-seq得到的轉錄本包含全長ORF(覆蓋了100%的UniProtKB資料庫里的蛋白序列)或接近全長ORF(覆蓋了大於80%的UniProtKB資料庫里的蛋白序列)的比例要更高(圖2b)。

圖2. 三代與二代轉錄本的比較

這些結果說明iso-seq能夠得到更完整的全長轉錄本,對於後續的基因結構分析非常有用。

葉和根UniTransModel的比較

1. 組織特異性UniTransModel:約有一半的UniTransModel是組織特有的(圖3)

圖3. 葉和根共有與特有的UniTransModel

2. GO, Pathway功能注釋:葉和根的GO,Pathway功能注釋與富集分析的結果相似,說明兩個組織代謝通路層面上的轉錄組整體來說是保守的,儘管具體不同基因的表達可能會不一樣。

可變剪切檢測

在葉和根里,分別有36.53%和34.46%的UniTransModel含有兩個以上的isoform(圖4a),分別檢測出6494個和4399個可變剪切事件,說明了黃芪葉和根轉錄組的複雜性。其中,內含子保留這種類型的可變剪切事件最多(圖4b)。

圖4. 可變剪切檢測

將Illumina短序列比對到UniTransModel上,結果顯示,比對上的位置、剪切位點和剪切位點支持的reads數都很好地證實了三代測序檢測可變剪切的能力(圖5)。

另外,還檢測到了同樣的UniTransModel在葉和根組織中具有不同的可變剪切形式,如下圖展示的是同一個基因在葉和根組織中具有不同的isoform數目和可變剪切位點。在葉中有4個isoform和8個剪切位點;在根中有5個isoform和5個剪切位點。這些結果暗示了黃芪不同的組織具有不同的特異性功能。

圖5. 可變剪切圖例。

紅色的為Illuminareads比對情況和覆蓋度,紅色曲線上的數字代表支持的reads數。

活性成分合成相關基因的分析

利用NCBI上與AST, Calycosin和CG生物合成相關的32個基因比對到UniTransModel上,分別在葉和根中鑒定出14條和13條UniTransModel對應17個AST合成相關基因。通過比較發現,與NCBI中的mRNA序列相比,Iso-seq得到的全長轉錄本更長,覆蓋度更高(>95%)。一些基因在兩個組織中具有不同的isoform,如AmMVD基因在葉和根組織中具有不同的組織特異性isoform(圖6)。

圖6. AmMVD基因在葉和根組織中的isoform

文章總結

1.本文利用三代測序技術,獲得了黃芪葉和根組織的全長轉錄組,並且通過與二代測序結果對比,證明三代測序能夠獲取更長更完整的全長轉錄本;

2.通過構建編碼參考序列,能夠進行可變剪切的分析,發現約36%的基因含有兩個以上的isoform,並且葉和根組織同一基因具有不同形式的可變剪切isoform;

3.對活性成分相關基因進行分析,得到了更長、覆蓋度更高的轉錄本,並且發現一些基因在兩個組織中具有不同的isoform。但文中沒有對這些不同isoform進行組織間的表達量差異分析,如果利用二代數據進行表達量的分析,從而進行功能機制的討論,那麼文章的水平就會更高了,也會發更高分的雜誌。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 基迪奧生物 的精彩文章:

全長轉錄組應用系列(三):融合基因檢測

TAG:基迪奧生物 |