當前位置:
首頁 > 最新 > 琴葉擬南芥基因組

琴葉擬南芥基因組

180+篇植物基因組文章解讀大全

第二章 十字花科

地表最強植物基因組文獻解讀,正在繼續。科技君和小夥伴們特地對植物基因組領域已發的180多篇高質量文章進行收集、解讀和歸類,經歸納整理後共分十章,前九章為相關領域已發表物種文獻解讀,最後一章為植物基因組未來發展趨勢及預測。

十字花科往期回顧

導讀

在此之前,180+篇植物基因組文獻解讀就曾推送過擬南芥基因組文章。今天,科技君要跟大家來說說它的「兄弟」,一千萬年前從原始8倍體擬南芥分化出來的琴葉擬南芥

在擬南芥的進化歷史中,由於早期擬南芥雜交派生出了新的進化品種——琴葉擬南芥(Aly)。該品種的基因組更接近古早擬南芥物種,但是遠大於當代擬南芥(Ath)基因組,且屬於自交不親和多年生植物。Aly的基因組與Ath基因組的巨大差異對於擬南芥基因組在常規進化過程中序列大量丟失、形成Ath種的演變歷史具有很強的指導意義。因此,該文章重點研究了這兩種擬南芥基因組在結構和功能上的差異,以及兩種擬南芥在進化過程中發生差異進化的原因,希望以此來揭開簡裝上陣的Ath基因組的神秘面紗。

文獻題目:The Arabidopsis lyrata genome sequence and the basis of rapid genome size change

發表期刊:Nature Genetics

發表時間:2011年4月11日

影響因子:27.959

摘要介紹:本文的數據是通過雙脫氧法測序所得的,數據深度為8.3x,最終組裝出來206.7Mb的北美琴葉擬南芥(Aly)基因組。它的基因組更接近早期擬南芥的基因組序列大小。通過分析雜交種琴葉擬南芥基因組含有32,670個基因,遠多於自交種Ath基因組約27,025個基因。且分化事件分析發現,琴葉擬南芥是在約1千萬年前從原始8倍體擬南芥中分化出來的,其基因組大小為207Mb。而Ath擬南芥基因組(僅125Mb)則是現代擬南芥家系的主要形態。

本文通過將Ath和Aly基因組序列進行比較,發現了Ath中大規模DNA序列遺失的情況,引起了研究者廣泛的關注。其中,Aly和Ath基因組的主要差異是成千上萬的小片段缺失,大部分缺失產生在DNA非編碼區和轉錄子。且隨著時間的推移,Ath基因組的序列缺失和插入仍在持續中,而這種現象是環境對小片段序列選擇的最終結果。Aly作為一個古早植物,對同種的擬南芥進化有極大的指導價值。

研究亮點:

1. 組裝了高質量的琴葉擬南芥基因組;

2. 導致自交Ath和雜交Aly基因組巨大差異的原因;

3. 使用Aly基因組與Ath擬南芥基因組,以及外群基因組,進行分化時間以及重組,倍增事件的研究,揭露超短時間周期,Ath輕裝上陣的原因。

研究意義:還原早期擬南芥的特異性基因組序列及染色體分組情況。且作為古早擬南芥的替代物種,Aly具有很重要的研究價值和地位。通過將Ath基因組跟Aly基因組進行比較,不僅知道了導致Ath基因組發生巨大變化的原因,也證明了自然選擇的偏好——偏好保留小基因序列信息。並且,這個特意的進化現象依然在進行中。

研究難點:Aly跟Ath的分化時間很短,且均屬於擬南芥種,但是極短時間內的基因組大範圍的縮減和大規模的重組是一個研究難點。因為古早物種已經消失,且並未有跟古早物種相似的近代物種作為參照,要想研究他們的巨大差異來源,這並不是一個短期就可以做到的事情。

研究方法

研究對象:琴葉擬南芥

所用軟體:

Arachne v.20071016 ---組裝

Megablast, blastp, Genomethreader, TblastX , SHORE/GenomeMapper, F-box PF00646.hmm, ClustalX

2.0 ,MUSCLE,SSEARCH,BLAT --- 比對

ab initio, EuGene, GeneID, SpliceMachine---基因預測

JGI Annotation pipeline,Blast2GO,tblastx ,BlastX ---注釋

MCL,OrthoMCL ---聚類

PAUP* version 4.0b10---建樹

i-ADHoRe---共線性分析

所用數據:

1. 北美琴葉擬南芥(MN47)DNA和RNA;

2. Ath擬南芥polyA+-RNA和小RNA;

3. 楊樹和葡萄的基因信息;

所用資料庫:

Repbase, TIGR Plant Transcript Assemblies database, KEGG, GO, Eukaryotic, nrprot,JCVI/TIGR plant repeat database.

研究結果

1. 基因組組裝與注釋

(1) 基於8.3x雙脫氧測序序列,組裝了206.7Mb的高質量的琴葉擬南芥菌種基因組MN47(琴葉擬南芥為部分近交)。其中,有90%的序列集中在9個最長的scaffolds上,在這其中,8個scaffolds覆蓋了Aly的8條染色體的絕大部分,一個大小為1.9M的scaffold代表其中的一個著絲粒。通過細胞學觀察,預估了著絲粒序列大小約為17.2Mb。

(2) 對Aly進行基因組結構和功能注釋,得到了共32,670個Aly基因的基因集合,這遠大於Ath的27,025個基因的基因集。

2. 合成與重排

(1) Aly以及大多數十字花科植物均擁有8條染色體,而Ath則只有5條染色體,通過序列比對,發現了10個主要重排(包括2個顛倒移位和3個染色體融合),這最終導致Ath僅僅擁有5條染色體。且這兩種的基因組相似性達到80%。通過比對Ath和Aly的4號染色體著絲粒的區域,發現該位置本來應為為Aly著絲粒區域的片段已經缺失,僅在AT2G26570 和 AT2G26580之間殘存了約1.4kb的兩個微衛星重複片段。

(2) 除去染色體數目的差別,兩個基因組90%的部分序列同步。且序列差異顯示,基因驟減的原因可能是大量的小規模重組(

3. 序列內容

(1) 全基因組序列比對顯示Aly基因組的50%(約114Mb)在Ath基因組中缺失,且25%的Ath基因組(約30Mb)在Aly基因組缺失。兩個基因組的序列分布中,差異序列有一半是轉座元件,有1/4是基因間區。這些差異導致的結果是Ath基因組比Aly基因組小約80Mb,但是Ath有更多的基因序列。Aly和Ath基因組差異的原因大部分由於成千上萬的小片段缺失與插入,而缺失的3個染色體只引起了10%的基因組大小差異。

(2) 共線分析表明,Aly基因間區域和內含子比Ath基因組中對應的片段要長很多,但它們的內含子間的差異相對較小。

(3) 大部分Ath基因比Aly要低,但在功能分類差異不大。Ath基因數目少於Aly基因,這一現象在它們與另外兩種雙子葉植物---楊樹與葡萄---的對比也可以看到:Aly與楊樹和葡萄有114個不包含Ath直系同源聚類,有875個獨有的聚類;Ath與楊樹和葡萄有45個不包含琴葉擬南芥的直系同源聚類,以及156個獨有的聚類。

(4) Ath的平均突變速率和中間突變速率分別為3.1百萬年和2.1百萬年,Aly的平均突變速率和中間突變速率分別為1.1百萬年和0.6百萬年。而Ath中LTR反轉錄轉座子的推算半衰期(2百萬年)大於琴葉擬南芥(60萬年)。系統發育分析也顯示特定LTR反轉座子在Aly分支的擴展。

(5) 反義轉座子在兩個物種中分布不同,琴葉擬南芥中有更多的基因附近存在反轉座子, Ath中則相反。這跟早期實驗驗證一致,也即遠離基因的反轉錄座子優先生存,反轉錄座子消除在Ath擬南芥中更加有效率。

4. Ath基因組大小持續縮小的證據

(1) 目前的證據都表明Ath通過基因組內大量小片段缺失,演化出了小基因組。在缺失差異里,缺失的平均長度要長於插入的平均長度。缺失多於插入是因為選擇而不是簡單的變異偏好,這些最終導致Ath基因組遠小於Aly基因組。

(2) Ath基因組中非編碼序列的缺失具有較高的等位基因頻率,而且固定和多態性缺失比插入更常見。

圖1 琴葉擬南芥基因組與Ath擬南芥基因組的比較

(a) 琴葉擬南芥與Ath擬南芥的染色體比對。基因組條均一成等長條狀。只有500kb以上片段被連接。Aly以及大多數十字花科植物擁有8條染色體,遺傳圖譜顯示10個主要重排(包括2個互易易位和3個染色體融合)導致Ath只擁有5條染色體。(b)基因同源劇烈。(c)共線基因的長度分布。1-條塊顯示了單基因置換的頻率。(d)未比對上的序列可以被認為只存在於一個物種中,在另一個則缺失;比對上的位置由星號表示,未比對上的位置由點號表示。 左側的直方圖表示比對不上的總數,中間的餅圖比較了不同基因組中結構區域的分布情況。(e)基因組構成。括弧里的數字是各類因子的數目。

圖2 通過基因組大小和注釋來顯示刪除

Aly信息在上Ath信息在下。全基因組比對顯示琴葉擬南芥基因組的50%(約114Mb)從Ath擬南芥的參考基因組中丟失,相反, 25%的Ath擬南芥基因組(約30Mb)沒有出現在琴葉擬南芥基因組中。儘管如此,兩個基因組的序列分布相似,未比對上的序列有一半是轉座元件,有1/4濕基因間區。這些差異導致的結果是Ath的基因組比琴葉擬南芥的基因組小約80Mb,但有更多的基因序列。

圖3 沿著Ath擬南芥基因組的基因組間隔的變化

藍色陰影為每個100 kb窗口中的共線基因對平均比例,淺藍色點顯示各個值。 深紫色線為每個不重疊的100 kb窗口的絕對長度的比率。灰色框為著絲粒。

圖4 共線區域、重排區域、基因間區域和基因家族的大小變化

(a) Ath擬南芥100kb窗戶的共線區域的大小比較,星號標明顯著不同的部分(二項檢測,p

圖5 轉座元件的對比

(a) 通過基於實驗的Ath擬南芥突變率來估算LTR反轉錄轉座子的插入時間。該指數在四分之一範圍均高於1.5倍。 物種間區別非常顯著(Wilcoxon秩和檢驗,p

圖6 95個Ath擬南芥個體中固定的或仍然分離的衍生插入與缺失的大小和等位基因頻率分布

(a) 固定插入和缺失的大小分布。單個密碼子(3 bp)倍數的插入和缺失在編碼區域超標。(b)分離非編碼區插入的等位基因頻率缺失頻率,與同義和非同義多態性的對比。通過合理假設琴葉擬南芥等位基因大多數情況下呈現祖先狀態,文章發現Ath擬南芥中非編碼位點的分離缺失偏向較高的等位基因頻率,而且固定和多態性缺失比插入更常見。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 華大科技BGITech 的精彩文章:

TAG:華大科技BGITech |