當前位置:
首頁 > 最新 > 精確物種進化地位:系統進化樹的構建

精確物種進化地位:系統進化樹的構建

進化樹也稱種系樹,英文名叫「Phyligenetic tree」, 根據蛋白質的序列或結構差異關係可構建分子進化樹。進化樹給出分支層次或拓撲圖形,它是產生新的基因複製或享有共同祖先的生物體的歧異點的一種反映,樹枝的長度反映當這些事件發生時就存在的蛋白質與現在的蛋白質之間的進化距離。根據進化樹不僅可以研究從單細胞有機體到多細胞有機體的生物進化過程,而且可以粗略估計現存的各類種屬生物的分歧時間。通過蛋白質的分子進化樹分析,從分子水平研究物種進化提供了新的手段,可以比較精確的確定某物種的進化地位。對於物種分類問題,蛋白質的分子進化樹亦可作為一個重要的依據。

構建進化樹的方法包括兩種

1. 序列進化樹,是序列類似性比較,主要是基於氨基酸相對突變率矩陣(常用PAM250)計算不同序列差異性積分作為它們的差異性量度;

2. 結構進化樹,是在難以通過序列比較構建序列進化樹的情況下,通過蛋白質結構比較包括剛體結構疊合和多結構特徵比較等方法建立的。

分析一個完整的進化樹需要以下幾個步驟

1. 要對所分析的多序列目標進行排列。做ALIGNMENT的軟體很多,最經常使用的有CLUSTALX和CLUSTALW,前者是在WINDOW下的而後者是在DOS下的。

2. 構建一個進化樹。構建進化樹的演算法主要分為兩類:獨立元素法和距離依靠法。

獨立元素法是指進化樹的拓撲形狀是由序列上的每個鹼基/氨基酸的狀態決定的;獨立元素法又包括最大簡約性法和最大可能性法。

最大簡約性法(MP)特點如下

i 所要比較的序列的鹼基差別小

ii 對於序列上的每一個鹼基有近似相等的變異率

iii 沒有過多的顛換/轉換的傾向

iv 所檢驗的序列的鹼基數目較多(大於幾千個鹼基)

最大可能性法(ML)分析序列則不需以上的諸多條件,但是此種方法計算極其耗時。如果分析的序列較多,有可能要花上幾天的時間才能計算完畢。

距離依靠法是指進化樹的拓撲形狀由兩兩序列的進化距離決定的。它包括除權配對法(UPGMAM)和鄰位相連法。UPGMAM假設在進化過程中所有核苷酸/氨基酸都有相同的變異率,也就是存在著一個分子鐘。這種演算法得到的進化樹相對來說不是很準確,現在已經很少使用。鄰位相連法(NJ)是一個經常被使用的演算法,它構建的進化樹相對準確,而且計算快捷。其缺點是序列上的所有位點都被同等對待,而且,所分析的序列的進化距離不能太大。

3. 對進化樹進行評估。主要採用Bootstraping法。進化樹的構建是一個統計學問題。我們所構建出來的進化樹只是對真實的進化關係的評估或者模擬。

在構建系統進化樹軟體的選擇方面,有如下幾點:

1. 構建NJ樹,可以用PHYLIP或者MEGA。MEGA圖形化的軟體,使用非常方便。MEGA軟體為初學者的首選。雖然多序列比對工具ClustalW/X自帶了一個NJ的建樹程序,但是該程序只有p- distance模型,而且構建的樹不夠準確,一般不用來構建進化樹。

2. 構建MP樹,最好的工具是PAUP,但該程序屬於商業軟體,並不對學術免費。而MEGA和PHYLIP也可以用來構建MP樹。MEGA是圖形化的軟體,使用方便,而PHYLIP則是命令行格式的軟體,使用較為繁瑣。對於近緣序列的進化樹構建,MP方法幾乎是最好的。

3. 構建ML樹可以使用PHYML,速度最快。或者使用Tree-puzzle,速度也較快,並且該程序做蛋白質序列的進化樹效果比較好。Tree- puzzle程序是命令行格式的,需要學習DOS命令。PHYML只有適用於64位的版本。 BioEdit集成了一些PHYLIP的程序,用來構建進化樹。

實際構建過程中需要注意的一些問題:

1. 如果對核酸序列進行分析,並且是CDS編碼區的核酸序列,需要將核酸序列分別先翻譯成氨基酸序列,進行比對,然後再對應到核酸序列上。

2. 無論是核酸序列還是蛋白序列,一般應當先做成 FASTA格式。FASTA格式的序列,第一行由符號「>」開頭,後面跟著序列的名稱,可以自定義,將所有的FASTA格式的序列存放在同一個文件中。

3. 構建NJ或者MP樹需要先將序列做多序列比對的處理。一般使用ClustalX進行多序列比對的分析。而構建ML樹則不需要預先的多序列比對,直接使用FASTA格式即可。

熱門圖文TOP7

GIF

一指禪 戳戳戳!


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 中洪博元醫學實驗幫 的精彩文章:

從杭州保姆縱火到醫生電梯勸煙,善良縱容了多少罪惡?

TAG:中洪博元醫學實驗幫 |