當前位置:
首頁 > 最新 > 進化樹作圖專題:Newick的前世今生

進化樹作圖專題:Newick的前世今生

大家好!我是新加盟生信人團隊的小編montreal,和前幾位小編遙相呼應,目前在大洋彼岸的美洲大陸最具法蘭西風情的Q省Q市Q大學攻讀博士學位。相信很多朋友在研究中都遇到過有關進化樹作圖的問題。從本期開始,我將為大家帶來進化樹作圖系列專題,希望能對有著不同專業背景的讀者在進化樹作圖(請注意不是建樹)方面有所幫助。

想必大家都知道Newick格式是目前進化樹做常用到的一種格式了。比如,對於下面這棵樹:

小編作圖,歡迎轉載或修改

用Newick格式來表示,就是:(A,(B,(C,D)))。很簡潔吧?目前,作為最常使用的進化樹格式,Newick在各種作圖軟體中得到了廣泛應用。本文將首先回溯歷史,帶你了解Newick的前世今生。

時光迴轉三十年。1986年6月26日,美國新罕布希爾州(New Hampshire)多佛市(Dover)的一家龍蝦館裡,七位科學家一邊吃著龍蝦,一邊進行著輕鬆的學術討論。對於這次會議,能找到的資料極為有限,但其結果卻對整個系統發育學(phylogenetics)產生了重要的影響。因為正是在這次會議中誕生了一種全新的、用字元與括弧來對進化樹進行描述的格式。這次在新罕布希爾的會議實際上由一系列非正式的討論構成,而最後一次討論(還有第二次討論)正是在一家名為Newick』s Lobster House的龍蝦館舉行,也許是龍蝦鮮美令人難以忘懷的緣故,大家決定用Newick龍蝦館來命名這種格式(學界也稱之為New Hampshire format)[1]。

Adapted from Google Map. Terms of use:https://www.google.com/intl/en_hk/help/terms_maps.html

BTW;這家建於1948年的龍蝦館至今仍在營業。聽去過的人說味道確實不錯,推薦fried oysters和Gulf shrimp,大家有興趣可以去嘗下鮮,地址:Address: 431 Dover Point Road, Dover, NH 03820。

從此,Newick從新罕布希爾的龍蝦館慢慢走入世界各大學的圖書館,儘管從未在正式文獻中被專門論述過[1]。七位與會嘉賓都是當時分子進化和計算機學界的翹楚,讓我們看看他們都是誰:James Archie, William Day, Joe Felsenstein,Wayne Maddison, Christopher Meacham, F. James Rohlf, David Swofford[1]。沒聽說過?沒關係,其中的幾位在下文和本系列專題後續的文章中還會多次出現。多說一句,本次會議的發起人[1]、著名分子進化學家,時任華大西雅圖(University of Washington, Seattle)遺傳系教授的Joseph Felsenstein還有一位親弟弟,Lee Felsenstein,是一位知名的電子工程師,對於PC的早期發展有巨大貢獻[2],大家不要搞混。

針對Newick格式,需要注意的是不同的樹會有多種的Newick格式對應 [1]。讓我再回到本文開始的例子:

小編作圖,歡迎轉載或修改

以下三種方式:(A,(B,(C,D))),(A,(B,(D,C))),(A,((C,D),B)),都可以表示這棵樹。此外,實際應用中很多的樹是無法定根的(rooted)。這裡所謂的「根」就是祖先,不能定根也就是我們無法知曉祖先在哪(如圖所示,1、2還是3)。用Newick來表示的時候,一般的原則是人為地定一個根。還是上面這棵樹,如果對於一棵不定根的樹(unrooted tree),那麼(A,(B,(C,D))),((C,D),(B,A))和(D,(C,(B,A)))表示的都是同一棵不定根樹(unrooted tree)[1]。

Newick的獨角戲唱了一年,就迎來了競爭對手Nexus,一種包含有多種信息並以模塊化存儲的新格式。與Newick不同,Nexus有一篇在正式期刊發表的文章,專門介紹這種格式。這篇文章於1997年刊載在分子進化和系統分類學(systematics)頂級期刊Systematic Biology上,儘管此前Nexus已在多種軟體中(比如MacClade 3和PAUP 3)被使用[3] 。

作者的名字眼熟嗎?對,其中的David Swofford和Wayne Maddison,正是當年新罕布希爾「龍蝦七子」中的兩位。不過為什麼排在第一位的也叫Maddison?莫非?

你沒有猜錯,這兩個Maddison是親兄弟,而且還是雙胞胎!至於哪個是哥哥,哪個是弟弟,有了解的讀者歡迎在後面留言,反正我是分不出,請見下圖:

Copyright: Wayne Maddison Lab, CC 3.0

BTW:Maddison兄弟之前都在亞利桑那大學(University of Arizona)做老師,其間經常被人搞混,甚至自己的學生也無法分辨。時常有人向哥哥諮詢一件事,幾天後卻向弟弟詢問結果,搞得對方一頭霧水。後來也許是大家實在受不了,Wayne Maddison遂改換門庭,去往加拿大的英屬哥倫比亞大學(University of British Columbia)任教。

作者在文中明確指出了發明Nexus格式旨在提供一種具有延展性(expandability),包容性(inclusivity),可移植性(portability),以及可操作性(processibility)的格式。而這些特性的實現,最重要的就是Nexus模塊(modularity)的設計。讓我們看一個示例:

小編作圖,歡迎轉載或修改

這裡面的內容確實不少。不過請注意,Nexus對於樹的描述(或者說tree block),實際上和Newick如出一轍,所以嚴格地說,在描述進化樹方面,它沒有任何創新,只是照搬Newick格式。

有趣的是,上面提及的這幾位在進化樹格式發展史中具有里程碑意義的人物——Newick龍蝦館會議的組織者Joseph Felsenstein,Nexus格式的發明者David Swofford和Maddison兄弟——分別摘取了第二、第一和第五第六屆系統分類學家(systematic biologist)主席終身成就獎(Presidents" Award for Lifetime Achievement)[4]。該獎由系統分類學家協會(Society for Systematic Biologists)每隔三年或以上頒發一次,迄今只有六位得主,堪稱系統分類學界最高榮譽[4]。當然,這絕不僅是對於Newick和Nexus的嘉獎。幾位科學家的貢獻還有很多,比如三個著名的進化軟體:Phylip、PAUP和Mesquite,也正分別出自他們之手。

Nexus雖然與Newick同出一源,卻由於其更加豐富的內容和複雜的模塊化結構,使得很多軟體中兩者不能兼容:前者有PAUP,Mesquite和MrBayes這樣的擁躉,而後者也得到了Phylip,MEGA以及RAxML等軟體的青睞。時至今日,如果把兩種格式的名字同時輸入谷歌搜索框,得到的幾乎都是「How to convert nexus files to Newick format?」之類的提問。

Newick和Nexus的二人轉在2009年終於迎來了攪局者,它就是phyloXML,一種基於XML並整合了樹和其他相關數據的新格式。在phyloXML里,不同的屬性用

…的方式描述,而XML良好的擴展性也使得phyloXML有著更靈活的設計方式[5]。可以說,這種格式是同Newick有著鮮明區別的、也是真正意義上的一種新的進化樹格式。該文作者,美國桑福德-伯納姆醫學研究所(Sanford-Burnham Medical Research Institute)的剝屍猴Christian Zmasek和來自印第安納大學布魯明頓分校(Indiana University, Bloomington)的Mira Han,在文中強調,生物學的飛速發展和研究的日益深入使得人們有必要將包括物種、基因名、枝長(branch length)、甚至是成種事件(speciation)等廣泛信息整合到進化樹中,並以一種全新的格式呈現出來。於是二人一道開發了phyloXML。下圖(左)展示了一個包含有多種信息的phyloXML文件。下圖(右)則是基於phyloXML的一棵包含物種信息和蛋白質結構域信息的樹。

小編作圖,歡迎隨意轉載或修改

除了上述三種進化樹格式之外,還有其他的一些「小眾」群體。由於篇幅所限不再一一介紹。本期內容至此介紹完畢,有問題的朋友歡迎在下方留言。預知後續內容,請鎖定生信人公眾號。

參考資料

http://evolution.genetics.washington.edu/phylip/newicktree.html

https://en.wikipedia.org/wiki/Lee_Felsenstein

Maddison, D. R., Swofford, D. L. and Maddison, W. P. (1997), Nexus: An extensible file format for systematic information.Syst. Biol., 46:590–621.

Han M.V. and Zmasek C.M. (2009) phyloXML: XML for evolutionary biology and comparative genomics.BMC Bioinformatics, 10:356.


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 生信人 的精彩文章:

NG 木豆 GWAS解讀

TAG:生信人 |