當前位置:
首頁 > 最新 > 科研人員建立靈長類特異新基因資料庫並系統預測新基因功能

科研人員建立靈長類特異新基因資料庫並系統預測新基因功能

靈長類特異乃至人特異新基因起源是推動人類表型演化的重要推動力,但只有少量新基因功能已知。近年來基因編輯技術和類器官技術的發展使得系統揭示新基因在人之所以為人這一演化過程中的貢獻成為可能。然而,由於基因年齡推斷方法的差別以及較低的新基因注釋質量(很難區分新蛋白編碼基因和假基因),文獻中已經發表的靈長類特異新基因(PSG)數據集相互之間差別極大。一個相對可靠的PSG數據集的缺乏阻礙了深入的功能研究。

基於GenTree數據的整合分析發現:1)以基因組共線性為基礎的基因年齡推斷方法與其它方法相比對近期起源的基因有較高的準確率;2)蛋白水平的選擇壓力推斷和蛋白基因組方法(proteogenomics)只能注釋部分靈長類特異基因的蛋白編碼能力。該研究考慮了這些方法各自的特點之後鑒定了846個PSG(圖2)。其中,254個基因有不同程度的蛋白支持證,該集合也包含了41個錯誤注釋的假基因(如MYH16)。

基於GenTree中所整合的轉錄組數據,該研究通過共表達分析推測了846個PSG的功能。與此前的認識相符,PSG經常呈現睾丸特異或睾丸偏好的表達;但PSG也呈現骨髓或胎盤偏好的表達譜。有意思的是,雖然PSG在成年腦中的表達量較低,但在孕中期胎腦表達上調(圖3)。富集於各共轉錄網路並佔據網路較核心位置的PSG可能推動了精子發生、免疫反應、母胎互作以及胎腦發育等快速演化的生命過程。

總體來看,該工作提供了一個專門的人類新基因資料庫,產生了相對高質量的PSG列表並推測了這些基因的功能。結果中所展示的年齡推斷方法、基因注釋方法的特點以及新基因器官特異的功能偏好性對研究其它物種種系特異基因的工作具普遍參考意義。

該研究於3月12日在線發表於Genome Research(doi:10.1101/gr.238733.118)。博士研究生邵毅、陳春燕為共同第一作者,張勇為通訊作者。龍漫遠、何斌、沈浩、朱政霖、余大奇、降帥、趙石磊、高志強、付岩、陳希、高歌、陳華等合作者在文章寫作、網頁開發、數據分析方面提供了大力支持。該研究得到中科院先導專項、國家自然科學基金委員會和科技部的資助;計算需求得到中科院北京基因組研究所基因組測序與數據分析中心和動物所高性能平台的支持。

圖1:GenTree網頁界面示例。A) 谷氨酸脫氫酶2 (GLUD2)在人和長臂猿的共同祖先起源;B) GLUD2隻編碼一個外顯子,而其最相似的同源基因GLUD1編碼多外顯子,暗示著GLUD2起源於GLUD1的mRNA水平的重複事件(逆轉錄);C) GLUD1廣譜高表達,GLUD2除了睾丸之外,其它器官轉錄水平較低,暗示著後者功能可能比較局限。

圖2:靈長類特異基因列表。灰色箭頭說明蛋白編碼能力可信度的下降,例如85個Ensembl注釋的蛋白編碼基因不僅有蛋白表達的證據(UniProt)也有功能研究(GO),而90個PSG只有蛋白表達、質譜和選擇壓力中的一種證據。值得一提的是846個靈長類特異基因包含192個人類特異的新基因。

圖3:不同腦發育階段共轉錄模塊(橫軸)編碼靈長類特異基因的比例(縱軸)。PCW和MAB分別代表孕周和出生後月份。共轉錄模塊2(BM2)與基因組背景(粉紅線標記)相比統計上顯著富集靈長類特異基因。該模塊與其它四模塊(藍色標記)都富集自閉症易感基因,暗示它們的重要性。

來源:中國科學院動物研究所


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 中科院之聲 的精彩文章:

中國東北湖泊水庫藻華遙感研究取得進展
科學家揭示幹細胞分化關鍵轉錄因子

TAG:中科院之聲 |