當前位置:
首頁 > 知識 > 忘記基因組和轉錄組,一起來關注印記組吧

忘記基因組和轉錄組,一起來關注印記組吧

2017年2月1日/生物谷BIOON/---在哺乳動物和植物的基因組中,某些基因攜帶著表明它們是來自親本或母本的標記。通常而言,這些標記是調節基因表達以便選擇性表達一個親本等位基因的甲基。總而言之,這些印記基因(imprinted gene, 也譯作印跡基因)組成印記組(imprintome)。


科學家們過去經常逐個地尋找印記基因,但是多虧現代的測序技術,他們如今能夠掃描整個基因組。印記組的準確大小是不確定的,特別是因為印記模式在不同組織中和發育的不同時間裡存在差異。經估計,人類和小鼠有100~150個左右印記基因,而模式植物擬南芥有90個以上的印記基因。基因組中的很多印記區域能夠含有與人類疾病(如糖尿病)相關聯的序列變異體。鑒於僅有一個印記基因拷貝會表達,因此功能缺失突變更可能導致印記模式出現問題。


來自紐西蘭奧塔哥大學的Ian Morison說,鑒定出人類和模式生物完整的印記基因列表將成為科學家們闡明印記機制和功能的起始點。這是一項正在持續進行的努力,但是這其中存在很多障礙。來自美國文安德爾研究所的Piroska Szabó曾經激動人心地認為她發現一個新的基因,而且僅僅是它的母本等位基因會表達。之後,她才意識到她正在研究的RNA序列是來自一個之前被錯誤標註為核基因的基因。這就解釋了母本遺傳性。

其他的方法也會誤導人。一些論文鑒定出1000多個潛在的印記基因,但是隨後它們當中的大多數因存在假陽性而被剔除。當細胞因出於隨機性或者等位基因序列特異性等其他原因而不是出於等位基因的親本來源選擇一個等位基因時,這些假陽性也會產生。


來自西班牙Bellvitge生物醫學研究所的David Monk提醒道,準確地分析序列的需要使得生物信息學研究者成為任何一個印記組研究小組的核心成員。


《科學家》雜誌請求印記研究專家分享他們的分析小鼠、擬南芥和人類印記組的技術和針對推動該領域發展的新技術和研究提出一些新的想法。


1.測試案例

研究人員:文安德爾研究所表觀遺傳學中心副教授Piroska Szabó


有機體:小


方法:RNA測序(RNA-seq)


2014年,Szabó和同事們報道了他們如何利用小鼠胚胎成纖維細胞測試這種相對較新的RNA測序方法是否能夠揭示已知的和新的印記基因。Szabó團隊以兩種不同的存在已知的基因組差異的小鼠品種開始研究。他們讓這兩種小鼠品種發生雜交,並且對所產生的後代的RNA進行測序。


對母本基因組和親本基因組在序列上存在差異的任何基因而言,Szabó團隊能夠研究基因經轉錄產生的RNA,並且尋求是哪個等位基因發生轉錄。對大多數基因而言,他們觀察到每個基因的母本等位基因和父本等位基因發生轉錄的比例是五五分。但是對印記基因而言,他們期待觀察到RNA主要是由母本等位基因,或者主要是由父本等位基因轉錄的。

發現


Morison(未參與這項研究)說,Szabó團隊鑒定出32個已知的印記基因,但是沒有新的印記基因,這提示著小鼠的印記基因列表---至少是在它的胚胎成纖維細胞中---幾乎是完整的(Nucleic Acids Research, doi:10.1093/nar/gkt1042)。


優勢


(1)針對用於雜交的兩個小鼠品種(每個品種代表母本或父本)開展研究有助證實這種印記。


(2)Szabó團隊採用了從cDNA的兩個末端開始讀取序列的末端配對測序法(paired-end sequencing),能夠有助鑒定出僅有基因的某些剪接變異體存在印記。

不足之處


(1)低水平表達的基因往往被錯誤地認為是印記基因,這是因為少量的轉錄本可能隨機地偏向一種或另一種親本等位基因。Szabó團隊需要最少10次序列讀取,才能判斷一個基因是否為印記基因。


(2)即便將高度表達的基因稱為印記基因也會充滿不確定性,這是因為一些印記基因以一種要麼全有要麼全無的方式進行表達。Szabó團隊設置一個截止值(cutoff):一個等位基因或另一個等位基因的80%表達就可將一個基因稱為印記基因。不同的研究團隊選擇不同的截止值,而且一種太寬的截止值可能會產生假陽性。


展望

Szabó想要採用單細胞印記組分析技術,也想要在發育期間不同時間點上針對不同的組織開展更多的研究,這仍然可能鑒定出更多的印記基因。


2.單親樣本集


研究人員:日本國家兒童健康與發育研究所母胎生物學系處長Kazuhiko Nakabayashi;西班牙Bellvitge生物醫學研究所表觀遺傳學與癌症生物學項目主要研究者David Monk。


有機體:人類


方法:亞硫酸氫鹽測序(Bisulfite-seq);亞硫酸氫鹽晶元(Bisulfite-chip)

忘記基因組和轉錄組,一起來關注印記組吧



圖片來自Genome Research, doi:10.1101/gr.164913.113


甲基化通常與非表達等位基因沉默相關聯,從而使得它成為印記基因的一種簡便的標記。不過,在兩個等位基因都會表達的組織中,差異甲基化模式是可能存在的。Nakabayashi、Monk和他們的合作者們研究了來自健康志願者體內的成體細胞、臍帶血細胞和胎盤細胞的甲基化模式。他們也研究了來自腦庫的腦組織的甲基化模式。此外,他們也研究了一種體外培養的肝細胞系的甲基化模式。他們利用亞硫酸氫鹽處理基因組DNA。亞硫酸氫鹽僅將DNA中未發生甲基化的胞嘧啶轉化為胸腺嘧啶,但不會影響發生甲基化的胞嘧啶。他們認為在多種組織中一直發生半甲基化(half-methylated)的基因很可能是印記基因。


為了證實基因印記和鑒定它們的親本起源,研究人員將這些甲基化模式與受到單親二體(uniparental disomy)影響的組織中的甲基化模式進行比較。單親二體指的是基因組(或者說染色體或部分染色體)的兩個拷貝都來自一個親本。一種這樣的樣品來自葡萄胎(hydatidiform mole, 又稱水泡狀胎塊)生長:當一個缺乏細胞核的卵子被兩個精子或者一個已發生基因組複製的精子受精時,葡萄胎就會這種不成功的懷孕中產生。其他的樣品來自攜帶源自父親或母親的發生染色體複製的血細胞的人體內。


研究人員利用Illumina晶元鑒定受到單親二體影響的組織樣品中的甲基化位點,並且將它們與具有典型染色體組的血細胞的甲基化模式進行比較。在大多數情形下,這兩種甲基化模式應當匹配得上,但是它們在印記基因上存在差異:在正常的血細胞中,一個基因拷貝發生甲基化,但在受到單親二體影響的組織中,兩個基因拷貝或者沒有一個基因拷貝發生甲基化。比如,在葡萄胎中,所有的基因都來自父本,因此正常情形下僅在父本拷貝上發生甲基化的基因在這些受到單親二體影響的組織中會在兩個等位基因上都發生甲基化。


研究人員獲得21個存在差異甲基化的位點,其中的15個位點僅存在於胎盤中,但是在他們開展研究的小鼠雜交種體內,沒有一個位點存在印記(Genome Research, doi:10.1101/gr.164913.113)。Nakabayashi說,「印記位點是新獲得的,而且很可能在進化中丟失了。」


(1)Monk偏好亞硫酸氫鹽測序法,這是因為大多數印記基因發生差異甲基化,即便這些基因在分析的組織中沒有表達。「我們將甲基化作為在基因組上的哪個位置去查找的標記而不是直接作為基因表達的標記。基因表達是非常複雜的。」


(2)受到單親二體影響的組織有助證實印記基因的身份。


(1)Monk說,測序是「非常昂貴的」,據估計,每個樣品的成本是6000美元。


(2)Illumina公司開發的Infinium HumanMethylation450 BeadChip晶元含有檢測45萬個可能發生甲基化的區域的探針,因此一些印記基因可能會遺漏掉。新的MethylationEPIC試劑盒含有檢測85萬個位點的探針。


(3)考慮到等位基因可能發生差異甲基化,但是在一些組織中不會發生差異表達,因此甲基化測序不會在RNA水平上證實印記。


鑒於很難獲得的人組織以及小鼠印記組與人印記組不相匹配,Nakabayashi想要針對靈長類動物印記開展更多的研究。


Monk補充道,「可擴展性是下一個問題。」他想要採用一種利用晶元而不是完整測序開展單細胞分析的方法,但是基於晶元的亞硫酸氫鹽方法需要的核酸(大約1毫克)比一個細胞提供的還要多。


3.親本衝突


研究人員:美國麻省理工學院生物學副教授、懷特海德研究所成員Mary Gehring


有機體:擬南芥(Arabidopsis thaliana)和深山南芥(A. lyrata)


方法:RNA-seq和bisulfite-seq


在植物中,印記僅發生在胚乳中。胚乳是滋養植物胚胎的三倍體種子組分。很多科學家猜測印記在動物和植物中發生的原因在於父本基因組促進儘可能大的後代生長,而母本基因組有助保護有限的資源。Gehring和同事們對在擬南芥中存在的印記是否比異型雜交的深山南芥中的更少感到好奇。擬南芥是一種自我受精的植物,親本的影響應當是一致的。他們讓兩種深山南芥品種發生雜交,親手解剖它的種子,並且對所產生的胚乳進行末端配對RNA測序(paired-end RNA-seq)和亞硫酸氫鹽測序,從而鑒定出這種物種的印記組。他們將它與他們之前確定的擬南芥印記組進行比較(Nature Plants, doi:10.1038/nplants.2016.145)。


事實上,在印記基因列表中,大多數印記基因在這兩種物種之間是保守的。但是Gehring團隊確實觀察到沉默基因表達的甲基位置在這兩種物種之間存在差異,這提示著它們的印記機制存在著不同。


正如Szabó的那項研究中的一樣,Gehring團隊了解親本基因型,因此他們能夠在這些種子中鑒定出這些等位基因。


(1)如果針對一個給定的基因,這兩種親代品種沒有基因差異,那麼任何印記將是無法觀察到的。


(2)Gehring說,「一個主要的挑戰是理解是什麼存在顯著的差異。」80%或90%的母本等位基因表達是印記存在的證據嗎?不同的研究團隊設置不同的截止值。


Gehring想要不用親手解剖微小種子的情形下分離出胚乳;她希望胚乳組織的三倍體(兩個母本基因組和一個父本基因組)性質將有助她通過流式細胞儀從其他的二倍體細胞中分裂出這種胚乳。


4.數據分析


研究人員:美國哥倫比亞大學系統生物學系助理教授、紐約基因組中心核心成員Tuuli Lappalainen


方法:分析測序數據

忘記基因組和轉錄組,一起來關注印記組吧



圖片來自Genome Research, doi:10.1101/gr.192278.115


多虧有廣泛獲得的轉錄組資料庫,一些科學家甚至不必選擇新的組織來尋找印記基因。Lappalainen是基因型-組織資料庫(Genotype-Tissue Expression, GTEx)的一名合作者。GTEx資料庫包括多種死後的組織樣品的基因型和RNA測序數據。在近期的一項研究中,Lappalainen和同事們利用來自這種資料庫的數據尋找印記基因。在任何一個給定的基因是雜合型的情形下,Lappalainen團隊能夠尋找等位基因特異性的表達。他們儘力地篩選出已知發生隨機的單等位基因表達的基因。單等位基因表達指的是由於序列變異而發生的單個等位基因表達,或者可能因測序存在的技術問題看起來像是單等位基因表達的RNA譜。


Lappalainen團隊鑒定出42個印記基因,其中的12個是新的(Genome Research, doi:10.1101/gr.192278.115)。


(1)GTEx包括來自多種組織的樣品,這些組織涵蓋循環系統、神經系統和胃腸道系統。


(2)具有較大的樣品---來自178人的1582種組織樣品---使得它更容易證實印記存在於整個人群中。


(1)僅從這些數據當中,Lappalainen團隊並不知道一個給定的等位基因來自哪個親本。他們不得不使用家庭樣品等額外數據來確定哪些基因是存在父本印記的還是母本印記的。


(2)Lappalainen提醒道,當印記模式在很多人之間是相同的情形下,這種大規模方法才會有效,但是印記的強度可能在整個人群當中存在差異。


開展這這種分析的理想方法是具有關於多種組織類型的大型家庭數據集,這樣研究人員就會知道親本基因型,但是Lappalainen說,當前僅有來自血液樣品的數據集是可獲得的。


5.印記資源


(1)基因組印記網站http://www.geneimprint.com/


Geneimprint網站包括物種的印記基因列表;論文,綜述和針對這個話題的演講稿。


(2)親源效應目錄:http://igc.otago.ac.nz/home.html


用戶能夠尋找受到親本來源影響的基因,包括多種物種中的印記基因和每個親本的不同突變率等其他影響(Nucleic Acids Research, doi:10.1093/nar/29.1.275)。


(3)小鼠基因組印跡和差異表達網路圖集(WAMIDEX):https://atlas.genetics.kcl.ac.uk/


這個小鼠印記基因列表是基於文獻檢索或晶元表達數據獲得的(Epigenetics, doi: 10.4161/epi.3.2.5900)。


(4)MouseBook印記資源:http://www.mousebook.org/mousebook-catalogs/imprinting-resource


MouseBook網站包括印記基因列表和圖譜(Nucleic Acids Research, 38:D593-99, 2010)。


(5)GTEx網站:https://www.genome.gov/gtex/


該網站提供來自人死後組織的基因組和RNA序列(Nature Genetics, doi:10.1038/ng.2653)。(生物谷 Bioon.com)


參考資源:


Characterizing the Imprintome


本文系生物谷原創編譯整理,歡迎轉載!點擊獲取授權。更多資訊請下載生物谷app.


生物谷更多精彩盤點,敬請期待!

您的贊是小編持續努力的最大動力,動動手指贊一下吧!


本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 生物谷 的精彩文章:

Nature雜誌1月26日精選文章一覽
利用條件性重編程無限制地培養正常細胞或引發醫學變革
2017年1月CRISPR/Cas重大進展梳理
Science子刊:發現一種迄今為止最為強效的HIV中和抗體
Nature:線粒體融合關鍵蛋白Mfn1結構被破解,揭開數十年謎題

TAG:生物谷 |

您可能感興趣

不一樣的全長轉錄組
全長轉錄組你必須要看的
空間轉錄組?這貨是什麼?
轉錄組分析的正確姿勢
基因組和轉錄組聯合分析(一):揭示網狀色素異常的致病機理
轉錄因子:閱讀遺傳信息的書籤!(一)
宏基因組與宏轉錄的結合的新分析工具
「淺嘗」全轉錄組研究套路!
轉錄組學領域研究進展一覽
步步為營,尋找轉錄因子與基因啟動子的「愛巢」
老司機帶你一網打盡啟動子和轉錄因子結合位點
從零開始學轉錄組:軟體安裝
基因組研究再創佳績,轉錄因子異常背鍋小兒白血病
為啥單細胞轉錄組總能發高分文章?
如何快速批量找到轉錄本序列的開放閱讀框 ORF
lncRNA 測序新紀元,開啟「無轉錄組」時代!
重難點釋疑:DNA分子的複製、轉錄、翻譯
Science:在單細胞轉錄組解析度下重建虛擬果蠅胚胎
Science:揭示基因轉錄暫停機制