當前位置:
首頁 > 最新 > 誰限制了長RNA出核?

誰限制了長RNA出核?

細胞區室化(compartment)是真核細胞的核心特徵,核膜將細胞分為細胞核和細胞質,是細胞最大的2個區室。細胞內的很多生物大分子並不是均勻分布在核膜兩側。例如,人們現在已經熟知,作為mRNA的前體,pre-mRNA必須經過帶帽,剪接,加尾等加工(processing)之後才能從核孔複合體(NPC)中離開。很多長非編碼RNA(lncRNA)也體現出明顯的核質分布不均勻,這一類依賴於序列特徵(長/非編碼)而統一命名的RNA,功能各異,近幾年備受關注。

作者對長RNA在細胞核中滯留的分子機制進行了研究。他們的前提假設是:一些短序列能夠作為cis-element,至少是一些lncRNA和mRNA在細胞核中富集的原因

篩選目標序列

研究者構建了一個報告系統,由兩部分核心組成:

1.選取37個人lncRNA,13個小鼠核富集mRNA的3"UTR,以及MALAT1(核富集突出的lncRNA )的4個同源基因(小鼠,斑馬魚,棘魚(Stickleback),蜥蜴(Lizard)),共計54個基因,構建了5511 條(tile)以109 nt為步長平均重疊25 nt的短序列文庫;

2.將短序列文庫克隆到報告基因AcGFP mRNA的5"和/或3"UTR區域,稱為文庫NucLibA,轉染到MCF7細胞中(3次重複)後核質分離,分別對全細胞抽提物(WCE),細胞核(Nuc),細胞質(Cyt)組分、以及input質粒文庫進行測序(每個樣本的測序量>10 M reads)。

根據測序數據,計算每條tile的核質分布比Nuc/Cyt Ratio)。

研究者從中篩出來自14個基因的19個區域,這些區域均跨越2-4條tile,並且每條tile都有>30%的核富集。來自lncRNAJPXPVT1NR2F1-AS1的區域表現出最高的核富集度,並且在GFP的5"和3"-UTR具有相似的強度。這3個區域的tile序列與反向的Alu重複序列重疊。

作者從tile覆瓦重疊之間發現一個長度為42 nt,含有3段至少6個嘧啶(C/T)串的有效序列,其中兩段序列相似,符合R(A/G)CCTCCC的保守序列,作者將這段42 nt序列起名為SIRLOINSINE-derived nuclearRNALocalizatIoN)(沙朗牛排)。

驗證序列功能

作者選取獨立的SIRLOIN序列,通過核質分離RT-PCR和PrimeFlow RNA assay進行的細胞流式均表明,含有SIRLOIN的序列可以驅動GFP mRNA待在細胞核中。

從GENCODE v7中的MCF7細胞核質分離RNA-seq數據中,作者發現,整體來看SIRLOIN元件與核RNA相關。從GENCODE細胞數據中發現,10個細胞株中的9個也同樣表現出含有2個及以上SIROIN元件的RNA表現出顯著的核富集。並且,RNA內部外顯子中的SIRLOIN具有更強的核富集。有趣的是,如果含有SIRLOIN的外顯子可以發生可變剪接,能夠保留SIRLION的轉錄本在細胞核中含量更高(平均1.07-1.53倍,7/10株細胞中P<0.05)。

有了以上結果後,研究者構建了另一個文庫(NucLibB),包括了更多含有 SIRLOIN元件的lncRNA和mRNA相關區域的覆瓦tile,以及對JPX#9和PVT1#22中兩段30 nt片段(NucLibA中最有效)各種序列的突變。從中又得到來自5條lncRNA和5條mRNA的18個SIRLOIN重疊區域。

對來自JPX#9和PVT1#22的SIRLOIN的序列突變發現,維持其雙核苷酸組成的序列重排並不影響這些序列對RNA核富集的作用。增加SIRLOIN核心重複序列拷貝數可以增強核定位能力。

SIRLOIN序列中第2段RCCTCCC中,嘧啶向嘌呤(A/G)的點突變即可破壞SIRLOIN元件的作用,但是在RCCTCCC區域之外的A-T和G-C突變也會影響其功能。

誰識別/結合SIRLOIN?

作者從ENCODE eCLIP數據中尋有SIRLOIN序列富集的RNA-蛋白直接相互作用位點。在分析得到的112個蛋白中,hnRNPK排名第一。hnRNPK的結合位點遍布整個轉錄組,CCTCC是其結合峰中的核心序列。這與SIRLOIN中的RCCTCCC序列吻合。

RIP實驗表明hnRNPK能夠結合帶有SIRLOIN AcGFP mRNA,而對失去有效核定位能力的SIRLOIN單點突變的AcGFP mRNA的結合能力明顯下降。使用λN peptide-BoxB系統將hnRNPK錨定到Luciferase mRNA的3"UTR,足以誘導~3倍的細胞核富集。

重要的是,在HepG2細胞中,hnRNPK的eCLIP數據表現出binding cluster和該RNA核富集之間的相關性(R=0.14,P<10-16)。在K562細胞中,這一現象相比較弱(R=0.05,P=3.6×10-7)。相比之下,另一個RNA結合蛋白PCBP2的eCLIP binding cluster數目與該RNA核質分布無關

值得注意的重要現象是,在HepG2細胞中,對於那些不含有任何SIRLOIN元件的RNA,hnRNPK的eCLIP binding cluster數目與該RNA的核富集程度之間的關係(R=0.15)與上文提到的整體RNA的核富集程度幾乎相同(R=0.14)

在MCF7細胞中,siRNA KD hnRNPK後,大量基因的核質分布發生變化,其中,397基因發生2倍以上的核富集,而283基因變得在細胞質中更多。其中,核富集程度的降低與hnRNPK eCLIP cluster數目之間存在顯著相關性(R=-0.22)。關鍵的是,在hnRNPK KD後,帶有1個以上SIRLOIN元件基因的核富集顯著降低。

有趣的是,在hnRNPK KD後,帶有hnRNPK eCLIP位點的靶基因發生平均~4%的表達下調,並且中細胞核中平均下調21%,細胞質中卻平均上調10%。

{}

hnRNPK識別位點 or SIRLOIN元件 ?

總結下來,這項研究試圖尋找能夠驅動長鏈RNA核富集的短序列元件,找到了帶有RCCTCCC共有序列的SIRLOIN元件,發現該元件能夠驅動報告基因核富集,通過序列突變分析,證明RCCTCCC序列對SIRLOIN的重要性。通過分析eCLIP數據,發現核定位RNA結合蛋白hnRNPK的結合序列與RCCTCCC重疊。

hnRNPK是一個大量表達、高度聚集在細胞核中的RNA結合蛋白。本文尋找到的SIRLOIN元件包括hnRNPK的結合位點,但是hnRNPK的結合位點並不僅限於SIRLOIN元件,因此SIRLOIN元件至多是hnRNPK結合的必要不充分條件。也就是說,沒有SIRLOIN元件的RNA也可以被hnRNPK結合。本文並未統計hnRNPK的eCLIP位點中,SIRLOIN元件佔有的比例

換句話說,本研究的故事還可能是:hnRNPK通過與含有其結合位點的RNA直接結合,將這些RNA滯留在細胞核中由於SIRLOIN元件帶有hnRNPK的結合位點,因此是整個機制中的一個子集

很容易想到的是,具有核質差異定位的RNA結合蛋白還有很多,其他蛋白是否也可以通過此機制,將所結合的RNA滯留在細胞核中?在某種細胞/背景下,不同核定位RNA結合蛋白對核滯留RNA的定位相對貢獻如何?hnRNPK是主導性因素么?

誠如本文所提倡的,如何採用高通量的方法全面的研究此事?另一方面,RNA出核是一個多因子參與、多步驟的受調控過程。核定位RNA結合蛋白的「挽留」,與RNA出核通路的調控之間有什麼樣的相互關聯?

技術點:核質分離

RNA的核質分布比是全文的重點,高通量的RNA核質比測定幾乎只能依賴於RNA-seq,所以核質分離是唯一的技術手段。

核質分離有多種方法實現,這項研究使用的是基於去垢劑(140 mM NaCl,0.5% NP-40)的核質分離:等滲裂解獲得的上清經高速離心後即為細胞質組分;細胞核沉澱經過同樣buffer washing後,經過250 mM/880 mM sucrose cushion低速分離,沉澱即為細胞核組分。

相比於傳統使用Dounce homogenizer,依賴於去垢劑的方法不需要特殊設備,操作簡單。但是分離效果受去垢劑種類和操作的極大影響。

技術點:UMI(unique molecule index)

本研究在測定報告基因AcGFP的核質分布比時,使用帶有illumina接頭、UMI的基因特異性引物進行反轉錄,從而引入UMI計數。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 半倍體 的精彩文章:

TAG:半倍體 |