搞懂RNA命名,miRNA、lncRNA、circRN不再傻傻分不清
作者:解螺旋.麥子
導語
最近,ncRNA的世界裡百花齊放,miRNA、lncRNA、circRNA三個「大腕」輪番上陣,真真是你方唱罷我登場,讓人感到眼花繚亂、應接不暇。ncRNA的故事個個精彩紛呈,好評如潮,晉陞為科研界的大IP。可是故事中的角色太多,讓絕大多數「臉盲」的科研者頭疼不已。為了增加各位「大腕」的辨識度,今天就和大家聊一聊ncRNA命名的那些事兒。
miRNA變身記
miRNA可以算是老牌明星了,一直佔據RNA世界中北方遼闊的疆土。其中,pri-miRNA,pre-miRNA,mature miRNA是miRNA的三種形態。
?
pri-miRNApre-miRNAmiRNA加工流程示意圖
miRNA的命名規則(以動物miRNA為例)
一般,pre-miRNA以「mir」命名,其編號以「MI」編號,如人的miRNA 122的前體ID為hsa-mir-122,Accession為MI0000442;而miRNA的成熟鏈以「miR」命名,其編號以「MIMAT」編號,如人的miR-122的一個成熟體的ID為hsa-miR-122-5p ,Accession為 MIMAT0000421。
可是仍有小夥伴對miRNA名字中的hsa、3p、5p等符號表示一臉懵逼,完全看不懂有沒有?在此小魚為大家解讀一下,如下圖。
其中,在確定命名規則之前發現的miRNA,依然保留原來名字,如hsa-let-7。miRNA後的阿拉伯數字表明被發現的先後順序,如hsa-miR-122;儘管曾經還用*表明表達量低的miRNA,但現在這種命名方式已被取消。
此外,病毒miRNA的命名方式與動物相一致,但是植物的卻有些與眾不同。通常植物的Pre-miRNA以MIR命名,如ath-MIR156a;miRNA則以miR來命名,如ath-miR156a。注意:MIR/miR與命名順序之間沒有「-」。
lncRNA的華麗轉變
曾經lncRNA這匹千里馬因為缺少伯樂的賞識以及伯樂尚不到火候的技術而備受冷落,可如今lncRNA已經風靡全球,其相關研究也是如火如荼。然而對剛涉及這一領域的菜鳥而言,lncRNA的名字就像一鍋大雜燴,五花八門的,看的人暈暈乎乎的。
實際上,目前lncRNA的命名還沒有一個統一的原則,但為了讓lncRNA的命名具有唯一性、準確性並最大程度上反映其功能,雨果基因命名委員會(HGNC,唯一的制定人類基因命名標準的官方授權機構)提供了一個命名指導指南,以供參考。
lncRNA命名指南
首先,每條lncRNA的名字應具有唯一性,不能發生一個基因幾個名字或存在重名的現象。因而,作者在發表新lncRNA時,可先獲取HGNC的認可,如果作者發布的名字已在其他地方使用過,HGNC將會指定一個新名字供作者選擇。
lncRNA的名字應是描述基因的縮寫,便於人們理解名字的含義。如BANCR就是BRAF-activatednon-proteincoding RNA的縮寫。
lncRNA的名字應僅由拉丁字母和阿拉伯數字組成,不應出現標點符號。連字元僅在特殊場合使用,如:反義編碼蛋白基因可在標識中加連字元(BACE1-AS就是BACE1 antisense RNA的名字)。
lncRNA的名字中的字母應為大寫,為了與其它種類物種的基因區別開來(如嚙齒動物基因的標識只要求首字母大寫,其餘小寫),人類基因標識中的字母都應為大寫,例如HOTAIR基因,在人類中叫HOTAIR,而在老鼠中寫成Hotair。
lncRNA的名字中不應涉及具體的物種類型,例如:如果基因名字中有H/h(代表人類),由於牽涉到同源基因的問題,就會造成一些疑惑和誤導。
lncRNA的命名應避免採用一些常用的辭彙,否則會給分析研究帶來很多問題,比如:「AIRN」基因最初公布時叫「AIR」,從公共資料庫中搜索可得到22萬條不相關的信息,而搜索「AIRN」則只有10條信息。
lncRNA的命名應儘可能的反映其功能,如XIST基因是「X(inactive)-specific transcript」的縮寫,該基因的作用是參與沉默一對X染色體的轉錄。命名的時候盡量反映基因通常的功能,而不體現其突變表型。其命名應簡潔明了,不應包含以下信息:
*具有攻擊或輕蔑的色彩。
*具有個人及地方色彩。
*含有神化,虛構或歷史人物的名字。
*含有「臆想」和沒什麼意義的信息。
功能性轉錄假基因在命名時應保留它們假基因名稱且不應改變其基於功能的名稱。為了方便搜索,這個功能應加在名字的最後。eg: PTENP1 是「phosphatase and tensin homolog pseudogene 1 (functional)」.
而對於未知功能的lncRNA應依據基因組上下文來命名,下圖則給出了系統化的命名的規則。
如果有一個很接近的蛋白編碼基因,lncRNA的名字應該以這個編碼基因名字開始,再加後綴即可。
後綴的分類:
反義(antisense,AS),eg: BACE1-AS;
內含子(intronic,IT),eg: SPRY4-IT1;
重疊(overlapping,OT),eg: OSX2-OT;
長鏈基因間lncRNA(Longintergenic lncRNAs,lincRNAs),以LINC為前綴,數字為後綴,eg: LINC00485。
此外,有些lncRNA與編碼基因是頭碰頭(headto head),可推斷它們擁有雙向啟動子,HGNC推薦將其命名為反義上游(Antisense upstream,AU),例如,GENE2-AU1。
參考文獻:A short guide tolong non-coding RNA genenomenclature
精彩內容回顧(回復左邊數字查看):
61:非編碼RNA類型及功能匯總,吐血推薦!
62:一文讀懂 與自噬相關的mTOR信號通號
63:乾貨 Oligo設計引物,就是這麼簡單
64:跟著13分文章學作圖,等著收穫SCI吧(origin8教程)
65:乾貨 磷酸化抗體使用必殺技
66:Discussion寫作模板:從3分、5分到10分
67:一文包會:Web of science資料庫應用寶典
68:讀圖 qPCR那些奇奇怪怪的曲線都代表啥?
69:MicroRNA,如何實現從零基礎到10分的跨越
70:ELISA實驗操作中值得關注的細節大盤點
回復SCI、國自然、信號通路、CNS、實驗工具、統計查看相應專欄文章!
投稿郵箱: tougao@helixlife.com.cn
合作微信:helixlife6
※免疫組化步驟、結果分析及注意事項……
※基因表達調控之DNA、RNA和蛋白質的三角戀
※聚焦諾貝爾醫學獎,自噬系統的前世今生
※諾獎熱點人物Alberts:從熊孩子到科教明星
※笑中有深意:搞笑諾獎里的設計思路探討
TAG:解螺旋 |
※「詞嵌入」在NLP中扮演什麼角色?一文搞懂Word Embeddings背後原理
※用一個bug搞懂什麼是JavaScript函數節流
※iPhone的AirDrop功能,你應該沒搞懂是幹嘛的!
※三分鐘,讓你搞懂MartiDerm四款熱門安瓶!
※搞懂merge和rebase的區別
※買 iPhone 8、8 Plus 前要搞懂的 8 件事!
※關於js中的arguments,只需要搞懂這三點
※一篇搞懂 Apple Watch 3到底值不值得買
※你的肌膚值得最好的!3分鐘搞懂FANCL無添加
※問問FinTech:搞懂電子支付、第三方支付、移動支付
※iPhone8到底多大?2張對比圖讓你一秒搞懂!
※MQL5 語言系列學習一 (怎麼快速搞懂一個用MQL5編寫的策略的功能與使用方法)
※iOS11與iOS10有什麼不同?6張對比圖讓你一秒搞懂!
※1分鐘搞懂 CPU該買多核還是高主頻?
※我們完美預測了 HTC 這款 VR 新品,但卻沒搞懂這家公司想要幹嘛……
※這些問題都沒搞懂?你秋招別想拿offer了!
※一直沒搞懂原來粉底液、BB霜和CC霜,真正不同在這
※品玩Live私教課筆記:比特幣擴容發生了,提前搞懂那點兒事
※一次搞懂i3 i5 i7處理器怎麼選 傲騰內存能否讓電腦飈起來