當前位置:
首頁 > 最新 > RED——助您探索水稻基因的表達模式

RED——助您探索水稻基因的表達模式

水稻是世界上最為重要的糧食作物之一,在我國已有幾千年的栽培歷史。同時,作為一種重要的模式物種,它也是世界上第一個完成全基因組測序的單子葉植物,為科學家們解析植物生長發育、逆境脅迫應答等重要生物學問題的分子機制,提供良好的研究體系。

近年來,隨著高通量測序技術的迅猛發展,公共資料庫中已經積累了大量來自水稻不同組織、發育時期、環境脅迫及實驗處理下的基因表達原始數據(SRA Raw Reads)。如果能夠將這些海量數據進行有效地處理、加工、整合及再利用,就有機會幫助科研人員從更為全面的角度來探索某一水稻基因在大量組織、多種狀態下的表達規律。不僅能極大地推動水稻轉錄學的發展,還可以為分子生物學家們在基因功能研究時提供強有力的表達數據支持。

圖1. RED的首頁

為此,中國科學院北京基因組研究所,生命與健康大數據中心的科研人員於2017年開發了水稻基因表達庫(RED, Rice Expression Database)。與傳統的水稻資料庫相比,RED將轉錄組測序作為唯一的表達數據入口,利用一套以(Hisat2 + Stringtie)為主體的高效分析流程,對公共資料庫中海量的水稻轉錄組原始Reads進行整合分析。從而實現了表達數據從來源到分析流程的統一,令比較同一水稻基因在不同狀態/處理下的表達譜成為了可能。

RED的首頁如圖1所示,簡單質樸的風格中,深藏功與名~

下面通過實際操作,對大家比較關注的幾個問題進行初步的探索。

1

用戶在RED資料庫中能獲得哪些信息?

當然是水稻基因的表達譜信息啦!具體地說,RED目前收錄了五萬多個水稻基因在已公開發表的二十四個水稻轉錄組測序計劃(Projects)中,共計15,847,484個基因表達數據。這些數據涉及到9種不同的水稻組織,284個高質量的RNA-Seq實驗。

當給定某一個具體基因的登錄號(Accession)時,用戶們可以獲得這一個基因在相關組織中的表達量的值(通過FPKM進行衡量與標準化分析),如圖2所示。

圖2. LOC_Os06g47890基因表達量的箱線圖

與此同時,用戶們還可以獲得該基因在不同組織、實驗處理下的基因表達譜熱圖。

圖3. LOC_Os06g47890基因表達量的熱圖

所有這些圖片,用戶們均可以保存到本地,並在各自的項目中免費使用。值得一提的是,貼心的開發者們給大家提供了多種下載格式,除了常規的點陣圖PNG和JPEG以外,小夥伴們還可以獲得對應的矢量圖(SVG)或PDF文檔,以方便根據各自所需要的風格進行後續編輯。

除此以外,RED資料庫還提供了水稻基因具體的meta信息,如該基因在不同版本水稻注釋系統中的登錄號(Accession),基因Symbol,染色體及位置信息及功能描述等。

圖4. LOC_Os06g47890基因的meta 信息

2

如何在RED中搜索到想要的信息呢?

RED提供了多種信息檢索方式:(1)首先,用戶可以提交某一個水稻基因的ID (如,Os01g0803200)對其表達譜直接進行查詢;(2)其次,用戶可以通過提供一個Ontology ID,來 對具有指定 Ontology 詞條的基因進行檢索;(3)用戶還可以輸入一個Project ID以便對NCBI中某一個具體的水稻轉錄組測序計划進行查詢;(4)最後,RED還允許用戶對指定染色體區域中的基因的表達譜進行檢索。

圖5. RED資料庫的信息檢索界面

3

RED資料庫中是否提供了分析工具?

當然有!RED除了給大家帶了豐富的水稻基因表達譜信息,還給大家提供了一些實用的在線分析工具。如水稻基因共表達網路分析工具(co-search)和管家基因/組織特異基因篩選工具(HK-TS):

圖6. RED資料庫的co-search工具展示

用戶可以提供一個基因列表,並設置相應的皮爾森相關係數,點擊「Search」,既可以完成網路共表達網路圖的構建。

圖7. 以LOC_Os01g09252和LOC_Os01g08420為主節點的共表達網路分析展示

(2)水稻管家基因/組織特異性基因鑒定工具(http://expression.ic4r.org/hk-ts),這個工具利用基因表達特異性指數 — tau值來衡量水稻基因表達的穩定性。tau值越大的基因越傾向組織特異性基因,tau值越小則越傾向於持家基因。用戶可以根據需求自己定義tau值,來進行篩選。

圖8. RED資料庫的HK/TS工具展示

4

RED中的數據是否可以免費下載?

那是當然的啦!RED提供了豐富的下載內容:如水稻基因在不同組織、不同發育時期、不同實驗處理下的表達量矩陣(FPKM值);每個SRA項目通過分析所產生的bedGraph文件;基因之間的共表達數據(co-expression data);參考基因組信息等等。所有這些信息和數據大家都可以免費下載,並用於自己的實際項目。不過還是建議大家使用到RED的數據後,可以引用主頁中的相關論文,以對研究人員表示鼓勵~

圖9. RED的所提供下載的數據

好啦,還在等什麼!水稻基因表達資料庫(RED) 約嗎?!


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!

TAG: |