當前位置:
首頁 > 知識 > GWAS+WGCNA分析——微效多基因控制的數量性狀定位的好方法

GWAS+WGCNA分析——微效多基因控制的數量性狀定位的好方法

GWAS(Genome-wide association studu),即全基因組關聯分析,是對遺傳多樣性豐富的自然群體中的每個個體進行高通量測序,獲得數以百萬計的SNP分子標記,結合目標性狀的表型數據運用一定的統計方法進行關聯分析,從而快速準確地定位到影響目標性狀的染色體區段或基因。該方法是研究複雜性狀遺傳的有力工具,已經廣泛應用於眾多物種的功能基因挖掘中,用於識別影響複雜性狀遺傳變異和數量性狀位點。

但是GWAS分析也有其局限性,即對微效多基因控制的數量性狀的檢測能力不足,這是因為微效多基因控制的數量性狀,每個基因對性狀的貢獻度都很小,在GWAS分析中往往達不到顯著水平,從而不能被準確挖掘出來。

WGCNA(weighted gene co-expression network analysis),即權重基因共表達網路分析,該分析方法旨在尋找協同表達的基因模塊(module),並探索基因網路與關注的表型之間的關聯關係,以及網路中的核心基因。WGCNA主要包括基因之間相關係數計算、基因模塊的確定、共表達網路、模塊與性狀關聯分析四個步驟。

既然這兩種技術都能鑒定與性狀有關的基因,那麼將這兩種技術結合,是否能夠進行優勢互補,提高對微效位點的檢測能力呢?下面,我們就通過一篇GWAS WGCNA聯合分析的文獻,看下其在水牛產奶量的微效位點挖掘上的威力吧。

論文 ID

文章名稱:Integrative Analysis of Transcriptome and GWAS Data to Identify the Hub Genes Associated With Milk Yield Trait in Buffalo

譯名:轉錄組和GWAS數據聯合分析鑒定與水牛產奶性狀有關的核心基因

發表期刊:frontiers in Genetics

IF4.151

發表時間:2019年

材料與方法

轉錄組測序:生產後7天(D7)、50天(D50)、140天(D140)、280天(D280)的乳腺組織,每個時間點2個重複,其中D7代表泌乳早期、D50代表泌乳高峰期、D140和D280代表泌乳中期和後期。用乳腺組織提取RNA,構建轉錄組文庫,Illumina HiSeq 2000測序。

GWAS分析:基於以前公布的935頭地中海水牛的GWAS資料庫進行基於基因的關聯分析,挖掘低顯著關聯基因(NSGG)。

分析內容

1

乳腺組織mRNA表達模式分析

經過過濾,每個樣品約產生22.14Mb clean reads,約90.89%的clean reads能夠比對到水牛基因組(UOA_WB_1),約74.79%的clean reads是唯一比對。所有RNA-Seq樣品間的皮爾遜相關係數在0.9318-1.0000之間,表明RNA-Seq結果滿足DEG分析的需求。

共鑒定到26,037個mRNA;相比於D7,在D50,D140,D280分別有103,601,439個基因上調,58,440,266個基因下調;相比於D50,D140,D280上調基因的個數分別為164和119;下調基因個數分別為138和137;相比於D140,D280中上調,下調基因個數分別為80和93。共鑒定到1420個差異表達基因(DEGs),在所有不同時間點中都存在的差異基因為17個。下圖為轉錄組分析相關的結果圖。

2

基於基因的全基因組關聯分析結果

通過基於基因的關聯分析,有976個基因(P≤0.05)被認為是NSGG基因(名義顯著關聯基因)。將這些基因用於後續的進一步分析。

3

DEGs和NSGG的網路分析

使用WGCNA演算法確定不同泌乳期乳腺組織差異基因共表達趨勢。其中DEGs形成了7個模塊(164個基因沒有形成模塊,灰色表示),基因個數從44到715個,turquoise(藍綠色)這個模塊包含的差異表達基因個數最多(715個);大部分模塊在乳腺腺體特異性基因本體及已建立的細胞功能中富集。

基於關聯分析得到的NSGG共形成了4個模塊,藍綠色模塊有402個基因,藍色模塊103個,棕色模塊59個,灰色模塊的為65個不相關基因。其中藍綠色模塊和藍色模塊均在the cell part term中顯著富集,棕色模塊在the single-organism process term中顯著富集。藍綠色模塊基因主要在代謝途徑、內噬作用、MAPK信號通路富集;藍色、棕色模塊基因的在Rap1信號通路、ECM受體互作通路富集。

4

鑒定與產奶量有關的模塊

對DEGs與NSGG形成的模塊與產奶量進行相關性分析。DEGs形成的模塊中有5個(藍綠色、黃色、綠色、棕色、紅色)與D7、D280的產奶量有顯著正相關性,藍綠色模塊與D7的產奶量相關性最強(r=0.96),棕色模塊與D280的相關性最強(r=0.92)。在NSGG模塊中,藍綠色模塊與D7的產奶量相關性最強(r=0.96),棕色模塊與D50的產奶量相關性最強。在DEGs和NSGG中都發現藍綠色模塊與D7的產量奶相關性最強,且turquoise模塊的基因主要在代謝途徑富集;且以往的研究表明泌乳早期是乳腺發育的重要時期;推測turquoise模塊中的基因可能與乳腺發育和乳汁分泌有關。

5

鑒定Hub基因

篩選turquoise模塊具有較高MM和GS值的基因為與產奶量有關的hub基因。在DEGs和NSGG的模塊中分別鑒定到了544個和225個基因;二者共有的基因為12個("real"hub genes),繪製了這12個基因的互作網路圖。GO分析發現大部分基因在胞內細胞器,其次是細胞器、胞內部分、胞內和細胞部分富集。

下表是這12個hub genes的列表:

小結

本篇文章是對水牛不同時期乳腺組織進行轉錄組測序分析基因表達模式及進行WGCNA分析的首篇文獻。通過分析,發現turquoise模塊與產奶量緊密相關,通過整合轉錄組和GWAS分析,提高了對微效基因的挖掘效率。鑒定到了12個與產奶量有關的hub genes,有助於更好地了解水牛產奶性狀的遺傳機制。

微分基因為國家大基因中心「基因檢測平台」運營方,專註於高通量測序技術,公司憑藉國際領先的高通量測序平台,依託獨具優勢的高通量基因測序和大數據挖掘技術,為各大高校、醫院、科研單位以及第三方健康管理服務平台,提供專業的基因檢測和數據分析解讀服務。2017年,微分基因在國家大基因中心建成2133平方米的潔凈分子生物實驗室,公司科研團隊匯聚了一批國內外優秀的基因組學實驗和生物信息分析研究人員。

科技服務部依託公司先進的自動化建庫儀、高通量測序儀等實驗設備,提供多種測序服務;憑藉強大的科研團隊,為高校、科研院所等研究單位提供領先的生物信息分析服務。主營業務包括DNA測序、RNA測序、表觀組學測序、單細胞測序、ICELL8單細胞表達譜測序、晶元服務、三代全長轉錄組測序等。

健康|醫療|基因|科普

微分基因科技服務

記得這是一個有溫度的公眾號


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 微分基因 的精彩文章:

TAG:微分基因 |