MEV 聚類-助力轉錄組分析,成就大paper!
主題
今天是聚類時間!啥叫聚類,本意就是將相似的東西聚到一起,其實在我們的試驗中,我們一直都在用。啥?沒聽錯吧?
來,舉個栗子!
歷史回顧
原核生物
細菌多樣性研究的時候,可以通過16S序列設計保守序列引物,對引物進行擴增,當然也可以用隨機引物擴增基因組DNA,之後用電泳分離擴增後的DNA,對細菌進行OTU分群,在二代測序之前,做環境微生物多樣性,一直是這樣做的。
真核生物
我們可以對不同組織,多個基因進行表達聚類分析!熱圖旁邊的這些樹都是聚類結果。
我們都知道了,你還講個毛線?
No! 我們今天換個口味,這不是簡單的聚類,是將轉錄水平相似的基因聚到一起,看聚到一起的這些基因有沒有什麼共同的功能或者其他共同特點。
這個是轉錄組深度挖掘的一部分,助你成就 大paper!
大家來看下圖,這就是聚類中的某一個cluster,每一條灰線都是一個基因的動態表達量,X軸每個時間點代表一個表達時間序列或者不同組織,縱坐標就是表達量的標準化。
定義
這種聚類今天我們使用什麼方法呢,K-means clustering。其主要是來計算數據聚集的演算法,主要通過不斷地取離種子點最近均值的演算法,演算法要求我們輸入聚類個數k,以及包含 n個數據對象的資料庫,輸出滿足方差最小標準的k個聚類。
軟體
今天我們涉及到的軟體是MEV,是windows下的一個軟體。等了這麼久,終於有一個windows下的軟體出來了。Sure, 也有linux 版本,用法一樣。
https://sourceforge.net/projects/mev-tm4/
使用方法
雙擊打開
導入數據
數據格式
第二列開始是樣品,或者不同時期,第一列是基因名稱,第一行是表頭。數字是表達量,當然例子是晶元數據。
聚類
數據導進去之後,軟體已經自動mapping上顏色了,當然我們可以用mev像往常一樣做熱圖。那麼怎麼做k-means聚類呢?看圖說話
下圖就是選擇要聚多少類,自己循環次數。
這兩個數值可以進行多次運算,最終選擇自己認為最好的。運算結果幾乎是瞬間返回!
結果
下圖就是聚類結果,左邊菜單可以查看不同結果。
最後我們可以將結果導出,保存成圖片或者txt。
接下來的分析就很明顯了,我們要進一步看每個類別中是什麼基因,什麼功能類就富集,或者有沒有共同的調控基因,以及啟動子。
還要進一步的話,我們可以做實驗進行驗證。
來看一篇2015年的文章:
Mu?oz J F, Gauthier G M, Desjardins C A, et al. The Dynamic Genome and Transcriptome of the Human Fungal Pathogen Blastomyces and Close Relative Emmonsia.[J]. Plos Genetics, 2015, 11(10):e1005493.
這是02年的:
Gasch A P, Eisen M B. Exploring the conditional coregulation of yeast gene expression through fuzzy k-means clustering[J]. Genome Biology, 2002, 3(11):RESEARCH0059.
都用到了K-Means 聚類!
歡迎分享!歡迎主動分享朋友圈!
千人QQ大群,請入!


※RNA-seq結果中,我們應該如何對待超低丰度基因?
※空間轉錄組?這貨是什麼?
TAG:生信百科 |
※Angew.Chem.Int.Ed:適配體介導的原位空間互補技術進行活細胞內天然RNA轉錄的實時成像
※Science:六倍體小麥轉錄組總覽
※使用inferCNV來推斷CCLE轉錄組數據的拷貝數變異
※CRSPER-dCas9在基因轉錄調控中的應用
※Nature Letter系統分析1699例兒童白血病和實體瘤基因組和轉錄組
※Facebook 被指僱傭承包商審查轉錄用戶的 Messenger 錄音
※ChIP:ChIP-SICAP專註於染色質轉錄調控機制發掘
※重磅消息:諾禾致源10X Genomics單細胞轉錄組產品全新升級
※Facebook支付數百名承包商轉錄用戶音頻
※梅奧診所或裁400名轉錄員:Epic EHR系統成功部署引發的問題
※Plant Cell經典案例:從組學數據到轉錄因子調控網路建構
※曹雪濤組Nature揭示TET2參與基因表達轉錄後調控的新模式
※精神疾病轉錄組分析 《Science》揭示轉錄組變化的遺傳基礎
※Cell Stem Cell:一種關鍵的轉錄因子或能促進幹細胞分化形成心血管系統和肌肉骨骼系統
※Nature丨廈大/UCB周強組揭示相分離對基因轉錄調控的分子機制——剛柔並濟的分子調節及藥物開發新理論
※Nat Neurosci:只需加入兩種轉錄因子 科學家就能將非神經元細胞成功重編程為神經元細胞
※Nature:FOX轉錄因子突變方式詮釋前列腺癌治療新靶點
※Nat Commun:在抗逆轉錄病毒治療期間,大多數HIV病毒的持續存在是由於受感染細胞的增殖
※兩篇《Science》聚焦真渦蟲的單細胞轉錄組圖譜
※PNAS:中科院微生物所在效應性Treg細胞分化的轉錄調控方面取得重要進展