這些軟體讓單細胞測序分析越來越Easy
單細胞生物學成了時下熱門話題,這其中最前沿的便是單細胞RNA測序(scRNA-Seq)。
傳統的「大量細胞(bulk)」RNA測序法是一次處理成千上萬個細胞,然後抹平它們之間的差異。但世上沒有兩個相同的細胞,而scRNA-seq可以找出造成各細胞差異的那些微妙改變。它甚至能定義全新的細胞類型。
比如說來自博大研究所的Aviv Regev和她的同事們,在運用scRNA-seq檢測了約2400個免疫系統細胞後,發現一些樹突細胞能刺激T細胞活化。
A.-C. Villani et al. Science 356, eaah4573; 2017.
最近Regev接受了Nature的專訪,說疫苗刺激了這些細胞則有潛力激發免疫系統,預防癌症。
這些發現是來之不易的。操縱單個細胞比操縱千軍萬馬難多了,又由於每個細胞只能得到一小丟丟RNA,所以誤差必須控制得很小。還有個問題就是處理其生成的磅礴數據——不僅僅是因為工具反直覺。
一個典型的RNA-seq數據的分析方法,是要辛辛苦苦在Unix操作系統上輸入命令行。數據文件從一個軟體包流轉到另一個包,每個包執行一個步驟:比對,質控,識別變異,等等。
這個過程很複雜。但要是大量細胞測序呢,至少每個步驟用哪種演算法,以及如何運用,都是有業內共識的。於是就形成了「流水線」,哪怕不是即插即用,至少對非專業人士來說也是溫順馴服的。英國癌症研究所的計算生物學家Aaron Lun說,要分析基因表達的差異,大量細胞RNA-seq的問題早就解決了。
scRNA-seq就不是這樣,研究者們還在研究他們拿到數據後可以做些什麼,以及哪種演算法最有用。
但也湧現了一批網路在線資源和工具,能夠使scRNA-seq的數據分析更容易。在GitHub的一個叫「Awesome Single Cell」的頁面上,整理了70多種工具和資源,涵蓋分析過程的每一個步驟。華盛頓大學的生物學家Cole Trapnell說,這個領域已經孵化出了一個計算生物學工具的小產業村。
https://github.com/seandavi/awesome-single-cell
單細胞分析工具的發展史
夏威夷大學的生物信息學家lana Garmire在去年發表的一篇綜述中列舉了scRNA-seq數據分析的基本步驟和48種工具。
O. B. Poirion et al. Front. Genet. 7, 163; 2016.
她說,雖然每個實驗都是獨特的,但大多數分析流水線還是依據一樣的步驟來清洗、篩選測序數據,找出是哪個轉錄本在表達,還要校正擴增造成的差異。研究者們會繼續跑一個或多個後續分析,來檢測亞組和其他功能。
威斯康星大學的生物統計學家Christina Kendziorski說,在許多情況下,大量細胞RNA-seq所用的工具對scRNA-seq也還適用。但數據上的根本差異意味著,這並不是永遠都行得通。Lun說,有一點值得注意,單細胞數據的噪點更多。處理這一小丟丟RNA,擴增和捕獲時失之毫釐,便會在細胞之間謬以千里,日復一日,最後玩的就不是生物了。
所以研究者們必須警惕「批處理效應」,不是同一天處理的細胞看起來很有個性,可能只是純粹的技術原因造成的,還有那些「漏網之魚」——在細胞中明明表達了的基因,測序數據中卻沒有撈到。
悉尼張任謙心臟研究所的生物信息學家Joshua Ho說,還有一個挑戰是規模。一個典型的大量細胞RNA-seq實驗通常收納少數樣本,但scRNA-seq則一來就是好幾千。原來那些處理幾十個樣本的工具塞給它十倍百倍的數據量,處理速度就成了龜爬。
哪怕是像怎麼製備細胞才算好這樣看起來很簡單的問題,放到scRNA-seq領域也會變複雜。Lun的工作流程是先假設大多數細胞都有近似等量的RNA丰度。他說,「可是這個假設未必就是真的。」比如,初始T細胞,尚未被抗原激活時相對靜態,它的mRNA相對其他免疫細胞就比較少,在分析時可能就會被移除,因為程序認為沒有足夠的RNA可以處理。
也許最重要的一點是,用scRNA-seq做研究的人,問的問題都跟做大量細胞RNA分析的不一樣。大量細胞分析一般研究兩種或以上的干預方法中,基因表達有什麼不同。但跟單細胞玩耍的研究者的目標則是鑒定新的細胞類型或狀態,或重建細胞發育通路。Lun說,「因為目標不一樣,則必然要用到不同的工具來分析數據。」
比如單細胞分析的一個常見方法就是降維處理。這是將數據簡單化,以便鑒別相似的細胞。如英國劍橋的威康信託桑格研究所的計算生物學家Martin Hemberg所說,在scRNA-seq數據中,每個細胞都是由2萬個基因表達值組成的表單(list)。降維演算法,如主成分分析(PCA)和t分布隨機鄰域嵌入(t-SNE),可以有效把數據變成二維或三維圖形,使相似細胞的聚類特徵更明顯。
另一個常用的方法是偽時間分析法(pseudo-time analysis)。2014年Trapnell開發了第一個運行這個演算法的工具,叫Monocle。他說這個軟體是運用機器學習,從一個scRNA-seq實驗推測細胞分化過程中伴隨的有基因表達改變的序列,就像從競走比賽的航拍照片推測比賽路線。
其他工具則用於檢測亞組(比如波士頓哈佛大學醫學院的Peter Kharchenko開發的Pagoda),還有空間定位,即利用組織中基因表達分布的數據,了解每個轉錄組都在組織的哪些地方出沒。紐約基因組中心的Rahul Satija是Regev的博士後,他就為此開發了一個叫Seurat的R語言包。他說Seurat是利用數據把細胞在三維空間中定位為一個點,這就是它的名字Seurat的由來,那些數據畫成的點看起來像一幅點彩派畫作。
左:畫家Seurat的作品 右:R包Seurat的作品(Nature Biotechnology. 2015; 33, 495–502.)
儘管這些工具都是為某個特定目的開發的,但通常也都包含多種功能。就說Seurat吧,除了上述的空間定位,還配備了細胞亞組分析的功能,那是Regev的組用來鑒定新的免疫細胞類型所需要的。
大多數scRNA-seq工具都是Unix程序或R語言包,但相對來說還是很少有生物學家喜歡使用這些開發環境,加州大學聖迭戈分校的生物信息學家Gene Yeo說,就算喜歡,也可能沒時間下載並配置好運行所需的一切。
於是有人開發了一些開袋即食型(原諒吃貨小編想不到更貼切的形容詞)工具。另外還有一些端對端的作圖工具,包括FlowJo的SeqGeq商業程序包,還有一組開源的網頁工具:Garmire組開發的Granatum(拉丁文:石榴),還有瑞士聯邦理工學院的生物工程師Bart Deplancke實驗室的ASAP(the Automated Single-cell Analysis Pipeline)。
http://garmiregroup.org/granatum/code
ASAP和Granatum都是用網頁瀏覽器來呈現相對簡單、互動的工作流程,讓研究者們能用圖形方式來探索自己的數據。用戶上傳數據,軟體就依流程一步步運行。
還是ASAP畫風最正 https://asap.epfl.ch/
對ASAP來說,就是帶著數據過一遍預處理、可視化、聚類、差異基因表達分析;Granatum還包括偽時間分析,並整合了蛋白質相互作用數據。
Garmire和Deplancke都說,ASAP和Granatum的設計是為了讓研究者和計算生物學家能夠好好合作。夏威夷大學的博士生、Granatum的開發組組長Xun Zhu說,研究者們曾經以為生物信息學家是有魔力的生靈,拿到數據魔杖一揮就能生成結果。現在他們也可以參與進來,調整一下參數就行,這很好。
工具雖好,還要謹慎選擇
這些工具當然也不是各種情況下都完美。比如一個擅長鑒定細胞類型的工具,用來做偽時間分析可能就笨手笨腳。再說了,最合適的方法也是由每個數據集來決定的,加州大學伯克利分校的生物統計學家Sandrine Dudoit說,這些方法和參數的調整要能解釋不同的變數,比如測序長度。
但英國癌症研究所的John Marioni說,不要一切都指望流水線。「就像衛星導航讓你往河裡開車,你還真開進去啊?」
新手尤其要謹慎。生物信息學工具幾乎總是能給你找到一個答案,問題是,這個答案真的有意義嗎?Dudoit的建議是做些探索性分析,再核查一下你選的那個演算法所基於的假設是否能說明問題。
Satija說,有些分析任務還是面臨很多挑戰的,包括比較不同實驗條件下或不同有機體之間的數據集,還有整合不同組學的數據。他還表示,Seurat正在計劃中的更新版本就要解決第一個問題。
但現在也已經有足夠多的工具讓研究者們使用了。Kendziorski建議感興趣的人自己多多挖掘。每一個新工具都能揭開生物學的一層面紗,只要你留意科學進展,明辨是非。
原文:
http://www.nature.com/news/single-cell-sequencing-made-simple-1.22233
如果想看全部的文獻精讀課,可以掃下面的二維碼購買課程錄播(課程有效期至2018年12月31日),想怎麼看就怎麼看。
※投什麼雜誌引什麼文章,有個神器可以幫你!
※「笑氣」風行,小心笑著笑著就沒氣兒了
※知道通路中的相關靶點,要怎麼來驗證呢?
※全基因組關聯研究十年蹤跡,下一個十年要去哪裡?
※阿茲海默病進展盤點:一些另類的研究視角
TAG:解螺旋 |
※Facebook數據泄露細節曝光 起因於一款個性分析測試軟體
※muncy惡意軟體分析
※新iPad?這些軟體你一定要了解一下!iPad常用軟體分享
※windows系統檢測硬碟壞道只需要這個軟體即可了
※如何使用Python腳本分析惡意軟體
※這些軟體不知道,別叫自己是Sneaker
※PyLocky勒索軟體分析
※AI不只是軟體,在vivo NEX上是這些造就出眾AI體驗
※Mytoken項目分析報告-行情分析軟體第一個吃螃蟹的項目
※果粉態度熱評:你為iPhone的硬體or 軟體買單?
※WannaCry陰魂不散 仍然是最流行的勒索軟體
※英語啟蒙,這個sight words軟體不能錯過
※老牌監控軟體Nagios可視化解決方案總結
※為什麼iPhoneXR不能安裝殺毒軟體?看完這3點你就懂了!
※如何在 Linux 中不安裝軟體測試一個軟體包
※用Python做一個翻譯軟體
※新型密碼竊取軟體AcridRain的分析
※CrossRat遠程控制軟體的分析
※不用花錢,這個軟體讓你的windows的字體效果堪比Mac os
※蘋果iPhone手機上線股票軟體數字貨幣行情 Mac受惡意挖礦軟體攻擊