當前位置:
首頁 > 最新 > 這些軟體讓單細胞測序分析越來越Easy

這些軟體讓單細胞測序分析越來越Easy

單細胞生物學成了時下熱門話題,這其中最前沿的便是單細胞RNA測序(scRNA-Seq)。

傳統的「大量細胞(bulk)」RNA測序法是一次處理成千上萬個細胞,然後抹平它們之間的差異。但世上沒有兩個相同的細胞,而scRNA-seq可以找出造成各細胞差異的那些微妙改變。它甚至能定義全新的細胞類型。

比如說來自博大研究所的Aviv Regev和她的同事們,在運用scRNA-seq檢測了約2400個免疫系統細胞後,發現一些樹突細胞能刺激T細胞活化。

A.-C. Villani et al. Science 356, eaah4573; 2017.

最近Regev接受了Nature的專訪,說疫苗刺激了這些細胞則有潛力激發免疫系統,預防癌症。

這些發現是來之不易的。操縱單個細胞比操縱千軍萬馬難多了,又由於每個細胞只能得到一小丟丟RNA,所以誤差必須控制得很小。還有個問題就是處理其生成的磅礴數據——不僅僅是因為工具反直覺。

一個典型的RNA-seq數據的分析方法,是要辛辛苦苦在Unix操作系統上輸入命令行。數據文件從一個軟體包流轉到另一個包,每個包執行一個步驟:比對,質控,識別變異,等等。

這個過程很複雜。但要是大量細胞測序呢,至少每個步驟用哪種演算法,以及如何運用,都是有業內共識的。於是就形成了「流水線」,哪怕不是即插即用,至少對非專業人士來說也是溫順馴服的。英國癌症研究所的計算生物學家Aaron Lun說,要分析基因表達的差異,大量細胞RNA-seq的問題早就解決了。

scRNA-seq就不是這樣,研究者們還在研究他們拿到數據後可以做些什麼,以及哪種演算法最有用。

但也湧現了一批網路在線資源和工具,能夠使scRNA-seq的數據分析更容易。在GitHub的一個叫「Awesome Single Cell」的頁面上,整理了70多種工具和資源,涵蓋分析過程的每一個步驟。華盛頓大學的生物學家Cole Trapnell說,這個領域已經孵化出了一個計算生物學工具的小產業村。

https://github.com/seandavi/awesome-single-cell

單細胞分析工具的發展史

夏威夷大學的生物信息學家lana Garmire在去年發表的一篇綜述中列舉了scRNA-seq數據分析的基本步驟和48種工具。

O. B. Poirion et al. Front. Genet. 7, 163; 2016.

她說,雖然每個實驗都是獨特的,但大多數分析流水線還是依據一樣的步驟來清洗、篩選測序數據,找出是哪個轉錄本在表達,還要校正擴增造成的差異。研究者們會繼續跑一個或多個後續分析,來檢測亞組和其他功能。

威斯康星大學的生物統計學家Christina Kendziorski說,在許多情況下,大量細胞RNA-seq所用的工具對scRNA-seq也還適用。但數據上的根本差異意味著,這並不是永遠都行得通。Lun說,有一點值得注意,單細胞數據的噪點更多。處理這一小丟丟RNA,擴增和捕獲時失之毫釐,便會在細胞之間謬以千里,日復一日,最後玩的就不是生物了。

所以研究者們必須警惕「批處理效應」,不是同一天處理的細胞看起來很有個性,可能只是純粹的技術原因造成的,還有那些「漏網之魚」——在細胞中明明表達了的基因,測序數據中卻沒有撈到。

悉尼張任謙心臟研究所的生物信息學家Joshua Ho說,還有一個挑戰是規模。一個典型的大量細胞RNA-seq實驗通常收納少數樣本,但scRNA-seq則一來就是好幾千。原來那些處理幾十個樣本的工具塞給它十倍百倍的數據量,處理速度就成了龜爬。

哪怕是像怎麼製備細胞才算好這樣看起來很簡單的問題,放到scRNA-seq領域也會變複雜。Lun的工作流程是先假設大多數細胞都有近似等量的RNA丰度。他說,「可是這個假設未必就是真的。」比如,初始T細胞,尚未被抗原激活時相對靜態,它的mRNA相對其他免疫細胞就比較少,在分析時可能就會被移除,因為程序認為沒有足夠的RNA可以處理。

也許最重要的一點是,用scRNA-seq做研究的人,問的問題都跟做大量細胞RNA分析的不一樣。大量細胞分析一般研究兩種或以上的干預方法中,基因表達有什麼不同。但跟單細胞玩耍的研究者的目標則是鑒定新的細胞類型或狀態,或重建細胞發育通路。Lun說,「因為目標不一樣,則必然要用到不同的工具來分析數據。」

比如單細胞分析的一個常見方法就是降維處理。這是將數據簡單化,以便鑒別相似的細胞。如英國劍橋的威康信託桑格研究所的計算生物學家Martin Hemberg所說,在scRNA-seq數據中,每個細胞都是由2萬個基因表達值組成的表單(list)。降維演算法,如主成分分析(PCA)和t分布隨機鄰域嵌入(t-SNE),可以有效把數據變成二維或三維圖形,使相似細胞的聚類特徵更明顯。

另一個常用的方法是偽時間分析法(pseudo-time analysis)。2014年Trapnell開發了第一個運行這個演算法的工具,叫Monocle。他說這個軟體是運用機器學習,從一個scRNA-seq實驗推測細胞分化過程中伴隨的有基因表達改變的序列,就像從競走比賽的航拍照片推測比賽路線。

其他工具則用於檢測亞組(比如波士頓哈佛大學醫學院的Peter Kharchenko開發的Pagoda),還有空間定位,即利用組織中基因表達分布的數據,了解每個轉錄組都在組織的哪些地方出沒。紐約基因組中心的Rahul Satija是Regev的博士後,他就為此開發了一個叫Seurat的R語言包。他說Seurat是利用數據把細胞在三維空間中定位為一個點,這就是它的名字Seurat的由來,那些數據畫成的點看起來像一幅點彩派畫作。

左:畫家Seurat的作品 右:R包Seurat的作品(Nature Biotechnology. 2015; 33, 495–502.)

儘管這些工具都是為某個特定目的開發的,但通常也都包含多種功能。就說Seurat吧,除了上述的空間定位,還配備了細胞亞組分析的功能,那是Regev的組用來鑒定新的免疫細胞類型所需要的。

大多數scRNA-seq工具都是Unix程序或R語言包,但相對來說還是很少有生物學家喜歡使用這些開發環境,加州大學聖迭戈分校的生物信息學家Gene Yeo說,就算喜歡,也可能沒時間下載並配置好運行所需的一切。

於是有人開發了一些開袋即食型(原諒吃貨小編想不到更貼切的形容詞)工具。另外還有一些端對端的作圖工具,包括FlowJo的SeqGeq商業程序包,還有一組開源的網頁工具:Garmire組開發的Granatum(拉丁文:石榴),還有瑞士聯邦理工學院的生物工程師Bart Deplancke實驗室的ASAP(the Automated Single-cell Analysis Pipeline)。

http://garmiregroup.org/granatum/code

ASAP和Granatum都是用網頁瀏覽器來呈現相對簡單、互動的工作流程,讓研究者們能用圖形方式來探索自己的數據。用戶上傳數據,軟體就依流程一步步運行。

還是ASAP畫風最正 https://asap.epfl.ch/

對ASAP來說,就是帶著數據過一遍預處理、可視化、聚類、差異基因表達分析;Granatum還包括偽時間分析,並整合了蛋白質相互作用數據。

Garmire和Deplancke都說,ASAP和Granatum的設計是為了讓研究者和計算生物學家能夠好好合作。夏威夷大學的博士生、Granatum的開發組組長Xun Zhu說,研究者們曾經以為生物信息學家是有魔力的生靈,拿到數據魔杖一揮就能生成結果。現在他們也可以參與進來,調整一下參數就行,這很好。

工具雖好,還要謹慎選擇

這些工具當然也不是各種情況下都完美。比如一個擅長鑒定細胞類型的工具,用來做偽時間分析可能就笨手笨腳。再說了,最合適的方法也是由每個數據集來決定的,加州大學伯克利分校的生物統計學家Sandrine Dudoit說,這些方法和參數的調整要能解釋不同的變數,比如測序長度。

但英國癌症研究所的John Marioni說,不要一切都指望流水線。「就像衛星導航讓你往河裡開車,你還真開進去啊?」

新手尤其要謹慎。生物信息學工具幾乎總是能給你找到一個答案,問題是,這個答案真的有意義嗎?Dudoit的建議是做些探索性分析,再核查一下你選的那個演算法所基於的假設是否能說明問題。

Satija說,有些分析任務還是面臨很多挑戰的,包括比較不同實驗條件下或不同有機體之間的數據集,還有整合不同組學的數據。他還表示,Seurat正在計劃中的更新版本就要解決第一個問題。

但現在也已經有足夠多的工具讓研究者們使用了。Kendziorski建議感興趣的人自己多多挖掘。每一個新工具都能揭開生物學的一層面紗,只要你留意科學進展,明辨是非。

原文:

http://www.nature.com/news/single-cell-sequencing-made-simple-1.22233

如果想看全部的文獻精讀課,可以掃下面的二維碼購買課程錄播(課程有效期至2018年12月31日),想怎麼看就怎麼看。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 解螺旋 的精彩文章:

投什麼雜誌引什麼文章,有個神器可以幫你!
「笑氣」風行,小心笑著笑著就沒氣兒了
知道通路中的相關靶點,要怎麼來驗證呢?
全基因組關聯研究十年蹤跡,下一個十年要去哪裡?
阿茲海默病進展盤點:一些另類的研究視角

TAG:解螺旋 |

您可能感興趣

Facebook數據泄露細節曝光 起因於一款個性分析測試軟體
muncy惡意軟體分析
新iPad?這些軟體你一定要了解一下!iPad常用軟體分享
windows系統檢測硬碟壞道只需要這個軟體即可了
如何使用Python腳本分析惡意軟體
這些軟體不知道,別叫自己是Sneaker
PyLocky勒索軟體分析
AI不只是軟體,在vivo NEX上是這些造就出眾AI體驗
Mytoken項目分析報告-行情分析軟體第一個吃螃蟹的項目
果粉態度熱評:你為iPhone的硬體or 軟體買單?
WannaCry陰魂不散 仍然是最流行的勒索軟體
英語啟蒙,這個sight words軟體不能錯過
老牌監控軟體Nagios可視化解決方案總結
為什麼iPhoneXR不能安裝殺毒軟體?看完這3點你就懂了!
如何在 Linux 中不安裝軟體測試一個軟體包
用Python做一個翻譯軟體
新型密碼竊取軟體AcridRain的分析
CrossRat遠程控制軟體的分析
不用花錢,這個軟體讓你的windows的字體效果堪比Mac os
蘋果iPhone手機上線股票軟體數字貨幣行情 Mac受惡意挖礦軟體攻擊