當前位置:
首頁 > 新聞 > 轉錄組分析的正確姿勢

轉錄組分析的正確姿勢

轉錄組分析是目前應用最廣的高通量測序分析技術之一。常見設計是不同樣品之間比較,尋找差異基因、標誌基因、協同變化基因、差異剪接和新轉錄本,並進行結果可視化、功能注釋和網路分析等。

轉錄組的測序分析也相對成熟,從RNA提取、構建文庫、上機測序再到結果解析既可以自己完成,又可以在專業公司進行。概括來看轉錄組的分析流程比較簡單,-----。整個環節清晰流暢,可以作為最開始接觸高通量測序學習最合適的技術之一。

但重點和難點在於理解這些過程都是怎麼做的,有什麼需要注意的,結果怎麼解讀,後續分析怎麼做。這些只有自己動手操作過,才可能有理解。而理解了一個,再去做其它類型分析,也會輕鬆很多。

實驗設計這塊重要的是對照和至少個生物學重複,並選擇合適的測序通量。要求重複之間的值大於(遺傳背景不一致的生物重複相關係數要大於)。定量基因表達和評估轉錄圖譜相似性只需要中等測序深度;而研究新轉錄本和可變剪接則需要更深的測序;一般來講長RNA-seq文庫測序深度滿足在(如果測PE150,換算成鹼基數為6G-9G)。

另外一個需要注意的是測序的批次效應,保證自己的樣品同時處理、RNA同時提取、同時構建文庫和上機測序。這些環節雖然不能總受我們控制,但記錄下對應的操作時間和批次,最後在繪製表達圖譜時與實驗相關參數進行關聯展示,從而保證結果沒有受到試驗中處理批次的影響。計劃有一篇文章在比較人和小鼠不同組織的表達譜相似度時得到的結果是樣品按物種而非組織聚在一起,這與之前認為的發育通路的保守性不符。後來發現是測序批次搗的鬼,做了批次效應矯正後,表達圖譜按組織而非物種聚在一起了(文章見文末鏈接)。

測序環節通常不需要自己操作,測序公司都很成熟,但測序的原理需要知道。這會影響到後續分析時參數的選擇,比如知道什麼是插入片段大小,什麼是鏈特異性測序,什麼情況會有接頭序列,雙端測序如何測等。

獲得數據後,就涉及到數據的傳輸和質量評估(也包括如何從公共資料庫下載數據)和文件格式的轉換。FASTQ格式解釋和質量評估中有些提及。質量評估的意義在於從測序質量角度評價建庫和測序的成功與否,指導接頭和低質量鹼基的去除。這一步參數控制的嚴格與否對後續的比對會有影響,同時也會受到後續分析選擇的工具的影響。對Linux系統一定程度的了解,是進行這些工作的基礎。

39個轉錄組分析工具,120種組合評估(轉錄組分析工具哪家強)中講述了如何選擇、評估合適的比對工具,序列拼裝工具,定量工具和差異分析工具。值得我們在進入正式的分析之前,仔細閱讀。另外類似的評估文章,還有幾篇,都可以一併讀一下,這樣在後期分析時對工具的選擇和使用才更得心應手。

工具比較類文章一般只告訴你做了什麼,不告訴你這麼做的原因是什麼,而且每一步細分開來又有很多小細節需要注意,比如在比對環節就會涉及到:不同的樣本如何選擇合適的基因組和注釋文件,什麼樣的軟體支持Junction reads的比對,什麼樣的比對率是合適的,比對質量怎樣,測序中RNA有無降解或選擇偏好性,測序飽和度如何等。

這些可能都不會體現在最終的結果中,但都是確保後期結果可靠性所必須要做的事情。2002年諾貝爾獎得主曾對數據分析做過提醒。軟體是死的,提供了格式正確的輸入,就可以得到輸出,但輸出正確與否,就得靠人的經驗來判斷了。

在後面的差異基因鑒定階段,還存在把值轉換為整數再提交給做分析的,軟體不報錯,但結果不對。或者能順著教程運行分析,但換成自己的數據就不知道如何下手的。這些問題都需要在實踐過程中持續不斷的試錯、閱讀更多的文章和教程來步步矯正。這當然是一個耗時耗力的過程,那麼有沒有一個更好的方式呢?

生信寶典團隊經過緊張的籌備,決定推出一系列的針對生信學習和高通量分析的學習小組(在生信學習系列教程的基礎上進一步拓展和深入),跟大家一起去走過這段歷程。我們的口號是,希望能通過短暫高強度的訓練快速推進大家在生信分析領域的進展。

中國生物技術網誠邀生物領域科學家在我們的平台上,發表和介紹國內外原創的科研成果。

本公眾號由中國科學院微生物研究所信息中心承辦

微信公眾號:中國生物技術網

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 中國生物技術網 的精彩文章:

中國專家破解本土小麥品質的「生命密碼」,育成18個新品種
微生物所解碼微管精準切割機制
神奇蘑菇或能改變抑鬱症患者大腦
淺談人類遺傳資源管理變革
科學證實:生育能力測試並不靠譜!

TAG:中國生物技術網 |