人類基因組研究的分析環節到底需要您提供哪些信息?
相信每一位做高通量測序項目的老師,都希望測序分析公司能給自己提供一名「專屬」的生信分析大神,和自己一對一溝通,快速、準確get到自己的分析思路。然而,在溝通的道路上,還有銷售、項目管理、技術支持等一堆人的存在,信息傳到最後也許已變了樣。想要保證信息儘可能符合客戶的本意,需要多方共同努力,當然,做好前期的信息收集準備是最基本、也是最不容易在傳遞過程中「失真」的手段。
一般在客戶的樣本進行生信分析前,微分基因的項目管理會給老師發送一個叫做「信息收
集表」的文件,根據產品大方向的類型,往往分為右圖幾大類。每種產品都有自己特有的信息收集點,本帖先就著人類DNA研究產品介紹您在填寫信息收集表時,應該注意哪些點,才能夠保證後端的生信同事明確get到您的需求,不讓雙方來回返工。
填對正確的表!
下圖是人類DNA產品的幾個不同的信息收集表,每個表格對應的分析產品流程存在較大的差別,所以根據您研究的方向選擇合適的表格進行信息填寫是保證信息完整的第一步。
舉個例子,《常規突變分析》對應的分析流程,把每個樣本通過WGS、WES目標區域測序獲得的數據使用GATK軟體單獨call變異,並對變異信息進行統計。如果您給我們提供的是腫瘤配對樣本,想要我們給您檢測的是somatic mutation(常規使用GATK Mutect2流程進行配對分析,對應信息表《腫瘤配對分析》),那麼《常規突變分析》表反饋給生信同事的信息就會出錯,他們會很「無辜」地使用錯誤的流程給您call變異,結果就是白乾/(ㄒoㄒ)/~~
如果您提供給我們的樣本需要進行家系分析,那需要提供家系中每個成員的關係、性別、是否發病、疾病顯、隱性等信息,《常規變異分析》中需要填寫的信息過簡單,無法滿足家系分析的要求,因此您應該選擇《遺傳病家系分析》。
所以,在您拿到信息收集表的時候,先確認PM給您發送的信息表是否包含基本需要收集的信息,如果信息不全,還請和PM溝通研究目的,確認是否需要更換表格。
PS:即使微分基因的項目管理身經百戰為您保駕護航,但也難免會有理解錯您意思的時候。
下面,就和小編一起仔細看下這三種不同分析產品具體需要提供哪些信息吧。
常規突變分析
1.拿到信息收集表,首先需要提供的是項目信息。
通過項目編號,生信端的同事可以準確找到您的樣本產生的數據。
參考基因組信息:一般默認為hg19,如果老師需要使用最新的hg38也OK,但請一定在此處提前告知(每次基因組版本的升級,比如從hg18到hg19,再到hg38,坐標系統不一樣,所以分析過程中使用了某個基因組,去公共資料庫查詢頻率,位置等信息時,都要對應到使用的參考基因組查詢相關信息,才能保持信息的一致性)。
2.分析環節信息中需要確認的信息較多,下面就重要的部分進行解釋。
送樣名稱、核酸編號、結題報告中樣本名稱:送樣名稱和核酸編號為《樣品檢測報告》中的樣本名稱和與其對應的核酸編號;結題報告中樣本名稱,是後續生信同事給您編寫結題報告時給每個樣本的命名,三者需要一一對應,保證無誤。
結題報告中樣本名稱,需要您自己根據每個樣本的特徵進行命名,只能由字母、數字和下劃線「_」組成,並且只能以字母開頭,名稱的長度不能超過15個字元,不要用中文字元!不要用中文字元!!!生信分析都是在linux系統下,而中文字元在linux系統下會出現各種問題,某些時侯因為編碼問題會顯示亂碼,有些軟體不識別中文字元,有些軟體會把中文字元認成其他的東西,造成亂碼,如下圖。
文庫類型:根據微分基因研究人類基因組的技術平台分為四種不同的產品(如下圖),全基因組重測序、全外顯子組測序、目標區域擴增子測序以及定製目標區域靶向捕獲測序,這四種產品對應不同建庫方式,也分別對應不同的分析區間大小,這就需要您後續提供不同的信息。
如果您在文庫類型中選擇了人全基因組重測序以及人外顯子組測序,那不需要再給我們提供分析區間信息(但是外顯子捕獲使用Agilent SureSelect Human All Exon v6,還是NimbleGen SeqCap EZ Exome v3.0您一定要選擇正確哦)。如果您選擇了目標區域擴增子測序,那請在信息收集表的末端填寫您設計的引物對信息以及擴增區間信息,如下表所示。分析人員會根據您提供的區間信息有針對地分析目的區域變異信息。
如果您在文庫類型中選擇了定製目標區域靶向捕獲測序,那需要您提供所有捕獲區間的.bed文件,其中包含區間所在染色體編號、區間起點與終點坐標以及位於正鏈還是負鏈,如下圖所示。
其他:通常來說,該信息收集表對應的產品進行的變異檢測為「標準分析」流程,如果客戶需要定製化分析,請在每個樣本後標註需要進行定製化分析的具體條目以及可能的樣本分組信息,如,A樣本與B樣本進行joint calling、尋找B樣本中相對A樣本特有的突變、比較A、B兩樣本的突變差異信息等。
腫瘤配對分析
說完了常規突變分析的客戶需要填寫的信息後,再來說腫瘤、遺傳病分析產品,咱們只關注差異點就OK了。
首先咱們一起來看腫瘤配對分析,下圖為信息收集表中的分析環節信息收集模塊。
1.既然是配對分析(尋找同一個體腫瘤細胞相對其他組織正常細胞中特有的體細胞突變),那提供如何配對的信息是關鍵。在分析環節信息收集模塊中,case/control列需要您提供這些信息。成對的case和control樣本請按順序寫在相鄰兩行,並標明該樣本是腫瘤case樣本,還是對照control樣本。
2.腫瘤類別:請提供case組中每個樣本的腫瘤來源,高級信息分析中如果參考資料庫的信息注釋,就會考慮到腫瘤類型(如分析某樣本實際檢測的TMB相對COSMIC資料庫中記載的同癌種TMB的差異);對於control組的正常對照樣本,也請在該列提供樣本的類型,如外周血、某組織的癌旁對照等(如果不是來自同一個體的control,也請標明)。
3.其他重要表型信息:腫瘤分析中,研究者如果需要將突變信息與某些表型進行聚類分析(如下圖),請將每個樣本的表型信息填寫在該列中,如年齡,是否吸煙,藥物有無反應等。如果沒有關注的表型,可以不提供。
4.文庫類型:和常規突變分析中需要關注的點一樣,根據您簽訂合同時選擇的變異檢測手段,選擇合適的文庫類型,並給我們提供對應的區間信息(If needed)。
遺傳病家系分析
下圖為遺傳病家系分析產品項目基本信息收集模塊。
1.疾病名稱:在項目信息中需要您給出待分析遺傳病的準確名稱,因為在高級分析中我們會多次用到OMIM等資料庫中收錄的可能與該疾病相關的基因信息進行注釋,或者搜索文獻中可能報道的和該疾病相關的突變信息,我們也會查閱資料庫和文獻了解該疾病的遺傳模式,為家系分析做準備。
2.疾病類型:如單基因常染色體顯/隱性遺傳病,性X/Y染色體顯/隱性遺傳病,多基因遺傳等,此信息是進行基於表型進行數據過濾最有用的信息之一,如該疾病為顯性遺傳病,那即挑選在患者中共有,在正常人中沒有的突變位點,如發現存在伴性遺傳,那突變分析的範圍也可以大大縮減。
3.家系圖譜:儘可能提供,連鎖和關聯分析必須提供。
下圖為分析環節信息收集模塊。
1. 如果存在多個家系樣本,在分析環節信息模塊中,來自同一家系的樣品家系編號需一致,命名規範與結題報告中樣品命名規範一致。
2. 我們需要您給出每個家系中的樣本之間的關係以及是否患病。在關係這一列中,如果存在先證者,請在第一行中寫出先證者(proband, index case)的信息(一般都以先證者為線索,對系譜做回顧性調查),隨後向下寫出父、母、兄弟或姐妹以及其他可能存在親緣關係樣本的信息,並在每一個樣本後標明與先證者的關係以及是否患有該病。
嘮嘮叨叨寫了一堆,小編算是為盡量減少客戶不必要的煩惱以及防止來回溝通導致低效操碎了心。隨著微分基因的NovaSeq 6000平台跑得越來越6,委託給咱們的人類基因組研究項目也越來越多,小編希望各位看官們在和微分基因合作時,一定要仔細和我們一起填寫信息收集表,微分基因確保給您一個舒心、放心的客戶體驗。
微分基因為國家大基因中心「基因檢測平台」運營方,專註於高通量測序技術,公司憑藉國際領先的高通量測序平台,依託獨具優勢的高通量基因測序和大數據挖掘技術,為各大高校、醫院、科研單位以及第三方健康管理服務平台,提供專業的基因檢測和數據分析解讀服務。2017年,微分基因在國家大基因中心建成2133平方米的潔凈分子生物實驗室,公司科研團隊匯聚了一批國內外優秀的基因組學實驗和生物信息分析研究人員。
科技服務部依託公司先進的自動化建庫儀、高通量測序儀等實驗設備,提供多種測序服務;憑藉強大的科研團隊,為高校、科研院所等研究單位提供領先的生物信息分析服務。主營業務包括DNA測序、RNA測序、表觀組學測序、單細胞測序、ICELL8單細胞表達譜測序、晶元服務、三代全長轉錄組測序等。
健康|醫療|基因|科普
微分基因科技服務
記得這是一個有溫度的公眾號


TAG:微分基因 |