當前位置:
首頁 > 最新 > 細菌基因組完成圖新策略出爐

細菌基因組完成圖新策略出爐

長讀長序列的獲取對於物種基因組的組裝是一個絕對性的優勢,可以顯著減小組裝難度、提高組裝質量。Nanopore-MinION納米孔單分子測序技術,不需PCR擴增且讀長長,所以自一開始出現就備受矚目;其測序的主要原理是:依賴於不同鹼基在穿越納米孔時會引起電流變化的幅度不同,通過檢測納米孔實時的電流變化推測出核酸分子的鹼基序列信息。

目前,Nanopore-MinION納米孔單分子測序應用地越來越廣泛,尤其適用於高雜合、高重複或大基因組等複雜基因組的高質量組裝。另外,Nanopore-MinION在大腸桿菌、酵母、線蟲等小基因組的組裝方面同樣具有優勢。但是,Nanopore-MinION測序準確率與Pacbio接近,準確率相對低一直是一個無法迴避的問題。

因此,在降低組裝難度的同時為了保證測序準確率,推薦採用以下兩種策略來構建細菌的基因組完成圖:

策略1:三代Nanopore(30×) + 二代(1Gb)

策略2:三代Nanopore(100×)

事實勝於雄辯,下面就來了解下我司利用Nanopore測序組裝得到的某革蘭氏陰性菌基因組的內測結果吧。

建庫測序(~25×)

序列組裝(Unicycler[1]流程)

組裝得到的3條環形分子詳見下表:

相應的組裝Graph如下圖所示,比較完美的3條環形分子。

組裝評估

利用minimap2將reads比對到基因組上,基因組覆蓋率達99.9999%,5×以上覆蓋率99.99%(以此估計錯誤率約萬分之一),整體覆蓋深度基本符合理論的泊松分布(下圖左),且無明顯GC偏好(下圖右)。

但由於Nanopore測序錯誤率相對較高(平均~10%),且對homopolymer的測序精度尤其差,經多輪polish後單鹼基錯誤率依舊較高、存在一些indel導致蛋白移碼錯誤,最終由BUSCO[4]評估得到完整的核心基因比例較低(~80%)。

結論

綜上,即使~25×的三代nanopore測序可以組裝出細菌完成圖,但是單純利用Nanopore測序得到的單鹼基精度還是比較低(特別是有移碼錯誤),所以構建細菌基因組完成圖的最佳策略是:

① 三代Nanopore測序(30×)+ 二代測序(1Gb);

② 三代Nanopore測序(100×)。

如此,便可以在保證單鹼基精度的同時構建得到細菌基因組完成圖。

參考文獻

[1] Wick R R, Judd L M, Gorrie C L et. al. Unicycler: Resolving bacterial genome assemblies from short and long sequencing reads [J]. Plos Computational Biology, 2017, 13 (6): e1005595.

[2] Li H. Minimap and miniasm: fast mapping and de novo assembly for noisy long sequences [J]. Bioinformatics, 2016, 32 (14): 2103.

[3] Vaser R, Sovi? I, Nagarajan N et. al. Fast and accurate de novo genome assembly from long uncorrected reads [J]. Genome Res., 2017, 27 (5): 737.

[4] Sim?o F A, Waterhouse R M, Ioannidis P et. al. BUSCO: assessing genome assembly and annotation completeness with single-copy orthologs. [J]. Bioinformatics, 2015, 31 (19): 3210.

[5] Wick R R, Judd L M, Gorrie C L, et al. Completing bacterial genome assemblies with multiplex MinION sequencing[J]. Microbial Genomics, 2017, 3(10).

暑期優惠

暑期來臨,源宜基因的服務熱情依然不會褪卻。只要您在2018年9月30日之前簽訂項目合同,將會享受8折大優惠哦。如有意向,請您微信留言或與當地銷售經理聯繫。

GIF


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 源宜基因 的精彩文章:

我國繪製出世界首個一串紅基因組圖譜

TAG:源宜基因 |