錯誤率10%的16S全長序列能否準確分類?
最新
07-13
分析的結果並不理想,結果顯示在10%的錯誤率的情況下,模擬文件在門水平上的注釋仍然和原始文件大致相似,在科水平上二者有些不同,但是也還能接受,可是在屬的水平上則差別太大,根本無法作圖,具體情況如下圖所示:
這使得我有點擔心納米孔可能並不適合16S測序這個應用場景,但是我還想嘗試2次,並不想這麼快就斷定它不行,回過頭來想想這個這個實驗設計的不合理,每個序列都去衍伸出20條序列,而原始文件的序列數太少,這樣就不由的放大了納米孔測序儀的高錯誤率對結果的影響,也許需要變化一下。
更改後的實驗設計:從資料庫中隨機抽取200條16S全長序列,然後設置0-100之間取隨機數生成某條序列的拷貝,從而形成原始文件,然後對原始文件中的每條序列進行隨機突變(10%的突變率)生成新的模仿文件,然後對原始文件和模仿文件進行物種注釋,比較二者的差異,這樣的設計也許才能符合真實的情況。


TAG:腸菌康 |