當前位置:
首頁 > 最新 > 多樣性分析遇到問題怎麼解決?

多樣性分析遇到問題怎麼解決?

微生物多樣性測序本質就是基於微生物基因組中某個特徵片段的擴增子測序。這個特徵片段必須是足夠保守,這樣子才能大規模擴增利用;同時還要有一定的變異速率,保證序列具有一定的種屬特異性,以加以區分物種。這類型的序列有很多,較常見的有單拷貝的保守基因或者一些核糖體編碼片段。

常用的單拷貝基因有幾十種,但由於丰度太低,提取和建庫難度太大等原因,現階段還不算十分主流的手段。相對而言,16S、18S、ITS等序列片段,由於其丰度高、序列特徵明顯等優勢,成為我們在微生物多樣性研究中常見的測序對象。

但無論哪種研究手段,他們只是針對的研究對象不同(例如16S針對細菌古細菌,ITS針對真菌藻類等),實驗分析方法有細微差別,但總體的研究內容是基本一致的。這些研究內容無外乎就是物種組成分析、多樣性分析、功能分析及環境因子分析幾個部分。

這些分析的過程就是常說的數據挖掘的過程,在數據挖掘當中,常常遇到各種問題:沒找到目標差異物種、組間的物種豐富度差異沒有預期中顯著、同類型樣本的聚類效果不好等等。

圖1. 微生物多樣性研究的五大分析內容

問題來源

上述問題產生的原因有很多:

有可能是實驗方案設計錯誤,例如錯把處理效應當作主要影響因素,實際上個體背景差異才是物種差異的主要來源;

還有可能是實驗造成人為偏差,例如引物的偏好性造成某些物種並不能被正確擴增,從而造成目標物種並沒有出現;

還有可能是分析帶來的影響,例如在篩選標記物種的時候,預計會有變形菌(Proteobacteria),但實際分析後沒發現,這有可能是篩選標準過於嚴格,導致沒找到目標物種。

圖2. 差異物種分析之後並沒有找到預期目標

無論以上何種問題,最終還是可以通過一定的分析手段去彌補和調整。

例如第一個例子所提到的,就可以通過配對t檢驗等統計方法來矯正背景差異。第二個例子可以通過剔除無效樣本,重新分析,從而達到效果。第三個例子就是較為溫和一點的操作,只要適當調整參數,改變閾值則可以。

上述所提到的一些分析過程的調整,就是我們所常常提到的試錯過程。實驗研究大部分都是對未知領域的探索,有實驗預期,也有實驗結果。當結果沒達到預期的時候,並不一定全是預期錯誤,而很多時候是我們沒摸索到一種適合的方法去展示我們的結果。

解決問題的途徑

解決問題的方法有很多,之前也探討過,無外乎就是自己解決與交給公司解決。自己解決的麻煩在於需要懂一些分析原理,知道如何整理數據,怎麼應用軟體等等。這些都需要一個學習與摸索的過程,前期投入大,但後期效果顯著,畢竟怎麼試錯都隨心隨意。

如果交給公司,我們可以省去大量的學習煩惱,但隨之而來是一大堆的溝通麻煩。反正也就是有利有弊。

如果有一個不需學習編程就能滿足大部分個性化數據挖掘需求的平台就好了!

不用整理上傳數據表格,可根據自己實驗目的隨意調整參數,可生成發表級的圖表,能得到理想的數據結果…這一切不再是夢想!因為Omicsmart動態數據挖掘系統就是這麼一款數據挖掘的超級利器!

表1.Omicsmart在線工具的優勢

數據分析實例

例如上面所提到的例子,在實際項分析結果中並沒有找到差異物種變形菌(Proteobacteria)。這是由於多方面因素造成的。從現有資料來說,變形菌是一定會出現差異變化的,結果中沒有,是由於檢驗模式是p值,造成篩選太嚴格,被過濾掉。後面調整為p值之後,變形菌就馬上出現了(圖3)。

圖3. q值變p值後出現預期結果

同時,經過我們研究發現,當把閾值從0.05改為0.051之後,預期中的變形菌也出現了(圖4)。P值是否值得參考,能有多大的參考意義,一直都是個爭論焦點。同時,統一的,過於標準化的閾值篩選,往往會失去很多的生物學意義,0.05與0.051到底有多大差別也是見仁見智。

是否0.051就沒有顯著性了,未必?在數據分析中,一點點小誤差都可以帶來波動,因此,在有實際根據的情況下,0.051能出來符合科學依據的結果,反而更有說服力。但總體而言,通過調整篩選閾值或檢驗方法後,確實能得到想要的預期的效果,這就是omicsmart平台的能力。

圖4. 閾值改0.051後出現預期結果

當然,以上只是omicsmart能解決問題中的冰山一角,實際上,它能解決微生物群落多樣性物種分析、多樣性分析、功能分析等五大類分析中90%以上的個性需求,讓結果更加符合需求。

今天的內容就到這裡了~


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 基迪奧生物 的精彩文章:

多組學數據解析沙龍嘉賓報告公布!

TAG:基迪奧生物 |