當前位置:
首頁 > 知識 > 科學家提出編碼基因重建新方法 解決識別效率低且不完整難題

科學家提出編碼基因重建新方法 解決識別效率低且不完整難題

近日,中科院北京生命科學研究院計算基因組學實驗室研究員趙方慶團隊提出一種基於密碼子de Bruijn圖的新演算法,使用非拼接策略直接對轉錄組測序數據進行編碼基因識別和重建,解決了編碼基因識別效率低且不完整的難題,該方法在非模式生物的進化基因組研究領域具有很大的應用前景。該成果已在線發表在《基因組生物學》上。


近年來,高性能計算技術和高通量測序技術的快速發展促進了大量基因組測序計劃的實施完成,從而獲得了海量的生物組學數據。面對轉錄組數據,科學家們的首要任務是獲得它們的編碼基因信息。傳統的基因識別工具主要依賴於RNA-seq組裝軟體得到的轉錄本進行基因鑒定。這些工具的缺點之一是組裝軟體對測序錯誤高度敏感並且不能有效處理重複序列區域,因此導致在此基礎上進行基因識別會產生大量高度冗餘和片段化的基因序列。此外,這些工具需要過度依賴同源基因資料庫或參考基因組,不能有效地應用於非模式物種的轉錄組數據的基因識別。因此,一種基於轉錄組數據重建編碼基因的新演算法亟待開發。


科研人員針對轉錄組數據分析中的編碼基因識別問題,開發了一種基於密碼子de Bruijn圖的新演算法inGAP-CDG。該方法不依賴於參考基因組,直接從未拼接的轉錄組測序數據中進行基因識別。通過使用模擬數據集和公共資料庫的真實轉錄組測序數據,他們對預測基因的長度、靈敏度、冗餘度、錯誤率和雜合度進行了系統性的評估。與其他方法相比,inGAP-CDG構建出的編碼基因序列具有長度更長、冗餘度更低和特異度更高的優勢。該研究為基因識別提供了新的思路和方法,進而對此後的系統發育和功能基因組學研究具有重要的應用價值。(柯訊)

[責任編輯:趙清建]

請您繼續閱讀更多來自 光明網 的精彩文章:

銀河系與仙女座40億年後將首次「相遇」?
哺乳期不能吃的東西 哺乳期不要碰的水果你知道嗎?
一種不良習慣誘發一種癌!
你知道哪些食物會導致不孕?

TAG:光明網 |

您可能感興趣

改進基因測序方法 有效簡化基因建庫儀器配置
科學家用混合方法了解細胞動態與功能
難搞痘痘不斷反覆的長出來 原因和有效解決方法快教教我
解決問題最有效的方法是什麼?
疫苗有效性識別與提高有新方法
什麼方法能有效的緩解焦慮症
英國巨石陣搭建難題設想,此方法可解決許多搬運難題
新研究顯示兩種常用早產評估方法準確率低
中醫學注重經驗傳承卻忽略確立療效證據,需用科學方法證實
無法改變,只是因為你沒有掌握培養習慣的方法
整形術後想要美 快消腫攻略不可少 消腫方法如何選
智者用超越問題的方法解決問題
想健身別盲目,關鍵是根據自己體型找到合適方法!
書法入門,方法比努力更重要
胸部沒料 最有效的豐胸方法 小編給您整理好了
解決科學質疑的科學方法是什麼
不增重,同樣能促進健身效果的3種方法
深度解析祛斑的有效方法
治療脫髮方法要正確五個簡單方法很有效