如何正確預測基因的保守結構域!
搜索鑒定基因的保守結構域,應該用專門搜索基因的保守結構域工具CD-search,而不是簡單的用blast搜索注釋。快速找到這個基因上的保守結構域,對研究基因的功能是非常重要的,因為行駛相同相近功能的基因往往具有相同的保守結構域!下面是介紹使用方法:
1.CDD入口:https://www.ncbi.nlm.nih.gov/cdd/,該工具為NCBI提供的,NCBI主頁選項口選擇進入Conserved Domain然後點擊Search。
然後選擇CD-search(單個基因),或者Batch CD-Search(多個基因)。
2.預測單條序列的保守結構域,點擊CD-search進入:
粘貼基因的蛋白序列,或者是核酸序列都可以,注意為fasta序列,如果你知道基因的GI或Accession號,也可以直接數據這些ID就可以查詢,右方OPTIONS中選擇要搜索的資料庫,Expect Value等,或者使用默認設置,然後按「提交」按鈕。就可以搜索了;
3.結果查看,默認為concise 簡潔顯示,可以選擇full result顯示全部內容:
搜索匹配結果,有特定匹配(specific hits),非特定匹配(non-specific hits),這些匹配所屬的超家族(superfamily),我們發現這個基因特定匹配在dnak,屬於HSP70超級家族;
4.批量提交序列搜索保守結構域,Batch CD-Search,如下::
可選擇直接粘貼多序列的fasta格式文件,或者提交fasta格式的文件,然後選擇資料庫,如果數據較大搜索時間很久,可填寫email,搜索完成之後會發郵寄,最後點擊submit提交就可以搜索了:
5.批量搜索結果展示:
批量搜索結果如下,只展示部分結果,詳細結果可點擊download進行下載,或者點擊Browse results 進行詳細的可視化瀏覽;
表格結果說明如下:
6.批量搜索結果,可視化瀏覽界面:
可以選中,然後瀏覽,下載等:
參考文獻:
Marchler-Bauer A et al. (2017), "CDD/SPARCLE: functional classification of proteins via subfamily domain architectures.", Nucleic Acids Res.45(D)200-3.
Marchler-Bauer A et al. (2015), "CDD: NCBI"s conserved domain database.", Nucleic Acids Res.43(D)222-6.
Marchler-Bauer A et al. (2011), "CDD: a Conserved Domain Database for the functional annotation of proteins.", Nucleic Acids Res.39(D)225-9.
Marchler-Bauer A, Bryant SH (2004), "CD-Search: protein domain annotations on the fly.", Nucleic Acids Res.32(W)327-331.


TAG:組學大講堂 |