手把手教你原始數據上傳NCBI
近期收到不少售後諮詢,老師發表文章需要將數據上傳到NCBI資料庫,下面小編就把最新版的詳細流程介紹給大家,記得收藏哦!
01
註冊NCBI賬號
如果已經註冊過NCBI,直接登陸。
02
登錄後轉入NCBI主頁
點擊進入「Submit」(紅框所示)
選擇上傳數據的類別
如圖紅框所示,選擇「Sequence Read Archive(SRA)」,然後點擊「GO「按鈕進入。
進入上傳入口界面
如下圖所示,首先點擊進入My profile,填寫個人信息並保存,應該注意是NCBI已經取消了向qq.com、163.com和foxmail.com發送郵件,請選擇其他郵箱,然後點擊「New submission」按鈕。
接著進入My profile界面,填寫姓名、單位和地址等信息。完成以後,進入到上傳的主界面,又有諸多步驟,下面進行詳細介紹。
4.1
進入Submitter界面
界面顯示的是你之前填寫的個人信息,直接點擊「continue」按鈕。
4.2
進入General Information界面
該界面值得注意的是數據的公開時間,如果用於發表文章,建議指定公開的日期應該早於投稿日期,因為審稿人可能要查看你的數據,當然後期也是可以調整數據的公開日期的。
4.3
進入Project Info界面
給你的實驗取個名字並簡要描述,然後點擊「continue」按鈕,如圖所示。
4.4
進入Sample Type界面
根據你的樣本,選擇相應的樣本類型,如「Micrbe」。
4.5
進入Attributes界面
接下來是對樣本的描述,可以在線填寫表格或者上傳表格(需要先下載NCBI提供的表格文件進行填寫)。NCBI提供了兩種格式的表格供我們下載後填寫,分別是TSV格式和xlsx格式。TSV格式也是可以用excel打開,每列表格都有固定的格式,切記要準確填寫。這裡推薦直接下載excel(xlsx格式)文件。
這裡推薦直接下載excel(xlsx格式)文件,如下圖所示。
首先,表格內容根據你之前所選的樣本類型的不同而不同。其次應該注意:綠色欄位是必填項;黃色欄位是選填項;藍色欄位也是必填項,如果沒有取得資料可以填「not collected」、「not applicable」或「missing」。
在每一列欄位的右上角有一個紅色三角形的每一列都有一個注釋,如果你將滑鼠懸停在標題上,可以顯示該提示信息。必須按照提示的格式填寫,否則會報錯。填寫還表格後,點擊「選擇文件」按鈕,找到你填寫的表格,完成上傳。
下圖是日期的格式報錯的例子,可以看出地址信息填寫錯誤,國名要大寫字母開頭,中間用冒號分隔(注意不支持中文格式的符號)。遇到這種情況要先點擊「Delete」刪除上傳的文件,根據表格中的提示,重新修改後再上傳。
4.6
進入SRA metadata界面
與上一步驟類似,先下載表格,填寫數據的信息。
SRA metadata表格如下,
該表格分為三個sheet,第一和第三的sheet是一些補充說明。需要填寫的是第二個sheet。這裡要注意:「sample_name」要與上一步表中「sample_name」相對應,除了「bioproject_accession」可以不填,其他藍色列必填。
完成表格的更改後,就可以上傳了,如果有報錯,請根據提示更改表格重新上傳。
4.7
進入Files界面
進入到該頁面後就可以上傳數據了,NCBI提供了多種上傳數據的方法,最常用的是瀏覽器上傳和命令行上傳。如果數據量少,可以使用瀏覽器上傳,選擇就不再贅述了,如下圖所示。
如果數據量大,用ftp或瀏覽器方法上傳,不僅速度慢而且還有會中斷的現象。這時候推薦使用Aspera軟體上傳數據,其優點是上傳速度快,可在windows和linux系統下以命令行運行。
首先,在使用Aspera上傳數據之前,需要下載安裝Aspera軟體,如下圖所示,進入NCBI主頁,點擊Download。
進入Aspera下載界面,如下圖所示。
准入IBM Aspera下載頁面,點擊下載,然後windows下安裝。
安裝完成後,進入命令行模式。輸入命令行:
首先進入用戶目錄:C:\Users\10243 (請改成自己的用戶名)
然後鍵入:
「AppData\Local\Programs\Aspera\Aspera Connect\bin\ascp.exe」-i
-QT -l100m -k1 -d
注意軟體路徑加上英文格式的雙引號,否則可能會報錯。
-i下載的key file的路徑
-I上傳的最大速度
windows系統命令行示例如下:
linux系統下的命令行示例如下:
等待數據上傳完成後,點擊「Select preload folder」按鈕。
然後核實一下信息,上傳就快完成了。
回到manage data項,會看見剛才上傳的Bioproject,大概一天後就會通過NCBI審核,並郵件通知你,裡面會有id信息,或者進入到該界面,自己找到對應的id。
到此,上傳數據就算完成了。
微分基因是一家藉助於國際領先的高通量測序平台,為生命科學研究和基因檢測提供整體解決方案的高新科技企業。致力於將生命科學研究和健康管理與疾病診療領域的測序數據進行產業化應用,推動基因科技成果轉化。
2017年3月,微分基因入駐國家大基因中心,成為國家大基因中心「基因檢測平台」運營企業,並成立安徽微分基因科技有限公司。8月,位於安徽巢湖的標準潔凈實驗室及醫學檢驗所啟動運營,佔地約2100平方米。10月,全貫穿的基因檢測平台、大數據處理平台、高通量自動化樣本處理平台、一流的生物樣本庫開始正式運作。
在生物醫藥晉陞為「 國家戰略性新興產業」 的行業背景下, 微分基因依託獨具優勢的高通量基因測序和大數據挖掘技術, 為各大高校、醫院、科研單位以及第三方健康管理服務平台, 提供專業的基因檢測和數據分析解讀服務。
健康|醫療|基因|科普
微分基因科技服務
記得這是一個有溫度的公眾號
※孩子到底更像誰?爸媽不用爭論了,做個測試就知道了
※Environment International:養殖魚類的糞便會增加海底沉積物中抗生素抗性基因的富集
TAG:微分基因 |