• 歡迎進入上海云序生物科技有限公司官方網站!?? 生物在線????丁香通

    服務熱線 021-64878766

    首頁 > 新聞動態 > 行業新聞

    GEO 數據上傳指南
    日期:2022年07月28日    來源:
    在完成了高通量測序分析以后,為了將用戶的實驗數據與全世界其它研究者共享,在用戶的研究轉化為論文發表之前,用戶需要先向 GEO 數據庫上傳用戶的原始數據。GEO 數據庫,全稱 Gene Expression Omnibus,中文直譯意為“基因表達集錦”,為美國國家生物信息中心(NCBI)管理的基因表達譜和 RNA 修飾譜的數據庫。
    今天小編就為用戶介紹 GEO 數據上傳的基本操作。在上傳數據之前,用戶需要事先創建 NCBI 賬號,準備需上傳的文件,并安裝 FTP 上傳軟件。

    1、創建NCBI賬號
    自 2021 年 6 月起,NCBI 因為安全理由已停止新用戶注冊。若用戶未在以前創建過 NCBI 賬號,則需要借由第三方賬戶登入。

    首先,在電腦瀏覽器中訪問 NCBI 網站(https://www.ncbi.nlm.nih.gov),點擊右上角的“Sign in to NCBI”。

    圖片4.png

    隨后,在左側面板中選擇“Sign in with”中選擇任意一個的第三方登入選項。
    圖片2.png
    如用戶不具備 NCBI 首推的 Google、NIH、eRA這三個第三方登錄選項的賬號,用戶仍可以點擊“See more 3rd party sign in options”從中搜尋用戶所具備的第三方登錄方式。對于大學在校師生而言,用戶可以嘗試搜索你所在的大學名稱;我們還建議在中國大陸網絡環境下的用戶,可以搜索“Microsoft”,以微軟賬戶登入。
    圖片3.png

    圖片4.png

    圖片5.png

    完成了 NCBI 賬號的創建以后,用戶還需要完善用戶的 GEO 個人信息(瀏覽器訪問 https://www.ncbi.nlm.nih.gov/geo/submitter/),填寫用戶的姓名、所在單位、電子郵箱地址等,其中帶星號(*)的項目為必填。填寫完成后,請點擊“Save”鍵保存。NCBI 官方提示,請用戶避免使用qq.com、 163.com 或 foxmail.com 等中國國內商用郵箱,以保證用戶能穩定收到 NCBI 發送給用戶的電子郵件。

    圖片6.png


    2、上傳數據
    在用戶完成 NCBI 賬號注冊和 GEO 個人信息填寫后,就可以開始上傳用戶的實驗數據了。在 NCBI 網站(https://www.ncbi.nlm.nih.gov)點擊如下圖灰色方框所示的“Submit”圖標,瀏覽器即會跳轉至“Submission Portal”界面。在“Submission Portal”界面的輸入框中輸入“GEO”,搜索框下方就會顯示 GEO 鏈接,請點擊進入。

    圖片7.png

    圖片8.png


    進入 GEO 主頁
    (https://www.ncbi.nlm.nih.gov/geo/info/submission.html)請選擇用戶需要上傳的數據類型。下面以高通量測序實驗數據為例,請點擊“Submit high-throughput sequencing”。
    圖片9.png


    準備需上傳的文件
    有以下三部分文件需要上傳:元數據表格、處理過的數據,以及原始數據。
    圖片10.png

    (1)元數據表格
    向下拖動網頁,看到“Download metadata spreadsheet (template and examples)”的超鏈接,點擊即可下載“seq_template.xlsx”元數據表格文件。下載后,請按照要求填寫元數據表格,內容包括研究的描述性信息、各樣本信息、所有實驗方法和數據處理方法、以及對處理過的數據和原始數據文件名的說明等。
    圖片11.png

    圖片12.png



    (2)處理過的數據

    (3)原始數據

    繼續向下拖動網頁,看到對處理過的數據文件(“Processed data files”)以及原始數據文件(“Raw data files”)的要求。請用戶仔細閱讀并按照要求準備文件。處理過的數據文件,可以直接使用云序生物提供的表達譜結果表格(注:請勿將 BAM 文件當作 Processed data files 上傳);原始數據文件,建議使用 Gzip 壓縮后的 FASTQ 文件,云序生物已經為用戶將 FASTQ 文件壓縮為 GZ 格式,用戶可以直接用于上傳。
    圖片13.png


    創建個人上傳空間
    在用戶按照要求準備好上傳所需的元數據表格、處理過的數據文件,以及原始數據文件后,請繼續向下拖動網頁,點選“Transfer Files”按鈕。在隨后進入的網頁里,點擊“Create personalized upload space”按鈕。等待數秒后,刷新網頁,即可看到用戶的個人上傳空間已經創建完成。
    圖片14.png

    圖片15.png

    圖片16.png


    FTP 上傳文件

    隨后,點擊“Transfer Files”左側的三角形箭頭,可展開如下圖所示的文件傳輸說明。其中,有 FTP 上傳文件所需的服務器主機地址(host address)、用戶名(username)、密碼(password)以及用戶的個人上傳空間的文件夾路徑,請用戶記錄下來,并在 FTP 上傳軟件中填寫(操作方法描述見后)。
    圖片17.png
    在用戶按照文件傳輸說明執行完 a 到 i 的全部數據上傳步驟后,請不要忘記提醒告知 GEO 你已完成上傳:繼續向下拖動網頁,點擊“Notify GEO”按鈕。
    圖片18.png


    3、FTP上傳軟件的安裝和使用
    但凡在云序生物做測序的用戶,我們已經為用戶下載好了 FTP 軟件 FileZilla 客戶端的安裝文件,請在用戶的實驗報告文件夾的下述路徑中到照與用戶系統版本(32位或64位 Windows 操作系統)對應的安裝文件,雙擊后按照指引完成軟件安裝:
    “Report\Sequence_Results\GEO_Upload\ftp software”
    如果用戶使用的電腦操作系統為 macOS 或 Linux,可以前往 FileZilla 官網的下載頁面(https://filezilla-project.org/download.php?type=client)下載與用戶操作系統對應的客戶端版本。
    安裝好 FTP 上傳軟件 FileZilla 后,打開軟件,在相應位置填寫用戶之前記錄下來的服務器主機地址(host address)、用戶名(username)和密碼(password),端口可留空。隨后點擊“快速連接”按鈕。首次連接時,軟件可能會彈窗警告,請勾選“總是允許在該服務器上執行不安全的明文 FTP(A)”,然后點擊“確定”按鈕。如果用戶的電腦上安裝了安全軟件或開啟了防火墻,建議用戶暫時停用,或單獨允許 FileZilla 軟件的 FTP 連接。
    圖片19.png


    正確輸入服務器主機地址、用戶名、密碼等信息后,稍等幾秒,軟件將提示用戶已成功與服務器建立連接(“狀態:已登錄”),但讀取目錄列表失?。ā板e誤:讀取目錄列表失敗”),系正?,F象。
    圖片20.png

    接下來,請用戶將之前在 GEO 網站上記錄下來的個人上傳空間的文件夾路徑,填寫到下圖“遠程站點”后面的文本框中,按回車鍵確認,然后再次點擊“快速連接”按鈕。稍等幾秒,軟件將提示用戶已成功讀取目錄列表。隨后,請用戶將用戶需要上傳至 GEO 的文件,拖拽至下圖紅框所框出的框格內,靜待文件上傳完成。
    圖片21.png


    由于上傳的原始數據文件較大,且服務器位于國外,所以上傳時間可能較久,請用戶耐心等候。請注意文件名和文件夾路徑當中,須避免出現漢字等非 ASCII字符。若很長時間仍未完成上傳,或出現軟件卡死等現象,建議用戶刪除上傳了一半的內容,重新嘗試上傳。

    4、上傳成功以后
    全部數據上傳完成以后,請逐一檢查本地文件(下例圖左)和服務器上同名文件(下例圖右)的大小是否相同,若出現同名文件大小不同的情況,說明文件上傳過程中可能受損,請用戶刪除該文件后重新上傳。
    圖片22.png
    最后,請用戶不要忘記在 GEO 的網站上點擊“Notify GEO”按鈕
    https://www.ncbi.nlm.nih.gov/geo/info/submissionftp.html)。
    圖片23.png
    在此之后,用戶將收到一封來自 GEO 的電子郵件,告知你所上傳的文件是否已被 GEO 成功收錄。


    5、溫馨提示

    由于 GEO 數據上傳對于大部分雜志的論文發表是必需的,而操作過程的繁瑣以及網絡的不穩定等因素又可能導致數據難以一次性上傳成功,加之 GEO 需要大約 5 個工作日來檢查用戶上傳的數據,基于小編的經驗,建議客戶至少在截止日期一個月前開始進行 GEO 數據上傳的工作,以免耽誤論文的正常發表。
    如果用戶不希望用戶的數據在論文發表前公開發布,以避免數據泄露的可能性,那么用戶可以通過 GEO 網站設置電子郵件的方式,指定一個論文發表后的日期作為 GEO 數據公布的時間。



    l2KrhfZ9H/SIfo47n2m+Iog+oI4b0q944OBNIdkpjVRjcnZZ3HiOWLOpQEqsQJDea0uO88v4MbyXJLEffcv/kqcfyZbdZTSexi1ZhooeiPDBc528m7ZMd0PLx1AutN/jsYnY0wPqK4qn4aHpx20XWkF/9logzpwYZUNsVSooe/Q=